Refinamento do Conjunto Inicial de Resultados Utilizando Informações Contextuais para Recuperação Interativa de Imagens

Luciano Araújo Dourado Filho

Resumo


O avanço das tecnologias de captura e armazenamento de conteúdo digital proporciona
um aumento na quantidade de dados (imagens, vídeos, e-mails, documentos, etc) que
consequentemente demanda por desenvolvimento de técnicas para sua exploração tendo
em vista sua grande quantidade e disponibilidade, em sistemas computacionais ao redor
do mundo. Esses dados podem ser utilizados para fins diversos, como medicina, análise
forense, estudo de biodiversidade, redes sociais, bibliotecas digitais, entre outros (Lew,
2001) e a eficácia em suas técnicas de exploração/recuperação podem tornar o acesso
mais fácil e produtivo.
Quando trata-se de imagens, por exemplo, os principais paradigmas de busca
consistem em levar em consideração informações textuais associadas (anotações,
metadados, palavras-chave) para realizar sua recuperação para um usuário a partir de
bancos de dados (Lieberman & Rosenzweig, 2001). Outra abordagem comum se dá
através da representação computacional das propriedades visuais de imagens (cor, forma
e textura) e com base nisso computar similaridade entre imagens. As entidades
responsáveis por realizar esse processo são denominadas descritores. Os sistemas
computacionais de recuperação de imagens por conteúdo, podem, a partir de uma ou
mais imagens de consulta, ordenar as imagens de sua base de
acordo com a similaridade em relação à imagem de consulta e retornar as mais
parecidas para o usuário (Torres & Falcão, 2006).
Um problema comum às duas abordagens citadas trata-se da noção de
similaridade, que varia de acordo com a percepção de cada usuário e da discrepância
entre a interpretação das características semânticas de uma imagem por um ser humano
em relação à representação de suas propriedades por meio de uma máquina (gap
semântico). Com intuito de minimizar o problema tenta-se combinar descritores visuais
de modo a adaptar a busca às necessidades do usuário (Atrey et al., 2010). Outra
possibilidade é permitir que o usuário interaja com o sistema, indicando a relevância das
imagens no resultado o que possibilita ao sistema retornar outras similarmente
relevantes (Ruthven & Lalmas, 2010; Calumby et al., 2010). Com isso, à partir de
técnicas de aprendizado de máquina é possível buscar por padrões que representem as
necessidades do usuário.
A aplicação de técnicas de aprendizado de máquina com realimentação de
relevância permitem ao usuário interagir com o sistema enquanto ele tenta aprender
como atender às suas necessidades. Esse processo é realizado de maneira iterativa
enquanto o usuário não se declarar satisfeito. O usuário alimenta o sistema ao longo das
iterações quando indica a relevância dos itens exibidos, desta forma, o sistema tenta
codificar quais propriedades visuais melhor caracterizam as imagens informadas como
relevantes pelo usuário, portanto tende a retornar resultados mais relevantes, ao longo
das iterações, em relação ao conjunto inicial. De forma intuitiva, se o conjunto inicial
apresenta resultados não satisfatórios, a tendência é que o usuário não tenha como
fornecer informação de qualidade para o sistema e assim os resultados consequentes
também sejam insatisfatórios (Calumby et al., 2017).
Desta forma, têm-se desenvolvido técnicas de re-ranqueamento com o intuito de
melhorar a eficácia de sistemas de recuperação de imagens. Exemplo disso é o método
de re-ranqueamento baseado em espaços contextuais (Pedronette et al., 2014). A ideia
geral é explorar as informações que as relações entre várias imagens podem prover.
Deste modo, é possível redefinir o grau de similaridade entre duas imagens levando em
consideração a similaridade de uma das imagens, em relação às suas vizinhas. Ou seja, é
possível refinar as distâncias entre imagens levando em consideração o contexto em que
uma delas estão inseridas.
Este trabalho realizou a avaliação do emprego desta técnica, com intuito de
refinar o conjunto inicial de resultados de busca de imagens por conteúdo e analisar seu
impacto ao longo das iterações.


Texto completo:

PDF


DOI: http://dx.doi.org/10.13102/semic.v0i22.4031

Apontamentos

  • Não há apontamentos.