FUSÃO DE CARACTERÍSTICAS ADAPTATIVA POR CONSULTA PARA DIVERSIFICAÇÃO VISUAL

Felipe Souza Cordeiro

Resumo


Com o aumento da popularização das tecnologias fica cada vez mais fácil adquirir um
dispositivo capaz de capturar e armazenar dados. Esses dados são utilizados das mas diversas
formas, entre eles, a utilização em redes sociais e sites, gerando a cada dia uma grande
quantidade de conteúdos digitais multimídia. Estes conteúdos são explorados para várias áreas,
como: sensoriamento remoto e análise forense. Logo, é preciso encontrar maneiras eficientes de
retornar resultados relevantes as necessidades de cada usuário.
Na recuperação de imagens, por exemplo, pode-se utilizar de informações textuais
(metadados, palavras-chaves, etc) e descrições das propriedades visuais (cor, forma, textura, etc).
No processo de recuperação de imagens, a relevância depende das intenções de busca do usuário.
É comum que os descritores de conteúdo individualmente não representem da melhor maneira o
conteúdo semântico de uma imagem. Esse problema é conhecido como gap semântico. Visando
amenizar este problema, descritores são combinados para adaptar as buscas às necessidades dos
usuários (Atrey et al (2010), Calumby et al (2014)). É preciso definir dinamicamente quais as
melhores características que representam melhor uma consulta ou o nível de importância que
cada característica disponível pode ter na definição de relevância de cada item da coleção de
dados.
Há dois tipos de técnicas para fusão de características: early fusion e late fusion. A
abordagem early fusion primeiro extrai as características referentes a cada uma das propriedades
para então as combinar. As abordagens baseadas em late fusion realizam a extração das
características para cada uma das propriedades, mas os algoritmos de aprendizado são aplicados a
cada uma das propriedades em separado. O resultado é a classificação dos itens da base.
O objetivo deste trabalho foi desenvolver um modelo de diversificação visual baseado em
fusão de características de imagens. Foi utilizado o método de Algoritmos Genéticos (AG)
(Goldberg, 1989) para desenvolvimento dinâmico e adaptativo por consulta, do modelo proposto,
a fim de apresentar uma solução capaz de definir dinamicamente a importância que cada
característica possui na combinação dos descritores para recuperação multimodal, visual e
textual.


Texto completo:

PDF


DOI: http://dx.doi.org/10.13102/semic.v0i21.2265

Apontamentos

  • Não há apontamentos.