Universidade Estadual de Feira de Santana
Feira de Santana - Bahia - Brasil
Fusão de Dados e Aprendizado de Máquina para Recuperação da Informação (UEFS)
Resumo: Os avanços tecnológicos para captura, armazenamento, processamento e compartilhamento de dados tornaram possível a construção de grandes bases de dados, em especial grandes repositórios de dados multimídia. Estes dados são utilizados nos mais diversos contextos, como por exemplo, educação, medicina, segurança biométrica, redes sociais, entretenimento, notícias, sensoriamento remoto, etc. Dado o grande volume de dados, prover meios para acesso eficaz é fundamental. Este projeto propõe a utilização da técnica de realimentação de relevância associada a técnicas de aprendizado de máquina para recuperação de dados multimídia. Estas técnicas têm sido aplicadas com sucesso em sistemas de recuperação por conteúdo e demonstram grande potencial para redução do gap semântico no processo de recuperação de dados multimídia, em especial por permitir a adaptação do sistema aos diferentes usuários.
Potencializando métodos de reconhecimento de padrões para identificação de espécies de plantas
Resumo: The knowledge of the biodiversity of a region is fundamental for the development of effective productive processes along with the minimization of damages to the environment. At the same time, knowing the characteristics of the species allows the definition of proper preservation policies, and the identification and recognition of flora species is a very important task in the activities of many sectors of society. Consequently, the study and application of modern techniques of representation of characteristics and construction of models for recognition are necessary to allow the development of practical tools. Aligned to the worldwide interested community, this project aims to contribute to the activities of recognition of flora by developing effective and efficient methods with special interest on deep learning approaches.
Recuperação Multimodal e Interativa de Informação Orientada por Diversidade (Tese de Doutorado, IC/Unicamp)
Resumo: Os métodos de Recuperação da Informação, especialmente considerando-se dados multimídia, evoluíram para a integração de múltiplas fontes de evidência na análise de relevância de itens em uma tarefa de busca. Neste contexto, para atenuar a distância semântica entre as propriedades de baixo nível extraídas do conteúdo dos objetos digitais e os conceitos semânticos de alto nível (objetos, categorias, etc.) e tornar estes sistemas adaptativos às diferentes necessidades dos usuários, modelos interativos que consideram o usuário mais próximo do processo de recuperação têm sido propostos, permitindo a sua interação com o sistema, principalmente por meio da realimentação de relevância implícita ou explícita. Analogamente, a promoção de diversidade surgiu como uma alternativa para lidar com consultas ambíguas ou incompletas. Adicionalmente, muitos trabalhos têm tratado a ideia de minimização do esforço requerido do usuário em fornecer julgamentos de relevância, à medida que se mantém níveis aceitáveis de eficácia. Esta tese aborda, propõe e analisa experimentalmente métodos de recuperação da informação interativos e multimodais orientados por diversidade. Este trabalho aborda de forma abrangente a literatura acerca da recuperação interativa da informação e discute sobre os avanços recentes, os grandes desafios de pesquisa e oportunidades promissoras de trabalho. Nós propusemos e avaliamos dois métodos de aprimoramento do balanço entre relevância e diversidade, os quais integram múltiplas informações de imagens, tais como: propriedades visuais, metadados textuais, informação geográfica e descritores de credibilidade dos usuários. Por sua vez, como integração de técnicas de recuperação interativa e de promoção de diversidade, visando maximizar a cobertura de múltiplas interpretações/aspectos de busca e acelerar a transferência de informação entre o usuário e o sistema, nós propusemos e avaliamos um método multimodal de aprendizado para ranqueamento utilizando realimentação de relevância sobre resultados diversificados. Nossa análise experimental mostra que o uso conjunto de múltiplas fontes de informação teve impacto positivo nos algoritmos de balanceamento entre relevância e diversidade. Estes resultados sugerem que a integração de filtragem e re-ranqueamento multimodais é eficaz para o aumento da relevância dos resultados e também como mecanismo de potencialização dos métodos de diversificação. Além disso, com uma análise experimental minuciosa, nós investigamos várias questões de pesquisa relacionadas à possibilidade de aumento da diversidade dos resultados e a manutenção ou até mesmo melhoria da sua relevância em sessões interativas. Adicionalmente, nós analisamos como o esforço em diversificar afeta os resultados gerais de uma sessão de busca e como diferentes abordagens de diversificação se comportam para diferentes modalidades de dados. Analisando a eficácia geral e também em cada iteração de realimentação de relevância, nós mostramos que introduzir diversidade nos resultados pode prejudicar resultados iniciais, enquanto que aumenta significativamente a eficácia geral em uma sessão de busca, considerando-se não apenas a relevância e diversidade geral, mas também o quão cedo o usuário é exposto ao mesmo montante de itens relevantes e nível de diversidade.
Recuperação Multimodal de Imagens Com Realimentação de Relevância Baseada em Programação Genética (Dissertação de Mestrado, IC/Unicamp)
Resumo: Este projeto apresenta uma abordagem para recuperação multimodal de imagens com realimentação de relevância baseada em programação genética. Supõe-se que cada imagem da coleção possui informação textual associada (metadado, descrição textual, etc.), além de ter suas propriedades visuais (por exemplo, cor e textura) codificadas em vetores de características. A partir da informação obtida ao longo das iterações de realimentação de relevância, programação genética é utilizada para a criação de funções de combinação de medidas de similaridades eficazes. Com essas novas funções, valores de similaridades diversos são combinados em uma única medida, que mais adequadamente reflete as necessidades do usuário. As principais contribuições deste trabalho consistem na proposta e implementação de dois arcabouços. O primeiro, RFCore, é um arcabouço genérico para atividades de realimentação de relevância para manipulação de objetos digitais. O segundo, MMRF-GP, é um arcabouço para recuperação de objetos digitais com realimentação de relevância baseada em programação genética, construído sobre o RFCore. O método proposto de recuperação multimodal de imagens foi validado sobre duas coleções de imagens, uma desenvolvida pela Universidade de Washington e outra da ImageCLEF Photographic Retrieval Task. A abordagem proposta mostrou melhores resultados para recuperação multimodal frente a utilização das modalidades isoladas. Além disso, foram obtidos resultados para recuperação visual e multimodal melhores do que as melhores submissões para a ImageCLEF Photographic Retrieval Task 2008.
2007 Ferramentas de Programação Paralela Para Plataformas Multicore
2006 Análise de Ferramentas Livres Para OLAP e Produção de um Ambiente de Data Warehousing de Baixo Custo
2005 Algoritmos Genéticos Para Reconstrução de Árvores Filogenéticas Baseadas nos Métodos de Máxima Verossimilhança