64ª Reunião Anual da SBPC |
A. Ciências Exatas e da Terra - 2. Ciência da Computação - 6. Inteligência Artificial e Redes Neurais |
FILTRAGEM DE INFORMAÇÃO USANDO REDE NEURAL DE HOPFIELD E ONTOLOGIAS |
Daniel Mandelli Martins 1 Juan Manuel Adán Coello 2 |
1. Faculdade de Engenharia de Computação, CEATEC – PUC-Campinas 2. Prof. Dr./Orientador - Faculdade de Engenharia de Computação, CEATEC - PUC-Campinas |
INTRODUÇÃO: |
A web disponibiliza uma enorme quantidade de informações, de modo que encontrar informações especificas de interesse do usuário entre os inúmeros documentos disponíveis sobre diferentes assuntos não é trivial. Contribuem para esse cenário a natureza não estruturada dos dados armazenados, principalmente documentos de texto usando a linguagem HTML, e a natureza dinâmica da Web que requer que os usuários continuamente realizem pesquisas para a seleção de novos documentos de interesse. As dificuldades para formular e constantemente realizar consultas na Web podem ser reduzidas com o uso de agentes inteligentes. Utilizando métodos da área de inteligência artificial, esses agentes podem aprender os interesses de um usuário especifico, sendo capazes de personalizar buscas e retornar documentos de maior qualidade. Em trabalhos anteriores do grupo de pesquisa ao qual se vinculam os autores deste resumo foi desenvolvido um agente de filtragem de informação baseado em redes neurais de Hopfield. O trabalho aqui relatado teve como objetivo avaliar se o uso de ontologias pode contribuir para aumentar a eficácia desse agente. |
METODOLOGIA: |
O agente opera em dois modos: geração do espaço de conceitos e filtragem de documentos. Para gerar um espaço de conceitos é utilizada uma coleção de documentos selecionados pelo usuário sobre um domínio de interesse. O agente remove os marcadores HTML do documento e as palavras irrelevantes (stop words) e gera os termos que melhor representam a coleção de documentos usando técnicas de indexação automática. A seguir são calculados coeficientes assimétricos de similaridade entre os termos. Termos e coeficientes de similaridade definem a rede de Hopfield, onde os termos correspondem aos neurônios e os coeficientes de similaridade aos pesos das conexões entre os neurônios. Para filtrar um documento, o agente gera os termos que representam o documento usando técnicas de indexação automática; e, usando esses termos, ativa os neurônios de entrada da rede. Cada neurônio de entrada receberá um valor entre 0 e 1 que dependerá da relação semântica existente entre os termos que representam o documento e o termo associado ao neurônio, determinada utilizando um algoritmo de cálculo de similaridade entre conceitos da ontologia. Uma vez ativada, a rede procurará um estado de equilíbrio. Quando esse estado é atingido, o número de neurônios ativos indica a relevância do documento filtrado. |
RESULTADOS: |
A eficácia do agente foi medida utilizando as taxas de precisão e cobertura. A precisão é calculada dividindo o número de documentos relevantes recuperados pelo número total de documentos recuperados. A cobertura é calculada dividindo o número de documentos relevantes recuperados pelo número de documentos relevantes disponíveis na base de documentos. Essas taxas variam de 0 a 1, sendo a situação ideal quando ambas atingem 1. Foram utilizados documentos retirados da Web e armazenados em um repositório local. Foi realizado um experimento sem o uso de ontologia e outro com uso de ontologia. Foram utilizados 48 documentos de diversos assuntos, sendo 13 deles relacionados a transportes, que no caso da avaliação do sistema são considerados relevantes. No experimento com ontologia 15 documentos foram retornados, sendo 12 deles relevantes, portanto precisão de 0,8, e cobertura de 0,92. No teste sem ontologia 16 documentos foram retornados, sendo 11 deles relevantes, portanto precisão de 0,68 e cobertura de 0,84. |
CONCLUSÃO: |
O objetivo da pesquisa descrita neste resumo era verificar se o uso de ontologias pode contribuir para aumentar a eficácia de um agente de filtragem de documentos existente. Os experimentos realizados sugerem que a resposta é afirmativa. Entretanto, em trabalhos futuros deve-se procurar confirmar esses resultados em experimentos de mais larga escala. Trabalhos futuros devem também analisar a escalabilidade do agente, ou seja, como se comporta o seu desempenho à medida que tem que tratar de maiores quantidades de documentos e ontologias mais complexas, de modo a determinar em que contextos o seu uso é recomendado. |
Palavras-chave: Filtragem de Documentos, Redes Neurais, Ontologias. |