Artigo Completo
e-mail : ogtj@inf.ufes.br CEFET - Campos - RJ |
e-mail : tavares@inf.ufes.br DI/CT/UFES |
e-mail : credine@inf.ufes.br DI/CT/UFES |
Resumo
Este trabalho apresenta um Ambiente Multi-Agente para Recuperação de Informação (AMARI). Mostra como esse ambiente armazena e recupera documentos de uma biblioteca de documentos, usando técnicas de recuperação de informações que lidam com os perfis dos documentos. Apresenta os agentes inteligentes desse ambiente que podem estar geograficamente distribuídos na Internet. Discute a necessidade de uma ferramenta para gerenciar a grande quantidade de conteúdos das mensagens e textos em geral, que circulam em um ambiente de educação à distância.
Palavras-chave: Recuperação de Informação, Agente Inteligente, Arquitetura multi-agente, educação à distância.
Abstract
This work presents an MultAgent System for Information Retrieval (AMARI). It shows as this environment stores and retrieves documents of a document library, using techniques of information retrieval which deal with the profiles of documents. It presents the intelligent agents of this environment who can be geographically distributed in the Internet. It discusses the necessity of a tool to manage the great amount of contents of the messages and texts, which circulate in an environment of distance education.
Keywords: Information retrieval, Intelligent Agent, Multi-agent
Architecture, Distance Education.
Através da utilização de um mural eletrônico podemos estruturar a interação entre os agentes da comunidade, viabilizando assim o compartilhamento de dúvidas e de seus esclarecimentos. Podemos dizer que ele materializa o registro do progresso intelectual do grupo.
Em cursos à distância, quando se explora adequadamente os aspectos multidisciplinar e transdisciplinar, faz-se necessário a utilização de vários murais.
É grande a quantidade de artigos submetidos a esses murais, com suas réplicas e tréplicas. Isso dificulta o acesso a artigos que se referenciem a indagações específicas, provocando uma grande queda no rendimento dos participantes.
Além disso, a constante troca de mensagens privadas (correios), as discussões ao vivo (chats) e inúmeros outros documentos são gerados e disponibilizados por professores e alunos, o que se constitui portanto em uma base de documentos textuais de grandes proporções.
Para atenuar o problema, os sistemas de autoria de sites educacionais oferecem mecanismos de busca baseado no autor, no assunto, no texto e na data. No momento em que o volume de mensagens cresce, esses elementos se tornam insuficientes.
Para tratar esse problema propomos neste artigo uma ferramenta de armazenamento e recuperação baseada no conteúdo das mensagens, independente de seus tamanhos. Essa ferramenta é o sistema AMARI [Terra-99].
Essa proposta foi modelada e implementada através de uma arquitetura multi-agente, que tem se constituído em uma tecnologia promissora para a construção de sistemas inteligentes.
Este artigo está organizado em 6 seções. Na seção
2 apresentamos alguns trabalhos correlatos. Nas seções 3
e 4 apresentamos o Projeto e a Implementação do Sistema AMARI.
Na seção 5, discutimos o uso desse sistema em ambientes de
educação a distância. Na seção 6, apresentamos
as considerações finais e na seção 7, as referências
bibliográficas.
Diversos trabalhos nessa área tem sido desenvolvido no mundo
inteiro, com inúmera aplicações previstas.
Os trabalhos aqui apresentados podem ser aplicados para recuperar informação de qualquer coleção.
Na Universidade de Massachusetts, foi desenvolvido um sistema chamado INQUERY, este sistema usa um modelo probabilístico, baseado em uma arquitetura de rede Bayesiana. Ele tem duas partes: uma rede de documentos e uma rede de perguntas.
Para desempenhar a recuperação, o sistema conecta essas duas redes, e pode assim calcular a probabilidade condicional em que a necessidade da informação é satisfeita a cada documento dado. O sistema então posiciona os documentos por esta probabilidade.
Um dos primeiro, e ainda melhores sistemas de IR disponíveis é o SMART ele foi desenvolvido por Gerard Salton, da Universidade Cornell. Ele usa um modelo de vetor espacial para representar documentos. O SMART desempenha uma ordenação automática removendo as "stopwords" (palavras sem significância) de uma lista predeterminada, "stemming" via exclusão de sufixo, e uma pesagem (peso dos termos). Dado uma nova pergunta, ele converte a mesma para um vetor, e então usa a similaridade dos elementos do vetor com os elementos de um vetor espacial, para medir e comparar a pergunta com os documentos do vetor espacial.
Um outro também interessante é o Micro CDS/ISIS é um avançado sistema de armazenamento de informações não-numéricas e de recuperação. Desenvolvido pela UNESCO, desde 1985, para satisfazer as necessidades de muitas instituições, especialmente em países em desenvolvimento, que precisam gerenciar informações, utilizando novas tecnologias. É usado mundialmente para acessar informações de bibliotecas.
Como mostra a figura 1, o AMARI possui agentes que executam as suas tarefas, podendo estarem distribuídos geograficamente em uma rede de computadores. O que interessa a esses agentes é:
Esse agente fica sendo o responsável pela interação do sistema com o usuário. Ele identifica o interesse do usuário, bem como, de que modo gostaria de receber o documento composto pelo AMARI (tipo e tamanho de letras, cor, som, etc.), tem acesso a uma base de conhecimento com o modelo do usuário, criada no primeiro acesso do usuário ao sistema.
No primeiro acesso, o agente Apresentador solicitará ao usuário que faça o seu cadastro, (nome, escolaridade e etc.) e lhe devolverá uma Senha que será daí em diante a senha de acesso ao sistema.
Em um próximo acesso ao sistema, o usuário informará seu nome e sua senha de acesso. A medida que a interação usuário/sistema vai transcorrendo, ou novas sessões de uso vão sendo realizadas, o modelo do usuário vai sendo dinamicamente atualizado, ou vai sendo ajustado para comportar novas seleções de propriedades de documentos feitas pelo usuário.
No início da interação com o usuário, esse agente apresenta áreas de conhecimento onde o AMARI pode recuperar documentos (p. ex.: mensagens, notas, etc). Então, a partir de um formulário apresentado pelo agente Apresentador, o usuário informa em que área deseja pesquisar e digita a sua solicitação, especificando o conteúdo dos documentos a serem recuperados, em linguagem natural.
Estando o agente Apresentador de posse da solicitação do usuário e da área dessa solicitação, ele envia uma mensagem ao agente Editor contendo a pergunta, a área e a identificação do usuário.
Nesse ponto o agente Apresentador fica aguardando uma mensagem, do agente Editor, com a resposta a sua solicitação.
Chegando essa mensagem o agente Apresentador exibe o conteúdo dos documentos recuperados, cuidando de sua apresentação audiovisual.
3.2 Agente Editor
O agente Editor desempenha o papel mais importante no AMARI, possuindo várias atribuições. Ele é responsável pelo:
Para elaborar esse perfil do documento, o agente Editor faz as seguintes filtragens no documento:
Editor conhece a estrutura de cada área de conhecimento, com a correta seqüenciação dos tópicos, considerando os pré-requisitos de cada tópico (veja figura 3). O Editor usa essa estrutura para sequenciar os documentos recebidos do Agente Arquivista no documento final. Isso por que é construído um único documento contendo todas as informações (documentos) recuperadas.
Outro papel do Editor é tratar os documentos que serão
incorporados à biblioteca de documentos. Ao receber um documento,
ele fará uma análise para encontrar o perfil desse documento
(figura 3). Essa análise é semelhante a relatada para construir
o perfil da solicitação do usuário. Após isso,
encaminha ao Arquivista o documento com o seu perfil.
3.3 Agente Arquivista
O agente Arquivista é quem cuida dos documentos e de seus perfis. O Arquivista recebe do Editor a solicitação de documentos relativos ao perfil da solicitação do usuário. O Arquivista recorre à sua biblioteca de perfis dos documentos e recupera os documentos relativos ao pedido, que satisfaçam ao perfil da especificação feita pelo usuário, calculando o "peso" do documento (de acordo com uma heurística adotada) e classificando-o.
O Arquivista usa um procedimento heurístico para classificar
os documentos de acordo com a sua relevância. Finalmente, ele devolve
ao Editor os documentos (o nome e a localização) que mais
se aproximam do perfil desejado.
4. Implementação do Sistema AMARI
O sistema foi implementado em um ambiente Delphi 3. Os agentes Apresentador, Editor e Arquivista, se comunicam usando a linguagem KQML e o protocolo de rede TCP/IP. O usuário interage com o Sistema AMARI através do agente Apresentador, sendo transparente para ele os outros agentes.
Quando o usuário entra com uma solicitação, o agente Apresentador envia este conteúdo ao agente Editor, quer irá processar essa solicitação extraindo o perfil da "pergunta" e montando um frame conforme a figura 3.
Estando de posse do perfil da pergunta o Agente Editor envia (linguagem KQML) uma mensagem ao Agente Arquivista, com esta informação, solicitando que ele (o agente Arquivista), verifique, junto a sua base de conhecimento (perfis de todos os documentos que existem na base de conhecimento do Sistema AMARI), quais os documento mais relevantes em relação a pergunta do usuário.
Quando o Arquivista localiza um documento ele imediatamente usa o perfil do documento para extrair o peso relativo do documento, guardando em um tabela temporária o nome e o peso. Assim ele verificará todos os perfis da área da pergunta e os guardará nessa tabela. Ao terminar, o Arquivista classifica os mais relevantes e envia ao Editor tantos documentos quantos o usuário solicitou que fossem concatenados.
Ao receber a lista de documentos o Agente Editor extrai de sua base os documentos e os envia ao Apresentador que mostrará ao usuário o documento final.
Tendo recebido em sua estação o documento final o usuário poderá ler, imprimir ou salvar em disco o documento.
Por fim o usuário responderá a um questionário, avaliando o funcionamento do sistema, tempo de resposta, conteúdo da resposta, etc. O Apresentador enviará essa avaliação ao Editor que a guardará em um Banco de Dados para ser examinado pelo administrador do sistema.
5. Aplicações
O Sistema AMARI tem diversas aplicações em ambientes de educação à distância, entre elas podemos citar:
6. Considerações Finais
Apresentamos o projeto e a implementação do AMARI (Ambiente Multi-Agente de Recuperação de Informação), com diversas aplicações possíveis em ambientes cooperativos de educação à distância, mediados por computador.
A possibilidade de armazenar textos e recuperá-los, de acordo com os seus conteúdos, é uma função importante em ambientes que precisam lidar com grande quantidade de informações, como é o caso dos ambientes educacionais.
Ressaltamos que os atuais sistemas de autoria de ambientes de educação à distância, para amenizar o problema de gerenciar a quantidade de informações trocadas pelos participantes dos cursos, oferecem mecanismos de busca baseados no autor, no assunto, no texto e na data. No momento em que o volume de mensagens cresce, esses elementos se tornam insuficientes.
A abordagem usada pelo AMARI é baseada no conteúdo das mensagens, independente de seus tamanhos.
O sistema apresentado foi desenvolvido como dissertação de mestrado em informática e deverá ser usado no contexto do projeto AmCorA, Ambiente Cooperativo de Aprendizagem, [Menezes] como uma ferramenta para armazenar e recuperar as mensagens trocadas pelos participantes de um ambiente de aprendizagem, nos diversos meios de interação disponíveis (e-mail, chats, fóruns de discussões, calendários), bem como gerenciar os textos editados nesse ambiente.
7. Referências Bibliográficas
[Gonnet87] GONNET, G. 1987. "Extracting Information from a Text Database: An Example with Dates and Numerical Data," in Third Annual Conference of the UW Centre for the New Oxford English Dictionary, pp. 85-89, Waterloo, Canada.
[JPessoa97] J. M. Pessoa. Desenvolvimento Orientado a Agentes: Uma Experiência com Agentes de Interface. Dissertação de Mestrado, Universidade Federal do Espírito Santo, 1997.
[Menezes99] Menezes, C. S.; Cury, D.; et alli; "Um Ambiente Cooperativo para Aprendizagem Construtivista Utilizando a Internet"; Projeto de Pesquisa; DI/CT/UFES; 1999.
[Rijsbergen79] C. J. van RIJSBERGEN B.Sc., Information Retrieval , Dip. NAAC, Ph.D., M.B.C.S., F.I.E.E., C.Eng., F.R.S.E., Second Edition (London: Butterworths, 1979).
[Salton83] SALTON, G., and M. MCGILL 1983. An Introduction to Modern Information Retrieval. New York: McGraw-Hill.
[Terra98] O. G. Terra Jr e Orivaldo L. T., Composição Inteligente de Documentos, Anais do IX Simpósio Brasileiro de Informática na Educação, Fortaleza – Ceará , novembro de 1998.
[Terra99] O. G. Terra Jr., "Um Ambiente Multi-Agente para Recuperação
de Informações"; Dissertação de Mestrado (ser
defendida em agosto/99); Mestrado em Informática, CT/UFES; 1999.