Uma Ferramenta Inteligente para Recuperação de Informações em Ambientes de Educação à Distância

Artigo Completo

Osvaldo Gomes Terra Jr
e-mail : ogtj@inf.ufes.br
CEFET - Campos - RJ
Orivaldo de Lira Tavares
e-mail : tavares@inf.ufes.br
DI/CT/UFES
Crediné Silva Menezes
e-mail : credine@inf.ufes.br
DI/CT/UFES
Universidade Federal do Espírito Santo
Centro Tecnológico - Mestrado em Informática
Av. Fernando Ferrari, s/n - Campus de Goiabeiras
CEP 29060-900 - Vitória - ES - Brasil
Tel.: (0xx27)3352899
E-mail: ogtj@inf.ufes.br

Resumo

Este trabalho apresenta um Ambiente Multi-Agente para Recuperação de Informação (AMARI). Mostra como esse ambiente armazena e recupera documentos de uma biblioteca de documentos, usando técnicas de recuperação de informações que lidam com os perfis dos documentos. Apresenta os agentes inteligentes desse ambiente que podem estar geograficamente distribuídos na Internet. Discute a necessidade de uma ferramenta para gerenciar a grande quantidade de conteúdos das mensagens e textos em geral, que circulam em um ambiente de educação à distância.

Palavras-chave: Recuperação de Informação, Agente Inteligente, Arquitetura multi-agente, educação à distância.

Abstract

This work presents an MultAgent System for Information Retrieval (AMARI). It shows as this environment stores and retrieves documents of a document library, using techniques of information retrieval which deal with the profiles of documents. It presents the intelligent agents of this environment who can be geographically distributed in the Internet. It discusses the necessity of a tool to manage the great amount of contents of the messages and texts, which circulate in an environment of distance education.

Keywords: Information retrieval, Intelligent Agent, Multi-agent Architecture, Distance Education.
 
 

  1. Introdução
Em um ambiente de educação à distância, mediado por computador, o mural eletrônico é uma ferramenta imprescindível. Ele é um local onde os participantes de um ambiente de aprendizagem podem iniciar ou participar de tópicos de discussões, registrando as suas dúvidas ou as suas contribuições.

Através da utilização de um mural eletrônico podemos estruturar a interação entre os agentes da comunidade, viabilizando assim o compartilhamento de dúvidas e de seus esclarecimentos. Podemos dizer que ele materializa o registro do progresso intelectual do grupo.

Em cursos à distância, quando se explora adequadamente os aspectos multidisciplinar e transdisciplinar, faz-se necessário a utilização de vários murais.

É grande a quantidade de artigos submetidos a esses murais, com suas réplicas e tréplicas. Isso dificulta o acesso a artigos que se referenciem a indagações específicas, provocando uma grande queda no rendimento dos participantes.

Além disso, a constante troca de mensagens privadas (correios), as discussões ao vivo (chats) e inúmeros outros documentos são gerados e disponibilizados por professores e alunos, o que se constitui portanto em uma base de documentos textuais de grandes proporções.

Para atenuar o problema, os sistemas de autoria de sites educacionais oferecem mecanismos de busca baseado no autor, no assunto, no texto e na data. No momento em que o volume de mensagens cresce, esses elementos se tornam insuficientes.

Para tratar esse problema propomos neste artigo uma ferramenta de armazenamento e recuperação baseada no conteúdo das mensagens, independente de seus tamanhos. Essa ferramenta é o sistema AMARI [Terra-99].

Essa proposta foi modelada e implementada através de uma arquitetura multi-agente, que tem se constituído em uma tecnologia promissora para a construção de sistemas inteligentes.

Este artigo está organizado em 6 seções. Na seção 2 apresentamos alguns trabalhos correlatos. Nas seções 3 e 4 apresentamos o Projeto e a Implementação do Sistema AMARI. Na seção 5, discutimos o uso desse sistema em ambientes de educação a distância. Na seção 6, apresentamos as considerações finais e na seção 7, as referências bibliográficas.
 
 


A arquitetura do Sistema AMARI usa o paradigma de uma sociedade composta por três agentes (Editor, Arquivista e Apresentador), que podem estar distribuídos geograficamente em redes que suportem a World Web Wide (WWW), ambiente este que pode ser usado para a recuperação de informações (p. ex.: mensagens, documentos didáticos, etc), de acordo com as especificações do usuário.

Como mostra a figura 1, o AMARI possui agentes que executam as suas tarefas, podendo estarem distribuídos geograficamente em uma rede de computadores. O que interessa a esses agentes é:

    1. Saber o endereço dos outros agentes para que se comuniquem.
    2. O agente Arquivista precisa saber onde procurar as informações a serem recuperadas.
    3. O agente Apresentador tem o endereço dinâmico e sempre que é inicializado por um usuário, envia imediatamente o seu endereço ao agente Editor.
    1. Agente Apresentador
Esse agente se comunica com o usuário através de um software em sua estação. Esse software, ao ser inicializado, faz a conexão com a Internet, localizando o agente Editor e lhe enviando o endereço do usuário na rede.

Esse agente fica sendo o responsável pela interação do sistema com o usuário. Ele identifica o interesse do usuário, bem como, de que modo gostaria de receber o documento composto pelo AMARI (tipo e tamanho de letras, cor, som, etc.), tem acesso a uma base de conhecimento com o modelo do usuário, criada no primeiro acesso do usuário ao sistema.

No primeiro acesso, o agente Apresentador solicitará ao usuário que faça o seu cadastro, (nome, escolaridade e etc.) e lhe devolverá uma Senha que será daí em diante a senha de acesso ao sistema.

Em um próximo acesso ao sistema, o usuário informará seu nome e sua senha de acesso. A medida que a interação usuário/sistema vai transcorrendo, ou novas sessões de uso vão sendo realizadas, o modelo do usuário vai sendo dinamicamente atualizado, ou vai sendo ajustado para comportar novas seleções de propriedades de documentos feitas pelo usuário.

No início da interação com o usuário, esse agente apresenta áreas de conhecimento onde o AMARI pode recuperar documentos (p. ex.: mensagens, notas, etc). Então, a partir de um formulário apresentado pelo agente Apresentador, o usuário informa em que área deseja pesquisar e digita a sua solicitação, especificando o conteúdo dos documentos a serem recuperados, em linguagem natural.

Estando o agente Apresentador de posse da solicitação do usuário e da área dessa solicitação, ele envia uma mensagem ao agente Editor contendo a pergunta, a área e a identificação do usuário.

Nesse ponto o agente Apresentador fica aguardando uma mensagem, do agente Editor, com a resposta a sua solicitação.

Chegando essa mensagem o agente Apresentador exibe o conteúdo dos documentos recuperados, cuidando de sua apresentação audiovisual.

3.2 Agente Editor

O agente Editor desempenha o papel mais importante no AMARI, possuindo várias atribuições. Ele é responsável pelo:

  1. processamento das perguntas de usuários que querem recuperar informações e
  2. processamento dos novos documentos para a geração de perfis, seguindo os algoritmos de filtragens e classificação, fornecidos pelo usuário que quer inserir novas informações que possam ser recuperadas posteriormente.
O agente Editor é quem guarda as principais informações do sistema, por isso ele estará sempre em um determinado servidor, primeiro porque ele terá que ter acesso direto as principais Bases de Conhecimento, e segundo, o Editor será sempre o ponto de referência para o agente Apresentador. As bases usadas pelo agente Editor são:
    1. Dados sobre o usuário (BC1)
    2. Documentos primitivos (BC3)
    3. Base de Conhecimento (árvore de conhecimento) (BC2)
    4. Críticas dos usuários (BC5)
Para fazer a análise da especificação do documento, o Editor constrói um perfil desse documento, usando um algoritmo estatístico, proposto por Salton [Salton83], e um dicionário de palavras-chave [Pessoa97], com o qual ele localiza as palavras-chave que comporão o perfil do documento. O dicionário usado possui uma classificação (DDC) das palavras do domínio de conhecimento escolhido pelo usuário.

Para elaborar esse perfil do documento, o agente Editor faz as seguintes filtragens no documento:

    1. Remoção de palavras comuns usando uma lista de stopwords.
    2. Transformação de letras minúsculas em letras maiúsculas.
    3. Remoção de símbolos especiais e seqüências de espaços múltiplos sendo reduzidos para um espaço.
    4. Transformação de números e datas para um formato padronizado [Gonnet87].
    5. Remoção de sufixos e/ou prefixos de palavras (apoiado em uma lista de sufixos/prefixos).
    6. Extração automática de palavra-chave.
    7. Posição das Palavras (classificação quanto ao número de ocorrência).
O Editor usa o mesmo procedimento para traçar o perfil tanto do documento a ser inserido quanto da solicitação de recuperação. Quando o perfil é do documento o agente Editor envia esse perfil ao agente Arquivista, junto com a localização (número) do documento origem. Quando o perfil é de uma pergunta, o agente Editor solicita ao agente Arquivista que recupere os documentos que mais se aproximem daquele perfil .

A partir do recebimento da mensagem "gostaria de saber sobre tipos da linguagem pascal", pelo agente Apresentador, o sistema AMARI passa a buscar seus objetivos sem a interferência humana. O agente Apresentador envia uma mensagem (KQML [Finin94]) para o Editor com a identificação do usuário, a área da pesquisa e a solicitação. Então o Editor, processando e filtrando esta solicitação do exemplo, obteria as palavras: tipos(1), linguagem(1) e pascal(1). Até aí teriam sido achadas 03 possíveis palavras-chaves. Cada uma delas com freqüência 1. De posse dessas palavras o Editor inicia uma busca, na sua base de conhecimento, da área solicitada. Essa busca é em profundidade, desde o grupo até os termos (veja, na figura 2, a árvore de conhecimento definida por um especialista da área de conhecimento) , obtendo o frame apresentado na figura 3.

Editor conhece a estrutura de cada área de conhecimento, com a correta seqüenciação dos tópicos, considerando os pré-requisitos de cada tópico (veja figura 3). O Editor usa essa estrutura para sequenciar os documentos recebidos do Agente Arquivista no documento final. Isso por que é construído um único documento contendo todas as informações (documentos) recuperadas.

Outro papel do Editor é tratar os documentos que serão incorporados à biblioteca de documentos. Ao receber um documento, ele fará uma análise para encontrar o perfil desse documento (figura 3). Essa análise é semelhante a relatada para construir o perfil da solicitação do usuário. Após isso, encaminha ao Arquivista o documento com o seu perfil.

 

3.3 Agente Arquivista

O agente Arquivista é quem cuida dos documentos e de seus perfis. O Arquivista recebe do Editor a solicitação de documentos relativos ao perfil da solicitação do usuário. O Arquivista recorre à sua biblioteca de perfis dos documentos e recupera os documentos relativos ao pedido, que satisfaçam ao perfil da especificação feita pelo usuário, calculando o "peso" do documento (de acordo com uma heurística adotada) e classificando-o.

O Arquivista usa um procedimento heurístico para classificar os documentos de acordo com a sua relevância. Finalmente, ele devolve ao Editor os documentos (o nome e a localização) que mais se aproximam do perfil desejado.
 
 

4. Implementação do Sistema AMARI

O sistema foi implementado em um ambiente Delphi 3. Os agentes Apresentador, Editor e Arquivista, se comunicam usando a linguagem KQML e o protocolo de rede TCP/IP. O usuário interage com o Sistema AMARI através do agente Apresentador, sendo transparente para ele os outros agentes.

Quando o usuário entra com uma solicitação, o agente Apresentador envia este conteúdo ao agente Editor, quer irá processar essa solicitação extraindo o perfil da "pergunta" e montando um frame conforme a figura 3.

Estando de posse do perfil da pergunta o Agente Editor envia (linguagem KQML) uma mensagem ao Agente Arquivista, com esta informação, solicitando que ele (o agente Arquivista), verifique, junto a sua base de conhecimento (perfis de todos os documentos que existem na base de conhecimento do Sistema AMARI), quais os documento mais relevantes em relação a pergunta do usuário.

Quando o Arquivista localiza um documento ele imediatamente usa o perfil do documento para extrair o peso relativo do documento, guardando em um tabela temporária o nome e o peso. Assim ele verificará todos os perfis da área da pergunta e os guardará nessa tabela. Ao terminar, o Arquivista classifica os mais relevantes e envia ao Editor tantos documentos quantos o usuário solicitou que fossem concatenados.

Ao receber a lista de documentos o Agente Editor extrai de sua base os documentos e os envia ao Apresentador que mostrará ao usuário o documento final.

Tendo recebido em sua estação o documento final o usuário poderá ler, imprimir ou salvar em disco o documento.

Por fim o usuário responderá a um questionário, avaliando o funcionamento do sistema, tempo de resposta, conteúdo da resposta, etc. O Apresentador enviará essa avaliação ao Editor que a guardará em um Banco de Dados para ser examinado pelo administrador do sistema.

5. Aplicações

O Sistema AMARI tem diversas aplicações em ambientes de educação à distância, entre elas podemos citar:

  1. As mensagens trocadas entre os participantes do ambiente podem ser armazenadas e, quando se desejar, poderão ser recuperadas organizadamente, de acordo com os seus conteúdos, ou seus assuntos, ou seus destinatários ou remetentes. Enfim, esse sistema permite-nos sistematizar o armazenamento e a recuperação dessas mensagens, tornando o registro delas realmente útil.
  2. É comum existirem vários fóruns de discussões (murais eletrônicos) nos ambiente de educação à distância. Nesses fóruns de discussões, os textos publicados podem agora ser armazenados de acordo com áreas de interesse e, assim que houver necessidade, podem ser recuperados de acordo com os seus conteúdos, seus títulos ou seus autores. Por exemplo, posso pedir todos os textos, publicados no fórum Cidadania (ou em qualquer fórum), com conteúdos que versem sobre "a violência contra a mulher", ou todos os textos publicados pelo "autor João da Silva", em todos os fóruns, ou apenas em um fórum de discussão.
  3. Podemos armazenar as mensagens trocadas nas conversas virtuais (chats) e recuperá-las organizadamente. Por exemplo, podemos pedir para serem agrupadas as mensagens que citam "sexo, amor e espiritualidade".
Devemos observar que a especificação dos documentos a serem recuperados são feitas em linguagem natural.

6. Considerações Finais

Apresentamos o projeto e a implementação do AMARI (Ambiente Multi-Agente de Recuperação de Informação), com diversas aplicações possíveis em ambientes cooperativos de educação à distância, mediados por computador.

A possibilidade de armazenar textos e recuperá-los, de acordo com os seus conteúdos, é uma função importante em ambientes que precisam lidar com grande quantidade de informações, como é o caso dos ambientes educacionais.

Ressaltamos que os atuais sistemas de autoria de ambientes de educação à distância, para amenizar o problema de gerenciar a quantidade de informações trocadas pelos participantes dos cursos, oferecem mecanismos de busca baseados no autor, no assunto, no texto e na data. No momento em que o volume de mensagens cresce, esses elementos se tornam insuficientes.

A abordagem usada pelo AMARI é baseada no conteúdo das mensagens, independente de seus tamanhos.

O sistema apresentado foi desenvolvido como dissertação de mestrado em informática e deverá ser usado no contexto do projeto AmCorA, Ambiente Cooperativo de Aprendizagem, [Menezes] como uma ferramenta para armazenar e recuperar as mensagens trocadas pelos participantes de um ambiente de aprendizagem, nos diversos meios de interação disponíveis (e-mail, chats, fóruns de discussões, calendários), bem como gerenciar os textos editados nesse ambiente.

7. Referências Bibliográficas

[Finin94] Finin, T., et alli, "KQML as an Agent Communication Language"; Proceedings of the Third International CIKM; 1994.

[Gonnet87] GONNET, G. 1987. "Extracting Information from a Text Database: An Example with Dates and Numerical Data," in Third Annual Conference of the UW Centre for the New Oxford English Dictionary, pp. 85-89, Waterloo, Canada.

[JPessoa97] J. M. Pessoa. Desenvolvimento Orientado a Agentes: Uma Experiência com Agentes de Interface. Dissertação de Mestrado, Universidade Federal do Espírito Santo, 1997.

[Menezes99] Menezes, C. S.; Cury, D.; et alli; "Um Ambiente Cooperativo para Aprendizagem Construtivista Utilizando a Internet"; Projeto de Pesquisa; DI/CT/UFES; 1999.

[Rijsbergen79] C. J. van RIJSBERGEN B.Sc., Information Retrieval , Dip. NAAC, Ph.D., M.B.C.S., F.I.E.E., C.Eng., F.R.S.E., Second Edition (London: Butterworths, 1979).

[Salton83] SALTON, G., and M. MCGILL 1983. An Introduction to Modern Information Retrieval. New York: McGraw-Hill.

[Terra98] O. G. Terra Jr e Orivaldo L. T., Composição Inteligente de Documentos, Anais do IX Simpósio Brasileiro de Informática na Educação, Fortaleza Ceará , novembro de 1998.

[Terra99] O. G. Terra Jr., "Um Ambiente Multi-Agente para Recuperação de Informações"; Dissertação de Mestrado (ser defendida em agosto/99); Mestrado em Informática, CT/UFES; 1999.
 


Retornar