60ª Reunião Anual da SBPC




A. Ciências Exatas e da Terra - 2. Ciência da Computação - 17. Ciência da Computação

APERFEIÇOAMENTO DO TRADUTOR FALIBRAS A PARTIR DE NOVAS TÉCNICAS DE TRADUÇÃO

João Roberto dos S. Júnior1
Luiz Américo M. Jardim1
Luis Cláudius Coradine1
Fábio Cunha de Albuquerque1

1. UFAL


INTRODUÇÃO:
O projeto Falibras tem como base de referência uma estrutura tradutora do Português (falado ou escrito) para a Língua Brasileira de Sinais (LIBRAS) em sua forma gestual animada, com o intuito de facilitar a comunicação entre ouvintes e surdos, ajudando estes a aprender a língua portuguesa e os provendo um meio de se desenvolver socialmente. É uma ferramenta que poderá ser utilizada em escolas, por professores que não conheçam a LIBRAS, ajudando os alunos surdos a participarem do processo do aprendizado. O objetivo principal do Falibras é, a partir de um trecho em Português, obter uma seqüência de animações em LIBRAS que tenha o mesmo significado do trecho em Português. Percebe-se que É uma tarefa difícil, mas graças às semelhanças entre as estruturas das duas línguas, os resultados têm sido satisfatórios. Considerando que a língua LIBRAS possui toda a complexidade e o poder expressivo de uma LN (Linguagem Natural), o tradutor tem sido desenvolvido utilizando-se técnicas de PLN (Processamento de Linguagem Natural). A LIBRAS é classificada como uma LN. Assim com o português, ela possui morfologia, sintaxe e semântica. No lugar de palavras, os itens lexicais são os sinais. Portanto, para se comunicar em LIBRAS não é o bastante saber apenas os sinais, mas também conhecer bem sua gramática, a fim de formar combinações adequadas e lógicas. O PLN é um ramo da Inteligência Artificial que tem por objetivo interpretar e gerar textos em uma língua natural. A interpretação de linguagem natural baseia-se em mecanismos que tentam ‘compreender’ frases em alguma linguagem natural, buscando traduzi-las para uma representação que possa ser compreendida e utilizada pelo computador. Na geração de linguagem natural, o computador traduz uma representação interna de um conteúdo semântico, pré-definido para sua expressão em alguma língua, buscando produzir textos os mais próximos possíveis de textos produzidos por pessoas. O sistema Falibras está sendo desenvolvido utilizando técnicas dessas duas áreas, mais especificamente, a tradução automática. Na tradução automática, um texto em uma linguagem fonte é reestruturado para uma representação intermediária. Feito isto, ocorre a tradução para outra linguagem alvo, a partir de regras de transferência da linguagem fonte para a linguagem alvo.

METODOLOGIA:
O analisador sintático foi a principal ferramenta desenvolvida para melhorar o processo de tradução realizado pelo Falibras. Ele foi escrito com base no algoritmo de Earley, que é apenas um reconhecedor, ou seja, não provê a construção de árvore sintática. Além disso, foi utilizada a linguagem de programação C++ em seu desenvolvimento. A análise é realizada por meio de um arquivo de texto que representa uma gramática livre de contexto. O conteúdo deste arquivo segue a forma de uma BNF. A partir dele, uma vez que ele esteja bem estruturado (sem erros de sintaxe), a análise pode ser efetuada pelo algoritmo de Earley. Para tornar o algoritmo um analisador sintático (parser) é necessário que exista uma etapa de construção de árvores sintáticas após uma análise de texto bem sucedida.Para tanto, um algoritmo específico de geração de árvore foi criado. Para utilizar a estrutura árvore na linguagem C++, foi utilizada a classe contêiner tree (escrita por Kasper Peeters, ver www.aei.mpg.de/~peekas/tree). Uma das suas grandes vantagens é a semelhança com as características das bibliotecas padrão da STL (Standard Template Library, ver www.cplusplus.com), em particular, os iteradores.

RESULTADOS:
O analisador sintático mostrou-se eficiente em seu papel. Porém, existem algumas limitações quanto ao número de árvores sintáticas que ele pode gerar. Mas, mesmo sendo gerada uma árvore, já é o bastante para que se obtenha o resultado uma tradução coerente. Um outro ponto a ser discutido, é a criação de regras de transferência da língua portuguesa para a LIBRAS. É nessa etapa que se identifica a qualidade de uma tradução. Para oferecer isso, um profissional da área de lingüística deve elaborar estas regras de transferência de forma consistente [DOOR, B.J. et al, 1998].

CONCLUSÕES:
No desenvolvimento desta etapa do projeto, foram identificadas as deficiências de implementação o sistema incialmente possuía. Primeiramente, o uso da linguagem de programação Prolog para o desenvolvimento do módulo de análise sintática foi substituído pela linguagem C++. E, a partir daí, todas as entidades do sistema poderiam ser abstraídas com mais facilidade, devido às características já apresentadas por esta linguagem. O antigo módulo de análise sintática utilizava o algoritmo clássico top-down. Porém, em determinadas vezes, ele se mostrava ineficiente (por exemplo, o problema da recursão à esquerda causava um loop infinito). Para superar tais problemas, o algoritmo de Earley foi usado e mostrou-se uma boa ferramenta. O uso de um arquivo de gramática tornou os testes mais flexíveis, pois caso haja necessidade de alteração neste arquivo, não será preciso recompilar todo o sistema (como era feito anteriormente), o que causaria, portanto, grande perda de tempo. A arquitetura por transferência foi adotada no sistema Falibras. E, para que esta arquitetura cumpra seu dever, as regras de transferência da língua portuguesa para a LIBRAS devem ser bem definidas, uma vez que, são cruciais para o processo de tradução.

Instituição de fomento: FAPEAL

Trabalho de Iniciação Científica

Palavras-chave:  analisador sintático, LIBRAS

E-mail para contato: jroberto.comp@gmail.com