A. Ciências Exatas e da Terra - 2. Ciência da Computação - 17. Ciência da Computação
APERFEIÇOAMENTO DO TRADUTOR FALIBRAS A PARTIR DE NOVAS TÉCNICAS DE TRADUÇÃO
João Roberto dos S. Júnior1 Luiz Américo M. Jardim1 Luis Cláudius Coradine1 Fábio Cunha de Albuquerque1
1. UFAL
INTRODUÇÃO:O projeto Falibras tem como base de referência uma estrutura tradutora do Português
(falado ou escrito) para a LÃngua Brasileira de Sinais (LIBRAS) em sua forma gestual
animada, com o intuito de facilitar a comunicação entre ouvintes e surdos, ajudando estes a aprender a lÃngua portuguesa e os provendo um meio de se desenvolver socialmente. É uma ferramenta que poderá ser utilizada em escolas, por professores
que não conheçam a LIBRAS, ajudando os alunos surdos a participarem do processo do aprendizado.
O objetivo principal do Falibras é, a partir de um trecho em Português, obter uma
seqüência de animações em LIBRAS que tenha o mesmo significado do trecho em
Português. Percebe-se que É uma tarefa difÃcil, mas graças à s semelhanças entre as
estruturas das duas lÃnguas, os resultados têm sido satisfatórios.
Considerando que a lÃngua LIBRAS possui toda a complexidade e o poder expressivo
de uma LN (Linguagem Natural), o tradutor tem sido desenvolvido utilizando-se técnicas de PLN (Processamento de Linguagem Natural).
A LIBRAS é classificada como uma LN. Assim com o português, ela possui
morfologia, sintaxe e semântica. No lugar de palavras, os itens lexicais são os sinais.
Portanto, para se comunicar em LIBRAS não é o bastante saber apenas os sinais, mas também conhecer bem sua gramática, a fim de formar combinações adequadas e lógicas.
O PLN é um ramo da Inteligência Artificial que tem por objetivo interpretar e gerar textos em uma lÃngua natural. A interpretação de linguagem natural baseia-se em mecanismos que tentam ‘compreenderÂ’ frases em alguma linguagem natural, buscando traduzi-las para uma representação que possa ser compreendida e utilizada pelo computador. Na geração de linguagem natural, o computador traduz uma representação interna de um conteúdo semântico, pré-definido para sua expressão em alguma lÃngua, buscando produzir textos os mais próximos possÃveis de textos produzidos por pessoas. O sistema Falibras está sendo desenvolvido utilizando técnicas dessas duas áreas, mais especificamente, a tradução automática.
Na tradução automática, um texto em uma linguagem fonte é reestruturado para uma representação intermediária. Feito isto, ocorre a tradução para outra linguagem alvo, a partir de regras de transferência da linguagem fonte para a linguagem alvo.METODOLOGIA:O analisador sintático foi a principal ferramenta desenvolvida para melhorar o processo de tradução realizado pelo Falibras. Ele foi escrito com base no algoritmo de Earley, que é apenas um reconhecedor, ou seja, não provê a construção de árvore sintática. Além disso, foi utilizada a linguagem de programação C++ em seu desenvolvimento.
A análise é realizada por meio de um arquivo de texto que representa uma gramática livre de contexto. O conteúdo deste arquivo segue a forma de uma BNF. A partir dele, uma vez que ele esteja bem estruturado (sem erros de sintaxe), a análise pode ser efetuada pelo algoritmo de Earley.
Para tornar o algoritmo um analisador sintático (parser) é necessário que exista uma etapa de construção de árvores sintáticas após uma análise de texto bem sucedida.Para tanto, um algoritmo especÃfico de geração de árvore foi criado.
Para utilizar a estrutura árvore na linguagem C++, foi utilizada a classe contêiner tree
(escrita por Kasper Peeters, ver www.aei.mpg.de/~peekas/tree). Uma das suas grandes vantagens é a semelhança com as caracterÃsticas das bibliotecas padrão da STL (Standard Template Library, ver www.cplusplus.com), em particular, os iteradores.RESULTADOS:O analisador sintático mostrou-se eficiente em seu papel. Porém, existem algumas limitações quanto ao número de árvores sintáticas que ele pode gerar. Mas, mesmo sendo gerada uma árvore, já é o bastante para que se obtenha o resultado uma tradução coerente.
Um outro ponto a ser discutido, é a criação de regras de transferência da lÃngua portuguesa para a LIBRAS. É nessa etapa que se identifica a qualidade de uma tradução. Para oferecer isso, um profissional da área de lingüÃstica deve elaborar estas regras de transferência de forma consistente [DOOR, B.J. et al, 1998].CONCLUSÕES:No desenvolvimento desta etapa do projeto, foram identificadas as deficiências de implementação o sistema incialmente possuÃa. Primeiramente, o uso da linguagem de programação Prolog para o desenvolvimento do módulo de análise sintática foi substituÃdo pela linguagem C++. E, a partir daÃ, todas as entidades do sistema poderiam ser abstraÃdas com mais facilidade, devido à s caracterÃsticas já apresentadas por esta linguagem.
O antigo módulo de análise sintática utilizava o algoritmo clássico top-down. Porém, em determinadas vezes, ele se mostrava ineficiente (por exemplo, o problema da recursão à esquerda causava um loop infinito). Para superar tais problemas, o algoritmo de Earley foi usado e mostrou-se uma boa ferramenta.
O uso de um arquivo de gramática tornou os testes mais flexÃveis, pois caso haja necessidade de alteração neste arquivo, não será preciso recompilar todo o sistema (como era feito anteriormente), o que causaria, portanto, grande perda de tempo.
A arquitetura por transferência foi adotada no sistema Falibras. E, para que esta arquitetura cumpra seu dever, as regras de transferência da lÃngua portuguesa para a LIBRAS devem ser bem definidas, uma vez que, são cruciais para o processo de tradução.
Instituição de fomento: FAPEAL
Trabalho de Iniciação Científica
Palavras-chave: analisador sintático, LIBRAS
E-mail para contato: jroberto.comp@gmail.com
|
|