63ª Reunião Anual da SBPC
A. Ciências Exatas e da Terra - 2. Ciência da Computação - 17. Ciência da Computação
Projeto Olhos Abertos
Pedro Henrique de Castro Lima 1
Simone Azevedo Bandeira de Melo 2
1. Instituto Federal de Educação, Ciência e Tecnologia do Maranhão - Campus Imperatriz
2. Profa. MSc./Orientadora - Instituto Federal de Educação, Ciência e Tecnologia do Maranhão - Campus Imperatriz
INTRODUÇÃO:
O projeto trata de um dos grandes problemas que atinge o Brasil: a não participação dos deficientes visuais no desenvolvimento tecnológico do País. O acesso de deficientes visuais a computadores ainda é limitado. O computador possibilita uma maior dinamização do cotidiano. Este problema é uma realidade que precisa ser tratada, com o avanço tecnológico é possível desenvolver softwares que permitam a essa população participarem de uma forma efetiva na ascensão do mundo digital. O computador é o meio com melhor influência para realizar tal tarefa, pois sempre estão sendo desenvolvidas novas ferramentas para o computador.
Incluir pessoas com distúrbios visuais exige uma análise econômica e social. Econômica, pois muitos deles não participam no mercado de trabalho, portanto um software de baixo custo facilitaria a inclusão de uma maioria. A análise social é para comprovar como o público alvo deste trabalho não conhece como é poderosa a máquina denominada computador e como esta máquina facilita bastante a vida.
Explorar a fala do usuário e seu sentido da audição foram pontos relevantes para a construção do protótipo, o software realiza uma ação no computador correspondente ao comando emitido pelo utilizador e recebe uma resposta sonora indicando que a ação for realizada.
METODOLOGIA:
A linguagem de programação Java foi o meio usado para realizar a interação dos comandos de voz com o computador , usamos essa linguagem devido a sua distribuição ser gratuita. Uma biblioteca de classes Java foi utilizada: a Java Speech API (JSAPI), em português: API Java Falado. A JSAPI captura ruídos sonoros e transforma os em código Java.
Para fazer a interpretação e relacionar os sons capturados, um kit de ferramentas para reconhecimento de voz, SPHINX-4, realiza tal função. O SPHINX (Esfinge em português) interpreta o ruído e busca em seu modelo acústico a palavra com o som mais próximo. Para a emissão das respostas aos comandos é utilizada a Java Media Framework (JMF), uma biblioteca que é capaz de executar sons externos de diversos formatos de mídia.
A primeira etapa do trabalho foi a realização de uma pesquisa com deficientes visuais da Escola Governador Archer em Imperatriz, no Maranhão, visto que essa escola é preparada para receber alunos das mais diversas deficiências. Esta pesquisa diz respeito às necessidades das quais os mesmos exigem em um software deste tipo, além de mostrar a relevância que esse trabalho possui.
Na segunda etapa do trabalho foi a construção de um software adequando-se aos resultados da pesquisa realizada e todas as técnicas de programação mencionadas são utilizadas para a criação do aplicativo.
RESULTADOS:
Os dados da pesquisa que foi realizada na primeira etapa mostram uma fraca interação entre o usuário deficiente e o computador. Poucos afirmam utilizar a máquina, e dos que utilizam a maioria afirma ter ajuda de terceiros para realizar a maioria das ações. Os dados mostram que a maior dificuldade ao interagirem com o computador é a dificuldade do uso de teclado e mouse e a essência do monitor.
A partir disso uma aplicação pré-prototípica foi criada, uma calculadora que faz soma de números de 1 a 10 em inglês. O utilizador dita um número (em inglês) ao microfone, e o operador de soma, no caso o operador “and”, e outro valor consecutivo. Uma resposta sonora é emitida após o processamento da soma. Essa versão “pré-prototípica” foi capaz de atender as necessidades iniciais dos usuários: eliminar teclado, mouse e monitor para interagir com o computador.
Os resultados de testes com essa aplicação mostraram uma dificuldade do sistema ao ser executado em local aberto com diversos ruídos dificultando no reconhecimento causando um distúrbio no sistema, porém, em local fechado é eficaz.
Usando todos os dados da antiga versão, um software prototípico foi elaborado, e este capta comandos como “Firefox”, “media player", executando a aplicação referida e respondendo acusticamente.
CONCLUSÃO:
Com base nos resultados compreende-se que os deficientes visuais não estão incluídos no mundo digital de forma efetiva.
As expectativas dos estudantes com distúrbios visuais do Complexo Governador Archer aumentaram, muitos aguardam a apresentação do novo software e alguns dos que presenciaram a primeira aplicação (denominada versão pré-prototípica) elogiaram bastante o modo como o software funciona, apesar do simples funcionamento de soma.
O aplicativo apresenta uma dificuldade para reconhecer sons em espaço aberto e com diferentes ruídos misturados, essa é uma dificuldade que ainda não foi superada.
O software ainda não utiliza língua portuguesa devido a não conclusão do modelo acústico em português que exige horas de treinamento de voz para sua elaboração.
O protótipo possui eficácia no seu objetivo que é trabalhar em local fechado como escritórios, portanto é capaz de transforma-se em produto e ser repassado, podendo ser utilizado como ferramenta de trabalho ou mesmo para uso doméstico para pessoas com deficiência visual ou não.
Palavras-chave: DEFICIENTES VISUAIS, COMPUTADOR, COMANDOS DE VOZ.