B. Engenharias - 1. Engenharia - 8. Engenharia Elétrica
SELEÇÃO AUTOMÁTICA DE CORPUS DE TEXTO PARA SISTEMAS DE SÍNTESE DE FALA VISANDO MÁXIMA VARIABILIDADE FONÉTICA E PROSÓDICA
Daiana dos Anjos1 Monique Vitório Nicodem1 Rui Seara1 Izabel Christine Seara1 Rui Seara Jr1
1. UFSC / CTC / LINSE - Laboratorio de Circuitos e Processamento de Sinais
INTRODUÇÃO:A naturalidade da fala sintética produzida por sistemas de conversão texto-fala é dependente de fatores como a qualidade do corpus gravado, as características da voz do locutor, o corpus de texto escolhido para gravação e os algoritmos de modelagem prosódica. Visando melhorar tanto a representatividade quanto a variabilidade fonética e prosódica do corpus de texto, este trabalho propõe um método para a seleção das sentenças que constituirão tal corpus.METODOLOGIA:O método proposto é dividido em quatro etapas principais: conversão grafema-fonema, anotação prosódica, representação na forma de vetores de características e seleção propriamente dita. Na primeira etapa, os fonemas constituintes das sentenças são obtidos através de uma transcrição fonética. Em seguida, uma anotação prosódica é atribuída para cada sentença pertencente ao banco. Essa anotação é baseada em regras que descrevem o padrão entonacional característico de cada classe de frase (declarativa, interrogativa e exclamativa). Na próxima etapa, as informações fonéticas e prosódicas geradas nos estágios anteriores são armazenadas na forma vetorial. Por fim, a seleção das sentenças que maximizam a variabilidade fonética e prosódica é realizada utilizando a ferramenta de algoritmos genéticos.RESULTADOS:A avaliação do método proposto é realizada considerando um conjunto de 4.000 sentenças fonética e prosodicamente ricas, selecionadas dentre um grande corpus de texto (com aproximadamente 1.500.000 sentenças pertencentes ao banco de dados CETENFolha). Nessa avaliação, a variabilidade fonética e prosódica das sentenças selecionadas é comparada com a de um conjunto de sentenças aleatoriamente escolhidas.CONCLUSÕES:Os resultados experimentais obtidos demonstram que o método proposto pode auxiliar na redução do número de sentenças que compõem o corpus de um sistema de síntese sem causar qualquer prejuízo ao conteúdo fonético e prosódico desse corpus.
Instituição de fomento: CNPq
Trabalho de Iniciação Científica
Palavras-chave: Algoritmos genéticos, Variabilidade fonética e prosódica, Seleção de um corpus de texto
E-mail para contato: daiana@linse.ufsc.br
|
|