60ª Reunião Anual da SBPC




B. Engenharias - 1. Engenharia - 8. Engenharia Elétrica

SELEÇÃO AUTOMÁTICA DE CORPUS DE TEXTO PARA SISTEMAS DE SÍNTESE DE FALA VISANDO MÁXIMA VARIABILIDADE FONÉTICA E PROSÓDICA

Daiana dos Anjos1
Monique Vitório Nicodem1
Rui Seara1
Izabel Christine Seara1
Rui Seara Jr1

1. UFSC / CTC / LINSE - Laboratorio de Circuitos e Processamento de Sinais


INTRODUÇÃO:
A naturalidade da fala sintética produzida por sistemas de conversão texto-fala é dependente de fatores como a qualidade do corpus gravado, as características da voz do locutor, o corpus de texto escolhido para gravação e os algoritmos de modelagem prosódica. Visando melhorar tanto a representatividade quanto a variabilidade fonética e prosódica do corpus de texto, este trabalho propõe um método para a seleção das sentenças que constituirão tal corpus.

METODOLOGIA:
O método proposto é dividido em quatro etapas principais: conversão grafema-fonema, anotação prosódica, representação na forma de vetores de características e seleção propriamente dita. Na primeira etapa, os fonemas constituintes das sentenças são obtidos através de uma transcrição fonética. Em seguida, uma anotação prosódica é atribuída para cada sentença pertencente ao banco. Essa anotação é baseada em regras que descrevem o padrão entonacional característico de cada classe de frase (declarativa, interrogativa e exclamativa). Na próxima etapa, as informações fonéticas e prosódicas geradas nos estágios anteriores são armazenadas na forma vetorial. Por fim, a seleção das sentenças que maximizam a variabilidade fonética e prosódica é realizada utilizando a ferramenta de algoritmos genéticos.

RESULTADOS:
A avaliação do método proposto é realizada considerando um conjunto de 4.000 sentenças fonética e prosodicamente ricas, selecionadas dentre um grande corpus de texto (com aproximadamente 1.500.000 sentenças pertencentes ao banco de dados CETENFolha). Nessa avaliação, a variabilidade fonética e prosódica das sentenças selecionadas é comparada com a de um conjunto de sentenças aleatoriamente escolhidas.

CONCLUSÕES:
Os resultados experimentais obtidos demonstram que o método proposto pode auxiliar na redução do número de sentenças que compõem o corpus de um sistema de síntese sem causar qualquer prejuízo ao conteúdo fonético e prosódico desse corpus.

Instituição de fomento: CNPq

Trabalho de Iniciação Científica

Palavras-chave:  Algoritmos genéticos, Variabilidade fonética e prosódica, Seleção de um corpus de texto

E-mail para contato: daiana@linse.ufsc.br