Aperfeiçoando uma metodologia para extração semiautomática de parâmetros de um modelo dinâmico do ritmo

Pablo Arantes, Ronaldo Mangueira Lima Júnior

Resumo


Apresentamos aperfeiçoamentos a uma metodologia que permite a extração semiautomática de parâmetros do modelo dinâmico do ritmo de Barbosa (2006). A metodologia busca a combinação de três parâmetros do modelo - taxa de indução (α), taxa de decaimento (β) e força de acoplamento (w0) - que minimiza a distância entre o contorno gerado pelo modelo e um contorno de duração de uma amostra de fala natural. Identificamos dynamic time warping como a medida de erro que mais minimiza a distância entre os contornos e comparamos as diferenças geradas por dois procedimentos de comparação entre o contorno natural e os gerados pelo modelo - comparação direta da duração posição a posição ao longo do enunciado ou comparação da mudança relativa na duração. Os resultados mostram que os dois métodos produzem estimativas diferentes para α e w0, embora essa diferença tenha uma magnitude baixa, em torno de 4% da gama de valores que os parâmetros assumem na metodologia. Os valores de α estimados para amostras de duas variedades do português brasileiro (Ceará e São Paulo) apresentam uma diferença estatisticamente relevante em torno de 0,2, e a diferença observada para w0 é de 0,01. Esse resultado se alinha à hipótese de Barbosa (2006), que prevê menor variabilidade em w0 entre falantes de uma mesma língua e maior variabilidade em α em função de fatores como estilos de elocução. Outra novidade apresentada no presente estudo é a análise do efeito da taxa de elocução sobre a estimativa dos parâmetros para a variedade de São Paulo. A variação na taxa de elocução (normal/típica, lenta e rápida) gerou diferenças semelhantes e de baixa magnitude (entre 0,05 e 0,07) em α e w0. A estimativa geral para w0 gerada por modelos de regressão hierárquicos bayesianos é um intervalo entre 0,64 e 0,81, centrado em 0,72. Esse valor indicaria que o português brasileiro no estilo de elocução leitura de frases é uma língua de ritmo misto tendendo mais ao polo acentual do que ao silábico.



Texto completo:

PDF

Apontamentos

  • Não há apontamentos.