Aperfeiçoando uma metodologia para extração semiautomática de parâmetros de um modelo dinâmico do ritmo

Pablo Arantes; Ronaldo Mangueira Lima Júnior

Aperfeiçoando uma metodologia para extração semiautomática de parâmetros de um modelo dinâmico do ritmo

Pablo Arantes, Ronaldo Mangueira Lima Júnior

Resumo

Apresentamos aperfeiçoamentos a uma metodologia que permite a extração semiautomática de parâmetros do modelo dinâmico do ritmo de Barbosa (2006). A metodologia busca a combinação de três parâmetros do modelo - taxa de indução (α), taxa de decaimento (β) e força de acoplamento (w0) - que minimiza a distância entre o contorno gerado pelo modelo e um contorno de duração de uma amostra de fala natural. Identificamos dynamic time warping como a medida de erro que mais minimiza a distância entre os contornos e comparamos as diferenças geradas por dois procedimentos de comparação entre o contorno natural e os gerados pelo modelo - comparação direta da duração posição a posição ao longo do enunciado ou comparação da mudança relativa na duração. Os resultados mostram que os dois métodos produzem estimativas diferentes para α e w0, embora essa diferença tenha uma magnitude baixa, em torno de 4% da gama de valores que os parâmetros assumem na metodologia. Os valores de α estimados para amostras de duas variedades do português brasileiro (Ceará e São Paulo) apresentam uma diferença estatisticamente relevante em torno de 0,2, e a diferença observada para w0 é de 0,01. Esse resultado se alinha à hipótese de Barbosa (2006), que prevê menor variabilidade em w0 entre falantes de uma mesma língua e maior variabilidade em α em função de fatores como estilos de elocução. Outra novidade apresentada no presente estudo é a análise do efeito da taxa de elocução sobre a estimativa dos parâmetros para a variedade de São Paulo. A variação na taxa de elocução (normal/típica, lenta e rápida) gerou diferenças semelhantes e de baixa magnitude (entre 0,05 e 0,07) em α e w0. A estimativa geral para w0 gerada por modelos de regressão hierárquicos bayesianos é um intervalo entre 0,64 e 0,81, centrado em 0,72. Esse valor indicaria que o português brasileiro no estilo de elocução leitura de frases é uma língua de ritmo misto tendendo mais ao polo acentual do que ao silábico.

Texto completo:

PDF

Apontamentos

Não há apontamentos.

Login
Senha
Lembrar usuário

Anais do Congresso Brasileiro de Prosódia

Aperfeiçoando uma metodologia para extração semiautomática de parâmetros de um modelo dinâmico do ritmo

Resumo

Texto completo:

Apontamentos