Sobre a percepção de pausa na fala espontânea

Bárbara Teixeira, Tommaso Raso, Plínio Barbosa

Resumo


O trabalho investiga a percepção de pausa dentro de um projeto de detecção automática de fronteiras prosódicas percebidas por segmentadores treinados na segmentação da fala espontânea. O longo do projeto ficou clara a necessidade de construir modelos separados para identificar fronteira com e sem pausa. Por consequência se tornou fundamental definir a pausa. O objetivo deste paper é chegar a uma medida de duração mínima necessária para que um silêncio seja relevante perceptualmente para ouvintes (ou seja, possa ser identificado como pausa), de modo a minimizar os erros em uma detecção automática de pausa, o que necessariamente gera uma fronteira prosódica. Todos os dados são extraídos das seções monológicas do corpus C-ORAL-BRASIL. Os dados utilizados para este trabalho foram segmentados em unidades entonacionais por dois grupos, compostos respectivamente por 14 e 19 segmentadores diferentes. As fronteiras percebidas pelos segmentadores foram marcadas como terminais, não-terminais ou disfluências. Os segmentadores com melhor concordância quanto à percepção das fronteiras anotaram as pausas percebidas nas posições de fronteira. Foi calculado o coeficiente Kappa relativo às marcações de pausas percebidas pelos anotadores. Uma série de variáveis fonético-acústicas foram anotadas com o objetivo de compreender o que contribui na percepção da pausa. As variáveis anotadas são a duração do silêncio, a taxa de articulação e o contexto fonético do silêncio, incluído fatores segmentais e prosódicos. Foi usado o Modelo Linear Generalizado para investigar as variáveis significativas para a percepção de pausa em posição de fronteira terminal, não- terminal e disfluência. Os resultados mostram que alguns fenômenos são importantes apenas para a percepção de pausa em posição de um tipo específico de fronteira. Outros, no entanto, se mostram importantes para a percepção de pausa em todos os três tipos de fronteira. Os resultados também sugerem que a duração ideal para o silêncio ser relevante perceptualmente é 100 ms.


Texto completo:

PDF

Apontamentos

  • Não há apontamentos.