Research on Biomedical Engineering
/doi/10.4322/rbeb.2013.010
Research on Biomedical Engineering
Original Article

Classificação de sinais de vozes saudáveis e patológicas por meio da combinação entre medidas da análise dinâmica não linear e codificação preditiva linear

Healthy and pathological voice assessment by means of nonlinear dynamic analysis measures and linear predictive coding

Costa, Washington César de A.; Costa, Silvana Luciene do N. C.; Assis, Francisco Marcos de; Neto, Benedito Guimarães A.

Resumo

Análise acústica tem sido sugerida como uma ferramenta auxiliar não invasiva e de baixo custo ao diagnóstico de patologias laríngeas. Diversas são as técnicas empregadas, entre as quais técnicas baseadas no modelo linear de produção da fala e na análise dinâmica não linear de sinais de vozes. O primeiro método é baseado na Teoria fonte-filtro, em que a fonte é a laringe e o filtro é o trato vocal. Nesse modelo, os sons surdos são modelados por uma fonte de ruído aleatório e os sons sonoros por um trem de impulsos na frequência fundamental do locutor. Na abordagem não linear são considerados aspectos da voz humana, não explorados no modelo linear, tais como: variação temporal da forma do trato vocal, as ressonâncias associadas à sua fisiologia, as perdas devido ao atrito nas paredes internas do trato vocal, a radiação do som nos lábios, o acoplamento nasal e o comportamento dinâmico associado à vibração das pregas vocais. Neste trabalho são associadas as duas abordagens e avaliado o desempenho na classificação com as características, de forma individual, e a partir da combinação das mesmas. São empregadas oito medidas oriundas da análise dinâmica não linear (dimensão de correlação, quatro medidas de entropia, expoente de Hurst, maior expoente de Lyapunov e o primeiro mínimo da função de informação mútua), além de coeficientes LPC, obtidos a partir da análise preditiva linear. Os resultados sugerem a viabilidade da técnica empregada para a discriminação entre vozes saudáveis e patológicas em geral, como também entre vozes afetadas por patologias laríngeas distintas como edema, nódulos e paralisia nas pregas vocais.

Palavras-chave

Patologias laríngeas, Análise acústica, Classificação de vozes patológicas, Análise dinâmica não linear, Análise preditiva linear.

Abstract

Acoustic analysis has been suggested as a noninvasive aiding and low cost tool for laryngeal disease diagnosis. Several techniques are employed using either the linear model of speech production, or the nonlinear dynamic analysis of voice signals. The first method is based on source-filter theory, in which the source is the larynx and the filter is the vocal tract. In this model, the unvoiced sounds are modeled by a random noise source and the voiced ones by impulse train at the speaker fundamental frequency. In nonlinear approach, aspects of the human voice are considered, not explored in the linear model, such as temporal variation of the vocal tract shape, resonances associated with its physiology, losses due to friction in the vocal tract inner walls, sound radiation in the lips, nose coupling and dynamic behavior associated with vocal fold vibration. This work combines the two approaches and evaluates the performance in classifying the features individually, and from their combination. Eight measures are employed derived from the nonlinear dynamic analysis (correlation dimension, four entropy measures, Hurst exponent, the largest Lyapunov exponent and the first minimum of mutual information function), besides LPC coefficients obtained from linear predictive analysis. The results suggest the feasibility of the employed technique to discriminate between healthy and pathological voices in general, but also among specific laryngeal diseases as vocal fold edema, nodules and paralysis.

Keywords

Laryngeal diseases, Acoustic analysis, Pathological voice assessment, Nonlinear dynamic analysis, Linear predictive analysis
5889fbd75d01231a018b4807 rbeb Articles
Links & Downloads

Res. Biomed. Eng.

Share this page
Page Sections