Inici Glossari Síntesi de parla
  Bibliografia Mapes
  Acústica bàsica AFI Electropalatogrames
  Sons del català Estàndard Imatges RM
     Vocals Laboratori virtual Enllaços
     Consonants Tests de percepció Ajuda
Curs de fonètica acústica
 

Acústica bàsica

Introducció
Què és el so?
I com els sentim, els sons?
Els sons de la parla
   
Període respiratori
   
Període fonatori
   
Període articulatori
Com es fan els diferents tipus de sons: la teoria de la font i el filtre
Veure els sons: representacions acústiques
Exercicis

 

Veure els sons: representacions acústiques

Però com es pot veure un so? Ja hem dit abans que els sons de la parla són complexos, és a dir, que tenen vibracions d’aire a diferents freqüències simultàniament. (Recordem que els sons simples són els que produeixen els diapasons, per exemple.)


Observa el so anterior. Com pots veure si observes el gràfic, sempre es repeteix el mateix patró –que es limita a anar des del punt d’inici fins al punt màxim, baixar fins al punt mínim i tornar al punt d’inici: el cicle, periòdicament– i amb una regularitat perfecta. Això significa que aquest so està compost per una sola ona, que té una determinada freqüència (és a dir, que repeteix la mateixa forma x vegades per segon). En aquest cas, veruàs que la freqüència és molt i molt baixa (5 cicles per segon, ja que el cicle es repeteix 15 vegades en els tres segons que representa el gràfic). Aquest so és inaudible per una persona.

En canvi, fixa’t ara en la forma d’ona següent:


Aquesta ona continua essent periòdica, perquè els cicles es repeteixen, però ara hi ha 20 cicles en 50 mil·lèssimes. Per tant, aquest so té una freqüència de 400 Hz, és a dir, es repeteix el cicle 400 cops cada segon. Aquest so sí que és audible. [so]

Ara fixa’t en el gràfic següent (que és una mostra de la vocal [o]):


En aquest cas també es repeteix un patró, però aquest és complex, és a dir, està format per més d’una ona simple. Per entendre aquest concepte, podem pensar en una analogia: pensa per exemple que una ona simple és una nota musical, mentre que una ona complexa és un acord.

Per veure els sons, existeixen diversos tipus de gràfics que donen informacions diferents. Els més importants són:

    Oscil·lograma
    Espectre (fft i lpc)
    Espectrograma
    Freqüència fonamental

Oscil·logrames
Els gràfics que hem vist anteriorment són oscil·logrames o formes d’ona (en anglès, waveforms). Aquests gràfics són la representació gràfica de les diferències en la pressió de l’aire a través del temps. L’eix de les x representa el pas del temps, i l’eix de les y representa els canvis en la pressió de l’aire.


Observant aquests gràfics obtenim dues informacions importants per entendre els sons de la parla: la freqüència i l’amplitud.

La freqüència és el nombre de vegades per segon que el cicle es repeteix –o podem veure observant l’eix horitzontal–. En canvi, l’amplitud indica quanta pressió de l’aire hi ha en un cada moment. Quan l’ona passa pel punt zero significa que en aquell moment hi ha la pressió ambiental normal; quan arriba al punt màxim indica que en aquell moment la pressió de l’aire és més gran; i quan arriba al punt més baix, significa òbviament que la pressió de l’aire és menor que la pressió ambiental.

Espectre (fft i lpc)
Els sons de la parla són tots complexos, és a dir, estan formats per molts sons simples. Fourier (un matemàtic del segle XIX) va demostrar que les ones periòdiques complexes estaven formades per una sèrie d’ones simples de diferents amplituds i freqüències.

En l’anàlisi acústica de la parla s’utilitzen dos tipus d’espectres basats en el teorema de Fourier: el Fast Fourier Transform (FFT) i el Linear Predictive Coding (LPC). El primer (en català Transformada Ràpida de Fourier) és un mètode ràpid de descomposar un instant d’una ona per veure’n l’amplitud en totes les freqüències. L’LPC (en català Codificació Linear Predictiva) és una suavització de l’FFT basant-se en què l’amplitud en diverses freqüències es pot predir a partir de la que tenen les freqüències veïnes.

L’espectre és una forma de representar quina és l’amplitud en cada banda de freqüències. En el següent exemple veiem una anàlisi LPC sobreposada a una FFT. Correspon al so [i].


Espectrogrames
Ara ja sabem com són els espectres. Però en els espectres no hi tenim cap informació referent al temps. Per tant, podem saber com es distribueix l’energia en tot l’espectre en un moment determinat però no podem saber què passa abans o després. Una solució seria fer centenars d’espectres (FFT o LPC) cada mil·lèsima de segon, per exemple, i veure’ls un darrera l’altre per observar-ne els canvis. Seria un gràfic aproximadament com el següent:


No obstant, aquest gràfic és força difícil d’interpretar. Una altra manera, probablement més fàcil d’interpretar, és utilitzar un mètode semblant però amb un gràfic de dues dimensions: l’eix vertical indica freqüències i l’eix horitzontal, el temps. I la intensitat? Doncs a través d’un codi de colors (o bé, més usualment, en blanc i negre: com més fosc, més intensitat). En tenim uns exemple a continuació:


Els dos espectrogrames representen el mateix fragment de parla. La diferència és en la «resolució». El de dalt és un espectrograma de banda ampla i el de baix és de banda estreta. Aquesta diferència fa referència a l’amplada de la finestra que es fa servir per a l’anàlisi: els pespectrogrames de banda estreta mostren d’una manera clara els harmònics de l’ona glotal. Les línies més fosques representen els harmònics. Aquest tipus d’espectrograma s’utilitza sovint també per analitzar l’entonació a través de l’anàlisi de la freqüència fonamental (que correspon al primer harmònic).

En canvi, els espectrogrames de banda ampla són més idonis per analitzar els formants i els canvis temporals.

Freqüència fonamental
La freqüència fonamental (o F0) és la freqüència més baixa d’un senyal periòdic. Per tant, només podrem parlar d’F0 en els sons sonors. Acústicament, la freqüència fonamental és el primer harmònic de l’espectre.

L’imatge següent representa una porció de l’espectre d’una vocal. La ratlla vertical indica la freqüència del primer harmònic. Observa com tots els altres harmònics tenen una freqüència múltiple de la del primer (estan situats a la mateixa distància).


En el següent espectrograma hi ha una línia blava que mostra la freqüència fonamental. L’espectrograma representa la pregunta “Veritat o mentida?”. Com podeu observar, l’F0 puja d’una manera molt clara al final per marcar l’entonació de la pregunta.