Fisiologia della percezione musicale (parte 1)

 

binaurale

I  due modelli teorici che descrivono la fisiologia della percezione acustica sono:

  • La teoria posizionale di Van Helmhotz

  • La teoria della periodicità

Il fatto che i modelli siano due lascia presagire che entrambi, se presi singolarmente, abbiano delle criticità nella spiegazione di alcuni fenomeni acustici. Prima di addentrarci nella descrizione analitica , reputo opportuno dedicare questa prima parte dell’articolo alla descrizione della fenomenologia acustica che rende entrambi i modelli teorici incompleti.

Lo studio della percezione acustica in ambito musicale può essere intrapreso solo in un contesto multidisciplinare. Infatti, vista la  vasta complessità dell’argomento, un tale studio risulterebbe vano ed improduttivo se non si  tenesse conto di tutte le  componenti che, molto spesso, non hanno nulla di apparentemente  accomunabile alla teoria musicale. Vediamole nello specifico:

 

Anatomia

– La forma del cranio determina una leggera discriminante percettiva a livello binaurale in quanto la morfologia delle ossa craniche fa giungere le onde acustiche ai due orecchi in modo differente ( differenza di fase e di intensità) da persona a persona. Questo a prescindere dall’orientamento della testa rispetto alla sorgente sonora. Il problema non si pone nel caso dell’ascolto tramite cuffie o auricolari, in quanto le differenze di fase e l’ intensità delle singole armoniche tra il canale destro e quello sinistro sono univoche, ovvero dipendono esclusivamente dalla  registrazione musicale.

Anche per merito dello studio della differente percezione acustica in funzione della forma anatomica del cranio, è stato  possibile realizzare la tecnica della registrazione binaurale. Questo porterà presto all’implementazione dell’AUDIO 3D  in tutti gli apparati della telefonia mobile nei quali, tramite delle comuni cuffie/auricolari, sarà possibile ascoltare musica registrata in modo binaurale. In questi mesi i membri dell’AES (Audio Engineering Society) si riuniranno per standardizzare i parametri della registrazione binaurale e della sua diffusione. Nel frattempo sono sempre più numerosi gli artisti e le orchestre che usano questa tecnica di registrazione. Attualmente esistono le prime “app.” disponibili per i principali modelli di smartphone.

220px-Dummyhead

Manichino per registrazione binaurale

La tecnica della registrazione binaurale (da non confondere con la stereofonia) prevede l’utilizzo di una testa di manichino, costruita con dimensioni e materiali atti a riprodurre fedelmente l’assorbimento sonoro di una vera testa umana e ,soprattutto, la sua funzione di separatore naturale tra i due canali uditivi (destro e sinistro). La testa riproduce con particolare fedeltà la forma dei padiglioni auricolari e i canali uditivi, all’interno dei quali vengono posti due microfoni ad alta fedeltà. In tal modo, i microfoni captano il suono nel modo in cui risulta equalizzato e modificato in fase dalla testa, e quindi nel modo più simile a come l’avrebbe percepito un ascoltatore reale. Questa tecnica di registrazione ha una resa  particolarmente efficace nella musica classica sinfonica ed in quella  “live” in genere, meno in quella registrata in studio. Personalmente ho ascoltato una sinfonia di Mahler e l’impressione è stata molto convincente. Ho avuto la netta sensazione di  trovarmi al centro di un’ orchestra sinfonica e di localizzare spazialmente ogni singolo gruppo di strumenti. Non avevo mai sentito nulla di lontanamente simile in cuffia  con la consueta tecnica stereofonica. Per fare un esempio, riporto due file sonori registrati in modo binaurale con licenza CC ,  da ascoltare necessariamente in cuffia.

Fonte: Wikipedia foundation Licenza Creative Commons
Descrizione file: Registrazione binaurale rumore carta         

 

 

Fonte: Wikipedia foundation Licenza Creative Commons
Descrizione file: Registrazione binaurale One man rumba

 

Psicoacustica

Se considerassimo la fenomenologia della percezione acustica come  unicamente di tipo fisico-meccanico,  legato ad onde con frequenze che comprimono ed espandono l’aria provocando la vibrazione della membrana timpanica, saremmo molto lontani dalla reale comprensione del fenomeno. L’immagine sonora viene interpretata dalla corteccia cerebrale attraverso delle matrici di cellule chiamate neuroni, la cui complessità è tale da non permetterci allo stato attuale di capirne pienamente tutti gli aspetti. L’essere umano, e probabilmente molte altre specie viventi, possiedono una memoria di tipo acustico, che non è il semplice riconoscimento di un suono a noi familiare, ma è anche la capacità che esso ha di farci evocare un’emozione che sia  piacevole o meno. Un altro motivo che evidenzia l’importanza dell’aspetto psicologico nella percezione uditiva, è la capacità selettiva dei suoni. Numerosi studi hanno evidenziato la capacità innata dell’essere umano di poter isolare un particolare tipo di voce in mezzo ad un insieme indistinto di rumori.

Lo studio dell’attenzione selettiva è stato avviato da Cherry ( Cherry, E. C. (1953) Some experiments on the recognition of speech, with one and with two ears. Journal of Acoustical Society of America 25(5), 975–979.), il quale cercò di capire perché, fra stimoli molteplici provenienti dal mondo esterno, il soggetto ne selezioni alcuni (attended messages) lasciandone decadere altri (unattended messages).

La dimostrazione di ciò è data da un fenomeno noto come cocktail party, in cui si riesce a prestare attenzione ad una sola conversazione nonostante ve ne siano parecchie in corso che potrebbero interferire (in pratica vengono esclusi gli stimoli disturbanti): nonostante che  le emissioni sonore provenienti da tutti gli astanti siano colte dai nostri recettori acustici, noi siamo in grado di selezionare e analizzare solo quelle provenienti dalla persona con la quale stiamo conversando. Negli studi sull’attenzione selettiva sono state utilizzate prevalentemente due classi di paradigmi sperimentali: i paradigmi di selezione e i paradigmi di filtraggio.

L’effetto cocktail party non trova una spiegazione nelle due teorie fondamentali sulla fisiologia della percezione che vedremo in seguito.

Sulla psicoacustica ed in particolare sulle ILLUSIONI ACUSTICHE rimando la lettura di un precedente articolo

 

Fisica Acustica

Il comportamento e l’interazione delle onde sonore ,oggigiorno, è completamente descritto in modo accurato dalle leggi della meccanica classica. Rimando per un approfondimento, la lettura di alcuni articoli precedentemente pubblicati: IL SUONO LA FREQUENZA,   L’INTENSITA‘ IL TIMBRO

 

L’orecchio

aniear1

aniear2

aniear3

La ricezione delle onde sonore parte dalle vibrazioni del timpano dopo il passaggio nel condotto uditivo esterno. Tali vibrazioni si ripercuotono sulla catena degli ossicini che, agendo come una leva, aumenta di 1,2 volte l’energia per unità di area, energia che aumenta ulteriormente di 17 volte grazie alle dimensioni più ridotte della finestra ovale rispetto al timpano. Questo permette di vincere l’inerzia della perilinfa ( il liquido contenuto nella coclea), generando onde di pressione che si ripercuotono quasi contemporaneamente in tutte le parti della conclea. L’Organo di Corti è deputato alla ricezione delle onde sonore, che arrivano come movimenti della membrana basilare dovuti a spostamenti della perilinfa cocleare, e alla loro trasformazione in impulsi nervosi, che attraverso la via uditiva vengono trasmessi all’area 41 del lobo temporale del cervello. L’organo di Corti risulta  essere la struttura capace di convertire, tramite della particolari cellule ciliate, l’energia meccanica in energia elettrica usata dai neuroni per il trasporto dell’informazione.

 

Il Battimento è quel fenomeno acustico (ma non solo) che riguarda due onde sinusoidali aventi frequenze molto prossime tra loro. La loro sovrapposizione, entro determinati valori di frequenza che vedremo in seguito, produrrà la percezione di un unico suono avente la tipica caratteristica di una voce pulsante.

Se le frequenze sono sufficientemente lontane tra di loro, la sovrapposizione di due suoni è percepita come l’insieme di “due voci” distinte. Se  invece le frequenze sono molto simili, non si percepiscono più le due voci distinte, ma, appunto, un solo suono di altezza simile a quella dei componenti, ma “battente”.

A molti di voi sarà capitato di osservare, ad esempio, un chitarrista nell’atto di accordare lo strumento.  In genere, dopo aver intonato tramite un diapason la quinta corda (A), premerà tale corda in corrispondenza del quinto tasto per intonare la corda sottostante(D). Muovendo la chiavetta che regola la tensione della corda,  avrete notato,  in prossimità dell’unisono (nota D), un caratteristico effetto di variazione pulsante dell’intensità sonora: ebbene quello è il battimento.

p.s. nella pratica molti chitarristi preferiscono accordare lo strumento usando gli armonici naturali, ma il fenomeno acustico del battimento è lo stesso.

Questo effetto è anche facilmente riscontrabile nel cosiddetto vibrato degli archi. Infatti, siccome il vibrato si ottiene spostando leggermente il dito sulla corda del violino, si producono dei suoni leggermente diversi l’uno dall’altro, determinando  la sovrapposizione delle vibrazioni. Il medesimo effetto è riscontrabile nel caso vi sia un’intera sezione di strumenti ad eseguire la stessa nota. Ciò e dovuto al fatto che, a livello microtonale, ogni singolo strumento ha  un’accordatura leggermente diversa; l’effetto di questi battimenti  contribuisce, nell’insieme, alla qualità del suono finale di un’intera orchestra.

Fino ad ora abbiamo descritto questo effetto considerando esclusivamente la nota fondamentale o tonica, ma come abbiamo visto un suono complesso è composto da una serie di armonici multipli della nota fondamentale. La loro interazione produce altri battimenti definiti di seconda specie. Vedi terzo suono o suono di Tartini.

Nell’esempio sonoro in basso ho realizzato, tramite il linguaggio di programmazione C ,il cui listato è riportato in appendice, e può essere liberamente copiato e/o modificato a fini di studio, aggiungendo altri suoni fondamentali ed armonici. Il file mp3 generato  è composto da: una nota singola a 440 Hz (A) sovrapposta ad un suono modulante che parte da 415,3 Hz ed  arriva a 440 Hz; giungendo all’unisono con la prima nota al 25° secondo.

 

La relazione che determina la frequenza del battimento per due suoni puri, è data dalla differenza delle due frequenze interagenti:

freqbatt

 

Quando questa differenza di frequenza raggiunge i 12Hz circa, non percepiamo più due suoni distinti, ma un’ unica voce battente o tremolante; nell’esempio sonoro dal 13° secondo in poi. Infatti, avremo 440-428= 12Hz.
battimentoNella figura in alto possiamo vedere l’andamento di due onde (y1 e y2). L’onda risultante in blu è il suono percepito battente. Quando i due segnali sono in fase si ha la somma delle intensità delle singole onde, viceversa, quando si trovano in opposizione di fase i due segnali si annullano. Il ripetersi di queste due condizioni nel tempo determina il battimento.

La percezione delle altezze

220px-Stereocilia_of_frog_inner_ear.01

stereociglia

All’ interno della conclea troviamo la membrana basilare e l’organo di Corti dove sono presenti delle cellule ciliate interne ed sterne. Ci sono circa tra 15.000 e 16.000 di queste cellule  nella conclea. Le cellule cigliate esterne hanno stereociglia che, come minuscoli fili di erba, trasformano il movimento della membrana basilare in impulsi nervosi che,tramite il nervo ottico, raggiungono la corteccia cerebrale.

 

422px-Basilarmembrane2_topath.svg

 

Nella figura a lato possiamo notare la semplificazione schematica dell’intera superfice  della membrana basilare. Le cellule che si trovano nella parte destra saranno eccitate da suoni aventi frequenze basse, e via di seguito.

Quando due suoni simultanei hanno frequenze molto vicine fra di loro ( avevamo visti intorno ai 12 Hz di differenza) eccitano lo stesso gruppo di cellule, in tal caso, non percepiamo più due suoni distinti ma uno solo.

La Banda Critica

Il concetto di Banda Critica  è molto importante perché determina sia la percezione di suoni simultanei (accordi) che quella del timbro.
Esso, inoltre, ha influenzato vari aspetti della pratica musicale, come vedremo.
Abbiamo visto che l’orecchio interno è un potente analizzatore in grado di distinguere le componenti di un suono. La sua capacità di discriminazione ha però dei limiti.
Le cellule dell’organo del Corti che interpretano le informazioni di frequenza, infatti, lavorano a gruppi di circa 1300, ognuno dei quali occupa fisicamente circa 1.3 mm di membrana basilare.
Ognuno di tali gruppi costituisce una Banda Critica .

Ricapitolando nell’esempio sonoro di prima possiamo distinguere le seguenti fasi:

  1. un suono che subisce lente oscillazioni dell’intensità (è questo il fenomeno dei battimenti);
  2. un suono nel quale le oscillazioni dell’intensità aumentano di frequenza fino a tradursi in un suono aspro, estremamente dissonante e fastidioso per l’orecchio:Banda critica
  3. un suono che torna ad essere gradevole ma nel quale si percepiscono chiaramente le due note che lo costituiscono come entità separate (è quello che i musicisti chiamano un bicordo).

400px_Banda_criticaQuesto spiega perchè, se ad esempio,suoniamo un intervallo di terza maggiore o minore, nella parte estremamente bassa del pianoforte, esso suonerà particolarmente aspro e dissonante; viceversa non sarà così, se il medesimo intervallo venisse suonato nel registro più alto dello strumento. La spiegazione di questa diversa percezione è dovuto al fatto che, la dissonanza è causata dal motivo che l’ intervallo cade all’interno della banda critica e che quindi coinvolge lo stesso gruppo di cellule.

 

 

In appendice riporto il listato del file di esempio, che può liberamente essere copiato e modificato.Per renderlo eseguibile ed ottenere il file sonoro bisognerà compilarlo con il programma open source CSOUND

<CsoundSynthesizer>

<CsOptions>

</CsOptions>

<CsInstruments>

sr = 44100

ksmps = 4410

nchnls = 2

0dbfs = 1

instr 1

aosc poscil p4, p5, 1

;aosc poscil p4, p5, 2

;aosc poscil p4,p5,3

;aosc poscil p4,p5,4

;aosc poscil p4,p5,5;

;aenv adsr 0.1,1,1,0.2

aenv adsr 0.2,1,1,0.2

outs aosc*aenv,aosc*aenv

endin

instr 99

allL, allR monitor

fout “battimento440.wav”,14,allR,allL

endin

</CsInstruments>

<CsScore>

f 1 0 16384 10 1 0[1/3]0[1/5] 0 [1/7] 0 [1/9] 0 [1/11] 0 [1/13] 0 [1/15];quadra wave

f 2 0 16384 10 1[1/2] [1/3] [ 1 / 4 ][1/5] [1/6] [1/7] [1/8][1/9] [1/10] [1/11] [1/12] [1/13] [1/14]; dente di sega

f 3 0 16384 10 1 ;sine

f 4 0 16384 10 1 0 [1/9] 0 [1/25] 0 [1/49] 0 [1/81]; onda triangolare

f 5 0 16384 10 1 0 [1/3] 0 1 0.1 0.20 -1;mista

i 1 0 28 0.20 440

i 2 0 1 0.20 415.3

i 3 1 1 0.20 416

i 4 2 1 0.20 417

i 5 3 1 0.20 418

i 1 4 1 . 419

i 2 5 1 0.20 420

i 3 6 1 0.20 421

i 4 7 1 0.20 422

i 5 8 1 0.20 423

i 1 9 1 0.20 424

i 2 10 1 0.20 425

i 3 11 1 0.20 426

i 4 12 1 0.20 427

i 5 13 1 0.20 428

i 1 14 1 0.20 429

i 2 15 1 0.20 430

i 3 16 1 0.20 431

i 4 17 1 0.20 432

i 5 18 1 0.20 433

i 1 19 1 0.20 435

i 2 20 1 0.20 435

i 3 21 1 0.20 436

i 4 22 1 0.20 437

i 5 23 1 0.20 438

i 1 24 1 0.20 439

i 2 25 3 0.20 440

i 99 0 28

e

</CsScore>

</CsoundSynthesizer>