DOSI VOCALI E DISTURBI VOCALI IN INSEGNANTI DI SCUOLA PRIMARIA Arianna Astolfi (1), Fabrizio Bronuzzi (1),Pasquale Bottalico (2), Anna Accornero (3), Massimiliano Garzaro (3), Juri Nadalin (3), Carlo Giordano (3) 1) Dipartimento di Energia, Politecnico di Torino,
[email protected] 2) Studio Progetto Ambiente S.r.l., Torino,
[email protected] 3) Dipartimento di Fisiopatologia Clinica, I Clinica ORL, Università di Torino,
[email protected]
1. Introduzione Un numero crescente di insegnanti, specialmente nelle scuole primarie, è sottoposto a sforzo vocale durante la giornata lavorativa. Lo sforzo vocale è una grandezza fisiologica che si manifesta attraverso cambiamenti nella produzione della voce causati da alcuni fattori quali la distanza dall'ascoltatore, il rumore e l’acustica dell’ambiente, mentre il carico vocale è correlato all’estensione nell’uso della voce nel tempo. Uno sforzo vocale, combinato con un carico vocale prolungato, comportano un incremento nei disturbi vocali. Gli effetti dei disturbi vocali variano da un disturbo lieve della qualità della voce alla perdita completa della normale funzione fonatoria. Al fine di indagare il carico vocale sugli insegnanti di scuola primaria alcune dosi vocali [1] relative alla fonazione sul lungo periodo sono state misurate con l’APM 3200 (Ambulatory Phonation Monitor) su un campione di 29 insegnanti nel corso di due o tre giorni lavorativi in due gruppi di scuole caratterizzate da diversi parametri acustici, e i dati ottenuti sono stati correlati con dati relativi ad una valutazione clinica della voce consistita in una visita otorinolaringoiatrica e foniatrica, una videolaringostroboscopia, una valutazione logopedica relativa a funzionalità respiratoria e fonatoria mediante la scala GIRBAS ed una valutazione soggettiva della voce mediante il questionario VHI (Voice Handicap Index). 2. Metodo sperimentale Il progetto di ricerca è stato sviluppato in collaborazione tra il Dipartimento di Fisiopatologia Clinica dell’Università di Torino e il Dipartimento di Energia del Politecnico di Torino. Il campione testato è composto da 29 insegnanti (2 uomini e 27 donne), con un età media di 45 anni (da 31 a 59), con in media 15 anni di esperienza (da 6 a 21), in 6 scuo-
1
39° Convegno Nazionale AIA
Roma 4-6 luglio 2012
le diverse e senza training vocali. Le condizioni acustiche nelle classi durante le analisi sono riportate in [2]. 2.1 Valutazione clinica Il metodo di indagine si articola nel seguente protocollo: Esame audiometrico ed anamnesi sull’uso della voce funzionale e professionale attraverso il protocollo per l’Anamnesi Specifica della Disfonia come in [3]. Visita logopedica con valutazione della dinamica respiratoria, tensione muscolare, auto percezione della voce e compilazione della scala GIRBAS [4] (valutazione dei parametri: Grado di disfonia, Instabilità, Raucedine, Voce Soffiata, Astenia e voce Sforzata; su una scala da 0 a 3 che va da normale a patologico). Compilazione del VHI-10 [4] [5], un questionario auto valutativo per la qualità vocale, composto da 10 domande su una scala a 5 punti (0 = mai, 4 = sempre), che riguardano tre differenti scale: fisica, funzionale ed emozionale. Esame videolaringostroboscopico con fonte di luce stroboscopica della Inventis collegata ad un fibroendoscopio flessibile Amplifon. Analisi elettroacustica attraverso il Multi Dimensional Voice Program (MDVP) [6] dell’emissione della vocale /a/ prelevata con CLS 4500 della Kaypentax. Diversi studi [6] [7] suggeriscono una riduzione dei parametri del MDVP da 22 a 11; in questo studio sono stati considerati solo i 3 parametri principali: Jitter percent (Jitt %), Shimmer percent (Shim %) e Soft Phonation Index (SPI). 2.2 Misura dei parametri e delle dosi vocali All’inizio della giornata lavorativa ad ogni soggetto testato è stato fatto indossare il dispositivo APM 3200 della KayPentax, composto da un accelerometro posizionato alla base del collo e da un dispositivo di acquisizione posizionato all’interno di un marsupio legato in vita [2]. Oltre al tempo di fonazione, questo dispositivo restituisce anche la frequenza fondamentale, F0, e dopo una procedura di taratura una stima del livello di pressione sonora, SPL, a 12 cm di distanza dalla bocca del parlatore, in asse. Entrambi i misurandi sono campionati ogni 50 ms. La taratura prevede il confronto del livello di accelerazione della pelle con il livello di pressione sonora misurato con un microfono calibrato di riferimento. L’accuratezza di questa tipologia di dispositivi è stata studiata da Švec et al. [8] e Hillman et al. [9]. In particolare, l’accuratezza di SPLmean è ±2.8 dB con un intervallo di confidenza del 95%, dove per le misure di sforzo vocale un accuratezza tra ±2 e ±3 dB può essere considerata accettabile. Per quanto riguarda la F0, le misure riportate in [9] che comparano i risultati dell’APM3200 con quelli di un segnale microfonico analizzato con il software Computerized Speech Lab, mostrano che la maggior parte delle differenze sono inferiori a 2 Hz e non sono mai superiori a 13 Hz. Come indicatori di sforzo vocale e di esposizione del tessuto delle corde alla vibrazione vengono utilizzate cinque diverse dosi vocali, proposte da Titze et al. [1]. Tali dosi possono essere ottenute dal tempo di fonazione, dalla frequenza fondamentale e dal livello di pressione sonora. La dose vocale più semplice è il Time Dose, o Voicing Time (Dt), espresso in secondi, che quantifica il tempo in cui le corde vocali vibrano. Il Voicing Time Percentage (Dt%) si ottiene come rapporto tra il Time Dose e il tempo di monitoraggio. Il Vocal Loading Index (VLI), in kcicli, misura il numero di periodi oscillatori delle corde vocali, mentre il Distance Dose (Dd), in metri, quantifica la distanza totale accumulata dalle corde vocali durante la vibrazione. L’Energy Dissipation Dose (De), in Joule/m3, si ot-
2
Roma 4-6 luglio 2012
39° Convegno Nazionale AIA
tiene integrando la potenza dissipata durante la fonazione e la Radiated Energy Dose (Dr), in Joule, si ottiene integrando la potenza irradiata durante la fonazione. La potenza dissipata è un effetto indesiderato dovuto alla dissipazione per effetto termico durante la collisione delle corde vocale dovuto alla natura viscoelastica del tessuto, mentre la potenza irradiata rappresenta la potenza sonora generata dalla sorgente parlatore. Al fine di rendere le dosi confrontabili su diversi tempi di monitoraggio è stata eseguita una normalizzazione delle dosi sul tempo di fonazione (VLInorm, Dd_norm, De_norm e Dr_norm). Queste dosi normalizzate rappresentano l’esposizione al secondo del parlato continuo senza pause, ed in particolare VLInorm corrisponde alla frequenza fondamentale media espressa in kHz. Il livello medio di pressione sonora del parlato a 1 m dalla bocca, SPLmean, in decibel, è stato calcolato come media dei singoli valori di SPL calcolati in ogni singolo frame di 50 ms e riportando il livello ad una distanza di 1 m dalla bocca del parlatore. Il valore medio della frequenza fondamentale, F0mean, in Hertz, è stato ottenuto integrando gli andamenti di F0 per ogni frame nel tempo e dividendo per il Time Dose. Inoltre sono state determinate le deviazioni standard di SPL e F0 (SPLsd e F0sd). Queste quantità rappresentano le variazioni nella dinamica e nell’intonazione della voce. 3. Risultati delle valutazioni cliniche Per quanto riguarda la valutazione laringoscopica, 18 su 29 soggetti (62%) risultano sani, mentre 11 (38%) hanno mostrato alcune alterazioni: 4 casi di noduli cordali (14%), 3 casi di ipercontrazione laringea (10%), 2 casi di cordite (7%) e 2 affetti da lieve ipotonia cordale (7%). I soggetti esaminati sono stati suddivisi in tre gruppi in base alla valutazione clinica come segue: 4 (14%) appartengono al gruppo 1, che comprende i soggetti con patologie vocali rilevate sia soggettivamente che oggettivamente, per i quali sarebbe necessario un trattamento (chirurgico, fonologopedico o una combinazione dei due). 14 (48%) appartengono al gruppo 2, che comprende i soggetti con sintomi riportati soggettivamente o funzionali, per i quali sarebbe necessario un trattamento preventivo logopedico. 11 (38%) appartengono al gruppo 3, che comprende soggetti non patologici. Secondo la scala GIRBAS, solo il 24% del campione mostra valori appropriati, mentre il 76% presenta parametri alterati. Il parametro più alterato sembra essere l’'Instabilità' (I) (66,7%), seguita dal grado di 'Disfonia Generale' (G) (42,2%) e la 'Raucedine' (R) (40%). Tutti i parametri sono alterati principalmente nei gruppi 1 e 2, in particolare i parametri G (p = 0,000) e R (p = 0,007). La Figura 1 mostra i risultati del VHI-10: tutti i gruppi ottengono i punteggi più alti nella scala F, che valuta l’impatto funzionale della disfonia sulla vita dell'individuo, mentre quella inferiore nella scala E, che valuta l'impatto emotivo. Il punteggio totale è significativamente correlato con la suddivisione nei tre gruppi (valore p <0,003), inoltre il punteggio medio ottenuto dal gruppo 1 è significativamente più alto rispetto a quello del gruppo 2, che a sua volta è notevolmente superiore a quella del gruppo 3. I parametri del MDVP, riportati in Tabella 1, risultano alterati in 3 su 4 pazienti nel gruppo 1, 8 su 14 nel gruppo 2 e 3 su 11 del gruppo 3.
3
39° Convegno Nazionale AIA
Roma 4-6 luglio 2012
15 GROUP 1
10
GROUP 2
5 GROUP 3
0 F
P
E
TOTAL
Figura 1- Punteggi del VHI per i tre gruppi suddivisi per scala Funzionale (F), Fisica (P) ed Emozionale (E). Tabella 1 – Risultai del MDVP per i tre gruppi. Valori alterati
Gruppo 1
Gruppo 2
Gruppo 3
Totale
N
%
N
%
N
%
N
%
Jitter Percent
3
75
3
21,4
0
0
6
20,7
Shimmer Percent
2
50
7
50,0
3
27,3
12
41,4
Soft Phonation Index
1
25
1
7,1
1
9,1
3
10,3
4. Risultati delle dosi e dei parametri vocali Le dosi vocali Dt%, VLInorm, Dd_norm, De_norm, Dr_norm e i parametri vocali SPLmean, SPLsd, F0mean, F0sd sono stati determinati per due giornate lavorative per tutti, tranne che per sei insegnanti. In seguito sono stati mediati i valori ottenuti. Per un insegnante i dati sono stati mediati su tre giornate lavorative mentre per 5 insegnanti i risultati sono riferiti ad una sola giornata lavorativa. Sono stati raccolti un totale di 54 campioni di giornate lavorative (50 per le donne e 4 per i uomini). Poiché la frequenza fondamentale F0 è fortemente influenzata dal sesso del parlatore, gli uomini e le donne sono stati analizzati separatamente e al fine di applicare l’ANOVA è stata verificata la normalità dei dati. Tutte le dosi ed i parametri seguono una distribuzione normale, ad eccezione di Dd_norm, De_norm e Dr_norm. Per questo motivo è stata applicata la seguente trasformazione alle tre dosi per renderle normali: (1)
LD x _ norm
10 log
D x _ norm Dx _ 0
;
dove Dd_0 è 10-4 m/s, De_0 è 10-4 mJ/(cm3s) e Dr_0 è 10-4 mJ/s. L'incertezza U dei dati misurati è stata determinata secondo la “Guide to the expression of Uncertainty in Measurement, GUM” [10] [11]. Poiché la frequenza fondamentale F0 è significativamente influenzata dal sesso del parlatore, i soggetti di sesso maschile non sono stati considerati a causa della dimensione ridotta del campione. La Tabella 2 mostra il valore medio e l'incertezza della media delle dosi e dei parametri vocali per le 27 maestre. Nonostante non vi sia alcuna variazione significativa tra dosi/parametri ed età, è stata riscontrata una correlazione negativa per tutte le dosi/parametri, tranne che per il Dt%, che invece aumenta di 0,12% all'anno. Si è riscontrata una diminuzione del SPLmean di 0,31 dB all’anno, imputabile ad una riduzione della capacità respiratoria con l'età che comporta una riduzione in intensità. Inoltre una diminuzione del F0mean di circa 0,65 Hz all'anno, che conferma il risultato letteratura [12], è ricollegabile ad un progressivo ispessimento dell'epitelio laringeo con l'età. 4
Roma 4-6 luglio 2012
39° Convegno Nazionale AIA
Tabella 2 - Valore medio e incertezza della media delle dosi e dei parametri vocali sulle diverse giornate lavorative per 27 maestre. Parametro
Dt%
VLInorm
LDd_norm
LDe_norm
LDr_norm
SPLmean
F0mean
SPLsd
F0sd
u.d.m.
%
kcycles/s
dB
dB
dB
dB
Hz
dB
Hz
m
26,2
0,24
38,8
36,6
41,8
63
243,6
1,8
5,6
U
2,63
0,01
0,76
1,59
4,2
3,63
7,79
0,11
0,29
5. Correlazioni tra dosi/parametri vocali e risultati della valutazione clinica A seguito della visita otorinolaringoiatria e della videolaringostroboscopia i soggetti sono stati suddivisi in 5 categorie a seconda della gravità della patologia: gruppo 1 comprende soggetti fisiologici, gruppo 2 soggetti con ipercontrazione, gruppo 3 con ipotonia, gruppo 4 con laringite e gruppo 5 con noduli. Al fine di ottenere la correlazione tra le possibili cause generanti la patologia e il manifestarsi della patologia è stata studiata la correlazione tra le dosi/parametri vocali e i risultati della valutazione clinica. I p-values derivanti dall'analisi hanno determinato le correlazioni significative elencate in Tabella 3. Il Dt% è fortemente correlato con il grado di patologia oggettivamente rilevato, con la sensazione di bruciore, con la sensazione voce afona e con il gruppo di appartenenza che si basa sulla visita foniatrica e logopedica. LDe_norm e LDr_norm sono fortemente correlati tra loro (r = 0,897, p-value = 0,000). Tabella 3 – Coefficiente di Pearson (r) and p-value per le correlazioni significative tra cause (dosi/parametri vocali) e effetti (risultati delle visite mediche). La sensazione di bruciore e la voce afona sono state valutate su scala binaria. Dt% / % Visita foniatrica Sensazione di bruciore Voce afona Gruppo
r p-value r p-value r p-value r p-value
LDe_norm /dB
LDr_norm / dB
0,393 0,047
0,437 0,026
0,427 0,021 0,446 0,022
-0,497 0,006
6. Conclusioni In questo studio, utilizzando l’APM3200 della Kaypentax®, sono stati monitorati le dosi e i parametri vocali relativi a 29 insegnanti di scuola elementare. L’eccessiva fatica vocale, associata ai disordini clinici della voce degli insegnanti [13], è stata valutata oggettivamente con le dosi ed i parametri vocali, che risultano dipendenti dalle condizioni acustiche delle aule scolastiche [2]. Dalla correlazione fra i valori medi delle dosi e dei parametri vocali ed i risultati derivanti da una valutazione clinica dei soggetti indagati risulta che il tempo di fonazione percentuale, Dt%, parametro molto più elevato per gli insegnanti che per altri professionisti [14][15], è fortemente correlato con i risultati dell'esame foniatrico, con la percezione della sensazione di bruciore e di voce afona, e con la suddivisione in gruppi in base alla valutazione clinica. In particolare al crescere
5
39° Convegno Nazionale AIA
Roma 4-6 luglio 2012
del tempo percentuale di fonazione aumenta la gravità della patologia, la sensazione di bruciore e la sensazione di voce afona. 7. Ringraziamenti Questa ricerca è stata finanziata dall’ISPESL e dal MIUR (PRIN 2008). Si ringrazia la disponibilità di maestri, studenti e amministrazioni scolastiche per aver reso possibile questo lavoro. 8. Bibliografia [1] Titze I.R., Švec J.G. e Popolo P.S., Vocal dose measures: Quantifying accumulated vibration exposure in vocal fold tissues, J. Speech Lang. Hear. Res., 46 (2003), pp. 919-932. [2] Bottalico P. e Astolfi A., Investigations on into vocal doses and parameters pertaining to primary school teachers in classrooms, J. Acoust. Soc. Am., 131 (4) (2012), pp. 2817-2827. [3] Vernero I., Gambino M., Schindler A. e Schindler O., La cartella logopedica-età adulta ed involutiva, Omega, Torino, 2002. [4] Hirano M., Psycho-acoustic evaluation of voice, in M. Hirano, Clinical Examination of voice, Springer-Verlag, New York, 1981. [5] Rosen A., Lee A. S., Osborne J., Zullo T. e Murry T., Development and validation of the Voice Handicap Index-10, Laryngoscope, 114 (2004), pp. 1549-56. [6] De Colle W. e Ricci Maccarini A., Acoustic analysis by Kay CSL 4300 in voice assessment, in Atti del 6th I.A.P. Symposium, Venezia – Abano Terme, 2000, pp. 19-22. [7] Ferrero F., Lanni R. e De Colle W., Primi risultati di uno studio per la validazione del sistema MDVP come strumento per una caratterizzazione multiparametrica della voce, Acta Phon Lat., 17 (1995), pp. 161. [8] Švec J.G., Titze I.R. e Popolo P.S., Estimation of sound pressure levels of voiced speech from skin vibration of the neck, J. Acoust. Soc. Am., 117(3) (2005), pp. 1386-1394. [9] Hillman R.E., Heaton J.T., Masaki A., Zeitels S.M. e Cheyne H.A., Ambulatory monitoring of disordered voices, Ann. Otol. Rhinol. Laryngol., 115(11) (2006), pp. 795-801. [10] JCGM 100, Evaluation of measurement data — Guide to the expression of uncertainty in measurement, Joint Committee for Guides in Metrology (2008), http://www.iso.org/sites/JCGM/GUM-JCGM100.htm (consultato l’08/06/11). [11] Astolfi A., Bottalico P., Accornero A., Garzaro M., Nadalin J. e Giordano C., Relationship between vocal doses and voice disorders on primary school teachers, in Atti del Congresso Euronoise 2012, Praga, 10-13 Giugno 2012. [12] Vipperla R., Renals S., e Frankel J., Ageing Voices: The Effect of Changes in Voice Parameters on ASR Performance, EURASIP J. Audio, Speech, and Music Proc., 2010, Article ID 525783. [13] Titze I. R., Principles of voice production, National Center for Voice and Speech, Iowa City, 2000. [14] Titze I.R., Hunter E.J. e Švec J.G, Voicing and silence periods in daily and weekly vocalizations of teachers, J. Acoust. Soc. Am., 121(1) (2007), 469-478. [15] Masuda T., Ikeda Y., Manako H.e Komiyama S., Analysis of vocal abuse: fluctuations in phonation time and intensity in 4 groups of speakers, Acta Otolaryngol., 113 (1993), pp. 547-552.
6