Teoria
Test per l’assessment della depressione nel contesto italiano: un’analisi critica Michela Balsamo e Aristide Saggino Dipartimento di Scienze Biomediche, Università degli Studi «G. d’Annunzio» di Chieti-Pescara
Riassunto La depressione rappresenta la malattia mentale più diffusa al mondo. Si calcola, infatti, che il 10,4% dei pazienti che afferisce ai setting di salute mentale sia affetto da depressione (World Health Organization, 1998; 1999). Le misure self-report di depressione sono strumenti particolarmente importanti nella diagnosi e nella distinzione tra diversi livelli di depressione e sono ampiamente usate nella ricerca clinica per la valutazione dell’efficacia dei farmaci antidepressivi e della psicoterapia. In questo articolo presentiamo una rassegna critica delle più importanti misure di autovalutazione della depressione disponibili nel nostro Paese, sottolineando per ognuna di esse i punti di forza e di debolezza sotto il profilo psicometrico. Lo scopo è quello di aiutare a far chiarezza nella complessità delle misure esistenti di depressione, al fine di evitare confusioni nella pratica clinica e nella ricerca rispetto a quale scala usare e per quale scopo. In particolare, lo studio approfondisce le proprietà psicometriche di sei scale self-report di depressione: Beck Depression Inventory-II (BDI-II; Beck, Steer e Brown, 1996), Center for Epidemiological Studies Depression Scale (CES-D; Radloff, 1977), Zung Self-Rating Depression Scale (ZSDS; Zung, 1965), Clinical Depression Questionnaire (CDQ; Krug e Laughlin, 1976), Questionario D della batteria Cognitive Behavioural Assessment 2.0 (CBA 2.0; Sanavio, Bertolotti, Michielin, Vidotto e Zotti, 1997; Sanavio, 2002) e scala D del Minnesota Multiphasic Personality Inventory (MMPI; Hathaway e McKinley, 1940; 1942; 1989).
Parole chiave: depressione, diagnosi, assessment, questionari, proprietà psicometriche.
Summary Depression assessment questionnaires in the Italian context: a critical analysis Depression represents the most pervasive mental illness worldwide. In fact, depression accounts for 10,4% of all patients seen in mental healthcare settings (World Health Organization, 1998, 1999). Selfreport measures of depression are particularly important tools in the diagnosis of and discrimination between different levels of depression, and are widely used in clinical research to assess the efficacy
Edizioni Erickson - Trento
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007 (pp. 167-199)
© Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
167
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
of antidepressant drugs and psychotherapy. In this paper, we present a critical review of the most important self-report measures of depression currently available in Italy, while emphasizing the points of strength and points of weakness of each measure from the psychometric point of view. The aim is to help clarify the complexities of the existing depression measures in order to avoid confusion in clinical practice and in research work in terms of which scale is to be used and for what purpose. To this end, this study investigated the psychometric properties of six self-report depression scales: Beck Depression Inventory-II (BDI-II; Beck, Steer & Brown, 1996), Center for Epidemiological Studies Depression Scale (CES-D; Radloff, 1977), Zung Self-Rating Depression Scale (ZSDS; Zung, 1965), Clinical Depression Questionnaire (CDQ; Krug & Laughlin, 1976), Cognitive Behavioural Assessment 2.0, Depression Questionnaire (CBA 2.0; Sanavio, Bertolotti, Michielin, Vidotto & Zotti, 1997; Sanavio, 2002) and Minnesota Multiphasic Personality Inventory, scale D (MMPI - Hathaway & McKinley, 1940; 1942; 1989).
Keywords: depression, diagnosis, assessment, questionnaires, psychometric properties.
INTRODUZIONE La depressione rappresenta la malattia mentale più diffusa al mondo. Secondo le più recenti stime dell’Organizzazione Mondiale della Sanità, il 10,4% dei pazienti che afferiscono ai setting di salute mentale in tutto il mondo ne sono affetti (World Health Organization, 1998; 1999). La situazione sembra destinata a peggiorare, poiché si prevede che per l’anno 2020 la depressione clinica risulterà seconda solo alla malattia cardiaca cronica per il suo peso sulla salute internazionale, peso identi¿cato dall’esame delle cause di morte, dalla disabilità, dall’incapacità a lavorare e dalle risorse mediche impiegate (World Health Organization, 1998; Blackburn e Moorhead, 2002). In Italia, i disturbi depressivi sono tra i disturbi mentali più comuni, con un tasso di prevalenza a 12 mesi del 13,5% (De Girolamo et al., 2005). Per una disamina teorica più approfondita, si rimanda a Saggino (2005). Storicamente la depressione è stata uno dei primi disturbi psichiatrici identi¿cati come unità distinta (Krug e Laughlin, 1976). La diagnosi di depressione non è sempre facile, a meno che il paziente non presenti l’intera costellazione dei sintomi depressivi. Il più delle volte, invece, il paziente presenta una depressione mascherata, soprattutto nei casi in cui lamenta solo malesseri ¿sici. Alcuni sintomi ¿sici ed emotivi riferiti dai pazienti depressi sono identici a quelli dell’ansia: una delle lamentele più comuni dei depressi, infatti, riguarda i disturbi del sonno, che sono massicciamente presenti anche nei sintomi prodotti dall’ansia. Con pazienti di questo tipo è facile sbagliare diagnosi e intervenire con farmaci o altre terapie che a nulla giovano o che possono addirittura aggravare la sintomatologia, come succede nel 75% dei casi. Poiché i possibili esiti della depressione possono essere molto gravi — comportando un notevole deterioramento del funzionamento psicosociale, sino ad arrivare al suicidio nel 15% dei casi (Goldston, Reboussin e Daniel, 2006) —, è importante fare una diagnosi differenziale af¿nché si possano intraprendere appropriati trattamenti psicoterapeutici e/o farmacologici. Dunque, il problema di una diagnosi precisa è molto importante per il medico e per lo psichiatra: la scelta del farmaco più ef¿cace o l’adozione di altri metodi di trattamento richie-
168 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
de, infatti, un’accurata diagnosi differenziale. D’altra parte, la crescente so¿sticazione dei criteri scienti¿ci impiegati nella ricerca obbliga all’uso di strumenti di misura dei fenomeni sempre più accurati. È necessario, allora, che sia i ricercatori sia i clinici conoscano a fondo vantaggi e limiti degli strumenti che hanno a disposizione per la diagnosi e la discriminazione tra diversi livelli di gravità della depressione. In assenza di strumenti di valutazione attendibili e validi, sarebbe estremamente dif¿cile valutare accuratamente i sintomi e la severità della depressione, de¿nire gli obiettivi del trattamento o valutarne l’ef¿cacia (Katz, Shaw, Vallis e Kaiser, 1995). Una delle più diffuse e utili modalità per la valutazione dei sintomi depressivi è rappresentata dal ricorso agli inventari di autovalutazione. Il presente lavoro offre una rassegna dei vari strumenti self-report disponibili nel contesto italiano per la valutazione della depressione negli adulti e fornisce raccomandazioni pratiche per i clinici, alla luce dell’analisi delle loro proprietà psicometriche e dei punti di forza e di debolezza di ciascuno. In letteratura sono state identi¿cate circa 25 misure self-report della severità della depressione. Di queste, 17 sono questionari speci¿camente sviluppati per misurare la severità dei sintomi depressivi nelle popolazioni adulte, mentre 8 sono stati creati per l’impiego con popolazioni speciali, ad esempio, depressione nella schizofrenia, depressione nei bambini, depressione nei setting di pronto soccorso (Nezu, Ronan, Meadows e McClure, 2000). Nezu e colleghi (2000) hanno classi¿cato ogni misura disponibile di depressione in termini di utilità clinica e di ricerca. È stata assegnata una valutazione di «elevato» agli strumenti frequentemente usati nella ricerca o nella pratica clinica e un valore di «limitato» a quelli che hanno un impiego ristretto nei setting clinici o che sono proibitivi in termini di costi o di tempo richiesti o che, relativamente all’utilità di ricerca, presentano dati empirici insuf¿cienti. La tabella 1 illustra le caratteristiche formali degli strumenti di autovalutazione della depressione per adulti che hanno un’elevata utilità clinica e di ricerca secondo la classi¿cazione di Nezu et al. (2000), di cui è disponibile l’adattamento italiano. Dei 6 questionari, i primi quattro costituiscono misure speci¿che di depressione, mentre gli ultimi due fanno parte di batterie più ampie, volte a individuare le diverse aree della patologia psichica. Proveremo a tracciare un pro¿lo psicometrico analitico per ciascuna scala. Nelle conclusioni, tenteremo di fornire un quadro globale della complessità e dei limiti dell’autovalutazione della depressione e presenteremo la nostra proposta di costruzione di una nuova scala self-report di misura della depressione.
SCALE DI AUTOVALUTAZIONE DELLA DEPRESSIONE Beck Depression Inventory-II (BDI-II) Il Beck Depression Inventory-II (BDI-II; Beck, Steer e Brown, 1996) è lo strumento di misura della presenza e della severità della depressione più utilizzato al mondo, sia nella popolazione normale che nei pazienti psichiatrici (Steer, Clark, Beck e Ranieri, 1998),
169 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
Affermazioni
Affermazioni
Zung Self-Rating Depression Scale (ZSDS)
Clinical Depression Questionnaire dell’IPAT (CDQ)
Scala D del Minnesota Multiphasic Personality Inventory-2 (MMPI-2)
Affermazioni
Affermazioni
Affermazioni
Center for Epidemiological Studies Depression Scale (CES-D)
Questionario di Depressione del Cognitive Behavioural Assessment 2.0 (CBA)
Affermazioni
Beck Depression Inventory-II (BDI-II)
Scala
Tipo di item
57
24
40
20
20
21
N° di item
24+ 33 -
22+ 2-
20+ 20 -
10+ 10 -
16+ 4-
Item ipsativi
Formulazione degli item (positivo/ negativo)
Vero/Falso
Sì/No
Scala con 3 risposte secondo gradi di intensità crescenti
Scala Likert a 4 passi
12’
10’
10’-20’
5’
5’-10’
5’-10’
Scala con 4 risposte secondo gradi di intensità crescenti
Scala Likert a 4 passi
Range dei tempi di somministrazione
Formato di risposta
Tabella 1 – Caratteristiche formali delle scale self-report di depressione più diffuse in Italia
Hathaway e McKinley (1989)
Sanavio, Bertolotti, Michielin, Vidotto e Zotti (1997)
Krug e Laughlin (1976)
Zung (1965)
Radloff (1977)
Beck, Steer e Brown (1996)
Riferimenti bibliografici
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
170
© Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
tanto da essere inserito nella classi¿ca dei «top 10» dei test psicologici più frequentemente usati (Camara, Nathan e Puente, 2000). Esso rappresenta un aggiornamento dell’inventario originale, il Beck Depression Inventory (BDI; Beck, Ward et al., 1961) e della sua parziale revisione (BDI-IA; Beck, Rush, Shaw e Emery, 1979), sviluppati a partire dagli anni Sessanta con lo scopo di misurare le manifestazioni comportamentali della depressione, senza riÀettere alcuna teoria riguardante l’eziologia o i processi psicologici sottostanti (Sanavio e Sica, 1999). Sebbene il Beck Depression Inventory mostrasse caratteristiche psicometriche adeguate in termini di attendibilità test-retest, consistenza interna e validità di costrutto (vedi Beck, Steer e Garbin, 1988), la sua validità di contenuto è apparsa via via più dubbia con il susseguirsi delle varie edizioni del Manuale Diagnostico e Statistico dei Disturbi Mentali (DSM) e delle conseguenti modi¿che apportate nei criteri che de¿niscono i disturbi depressivi. Dunque, il Beck Depression Inventory-II è stato adattato ai criteri diagnostici dell’Episodio Depressivo Maggiore (EDM) della quarta versione riveduta del DSM (DSM-IV-TR; APA, 2000) e, coerentemente con questi, il frame temporale di riferimento della sintomatologia descritta è stato esteso da 1 a 2 settimane (Beck, Steer, Ball e Ranieri, 1996). Benché la nuova versione della scala faccia riferimento a un sistema di classi¿cazione categoriale, qual è quello alla base del DSM, il modello cognitivo della depressione segue sostanzialmente un approccio dimensionale, considerando la depressione come collocabile lungo un continuum di gravità alle cui estremità si trovano, da una parte, i sintomi affettivi più lievi e non clinici e, dall’altra, i disturbi affettivi clinici più gravi (Beck, 1991; Clark, Beck e Alford, 1999). Proprietà psicometriche e norme Le proprietà psicometriche della scala nella seconda edizione sono riassunte nella tabella 2, sia per la versione originale che per quella italiana, recentemente pubblicata ad opera di Ghisi, Flebus, Montano, Sanavio e Sica (2006). Le norme della versione originale del Beck Depression Inventory-II si basano su un campione di 120 studenti universitari e di 500 pazienti psichiatrici ambulatoriali, tratti da 4 istituti clinici statunitensi, di cui il 53% con diagnosi di disturbi dell’umore, il 18% con disturbi d’ansia, il 16% con disturbi dell’adattamento e il 14% con vari altri tipi di disturbi. Le norme della versione italiana sono basate su un campione di taratura italiano, composto da 723 studenti universitari, 354 adulti tratti dalla popolazione generale e un campione clinico, composto da 135 soggetti con disturbi depressivi come problema principale e un gruppo di controllo di 135 soggetti tratti dalla popolazione generale, selezionati in maniera randomizzata dal campione precedente (Ghisi et al., 2006). Attendibilità Sia nella versione originale che nella versione italiana, gli indici di coerenza interna e di attendibilità test-retest sono ottimi, aggirandosi intorno a 0,92. Nella versione italiana, sono altresì più che soddisfacenti, andando da 0,76 a 0,87 (tabella 2).
171 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
0,87t
Versione originale
0,93•
Versione originale
Versione italiana
Versione originale
Scale self-report di depressione Struttura bifattoriale:• 1. fattore somaticoaffettivo 2. fattore cognitivo
Struttura bifattoriale:°t 1. fattore somaticoaffettivo 2. fattore cognitivo
Struttura bifattoriale:• 1. fattore cognitivoaffettivo 2. fattore somatico
Versione italiana
Struttura bifattoriale:° 1. fattore cognitivoaffettivo 2. fattore somatico 0,71° con HRSD
0,84° con BDI;
Versione originale
0,76• ad 1 mese
Validità convergente
0,73° con QD
0,70t con QD
0,60t con CES-D
0,77• con QD
Versione italiana
0,93° a7 giorni
Validità fattoriale
Validità discriminante
0,47° con HARS-R
0,60° con BAI
Versione originale
BDI-II
0,80•
Attendibilità test-retest
(continua)
0,55° con STAI
0,57° con BAI
0,60t con BAI
0,66• con STAI
Versione italiana
0,87°
Versione italiana
0,92°
Coerenza interna (_ di Cronbach)
Tabella 2 – Caratteristiche psicometriche delle scale self-report di depressione più diffuse in Italia
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
172
© Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
(continua)
Versione originale
Versione originale
Scale self-report di depressione
0,32t ad 1 anno
0,54t a6 mesi
Versione italiana
0,48t a3 mesi
Versione originale n.r.
Versione italiana
Struttura quadrifattoriale:t 1. disforia 2. benessere 3. sintomi somatici e di rallentamento 4. difficoltà interpersonali 0,83° con SCL-90
0,51t e 0,70° con scala di depressione di Lubin
Versione originale
n.r.
Validità convergente
0,47° con scala D del MMPI
0,61° e 0,65t con HRSD
Versione italiana
0,57t in media da 2 a 8 settimane
Validità fattoriale
Validità discriminante
0,19t e 0,24° con una scala di Funzionamento Sociale
0,26t e 0,21° con una scala di Aggressività
Versione originale
CES-D
n.r.
Attendibilità test-retest
(continua)
n.r.
Versione italiana
0,85t
Versione italiana
0,90°
Coerenza interna (_ di Cronbach)
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
173
© Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
(continua)
0,75°
Attendibilità test-retest Versione italiana
Versione originale
Versione italiana
Versione originale
Scale self-report di depressione Struttura trifattoriale:t 1. sintomatologia positiva 2. sintomatologia negativa 3. sintomatologia somatica
Versione originale 0,57t con scala D del MMPI-2 0,62t con scala DEP del MMPI-2 0,60° con HRSD
0,90t con CES-D 0,41t con HRSD 0,61t con GDS
0,74° con BDI
0,54° con WDRS
0,77t con CDQ
0,73t con BDI
Versione originale
Struttura trifattoriale:• 1. sintomi cognitivi 2. sintomi affettivi 3. sintomi somatici
Versione italiana
n.r.
Validità convergente
Validità discriminante
88%° di sensibilità
Versione originale
n.r.
Validità fattoriale
(continua)
0,61t con scala ANX (Ansietà) del MMPI-2
0,70t con ASQ
Versione italiana
ZSDS
Versione italiana
0,82°
Coerenza interna (_ di Cronbach)
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
174
© Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
(continua)
Versione originale
Scale self-report di depressione
QD del CBA-2.0
Versione originale
0,82t
Versione italiana
0,85t
0,72t a 30 giorni
0,88t a 7 giorni,
Versione originale Struttura monofattorialet
Struttura bifattoriale•
n.r.
Versione italiana
Struttura monofattoriale°t
0,56° con il BDI
0,26• con la scala Depressione tediosa del CAQ
0,70• con la scala Colpa e risentimento
0,63 con la scala Bassa energia
•
0,36• con la scala Depressione ansiosa
0,75• con la scala Depressione suicida
0,58• con la scala Ipocondria
0,31° con la scala D del MMPI
Versione originale
n.r.
Validità convergente
n.r.
Versione italiana
0,93t in media a distanza di un giorno
Validità fattoriale
Validità discriminante
0,71• con ASQ
(continua)
1 falso positivo e 3 falsi negativi°
0,51° con la scala Si del MMPI
0,32° con la scala Sc del MMPI
48° con la scala Pt del MMPI
0,34° con la scala Pd del MMPI
Versione originale
CDQ
0,46•
Attendibilità test-retest Versione italiana
0,91•
Versione italiana
0,93°
Coerenza interna (_ di Cronbach)
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
175
© Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
(continua)
Versione originale
Scale self-report di depressione 0,77t a 7 giorni per le femmine
Versione italiana struttura bifattorialet nelle femmine
struttura bifattorialet nelle femmine
n.r.
n.r.
n.r.
•
t
°
= campione clinico = campione tratto dalla popolazione generale = campione di studenti universitari
Tipologia di campione su cui è stato calcolato il dato riportato:
n.r.
Validità discriminante
I dati riportati sono tratti dagli studi più rappresentativi per ogni scala. In particolare, per le versioni originali, da Beck, Steer e Brown (1996) e da Steer, Ball, Ranieri e Beck (1999) per il BDI-II; da Radloff (1977) per la CES-D; da de Jonghe e Baneke (1989) e Sakamoto, Kijma, Tomoda e Kambara (1998) per la ZSDS; da Krug e Laughlin (1976) per il CDQ, da Bertolotti, Zotti, Michielin, Vidotto & Sanavio (1990) e da Sanavio (2002) per il QD del CBA 2.0, da Hathaway e McKinley (1989) per il MMPI-2. Per le versioni italiane, da Ghisi, Flebus, Montano, Sanavio e Sica (2006) per il BDI-II; da Pierfederici et al. (1982) e da Fava (1983) per la CES-D; da Faravelli, Albanesi e Poli (1986) e Innamorati, Lelli, Aiello, Di Lorenzo del Casale, Russo e Ferrari (2006) per la ZSDS; da Ciof¿, Balsamo e Saggino (in corso di stampa) per il CDQ e da Sirigatti e Pancheri (1995) per il MMPI-2.
ASQ = Anxiety Scale Questionnaire dell’Institute for Personality and Ability Testing (IPAT); BAI = Beck Anxiety Inventory; BDI = Beck Depression Inventory; CAQ = Clinical Analysis Questionnaire; CDQ = Clinical Depression Questionnaire dell’IPAT; CES-D = Center for Epidemiological Studies Depression Scale; GDS = Geriatric Depression Scale; HARS-R = Revised Hamilton Anxiety Rating Scale; HRSD = Hamilton Rating Scale of Depression; MMPI = Minnesota Multiphasic Personality Inventory; MMPI-2 = Minnesota Multiphasic Personality Inventory-2; QD = Questionario di Depressione del Cognitive Behavioural Assessment-CBA- 2.0; SCL-90 = Symptom Check List-90-Revised; STAI = State-Trait Anxiety Inventory; WDRS = Wechsler Depression Rating Scale; ZSDS = Self-Rating Depression Scale di Zung; n.r.= dato non rinvenuto nella letteratura di riferimento
0,70t per le femmine
Versione originale
0,64t per le femmine
Versione originale Struttura bifattorialet nei maschi
Versione italiana
Struttura trifattorialet nei maschi
Versione originale
n.r.
Validità convergente Versione italiana
0,75t a 7 giorni per i maschi
Validità fattoriale Versione originale
Legenda
0,61t per i maschi
Attendibilità test-retest Versione italiana
Scala D del MMPI-2
Versione italiana
0,59t per i maschi
Coerenza interna (_ di Cronbach)
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
176
© Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
Validità Per la versione originale del Beck Depression Inventory sono state rinvenute diverse soluzioni fattoriali, che spaziavano in un range da 3 a 7 fattori, a seconda della procedura di estrazione di analisi fattoriale impiegata e della patologia del campione esaminato (Weckowicz, Muir e Cropley, 1967; Beck e Lester, 1973; Golin e Hartz, 1979; Louks, Hayne e Smith, 1989; Whisman, Perez e Ramel, 2000). Tuttavia, molteplici analisi fattoriali confermatorie (Clark, Cavanaugh e Gibbons, 1983; Tanaka e Huba, 1984; Steer, Ball, Ranieri e Beck, 1999; Storch, Roberti e Roth, 2004) suggerivano l’esistenza di una generale sindrome sottostante di secondo ordine di depressione, composta da tre fattori di primo ordine altamente intercorrelati: sintomi cognitivo-emotivi, sintomi comportamentali e sintomi somatici (Beck e Steer, 1987). Il Beck Depression Inventory-II sembrerebbe, invece, avere una struttura fattoriale più forte, in cui emergono due fattori principali, altamente correlati: sintomi cognitivi e sintomi somatico-affettivi nel campione clinico; sintomi cognitivo-affettivi e somatici nel campione di studenti universitari, come illustrato nella tabella 2 (Beck, Steer e Brown, 1996). Nel contesto italiano, questi risultati sono stati confermati da diverse analisi fattoriali confermative. Nello studio di Montano e Flebus (2006), il modello a due fattori (cognitivo-affettivo e somatico), altamente correlati (0,80), è risultato avere buoni indici di ¿t [Comparative Fit Index (CFI) = 0,915, Root Mean Square Error of Approximation (RMSEA) = 0,068; r2 = 251,57, gl = 89] in un campione italiano di 574 adulti sani. Nel campione di taratura italiano, il modello a due fattori risulta quello che risponde meglio alla struttura fattoriale del Beck Depression Inventory-II sia tra gli studenti universitari (CFI = 0,92, RMSEA = 0,055; rapporto r2/gl = 3,08), sia nel campione di adulti provenienti dalla popolazione generale (CFI = 0,90, RMSEA = 0,085; rapporto r2/gl = 3,5), sia nel campione clinico (CFI = 0,95, RMSEA = 0,062; rapporto r2/gl = 1,52). Generalmente il fattore somatico-affettivo raccoglie le manifestazioni somatiche e affettive della depressione, quali perdita di interessi, perdita di energia, agitazione, pianto, modi¿cazioni del sonno e dell’appetito, perdita di piacere, dif¿coltà di concentrazione, irritabilità, affaticamento; il fattore cognitivo riguarda le manifestazioni cognitive della depressione, quali pessimismo, senso di colpa, autocritica, mancanza di autostima, mancanza di valore, indecisione, pensieri o desideri di suicidio, fallimenti passati, sentimenti punitivi. La differenziazione di fattori all’interno del Beck Depression Inventory-II potrebbe rivelarsi utile per l’identi¿cazione di diversi tipi di depressione (endogena versus reattiva) e per la valutazione della severità (intensità e cronicità), della prognosi e delle risposte al trattamento dei soggetti depressi: i soggetti con punteggi più elevati nella dimensione cognitivo-affettiva, con una sintomatologia ¿siologica lieve o nulla, potrebbero bene¿ciare maggiormente del trattamento cognitivo-comportamentale e rispondere meno bene agli interventi farmacologici (Endler, Rutheford e Denisoff, 1999). Alla luce di queste suggestive implicazioni, non risulta chiara la scelta degli autori di riferirsi unicamente a un punteggio totale per l’interpretazione dei risultati, ignorando la potenziale multidimensionalità di questa misura (Farmer, 2001).
177 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
Utilità clinica e di ricerca Pur costituendo attualmente lo standard di riferimento di ogni scala self-report per la misura della depressione, il Beck Depression Inventory-II presenta alcuni limiti, sia dal punto di vista clinico che psicometrico. 1. Dal punto di vista clinico, la diagnosi di Episodio Depressivo Maggiore risulta molto più complessa di quanto non sembri a prima vista con l’ausilio del Beck Depression Inventory (Sanavio e Sica, 1999). Il pericolo di falsi positivi (circa il 18%) ha condotto gli autori del test a rivolgere precise raccomandazioni ai somministratori circa la necessità di una corretta somministrazione dello strumento (Kendall, Hollon, Beck, Hammen e Ingram, 1987). Va, inoltre, considerato che il sintomo «perdita di peso», incluso nel IV criterio del DSM-IV-TR, non è rappresentato nell’inventario. 2. Dal punto di vista psicometrico, Gibbons, Clark, VonAmmon Cavanaugh e Davis (1985) osservano che gli item del Beck Depression Inventory consistono di un gruppo di affermazioni graduate, o opzioni, che riÀettono gradi diversi di gravità del dominio sintomatologico misurato da quell’item. Infatti, per ogni item vi sono 4 opzioni, cui sono stati assegnati dei pesi su una base intuitiva e aprioristica, con un range che va da 0 a 3. Lo scoring del Beck Depression Inventory secondo questa modalità assume che: a) gli item siano egualmente ef¿caci nel misurare la depressione e b) gli intervalli tra le opzioni siano psicologicamente identici. Né gli item né le opzioni di risposta sono ponderati in base a quanto gli item siano ef¿caci o discriminativi rispetto alle differenze nella gravità della depressione e le risposte alle opzioni sono usate senza considerare se le differenze tra le opzioni riÀettono una sottostante scala a intervalli o ordinale. Se gli item e le opzioni sono ugualmente ef¿caci e se i pesi assegnati alle opzioni sono appropriati è discutibile e dovrebbe comunque essere veri¿cato empiricamente (Gibbons et al., 1985). Contrariamente al gran numero di studi che indagano le proprietà psicometriche del BDI, non ci sono ricerche che esaminino esplicitamente l’appropriatezza delle ponderazioni assegnate alle opzioni di risposta. 3. Scarsa capacità discriminativa tra depressione e ansia, com’è dimostrato dalle correlazioni di 0,71 con la sottoscala di Ansia della Symptom Check List-90-Revised (SCL-90; Steer, Ball, Ranieri e Beck, 1997), di 0,60 con il Beck Anxiety Inventory (BAI; Beck e Steer, 1990) e di 0,47 con l’Hamilton Rating Scale for Depression (HDRS; Hamilton, 1960). 4. Mancanza di controllo del response set della desiderabilità sociale. Come fa osservare Arbisi (2001) nella recensione critica al Beck Depression Inventory-II nel The Fourteenth Mental Measurements Yearbook: «Quelli tra noi impegnati nella pratica clinica si trovano spesso di fronte a pazienti che alterano la loro presentazione per promuovere una personale agenda che può non essere condivisa dal clinico. Il manuale menziona indirettamente questo problema con una modalità piuttosto ambivalente ed evitante» (p. 2). Si impone cautela, dunque, qualora si usi tale strumento con persone che potrebbero desiderare di nascondere le proprie intenzioni suicide o, di contro, sovrastimare la loro depressione (Conoley, 1978). Nella valutazione delle risposte, si deve tenere, altresì, conto della tendenza, tipica di alcuni pazienti con depressione
178 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
severa, a «dicotomizzare» ogni cosa in maniera estremamente positiva o negativa. Si tratterebbe, infatti, di un importante sintomo cognitivo di depressione piuttosto che di uno stile di risposta (Beck, Steer e Brown, 1996).
Center for Epidemiological Studies Depression Scale (CES-D) La Center for Epidemiological Studies Depression Scale (CES-D; Radloff, 1977) è una breve scala di valutazione self-report, sviluppata dal Center for Epidemiological Studies del National Institute of Mental Health (NIMH) a partire da un pool di item di questionari per la depressione validati intorno agli anni Settanta, tra cui il Beck Depression Inventory, la Zung Self-Rating Depression Scale (ZSDS; Zung, 1965) e la scala D del Minnesota Multiphasic Personality Inventory (MMPI; Hathaway e McKinley, 1940), che furono sottoposti ad analisi fattoriali atte a identi¿care le componenti maggiori della sintomatologia depressiva (umore depresso, hopelessness, ovvero senso di disperazione, helplessness, ovvero senso di impotenza, sentimenti di colpa e di inutilità), con lo speci¿co scopo di studiare la distribuzione della depressione nella popolazione generale. Proprietà psicometriche e norme Le proprietà psicometriche della forma originale appaiono adeguate e riconfermate nel tempo (Radloff, 1977; Knight, Williams e Olaman, 1997), come illustrato nella tabella 2. Le norme si basano sui seguenti campioni (Radloff, 1977): 2514 adulti bianchi normali, 1060 adulti bianchi normali, 1422 adulti bianchi normali e 70 pazienti psichiatrici bianchi adulti. Attendibilità Per l’attendibilità, Radloff (1977) ha riportato indici di consistenza interna piuttosto alti e correlazioni test-retest modeste. Validità La validità convergente è accettabile, dato che sono riportate correlazioni elevate con altri indici di sintomatologia depressiva, quali il Beck Depression Inventory e la Zung Self-Rating Depression Scale (Radloff, 1977). La validità di costrutto appare solo in parte supportata dalla struttura fattoriale emergente. Sebbene la Center for Epidemiological Studies Depression Scale sia stata costruita per porre l’enfasi essenzialmente sull’umore depresso (Radloff, 1977) e sia da sempre considerata e utilizzata come test monodimensionale, con un unico punteggio totale (Gotlib e Hammen, 2002), nelle analisi fattoriali delle componenti principali emergono generalmente 4 fattori, che spiegano mediamente il 48% della varianza: 1) umore depresso; 2) benessere; 3) sintomi somatici e di rallentamento; 4) sintomi interpersonali (Radloff, 1977). Il fattore benessere sembrerebbe legato alla formulazione in positivo di quattro item della scala, inseriti allo scopo di rompere un’eventuale tendenza a rispondere in modo unidirezionale (acquiescence response set). La scala risulta, inoltre, avere una buona sensibilità (che è la capacità di identi¿care correttamente individui con disturbo depressivo), ma la sua speci¿cità (ovvero, la sua
179 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
capacità di identi¿care correttamente individui senza il disturbo) e il suo potere predittivo positivo (ossia, il numero di individui identi¿cati dal test come depressi che sono diagnosticati come tali) sono altamente insoddisfacenti, pur considerando che, in quanto strumento di screening, il suo scopo principale dovrebbe essere quello di massimizzare la sensibilità (Dozois e Dobson, 2002). Utilità clinica e di ricerca Particolarmente utile nelle valutazioni epidemiologiche e nei procedimenti di screening, ha doti di brevità, semplicità e moderata intrusività, che la rendono adatta all’impiego nella ricerca e nello screening nella popolazione generale anziana, in campioni istituzionalizzati o con disabilità, essendo stata anche adattata per l’uso nelle interviste computerizzate o telefoniche. Nel complesso, i limiti della Center for Epidemiological Studies Depression Scale sono diversi e riassumibili come segue. 1. Tendenza alla sovrastima della depressione e, conseguentemente, alla produzione di un largo numero di «falsi positivi». Per la sua scarsa capacità discriminativa, metà degli studenti esaminati nelle varie ricerche viene classi¿cata come depressa (Robert, Lewinsohn e Seeley, 1991). Analogamente, Fechner-Bates, Coyne e Schwenk (1994) hanno trovato che il 72% dei soggetti con elevati punteggi al test non incontrava i criteri diagnostici di depressione con la Structured Clinical Interview for DSM-III-R (SCID; Spitzer, Williams, Gibbon e First, 1990). Ciò risiede probabilmente nel fatto che il punteggio di cut off standard, che discrimina fra presenza/assenza di depressione, individuato in 16 punti, risulta eccessivamente basso, perciò sarebbe preferibile sostituirlo con un punteggio di allarme clinico di 23 punti (Pierfederici et al., 1982; Fechner-Bates et al., 1994; Santor e Coyne, 1997). Proprio per questa ragione, secondo Roberts e Vernon (1983) il test andrebbe usato con cautela anche nelle fasi preliminari di screening. 2. Limitato potere discriminativo tra depressione e ansia. Elevate correlazioni con misure di psicopatologia generale e, in particolare, di ansia, conducono a una tipica tendenza dello strumento a segnalare un numero eccessivo di casi che, pur presentando un interesse psicopatologico, non soffrono di depressione maggiore. I sintomi esplorati dalla CES-D potrebbero, in effetti, far parte di altre sindromi o di un’aspeci¿ca «demoralizzazione», per cui sarebbe irrealistico attendersi diagnosi differenziali da questo strumento (Myers e Weissman, 1980). 3. Scarsa validità di contenuto, attribuibile alla copertura solo parziale dei criteri diagnostici del DSM per l’Episodio Depressivo Maggiore. Gli item della Center for Epidemiological Studies Depression Scale coincidono poco con i criteri dell’Episodio Depressivo Maggiore dell’attuale versione del DSM (DSM-IV-TR; APA, 2000). Mancano item che valutino l’ideazione suicidaria, i pensieri di morte, la colpa, l’agitazione e la perdita di interessi (Zimmerman, 1983) e sono inclusi item che non corrispondono ai criteri diagnostici, che possono essere meglio visti come sintomi di sindromi non depressive. La mancanza di item corrispondenti ai criteri diagnostici
180 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
contribuisce alla riduzione della sensibilità dello strumento, mentre l’inclusione di item non corrispondenti ai criteri diagnostici riduce inevitabilmente la sua speci¿cità per la depressione clinica. La validità di contenuto è compromessa, altresì, dalla mancata corrispondenza delle istruzioni e del formato di risposta ai criteri diagnostici per l’Episodio Depressivo Maggiore previsti dal DSM-IV-TR, che chiede di riferire la frequenza con cui è stato esperito il sintomo descritto nell’ultima settimana, anziché nelle ultime due settimane. Ciò contribuisce a ridurre ulteriormente la speci¿cità della scala. 4. Presenza di bias di genere in almeno due item (Stommel, Given, Given, Kalaian, Schulz e McCorkle, 1993). 5. Assenza di un manuale vero e proprio dell’adattamento italiano, che pone problemi per un suo corretto impiego. La traduzione è stata curata da Pierfederici, Fava, Munari, Rossi, Baldaro, Pasquali Evangelisti, Grandi, Bernardi e Zecchino (1982), supportata dalle back-translation di cinque italo-americani residenti in Italia. Nel campione italiano di validazione la CES-D discrimina signi¿cativamente, e meglio di altri strumenti, i pazienti depressi dai soggetti di controllo, sebbene sui punteggi medi inÀuiscano signi¿cativamente l’età (più anziani sono i soggetti più alto è il punteggio) e il sesso (le donne hanno punteggi medi più alti). Dunque, lontano dall’essere un test di ausilio diagnostico o una misura dei cambiamenti della gravità dei sintomi depressivi nel tempo, come osservano Sanavio e Sica (1999), la CES-D può essere considerata al massimo solo un grossolano indicatore di depressione nella popolazione generale, come fanno notare Myers e Weissman (1980).
Zung Self-Rating Depression Scale (ZSDS) Considerata il prototipo delle scale di autovalutazione per la sua semplicità, la Zung Self-Rating Depression Scale (ZSDS; Zung, 1965) è stata messa a punto per ottenere una rapida valutazione quantitativa dei sintomi psicologici (10 item), affettivi (2 item) e somatici (8 item) nei soggetti depressi. Rispetto al Beck Depression Inventory presenta uno spettro sintomatologico più ampio, dando molto peso anche all’ansia e ai sintomi accessori. Gli item sono stati ricavati sottoponendo ad analisi fattoriale un insieme di sintomi raccolti dalla letteratura e integrati da interviste con pazienti. La metà di essi è formulata e codi¿cata all’inverso, per il controllo dell’effetto acquiescenza. Un punteggio di cut off di 50 conduce a una corretta classi¿cazione diagnostica nell’88% dei casi (sensibilità = 88%, speci¿cità = 88%) (Basco, Krebaum e Rush, 1997). Proprietà psicometriche e norme Sorprendentemente, nonostante la sua lunga storia di impiego nella clinica e nella ricerca, esistono pochi dati relativi alle caratteristiche psicometriche di questo strumento.
181 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
Le norme del test furono inizialmente sviluppate su un campione di 56 pazienti psichiatrici ricoverati con una prima diagnosi di depressione: di questi, 31 furono trattati come disturbi depressivi e 25 ricevettero diagnosi diverse in una successiva valutazione. Tuttavia, importanti informazioni aggiuntive sono state fornite nello studio condotto da Gabrys e Peters (1985) su un campione di 587 pazienti, di cui 369 depressi e 218 non depressi, di età compresa tra i 12 e i 69 anni. Attendibilità La consistenza interna sembra adeguata, con un coefficiente split/half che varia da 0,79 a 0,94 e un _ di Cronbach di 0,82 nello studio più ampio (Sakamoto, Kijma, Tomoda e Kambara, 1998), condotto su 2187 studenti universitari, riportato in tabella 2. Generalmente, essa oscilla tra 0,71 e 0,88 in altri studi (Knight, Waal-Manning e Spears, 1983; Gabrys e Peters, 1985; de Jonghe e Baneke, 1989). Validità L’esame della validità convergente mostra correlazioni da moderate a elevate con altri strumenti di depressione, come illustrato nella tabella 2 (Carroll, Fielding e Blashki, 1973; Faravelli, Albanesi e Poli, 1986; Plutchik e van Praag, 1987). Di contro, la validità discriminante risulta molto più sospetta: sebbene la Zung Self-Rating Depression Scale appaia distinguere tra depressi e soggetti normali, sia in psichiatria che in medicina generale (Gabrys e Peters, 1985; Thurber, Snow e Honts, 2002), essa è meno capace di distinguere tra depressione e ansia (Di Marco et al., 2006) o tra diversi livelli di gravità del disturbo depressivo (Rabkin e Klein, 1987). In uno studio su un campione italiano di 140 soggetti normali (Innamorati et al., 2006), sono riportati, infatti, indici di correlazione di 0,70 con la scala per l’ansia dell’Institute for Personality and Ability Testing (IPAT), de¿nita più speci¿camente Anxiety Scale Questionnaire (ASQ; Krug, Scheier e Cattell, 1976), e di 0,61 con la scala di contenuto ANX del MMPI-2 (Hathaway e McKinley, 1989), com’è possibile notare nella tabella 2. La struttura fattoriale della scala è stata oggetto di indagine in diverse culture, da quella olandese a quella giapponese, e ha portato all’identi¿cazione di un numero ampio di fattori, da uno a sette. Ad esempio, Sakamoto, Kijma, Tomoda e Kambara, (1998), in un campione di 2187 studenti universitari giapponesi, hanno trovato tre fattori che hanno interpretato come sintomi cognitivi, sintomi affettivi e sintomi somatici. Tale struttura è stata supportata da una analisi fattoriale confermativa (Goodness of Fit Index, GFI = 0,92). Anche Kivelae e Pahkala (1987) hanno trovato tre fattori, che hanno, tuttavia, classi¿cato come Umore depresso, Perdita di autostima e Irritabilità e agitazione. Utilità clinica e di ricerca Gli studi condotti su questa scala inducono a ritenere che la Zung Self-Rating Depression Scale, a dispetto della sua popolarità nei paesi anglosassoni, non può essere utilizzata come strumento per la misura della gravità della depressione o dei suoi cambiamenti nel corso del trattamento (Gotlib e Cane, 1989; Basco, Krebaum e Rush, 1997; Dozois e Dobson, 2002). Possiamo identi¿care i limiti della scala in quelli che seguono.
182 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
1. Copertura parziale dei criteri del DSM-IV-TR per l’Episodio Depressivo Maggiore: sono inclusi solo 5 dei 9 criteri, mentre sono coperti da un solo item e, quindi, inadeguatamente sondati i rimanenti 4 (anedonia, disturbi del sonno, sentimenti di inadeguatezza o di colpa eccessivi, idee e tentativi di suicidio). 2. Mancanza di univocità dei dati sulla validità (Mayer, 1977; Ponterotto, Pace e Kavan, 1989) e, quindi, una dubbia validità di costrutto. Schotte, Maes, Cluydts e Cosyns (1996) hanno contestato dal punto di vista empirico l’assunto secondo cui gli item formulati in positivo e in negativo riÀettano lo stesso costrutto. In un campione di 338 depressi, infatti, gli stessi autori trovarono che il punteggio ricodi¿cato della Zung Self-Rating Depression Scale «gon¿ava» la media dei punteggi agli item. Inoltre, la maggior parte degli item formulati in positivo e in negativo presentava saturazioni salienti su diversi fattori. Sebbene questi risultati non siano stati trovati solo in questa scala, essi gettano dubbi sulla sua validità di costrutto come misura di sintomi depressivi. La struttura fattoriale sembrerebbe, infatti, identi¿care, almeno in parte, le polarità degli item del test piuttosto che valutare le componenti cognitive o psicomotorie della depressione (Dozois e Dobson, 2002). 3. Limitata capacità discriminativa tra i vari livelli di depressione. 4. Scarsa validità discriminante (Dobson, 1985; Tanaka-Matsumi e Kaneoka, 1986; Innamorati et al., 2006). Una possibilità di impiego di questa scala quale strumento di screening ne prevede l’uso in associazione con uno strumento psicometricamente più raf¿nato, come il Beck Depression Inventory-II. Sebbene siano riportate alte correlazioni tra le due scale (Plutchik e van Praag, 1987), esse sembrerebbero fornire informazioni complementari: il Beck Depression Inventory-II si focalizza sull’intensità dei sintomi depressivi, la Zung Self-Rating Depression Scale enfatizza la loro frequenza. Tuttavia, alcuni autori italiani (Innamorati et al., 2006) escluderebbero anche questa ipotesi, prevedendone «il ritorno nell’oblio senza rimpianti» (Sanavio, 2006).
Clinical Depression Questionnaire (CDQ) Il Clinical Depression Questionnaire (CDQ; Krug e Laughlin, 1976), altrimenti de¿nito IPAT Depression scale, conserva un’importanza essenzialmente storica, dato che trova il suo «progenitore» (Krug e Laughlin, 1976) in un test importante, quale il Clinical Analysis Questionnaire (CAQ; Delhees e Cattell, 1975), a sua volta costituito da una forma abbreviata del Questionario dei 16 Fattori della Personalità (16 PF; Cattell, Eber e Tatsuoka, 1970) e da 12 scale per la valutazione di tratti patologici, di cui 7 rispecchiano altrettanti fattori di depressione, correlati tra loro, e 5 corrispondono a fattori clinici scoperti da Cattell e Bolton (1969). Attraverso un’accurata fusione di due strategie di costruzione dei test (l’analisi fattoriale e il metodo empirico dei gruppi contrapposti), furono selezionati 36 item, che dimostrarono un’eccellente validità per la misura del fattore puro della depressione. Tuttavia, dato che nel corso della selezione degli item si andò formando un sotto-raggruppamento di item
183 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
connessi all’ansia, e data la correlazione di circa 0,80 con l’ASQ (Krug, Scheier e Cattell, 1976), in linea con l’esperienza clinica che da sempre confermava la stretta connessione tra i sintomi dell’ansia e della depressione, fu inserito un «fattore di correzione», costituito da quattro item «moderatori» che presentavano correlazioni trascurabili con la depressione ed elevate con l’ansia, riducendo così la correlazione tra il CDQ e l’ASQ e migliorando il potere discriminativo del CDQ. La decisione di includere o no questi quattro item nel punteggio totale della depressione come fattore di correzione è lasciata a chi fa uso del test: nel manuale del test, infatti, sono indicate le norme per entrambe le possibilità. Proprietà psicometriche e norme Le norme sono basate su poco più di 2000 casi, reclutati da oltre 60 località diverse degli USA e del Canada. Il punteggio del soggetto viene confrontato con quello di un adulto normale di 30 anni di età circa. Sono state, inoltre, fornite norme per sei gruppi speciali (458 studenti universitari, 211 carcerati, 728 casi clinici la cui diagnosi principale non è la depressione, 195 alcolizzati, 69 tossicomani) (Krug e Laughlin, 1976). Attendibilità L’attendibilità della scala, calcolata sui gruppi clinici di cui sopra, inclusi i 67 depressi, e su 632 adulti di controllo, è alta, con stime di coerenza interna di circa .90 in media (Krug e Laughlin, 1976). Validità La validità del test è stata esaminata sotto diversi aspetti. È emersa una correlazione di circa 0,88 tra il punteggio del test e un «fattore puro di depressione», in un campione di 1904 casi, composto da persone normali e da soggetti clinici. L’indagine sul potere discriminativo del test, ossia su come il test identi¿ca la differenza tra soggetti normali e soggetti depressi, ha chiarito che un punteggio sten di 8, 9 o 10 al test si veri¿ca all’incirca da 4 a 30 volte più spesso tra i depressi e tra i casi clinici piuttosto che tra i soggetti normali (Krug e Laughlin, 1976). Utilità clinica e di ricerca Sebbene il test abbia avuto un’indubbia importanza storica, attualmente esso non possiede più una validità pratica rispetto al criterio diagnostico, dato che successivamente i criteri per la diagnosi di depressione sono stati in parte modi¿cati, soprattutto con la pubblicazione delle più recenti edizioni del Manuale Diagnostico e Statistico dei Disturbi Mentali. Ulteriori limiti del questionari sono i seguenti. 1. Il formato di risposta è molto discutibile perché introduce esso stesso una fonte di variabilità non controllabile; 5 item richiedono una risposta corrispondente a: a) «quasi sempre», b) «qualche volta (o talvolta)», c) «quasi mai»; 20 item richiedono una risposta corrispondente a: a) «vero», b) «incerto», c) «falso»; un item richiede una risposta del tipo: a) «sì», b) «forse», c) «no».
184 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
2. La validità di criterio dovrebbe essere sottoposta a ulteriori indagini, dato che, come riportato nella tabella 2, emerge una correlazione di entità modesta tra il CDQ e la scala D del Minnesota Multiphasic Personality Inventory (r = 0,31, n.s.), comunque più bassa di quella ottenuta con altre scale del MMPI, quali Deviazione Psicopatica, Psicastenia, Schizofrenia e Introversione Sociale (Krug e Laughlin, 1976). 3. In Italia è presente l’adattamento a cura di Novaga e Pedon (1979), ma il campione di standardizzazione, che assomma a oltre 2000 casi, è, tuttavia, statunitense e in parte canadese. Tuttavia, in uno studio recente (Ciof¿, Balsamo e Saggino, in corso di stampa), la scala è stata sottoposta a un campione italiano di 240 studenti universitari, in cui è stata valutata l’adeguatezza di una versione con un formato di risposta a cinque alternative in luogo di tre.
SCALE INSERITE IN BATTERIE PSICODIAGNOSTICHE Tracceremo ora un pro¿lo psicometrico delle scale self-report di depressione disponibili in versione italiana, che fanno parte di batterie più ampie, destinate a misurare la psicopatologia ad ampio spettro: il Questionario D della batteria Cognitive Behavioural Assessment 2.0 (CBA 2.0; Sanavio et al., 1997; Sanavio, 2002) e la scala D del MMPI (Hathaway e McKinley, 1940; 1942; 1989). L’utilizzo di una batteria ha evidenti vantaggi ai ¿ni diagnostici.
Questionario D del Cognitive Behavioural Assessment 2.0 Il Questionario D è stato costruito appositamente per essere inserito nella batteria Cognitive Behavioural Assessment 2.0 (Bertolotti et al., 1985; Sanavio, 2002), che è un insieme di strumenti autodescrittivi utile per ottenere un primo screening su un ampio ventaglio di aree psicologiche disfunzionali (ansia, disturbi psico¿siologici, tratti di personalità, ossessioni e compulsioni, sintomi depressivi) e per veri¿care l’ef¿cacia dell’intervento cognitivo-comportamentale. La batteria è nata all’interno di un modello di assessment concepito come processo clinico-psicologico, integrato sia orizzontalmente (multidimensionale) sia verticalmente (organizzato gerarchicamente per approfondimenti successivi) (Mucciarelli, Chattat e Celani, 2002). Il questionario, che costituisce la scheda 8 della batteria, misura manifestazioni disforiche e depressive di rilievo sub-clinico, di frequente associate con altri disturbi (Sanavio et al., 1997), attraverso 21 item, ispirati prevalentemente alle scale di Beck (Beck et al., 1961; Beck, Rush, Shaw ed Emery, 1979) e di Zung (1965), da cui sono stati sistematicamente esclusi i contenuti psicosomatici, data la presenza di un apposito questionario nella stessa batteria. Ogni item è costituito da una serie di descrizioni che fanno riferimento a diversi aspetti del soggetto, disposti in ordine crescente di dif¿coltà, e da un formato di risposta dicotomico (sì/no). Bassi punteggi indicano l’assenza di manifestazioni depressive; alti punteggi indicano, invece, l’esistenza di una condizione disforica non necessariamente depressiva.
185 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
Uno stato depressivo, inoltre, potrebbe essere secondario a numerosi altri disturbi sia di carattere medico che psicologico. Ciò può essere chiarito attraverso l’uso del colloquio e delle scale secondarie, tra cui il Beck Depression Inventore (Sanavio e Sica, 1999; Sanavio, 2002). Proprietà psicometriche e norme Il Cognitive Behavioural Assessment 2.0 dispone di un campione normativo, aggiornato nel 1992, che comprende più di 2300 soggetti, divisi per sesso e per tre fasce d’età. Per la popolazione ultrasettantenne sono presentate norme separate che fanno riferimento a uno studio epidemiologico condotto su 583 anziani normali, divisi per sesso e cinque classi d’età (Della Sala e Zotti, 1994; Sanavio e Vidotto, 1996). Sono, inoltre, disponibili norme, divise per sesso e fasce d’età, relative a più di 6000 pazienti ricoverati per trattamento riabilitativo nell’area cardiologica, pneumologica, neurologica/¿siatrica, della tossicodipendenza, delle distonie e malattie professionali (Bertolotti, Michielin, Sanavio e Zotti, 1994). Attendibilità È stata, successivamente, indagata la consistenza interna, risultata pari a 0,82, in un gruppo di riferimento formato da 1722 soggetti (87,6% maschi), di età compresa tra i 16 e gli 80 anni, appartenenti alla popolazione normale di tutto il territorio nazionale. Per la misura dell’indice di fedeltà test-retest, sono state effettuate due rilevazioni a 7 (0,88) e 30 giorni (0,72), su due gruppi di soggetti rispettivamente di 124 e 76 unità (Sanavio, 2002). Validità Il questionario è stato sottoposto a una validazione preliminare su piccoli campioni, in base alla quale si caratterizza come una misura monofattoriale omogenea (_ = 0,86) e stabile (r = 0,88, a distanza di sette giorni, r = 0,72 a un mese), sensibile a variazioni di età (i punteggi medi tendono ad aumentare con l’età, in modo congruo con quanto è noto dalla letteratura psicologica) e di genere (le donne hanno punteggi medi più elevati) (Sanavio e Sica, 1999). Per valutare la validità di costrutto dello strumento, i punteggi del Questionario D sono stati confrontati con quelli della versione italiana del Beck Depression Inventory in 46 pazienti psichiatrici depressi. La correlazione tra i due strumenti è risultata pari a 0,56, ovvero abbastanza forte da considerare il costrutto valido, e abbastanza bassa da permettere di concludere che lo strumento misura taluni aspetti che il Beck Depression Inventory non considera. L’esame della validità discriminante ha portato a rinvenire un falso positivo e tre falsi negativi, usando un cut off di 15 in un campione di 46 pazienti psichiatrici depressi (Bertolotti et al.,1990). Utilità clinica e di ricerca L’obiettivo che ha mosso il gruppo CBA verso la costruzione di una nuova scala di depressione è nato dall’esame dei limiti delle scale precedenti, individuati nell’eccessiva
186 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
lunghezza, nella modesta utilità clinica e validità discriminante, nell’inadeguata validazione sulla popolazione italiana, nella limitata utilità con popolazioni con depressione subclinica, nelle scarse traduzioni o nell’uso limitato in Italia. Il questionario D del CBA 2.0 effettivamente supera questi limiti, offrendo diversi altri vantaggi: il campione normativo italiano è molto ampio, le norme speci¿che risultano un utile elemento di riferimento a chi applica la batteria in ambito ospedaliero, lo scoring computerizzato consente un notevole risparmio di tempo e risorse. Il limite principale di questa scala in ambito clinico è che il suo uso rientra all’interno della batteria completa, che richiede tempi di somministrazione piuttosto lunghi. Tuttavia, non è infrequente l’uso, in ambito clinico, di una versione autonoma della scheda 8, che, unita alla scheda 2 (corrispondente allo State-Trait Anxiety Inventory per la misura dell’ansia), è nota con il nome di Scale A-D (per lo studio di validazione si veda Vedana et al., 2001). Nei setting di ricerca lo strumento fornisce utili linee guida per un sistematico processo decisionale diagnostico, che ne incrementa sia la validità diagnostica che l’attendibilità (Nezu et al., 2000).
Scala D del Minnesota Multiphasic Personality Inventory (MMPI) La scala D corrisponde alla scala 2 del Minnesota Multiphasic Personality Inventory, sia nella prima edizione (MMPI-I; Hathaway e McKinley, 1940; 1942), sia nella seconda (MMPI-2; Hathaway e McKinley, 1989; Pancheri e Sirigatti, 1995) e non dovrebbe mai essere somministrata al di fuori dell’intera batteria. La procedura di costruzione della batteria consiste nel «metodo orientato al criterio», in base al quale si scelgono gli item che discriminano uno o più gruppi criterio (individuati clinicamente attraverso l’uso di categorie psichiatriche «correnti») da quelli di controllo. Dunque, la logica per la scelta degli item non è di tipo teorico, né intuitivo, bensì pragmatico (Kline, 1993). La scelta degli item per costruire la scala D fu operata sulla base della loro capacità di discriminare tra pazienti psichiatrici con diagnosi di depressione, pazienti psichiatrici non depressi e due gruppi di soggetti normali. Nel MMPI-2, 3 item sono stati eliminati, cosicché la scala risulta composta da 57 item, che si riferiscono a disturbi dell’umore, del pensiero, a sintomi psico¿sici, nonché ad aspetti di personalità di base riguardanti eccessivo senso del dovere, standard personali elevati e intrapunitività. Nell’insieme, dei 9 criteri diagnostici del DSM-IV-TR, quello che riguarda idee o tentativi di suicidio non è contemplato da nessun item e quello che si riferisce a variazioni nel peso corporeo e nell’appetito è de¿nito da un solo item. Proprietà psicometriche e norme Il campione impiegato per la standardizzazione del Minnesota Multiphasic Personality Inventory-2 è più ampio e ben distribuito rispetto a quello originario, includendo 1138 maschi e 1562 femmine, divisi per area geogra¿ca, razza ed età. La taratura italiana si è avvalsa di un campione di 1375 soggetti, di cui 403 maschi e 972 femmine, di età media
187 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
pari a 27 anni, con scolarità media pari a 12 anni. I punteggi grezzi sono stati trasformati in punti T, con media = 50 e DS = 10. In Italia, la versione computerizzata del Minnesota Multiphasic Personality Inventory-2, de¿nita MMPI-2 Panda, è stata tarata su un campione di 2686 soggetti normali, di cui 1336 maschi e 1350 femmine, residenti in varie regioni italiane (De Fidio e Pancheri, 2007). Attendibilità Si tratta di una misura alquanto stabile (attendibilità test-retest 0,75 a distanza di una settimana). Secondo Anastasi (2002), invece, la scala «valuta un comportamento così variabile nel tempo da far apparire fuori luogo qualsiasi discorso sulla sua attendibilità» (p. 656). Validità Le critiche alla validità riguardano vari aspetti e portano alla conclusione che la scala sia un dubbio indicatore di depressione (Ancona et al., 1985; Boncori, 1993). Per quel che riguarda il contenuto degli item, è stato evidenziato sia il fatto che item di altre scale del MMPI sono indicatori altrettanto buoni di depressione (Calonghi e Espinosa, 1965), sia la loro eterogeneità all’interno della scala. Proprio sulla base di questa critica è stata costruita la scala di contenuto «depressione e apatia», composta di 28 item, di cui solo 10 presi dalla scala D. Secondo altri autori, questa scala misura non tanto uno stato patologico, quanto fattori di personalità (Mayer, 1977), il che potrebbe essere in rapporto con la sua modesta sensibilità agli effetti dei trattamenti farmacologici (McNair, 1974). Recentemente, il problema della sensibilità e del potere predittivo della scala è stato connesso alla sua mancanza di unidimensionalità. In uno studio recente (Chang, 1996), è stata esaminata la struttura dimensionale sottostante della scala D del MMPI-2 sia con il modello di Rasch dicotomico (Rasch, 1960-1980) sia con l’analisi fattoriale in un campione di 2600 soggetti normali (dai 18 agli 84 anni). Sono emerse 2 sottoscale dal contenuto omogeneo, de¿nite depressione mentale e depressione ¿sica. Tali metodologie di Rasch hanno fornito così una base per una migliore comprensione della struttura sottostante. Utilità clinica e di ricerca In accordo con Nezu et al. (2000), riteniamo che sia l’utilità clinica che di ricerca della scala siano limitate. Nella pratica clinica, il tempo richiesto per la somministrazione dell’intera batteria (composta da 567 item) e per l’interpretazione è di gran lunga superiore se raffrontato ai potenziali vantaggi offerti dall’applicazione della batteria stessa (Nezu et al., 2000). Boncori (1993) suggerisce di interpretare i punteggi della scala, ponendoli in relazione con quelli di altre scale, magari ricorrendo a codici a 2 o 3 punte, che si sono rilevati abbastanza stabili. Nella ricerca il ricorso a questa scala è generalmente subordinato all’uso dell’intera batteria, il cui metodo di costruzione presenta evidenti limiti strutturali, secondo Kline (1993). Infatti, la scelta dei gruppi criterio risente dell’inattendibilità dovuta alla diagnosi psichiatrica, nonché allo scarso accordo rispetto a quali categorie andrebbero usate; la mancanza di signi¿cato psicologico delle scale così costruite limita inoltre la
188 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
generalizzabilità dei risultati. Alla luce di queste obiezioni psicometriche, secondo Kline «sarebbe stato meglio costruire un questionario fattorializzato completamente nuovo» (1993, p. 499). Pertanto, le elevazioni della scala D non sono facilmente interpretabili dato che la scala non riÀette un costrutto unidimensionale (Chang, 1996).
CONCLUSIONI Sia i ricercatori sia i clinici dovrebbero conoscere bene le proprietà psicometriche e lo sviluppo degli inventari self-report per la misura della depressione, in modo da essere consapevoli di quali aspetti possono non essere attendibilmente e validamente indagati attraverso lo speci¿co strumento di assessment usato (Endler, Macrodimistris e Kocovski, 2000). Più precisamente, dato che strumenti diversi misurano aspetti diversi della depressione (cognitivi, affettivi e ¿siologici, ecc.), è importante conoscere quali aspetti della depressione è capace di identi¿care una scala e compensare appropriatamente gli aspetti che non sono stati indagati con l’uso di altri inventari di autovalutazione o con le domande di un’intervista diagnostica. L’autovalutazione della depressione presenta in sé indubbi vantaggi, che vanno dalla velocità alla facilità di somministrazione, particolarmente importanti nella psicoterapia cognitivo-comportamentale, che include un periodico automonitoraggio (Nezu et al., 2000). Tuttavia, essa porta con sé anche una serie di limiti, che tenteremo di sintetizzare qui di seguito. 1. La distribuzione dei punteggi totali delle scale self-report ha evidenziato che quasi tutte hanno una distribuzione unimodale. Tuttavia, mentre le scale di eterovalutazione mostrano un’asimmetria verso sinistra, le scale di autovalutazione, eccetto il Beck Depression Inventory, sono sbilanciate verso destra (Faravelli, Albanesi e Poli, 1986). La ragione di ciò può risiedere in due ordini di fattori: a) il paziente tende mediamente a fornire una valutazione cognitiva del suo stato emotivo e della sua condizione come più grave rispetto alla valutazione «obiettiva» effettuata da un osservatore esterno, in quanto ha come unico riferimento le proprie precedenti esperienze interne, a differenza dello psichiatra che lo valuta in relazione ad altri casi con cui è venuto a contatto; b) la depressione è una condizione che porta il paziente al peggiore pessimismo, in¿ciandone le capacità critiche, per cui il proprio stato attuale è vissuto generalmente come la condizione peggiore possibile. Non a caso, quando il paziente non è costretto da «ancoraggi» precisi, tende a posizionarsi nella fascia di gravità estrema (Conti, Ruggeri e Faravelli, 1999). 2. Inadeguatezza dei criteri e del metodo di scoring: è opportuno che una scala self-report preveda criteri di scoring ben de¿niti; in questo senso, il Beck Depression Inventory si è rivelato superiore alle altre scale di autovalutazione, risultando l’unica fra le scale di questo tipo a correlare abbastanza bene con le misure di valutazione del clinico (Faravelli, Albanesi e Poli, 1986). Inoltre, il metodo tradizionale di scoring delle
189 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
scale di autovalutazione della depressione prevede l’uso del punteggio grezzo totale (dato dalla somma algebrica dei punteggi ai singoli item) come indice di gravità della depressione. Questo metodo risulta incongruo, in quanto il punteggio assunto come diagnostico deriva anche da sintomi presenti a livelli di frequenza o di gravità tali che non sarebbero stati presi in considerazione da un’intervista diagnostica, che prende in considerazione per la diagnosi solo sintomi che vanno da un certo livello di gravità in poi (Zimmerman, 1983). In questo senso, il punteggio totale esprimerebbe più la pervasività del quadro clinico che non la sua gravità. Inoltre, questo metodo può rivelarsi fallace poiché si basa su una serie di assunzioni che potrebbero essere false (Gibbons, Clark, Von Ammon Cavanaugh e Davis, 1985): a) attribuendo lo stesso peso a ogni item, si assume che ogni item o sintomo su una scala rappresenti un uguale livello di gravità psichiatrica, laddove ciò si veri¿ca raramente. Alcuni sintomi sono presenti solo nei pazienti più gravemente depressi, mentre altri si trovano sia in pazienti con bassi livelli di depressione che in quelli con alti livelli di depressione; b) si assume che ogni sintomo sulla scala sia ugualmente correlato con la dimensione clinica di interesse. In realtà, alcuni sintomi possono discriminare bene tra individui depressi e non, mentre altri possono essere correlati a un fenomeno differente, come una malattia ¿sica; c) il confronto dei punteggi totali tra popolazioni diverse (ad esempio, i punteggi del Beck Depression Inventory in pazienti con disturbi ¿sici e mentali) assume che i singoli item abbiano caratteristiche identiche nei diversi campioni. Un sintomo che discrimina attendibilmente livelli alti e bassi di depressione nei pazienti psichiatrici può non essere un reale discriminante di livelli alti e bassi di depressione in pazienti con disturbi ¿sici. Dunque, dal punto di vista teorico, l’uso dei punteggi totali è sotteso da una logica molto carente, non dissimile da quella che muove un geografo a valutare una determinata area geogra¿ca sommando il numero degli abitanti, la lunghezza dei ¿umi e l’altezza delle montagne (Conti, Ruggeri e Faravelli, 1999). Da un punto di vista pratico, una diminuzione dei sintomi accessori, che può ottenersi per un insieme di fattori del tutto aspeci¿ci, si riÀette in una diminuzione del punteggio totale, dando l’illusione di un miglioramento clinico anche quando i sintomi nucleari rimangono inalterati (Conti, 2002). D’altra parte, occorre considerare che nella prassi l’additività dei punteggi porta a risultati meno astrusi di quanto non sia lecito attendersi in base alle considerazioni teoriche. Il più delle volte, infatti, l’impressione clinica è sostanzialmente concorde con il punteggio globale di una scala di valutazione, probabilmente perché anche i nostri comuni atti di giudizio sono in buona parte additivi (Poli e Faravelli, 1981). Quindi, se appare improponibile l’uso del punteggio totale di una rating-scale come «termometro psichico» per caratterizzare un paziente, è possibile che tale punteggio possa avere una certa validità nel caratterizzare un gruppo. Ad esempio, il dato che in una certa ricerca il campione presenta una media X e una DS Y a una data scala, probabilmente contiene più informazioni per il lettore che abbia pratica di quella scala che il sapere che i pazienti erano «moderatamente gravi» (Poli e Faravelli, 1981). 3. Scarsa validità di contenuto, se si usa come criterio la diagnosi di Episodio Depressivo Maggiore del DSM-IV-TR. In effetti, come sostengono Clark, Beck e Alford (1999),
190 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
«se davvero esiste un insieme di sintomi unanimamente considerati caratteristici della depressione sia dagli psicologi che dagli psichiatri, questo è il gruppo dei sintomi che caratterizza l’episodio depressivo maggiore» (p. 2). 4. Mancanza di omogeneità nei contenuti delle varie scale, che, riÀettendo le diverse teorie degli autori che le hanno costruite, misurano aspetti diversi dello stesso costrutto. Questo dato emerge da molteplici fonti: a) l’osservazione del peso relativo assegnato alle singole componenti del quadro depressivo nelle diverse scale di valutazione evidenzia un’estrema difformità tra esse, come emerge nello studio di Faravelli, Albanesi e Poli (1986), in cui vengono confrontate sei scale di valutazione della depressione, di cui quattro autocompilate. Ad esempio, i sintomi nucleari della depressione, nel loro insieme, pesano fra il 40 e il 50% nell’Hamilton Rating Scale for Depression, circa il 70% nella Zung Self-Rating Depression Scale e oltre il 70% nel Beck Depression Inventory; b) la bassa concordanza tra i punteggi totali delle diverse scale evidenzia ancora di più questo fenomeno. I coef¿cienti rinvenibili in letteratura variano tra 0,14 e 0,77: pur presumendo di misurare la stessa entità, nel migliore dei casi due scale di depressione avrebbero solo il 59% della varianza comune (Conti, Ruggeri e Faravelli, 1999); c) l’analisi fattoriale, tecnica statistica multivariata che permette di individuare le dimensioni comuni a un insieme di variabili, applicata allo studio della struttura interna delle singole scale self-report, ha evidenziato differenze considerevoli tra i vari strumenti, ad ulteriore dimostrazione che concezioni diverse della depressione stanno alla base delle differenti scale. Questo limite renderebbe l’uso di una scala di depressione in luogo di un’altra tutt’altro che irrilevante, con la possibilità di ottenere risultati diversi e l’impossibilità di generalizzare i risultati da uno studio all’altro (Endler et al., 2000). 5. Mancanza di controllo del response set della desiderabilità sociale. Una controversia importante riguardante l’uso degli inventari di autovalutazione consiste nella loro falsi¿cabilità e nel rapporto con la desiderabilità sociale (Conoley, 1978; Arbisi, 2001; Wood, Garb, Lilienfeld e Nezworski, 2002). La tipica facilità di somministrazione li espone, infatti, a uno stile deliberato di risposta e alla distorsione dei risultati. Già Davis (citato in Beck, Steer e Garbin, 1988) riferiva che i pazienti dei reparti di salute mentale sono in grado di descriversi come depressi o non depressi a seconda del setting di valutazione. La cautela è, dunque, imperativa nell’uso di tali strumenti con persone che potrebbero desiderare di nascondere le proprie intenzioni suicide o, di contro, sovrastimare la loro depressione (Conoley, 1978). Per giunta, come dimostra Schwartz (1999), nell’interessante lavoro Self-reports: how the questions shape the answers, le differenze più piccole nel formato del questionario, incluso l’ordine degli item, potrebbero inÀuenzare sostanzialmente non solo i livelli medi di risposta agli item, ma anche le intercorrelazioni tra gli item. 6. Inapplicabilità in popolazioni di depressi gravi: in una ricerca di Faravelli, Albanesi e Poli (1986), 24 dei 100 pazienti con diagnosi di Episodio Depressivo Maggiore secondo i criteri del DSM-III (APA, 1980), cui sono state somministrate sei scale self-report di depressione, non sono stati in grado di completare autonomamente i questionari per dif¿coltà di comprensione e/o per mancanza di collaborazione. Dunque, se la praticità
191 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
d’uso delle scale self-report è maggiore in certi casi (ad esempio, screening di massa, casi ambulatoriali), essa si riduce drasticamente rispetto alle scale di eterovalutazione nel caso di pazienti gravi in degenza ospedaliera. 7. Scarsa validità discriminante rispetto all’ansia. Come riportato nella review di Dobson (1985), gli indici di correlazione tra i diversi strumenti per la misurazione della depressione e dell’ansia sono elevati, aggirandosi intorno a 0,61. Ciò potrebbe essere attribuito al fatto che le scale di depressione misurano un fattore depressivo generale di ordine più elevato e diversi fattori speci¿ci di ordine inferiore, alcuni dei quali condividono parte della loro variabilità con la sintomatologia ansiosa. 8. Problematiche relative alla standardizzazione e alla validazione di strumenti tradotti da una lingua all’altra (Fava, 1983; Behling e Law, 2000). L’adattamento di una scala, che ha per oggetto di misura una dimensione soggettiva e complessa della patologia psichica come la depressione, presuppone: a) la risoluzione di problemi metodologici di ordine semantico, relativi alle dif¿coltà di traduzione, che rendono necessario procedere ad accurate back-translations, per veri¿care se è stato realmente colto il signi¿cato originale del costrutto misurato dallo strumento nei suoi aspetti più sottili; b) la necessità di effettuare studi di standardizzazione e validazione, con le dovute modi¿che da effettuare per rendere la scala compatibile con la realtà socio-culturale con cui si va a confrontare, date le note differenze transculturali nella misura della depressione (ad esempio, Crittenden et al., 1992; Zung, 1972). Tra gli strumenti attualmente più diffusi nel nostro Paese non vi è nessuna misura di depressione singola (ovvero non inserita in questionari più ampi) nata nel contesto italiano che abbia raggiunto un ampio impiego nella ricerca e/o nella clinica. Inoltre, se si eccettuano quelle incluse in batterie più ampie, nessuna di quelle tradotte da altre lingue presenta un manuale vero e proprio dell’adattamento italiano. Proprio per colmare questa lacuna, attualmente siamo impegnati in un progetto di ricerca che prevede la costruzione di un nuovo inventario self-report di depressione, che tenterà di superare i limiti psicometrici di quelli già esistenti, e che verrà adattato e standardizzato sulla popolazione italiana (Balsamo, 2006). L’obiettivo generale di questo lavoro sarà quello di costruire uno strumento di misurazione dell’entità della depressione negli adulti che garantisca al clinico facilità e velocità d’uso e che sia, al tempo stesso, raf¿nato dal punto di vista psicometrico, cioè il più possibile valido e attendibile. A partire dai limiti summenzionati delle scale già esistenti, stiamo mirando a costruire uno strumento che si dovrebbe con¿gurare come nuovo essenzialmente per tre caratteristiche peculiari: a) copertura dell’intero spettro sintomatologico previsto dal DSM-IVTR per la diagnosi di depressione maggiore e della relativa durata della sintomatologia; b) analisi degli item attraverso un modello di Item Response Theory; c) controllo del response set della desiderabilità sociale. La presentazione dei risultati preliminari di questo progetto, attualmente in corso, esula dagli scopi del presente lavoro e, pertanto, sarà auspicabilmente fornita in un prossimo articolo.
192 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
Bibliografia American Psychiatric Association (2000). Diagnostic and Statistical Manual of Mental Disorders, Fourth Edition, Text Revision. Washington, DC: Author. Tr. it. DSM IV-TR; Manuale Diagnostico e Statistico dei Disturbi Mentali. Milano: Masson, 2001. Anastasi, A. (2002). I test psicologici. Milano: Franco Angeli. Ancona, M., Torre, E., Jaretti Sodano, A., De Lorenzo, C. e Matta, F. (1985). L’Inventario della Depressione di Beck nella ricerca in psicosomatica. Minerva Psichiatrica, 26, 41-45. Antony, M.M., & Barlow, D.H. (2002). Handbook of assessment and treatment planning for psychological disorders. New York: the Guilford Press. Arbisi, P. (2001). Review of the Beck Depression Inventory-II. In B.S. Plake & J.C. Impara (Eds.), The fourtheen mental measurements yearbook (pp. 452-468). Lincoln, NE: Buros Institute of Mental Measurements. Balsamo, M. (2006). Costruzione di un nuovo strumento self-report di depressione. Tesi di Dottorato, Università «G. d’Annunzio» di Chieti-Pescara, a.a. 2006-07. Basco, M.R., Krebaum, S.R., & Rush, A.J. (1997). Outcome measures of depression. In H.H. Strupp, L.M. Horowitz e M.J. Lambert (Eds.), Measurement patient changes in mood, anxiety, and personality disorders: toward a core battery (pp. 191-245). Washington, DC: American Psychological Association. Beck, A.T. (1991). Cognitive therapy: a 30-year retrospective. American Psychologist, 46, 368-375. Beck, A.T., Ward, C.H., Mendelson, M., Mock, J., & Erbaugh, J. (1961). An inventory for measuring depression. Archives of General Psychiatry, 4, 561-579. Beck, A.T., & Lester, D. (1973). Components of depression in attempted suicides. Journal of Psychology, 85, 257-260. Beck, A.T., Rush, A.J., Shaw, B.F., & Emery, G. (1979). Cognitive therapy of depression. New York: Guilford Press. Tr. it. Terapia cognitiva della depressione. Torino: Bollati Boringhieri, 1987. Beck, A.T., & Steer, R.A. (1987). Beck Depression Inventory. Manual. San Antonio, TX: The Psychological Corporation. Beck, A.T., & Steer, R.A. (1990). Manual for the Beck Anxiety Inventory. San Antonio, TX: The Psychological Corporation. Beck, A.T., Steer, R.A., & Garbin, E. (1988). Psychometric properties of the Beck Depression Inventory: twenty-Àve years of evaluation. Clinical Psychology Review, 8, 77-100. Beck, A.T., Steer, R.A., Ball, R., & Ranieri, W.F. (1996). Comparison of the Beck Depression Inventories-IA and II in outpatients. Journal of Personality Assessment, 67, 588-797. Beck, A.T., Steer, R.A., & Brown, G.K. (1996). Beck Depression Inventory-Second Edition manual. San Antonio, TX: The Psychological Corporation. Behling, O., & Law, K.S. (2000). Translating questionnaires and other research instruments. London: Sage. Bertolotti, G., Michielin, P., Sanavio, E., Simonetti G., Vidotto G., & Zotti, A.M. (1985). CBA 2.0. Cognitive Behaviuoral Assessment 2.0. Scale Primarie. Firenze: Organizzazioni Speciali.
193 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
Bertolotti, G., Zotti, A.M., Michielin, P., Vidotto G., & Sanavio (1990). A computerized approach to cognitive behavioural assessment: An introduction to CBA 2.0 Primary Scales. Journal of Behavior Therapy and Experimental Psychiatry, 21, 21-27. Bertolotti, G., Michielin, P., Sanavio, E., & Zotti, A.M. (1994). Un modello di valutazione psicologica in medicina riabilitativa. Uso della batteria CBA-2.0 Scale Primarie. Pavia: PIME. Blackburn, I.M., & Moorhead, S. (2002). Depressione. In W.J. Lyddon & J.V. Jones, L’approccio evidence-based in psicoterapia. Milano: McGraw-Hill. Boncori, L. (1993). Teoria e tecniche dei test. Torino: Bollati Boringhieri. Calonghi, L., & Espinosa, J. (1965). La depressione nel Multiphasic Minnesota Personality Inventory (MMPI). Orientamento pedagogico, 12, 1099-126. Camara, W.J., Nathan, J.S., & Puente, A.E. (2000). Psychological testing usage: Implications in professional psychology. Professional Psychology: Research and Practice, 31, 141-154. Cattell, R.B., Eber, H.W., & Tatsuoka, M.M. (1970). Handbook for the Sixteen Personality Factor Questionnaire (16 PF). Champaign: IPAT. Chang, C. H. (1996). Finding two dimensions in MMPI-2 depression. Structural Equation Modeling, 3, 41-49. CiofÀ, R., Balsamo, M., & Saggino, A. (in press). Psychometric characteristics of the Italian Depression Questionnaire using a 5-point rating scale with undergraduate. Submitted to Psychological Reports. Clark, D.C., Cavanaugh, S.V., & Gibbons, R.D. (1983). The core symptoms of depression in medical and psychiatric patients. Journal of Nervous and Mental Disease, 171, 705-713. Clark, D.A., Beck, A.T., & Alford, B.A. (1999). ScientiÀc foundations of cognitive theory and therapy of depression, John Wiley & Sons Inc. Trad. it. Teoria e terapia cognitive della depressione. Milano: Masson. Carroll, B.J., Fielding J., & Blashki T. (1973). Depression rating scales: a critical review. Archives of General Psychiatry, 28, 361. Conoley, C.W. (1978). Review of the Beck Depression Inventory (Revised Edition). In O.K. Buros (Ed.). The eight mental measurements yearbook. Highland Park, N.J.: The Gryphon Press. Conti, L. (2002). Repertorio delle scale di valutazione in psichiatria. Firenze: SEE Editore. Conti L., Ruggeri M., & Faravelli, C. (1999). Strumenti di valutazione e di misura. In G. Cassano e P. Pancheri, Trattato Italiano di Psichiatria (pp. 829-855). Milano: Masson. Crittenden, K.S., Fugita, S.S., Bae, H., Lamug, C.B., & Un, C. (1992). A cross-cultural study of self-report depressive symptoms among college students. Journal of CrossCultural Psychology, 2, 163-178. De Fidio, D., & Pancheri, P. (2007). La taratura italiana del MMPI-2 www.psychomedia. it/pm/inftel/informatic/mmpi2-panda.htm.
194 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
De Girolamo, G., Polidori, G., Morosini, P.L., Mazzi, F., Serra, G., Scarpino, V., Reda, V., Visonà, G., Falsirollo, F., & Rossi, A. (2005). Prevalenza dei disturbi mentali comuni in Italia, fattori di rischio, stato di salute ed uso di servizi sanitari: il progetto ESEMEDWMH. Epidemiologia e Psichiatria Sociale, 14 (Suppl.4). de Jonghe, J. F., & Baneke, J.J. (1989). The Zung Self-Rating Depression Scale: a replication study on reliability, validity and prediction. Psychological Reports, 64, 833-834. Della Sala, S. e Zotti, A.M. (1994). Psicologia dell’invecchiamento ed epidemiologia della demenza: uno studio di popolazione. Pavia: PIME. Delhees, K.H., &, Cattell, R.B. (1975). Handbook for the Clinical Analysis Questionnaire. Champaign, Ill.: IPAT. Di Marco, F., Verga, M., Reggente, M., Casanova, F., Santus, P., Blasi, F., Allegra, L., &, Centanni, S. (2006). Anxiety and depression in COPD patients: the roles of gender and disease severity. Respiratory Medicine, 100, 1767-74. Dobson, K.S. (1985). The relationship between anxiety and depression. Clinical Psychology Review, 5, 307-324. Dozois, D.J.A., & Dobson, K.S. (2002). Depression. In M.M. Antony & D.H. Barlow (Eds), Handbook of assessment and treatment planning for psychological disorders (pp. 173-184). New York: the Guilford Press. Endler, M.S., Rutheford, A., & Denisoff, E. (1999). Beck Depression Inventory: exploring its dimensionality in a nonclinical population. Journal of Clinical Psychology, 55, 1307-1312. Endler, N.S., Macrodimistris, D.S., & Kocovski, N.L. (2000). Depression: the complexity of self-report measures. Journal of Applied Biobehavioral Research, 5, 1, 26-46. Faravelli, C., Albanesi, G., & Poli, E. (1986). Assessment of depression: a comparison of rating scales. Journal of Affective Disorders, 11, 245-253. Farmer, R.F. (2001). Review of the Beck Depression Inventory-II. In B.S. Plake & J.C. Impara (Eds.), The fourtheen mental measurements yearbook (pp. 452-468). Lincoln, NE: Buros Institute of Mental Measurements. Fava, G. A. (1983). Assessing depressive symptoms across cultures: Italian validation of the CES-D self-rating scale. Journal of Clinical Psychology, 39, 2, 249-251. Fechner-Bates, S., Coyne, J.C., & Schwenk, T.L. (1994). The relationship of self-reported distress to depressive disorders and other psychopatology. Journal of Counsulting and Clinical Psychology, 62, 550-559. Gabrys, J.B., & Peters, K. (1985). Reliability, discriminant and predictive validity of the Zung Self-rating Depression Scale. Psychological Reports, 57, 1091-1096. Ghisi, M., Flebus, G.B., Montano, A., Sanavio, E., & Sica, C. (2006). Beck Depression Inventory-II. Manuale italiano. Firenze: Organizzazioni Speciali. Gibbons, R., Clark, D.C., VonAmmon Cavanaugh, S., & Davis, J.M. (1985). Application of modern psychometric theory in psychiatric research. Journal of Psychiatric Research, 19, 43-55. Goldston, D.B., Reboussin, B.A., & Daniel, S.S. (2006). Predictors of Suicide Attempts: State and Trait Components. Journal of Abnormal Psychology, 115, 842-849.
195 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
Golin, S., & Hartz, M. (1979). A factor analysis of the Beck Depression Inventory in a mildly depressed population. Journal of Clinical Psychology, 35, 322-325. Gotlib, I.H., & Cane, D.B. (1989). Self-report assessment of depression and anxiety. In P.C. Kendall e D. Watson (Eds.), Anxiety and depression: distinctive and overlapping features. Personality, psychopathology, and psychotherapy (pp. 131-169). San Diego, CA: Academic Press. Gotlib, I.H., & Hammen, C.L. (2002). Handbook of depression. New York: the Guilford Press. Hamilton, M. (1959). The assessment of anxiety states by rating. British Journal of Medical Psychology, 32, 50-55. Hamilton, M. (1960). A rating scale for depression. Journal of Neurology and Neosurgical Psychiatry, 23, 56-62. Hathaway, S.R., & McKinley, J.C. (1940). A multiphasic personality schedule (Minnesota): I. Construction of the schedule. Journal of Psychology, 10, 249-254. Hathaway, S.R., & McKinley, J.C. (1942). A multiphasic personality schedule (Minnesota): III. The measurement of symptomatic depression. Journal of Psychology, 14, 73-84. Hathaway, S.R., & McKinley, J.C. (1989). Minnesota Multiphasic Personality Inventory 2: Manual. Tr. it. Manuale del Minnesota Multiphasic Personality Inventory 2 (a cura di) P. Pancheri & S. Sirigatti. Firenze: Organizzazioni Speciali, 1995. Hughes, J. R., O’Hara M.W., & Rehm, L.P. (1982). Measurement of depression in clinical trials: an overview. Journal of Clinical Psychiatry, 43, 85-88. Innamorati, M., Lelli, M., Aiello, S., Di Lorenzo del Casale, F.L., Russo, S., & Ferrari, V. (2006). Validazione convergente e discriminante della versione italiana della Zunf SelfRating Depression Scale. Psicoterapia Cognitiva e Comportamentale, 12, 343-353. Kats, R., Shaw, B.F., Vallis, T.M., & Kaiser, A.S. (1995). The assessment of severity and symptom patterns in depression. In E.E. Beckham & W.R. Leber (Eds.), Handbook of depression (2nd ed.) (pp. 61-85). New York: the Guilford Press. Kendall, P.C., Hollon, S.D., Beck, A.T., Hammen, C.L., & Ingram, R.E. (1987). Issues and recommendations regarding use of the Beck Depression Inventory. Cognitive Therapy and Research, 11, 289-299. Kivelae, S., & Pahkala, K. (1987). Factor structure of the Zung Self-Rating Depression Scale among a depressed elderly population. International Journal of Psychology, 22, 289-300. Kline, P. (1993). The handbook of psychological testing. Londra: Routledge. Trad. it. Manuale di psicometria. Roma: Astrolabio, 1996. Knight, R. G., Waal-Manning, H.J., & Spears, G.F. (1983). Some norms and reliability data for the State-Trait Anxiety Inventory and the Zung Self-Rating Depression Scale. British Journal of Clinical Psychology, 22, 245-249. Krug, S.E., & Laughlin, J.E. (1976). Handbook for the IPAT Depression Scale. Champaign, Ill.: Institute for Personality and Ability Testing. Trad. it. Questionario di autovalutazione CDQ. Adattamento italiano a cura di M. Novaga e A. Pedon. Firenze: Organizzazioni Speciali, 1979.
196 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
Krug, S.E., Scheier, I.H., & Cattell, R.B. (1976). Handbook for the IPAT Anxiety Scale. Champaign, Ill.: Institute for Personality and Ability Testing. Mayer, J.M. (1977). Assessment of Depression. In P. McReynolds (Ed), Advances in Psychological Assessment, vol. IV (pp. 358-425). Palo Alto: Science and Behavior Books. McNair, D.M. (1974). Self-evaluations of antidepressants. Psychopharmacologia, 37, 281-302. Milani, P., Caniatti, L., & Tola, M.R. (2006). Valutazione della depressione in persone affette da sclerosi multipla: limiti dei principali questionari. Psicoterapia Cognitiva e Comportamentale, 12, 355-364. Montano, A., & Flebus, G.B. (2006). Presentazione del Beck Depression Inventory-Seconda edizione (BDI-II): conferma della struttura bifattoriale in un campione di popolazione italiana. Psicoterapia Cognitiva e Comportamentale, 12, 67-82. Mucciarelli, G., Chattat, R., & Celani, G. (2002). Teoria e pratica dei test. Padova: Piccin. Myers, J.K., & Weissman, M.M. (1980). Use of a self-report symptom scale to detect depression in a community sample. American Journal of Psychiatry, 137, 1081-1089. Nezu, A.M., Ronan, G.F., Meadows, E.A., & McClure, K.S. (2000). Clinical assessment series: Vol. 1. Practitioner’s guide to empirically-based measures of depression. New York: Kluver/Plenum. Novaga, M., & Pedon, A. (1979). Questionario di autovalutazione CDQ. Firenze: Organizzazioni Speciali. Pierfederici, A., Fava, G.A., Munari, F., Rossi, N., Baldaro, B., Pasquali Evangelisti, L., Grandi, S., Bernardi, M., & Zecchino, F. (1982). Validazione italiana del CES-D per la misurazione della depressione. In R. Canestrari (a cura di), Nuovi metodi in psicometria (pp. 95-103). Firenze: Organizzazioni Speciali. Plutchik, R., & van Praag, H.M. (1987). Interconvertability of Àve self-report measures of depression. Psychiatric Research, 22, 243-256. Poli, E., & Faravelli, C. (1981). La valutazione dei sintomi psichiatrici. III: Problemi connessi alla misurazione. Rassegna di Studi Psichiatrici, 70, 228-238. Rabkin, J.G., & Klein, D.F. (1987). The clinical measurement of depressive disorders. In A.J. Marsella & R.M.A. Hirschfeld (Eds.), The measurement of depression (pp. 30-83). New York: the Guilford Press. Radloff, L.S. (1977). The CES-D Scale: A self-report depression scale for research in the general population. Applied Psychological Measurement, 1, 385-401. Rasch, G. (1960-1980). Probabilistic models for some intelligence and attainment tests. Chicago: the University of Chicago Press. Robert, R.E., Lewinsohn, P.M., & Seeley, J.R. (1991). Screening for adolescent depression: a comparison of depression scales. Journal of the American Academy of Child and Adolescent Psychiatry, 30, 58-66. Roberts, R. E., & Vernon, S.W. (1983). The Center for Epidemiologic Studies Depression scale: its use in a community sample. American Journal of Psychiatry, 140, 41-48. Saggino, A. (2005). La depressione. In A. Galeazzi e P. Meazzini (a cura di), Mente e Comportamento. Trattato italiano di psicoterapia cognitivo-comportamentale. Firenze: Giunti editore.
197 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
Psicoterapia Cognitiva e Comportamentale - Vol. 13 - n. 2 • 2007
Sakamoto, S., Kijima, N., Tomoda, A., & Kambara, M. (1998). Factor structures of the Zung Self-Rating Depression Scale (SDS) for undergraduates. Journal of Clinical Psychology, 54, 477-487. Sanavio, E., Bertolotti, G., Michielin, P., Vidotto, G., & Zotti, A.M. (1988). CBA-2.0 Cognitive behavioral assessment: Scale primarie. Manuale. Firenze: Organizzazioni Speciali. Sanavio, E., & Vidotto, G. (1996) (a cura di). Batteria CBA: dieci anni di ricerche. UPSEL, Torino. Sanavio, E., & Sica, C. (1999). Depressione. In E. Sanavio e C. Sica, I test di personalità (pp.217-235). Bologna: Il Mulino. Sanavio, E. (a cura di) (2002). Le Scale CBA. Milano: Raffaello Cortina Editore. Sanavio, E. (2006). Editoriale. Psicoterapia Cognitiva e Comportamentale, 12. Sanavio, E., Bertolotti G., Michielin, M., Vidotto G., & Zotti, A.M. (1997). CBA 2.0. Cognitive Behavioural Assessment. Scale Primarie. Manuale. Firenze: Organizzazioni Speciali. Santor, D.A., Ramsay, J.O., & Zuroff, D.C. (1994). Nonparametric item analyses of the Beck Depression Inventory: evaluating gender item bias and response option weights. Psychological Assessment, 6, 255-270. Santor, D.A., & Coyne, J. C. (1997). Shortening the CES-D to improve its ability to detect case of depression. Psychological Assessment, 9, 233-243. Schotte, C.K.W., Maes, M., Cluydts, R., & Cosyns, P. (1996). Effects of affective-semantic mode of item presentation in balanced self-report scales: biased construct validity of the Zung Self-Rating Depression Scale. Psychological Medicine, 26, 1161-1168. Schwartz, N. (1999). Self-reports: how the questions shape the answer. American Journal of Psychology, 54, 93-105. Shafer, A.B. (2006). Meta-analysis of the factor structures of four depression questionnaires: Beck, CES-D, Hamilton, and Zung. Journal of Clinical Psychology, 1, 123-146. Sirigatti, S., & Pancheri, P. (1995). L’adattamento italiano del MMPI-2. In S.R. Hathaway & J.C. McKinley, Minnesota Multiphasic Personality Inventory 2: Manual. Firenze: Organizzazioni Speciali. Spitzer, R.L., Williams, J.B.W., Gibbon, M., & First, M.B. (1990). User’s guide for the Structured Clinical Interview for DSM-III-R. Washington, DC: American Psychiatric Press. Steer, R.A., Ball, R., Ranieri, W.F., & Beck, A.T. (1997). Further evidence for the construct validity of the Beck Depression Inventory-II with psychiatric outpatients. Psychological Reports, 80, 443-446. Steer, R.A., Clark, D.A., Beck, A.T., & Ranieri, W.F. (1998). Common and speciÀc dimensions of self-reported anxiety and depression: the BDI-II versus the BDI-IA. Behaviour Research and Therapy, 37, 183-190. Steer, R.A., Ball, R., Ranieri, W.F., & Beck, A.T. (1999). Dimensions of the Beck Depression Inventory-II in clinically depressed outpatients. Journal of Clinical Psychology, 55, 117-128. Storch, E.A., Roberti, J.W., & Roth, D.A. (2004). Factor structure, concurrent validity, and internal consistency of the Beck Depression Inventory-Second Edition in a sample of college students. Depression & Anxiety, 19, 187-189.
198 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata
M. Balsamo e A. Saggino – Test per l’assessment della depressione nel contesto italiano: un’analisi critica
Stommel, M., Given, B.A., Given, C.W., Kalaian, H.A., Schulz, R., & McCorkle (1993). Gender bias in the measurement properties of the Center For Epidemiological Studies Depression Scale (CES-D). Psychiatry Research, 49, 239-250. Tanaka, J.S., & Huba, G.J. (1984). ConÀrmatory hierarchical factor analysis of psychological distress measures. Journal of Personality and Social Psychology, 46, 621-635. Tanaka-Matsumi, J., & Kaneoka, V.A. (1986). Relabilities and concurrent validities of popular self-report measures of depression, anxiety, and social desirability. Journal of Consulting and Clinical Psychology, 54, 328-333. Thurber, S., Snow, M., & Honts, C.R. (2002). The Zung Self-Rating Depression Scale: Convergent validity and diagnostic discrimination. Assessment, 4, 328-333. Vedana, L., Baiardi, P., Sommaruga, M., Galli, M., Neri, M., Pedretti, R.F., Tramarin, R., & Bertolotti G. (2001). Clinical validation of an anxiety and depression screening test for intensive in-hospital rehabilitation. Monaldi Arch Chest Dis, 56, 101-06. Weckowicz, T.E., Muir, W., & Cropley, A.J. (1967). A factor analysis of the Beck Inventory of Depression. Journal of Consulting Psychology, 31, 23-28. Whisman, M.A., Perez, J.E., & Ramel, W. (2000). Factor structure of the Beck Depression Inventory-Second Edition (BDI-II) in a student sample. Journal of Clinical Psychology, 56, 545-551. Wood, J.M., Garb, H.N., Lilienfeld, S.O., & Nezworski, M.T. (2002). Clinical assessment. Annual Review of Psychology, 53, 519-543. World Health Organization (1998). Well-being measures in primary healthcare/The Depcare project. Copenhagen: WHO Regional OfÀce for Europe. World Health Organization (1999). Press Release. World Health Report 1999 Making a difference. Geneva: WHO Regional OfÀce for Europe. Zimmerman, M. (1983). Self-report depression scales. Archives General of Psychiatry, 40, 1035-1042. Zung, W.W.K. (1965). A self-rating depression scale. Archives of General Psychiatry, 12, 63-70. Zung, W.W.K. (1972). A cross-cultural survey of depressive symptomatology in normal adults. Journal of Cross-Cultural Psychology, 2, 177-183.
Corrispondenza Michela Balsamo presso Laboratorio di Psicometria, Dipartimento di Scienze di Scienze Biomediche, Università degli Studi «G. d’Annunzio» di Chieti-Pescara Via dei Vestini 31 (Blocco A) 66013 Chieti (CH) Tel. 0871/3554202 e-mail:
[email protected];
[email protected]
199 © Edizioni Erickson – Copia concessa all’autore. Ogni riproduzione o distribuzione è vietata