I dati statistici sono una sintesi di alcuni aspetti della realtà e influenzano le decisioni sui fenomeni sociali, aziendali, finanziari, sanitari (…) La realtà non è contraddittoria, ma le conclusioni che decidiamo di trarre dai dati possono esserlo. Il Paradosso di Simpson (legato al nome di Edward Simpson, che nel 1951 – come già altri prima di lui – lo descrisse) riguarda l’apparire di contraddizioni tra l’analisi di dati aggregati e dati disaggregati. Lo presentiamo attraverso due esempi, uno di carattere sociale, l’altro medico.
Discriminazione a Berkeley
Nel 1973 l’Università di Berkeley fu uno dei primi atenei a essere denunciato per discriminazione di genere (¹). Per l’ammissione al semestre autunnale di quell’anno furono esaminate 12.763 domande di iscrizione (8.442 di ragazzi e 4.321 di ragazze) e le ammissioni, suddivise per genere, furono quelle riportate nella tabella seguente:
Dal punto di vista dell’università fu a quel punto naturale disaggregare i dati per capire quali dipartimenti avevano contribuito a questa discrepanza. Quelli che seguono sono i dati dei sei principali major (²).
Qui la differenza di genere è ancora più marcata: risultano globalmente ammessi circa il 45% dei maschi e il 30% delle femmine. Eppure in quattro major la percentuale di ragazze ammesse è maggiore, mentre nei rimanenti due il vantaggio dei maschi è contenuto. In altre parole, il dato complessivo dei sei major mostra una discriminazione verso le femmine, mentre nel dato disaggregato non appare alcuna discriminazione o addirittura si può pensare a una discriminazione contro i maschi.
La spiegazione sta nel fatto che i dati precedenti non tengono conto delle scelte dei major da parte delle candidate/dei candidati. Le ragazze tendevano a iscriversi ai major più selettivi, nei quali la percentuale di ammissioni era inferiore, mentre i maschi si iscrivevano spesso a major in cui era più facile essere ammessi.
Calcoli renali
Anche il secondo esempio descrive dati reali (³). Due cure (X e Y) per il trattamento dei calcoli renali sono state sperimentate su due gruppi di 350 pazienti, con il risultato che la percentuale di successi è stata del 78% per la cura X e dell’83% per la cura Y. Se però si separano i risultati rispetto alla gravità della malattia, la conclusione cambia: si scopre che per i casi gravi la percentuale di successi è stata del 73% per la cura X e del 69% per la cura Y; mentre per i casi non gravi la percentuale di successi è stata del 93% per la cura X e dell’87% per la cura Y.
In altre parole, i pazienti sono stati suddivisi in due gruppi (calcoli piccoli e calcoli grandi); per ciascuno dei due gruppi sembra migliore la cura X, ma se non suddividiamo i pazienti allora, nel gruppo complessivo, sembra migliore la cura Y.
Per capire cosa è successo controlliamo innanzitutto i numeri.
Vai al PDF per l’INTERO articolo
Giancarlo Travaglini(Dipartimento di Matematica e Applicazioni, Università degli Studi di Milano-Bicocca)Note:(1)
Int’l Bhd. of Teamsters v. United States, 431 U.S. 324, 339 (1973); P. J. Bickel, E. A. Hammel, J. W. O’Connell (1975). Sex bias in graduate admissions: Data from Berkeley. Science, 187(4175), 398—404; D. Freedman, R. Pisani, R. Purves (2007), Statistics, W. W. Norton.
(2) Insieme a una formazione di base gli studenti devono scegliere una materia principale (major): Ingegneria, Storia, Psicologia, … L’università non ha fatto sapere chi è A, chi è B, etc.
(3) C. R. Charig; D. R. Webb; S. R. Payne; J. E. Wickham (1986), Comparison of treatment of renal calculi by open surgery, percutaneous nephrolithotomy, and extracorporeal shockwave lithotripsy, Br. Med. J. (Clin. Res. Ed.). 292 (6524): 879–882.