Prevedere il livello di istruzione a partire dal DNA?
"Queste previsioni basate sul DNA riguardo al successo scolastico di una persona sono affidabili o deboli??" Questa domanda di Antonio Regalado, un giornalista scientifico di MIT Technology Review, illustra quanto possano essere sconcertanti le nuove scoperte nel campo della genetica delle scienze sociali, persino per gli esperti.
In questo post del blog, vogliamo contribuire a chiarire questa domanda: cosa intendono i genetisti delle scienze sociali quando dicono che il DNA può "prevedere" il livello di istruzione e che queste previsioni sono "forti" o "deboli"? Data la storia di atrocità perpetrate sotto la bandiera delle ideologie eugenetiche, qualsiasi sforzo scientifico per collegare le differenze del DNA alle disuguaglianze sociali tra le persone è destinato a essere, per usare un eufemismo, controverso. Una chiara comprensione di cosa misura il DNA può (e non può) prevedere statisticamente è essenziale per fondare i dibattiti su come il DNA misura dovrebbero essere usato.
«Vogliamo contribuire a chiarire questo quesito: cosa intendono i genetisti delle scienze sociali quando affermano che il DNA può "prevedere" il livello di istruzione raggiunto e che tali previsioni sono "forti" o "deboli"?»
Due nuovi articoli hanno riacceso il dibattito pubblico sulla previsione nella genetica delle scienze sociali. Questa settimana, Daniel Benjamin e i suoi colleghi del Social Science Genetics Association Consortium (SSGAC) hanno riportato un'analisi dei genomi di oltre 1 milione di persone che ha portato alla luce più di mille varianti genetiche associate al livello di istruzione.
Uno dei prodotti di questo gigantesco studio è un algoritmo chiamato punteggio poligenico. Questo algoritmo può essere applicato ai genomi di persone non incluse nello studio originale per prevedere il loro livello di istruzione e, come uno di noi ha mostrato in un articolo pubblicato all'inizio di questo meseil loro successo professionale e l'accumulo di ricchezza.
Le tre figure seguenti illustrano tutte le previsioni del DNA sugli esiti del corso di vita. Le figure A e C, che provengono dallo studio SSGAC, mostrano il livello di istruzione raggiunto in un campione chiamato Studio sulla salute e il pensionamento. La Figura A è un diagramma a dispersione del livello di istruzione raggiunto da ciascuna persona in base al suo punteggio poligienico, mentre la Figura C mostra la percentuale di persone che hanno conseguito una laurea universitaria per quintile di punteggio poligienico. La Figura B offre un ulteriore modo di visualizzare le associazioni poligieniche con gli esiti del percorso di vita. un diagramma a dispersione suddiviso in intervalliIl risultato in questo caso è la ricchezza, piuttosto che il livello di istruzione, rappresentata graficamente separatamente per le persone provenienti da contesti socioeconomici infantili bassi, medi e alti.

Figura A. Immagine fornita dalla Social Science Genetic Association
Consorzio per The Atlantic. Dati e analisi riportati in Lee et al., 2018,
Nature Genetics. I dati provengono dallo studio Health and Retirement Study.

Figura B. Da Belsky et al., 2018, PNAS. Ogni punto tracciato riflette
coordinate x e y medie per un gruppo di 50 partecipanti. La regressione in rosso
Le linee vengono tracciate dai dati grezzi. I diagrammi a scatola e baffi al
la parte inferiore dei grafici mostra la distribuzione dell'istruzione poligenica
punteggio per ogni categoria SES infantile. I dati provengono da Health and
Studio sulla pensione.

Figura C. Da Lee et al., 2018, Nature Genetics. Prevalenza media di
Completamento degli studi universitari per quintile di punteggio poligienico. I dati sono espressi come media ± 95%.
intervallo di confidenza.
Le correlazioni con il DNA sembrano intensificarsi passando dalla Figura A alla Figura C, ma la differenza principale tra queste figure non risiede nell'entità dell'effetto, bensì nel numero di persone rappresentate da ciascun punto dati nei grafici. I punti dati nella Figura A (i piccoli punti grigi) rappresentano singoli individui. I punti dati nella Figura B (i grandi punti blu) rappresentano le medie di gruppi di 50 persone. Infine, i punti dati nella Figura C rappresentano le medie di gruppi di circa 1000 persone (le barre blu) o circa 1700 persone (le barre gialle).
I fattori genetici scoperti nel nuovo studio sul livello di istruzione sono altamente predittivi dei risultati medi in ampi gruppi di persone, ma non altrettanto predittivi dei risultati per il singolo individuo.
Questo è un punto fondamentale sulla statistica che spesso viene dimenticato: per un effetto di qualsiasi dimensione, i modelli statistici prevedono l' media APPREZZIAMO per di gruppo di persone con molta più certezza di quanto prevedano il valore individuale per qualsiasi prima persona. Tutto si riduce al rapporto segnale-rumore.
«Quegli eventi unici e fortuiti che potrebbero aver influenzato la tua vita non hanno avuto alcuna importanza per qualcun altro. Questo è ciò che intendiamo per rumore statistico.»
Quando rifletti sul percorso della tua vita, spesso puoi individuare alcuni eventi e circostanze unici e fortuiti che hanno contribuito a portarti dove sei ora. Ma la serendipità è proprio questo: quegli eventi unici e fortuiti che potrebbero aver influenzato la tua vita potrebbero non aver avuto lo stesso impatto su quella di qualcun altro. Questo è ciò che intendiamo per rumore statistico. Nelle medie di gruppo, questo rumore viene annullato, perché è diverso per ogni persona. Ciò che rimane è il segnale, ciò che abbiamo in comune. Tutti e tre i grafici mostrano il segnale del DNA che predice il livello di istruzione raggiunto; la differenza tra le figure sta nella quantità di rumore. La Figura A mostra più rumore della Figura B, e la Figura B ne mostra più della Figura C.
Quindi, quanto sono predittive queste differenze del DNA sugli esiti della vita? Dipende dalla domanda.
I ricercatori sono interessati alle medie. Vogliamo sapere come si formano i modelli di differenze educative nella popolazione. Per questa domanda, queste differenze del DNA sono sufficientemente predittive da essere utili. (Si pensi alla Figura C). Tuttavia, genitori ed educatori potrebbero voler fare previsioni su un singolo bambino, ad esempio per personalizzare un curriculum in un intervento di educazione di precisione. Per questa domanda, queste differenze del DNA sono probabilmente non è un Abbastanza predittivo. Il DNA sbaglierà più spesso di quanto ci sentiremmo a nostro agio ad accettare. Pensate alla Figura A: scegliete un qualsiasi valore del punteggio poligienico e i punti – le singole vite umane – saranno sparsi lungo tutta la gamma del livello di istruzione.
"I punteggi poligienici sono strumenti utili per i ricercatori delle scienze sociali interessati alle tendenze medie, ma le previsioni specifiche sulla vita di un singolo individuo saranno estremamente incerte."
Un altro aspetto da considerare quando si interpretano le previsioni del DNA sul livello di istruzione raggiunto è la misura in cui il DNA cattura informazioni sull'ambiente sociale delle persone. Un articolo pubblicato in Scienze all'inizio di quest'anno hanno scoperto che un punteggio poligenico calcolato per il DNA dei genitori che i loro figli hanno fatto non è un ereditare prevedeva ancora il rendimento scolastico dei loro figli. uno di noi ha scritto in un commento Secondo quello studio, le associazioni del DNA con gli esiti del percorso di vita "potrebbero operare attraverso qualsiasi ambiente fisico o sociale intessuto da legami di parentela genetica: una rete davvero intricata".
I dibattiti pubblici sul valore dei punteggi poligienici oscillano tra un pronta accettazione delle loro possibilità di previsione individuale, come l'istruzione personalizzata, e un rifiuto eccessivamente pessimistico di essi come "quasi inutileLa realtà è molto più complessa. Sono strumenti utili per i ricercatori delle scienze sociali interessati alle tendenze medie, ma le previsioni specifiche sulla vita di un singolo individuo saranno estremamente incerte. Per la previsione poligenica, la sicurezza si trova solo nei numeri (elevati).
4 commenti
I commenti sono chiusi.
Se questi geni sono predittivi per grandi gruppi, ma non per i singoli individui, ciò suggerisce una stratificazione della popolazione. Potrebbe darsi che stiano individuando varianti genetiche comuni in un gruppo isolato (ad esempio, persone bianche che sposano solo individui di un certo status sociale). In pratica, predicono solo se si è geneticamente simili a quel gruppo, nello stesso modo in cui un test genetico come 23andMe potrebbe classificare una persona come italiana in base alle sue varianti genetiche. Probabilmente i geni non hanno alcuna relazione causale con il "livello di istruzione", che di per sé è un concetto piuttosto assurdo.
Il punteggio poligienico per l'istruzione predice le differenze nei risultati scolastici dei fratelli (e anche le differenze nel successo professionale e nella ricchezza). Quindi cattura chiaramente qualcosa che va oltre ciò che i genetisti chiamano stratificazione della popolazione. È una domanda legittima capire come le differenze del DNA arrivino a predire i risultati scolastici dei bambini. Ovviamente non c'è una connessione diretta. Ma ci sono molti percorsi attraverso i quali le differenze genetiche tra le persone potrebbero portare a differenze nella struttura e nella funzione del cervello e nel comportamento che in definitiva contribuiscono al successo scolastico. Puoi dare un'occhiata agli altri miei BOLD Questo post sul blog sarà dedicato alla discussione di questo argomento. Restate sintonizzati per ulteriori aggiornamenti.
Affermare che si osserva un effetto molto attenuato tra fratelli non nega la stratificazione della popolazione. Ciò è evidente, ad esempio, se si elabora un punteggio con una componente di ascendenza, come nel caso del colorismo. Si potrebbe erroneamente convalidare il punteggio esaminando i fratelli e interpretarlo come una prova causale relativa ad alcuni SNP. Lo stesso vale per l'altezza e altre caratteristiche simili. La variazione all'interno della famiglia può quindi essere influenzata dalla stratificazione sociale. Va aggiunto che un trattamento differenziato da parte di altri membri della famiglia, come i nonni, e l'autoidentificazione dei soggetti stessi possono influenzare i comportamenti. Questa è la stessa critica che si applica agli studi sui gemelli: le coppie non differiscono solo per metà del loro materiale genetico (in questo caso il punteggio poligienico relativo al tratto bersaglio), ma anche per l'intero insieme di condizioni ambientali.
Il tuo punteggio ha componenti antropometriche residue legate all'ascendenza che provocano un trattamento differenziato sia all'interno della famiglia, attraverso un trattamento differenziato da parte dei membri della famiglia (genitori; nonni) tramite omofilia e altre dinamiche, sia all'esterno in contesti che potenziano le capacità cognitive come le scuole. Questo è stato documentato per l'altezza e il colorismo. La struttura familiare non isola quindi dalla stratificazione sociale.
Un altro fattore di complicazione per la progettazione familiare.