¿Predecir la educación a partir del ADN?
"¿Son sólidas o débiles estas predicciones basadas en el ADN sobre el éxito académico de una persona??” Esta pregunta de Antonio Regalado, un reportero científico de MIT Technology ReviewEsto refleja lo confusos que pueden resultar los nuevos descubrimientos en genética de las ciencias sociales, incluso para los expertos.
En esta entrada de blog, queremos ayudar a aclarar esta pregunta: ¿Qué quieren decir los genetistas de ciencias sociales cuando afirman que el ADN puede "predecir" el nivel educativo y que esas predicciones son "fuertes" o "débiles"? Dada la historia de atrocidades perpetradas bajo la bandera de las ideologías eugenésicas, cualquier esfuerzo científico por vincular las diferencias de ADN con las desigualdades sociales entre las personas inevitablemente será, como mínimo, controvertido. Una comprensión clara de lo que mide el ADN puede (y no puede) predecir estadísticamente es esencial para fundamentar los debates sobre cómo se mide el ADN debo ser usado.
“Queremos ayudar a aclarar esta cuestión: ¿Qué queremos decir los genetistas de las ciencias sociales cuando afirmamos que el ADN puede 'predecir' el nivel educativo alcanzado, y que esas predicciones son 'fuertes' o 'débiles'?”
Dos nuevos artículos han reavivado el debate público sobre la predicción en la genética de las ciencias sociales. Esta semana, Daniel Benjamin y sus colegas del Consorcio de la Asociación de Genética de las Ciencias Sociales (SSGAC) Se publicó un análisis de los genomas de más de un millón de personas. que descubrieron más de mil variantes genéticas asociadas con el nivel educativo.
Uno de los productos de este gigantesco estudio es un algoritmo llamado puntaje poligénicoEste algoritmo se puede aplicar a los genomas de personas no incluidas en el estudio original para predecir su nivel educativo y, como Uno de nosotros lo demostró en un artículo publicado a principios de este mes., su éxito profesional y la acumulación de riqueza.
Las tres figuras a continuación ilustran las predicciones del ADN sobre los resultados del curso de la vida. Las figuras A y C, que provienen del estudio SSGAC, muestran el nivel educativo en una muestra llamada Estudio sobre salud y jubilación. La figura A es un diagrama de dispersión del nivel educativo de cada persona según su puntuación poligénica, mientras que la figura C es el porcentaje de personas que obtienen un título universitario según el quintil de la puntuación poligénica. La figura B ofrece otra forma de visualizar las asociaciones poligénicas con los resultados del curso de la vida. un diagrama de dispersión agrupadoEl resultado aquí es la riqueza, en lugar del nivel educativo alcanzado, representada gráficamente por separado para personas con estatus socioeconómico bajo, medio y alto durante la infancia.

Figura A. Figura proporcionada por la Asociación de Genética de Ciencias Sociales.
Consorcio para El Atlántico. Datos y análisis presentados en Lee et al., 2018,
Nature Genetics. Los datos provienen del Estudio de Salud y Jubilación.

Figura B. De Belsky et al., 2018, PNAS. Cada punto graficado refleja
Coordenadas x e y promedio para un grupo de 50 participantes. La regresión roja
Las líneas se trazan a partir de los datos brutos. Los diagramas de caja y bigotes en el
La parte inferior de los gráficos muestra la distribución de la educación poligénica
puntuación para cada categoría SES infantil. Los datos provienen de Salud y
Estudio sobre la jubilación.

Figura C. De Lee et al., 2018, Nature Genetics. Prevalencia media de
Finalización de estudios universitarios por quintil de puntuación poligénica. Los datos se presentan como media ± 95 %.
intervalo de confianza.
Las relaciones con el ADN parecen fortalecerse al pasar de la Figura A a la Figura C, pero la principal diferencia entre estas figuras no radica en la magnitud del efecto, sino en la cantidad de personas representadas por cada punto de datos en los gráficos. Los puntos de datos en la Figura A (los pequeños puntos grises) representan individuos individuales. Los puntos de datos en la Figura B (los grandes puntos azules) representan promedios de grupos de 50 personas. Y los puntos de datos en la Figura C representan promedios de grupos de aproximadamente 1000 personas (las barras azules) o aproximadamente 1700 personas (las barras amarillas).
Los datos genéticos descubiertos en el nuevo estudio sobre el nivel educativo son altamente predictivos de los resultados promedio en grandes grupos de personas, pero no muy predictivos de los resultados para un individuo en particular.
Este es un punto básico sobre estadística que a menudo se pasa por alto: para un efecto de cualquier tamaño, los modelos estadísticos predicen el promedio valor para la grupo de XNUMX de personas con mucha más certeza de la que predicen valor individual para cualquier uno persona. Todo se reduce a la relación señal/ruido.
“Esos sucesos únicos y fortuitos que podrían haber marcado tu vida no importaron en la de otra persona. A eso nos referimos con ruido estadístico.”
Al reflexionar sobre el rumbo de tu vida, a menudo puedes identificar eventos y circunstancias únicos y fortuitos que influyeron en tu situación actual. Pero la serendipia es precisamente eso: esos eventos únicos y fortuitos que pudieron haber marcado tu vida no tuvieron la misma importancia en la de otra persona. A esto nos referimos con ruido estadístico. En los promedios grupales, ese ruido se elimina, ya que es diferente para cada persona. Lo que queda es la señal: lo que tenemos en común. Los tres gráficos muestran la señal de ADN que predice el nivel educativo; la diferencia entre las figuras radica en la cantidad de ruido. La figura A muestra más ruido que la figura B, y la figura B muestra más que la figura C.
Entonces, ¿hasta qué punto estas diferencias de ADN son predictivas de los resultados en la vida? Depende de la pregunta.
A los investigadores les interesan los promedios. Queremos saber cómo surgen los patrones de diferencias educativas en la población. Para esa pregunta, estas diferencias de ADN son lo suficientemente predictivas como para ser útiles. (Piense en la Figura C). Sin embargo, los padres y educadores podrían querer hacer predicciones sobre un niño en particular, por ejemplo, para adaptar un currículo en una intervención de educación de precisión. Para esa pregunta, es probable que estas diferencias de ADN sean útiles. No Suficientemente predictivo. El ADN se equivocará con más frecuencia de la que nos gustaría. Piense en la Figura A: elija cualquier valor del puntaje poligénico, y los puntos —vidas humanas individuales— se dispersan a lo largo de todo el rango de logros educativos.
“Las puntuaciones poligénicas son herramientas útiles para los investigadores de ciencias sociales interesados en las tendencias promedio, pero las predicciones específicas sobre la vida de un individuo serán sumamente inciertas.”
Otro aspecto que debemos considerar al analizar las predicciones de ADN sobre el nivel educativo alcanzado es hasta qué punto el ADN capta información sobre el entorno social de las personas. Un artículo publicado en Ciencias: a principios de este año descubrieron que una puntuación poligénica calculada para el ADN parental que sus hijos No heredar aún predecía el nivel educativo de sus hijos. Como Uno de nosotros escribió en un comentario En ese estudio, las asociaciones de ADN con los resultados del curso de la vida "podrían operar a través de cualquier entorno físico o social tejido por el parentesco genético: una red realmente enmarañada".
Los debates públicos sobre el valor de las puntuaciones poligénicas oscilan entre una Aceptación inmediata de sus posibilidades para la predicción individual, como la educación personalizada, y un rechazo excesivamente pesimista de ellas como “casi inútilLa realidad es mucho más compleja. Son herramientas útiles para los investigadores de ciencias sociales interesados en las tendencias promedio, pero las predicciones específicas sobre la vida de un individuo serán sumamente inciertas. Para la predicción poligénica, la seguridad solo se encuentra en grandes cantidades.
4 comentarios
Los comentarios están cerrados.
Si son predictivos para grandes grupos, pero no para individuos, esto sugiere estratificación poblacional. Podría ser que detecten variantes genéticas comunes en un grupo cerrado (por ejemplo, personas blancas que solo se casan con personas de cierto estatus). Lo único que predicen es si eres genéticamente similar a ese grupo, de la misma manera que 23andMe podría identificarte como italiano según tus variaciones genéticas. Es probable que los genes no tengan ninguna relación causal con el "nivel educativo", lo cual es una idea bastante absurda.
La puntuación poligénica para la educación predice diferencias en los resultados educativos de los hermanos (y también diferencias en el éxito profesional y la riqueza). Por lo tanto, claramente captura algo más allá de lo que los genetistas llaman estratificación poblacional. Es una buena pregunta cómo las diferencias de ADN llegan a predecir los resultados educativos de los niños. Obviamente, no hay una conexión directa. Pero hay muchas vías a través de las cuales las diferencias genéticas entre las personas podrían conducir a diferencias en la estructura y función cerebral, y en el comportamiento que, en última instancia, contribuyen al éxito escolar. Puedes consultar mi otro BOLD Publicaremos una entrada en el blog para hablar sobre este tema. Manténganse atentos para más información al respecto.
Decir que se observa un efecto muy atenuado entre hermanos no niega la estratificación poblacional. Esto queda claro, por ejemplo, si se diseñan puntuaciones con un componente de ascendencia, como es el caso del colorismo. Se pueden validar erróneamente las puntuaciones observando a los hermanos y tomar eso como afirmaciones causales sobre ciertos SNP. Lo mismo ocurre con la estatura y otras características similares. Por lo tanto, la variación dentro de la familia puede verse afectada por la estratificación social. Cabe añadir que el trato diferencial por parte de otros miembros de la familia, como los abuelos, y la propia autoidentificación de los sujetos pueden afectar a los comportamientos. Esta es la misma crítica que se aplica a los estudios de gemelos: las parejas no difieren solo en la mitad de su material genético (en este caso, la puntuación poligénica relacionada con el rasgo objetivo), sino también en todo un conjunto de tratamientos ambientales.
¿Cuál es tu puntuación? Tiene componentes antropométricos residuales relacionados con la ascendencia que generan un trato diferencial tanto dentro de la familia por parte de sus miembros (padres, abuelos) a través de la homofilia y otras dinámicas, como fuera de ella en entornos que mejoran la capacidad cognitiva, como las escuelas. Esto se ha documentado para la estatura y el colorismo. Por lo tanto, el diseño familiar no aísla de la estratificación social.
Otro factor que complica el diseño familiar.