Alicia R Martin1, Christopher R Gignoux1, Raymond K Walters2, Genevieve L Wojcik1, Benjamin M Neale2, Simon Gravel, Mark J Daly2, Carlos D Bustamante1, Eimear E Kenny4
1 Stanford University, EUA
2 Broad Institute of Harvard and MIT, EUA
3 McGill University, Canada
4 Icahn School of Medicine at Mount Sinai, EUA
[tabby title=»Español»]
Los estudios genéticos se han centrado mayoritariamente en participantes de ascendencia europea. Un estudio realizado en 2009 estimó que sorprendentemente el 96% de los participantes en estudios de asociación de genoma completo (GWAS por sus siglas en inglés) eran de ascendencia europea. Un estudio más reciente del año pasado, estima que los estudios genéticos han avanzado gradualmente hacia un aumento de la diversidad, el 80% de los participantes en el GWAS son europeos, mientras que el resto son en su mayoría de Asia oriental y no representan colectivamente un conjunto de participantes globalmente diverso. Una cuestión que queda por aclarar es si los resultados de una enfermedad en una población son aplicables a otra población. Nuestro estudio estuvo divido en dos partes: una investigación sobre el pasado, centrándose en la variación genética dentro y entre poblaciones, y un análisis de hasta qué punto los estudios genéticos de una enfermedad en una población europea homogénea son transferibles a otras poblaciones.
En la primera parte de nuestro estudio, estudiamos la variación genética dentro y entre las poblaciones para aprender cómo las poblaciones emigran, se mezclan, crecen y se reducen para dar como resultado la diversidad genética que hoy vemos en todo el mundo. Utilizamos datos del ¨Proyecto 1.000 Genomas¨, un amplio recurso público de datos genéticos de 2.504 personas de 26 poblaciones distintas del mundo. Nos enfocamos en poblaciones de las Américas, incluyendo, por ejemplo, afroamericanos e hispanos/latinos, porque la historia de su poblaciones está bien establecida y por su insuficiente representación en estudios genéticos. Sus genomas son un mosaico de ascendencias continentales, con fragmentos de ADN procedentes de europeos, nativos americanos y africanos. Demostramos que es fácil detectar qué fragmentos de ADN provienen de cada continente. Nos centramos en los fragmentos de un mismo continente para aprender sobre sus antepasados y cómo se mezclaron para crear las poblaciones que vemos hoy. Por ejemplo, cuando examinamos los fragmentos europeos de poblaciones hispanas/latinas, demostramos que se parecían más a los genomas de los europeos del sur, como los españoles. En contraste, los fragmentos europeos de genomas afroamericanos contenían más de una mezcla, con más ascendencia europea proveniente de los europeos del norte, como los británicos.
En la segunda parte de nuestro estudio, preguntamos hasta qué punto los estudios genéticos de una enfermedad en una población se pueden transferir a otra. Nuestro enfoque fue ver con qué precisión podíamos predecir enfermedades y rasgos en las poblaciones utilizando datos de estudios genéticos anteriores. La mayoría de los estudios de enfermedades han demostrado que son en parte genéticas (es decir, heredadas de nuestros padres) y parcialmente ambientales (por ejemplo, derivadas de los alimentos que comemos). Para crear una «puntuación» genética para una enfermedad dada, tuvimos en cuenta los pequeños efectos genéticos en todo el genoma. Cuando examinamos algunos rasgos que han sido bien estudiados con datos genéticos de poblaciones europeas, incluyendo la estatura y la diabetes tipo 2, aprendimos que no eran muy buenos en la predicción de rasgos entre las poblaciones. Por ejemplo, predecían que los africanos del oeste eran considerablemente más bajos que poblaciones europeas, a pesar de que hay estudios que demuestran lo contrario. El orden relativo del riesgo poblacional previsto para la diabetes tipo 2 también dependía de la diversidad genética de la población estudiada. Estos resultados indicaron que la transferencia de estudios genéticos en europeos a otras poblaciones estaba limitada.
Nos centramos en este problema para tratar de averiguar por qué había una discrepancia de predicción. Establecimos simulaciones para preguntarnos con qué exactitud podríamos predecir el verdadero riesgo de enfermedad en africanos, asiáticos y europeos si supiéramos la combinación exacta de variantes que causaron una enfermedad con un diseño de estudio europeo. Hemos aprendido que para muchos rasgos, la exactitud de la predicción siempre es más alta en la población del estudio (es decir, los europeos). Para un rasgo determinado, la magnitud del riesgo previsto no es predecible, y a menudo no en la misma escala que el verdadero riesgo. Esto tiene importantes implicaciones para los futuros estudios genéticos: como genetistas, tenemos que trabajar duro para incrementar la diversidad de los participantes del estudio. Si la genética se incluye en la práctica clínica para la mayoría de las enfermedades conocidas hoy en día, sería más útil para los pacientes de ascendencia europea. Actualmente estamos trabajando en métodos estadísticos para mejorar la exactitud de la predicción y hacer que las predicciones de riesgo de enfermedad sean más transferibles entre las poblaciones.
Referencia: Martin AR, et al. Human Demographic History Impacts Genetic Risk Prediction across Diverse Populations. Am J Hum Genet. 2017. Doi: http://dx.doi.org/10.1016/j.ajhg.2017.03.004
[tabby title=»English»]
Human Demographic History Impacts Genetic Risk Prediction
Genetic studies have been heavily biased towards European descent participants. A study in 2009 estimated that an astonishing 96% of participants in genome-wide association studies (GWAS) were of European descent. A more recent study last year estimates that genetic studies have made some incremental progress towards increased diversity—while 80% of participants in GWAS are European, the remainder are mostly East Asian and do not collectively represent a globally diverse set of participants. A long-standing question has been how transferable disease findings from one population are to another population. Our study had two main parts: an investigation into the past using genetic variation within and between populations, and an analysis of how transferable genetic studies of disease are when they are derived from a homogeneous European population.
In the first part of our study, we looked at genetic variation within and between populations to learn about how people migrate, mix, and grow/shrink to make the genetic diversity we see across the globe today. We used data from the 1000 Genomes Project, a large and diverse public resource of genetic data from 2,504 individuals across 26 global populations. We focused on populations from the Americas, including e.g. African Americans and Hispanic/Latinos, because of their well-established population histories and underrepresentation in genetic studies. Their genomes are a mosaic of continental ancestries, with stretches of DNA arising from European, Native American, and African ancestors. We showed that it is straightforward to detect which ancestry tracts (i.e. stretches of DNA) arise from which continent. We looked at these tracts one continent at a time to learn about their ancestors that mixed to create populations that we see today. For example, when we looked at the European tracts from Hispanic/Latino populations, we showed that they most closely resembled the genomes of southern Europeans, such as the Spanish. In contrast, the European tracts from African American genomes contained more of a mix, with more of their European ancestry coming from northern Europeans, such as the British.
In the second part of our study, we asked how well genetic studies of disease transfer from one population to another. Our approach was to see how accurately we could predict diseases and traits across populations using summary data from previous genetic studies. Most disease studies have shown that they are partly genetic (i.e. from your parents) and partly environmental (e.g. the food you eat). To form a genetic “score” for a given disease, we summed up small genetic effects across the whole genome. When we looked at a few traits that have been well-studied with genetic data from European populations, including height and Type II diabetes, we learned that we were not doing a very good job predicting traits across populations. For example, we predicted that West Africans were considerably shorter than European populations, despite observational studies to the contrary. The relative order of predicted population risk for type 2 diabetes was also dependent on the genetic diversity of the study population. These results indicated that we were doing a poor job transferring genetic studies in Europeans to other populations.
We dove deeper into this problem to try to figure out why there was a prediction discrepancy. We set up simulations to ask how accurately we should be able to predict the true risk for disease in Africans, Asians, and Europeans if we knew the exact combination of variants that caused a disease with a European study design. We learned that across many traits, the prediction accuracy is always highest in the study population (i.e. Europeans). For any given trait, the relative order of predicted risk is unpredictable, and often not in the same order as the true risk. This has major implications for future genetic studies: as geneticists, we need to work hard to increase the diversity of study participants. If genetics were standardly used in clinical practice for most well-studied diseases today, they would be most useful for European descent patients. We are currently working on statistical methods to improve prediction accuracy and make disease risk predictions more transferable across populations.
Referencia: Martin AR, et al. Human Demographic History Impacts Genetic Risk Prediction across Diverse Populations. Am J Hum Genet. 2017. Doi: http://dx.doi.org/10.1016/j.ajhg.2017.03.004
[tabbyending]