Primera secuencia completa de un genoma humano

Amparo Tolosa, Genotipia

 

El Consorcio T2T (Telomere-to-Telomer) ha completado por primera vez, la secuenciación total de un genoma humano. Los investigadores han obtenido la secuencia de ADN de todos los cromosomas sin dejar ningún hueco en regiones repetitivas o difíciles de resolver, proporcionando información de gran interés sobre su estructura y contribución a la variación genética humana. Los resultados se publican en Science.

Hace veintiún años la publicación del primer borrador del genoma humano supuso el mayor logro biotecnológico del momento y abrió un mundo de posibilidades para la biomedicina. No obstante, ciertas regiones de algunos cromosomas no pudieron ser secuenciadas de forma precisa, debido en gran medida a su complejidad, inabordable con las técnicas disponibles en ese momento.

Pese a las sucesivas actualizaciones y mejoras en la secuencia del genoma humano de referencia, que se utiliza como plano comparativo para los estudios genómicos, las regiones incompletas han permanecido sin resolverse. Así, la versión más actual, GRCh38.p13, cubre alrededor de un 92% del genoma, suficiente para tener una imagen aproximada y para impulsar miles de investigaciones sobre el pasado de nuestra especie o el impacto de los genes en la salud humana, pero, en definitiva, incompleta. En total, más de 150 millones de pares de bases seguían siendo desconocidas.

En 2019, Karen Miga, investigadora en la Universidad de California Santa Cruz y Adam Phillippy, del Instituto Nacional de Investigación del Genoma Humano (NHGRI) en EE. UU., crearon el consorcio T2T (“De telómero a telómero” por sus siglas en inglés) en el que participan más de 100 investigadores de 32 instituciones diferentes, con el objetivo de completar el puzle del genoma humano y rellenar los huecos existentes en la secuencia de referencia. La construcción, validación y análisis inicial del primer genoma humano completo, se publicaron como preprint en 2021. Ahora, una serie de artículos, publicados en Science, revelan en detalle sus resultados, que abren un camino hacia conocer mejor la función y potencial del genoma humano.

“Generar una secuencia del genoma humano verdaderamente completa representa un increíble logro científico que proporciona la primera vista detallada de nuestro mapa de ADN”, ha señalado Eric Green, director del NHGRI. “Esta información fundamental reforzará los muchos esfuerzos en marcha para entender todos los matices del genoma humano, lo que a su vez potenciará los estudios genéticos sobre las enfermedades humanas”.

secuencia genoma humano
Los investigadores del Consorcio T2T han obtenido la secuencia de ADN de todos los cromosomas sin dejar ningún hueco en regiones repetitivas o difíciles de resolver. Imagen: Ernesto del Aguila III, NHGRI.

Últimas tecnologías de secuenciación para completar un genoma humano

Las regiones desconocidas o pendientes de resolver en el genoma de referencia GRCh38.p13  incluyen secuencias con duplicaciones o muchas repeticiones, como las correspondientes a los genes ribosómicos, o los centrómeros y telómeros de los cromosomas.

Estas regiones son difíciles de secuenciar utilizando las tecnologías de secuenciación masiva que fueron determinantes para la secuenciación del primer borrador del genoma humano, por lo que los investigadores han utilizado las herramientas de secuenciación de generación más reciente, aquellas que producen lecturas de secuencias más largas y por lo tanto ofrecen mejor capacidad para resolver secuencias repetitivas. Concretamente, los equipos han combinado las tecnologías de Oxford Nanopore y PacBio.

“Utilizando los métodos de lecturas largas hemos hecho descubrimientos para nuestra comprensión de las partes más difíciles del genoma humano, ricas en repeticiones”, ha señalado Karen Miga, codirectora del consorcio T2T, cuyas investigaciones están financiadas por el NHGRI. “Esta secuencia del genoma completo ha proporcionado ya nuevo conocimiento sobre la biología del genoma y ya estoy esperando a la nueva década de descubrimientos sobre estas regiones”.

Además, los investigadores han recurrido a otra aproximación que ha simplificado notablemente la secuenciación. Han utilizado una línea celular, CHM13, derivada de una complicación gestacional poco frecuente que se conoce como mola hidatiforme. La característica principal de estas células es que, al derivar de la fecundación de un óvulo sin núcleo, con posterior duplicación del genoma del espermatozoide, en esencia, son haploides y tienen la información de un único genoma. Esto implica que cuando se analiza su ADN no es necesario identificar a qué cromosoma de un par pertenece cada secuencia, como ocurre en las células diploides de cada persona, que tienen cromosomas paternos y maternos.

Nuevos genes y avances en el estudio de la variación humana

El primer genoma completo, denominado T2T-CHM13, desbloquea cerca de 200 millones de pares de bases, para su análisis en estudios funcionales o de variación genética. En las nuevas regiones resultantes se incluyen predicciones de 1956 genes, 99 de ellos codificantes.

En los artículos que acompañan al trabajo central, investigadores del consorcio T2T describen los patrones epigenéticos identificados en el genoma completo, así como el análisis de grandes duplicaciones y su variación en el genoma. Estos estudios ofrecen las primeras evidencias del potencial de T2T-CHM13 para conocer el funcionamiento del genoma y mejorar el análisis de la variación genética humana. Y solo son la punta del iceberg.

Por ejemplo, T2T-CHM13 ofrece, por primera vez, la posibilidad de analizar en detalle las regiones cercanas a los centrómeros, estructuras de los cromosomas que coordinan su correcta separación durante la división celular. Los primeros análisis apuntan a una fuerte relación entre la posición del centrómero en el cromosoma y la evolución del ADN que lo rodea. Además, al comparar con genomas disponibles de diferentes poblaciones, los investigadores han encontrado que existe gran variación genética en estas regiones.

“Los centrómeros juegan un papel crítico en cómo los cromosomas se segregan apropiadamente durante la división celular, y, aunque hemos sabido durante algún tiempo que están alterados en todo tipo de enfermedades humanas, nunca hemos sido capaces de estudiarlos a nivel de secuencia”, señala Karen Miga, directora del trabajo. “De lejos, la mayor porción de nuevas secuencias que se han añadido a la de referencia son de ADN satélite centromérico. Por primera vez podemos estudiar base a base las secuencias que definen el centrómero y podemos empezar a entender cómo funciona”.

En otro trabajo, Sergey Aganezov y colaboradores de la Universidad Johns Hopkins, muestran que la nueva versión del genoma mejora algunas regiones ya presentes en los genomas previos. Su análisis de 3200 genomas utilizando como referencia T2T-CHM13 señala que el genoma completo detecta miles de variaciones genéticas que no capturaba GRCh38.p13 y mejora el análisis de más de 200 genes de relevancia médica.

Por su parte, el equipo de Evan Eichler, de la Universidad de Washington en Seattle ha analizado las duplicaciones de grandes fragmentos repetitivos del genoma y ha encontrado que la mayor parte de los nuevos genes codificantes de proteínas detectados en T2-CHM13 se localizan en estas regiones. Al comparar el nuevo genoma humano completo con los genomas completos de otros primates, el equipo también ha descubierto que en las duplicaciones de regiones del genoma que se han producido de forma específica en humanos se localizan genes implicados la formación de nuevas neuronas. Además, algunas de estas regiones muestran una variabilidad inesperada en la especie humana.

En resumen, la secuenciación del primer genoma completo ya está revelando características del genoma desconocidas hasta el momento, implicadas en aspectos tan relevantes como la correcta división celular o el desarrollo cerebral. Estos primeros resultados apuntan a que las nuevas regiones del genoma serán importantes para la genética aplicada a la salud.

Siguiente paso: capturar toda la variación genética humana

La secuencia de T2T-CHM13, primer genoma humano completo, junto con la secuencia de un cromosoma Y obtenida por el consorcio T2T en otra línea celular, estarán disponibles en el conocido portal de referencia UCSC Genome Browser. Además, los investigadores planean añadir otros genomas. “La siguiente fase es pensar en la referencia del genoma de la humanidad, no cómo una única secuencia del genoma”, indica David Haussler, director del Institudo de Genómica de la Universidad de California Santa Cruz. “Se trata de una profunda transición, el inicio de una nueva era en la que eventualmente capturaremos la diversidad humana de forma no sesgada”.

El genoma de referencia actual GRCh30, fue construido a partir del genoma de varias personas, pero no refleja la diversidad genética que puede existir entre individuos. Es decir, no refleja la variación genética completa. Culminada su secuenciación de un genoma completo, el siguiente reto del consorcio T2T es obtener un genoma de referencia humano que represente toda la variación genética que existe en la especie humana. Para ello, el consorcio se ha unido al Consorcio del Pangenoma Humano de Referencia, que pretende elaborar un genoma basado en las secuencias completas de 350 personas.

“Hemos terminado UN genoma”, ha señalado Evan Eichler. “Habrá cientos, posiblemente miles de genomas en los próximos años. Creo que nuestra visión de cómo difieren los humanos entre sí va a verse transformada, igual que cómo la variación genética más compleja es importante no solo para hacernos humanos, sino para hacernos diferentes”.

Referencias:

Nurk et al. The complete sequence of a human genome. Science (2022)  376. Doi: http://dx.doi.org/10.1126/science.abj6987

Gershman et al. Epigenetic patterns in a complete human genome. Science (2022) 376. Doi: http://dx.doi.org/10.1126/science.abj5089

Vollger et al. Segmental duplications and their variation in a complete human genome. Science 376 (2022). Doi: http://dx.doi.org/10.1126/science.abj6965

Hoyt et al. From telomere to telomere: The transcriptional and epigenetic state of human repeat elements. Science (2022) 376. Doi: http://dx.doi.org/10.1126/science.abk3112

Aganezov et al. A complete reference genome improves analysis of human genetic variation. Science (2022) 376. Doi: http://dx.doi.org/10.1126/science.abl3533

Altemose et al. Complete genomic and epigenetic maps of human centromeres. Science (2022) 376. Doi: http://dx.doi.org/10.1126/science.abl4178

Fuentes:

Researchers generate the first complete, gapless sequence of a human genome. https://www.genome.gov/news/news-release/researchers-generate-the-first-complete-gapless-sequence-of-a-human-genome

Some elusive genome areas hold distinctly human data. https://newsroom.uw.edu/news/some-hard-crack-genome-areas-hold-distinctly-human-data

First complete, gapless sequence of a human genome reveals hidden regions. https://news.ucsc.edu/2022/03/t2t-genome.html

 

 

Si te ha gustado esta noticia y quieres aprender más sobre Genética en Medicina, te interesan nuestros cursos, como el de “Pruebas genéticas: explorando el potencial del ADN”, y formación universitaria, así como nuestro canal audiovisual, Genotipia TV.

Abrir chat