Se lanza la primera base de datos crowdsourcing de la variabilidad genética española

María Peña Chilet

Doctora en Biotecnología y Biomedicina.Fundación Progreso y Salud (FPS), Hospital Virgen del Rocío; Instituto de Biomedicina de Sevilla (IBIS); Centro de Investigación Biomédica en Red de Enfermedades Raras (CIBERER)

 

variabilidad genética española
Conocer la variabilidad genética local facilita el descubrimiento de nuevas variantes genéticas relacionadas con enfermedades y favorece la medicina personalizada. Imagen: Rubén Megía, Genotipia.

El conocimiento de la variabilidad genética local es de gran importancia en la medicina personalizada, ya que permite un análisis más preciso, siendo un factor crítico para el descubrimiento de nuevas variantes genéticas de enfermedad. Una de las estrategias que se siguen para buscar nuevos genes responsables de enfermedades es fijarse en la frecuencia poblacional de las variantes de un gen, de modo que si es responsable de la enfermedad, su frecuencia será muy baja en individuos sanos. Sin embargo, la variabilidad genómica tiene un componente poblacional, variando sustancialmente entre poblaciones, por esto es importante contar con un catálogo local de la variabilidad genómica, ya que permite descartar aquellas variantes candidatas por baja frecuencia en otras poblaciones, pero que tienen gran representación en nuestra población, debido a fenómenos de modificación poblacional, como la deriva genética o el efecto fundador.

Desde el Área de Bioinformática Clínica de la Fundación Progreso y Salud, liderada por el Dr. Joaquín Dopazo, junto con instituciones nacionales como el CIBERER, proyectos genómicos locales como Nagen (Navarra) o EnoD (CIBERER), y diversos centros, como el Instituto Galego de Xenómica de Santiago de Compostela, la Fundación Jiménez Díaz o el Hospital Ramón y Cajal de Madrid, el Instituto de Investigación Biosanitaria (IBS) de Granada y otros muchos centros, hemos realizado un esfuerzo conjunto para crear la primera base de datos de variabilidad genética española, CSVS (de sus siglas en inglés Collaborative Spanish Variability Server), que actualmente contiene más de 2000 genomas y exomas de individuos españoles no relacionados. Este trabajo ha sido recientemente publicado en la revista Nucleic Acids Research (NAR).

Esta base de datos, accesible a través de la web http://csvs.babelomics.org/, ha sido generada gracias a un esfuerzo colaborativo de crowdsourcing gracias a diversos proyectos genómicos locales, y permite acceder a la información de manera agregada, de modo que es imposible la reidentificación, obteniendo la frecuencia poblacional en diversos grupos de enfermedades e individuos sanos. Esta información agregada permite su uso como población control para una gran cantidad de estudios, permitiendo el descubrimiento de variantes genéticas asociadas a enfermedades, pero también de prevalencia de variantes farmacogenómicas, u otros estudios poblacionales.

Este modelo innovador de crowdsourcing nos permite acceder a la información generada por diversos proyectos nacionales de manera abierta y sencilla, democratizando el uso de la información genómica poblacional y permitiendo la reusabilidad de los datos generados de múltiples maneras, optimizando así los recursos disponibles. Este modelo constituye un ejemplo a futuras iniciativas en todo el mundo para caracterizar la variabilidad genómica local.

Referencia: María Peña-Chilet, et al. CSVS, a crowdsourcing database of the Spanish population genetic variability, Nucleic Acids Research. 2020.  https://doi.org/10.1093/nar/gkaa794

 

Si te ha gustado esta noticia y quieres aprender más sobre Genética en Medicina, te interesan nuestros cursos y formación universitaria.

Abrir chat