Investigadores de la Universidad de Malaga concluyen un proyecto para facilitar el acceso y el análisis del ‘big data’ en el estudio del genoma

Universidad de Málaga

 

La iniciativa, de carácter europeo y coordinada por la Universidad de Málaga, trata de facilitar el acceso y análisis de grandes volúmenes de datos genómicos a través de ‘la nube’

Un grupo de investigadores del Departamento de Arquitectura de Computadores de la Universidad de Málaga ha desarrollado durante los últimos años nuevas herramientas y programas informáticos de computación avanzada para el procesamiento de información relativa al genoma. Han participado profesionales de los ámbitos académico y empresarial de Alemania, Austria y España.

La Universidad de Málaga ha concluido con éxito la dirección del proyecto europeo de computación avanzada en grandes conjuntos de datos clínicos y genéticos “High Performance, Cloud and Symbolic Computing in Big-Data problems applied to mathematical modelling of Comparative Genomics (Mr.Symbiomath)”. El proyecto ha sido financiado por la Unión Europea en el marco de las acciones Marie Curie para impulsar la transferencia de conocimiento entre la academia y la industria. Por ello, uno de los beneficios más importantes del proyecto se refiere al intercambio de personal -estudiantes de doctorado y profesores- entre los diferentes grupos de investigación nacionales e internacionales en áreas de conocimiento que incluyen las ciencias de computación, la bioinformática, biomedicina, realidad virtual y técnicas de aprendizaje profundo.

 

estudio del genoma universidad malaga
El proyecto conducido por la Universidad de Málaga ofrece ahora soluciones para acelerar el procesamiento de los grandes volúmenes de datos genómicos. Imagen cortesía del Departamento de Arquitectura de Computadores de la Universidad de Málaga.

 

Desde el punto de vista científico, este proyecto ha propuesto soluciones para gestionar el ‘big-data’ mediante el uso de técnicas de computación de alto rendimiento, paralela y en ‘la nube’. Estas soluciones han sido implementadas con la vista puesta en las necesidades de los usuarios finales para simplificar su trabajo en este tipo de entornos complejos. Los desarrollos propuestos se han validado en aplicaciones de medicina personalizada , también llamada medicina de precisión.

Con toda seguridad Homo Sapiens es la única especie de la cual contamos con tantas muestras de genomas pertenecientes a diferentes individuos. Actualmente se dispone de más de 250 mil genomas y se espera llegar a más de un millón y medio en 2017, siendo un dato en continuo crecimiento.

El proyecto desarrollado por la Universidad de Málaga es válido para el estudio de estos datos masivos en diferentes especies. Imagen cortesía del Departamento de Arquitectura de Computadores de la Universidad de Málaga.

 

La aplicación más atractiva e interesante de estos datos es en el campo de la salud. La medicina personalizada toma en cuenta las características específicas del paciente, estudiando la asociación entre el genotipo (la información de los genes) y el fenotipo (sus características visibles) y los cambios producidos por las mutaciones presentes en cada genoma individual. Ello se manifiesta en la susceptibilidad del individuo a padecer una enfermedad concreta o una reacción adversa a un determinado fármaco, por ejemplo.

 

Miembros del grupo de investigadores que ha desarrollado durante los últimos años nuevas herramientas y programas informáticos de computación avanzada para el procesamiento de información relativa al genoma. Imagen cortesía del Departamento de Arquitectura de Computadores de la Universidad de Málaga.

 

Hay muchos estudios mendelianos en los que se establecen asociaciones simples entre una mutación y su efecto. En este proyecto se ha ampliado el campo de asociación a múltiples mutaciones mediante técnicas de análisis epistático en los que se analizan genes que “trabajan” juntos. Ello ha sido posible haciendo uso de grandes infraestructuras de cálculo debido a la cantidad de información a procesar. En ello la UMA ha trabajado junto con el Hospital Regional Universitario de Málaga, la empresa Integromics y la Universidad Johannes Kepler de Linz-Austria.

Sin embargo, no solo el genoma humano está en el interés de los científicos. Muchos otros organismos han sido secuenciados y existen multitud de proyectos de secuenciación en marcha. En términos prácticos, el proyecto desarrollado por la Universidad de Málaga es válido para el estudio de estos datos masivos en diferentes especies. En el caso particular del proyecto se han desarrollado métodos para la comparación rápida de genomas y se ha llegado a estudiar los grandes cambios evolutivos en las diferentes especies, proveyendo mecanismos de representación novedosos tomados del área de la realidad virtual y a través de la Red. En este campo la UMA ha colaborado con el Centro de Supercomputación de Leibniz (Munich, Alemania).

Acelerar el procesamiento de estos grandes volúmenes de datos es uno de los grandes desafíos actuales para la informática, ya que tanto la Red como las propias computadoras convencionales no dan abasto para trabajar con ellos. El proyecto conducido por la Universidad de Málaga ofrece ahora soluciones para este problema usando técnicas de computación avanzada cuya parte tecnológica de mejoras en la gestión computacional de la nube se ha realizado en colaboración con la start-up RISC-Software de Hagenberg, Austria.

El proyecto ha estado coordinado por personal docente e investigador de la Escuela Técnica Superior de Informática de la Universidad de Málaga. Los resultados han sido herramientas de análisis de datos y una plataforma en la nube que facilitan el acceso y análisis a las empresas y a otros investigadores a grandes volúmenes de datos en bioinformática y biomedicina.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Abrir chat