Genética Médica News

Desarrollan un agente de IA que mejora la precisión del análisis de conjuntos de genes

Investigadores de los Institutos Nacionales de Salud (NIH) han desarrollado un agente de inteligencia artificial (IA) impulsado por un modelo de lenguaje grande (LLM) que crea descripciones más precisas e informativas de los procesos biológicos y sus funciones en el análisis de conjuntos de genes que los sistemas actuales.

El sistema, denominado GeneAgent, comprueba la precisión de sus propias predicciones iniciales —también conocidas como afirmaciones— con la información de bases de datos establecidas y seleccionadas por expertos, y devuelve un informe de verificación en el que se detallan sus aciertos y errores. El agente de IA puede ayudar a los investigadores a interpretar datos moleculares de alto rendimiento e identificar vías biológicas o módulos funcionales relevantes, lo que puede conducir a una mejor comprensión de cómo diferentes enfermedades y afecciones afectan a grupos de genes de forma individual y conjunta.

Desarrollan un agente de IA que mejora la precisión del análisis de conjuntos de genes
GeneAgent está diseñado para comprobar sus predicciones y evitar las llamadas «alucinaciones IA». Imagen: Adobe Express.

Una herramienta diseñada para reducir las alucinaciones de IA

El contenido generado por IA es producido por modelos de lenguaje grande (LLM) entrenados con enormes cantidades de datos de texto procedentes de Internet. Los LLM utilizan esos datos para reconocer patrones y predecir qué palabras pueden seguir a otras en una frase. Sin embargo, los LLM no están diseñados para verificar la veracidad, lo que significa que el contenido generado por IA puede ser falso, engañoso o inventado, un fenómeno denominado «alucinaciones de IA». Además, los LLM son propensos al razonamiento circular, es decir, a verificar los resultados que generan con sus propios datos, lo que les hace parecer más seguros de los resultados, incluso cuando la información es falsa.

Es importante evitar las alucinaciones de IA cuando se utilizan herramientas LLM para el análisis de conjuntos de genes, el proceso de generar descripciones funcionales colectivas de genes agrupados y sus posibles interacciones. Estudios anteriores que enseñaban a los LLM a responder preguntas genómicas o resumir procesos biológicos en un conjunto de genes determinado no abordaban explícitamente las alucinaciones en el contenido generado.

GeneAgent mitiga este problema tomando sus propias afirmaciones y comparándolas de forma independiente con los conocimientos establecidos recopilados en bases de datos externas y seleccionadas por expertos. 

La herramienta IA GeneAgent genera un 92% de decisiones correctas sobre genes

El equipo de investigación probó primero GeneAgent en 1106 conjuntos de genes procedentes de bases de datos existentes con funciones y nombres de procesos conocidos. Para cada conjunto de genes, GeneAgent generó primero una lista inicial de afirmaciones funcionales. A continuación, utilizó de forma independiente su módulo de autoverificación para cotejar estas afirmaciones con las bases de datos seleccionadas y crear un informe de verificación en el que se indicaba si cada una de sus afirmaciones estaba respaldada, parcialmente respaldada o refutada.

Para determinar mejor su precisión en la etapa de autoverificación, los investigadores recurrieron a dos expertos humanos para que revisaran manualmente 10 conjuntos de genes seleccionados al azar con un total de 132 afirmaciones y juzgaran si los informes de autoverificación de GeneAgent eran correctos, parcialmente correctos o incorrectos. 

De los informes de autoverificación generados por GeneAgent, los expertos determinaron que el 92 % de sus decisiones eran correctas, lo que indica un alto rendimiento en su capacidad para llevar a cabo la autoverificación, especialmente en comparación con GPT-4. Su revisión detallada confirmó la eficacia del modelo para minimizar las alucinaciones y generar narrativas analíticas más fiables.

El equipo de investigación también analizó la aplicación real de GeneAgent en conjuntos de genes de modelos animales. Cuando se aplicó a siete conjuntos de genes novedosos derivados de líneas celulares de melanoma de ratón, GeneAgent fue capaz de ofrecer información valiosa sobre las nuevas funcionalidades de genes específicos. Esto podría suponer el descubrimiento de conocimientos como posibles nuevos objetivos farmacológicos para enfermedades como el cáncer.

Aunque los LLM como GeneAgent siguen estando limitados por la información que pueden utilizar y su incapacidad para razonar como los seres humanos, la capacidad de GeneAgent para verificar los hechos de forma autónoma resulta muy prometedora para mitigar las alucinaciones de la IA.

Artículo científico

Wang, Z., Jin, Q., Wei, CH. et al. GeneAgent: self-verification language agent for gene-set analysis using domain databases. Nat Methods (2025). https://doi.org/10.1038/s41592-025-02748-6

Comparte esta noticia en tus redes

Categorías
Cursos relacionados

Contacto

¿Quieres publicar con nosotros? ¿Tienes dudas?
Contacta con nosotros de la manera que prefieras y te responderemos a la mayor brevedad.

Scroll al inicio