Evo 2 es el modelo de inteligencia artificial (IA) más grande y de código abierto en biología. Un sistema que abarca la diversidad genética del árbol de la vida y que puede ser útil para predecir mutaciones que causan enfermedades o para diseñar secuencias de ADN.

El nuevo sistema de IA generativa, que puede leer y escribir código genético, fue entrenado con el ADN de más de 100.000 especies de todo tipo y desarrollado por científicos del Instituto Arc y la empresa NVIDIA, junto a colaboradores de la Universidad de Stanford, la de California en Berkeley y la de California en San Francisco.

Se trata de una versión mejorada de Evo, que fue presentada en 2024, el nuevo modelo se hizo público hace un año en un repositorio, es decir, sin la necesaria revisión por pares para llegar a una revista científica, y ahora se publica en Nature.

La información genética esencial para la vida se escribe con un vocabulario de solo cuatro nucleótidos, que pueden describirse como los bloques de construcción que forman el ADN o el ARN.

Evo 2 es capaz de leer y escribir en ese lenguaje, su desarrollo “representa un momento clave en el campo emergente de la biología generativa, ya que los modelos han permitido a las máquinas leer, escribir y pensar en el lenguaje de los nucleótidos”, indicó Patrick Hsu, autor del estudio y cofundador del Instituto Arc.

identifica mutaciones

Evo puede, según el equipo, identificar con precisión mutaciones causantes de enfermedades en genes humanos y es capaz de diseñar nuevos genomas tan largos como los que tienen las bacterias simples.

Ante los posibles riesgos éticos y de seguridad, los científicos excluyeron de su base de datos los patógenos que infectan a los seres humanos y otros organismos complejos, y se aseguraron de que el modelo no diera respuestas productivas a esas consultas, resaltó el Instituto Arc.

En el año transcurrido desde su publicación preliminar, los investigadoresaplicaron el modelo a una serie de problemas científicos, desde la predicción del riesgo de enfermedades genéticas en pacientes con alzhéimer, hasta la evaluación de los efectos de las variantes en especies animales domesticadas.

El modelo ya muestra suficiente versatilidad para identificar cambios genéticos que afectan a la función de las proteínas y a la aptitud física de los organismos. En pruebas con variantes del gen BRCA1 asociado al cáncer de mama, alcanzó una precisión superior al 90 % en la predicción de qué mutaciones son benignas y cuáles potencialmente patógenas.

Además, Evo 2 se usó para diseñar bacteriófagos sintéticos funcionales, lo que demuestra sus posibles aplicaciones para el tratamiento de bacterias resistentes a los antibióticos, y el equipo considera que podría ser útil para diseñar nuevas herramientas o tratamientos biológicos.

T/Agencias