banner
Hogar / Blog / AI arroja nueva luz sobre el 'Código de la vida'
Blog

AI arroja nueva luz sobre el 'Código de la vida'

Oct 14, 2023Oct 14, 2023

Si bien ChatGPT, Bard y otras herramientas de inteligencia artificial mantienen despiertos a los escritores, maestros y fanáticos de la franquicia Terminatormovie preocupados por varios escenarios apocalípticos, otro uso de la IA ofrece resultados más esperanzadores.

Investigadores de la Facultad de Letras, Artes y Ciencias Dornsife de la USC están utilizando IA y otros métodos computacionales para redefinir cómo los científicos ven el ADN y brindar una perspectiva más clara y global sobre el "código de la vida".

El conocimiento revelado promete transformar campos científicos que van desde la investigación del cáncer hasta el diseño de fármacos y la sostenibilidad.

En términos más simples, el código genético se compone de cuatro letras: A, C, G y T. Las letras representan los nucleótidos adenina, citosina, guanina y timina, que forman parte de la doble hélice del ADN. Estas cuatro letras de nucleótidos explican el código genético de todos los seres vivos.

Si bien esta versión simple del código ha realizado un trabajo útil durante décadas, no comienza a revelar completamente la complejidad del ADN.

"Queríamos encontrar una nueva forma de codificar el ADN que vaya más allá del código de letras lineales", dijo Remo Rohs, presidente del Departamento de Biología Cuantitativa y Computacional de la USC Dornsife. Él y sus colegas publicaron una investigación significativa, que utilizó datos experimentales a gran escala, a principios de este año en las Actas de la Academia Nacional de Ciencias. También publicaron datos experimentales similares para una familia de proteínas relacionadas con el cáncer llamadas factores de transcripción de caja de cabeza de horquilla en Nucleic Acids Research la semana pasada.

Estos y otros avances de investigación colocan al departamento entre los que están a la vanguardia de la nueva iniciativa USC Frontiers of Computing, cuyo objetivo es estimular la investigación y la innovación en tecnologías informáticas avanzadas como IA y aprendizaje automático, ciencia de datos, blockchain e información cuántica.

Rohs, profesor de biología cuantitativa y computacional, química, física y astronomía e informática, y su equipo buscan desarrollar una definición más realista y holística del código genético que incluya "todas las variaciones estructurales y modificaciones químicas que conocemos ahora o eso podría descubrirse en el futuro", dijo.

Estas modificaciones químicas y variaciones estructurales que menciona Rohs van desde pequeños cambios en los cuatro nucleótidos hasta alteraciones importantes que afectan la forma en que el ADN se enrolla alrededor de sí mismo y de otras moléculas como las proteínas.

Estos cambios pueden afectar qué genes están activos y cuáles están inactivos al permitir o bloquear que las proteínas interactúen con el ADN o lean el código.

El enfoque de Rohs reemplaza la secuencia simple de cuatro letras con una que incluye grupos fisicoquímicos en los surcos mayor y menor en la doble hélice del ADN.

¿Entonces que significa eso?

La doble hélice del ADN forma una escalera retorcida. En virtud del giro de la escalera, tiene un surco mayor más ancho y un surco menor más estrecho. Dependiendo de su tamaño y forma, las moléculas celulares pueden interactuar más fácilmente con el ADN a través de un surco que del otro.

"Fisicoquímico" se refiere tanto a propiedades físicas como químicas. El método de Rohs tiene en cuenta las diversas protuberancias y protuberancias de los nucleótidos y otros componentes del ADN y su accesibilidad física dentro de los dos surcos. También incorpora cómo los componentes del ADN pueden reaccionar químicamente con las proteínas. En conjunto, esto brinda una imagen más clara de cómo la maquinaria de la célula interactúa e interpreta el código genético.

Por ejemplo, una proteína podría normalmente unirse a una sección de ADN codificada como AGTCATGGA, pero si esa sección está oculta en el surco menor, es posible que la proteína no pueda acercarse lo suficiente para unirse. O, si la proteína y la sección codificada tienen una fuerte atracción química, incluso si la sección codificada está apretada, la proteína aún podría interactuar, pero en menor grado.

Aquí es donde el equipo de Rohs presenta la IA, que aprende la preferencia de una proteína de unión al ADN por ciertos grupos químicos en ubicaciones físicas específicas en cada surco del ADN.

Al tener en cuenta estos matices, Rohs y su equipo revelan una imagen más completa de lo que sucede con el ADN en las células vivas, que se extiende mucho más allá del simple código lineal de cuatro letras. Esto, dice Soheil Shams, director de información emérito de la empresa de biotecnología Bionano Genomics Inc., es clave para avanzar en la investigación computacional sobre el genoma.

"Uno de los pasos más importantes, pero desafiantes, en muchas aplicaciones de biología computacional, como el aprendizaje automático, es cómo representar la información bioquímica para que pueda procesarse computacionalmente", dijo Shams, quien se graduó de la Escuela de Ingeniería Viterbi de la USC con una maestría Licenciado en 1986 y doctorado en 1992. "El enfoque propuesto por el Dr. Rohs y sus colegas ofrece una representación mucho más completa de la secuencia de ADN que debería permitir descubrimientos igualmente más completos en la interpretación de variantes genéticas, así como en la investigación del cáncer".

El método de Rohs ayudaría a los científicos a comprender por qué algunos genes solo están parcialmente activos bajo ciertas condiciones, o por qué la actividad de algunos genes aumenta o disminuye con la edad.

Y esto, dice Rohs, abre las puertas a una variedad de vías de investigación beneficiosas.

"El uso de métodos de IA en un genoma con modificaciones químicas y modificaciones estructurales permitirá sus aplicaciones en la investigación del cáncer y el envejecimiento, la investigación agrícola, la biología sintética, la ingeniería química y el diseño de fármacos", dijo. "Por ejemplo, ciertos tipos de cáncer implican modificaciones químicas del ADN, el envejecimiento se correlaciona con el nivel de metilación del ADN y los genomas de las plantas sufren amplias modificaciones químicas en comparación con los genomas de otros organismos".

Para sus próximos pasos, dice Rohs, los investigadores quieren aplicar su trabajo a las proteínas de unión al ADN que controlan la actividad de los genes y predicen cómo la alteración de los nucleótidos, o la sustitución de nuevos nucleótidos sintéticos, afecta la función de esas proteínas.

"Queremos predecir las preferencias de unión de las proteínas reguladoras de genes, llamadas factores de transcripción, al ADN con nucleótidos modificados químicamente y pares de bases sintéticas para mejorar las características de unión y desarrollar fármacos que mejoren la salud y las enfermedades humanas", dijo.

El trabajo de Rohs en la vanguardia de la biología computacional utilizando IA podría tener beneficios para la humanidad con los que los bots como ChatGPT solo podrían soñar.

El artículo publicado en Proceedings of the National Academy of Sciences fue dirigido por el asociado postdoctoral Tsu-Pei Chiu y coautor del ex estudiante de posgrado Satyanarayan Rao.

El artículo publicado en Nucleic Acids Research fue dirigido por el asociado postdoctoral Brendon Cooper y coescrito por la ex asociada postdoctoral Ana Carolina Dantas Machado, el técnico de laboratorio Yan Gan y el profesor de ciencias biológicas Oscar Aparicio.

El proyecto experimental fue parte del Centro Michelson de Biociencia Convergente. Ambos estudios fueron apoyados por los Institutos Nacionales de Salud y el Programa de Ciencias Human Frontier.

Más información sobre la investigación realizada en el laboratorio de Rohs está disponible en www.rohslab.org.

darrin s la alegría