MADRID 9 Ene. (EUROPA PRESS) -
Mediante un nuevo método de inteligencia artificial, investigadores del Colegio de Médicos y Cirujanos Vagelos de la Universidad de Columbia (Estados Unidos) pueden predecir con precisión la actividad de los genes dentro de cualquier célula humana, revelando esencialmente los mecanismos internos de la célula.
El sistema, descrito en 'Nature', podría transformar la forma en que los científicos trabajan para comprender todo, desde el cáncer hasta las enfermedades genéticas. "Los modelos computacionales predictivos generalizables permiten descubrir procesos biológicos de forma rápida y precisa. Estos métodos pueden llevar a cabo experimentos computacionales a gran escala de manera eficaz, impulsando y guiando los enfoques experimentales tradicionales", declara Raul Rabadan, profesor de biología de sistemas y autor principal del artículo.
Los métodos tradicionales de investigación en biología son buenos para revelar cómo las células realizan su trabajo o reaccionan a las perturbaciones, pero no pueden hacer predicciones sobre cómo funcionan las células o cómo reaccionarán a los cambios, como una mutación que causa cáncer.
"Poder predecir con precisión las actividades de una célula transformaría nuestra comprensión de los procesos biológicos fundamentales", augura Rabadan. "Convertiría a la biología, que dejaría de ser una ciencia que describe procesos aparentemente aleatorios, en una ciencia capaz de predecir los sistemas subyacentes que rigen el comportamiento celular".
En el nuevo estudio, Rabadan y sus colegas intentaron utilizar la inteligencia artificial para predecir qué genes están activos en células específicas. Esta información sobre la expresión genética puede indicar a los investigadores la identidad de la célula y cómo realiza sus funciones. "Los modelos anteriores se han entrenado con datos de tipos de células particulares, generalmente líneas celulares cancerosas o algo que tiene poca semejanza con las células normales", aporta Rabadan.
Xi Fu, un estudiante de posgrado en el laboratorio de Rabadan, decidió adoptar un enfoque diferente y entrenar un modelo de aprendizaje automático con datos de expresión genética de millones de células obtenidas de tejidos humanos normales. Los datos de entrada consistían en secuencias genómicas y datos que mostraban qué partes del genoma son accesibles y se expresan.
El enfoque general se asemeja al funcionamiento de ChatGPT y otros modelos de "base" populares. Estos sistemas utilizan un conjunto de datos de entrenamiento para identificar reglas subyacentes, la gramática del lenguaje, y luego aplican esas reglas inferidas a nuevas situaciones. "Aquí es exactamente lo mismo: aprendemos la gramática en muchos estados celulares diferentes y luego pasamos a una condición particular (puede ser un tipo de célula enfermo o normal) y podemos intentar ver qué tan bien predecimos patrones a partir de esta información", relata Rabadan.
Después del entrenamiento con datos de más de 1,3 millones de células humanas, el sistema se volvió lo suficientemente preciso como para predecir la expresión genética en tipos de células que nunca había visto, produciendo resultados que coincidían estrechamente con los datos experimentales.
A continuación, los investigadores demostraron el poder de su sistema de IA cuando le pidieron que descubriera la biología aún oculta de las células enfermas, en este caso, una forma hereditaria de leucemia pediátrica. Con la IA, los investigadores predijeron que las mutaciones alteran la interacción entre dos factores de transcripción diferentes que determinan el destino de las células leucémicas. Los experimentos de laboratorio confirmaron la predicción de la IA. Comprender el efecto de estas mutaciones revela mecanismos específicos que impulsan esta enfermedad.
Los nuevos métodos computacionales también deberían permitir a los investigadores comenzar a explorar el papel de la "materia oscura" del genoma (un término tomado de la cosmología que se refiere a la gran mayoría del genoma, que no codifica genes conocidos) en el cáncer y otras enfermedades.
"La gran mayoría de las mutaciones que se encuentran en los pacientes con cáncer se encuentran en las llamadas regiones oscuras del genoma. Estas mutaciones no afectan la función de una proteína y han permanecido en su mayor parte sin explorar", afirma Rabadan. "La idea es que, utilizando estos modelos, podamos observar las mutaciones y arrojar luz sobre esa parte del genoma".
En este contexto, Rabadan ya está trabajando con investigadores de Columbia (Estados Unidos) y otras universidades, explorando diferentes tipos de cáncer, desde el cáncer cerebral hasta el cáncer de sangre, aprendiendo la gramática de la regulación en células normales y cómo las células cambian en el proceso de desarrollo del cáncer. El trabajo también abre nuevas vías para comprender muchas enfermedades más allá del cáncer y potencialmente identificar objetivos para nuevos tratamientos. Al presentar mutaciones novedosas al modelo informático, los investigadores ahora pueden obtener conocimientos y predicciones más profundos sobre cómo exactamente esas mutaciones afectan a una célula.