MADRID 28 Oct. (EUROPA PRESS) -
Investigadores del Laboratorio Jackson (JAX), el Instituto Broad del MIT y Harvard, y la Universidad de Yale (Estados Unidos) han utilizado inteligencia artificial para diseñar miles de nuevos interruptores de ADN que pueden controlar con precisión la expresión de un gen en diferentes tipos de células.
Tal y como se publica en 'Nature', su nuevo enfoque abre la posibilidad de controlar cuándo y dónde se expresan los genes en el cuerpo, en beneficio de la salud humana y la investigación médica, de maneras que nunca antes habían sido posibles.
"Lo especial de estos elementos diseñados sintéticamente es que muestran una notable especificidad para el tipo de célula diana para el que fueron diseñados. Esto nos brinda la oportunidad de aumentar o disminuir la expresión de un gen en un solo tejido sin afectar al resto del cuerpo", precisa el doctor Ryan Tewhey , profesor asociado del Laboratorio Jackson y coautor principal del trabajo.
En los últimos años, las tecnologías de edición genética y otros enfoques de terapia génica han brindado a los científicos la capacidad de alterar los genes dentro de las células vivas. Sin embargo, afectar los genes solo en tipos de células o tejidos seleccionados, en lugar de en todo el organismo, ha sido difícil. Esto se debe en parte al desafío constante de comprender los interruptores del ADN, llamados elementos reguladores cis (CRE), que controlan la expresión y represión de los genes.
En este trabajo, Tewhey y sus colaboradores no solo diseñaron CRE sintéticos nuevos y nunca antes vistos, sino que los utilizaron para activar con éxito genes en células cerebrales, hepáticas o sanguíneas sin activar esos genes en otros tipos de células.
Cabe recordar que, aunque cada célula de un organismo contiene los mismos genes, no todos son necesarios en todas las células ni en todo momento. Los CRE ayudan a garantizar que los genes necesarios en el cerebro no sean utilizados por las células de la piel, por ejemplo, o que los genes necesarios durante el desarrollo temprano no se activen en los adultos. Los CRE en sí no son parte de los genes, sino que son secuencias de ADN reguladoras independientes, que a menudo se encuentran cerca de los genes que controlan.
Los científicos saben que hay miles de CRE diferentes en el genoma humano, cada uno con funciones ligeramente diferentes. Pero la gramática de los CRE ha sido difícil de descifrar, "sin reglas sencillas que controlen lo que hace cada CRE. Esto limita nuestra capacidad para diseñar terapias genéticas que solo afecten a ciertos tipos de células en el cuerpo humano", explica Rodrigo Castro, científico computacional en el laboratorio Tewhey en JAX y coautor principal del nuevo artículo.
"Este proyecto plantea básicamente la pregunta: '¿Podemos aprender a leer y escribir el código de estos elementos reguladores?'", comenta Steven Reilly, profesor adjunto de genética en Yale y uno de los autores principales del estudio. "Si lo pensamos en términos de lenguaje, la gramática y la sintaxis de estos elementos son poco entendidas. Y por eso, tratamos de construir métodos de aprendizaje automático que pudieran aprender un código más complejo del que podríamos hacer por nuestra cuenta".
Utilizando una forma de inteligencia artificial (IA) llamada aprendizaje profundo, el grupo entrenó un modelo utilizando cientos de miles de secuencias de ADN del genoma humano que midieron en el laboratorio para detectar la actividad de CRE en tres tipos de células: sangre, hígado y cerebro. El modelo de IA permitió a los investigadores predecir la actividad de cualquier secuencia a partir del número casi infinito de combinaciones posibles. Al analizar estas predicciones, los investigadores descubrieron nuevos patrones en el ADN y aprendieron cómo la gramática de las secuencias de CRE en el ADN afecta la cantidad de ARN que se producirá, un indicador de cuánto se activa un gen.
El equipo, que incluye a Pardis Sabeti , coautor principal del estudio y miembro central del instituto Broad y profesor en Harvard, desarrolló una plataforma llamada CODA (Optimización computacional de la actividad del ADN), que utilizó su modelo de IA para diseñar de manera eficiente miles de CRE completamente nuevos con las características solicitadas, como activar un gen particular en células hepáticas humanas pero no activar el mismo gen en la sangre humana o las células cerebrales.
A través de una combinación iterativa de investigación "húmeda" y "seca", utilizando datos experimentales para construir primero y luego validar modelos computacionales, los investigadores refinaron y mejoraron la capacidad del programa para predecir el impacto biológico de cada CRE y permitieron el diseño de CRE específicos nunca antes vistos en la naturaleza.
"Los CRE naturales, aunque abundantes, representan una fracción minúscula de los posibles elementos genéticos y su función está limitada por la selección natural", destaca el coautor principal del estudio, el doctor Sager Gosai, investigador postdoctoral en el laboratorio de Sabeti. "Estas herramientas de IA tienen un potencial inmenso para diseñar interruptores genéticos que ajusten con precisión la expresión genética para aplicaciones novedosas, como la biofabricación y la terapéutica, que quedan fuera del alcance de las presiones evolutivas".
Tewhey y sus colegas probaron los nuevos CRE sintéticos diseñados por IA añadiéndolos a las células y midiendo lo bien que activaban los genes en el tipo celular deseado, así como lo bien que evitaban la expresión génica en otras células. Descubrieron que los nuevos CRE eran incluso más específicos del tipo celular que los CRE naturales que se sabe que están asociados con los tipos celulares.
"Los CRE sintéticos divergían tanto semánticamente de los elementos naturales que las predicciones sobre su eficacia parecían improbables", afirma Gosai. "Inicialmente esperábamos que muchas de las secuencias se comportaran mal dentro de las células vivas".
Tewhey y sus colaboradores estudiaron por qué los CRE sintéticos pudieron superar a los CRE naturales y descubrieron que los CRE sintéticos específicos de la célula contenían combinaciones de secuencias responsables de expresar genes en los tipos de células objetivo, así como secuencias que reprimían o desactivaban el gen en los otros tipos de células.
Finalmente, el grupo probó varias de las secuencias de CRE sintéticas en peces cebra y ratones, con buenos resultados. Un CRE, por ejemplo, fue capaz de activar una proteína fluorescente en los hígados en desarrollo de los peces cebra, pero no en ninguna otra zona del pez.
"Esta tecnología abre el camino hacia la creación de nuevos elementos reguladores con funciones predefinidas. Estas herramientas serán valiosas para la investigación básica, pero también podrían tener importantes implicaciones biomédicas, ya que se podrían utilizar estos elementos para controlar la expresión genética en tipos de células muy específicos con fines terapéuticos", concluye Tewhey.