MADRID 4 Feb. (EUROPA PRESS) -
Investigadores de la UC Santa Cruz (EstadosUnidos) están impulsando la investigación sobre un método alternativo de vanguardia, llamado secuenciación de lectura larga, que puede proporcionar un conjunto de datos más completo para encontrar variaciones, eliminar la necesidad de múltiples pruebas especializadas y agilizar el diagnóstico de enfermedades raras. Las pruebas clínicas actuales para el diagnóstico de enfermedades raras utilizan un método llamado secuenciación de lectura corta, que no puede acceder a la información en ciertas regiones del genoma y, por lo tanto, puede pasar por alto evidencia crucial para ayudar a hacer un diagnóstico.
El nuevo estudio publicado en 'The American Journal of Human Genetics' muestra que la secuenciación de lectura larga tiene el potencial de mejorar la tasa de diagnóstico y reducir el tiempo de diagnóstico de años a días, en una sola prueba y a un costo mucho menor. El estudio está dirigido por los miembros principales del Instituto de Genómica de la UCSC, el profesor de Ingeniería Biomolecular (BME) Benedict Paten y la profesora asociada de BME Karen Miga, así como la ex investigadora postdoctoral de la UCSC Jean Monlong.
"Hoy en día, el rendimiento diagnóstico de la secuenciación genética es frustrantemente bajo", declara Paten. "Una causa probable son los métodos de secuenciación incompletos que se utilizan en la práctica clínica. En este trabajo, probamos la hipótesis de que una secuenciación de lectura larga nueva y más completa puede generar información adicional útil para el diagnóstico genético. Nos entusiasmó descubrir numerosas variantes genéticas y señales epigenéticas adicionales potencialmente interesantes en nuestra cohorte. Si bien todavía es pronto, esta información es muy prometedora y la comunidad necesitará tiempo para interpretar y comprender plenamente gran parte de esta nueva información".
Este estudio se centró en enfermedades monogénicas raras, que son aquellas causadas por una alteración de un solo gen. Los científicos diagnostican enfermedades genéticas buscando en el material genético variantes (diferencias en un gen que pueden impedir que funcione correctamente). El método habitual para encontrar estas variantes utiliza una técnica denominada secuenciación de lectura corta, que lee los pares de bases genéticas (combinaciones de adenina (A), citosina (C), guanina (G) y timina (T)) en secuencias de aproximadamente 150 a 250 a la vez.
Sin embargo, la limitación de la secuenciación de lectura corta es que puede pasar por alto información crucial en ciertas regiones del genoma, como patrones de pares de bases que son mucho más largos que solo 250 pares de bases. Tampoco puede realizar el "escalado", el proceso de determinar qué variantes se heredan de la madre y cuáles del padre. Esto puede ayudar a los médicos a descubrir de quién se heredan las variantes; por ejemplo, si dos variantes se heredan del mismo progenitor, una de cada progenitor o no se heredan en absoluto. Esta puede ser una pieza de información muy útil para los diagnósticos genéticos, especialmente cuando no se dispone de datos parentales.
En cambio, la secuenciación de lectura larga permite leer grandes fragmentos de ADN a la vez, eliminando lagunas que pueden hacer que los científicos y los médicos pasen por alto información importante sobre la variación genética. La secuenciación de lectura larga también proporciona datos directos sobre la fase, así como información sobre la metilación, un proceso químico del ADN que hace que los genes se "activen o desactiven" y que puede contribuir a la aparición de enfermedades.
En esta investigación, los laboratorios de Paten y Miga colaboraron con médicos para trabajar en los casos de 42 pacientes con enfermedades raras, algunos de los cuales recibieron un diagnóstico mediante métodos de lectura breve u otras pruebas especializadas, y otros que aún no habían sido diagnosticados. En algunos casos, los investigadores tuvieron acceso a la información genética de los padres, pero en otros no.
La secuenciación de lectura larga de los pacientes fue dirigida por el Laboratorio Miga utilizando secuenciación de nanoporos, un método de secuenciación de lectura larga iniciado en la UCSC , para lograr lecturas de extremo a extremo altamente precisas de los genomas de los pacientes por aproximadamente 1.000 dólares (954 euros) por muestra.
Los datos genómicos se analizaron utilizando métodos computacionales desarrollados en el laboratorio de Paten para encontrar variantes pequeñas y grandes, datos de fases y datos de metilación, todo mediante un proceso denominado proceso Napu . El proceso de análisis demora alrededor de un día o menos, dependiendo de la velocidad de procesamiento de la computadora, y cuesta 100 dólares (95 euros).
Después de secuenciar y analizar los datos del paciente, los investigadores descubrieron que las lecturas largas proporcionaban un conjunto de datos más exhaustivo en comparación con lo que se puede obtener con la secuenciación de lecturas cortas. La secuenciación de lectura larga arrojó un diagnóstico concluyente para 11 de los 42 pacientes de la cohorte, aportando todo lo que se sabía de los datos de lectura corta, así como información adicional, incluidas variantes candidatas raras adicionales, fase de largo alcance y metilación, todo en un protocolo único, rentable y rápido.
Entre los 11 casos diagnosticados se encuentran cuatro de hipoplasia suprarrenal congénita (una enfermedad poco frecuente en la que las glándulas suprarrenales están agrandadas y no funcionan correctamente). El gen responsable de esta enfermedad se encuentra en una región particularmente difícil del genoma: no se puede caracterizar con la tecnología de secuenciación de lectura corta y la prueba clínica actual es engorrosa e incompleta.
"La secuenciación de lectura larga es probablemente la siguiente mejor prueba para los casos sin resolver con variantes convincentes en un solo gen o un fenotipo claro", recalcan los investigadores. "Puede servir como una prueba de diagnóstico única, reduciendo la necesidad de múltiples visitas clínicas y transformando un proceso de diagnóstico de años en cuestión de horas".
En promedio, cada paciente tenía 280 genes (incluidos algunos genes de enfermedades mendelianas, que están vinculados a trastornos hereditarios causados por mutaciones de un solo gen) con regiones codificantes de proteínas significativas cubiertas únicamente por lecturas largas y no detectadas por lecturas cortas.
"Las lecturas largas pueden revelar mucho más del genoma", finalizan los investigadores. "Pero pasará algún tiempo hasta que podamos interpretar por completo esta nueva información revelada por las lecturas largas. Estos datos no estaban en nuestras bases de datos clínicas, que se crearon mediante análisis de lecturas cortas y mapeo con la referencia estándar. Demostramos que las lecturas largas están revelando aproximadamente un 5,8 % más del genoma de telómero a telómero al que las lecturas cortas simplemente no pudieron acceder".