Fecha
Fuente
CRG

Cómo se preparan los embriones de mamíferos para la primera gran decisión irreversible

El estudio refuerza la hipótesis de la preparación multilinaje, una teoría que postula que las células no comprometidas expresan programas genéticos asociados con múltiples destinos antes de tomar una decisión. Las células madre anticipan instrucciones mientras mantienen abiertas sus opciones antes de tomar su primera decisión irreversible

Los mapas genéticos humanos contienen puntos ciegos porque se construyeron principalmente a partir de secuencias de ADN de personas con ascendencia europea, según un estudio publicado hoy en Nature Communications.

El estudio identificó miles de transcritos ausentes (las moléculas de ARN que transportan las instrucciones de un gen) en personas pertenecientes a poblaciones de África, Asia y América. Algunas de estas moléculas podrían ser productos de genes completamente nuevos, nunca antes descritos por la ciencia.

Algunos transcritos también aparecen en genes ya relacionados con enfermedades que difieren según las ascendencias, como el lupus, la artritis reumatoide, el asma y rasgos vinculados al colesterol.

Los resultados sugieren que parte del motivo por el que ciertas enfermedades son más frecuentes o se comportan de forma distinta en determinadas poblaciones podría ser que sus genes producen transcritos diferentes y, potencialmente, proteínas diferentes mediante procesos como el splicing. Estas variaciones moleculares han permanecido prácticamente invisibles en los mapas genéticos actuales, ocultando información potencialmente crucial para comprender el riesgo de enfermedad.

"Los mapas génicos se utilizan cada día en los laboratorios, pero estamos dejando fuera enormes segmentos de la población mundial. Este estudio muestra, por primera vez, cuánto nos estábamos perdiendo," afirma el primer autor Pau Clavell-Revelles, del Barcelona Supercomputing Center y el Centro de Regulación Genómica.

El legado de la genética eurocéntrica

El primer borrador del genoma humano, publicado en 2001, supuso un hito científico, a pesar de presentar limitaciones. La secuencia por sí sola no revelaba dónde se encontraban los genes, cuántos existían o cómo un mismo gen podía producir múltiples versiones de una proteína mediante splicing, el proceso por el que las células cortan y ensamblan las instrucciones genéticas.

Para resolverlo, se construyeron los mapas de anotación génica: catálogos detallados que muestran la posición de cada gen humano y el conjunto completo de transcritos de ARN que generan. Proyectos como GENCODE transformaron los tres mil millones de letras del genoma en un material interpretable, ayudando a la ciencia a identificar qué regiones están implicadas en enfermedades y cómo pueden afectar las diferencias genéticas entre personas.

Pero estos mapas heredaron un punto ciego. Aunque dos personas son genéticamente idénticas en un 99,9%, la fracción restante refleja la historia evolutiva humana. Algunos grupos han vivido aislados durante decenas de miles de años y han acumulado variantes distintas moldeadas por el entorno, el azar y la geografía. Estas diferencias son reales, pero no están bien documentadas.

El genoma humano de referencia, y muchas de las anotaciones construidas sobre ella, proceden principalmente de personas con ascendencia europea. En consecuencia, la biología específica de poblaciones de África, Asia, Oceanía y América nunca quedó plenamente representada en los mapas génicos.

Esto implica que gran parte del conocimiento sobre la forma en que las células utilizan los genes se basa en una muestra reducida de la humanidad, dejando transcritos importantes, y posibles claves sobre la enfermedad, fuera de nuestro alcance.

"La mayoría de la secuenciación genética realizada hasta ahora procede de personas europeas, de modo que los catálogos de referencia que utilizamos pueden carecer de genes o transcritos que existan únicamente en poblaciones no europeas", señala el Dr. Roderic Guigó, coautor principal del estudio e investigador del Centro de Regulación Genómica en Barcelona y profesor en la Universidad Pompeu Fabra.

"Si una variante genética cae en uno de estos genes ausentes, asumimos que no tiene ningún efecto biológico. En algunos casos, esa suposición podría ser sencillamente errónea", añade.

La secuenciación de ARN de lectura larga revela biología oculta

Para identificar qué faltaba en los mapas génicos existentes, los autores del estudio se centraron en los transcritos, las moléculas de ARN que muestran cómo se utilizan los genes en las células humanas. Emplearon la secuenciación de lectura larga, una tecnología capaz de leer moléculas completas de ARN de extremo a extremo. Métodos anteriores solo capturaban fragmentos pequeños, lo que dificultaba enormemente la reconstrucción de transcritos y generaba resultados ambiguos, una de las principales razones por las que esta pregunta no había podido abordarse hasta ahora.

El equipo analizó células sanguíneas de 43 personas pertenecientes a ocho poblaciones: Yoruba (Nigeria), Luhya (Kenia), Mbuti (Congo), chinos Han, indios Telugu, peruanos de Lima, judíos asquenazíes y europeos de Utah. Estos grupos forman parte del Proyecto 1000 Genomas, lo que implica que su ADN está bien caracterizado, y esto permite a su vez comparar directamente los nuevos datos de ARN.

Los investigadores identificaron 41.000 transcritos potenciales ausentes en los mapas oficiales de GENCODE. Entre los transcritos originados en genes codificadores de proteínas, se prevé que el 41% codifique versiones diferentes de proteínas ya conocidas. En otras palabras, el estudio reveló miles de variantes proteicas nunca catalogadas.

Un ejemplo es el gen SUB1, implicado en procesos celulares esenciales como la reparación del ADN. Se observó que las personas de ascendencia peruana producen un transcrito distinto de SUB1. Esta molécula de ARN alterada modifica la proteína resultante, aunque estaba ausente en todas las anotaciones génicas existentes.

Al agrupar los datos por ascendencia, se observó un patrón claro: las muestras no europeas contenían una proporción mucho mayor de transcritos nunca vistos que las europeas. En total, el estudio identificó 2.267 transcritos específicos de población, presentes en un solo grupo y ausentes en todos los demás. Para los grupos europeos, la mayoría ya se conocía; para los no europeos, la mayoría era completamente nueva.

De los nuevos transcritos identificados, 773 parecen proceder de regiones génicas no reconocidas previamente, lo que sugiere que podrían ser productos de genes cuya existencia no se había descrito.

El equipo también probó si la utilización de la secuencia del ADN de cada persona como referencia podía revelar incluso más transcritos ausentes. Se observó que sustituir el genoma de referencia estándar por genomas personalizados destapaba cientos de transcritos adicionales por persona, con los mayores incrementos en personas de ascendencia africana.

Si bien esta parte del estudio confirma los sesgos ya existentes en los mapas génicos, también demuestra que depender de una única referencia genómica universal puede ocultar variaciones biológicamente relevantes en el uso de los genes.

Por qué importan los transcritos ausentes

Para comprender la importancia de estos transcritos, el equipo analizó lo que se denomina el uso de transcritos específicos de alelos. Cada persona posee dos copias de la mayoría de los genes, una heredada de cada progenitor. En ocasiones, estas dos copias producen transcritos diferentes, y dichas diferencias pueden influir en el funcionamiento del gen.

Sin embargo, estos efectos solo pueden detectarse si todos los transcritos existentes están catalogados en los mapas génicos. Cuando faltan transcritos importantes, los efectos permanecen invisibles.

Tras añadir los miles de transcritos recién descubiertos a los mapas existentes, el equipo pudo detectar muchos más efectos genéticos que influyen en el comportamiento de los genes, especialmente en personas con ascendencia no europea.
"Observamos que muchos de los nuevos transcritos sesgados por ascendencia aparecen en genes ya asociados a enfermedades autoinmunes, asma y rasgos metabólicos", afirma la Dra. Marta Melé, coautora principal del estudio y jefa de grupo en el BSC.

La Dra. Melé explica que esto no implica que los transcritos sean la causa directa de las diferencias en una enfermedad, sino que permiten identificar señales genéticas que antes estaban ocultas. Sin estos transcritos en los mapas de referencia, se perdería información clave para comprender por qué ciertas enfermedades son más comunes, o actúan de forma diferente, en algunos grupos respecto a otros.

Hacia un "pantranscriptoma" humano

El equipo subraya que este trabajo es solo un primer paso con limitaciones importantes. El estudio analizó un único tipo celular de un solo tejido, y solo en 43 personas. Muchas regiones del mundo no están representadas y no se examinó ninguno de los órganos más complejos del cuerpo.

Aun así, pese a esta limitación, se identificaron decenas de miles de transcritos que habían pasado desapercibidos en los mapas génicos oficiales. Para la Dra. Fairlie Reese, la combinación entre la reducida escala del estudio y la magnitud de lo descubierto es un resultado sorprendente. "Creemos firmemente que cualquier resultado obtenido aquí es solo la punta del iceberg", señala la Dra. Reese, investigadora posdoctoral en el BSC.

Los autores del estudio piden replantear cómo se construyen los mapas de la biología humana para que reflejen verdaderamente a la humanidad. En los últimos años, grandes iniciativas internacionales como el Human Pangenome Project han empezado a ampliar la referencia genómica, incorporando mucha más diversidad del ADN global.

Sin embargo, el ADN no es más que el manual de instrucciones. Para comprender cómo se utilizan dichas instrucciones, la comunidad científica necesita también un pantranscriptoma humano: el catálogo completo de todas las moléculas de ARN utilizadas en todos los tejidos, en todas las etapas de la vida y en todas las poblaciones.

"El pangenoma nos informa sobre la diversidad del ADN; es, esencialmente, un libro de instrucciones. El pantranscriptoma nos indica qué palabras son importantes en cada célula de nuestro cuerpo. Ambos son esenciales para comprender plenamente la diversidad humana", afirma la Dra. Melé.

Construir un recurso así es una tarea titánica. Solo este estudio generó más de 10 terabytes de datos y 800 millones de secuencias completas de ARN, lo que requirió herramientas avanzadas de aprendizaje automático y la capacidad del superordenador MareNostrum 5 del BSC. Escalar este trabajo a cientos de tejidos y miles de personas exigiría capacidades computacionales y una coordinación global de otra magnitud.

Pero los investigadores sostienen que esta ambición merece la pena. "Esperamos que nuestro estudio sirva como base y como invitación a la comunidad científica global para aportar datos, métodos y poblaciones diversas. Solo mediante un esfuerzo colectivo lograremos un mapa verdaderamente completo e inclusivo de la biología humana, esencial para una medicina genómica justa y precisa", concluye la Dra. Melé.

Add new comment