Fecha
Fuente
BSC

Revelan por primera vez que los mapas de genes humanos están sesgados hacia poblaciones europeas

La falta de diversidad global en los mapas génicos de referencia distorsiona lo que conocemos sobre el papel de los genes en la salud y la enfermedad

Desde que se secuenció el genoma humano en 2001, la comunidad científica ha tratado de identificar las secciones más importantes, que son aquellas que contienen los genes. Esta tarea de definir dónde empiezan, dónde acaban y cómo se activan estos fragmentos ha dado pie a la creación de un mapa de los genes en el genoma, una herramienta fundamental para la investigación biomédica utilizada a diario como referencia por toda la comunidad científica.

Ahora, un nuevo estudio del Barcelona Supercomputing Center – Centro Nacional de Supercomputación (BSC-CNS) y el Centro de Regulación Genómica (CRG), publicado en Nature Communications, ha revelado por primera vez que este mapa génico que se usa como referencia está sesgado y no representa correctamente los individuos de ascendencias no europeas.

Para confirmarlo, el equipo científico analizó información genética de células immunitarias de la sangre de 43 individuos de 8 poblaciones diferentes (3 africanas, 2 asiáticas, 2 europeas y 1 amerindia) y descubrió 41.000 secuencias nuevas, mayoritariamente prevalentes en poblaciones no europeas, que faltaban en los mapas de referencia. Algunas de estas secuencias aparecen en genes ya relacionados con afecciones que varían entre las distintas ascendencias genéticas, como el lupus, la artritis reumatoide, el asma y el control del colesterol.

Además, se prevé que parte de esas secuencias sea el origen de diferentes versiones de proteínas existentes. Esto supondría miles de variantes proteicas nunca antes catalogadas e invisibles hasta ahora para todos los científicos, que podrían aportar información potencialmente importante sobre el funcionamiento de ciertas enfermedades.

"Con lo que hemos descubierto, hemos construido un mapa génico no sesgado que nos ha confirmado que toda la comunidad científica está perdiendo la oportunidad de estudiar variantes genéticas de ascendencias no europeas y cambios moleculares que pueden afectar el funcionamiento de las células. Estas variantes no europeas, al no estar representadas en los mapas, son invisibles para la investigación biomédica", ha destacado Marta Melé, líder del grupo de Transcriptómica y Genómica Funcional del BSC y co-autora sénior del estudio.

De este modo, mientras las referencias genómicas estén incompletas y sesgadas, comentan las investigadoras, la comunidad científica tendrá menos posibilidades de asociar variantes genéticas a enfermedades en ciertos grupos de la sociedad. Así que se estarán perpetuando injusticias en cuanto a la ascendencia genética, además de perder oportunidades para mejorar el conocimiento global del genoma humano.

EL PANTRANSCRIPTOMA: UN FUTURO MAPA GENÉTICO INCLUSIVO

Los resultados obtenidos ponen de manifiesto que hay que invertir esfuerzos en generar un mapa de la parte activa del ADN, el transcriptoma, para generar el pantranscriptoma, un registro inclusivo y completamente representativo que incluiría la diversidad de todos los grupos étnicos y los diferentes tipos celulares.

"La mayor parte de la secuenciación genética realizada hasta ahora procede de individuos europeos, por lo que los mapas de referencia en los que nos basamos pueden carecer de genes o transcripciones que solo existen en poblaciones no europeas. Si una variante genética se encuentra en uno de estos genes que faltan, asumimos que no tiene ningún efecto biológico. En algunos casos, esa suposición puede ser simplemente errónea", ha afirmado Roderic Guigó, líder del grupo de Biología Computacional del procesamiento del ARN del CRG y co-autor sénior del estudio.

En esta colaboración, el CRG llevó a cabo la parte experimental del proyecto, mientras que para el análisis masivo de los 10 terabytes de datos generados en la investigación fue imprescindible el uso de la infraestructura de supercomputación del BSC.

"Gracias a la partición especializada en inteligencia artificial de MareNostrum 5 pudimos convertir la información obtenida de los aparatos de secuenciación en información biológica, y analizar, en menos de 48h, más de 800 millones de secuencias, una tarea imposible de asumir para sistemas más antiguos", ha explicado Pau Clavell-Revelles, investigador del BSC y el CRG y primer co-autor del estudio.

Sin embargo, las investigadoras enfatizan que su trabajo es solo un primer paso, ya que muchas partes del mundo no están representadas en absoluto y no se examinó ninguno de los órganos más complejos del cuerpo. Pese a ello, el equipo encontró decenas de miles de moléculas que se habían escapado de los mapas génicos oficiales, un resultado de una magnitud sorprendente teniendo en cuenta las limitaciones del estudio.

"Creemos firmemente que cualquier hallazgo que hayamos hecho aquí es solo la punta del iceberg", afirma Fairlie Reese, investigadora postdoctoral del BSC y primera co-autora del estudio.

Con estos resultados, los equipos científicos del BSC y el CRG han demostrado que hay que mejorar los mapas génicos de referencia. Para hacerlo, piden que se incluyan muchas más ascendencias humanas en los estudios para construir mapas de la biología humana que reflejen verdaderamente toda la humanidad. Solo de esta manera, dicen, se podrá acabar con las injusticias relativas a la ascendencia genética, garantizando que ningún individuo quede excluido de los beneficios de la genómica y de la medicina de precisión.


Referencia bibliográfica:

Clavell-Revelles, P., Reese, F., Carbonell-Sala, S. et al. Long-read transcriptomics of a diverse human cohort reveals ancestry bias in gene annotation. Nat Commun 16, 10194 (2025). https://doi.org/10.1038/s41467-025-66096-x

Añadir nuevo comentario