Rafael Pérez Ybarra Miércoles, 14 de febrero de 2001

Glosario de términos asociados al genoma

El entendimiento de los métodos, estrategias y análisis que han llevado a la obtención de la secuencia completa del genoma por parte de Celera y del consorcio público internacional supone el aprendizaje y comprensión de un buen número de términos científicos empleados en genética. Por ello, las revistas Nature y Science han incluido entre sus artículos del último número un glosario de estos términos, de los que hemos seleccionado los más novedosos y complejos.

* Secuencia en bruto. Fragmento sin ensamblar, producto de la secuenciación de clones que contienen inserciones de ADN.

* Final de secuencia pareada. Secuencia en bruto obtenida de los dos extremos de una inserción de clon en cualquier vector, como un plásmido o un cromosoma bacteriano artificial.

* Secuencia terminada. Fragmento completo de un clon o genoma, con una precisión de al menos un 99,9 por ciento y sin huecos.

* Cobertura. El promedio de veces en las que un nucleótido es representado por una base de alta calidad en varias secuencias en bruto obtenidas de manera aleatoria.

* Cobertura total del genoma. La cobertura en una secuencia en bruto aleatoria necesitada por un clon insertado grande para asegurarse de que está listo para marcar el fin de la información que aporte. Puede haber variación entre centros pero se sitúa normalmente entre los 8 y los 10 pliegues. Los clones con cobertura total del genoma pueden ser ensamblados normalmente con muy pocos huecos por 100 kilobytes (kb).

* Clon BAC. Vector cromosómico artificial bacteriano que porta un inserto de ADN genómico, normalmente de entre 100 y 200 kb. La mayoría de los clones insertados grandes secuenciados para el proyecto fueron clones BAC.

* Clon terminado. Clon grande insertado que está representado completamente en la secuencia final.

* Cobertura completa del clon. Clon insertado grande para el que se ha producido una secuencia total del genoma.
* Continuo ('contig'). Mapa cromosómico que muestra la localización de las regiones de un cromosoma donde los segmentos de ADN continuo se superponen.

* Esqueleto ('scaffold') Resultado de la conexión de varios continuos gracias a la recapitulación de información procedente de la lecturas finales pareadas de plásmidos, lecturas finales pareadas de varios BAC, ARNm conocidos y otras fuentes. El orden y orientación de los continuos que componen un esqueleto están determinados por ellos mismos.

* Continuos de la secuencia inicial. Son los producidos por la asociación de la lectura de la secuencia imbricada obtenida de un simple clon, en un proceso denominado ensamblaje de la secuencia.

* Borrador de la secuencia del genoma. Producido al combinar la información de clones secuenciados individualmente y posicionando la secuencia a lo largo de un mapa de cromosomas físico.

* Características del mapa: STS. Localización etiquetada de la secuencia, que corresponde a un breve (normalmente menos de 500 bp) locus genómico único para el que se ha desarrollado un análisis de reacción en cadena de la polimerasa (PCR).

* Clon. Pequeña copia de un trozo concreto de ADN necesaria para poder estudiar una secuencia de ADN. El método de secuenciación utilizado por Celera consiste en desintegrar el genoma en un conjunto aleatorio de piezas con una longitud de 2.000, 10.000 y 50.000 pares de bases de largo.

* Características del mapa: EST. Etiqueta de la secuencia expresada, obtenida a partir de la interpretación de la lectura de una secuencia en bruto cualquiera de un clon de ADN complementario.

* Características del mapa: SSR. Repetición de una secuencia simple. Muchos SSR son polimórficos y han sido ampliamente utilizados en los mapas genéticos.

* Características del mapa: SNP. Polimorfismo nucleótido individual, o posición nucleótida individual en la secuencia del genoma para el que se presentan dos o más alelos alternativos con frecuencia apreciable (tradicionalmente, al menos de un 1 por ciento) en la población humana.

* Mapa genético. Mapa en el que los loci polimórficos están posicionados de manera relativa los unos con los otros teniendo en cuenta la frecuencia con la cual se recombinan durante la miosis. La unidad de distancia que se utiliza es el centimorgan (cM).

* Mapa de radiación híbrido (RH). Mapa genómico en el cual los STS se posicionan de manera relativa los unos con los otros según la frecuencia con la que están separados por los recesos de radiación inducida. La frecuencia está análizada a través de un panel de líneas celulares híbridas humanas y de hámster. La unidad de distancia son los centirayos (cR), lo que denota un 1 por ciento de probabilidad de que se produzca una ruptura entre dos lugares.

* Codones, exones, intrones. Cuando se obtiene la secuencia en bruto de un genoma, el siguiente paso consiste en ordenar todas las letras que la componen. Los conjuntos de tres pares de bases se llaman codones, que a su vez forman exones. Los intrones son los espacios que se forman entre los exones.

Volver a la portada del informe