La Secuenciación a Gran Escala – Una carrera sin límite a la vista…

Como Biólogo Molecular, no deja de sorprenderme la carrera en la que se han embarcado investigadores y empresas a la hora de ofrecer y abaratar procesos como el de la secuenciación de muestras de ADN a gran escala. No sólo genomas de individuos concretos (el humano entre otros) sino mezcla de cientos o miles de genomas distintos – Proyectos de Metagenómica…

La mejora de estas nuevas plataformas de secuenciación, no es sólo en el aumento de la información en cada run (puesta en funcionamiento de cada máquina) – desde las 100 Mb (100 millones de bases en lecturas) del secuenciador 454 hasta las 4 Gbp (4000 millones de bases) del sistema ABI SOLID – sino en el desarrollo de herramientas bioinformáticas que permiten interpretar, cerrar y extraer la información de esta tremenda cantidad de datos. Este nuevo “software” se ha desarrollado para mejorar el “cuello de botella” de los nuevos secuenciadores que no era otro que la longitud de las secuencias ofertadas. Sin embargo esta longitud ha ido creciendo; así la plataforma 454, comenzó con lecturas de 100 bases (b) y en la actualidad ofertan hasta 400 b y las SOLID han pasado de las 35b a las 50b. Todavía quedan lejos de la longitud de los secuenciadores SANGER, alrededor de las 700-900b fiables dependiendo del polímero y capilar. Aunque como compensación de unas lecturas cortas, la cantidad de datos aportados en las nuevas plataformas era muy superior a los secuenciadores del método SANGER.

 

La última sorpresa en esta carrera, es algo que sospechaba que no tardaría en suceder. Mientras que para las plataformas SANGER, la longitud de lectura dependía de una electroforesis, y por tanto de la limitada capacidad de discriminación en tamaño observada en el capilar: de hasta unos 800-900 b; las nuevas plataformas se basan en una detección directa de la polimerización llevada a cabo sobre un molde fijado generalmente a un soporte sólido. Al no haber un límite “a priori” en esta polimerización, el margen de mejora en la técnica en la longitud de la lectura parecía prometedor.

 

Este último salto (probablemente no será el último) se ha dado en la empresa Pacific Biosciences: ha desarrollado una plataforma (máquina) que permite secuenciar a nivel molecular con lecturas únicas de hasta 4000 b (y subiendo). ¡Una única lectura de 4 kb multiplicada a nivel nanotecnológico! La polimerasa usada, por cierto, es la DNA Polimerasa del fago fi-29 (Patente conocida).

 

El salto cualitativo y cuantitativo a la hora de abordar proyectos de secuenciación genómica es de vértigo. El sistema ha sido recientemente publicado en Science y creo que comienza una nueva carrera en los nuevos secuenciadores. Sospecho que en breve, el cuello de botella no va a estar en la obtención de datos sino en qué hacemos con ellos: la Bioinformática.

 

Estaremos atentos…

 

Francisco Martínez-Abarca

EEZ-CSIC

Compartir:

Deja un comentario