Récord de simulación de plegamiento de proteínas
Hace unos días salió publicado en Nature News la noticia ‘Supercomputer sets protein-folding record’, en la que se cuenta cómo se ha conseguido simular con el supercomputador Anton los cambios estructurales de una proteína durante un milisegundo, coincidiendo con las observaciones obtenidas de la proteína real. El tiempo necesario para calcular esa simulación fue de 100 días, mientras el tiempo de plegamiento simulado es 100 veces mayor que el anterior récord. Para esta prueba se usaron dos proteínas que han sido estudiadas experimentalmente durante mucho tiempo. Una de ellas es en sí un fragmento de proteína que es un dominio WW, y la otra es una pequeña proteína llamado inhibidor pancreático básico de tripsina (espero haber hecho bien la traducción).
Para los que no seáis del mundillo de la bioinformática puede chocar esta noticia, porque comparado con la vida real u otro tipo de predicciones (como la meteorológica) es una duración muy corta, pero a escala molecular un milisegundo es una duración muy larga.
Haciendo un poco de resumen, una proteína es básicamente una sucesión de aminóacidos encadenados entre sí de forma secuencial. Cada proteína que sintetizan las células de cualquier organismo ha sido creada por la maquinaria traslacional de las mismas, a partir de la traducción a aminoácidos del ADN complementario al ARN mensajero que fue obtenido del correspondiente gen (aunque un gen pueda tal vez llevar a más de una proteína si hay splicing alternativo de por medio).
Cuando las proteínas son sintetizadas no ‘nacen’ directamente en su conformación tridimensional habitual, sino que la adquieren pasado un tiempo (una de las situaciones simulables). Además, las proteínas no son rígidas, sino que pueden tener distintas confirmaciones destinadas a su interacción con otras proteínas, ADN y pequeñas moléculas. Estas conformaciones son importantes a la hora de determinar la función, el papel o la participación de una proteína en las distintas rutas metabólicas. El problema es que a veces es difícil por medios experimentales reproducir las condiciones en las que se produce el proceso para una determinada proteína, y muy difícil conseguir cristalizar la proteína para poder usar técnicas de difracción de rayos X o resonancia magnética nuclear, en lo cuál a veces se tarde 2 años o más (si es que se consigue).
Y ahí está la importancia de estas simulaciones, que pueden proporcionar información o al menos pistas sobre la función de proteínas conocidas a nivel de secuencia, pero con estructura tridimensional desconocida. El gran problema de cualquier simulación es que nunca puede llegar a ser una emulación del mundo real, principalmente porque se desconocen todos los factores que afectan al suceso real a emular, o calcular el impacto de algunos de esos factores no es razonable. Eso hace que con cada paso de simulación se vayan introduciendo errores de cálculo que hacen que los resultados de la simulación se vayan separando poco a poco de la realidad. Conseguir alargar una simulación no sólo depende de la potencia computacional bruta disponible, sino también del modelo físico usado y de si se ha conseguido compensar de alguna manera esos inevitables errores de cálculo que se introducen en cada paso de la simulación.