Polémica con el reciente cambio en PDB

Como pudisteis leer en una noticia anterior, el nuevo formato de fichero v3 de la base de datos PDB es incompatible en algunos aspectos con las versiones anteriores. Eso provoca que algunos programas tengan que ser actualizados. Pero este cambio en el formato además ha traido una gran polémica tras de sí, relacionada con la representación de las moléculas de agua. Gracias a las indicaciones de Gloria Fuentes, que está suscrita a la lista de distribución de PDB, he leído algunos de los correos más relevantes, en los que los usuarios se quejan del formato. Incluyo los párrafos más relevantes.
Pero antes de comenzar, la referencia al primer correo de la hebra de correos:

Subject: pdb-l: Stop the new PDB format!
(https://lists.sdsc.edu/pipermail/pdb-l/2007-August/004020.html)

De este correo extraigo y traduzco un par de párrafos escritos por Joe Krahn, relacionados con el tratamiento de las moléculas de agua en el formato PDB:

La idea de que ATOM es sólo para residuos poliméricos no formaba
parte del formato original, y es específicamente uno de los cambios
que afirmo que es erróneo. El formato PDB original establecía que
ATOM es para "residuos estándar" que están definidos en una lista
de nombres de residuos
proporcionada en la documentación del formato
PDB, y la "lista de residuos estándar" incluía las moléculas de agua.
Los residuos no estándar deben definirse usando campos HET adicionales.
Con la base de datos de RCSB, los HETs deben estar completamente definidos
a su vez, lo cuál hace sencillo olvidar para ellos que la idea completa
de HETATM es permitir representar los tipos de residuo desconocidos.

RCSB ha añadido el concepto de que los HET son no poliméricos, pero
también se mantiene este concepto enmarañado por por no incluir
Se-Met(Selenometionina) (MSE), que ciertamente es de por sí bastante
para no ser un grupo HET. Por eso, la idea de que ATOM implique alguna
relación de polimerización es disfuncional. Lo que debería incluir el
formato PDB es un registro INIT que sea el contrapunto al registro TER.

En un correo de Eric Pettersen, respondiendo a Joe Krahn, le contestó que las moléculas de agua ya estaba también aparaciendo desde hacía muchos años como campo HETATM. Siguiendo el hilo, Frances C. Bernstein respondió lo siguiente:

	Estuve presente en la creación de lo que es llamado el
formato "PDB" a mediados de los 70 y HOH fue siempre HETATM. Lo
único especial sobre HOH fue que pensamos que no era necesario
incluir un campo HET en (virtualmente) cada entrada para
definir HOH.

Pensamos en ese momento que sería útil ser capaz de
calcular el número total de cada tipo de átomo en una entrada
y esto se puede hacer sumando el número de resíduos listados en
SEQRES, restándole el número apropiado de moléculas de agua, y
después añadiéndolos en la fórmula para los HETATMs.

[Para los que esteis interesad@s en la historia antigua
hubo un formato anterior al formato "PDB" que fue usado para más
o menos las primeras 100 entradas. Estaba basado en el formato de
salida del programa de refinamiento de espacio real de Bob Diamond.]

Por tanto, la polémica está servida ¡por una decisión de hace 30 años que tenía en su momento sentido!

Compartir:

Deja un comentario