{"id":131451,"date":"2014-05-19T17:26:44","date_gmt":"2014-05-19T15:26:44","guid":{"rendered":"http:\/\/www.madrimasd.org\/blogs\/bioinformatica\/?p=131451"},"modified":"2014-05-19T17:26:56","modified_gmt":"2014-05-19T15:26:56","slug":"los-accession-numbers-de-uniprot-tendran-mas-longitud-a-partir-de-junio","status":"publish","type":"post","link":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/2014\/05\/19\/131451","title":{"rendered":"Los accession numbers de UniProt tendr\u00e1n m\u00e1s longitud a partir de Junio"},"content":{"rendered":"<p><a title=\"UniProt\" href=\"http:\/\/www.uniprot.org\/\" target=\"_blank\">UniProt<\/a> es una de las bases de datos de prote\u00ednas m\u00e1s curada (en su secci\u00f3n SW) y mantenida actualmente, y por eso es tomada como una de las bases de datos de referencia a nivel de informaci\u00f3n de prote\u00ednas. Desde que se hizo p\u00fablica en Julio de 1986 Swiss-Prot (una de las integrantes de UniProt, y predecesora), cada entrada de la base de datos dispone de un\u00a0<em>accession number<\/em> (AC en el formato SW) principal, que sirve para identificar de forma inequ\u00edvoca cada entrada. Tambi\u00e9n se almacena para cada entrada\u00a0cero o m\u00e1s <em>accession number<\/em> secundarios, que fueron usados en el pasado para esta entrada, y que sirven tanto para\u00a0mantener un historial dentro de UniProt como para poder relacionar material de investigaci\u00f3n antiguo (por ejemplo, art\u00edculos) con los datos actuales.<\/p>\n<p>Inicialmente, un identificador de Swiss-Prot o TrEMBL ten\u00eda el siguiente formato de 6 caracteres:<\/p>\n<table style=\"margin: 0px auto;\" align=\"center\">\n<tbody>\n<tr style=\"background-color: #dedede;\" align=\"center\">\n<th>1<\/th>\n<th>2<\/th>\n<th>3<\/th>\n<th>4<\/th>\n<th>5<\/th>\n<th>6<\/th>\n<\/tr>\n<tr>\n<td>[O,P,Q]<\/td>\n<td>[0-9]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[0-9]<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>lo que permit\u00eda tener 13996800 entradas diferentes (3\u00b710\u00b7(26+10)<sup>3<\/sup>\u00b710). Posteriormente, se permitieron m\u00e1s letras en la primera posici\u00f3n (y menos en la tercera):<\/p>\n<table style=\"margin: 0px auto;\" align=\"center\">\n<tbody>\n<tr style=\"background-color: #dedede;\" align=\"center\">\n<th>1<\/th>\n<th>2<\/th>\n<th>3<\/th>\n<th>4<\/th>\n<th>5<\/th>\n<th>6<\/th>\n<\/tr>\n<tr>\n<td>[O,P,Q]<\/td>\n<td>[0-9]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[0-9]<\/td>\n<\/tr>\n<tr>\n<td>[A-N,R-Z]<\/td>\n<td>[0-9]<\/td>\n<td>[A-Z]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[0-9]<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>lo cu\u00e1l aument\u00f3 el n\u00famero de identificadores diferentes a 91497600 ((23\u00b710\u00b726\u00b7(26+10)<sup>2<\/sup>\u00b710) = 77500800).<\/p>\n<p>Pero, en la versi\u00f3n de Mayo de 2014 ya hay 56555610\u00a0entradas (545388 de UniProt\/SwissProt y\u00a056010222 de UniProt\/TrEMBL), eso sin contar los <em>accession number<\/em> secundarios de dichas entradas. Los encargados de UniProt han hecho sus propios c\u00e1lculos de estimaci\u00f3n del crecimiento de la base de datos y de uso de <em>accession numbers<\/em>, y se han dado cuenta que para finales de 2014 se iban a quedar sin <em>accession numbers<\/em> para prote\u00ednas nuevas. As\u00ed que, a partir del 11 de Junio podr\u00e1 haber entradas que usen, adem\u00e1s de estos formatos, <em>accession number<\/em> de 10 caracteres:<\/p>\n<table style=\"margin: 0px auto;\" align=\"center\">\n<tbody>\n<tr style=\"background-color: #dedede;\" align=\"center\">\n<th>1<\/th>\n<th>2<\/th>\n<th>3<\/th>\n<th>4<\/th>\n<th>5<\/th>\n<th>6<\/th>\n<th>7<\/th>\n<th>8<\/th>\n<th>9<\/th>\n<th>10<\/th>\n<\/tr>\n<tr>\n<td>[O,P,Q]<\/td>\n<td>[0-9]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[0-9]<\/td>\n<\/tr>\n<tr>\n<td>[A-N,R-Z]<\/td>\n<td>[0-9]<\/td>\n<td>[A-Z]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[0-9]<\/td>\n<\/tr>\n<tr>\n<td>[A-N,R-Z]<\/td>\n<td>[0-9]<\/td>\n<td>[A-Z]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[0-9]<\/td>\n<td>[A-Z]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[A-Z,0-9]<\/td>\n<td>[0-9]<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>que proporcionar\u00e1n (23\u00b710\u00b7(26\u00b7(26+10)<sup>2<\/sup>\u00b710)<sup>2<\/sup>) = 2.6114669568\u00b710<sup>13<\/sup> nuevos identificadores (una diferencia de 6 \u00f3rdenes de magnitud),\u00a0margen suficiente para varios a\u00f1os m\u00e1s.<\/p>\n<p><span style=\"text-decoration: underline;\">Enlaces<\/span><\/p>\n<ul>\n<li><a href=\"http:\/\/www.uniprot.org\/changes\/accession_format\">http:\/\/www.uniprot.org\/changes\/accession_format<\/a><\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>UniProt es una de las bases de datos de prote\u00ednas m\u00e1s curada (en su secci\u00f3n SW) y mantenida actualmente, y por eso es tomada como una de las bases de datos de referencia a nivel de informaci\u00f3n de prote\u00ednas. Desde que se hizo p\u00fablica en Julio de 1986 Swiss-Prot (una de las integrantes de UniProt, y predecesora), cada entrada de la base de datos dispone de un\u00a0accession number (AC en el formato SW) principal, que sirve para identificar de forma inequ\u00edvoca cada entrada. Tambi\u00e9n se almacena para cada entrada\u00a0cero o m\u00e1s accession number secundarios, que fueron usados en el pasado\u2026<\/p>\n","protected":false},"author":25,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0},"categories":[1,31],"tags":[],"blocksy_meta":{"styles_descriptor":{"styles":{"desktop":"","tablet":"","mobile":""},"google_fonts":[],"version":4}},"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131451"}],"collection":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/users\/25"}],"replies":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/comments?post=131451"}],"version-history":[{"count":22,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131451\/revisions"}],"predecessor-version":[{"id":131472,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131451\/revisions\/131472"}],"wp:attachment":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/media?parent=131451"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/categories?post=131451"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/tags?post=131451"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}