{"id":131277,"date":"2011-07-16T15:02:43","date_gmt":"2011-07-16T14:02:43","guid":{"rendered":"http:\/\/www.madrimasd.org\/blogs\/bioinformatica\/?p=131277"},"modified":"2011-07-17T11:43:37","modified_gmt":"2011-07-17T10:43:37","slug":"nextprot-proteinas-humanas-anotadas-al-maximo","status":"publish","type":"post","link":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/2011\/07\/16\/131277","title":{"rendered":"neXtProt: prote\u00ednas humanas anotadas al m\u00e1ximo"},"content":{"rendered":"<p>Durante estos d\u00edas estoy asistiendo al <a href=\"http:\/\/www.iscb.org\/ismbeccb2011\" target=\"_blank\">ISMB\/ECCB 2011<\/a>, en Viena, Austria, y los dos primeros d\u00edas no son de congreso como tal, sino dedicados a tutoriales y reuniones de SIGs (<em>Special Interest Groups<\/em>). En el <a href=\"http:\/\/biofunctionprediction.org\/\" target=\"_blank\">SIG de CAFA<\/a> (<em>Critical Assessment on Function Prediction<\/em>) escuch\u00e9 ayer una charla muy interesante de <a href=\"http:\/\/en.wikipedia.org\/wiki\/Amos_Bairoch\" target=\"_blank\">Amos Bairoch<\/a> sobre la relaci\u00f3n existente entre n\u00famero de genes y el n\u00famero de prote\u00ednas humanas, sobre UniProt y el proceso de anotaci\u00f3n, lo que hay anotado sobre prote\u00ednas humanas y uno de los nuevos desarrollos que se est\u00e1n llevando a cabo en el <a href=\"http:\/\/www.isb-sib.ch\/\" target=\"_blank\">SIB<\/a> (<em>Swiss Institute of Bioinformatics<\/em>). Este desarrollo es <a href=\"https:\/\/www.nextprot.org\/\" target=\"_blank\">neXProt<\/a>.<\/p>\n<div style=\"text-align:center\"><a href=\"http:\/\/www.nextprot.org\/\"><img decoding=\"async\" title=\"neXtProt\" src=\"https:\/\/www.nextprot.org\/db\/images\/blueflat\/nextprot-small.png\" alt=\"\" width=\"122\" height=\"43\" \/><\/a><\/div>\n<p>\u00bfDe d\u00f3nde nace este proyecto? En Septiembre de 2008 el grupo de UniProt\/Swiss-Prot termin\u00f3 la primera anotaci\u00f3n manual completa de lo que se cre\u00eda el conjunto completo de prote\u00ednas humanas, derivadas de alrededor de 20000 genes. Aunque fue un gran hito, por ya estar esta colecci\u00f3n de datos bastante bien anotada con informaci\u00f3n relacionada con investigaci\u00f3n m\u00e9dica biomolecular, queda todav\u00eda un gran hueco en el conocimiento disponible en t\u00e9rminos de informaci\u00f3n funcional sobre las prote\u00ednas humanas. Tambi\u00e9n queda un gran hueco que rellenar a nivel de caracterizaci\u00f3n de estas prote\u00ednas, como <a href=\"http:\/\/es.wikipedia.org\/wiki\/Modificaci%C3%B3n_postraduccional\" target=\"_blank\">modificaciones postrasduccionales<\/a>, interacciones con otras prote\u00ednas, localizaciones subcelulares de las mismas, etc&#8230;<\/p>\n<p>Entonces, el proyecto neXtProt tiene como objetivo rellenar esos huecos, o lo que es lo mismo, utilizar todas las tecnolog\u00edas, t\u00e9cnicas e informaci\u00f3n disponibles para caracterizar las prote\u00ednas de funci\u00f3n desconocida. Si uno piensa en el n\u00famero de genes de los que dispone el genoma humano, que son unos 20000 genes (y con cada revisi\u00f3n, menos), piensa que el n\u00famero de prote\u00ednas tiene que estar en el mismo orden de magnitud. Pero eso es un error:<\/p>\n<div style=\"text-align:center\"><a href=\"http:\/\/www.madrimasd.org\/blogs\/bioinformatica\/files\/2011\/07\/IMG_6355.jpg\"><img decoding=\"async\" class=\"aligncenter size-medium wp-image-131278\" title=\"Numbers from human genes to human proteins\" src=\"http:\/\/www.madrimasd.org\/blogs\/bioinformatica\/files\/2011\/07\/IMG_6355-e1310823707464-300x247.jpg\" alt=\"\" width=\"300\" height=\"247\" srcset=\"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/files\/2011\/07\/IMG_6355-e1310823707464-300x247.jpg 300w, https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/files\/2011\/07\/IMG_6355-e1310823707464-1024x844.jpg 1024w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/a><\/div>\n<p>Como pod\u00e9is ver, desde los genes (en el c\u00f3digo gen\u00e9tico) hasta las prote\u00ednas hay un largo camino, que hace que al final haya una estimaci\u00f3n de que existen alrededor de 5 millones de prote\u00ednas en nuestro <a href=\"http:\/\/es.wikipedia.org\/wiki\/Proteoma\" target=\"_blank\">proteoma completo<\/a>. Para conseguir anotar de forma adecuada todas estas prote\u00ednas neXtProt va a integrar (no enlazar, realmente integrar) en corto a medio plazo informaci\u00f3n prote\u00f3mica experimental de alta calidad, datos experimentales de <a href=\"http:\/\/es.wikipedia.org\/wiki\/SiRNA\" target=\"_blank\">siRNA<\/a>, datos estructurales experimentales, informaci\u00f3n de rutas metab\u00f3licas, informaci\u00f3n poblacional de CNV (cu\u00e1nto se expresan las distintas variantes de prote\u00ednas en las distintas poblaciones humanas) e informaci\u00f3n disponible de interacci\u00f3n entre las distintas prote\u00ednas y las prote\u00ednas con f\u00e1rmacos y drogas.<\/p>\n<p>Pero ya hay trabajo hecho. La \u00faltima publicaci\u00f3n de <a href=\"http:\/\/www.nextprot.org\/\" target=\"_blank\">neXtProt<\/a> ya integra informaci\u00f3n sobre casi 21000 prote\u00ednas, proveniente de las bases de datos <a href=\"http:\/\/www.uniprot.org\/\" target=\"_blank\">UniProt<\/a>, <a href=\"http:\/\/www.ensembl.org\/\" target=\"_blank\">Ensembl<\/a>, <a href=\"http:\/\/bgee.unil.ch\/\" target=\"_blank\">BGee<\/a>, <a href=\"http:\/\/www.expasy.org\/enzyme\/\" target=\"_blank\">ENZYME<\/a>, <a href=\"http:\/\/www.geneontology.org\/\" target=\"_blank\">GO<\/a>, <a href=\"http:\/\/www.ebi.ac.uk\/GOA\/uniprot_release.html\" target=\"_blank\">GOA<\/a>, <a href=\"http:\/\/www.proteinatlas.org\/\" target=\"_blank\">HPA<\/a>, <a href=\"http:\/\/www.ebi.ac.uk\/interpro\/\" target=\"_blank\">InterPro<\/a>, <a href=\"http:\/\/www.nlm.nih.gov\/mesh\/MBrowser.html\" target=\"_blank\">MeSH<\/a>, <a href=\"http:\/\/www.expasy.org\/prosite\/\" target=\"_blank\">PROSITE<\/a> y <a href=\"http:\/\/www.ncbi.nlm.nih.gov\/sites\/entrez?db=pubmed\" target=\"_blank\">PubMed<\/a>. Me da la impresi\u00f3n de que este proyecto va ser una piedra angular de la bioinform\u00e1tica, igual que lo ha sido <a href=\"http:\/\/www.ensembl.org\/\" target=\"_blank\">Ensembl<\/a> en los pasados a\u00f1os.<\/p>\n<p>Enlaces<\/p>\n<ul>\n<li><a href=\"http:\/\/www.nextprot.org\/\" target=\"_blank\">Sitio web de neXtProt<\/a>.<\/li>\n<li><a href=\"http:\/\/www.nextprot.org\/db\/statistics\/release\" target=\"_blank\">Bases de datos integradas (y versiones) en neXtProt<\/a>.<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Durante estos d\u00edas estoy asistiendo al ISMB\/ECCB 2011, en Viena, Austria, y los dos primeros d\u00edas no son de congreso como tal, sino dedicados a tutoriales y reuniones de SIGs (Special Interest Groups). En el SIG de CAFA (Critical Assessment on Function Prediction) escuch\u00e9 ayer una charla muy interesante de Amos Bairoch sobre la relaci\u00f3n existente entre n\u00famero de genes y el n\u00famero de prote\u00ednas humanas, sobre UniProt y el proceso de anotaci\u00f3n, lo que hay anotado sobre prote\u00ednas humanas y uno de los nuevos desarrollos que se est\u00e1n llevando a cabo en el SIB (Swiss Institute of Bioinformatics). Este\u2026<\/p>\n","protected":false},"author":25,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0},"categories":[2442,1,31,189],"tags":[],"blocksy_meta":{"styles_descriptor":{"styles":{"desktop":"","tablet":"","mobile":""},"google_fonts":[],"version":4}},"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131277"}],"collection":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/users\/25"}],"replies":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/comments?post=131277"}],"version-history":[{"count":5,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131277\/revisions"}],"predecessor-version":[{"id":131283,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/131277\/revisions\/131283"}],"wp:attachment":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/media?parent=131277"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/categories?post=131277"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/tags?post=131277"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}