{"id":11517,"date":"2006-01-03T02:31:00","date_gmt":"2006-01-03T02:31:00","guid":{"rendered":"http:\/\/weblogs.madrimasd.org\/\/bioinformatica\/archive\/2006\/01\/03\/11517.aspx"},"modified":"2006-01-03T02:31:00","modified_gmt":"2006-01-03T02:31:00","slug":"google-base-un-proyecto-que-podria-servir-a-los-bioinformaticos","status":"publish","type":"post","link":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/2006\/01\/03\/11517","title":{"rendered":"Google Base, un proyecto que podr\u00eda servir a los bioinform\u00e1ticos"},"content":{"rendered":"<p>Hace poco ha salido publicado en la revista <a href=\"http:\/\/www.nature.com\/\">Nature<\/a> un <a href=\"http:\/\/www.nature.com\/nature\/journal\/v438\/n7067\/full\/438400a.html\">art\u00edculo que habla sobre Google Base<\/a>, uno de los nuevos servicios Beta de investigaci\u00f3n que Google est\u00e1 desarrollando, y su uso para facilitar la miner\u00eda de datos sobre contenidos almacenados en \u00e9l.<\/p>\n<p><a href=\"http:\/\/base.google.com\/\">Google Base<\/a> es un lugar donde se puede almacenar todo tipo de contenido, ya sea enlaces a sitios web o ficheros que no se encuentran publicados en Internet. A partir de ese momento, dicho contenido se encuentra disponible e indexado en Google Base, y puede ser etiquetado y descrito con atributos (al estilo de palabras clave tipo &#8216;Autor&#8217;, &#8216;Fecha&#8217;, etc&#8230;), de forma que la b\u00fasqueda de contenidos se agilice. Si el contenido es relevante, el contenido almacenado puede llegar a aparecer incluso en las b\u00fasquedas Google.<\/p>\n<p>En el art\u00edculo de la revista Nature apuntan que los principales usuarios del servicio ser\u00e1n cient\u00edficos (entre ellos, bioinform\u00e1ticos), dado que permite a cualquiera compartir, almacenar y anotar informaci\u00f3n de forma global. El funcionamiento de dicho servicio se parece al objetivo de los <a href=\"http:\/\/www.w3.org\/2001\/sw\/\">grupos de W3C dedicados a web sem\u00e1ntica<\/a>: contenido simult\u00e1neamente legible por las personas y procesable por los ordenadores, ya sea de forma puntual o sistem\u00e1tica.<br \/><!--more-->La mayor parte del contenido web est\u00e1 dise\u00f1ado para ser visto, le\u00eddo y asimilado por personas, y no contiene informaci\u00f3n descriptiva adicional aprovechable por los ordenadores. Esto limita su utilidad a la hora de realizar b\u00fasquedas masivas o intentar extraer conclusiones, salvo con herramientas especializadas y muy limitadas a un determinado dominio del problema, como por ejemplo <a href=\"http:\/\/srs.ebi.ac.uk\/\">SRS<\/a> en bioinform\u00e1tica). Otro problema es la imposibilidad de reaprovechar la mayor parte de los datos relacionados con un contenido, simplemente porque se encuentran en una tabla accesoria en un formato no manejable de forma autom\u00e1tica por el ordenador, o redibujar las gr\u00e1ficas basadas en dicha tabla junto con datos adicionales.<\/p>\n<p>Evidentemente, existe un inconveniente: la heterogeneidad actual en los formatos de fichero empleados en Bioinform\u00e1tica (tanto en los art\u00edculos como en los datos y bases de datos), incomprensibles para el sistema Google Base a pesar de encontrarse en formato textual. En ese sentido, Google Base es muy sencillo, y no se adecua a las necesidades actuales de los bioinform\u00e1ticos, pero puede ser el comienzo de algo muy importante si dedican desarrollos e investigaci\u00f3n en Google. Cuando llegue el momento, llegar\u00e1 la siguiente pregunta: \u00bfser\u00e1 capaz de buscar en el volumen de datos disponibles en bioinform\u00e1tica de forma \u00e1gil?<\/p>\n<p>En cualquier caso, recomiendo la lectura de este art\u00edculo.<\/p>\n<p>Enlaces:<\/p>\n<ul>\n<li><a href=\"http:\/\/www.nature.com\/nature\/journal\/v438\/n7067\/full\/438400a.html\">Art\u00edculo original<\/a> en la revista Nature.<\/li>\n<li><a href=\"http:\/\/base.google.com\/\">Google Base<\/a> y su <a href=\"http:\/\/base.google.com\/base\/about.html\">FAQ<\/a> (<i>Frequently Asked Questions<\/i>).<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Hace poco ha salido publicado en la revista Nature un art\u00edculo que habla sobre Google Base, uno de los nuevos servicios Beta de investigaci\u00f3n que Google est\u00e1 desarrollando, y su uso para facilitar la miner\u00eda de datos sobre contenidos almacenados en \u00e9l. Google Base es un lugar donde se puede almacenar todo tipo de contenido, ya sea enlaces a sitios web o ficheros que no se encuentran publicados en Internet. A partir de ese momento, dicho contenido se encuentra disponible e indexado en Google Base, y puede ser etiquetado y descrito con atributos (al estilo de palabras clave tipo &#8216;Autor&#8217;,\u2026<\/p>\n","protected":false},"author":25,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0},"categories":[186,189],"tags":[],"blocksy_meta":{"styles_descriptor":{"styles":{"desktop":"","tablet":"","mobile":""},"google_fonts":[],"version":4}},"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/11517"}],"collection":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/users\/25"}],"replies":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/comments?post=11517"}],"version-history":[{"count":0,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/11517\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/media?parent=11517"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/categories?post=11517"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/tags?post=11517"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}