{"id":110384,"date":"2008-12-29T18:16:00","date_gmt":"2008-12-29T18:16:00","guid":{"rendered":"http:\/\/weblogs.madrimasd.org\/\/bioinformatica\/archive\/2008\/12\/29\/110384.aspx"},"modified":"2008-12-29T18:16:00","modified_gmt":"2008-12-29T18:16:00","slug":"novoseek","status":"publish","type":"post","link":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/2008\/12\/29\/110384","title":{"rendered":"novo|seek"},"content":{"rendered":"<p>Hace ya tiempo me pidi\u00f3 mi amigo Ram\u00f3n de <a href=\"http:\/\/www.bioalma.com\/\">BioAlma<\/a> que probara uno de los nuevos sistemas de <i>text-mining<\/i> que han desarrollado. El sistema se llama <a href=\"http:\/\/www.novoseek.com\/\">novo|seek<\/a>, y aunque haya nacido en una compa\u00f1\u00eda, lo puede usar cualquiera tras registrarse gratuitamente en <a href=\"http:\/\/www.novoseek.com\/RegisterForm.action\">la p\u00e1gina de creaci\u00f3n de una nueva cuenta<\/a>.<\/p>\n<p>Una vez que te creas la cuenta y te autenticas en el sistema, la p\u00e1gina principal de <a href=\"http:\/\/www.novoseek.com\/\">novo|seek<\/a> muestra una disposici\u00f3n similar a la de los buscadores de contenidos como <a href=\"http:\/\/www.google.com\/\">Google<\/a> o <a href=\"http:\/\/www.wikipedia.org\/\">Wikipedia<\/a>, con un campo de texto libre donde escribir los t\u00e9rminos a buscar. Una vez que lanzas la b\u00fasqueda, los resultados que se obtienen son del estilo de <a href=\"http:\/\/www.ihop-net.org\/\">iHOP<\/a> o <a href=\"http:\/\/scholar.google.com\/\">Google Scholar<\/a>: fragmentos de los abstracts o los art\u00edculos relevantes para los t\u00e9rminos de b\u00fasqueda, con informaci\u00f3n resaltada. Pero es ah\u00ed donde terminan las similitudes&#8230;<\/p>\n<div align=\"center\"><a href=\"http:\/\/www.novoseek.com\/\" alt=\"Si lees esto, es que han movido de sitio el logotipo de novo|seek\"><img decoding=\"async\" src=\"http:\/\/www.novoseek.com\/resources\/images\/logo_beta.gif\"><\/a><\/div>\n<p><!--more-->Una vez realizada la b\u00fasqueda inicial se puede empezar a refinar la misma, aprovechando el panel de filtros que aparece en la parte izquierda de la p\u00e1gina de resultados. Los filtros pueden ser tanto bibliogr\u00e1ficos (por ejemplo, autores o revistas) como conceptuales (por ejemplo, enfermedades, s\u00edntomas, genes, etc&#8230;). Son filtros din\u00e1micos, basados en los contenidos de los resultados obtenidos, y de esa manera s\u00f3lo se muestran filtros realmente \u00fatiles para la consulta, lo cu\u00e1l es de agradecer a la hora de refinar b\u00fasquedas sobre t\u00e9rminos muy comunes.<\/p>\n<p>Para probar qu\u00e9 tal funciona el sistema, he probado a buscar con un t\u00e9rmino bastante com\u00fan como <i>\u00abprostate cancer\u00bb<\/i>. La b\u00fasqueda inicial me devolvi\u00f3 alrededor de 43000 resultados en novo|seek y alrededor de 644000 en Google Scholar (iHOP estaba caido mientras estaba haciendo estas pruebas). Eleg\u00ed al azar para filtrar uno de los s\u00edntomas propuestos por novo|seek, <a href=\"http:\/\/es.wikipedia.org\/wiki\/Hematospermia\"><i>hematospermia<\/i><\/a> (que tiene como sin\u00f3nimo <a href=\"http:\/\/es.wikipedia.org\/wiki\/Hemospermia\"><i>hemospermia<\/i><\/a>), y la b\u00fasqueda se centr\u00f3 en 30 art\u00edculos. Buscando en Google Scholar por \u00ab<i>prostate cancer hematospermia<\/i>\u00bb obtuve 498 art\u00edculos, mientras que con \u00ab<i>prostate cancer hemospermia<\/i>\u00bb obtuve 299 art\u00edculos, lo cu\u00e1l muestra que Google Scholar no tiene en cuenta los sin\u00f3nimos de los t\u00e9rminos de b\u00fasqueda. Como cada sistema tiene su propio m\u00e9todo de puntuaci\u00f3n, y Google Scholar no busca por iniciativa propia los sin\u00f3nimos de los t\u00e9rminos, no es f\u00e1cil comparar cu\u00e1l de ellos proporciona los mejores resultados, al menos no con la prueba tan sencilla que realic\u00e9.<\/p>\n<p>Una vez estamos conformes con los resultados obtenidos, podemos inspeccionar cada uno de los art\u00edculos de forma detallada. En la vista detallada de un art\u00edculo se muestra el t\u00edtulo y abstract, autores, revista, fecha de publicaci\u00f3n, y la posibilidad de que novo|seek marque en el texto los tipos de t\u00e9rminos en los que estemos interesados: enfermedades, drogas, genes o prote\u00ednas, s\u00edntomas, etc&#8230;<\/p>\n<p>Aunque el sistema est\u00e1 todav\u00eda en fase <a href=\"http:\/\/es.wikipedia.org\/wiki\/Versi%C3%B3n_beta#Beta\">beta<\/a>, es bastante usable. Personalmente pienso que le falta algo de conectividad, por ejemplo con <a href=\"http:\/\/www.ncbi.nlm.nih.gov\/pubmed\/\">PubMed<\/a> o <a href=\"http:\/\/www.pubmedcentral.nih.gov\/\">PubMed Central<\/a> para el tema de los art\u00edculos que est\u00e9n disponibles de forma libre, o con <a href=\"http:\/\/www.zotero.org\/\">Zotero<\/a> para poder recopilar r\u00e1pidamente la bibliograf\u00eda relacionada con una b\u00fasqueda en concreto, pero seguro que mejorar\u00e1 con el paso del tiempo.<\/p>\n<p>\u00a1Felices Fiestas!<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Hace ya tiempo me pidi\u00f3 mi amigo Ram\u00f3n de BioAlma que probara uno de los nuevos sistemas de text-mining que han desarrollado. El sistema se llama novo|seek, y aunque haya nacido en una compa\u00f1\u00eda, lo puede usar cualquiera tras registrarse gratuitamente en la p\u00e1gina de creaci\u00f3n de una nueva cuenta. Una vez que te creas la cuenta y te autenticas en el sistema, la p\u00e1gina principal de novo|seek muestra una disposici\u00f3n similar a la de los buscadores de contenidos como Google o Wikipedia, con un campo de texto libre donde escribir los t\u00e9rminos a buscar. Una vez que lanzas la\u2026<\/p>\n","protected":false},"author":25,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0},"categories":[189],"tags":[],"blocksy_meta":{"styles_descriptor":{"styles":{"desktop":"","tablet":"","mobile":""},"google_fonts":[],"version":4}},"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/110384"}],"collection":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/users\/25"}],"replies":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/comments?post=110384"}],"version-history":[{"count":0,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/posts\/110384\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/media?parent=110384"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/categories?post=110384"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/bioinformatica\/wp-json\/wp\/v2\/tags?post=110384"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}