Un buen día, el Director de un Instituto del CSIC me comentó asombrado la respuesta de un Coordinador de Área cuando el primero le interpeló por que había sido rechazada la solicitud de una beca presentada desde su instituto. ¿Y sabes lo que me comentó?. Juanjo ¡Qué el tema iba a dar lugar a escasas “publicaciones potenciales”! Dudo, sinceramente que esta fuera la respuesta concreta, ya que de ser así (….). Si el gasto de las empresas por descifrar los algoritmos de Google supone muchos miles de millones de euros anuales, imagínense si los científicos pudiéramos averiguar con antelación el número de citas que van a alcanzar nuestros artículos años después. Recientemente unos investigadores de IA, nos dicen que han descubierto la piedra filosofal, y se quedan tan tranquilos. ¿¿??. 

 watson-y-crick-o-el-desciframiento-del-codigo-genetico

Watson y Crick descifrando las “letras clave” del código genético. Fuente: Science News

Lo dicho, muchos colegas matarían (metafóricamente hablando, ¿o no?) por atesorar un algoritmo que les indicara el número de citaciones que iba a recibir el artículo que pretenden publicar. Ahora se nos informa de que tal constructo matemático ya ha sido probado con “éxito”. ¡Fastuoso!. Más aun, parece ser que el meollo de la cuestión reside en los vocablos empleados en el resumen y las palabras clave que le postceden (keywords en suahili), más que en la calidad del propio articulo. En dos keywords: “Im” “Presionante”, como sabiamente nos dice nuestro afamado intelectual, filósofo y lingüista, Jesulín de Ubrique. Ahora ya entiendo porque se añaden las expresiones “cambio climático, IPCC” o “esto servirá para detectar nuevas dianas terapéuticas” ad nauseam, aunque se trate de indagaciones a cerca de las ideas inmanentes de Platón. Todo un descubrimiento que cambiará la sociología de la ciencia (si: todo puede ir a peor…….).

james-watson-y-francis-crick

¿Va a tener esta publicación muchas citas?. ¡Elemental mi querido Watson!, miles y seremos Premios Nóbel. Fuente: PepQuimic

Las revistas indexadas ya pueden decidir que artículos aceptarán para su publicación, sin tener que molestar a los investigadores con las tediosas y tendenciosas “revisiónes por iguales” Del mismo modo, las agencias de evaluación de la actividad investigadora podrán dejar de sufragar los gastos ocasionados por los expertos que deciden que proyectos financiar. Más aun, sabremos que “jóvenes cerebros” deben continuar en una institución científica y a cuales deben ser “descerebrados” arrojándolos por la ventana. También se podrán otorgar Premios Nóbel con antelación, sin que el agraciado deba sufrir esperas exasperantes, aterrado con perder la vida y quedarse fuera de juego injustamente.  

Durante años he utilizado el palabro “superfragilisticoespialidoso” en mis denodados e infructuosos intentos por publicar en Nature o Science, con escaso éxito. ¡Ahora lo entiendo!

Del mismo modo, la indagación científica sufrirá una revolución sin precedentes, por cuanto los investigadores nos dedicaremos a un sofisticado “data mining” en las narraciones (que no en los contenidos, algo mucho más tedioso) de los estudios más citados. De este modo, disminuiremos drásticamente los dispendios actuales que infligimos a los erarios públicos en costosísimos y prolongados experimentos, que a menudo no nos conducen a ningún lado.  Vamos que todos saldremos ganando.

Tan solo albergo una duda, eso sí, sin importancia: ¿Y la creatividad científica? Pues lo dicho, voy a inscribirme en un curso de “data mining”, así como en otro de algoritmos de búsqueda. ¡Al fin una noticia revolucionaria, de las de verdad! “Y todo de manera objetiva”, como acertadamente exclaman los autores. Eso si, no sé si los periodistas se han quedado cortos o se han pasado de largo, respecto al contenido del trabajo original. Tal tarea os lo dejo a vosotros. Yo ya se en que perder el tiempo más productivamente.

Y ya sabéis: “el actual calentamiento climático generará nuevas dianas terapéuticas con vistas a mejorar las predicciones de los modelos de circulación general de la atmósfera, y otras enfermedades raras, como el IPCC y el gran colisionador de hadrones, dicho sea de paso”.

Juan José Ibáñez

Francamente excitado por el notición, buscando ahora su palabro, promesa de un futuro ¡Eureka!.   

Predicen el número de citas que tendrán los artículos científicos

Investigadores de la Universidad Politécnica de Madrid (UPM) han elaborado un sistema predictivo para calcular el número de citas futuras que tendrán los artículos científicos publicados. FUENTE | UPM – mi+d  08/03/2010

A través de un estudio sobre artículos publicados en la revista Bioinformatics, investigadores del Departamento de Inteligencia Artificial de la UPM han construido una serie de modelos con los que se puede predecir, en el mismo momento de su publicación, el número de citas que recibirá un artículo publicado en dicha revista.

Fuente: (cc) Julio Pesquero

Debido al apogeo de la ciencia y a la multitud de artículos que se publican sobre ella, los editores de las revistas científicas se encuentran con la dificultad de saber elegir, entre una gran variedad, los artículos de mayor calidad y, al mismo tiempo, con el mayor número de lectores posibles.

Con el fin de evaluar los resultados de las investigaciones científicas de una manera objetiva, se han desarrollado una serie de medidas cuantitativas asociadas a las publicaciones de las mismas. Una de estas medidas es el número de citas recibidas por un artículo en un periodo determinado de tiempo. Aunque el número de citas recibidas es una medida de visibilidad, podría ser considerada como una medida indirecta de la calidad del artículo.

Relacionado con esto, investigadores de la Facultad de Informática de la UPM han construido unos modelos inteligentes [1] capaces de predecir el número de citas que, en cada uno de los primeros cuatro años, recibirán los artículos publicados en la revista Bioinformatics (revista concreta donde han aplicado sus modelos).

Para la construcción de estos modelos se han utilizado como variables predictivas una selección de ciertas palabras clave identificadas de forma automática a partir de los resúmenes de los artículos, junto con variables referidas a las áreas de publicación de los artículos y a la fecha de publicación de los mismos. Gracias a las variables predictivas utilizadas se podrán realizar en el mismo momento de la publicación predicciones sobre el número de citas que recibirá un artículo determinado (Fig. 1).

El porcentaje de acierto de los modelos depende del área de publicación del artículo que se quiera predecir, del año que se quiera pronosticar y del método utilizado para realizar la predicción. Tras realizar distintas predicciones con cada combinación de área, año y método, se obtiene un porcentaje de acierto medio del 91.8% en cada una de las posibles áreas y años de predicción.

Gracias a estos modelos predictivos se demuestra que la aparición de ciertas palabras en el resumen del artículo está correlacionada con el número de citas recibidas. Estas palabras pueden ser usadas como un punto de referencia para identificar temas que están de actualidad.

Finalmente, se debe resaltar la ventaja de estos modelos frente a los existentes ya que ofrecen la posibilidad de predecir en el mismo momento de la publicación el número de citas que obtendrá un artículo en los primeros años.

[1] Bioinformatics, 25, 3303-3309 (2009). «Predicting citation count of Bioinformatics papers within four years of publication». Ibáñez, A., Larrañaga, P. y Bielza, C.

Noticias relacionadas, según el boletín de noticias de mi+d

– La mejor ciencia no es siempre la que más figura en los medios de comunicación

– Un estudio analiza la discriminación de las citas que emplean los científicos

Compartir:

Un comentario

  1. Muy bueno… quizá la herramienta al final funcione para predecir el pasado… (cuando las cosas se hacían sin herramienta de predicción).

    Sabiendo esto… tendrán que hacer alguna otra que sirva para controlar las palabras clave que se pongan de ahora en adelante… Cuando prueben la nueva funcionará con esta etapa2, porque serán las palabras clave… excepto estas que usan todos, excepto este truco que usan todos…

    Y así sucesivamente 🙂

Deja un comentario