ciencia + transparencia = ciencia 2.0

La convergencia del open access, opendata, open source, open standars y open lab notebook, entre otrosmovimientos en marcha, hace viable la noción de ciencia 2.0.

Portada_revista_madri+d: 20_años_Ley_de_la_CienciaPorencargo de PatricioMorcillo, director de la revistamadri+d, escribí un artículo que acaba de aparecersobre la lanoción de ciencia 2.0. Presento aquí unextracto que resume lo sustantivo. Las nuevas tecnologías, aligual que están modificando lo que entendemos por cultura,también nos obligan a repensar lo que es la ciencia. O, dichoen otros términos, ¿está la web 2.0 sacando aflote una ciencia 2.0? Miremos donde miremos se impone la respuestaafirmativa.

Elpróximo lanzamiento de la revista PlosOne,perteneciente al grupo Public Library of Science, es un buenejemplo de lo que está pasando. A nadie se le escapa que elsistema de control de calidad de los artículos científicos,elpeer review, está en crisis. No es que haya dejadode ser útil, sino que son tan agudos sus problemas que ya sediscuten abiertamente.

Elopen peer review que postula PlosOne es expresiónde un movimiento de mayor calado y que está en resonancia conlas movilizaciones favorables al openaccess y al opendata pues, en la práctica, el primero es una autopistaque conduce necesariamente al segundo. El asunto es que hoy lasnuevas tecnologías permiten no sólo hacer experimentosque producen/demandan gigantescas masas de datos, sino situarlostambién en un repositorio a disposición de quien losnecesite.

Elhecho, sin embargo, es que históricamente (sin entrar aquíen el vertiginoso proceso de privatización) se han producidograndespérdidas debido a las deficientes políticas dearchivado de datos. Y no estamos hablando solamente de seguridad,sino sobre todo de interoperatividad, pues la diversidad detecnologías de conservación y las discontinuidadesinstitucionales (cierre, cambio o abandono de bases de datos) hanconvertido el uso de la información pública en unacarrera de obstáculos difícil de superar. Y la pérdidade datos implica despilfarro de recursos y de conocimientos.

Muchomás en nuestro tiempo que podemos diseñar/personalizarherramientas capaces de extraer información a conveniencia delas bases de datos accesibles. Baste aquí con considerar lared como un ingente repositorio para percibir la importancia de quela información sea accesible, pues ha sido a partir de estaderiva que Internet ha permitido la creación de miles deproductos, muchos de ellos desarrollados por usuarios anónimos,que no cesan de agregar valor añadido al conjunto.

El caso deAmazon es paradigmático pues, tras obtener, igual que suscompetidores, la información de los libros del registro ISBNoptó por un modelo de negocio en el que los clientes podíanañadir comentarios, incrementando exponencialmente el valor dela información ofrecida a través de su registro ASIN.Lo mismo está sucediendo ahora con la informacióncartográfica y la continua amalgamación de datos(mashups)que hacen los usuarios, mezclando los planos de ciudades con losdatos/noticias de criminalidad, gustos musicales o precios dealquiler de la vivienda para ofrecer unas cartografíasinverosímiles, dinámicas y colaborativas que inventanlas más extrañas formas de “vecindad”.

Podríamosseguir con nuevos ejemplos, sin que mejore la claridad del argumentoque nos traemos entre manos: abrir los datos, no sólo es unrequerimiento derivado de la doble necesidad de que la ciencia seacerque al viejo modelo de una República de Sabios y al queexige una democratización del conocimiento, sino que implicaapostar por la oportunidad difícilmente discutible de queaparezcan nuevas e imprevistas formas de usarlos y conectarlos o, enotros términos, de crear conocimiento.

Losdatos, en consecuencia, deberían ser algo que se encontrase enla web, antes que en el laboratorio. La web 2.0 llevará elsello DataInside, una analogía con el Intel Inside del PCque domina la cultura del escritorio y que será reemplazadopor la noción de la red como una plataforma global decomputación. La web del futuro, la llamada websemántica, (ver StrangeAttractor), sentenció no hace mucho TimBerners-Lee será una redde datos (alternativa a la actual red de documentos).

Y,en efecto, la combinación de open access y open datademanda iniciativas que favorezcan el open source y el opendocument, es decir el software de código abierto y losformatos estándar. Los motivos son obvios, como ha explicadoentre otros muchos GlynMoody y IanFoster. Para que la web funcione como una plataforma esimprescindible asegurar la interoperatividad entre todas las máquinasy todos los programas o, dicho en otros términos, que todoslos objetos que circulen por la red puedan ser correctamenteinterpretados, cualquiera que sea el hardware o el software queempleemos. La red, en consecuencia, debe ser neutral desde el puntode vista tecnológico.

Queun documento sea estándar quiere decir que ha sido codificadoy archivado según protocolos abiertos y que, en consecuencia,pueden ser modificados y adaptados a nuestra necesidades. Tambiénsignifica (ver la interesante entrevistaa Peter Murray-Rust en Reactive Reports) que no dependemos deninguna empresa para editarlo, formatearlo, enviarlo o archivarlo,pues tales funciones deberían poder ejecutarse con cualquierade los procesadores de textos o clientes de correo existentes en elmercado. Y lo mismo tendría que ocurrir con las bases dedatos, pues de otro modo no podríamos diseñarherramientas específicas (API) para interactuar con ellas yextraer los datos que necesitemos. Y esto es importante porque lasbases de datos no debieran condicionar la forma en la que puedan serconsultadas, pues siempre es concebible una utilidad insospechada porsus creadores y que demandará nuevas API cuyo desarrollo esimpensable sin tener acceso al código fuente.

Perohay más. Siempre se ha dicho que la replicabilidad es una delas características insoslayables del trabajo científico.Si esta condición debe ser mantenida en las cienciasexperimentales, tenemos que preguntarnos por la pertinencia deprogramas informáticos de código oculto (cerrado) quefuncionan como una caja negra en donde se introducen datos para quesean procesados y luego devueltos como un output o soluciónque no puede verificarse dada la imposibilidad de conocer lasoperaciones a las que han sido sometidas las cifras iniciales que lesuministramos. No es que tengamos pruebas que justifiquen algunasombra de desconfianza. Lo que aquí importa es la cuestiónde fondo de si podemos usar herramientas científicas que estánconstruidas para que no podamos saber cómo funcionan.

Elasunto es delicado, pues no cuesta mucho imaginar instalaciones(centrales nucleares, laboratorios científicos o bases dedatos fiscales, por ejemplo) que, siendo estratégicas para laseguridad nacional, deberían ser gestionadas por programasinformáticos de código abierto, no sea que elpaís/corporación donde se redactó el softwareque los regula se enemigue o quiebre y deje de cedernos lasactualizaciones necesarias para el correcto funcionamiento de todoslo procesos. Así, soberanía (nacional), replicabilidad(científica), interoperabilidad (tecnológica) y código(lengua) son conceptos de mucha enjundia política que seentrelazan de diversas e intrincadas maneras.

LaCiencia 2.0 tiene que ver entonces con todas las tecnologíasque favorecen la cultura de la transparencia y de la colaboración.Si le agregamos los dígitos 2.0 que aluden, como sucede conlos programas informáticos, a la existencia de versionesantiguas, estables o en construcción, es porque queremosreivindicar no sólo el desideratum de una forma desaberen Beta, sino también la viabilidad de una forma deorganización desjerarquizada, desnacionalizada, desinteresada,despatronalizada y descorporativizada o, en otros términos,verdaderamente acéfala, cosmopolita, altruista, comunitaristay pública.

Usamosel meme (o marca, en el sentido más comercial del término)lanzado por O’Reilly por la provocación que suponeconceptualizar la web como algo editable y siempre en construcciónpor los mismos internáutas. Podríamos hablar, y dehecho se hace, de Biblioteca2.0, Ciudad2.0 y Futuro 2.0. Lo que estas denominacionescomparten es la voluntad de que converjan todas las tecnologíasy prácticas favorables a la horizontalidad, la transparencia,la participación o cualquier otra forma de implicaciónde los usuarios en su gestión.

La ya citada PlosOne,por ejemplo, admite comentarios (como también alertas,etiquetas o enlaces a otros datos, textos o criticas) sin preguntarpor la especialidad, cargo, institución o edad del críticoy, al igual que hay estudiantes que son editores de revistas deprestigio o hackers que son excelentes programadores sin pertenecer aninguna estructura académica, también cabe esperar másde una sorpresa de estos experimentos incipientes.

Laciencia 2.0 seguirá necesitando investigadores, datos,publicaciones y gestores, pero quizás pueda contribuir aevitar las muchas y disparatadas formas de nepotismo, ocultamiento yprivatización, por no citar los cada día másfrecuentes casos de despilfarro, duplicación o fraude. Noestamos refiriéndonos a una utopía inalcanzable, laderiva que está tomando la ciencia, prosperará en lamedida en que entren en circulación proyectos y tecnologíasque la hagan viable.

Yahemos hablado de la eficacia del broadcasting y del openpeer review, ahora vamos a detenernos en el OpenWetWare(OWW, nacido como Endipedia en mayo de 2005), una aventura quepromueve un grupo de investigadores del MIT. Quien haya llegadohasta aquí entenderá perfectamente de qué setrata. Consiste en apostar a fondo por la cultura abierta (opennes) ycompartir en el ámbito de las biotecnologías ideas,protocolos, datos y prácticas.

Quienessospechen que algo así sólo puede funcionar en un mundoideal deberían leer las páginas en donde se responde aeste tipo de preocupaciones. Y sí, aunque parezca mentira, seargumenta que cuando alguien se apropia de una idea y lo oculta, lamejor solución es cambiar de asunto y a otra cosa, pues paralos promotores es más probable que los visitantes incluyancomentarios breves y pertinentes que sirvan de ayuda. Desde laperspectiva del bien común, está claro que estamos anteuna muy buena iniciativa pues en el peor de los casos (cuando hay plagio) el conocimiento crece. En los demás, se avanza haciaformas de colaboración amenazadas.

Losperjudicados saben que se trata de una apuesta a medio plazo y quesiendo wiki la tecnología de intercambio empleada, quedaregistrado y a la vista el historial de todas las contribuciones, loque permitirá en todo momento asignar méritos yrestablecer la reputación. Hace unos días, el 10 denoviembre de 2006, había 265 usuarios registrados, 29administradores, 2725 páginas, 15 laboratorios implicados ycontaba con unas 1000 visitas diarias. No es mucho para las cifras alas que nos tiene acostumbrados la web, pero nadie sabe todavíasi estamos al comienzo de otras de esas iniciativas que introduciráncambios irreversibles.

Losque se apresuran a decir que eso no ocurrirá en ciencia, debensaber que hay mucha gente competente movilizándose para quelos cuadernos de laboratorio se hagan públicos o que lospapers colectivos se escriban con wiki, desde el brainstorminginicial hasta su envío a un repositorio público orevista. Iniciativas que, huelga decirlo, solo seríanplenamente operativas si se avanza en la estandarizaciónde los documentos, las bases de datos y los cuadernos de notas.

Bookmark and Share
Etiquetas:

Si te gustó esta entrada anímate a escribir un comentario o suscribirte al feed y obtener los artículos futuros en tu lector de feeds.

Comentarios

Excelente Antonio. Regreso el día 26. Feli< Navidad y sigue así, por favor.

Juanjo Ibáñez

muy interesante

No, si lo de escribir en wiki está bien, pero no da ni por el forro la calidad de LaTeX. Para trabajar con esto, mucho mejor usar algún sistema de control de versiones como CVS. ¿Abogar por que sean públicos? Pues vale… pero si ya el paper medio publicado lo leen 5 personas (incluyendo revisores y autores), no quiero decir nada seguir un trabajo mientras se está escribiendo.

En cuanto a Plos, muy guay y muy abierto y todo lo que quieras, pero son <a href=’http://www.plos.org/about/faq.html#pubfees‘>1250 dólares de vellón</a>. Para eso, lo publico en <a href=’http://arxiv.org‘>Arxiv</a>, que si que es abierto (tiene hasta RSS) y es gratis.

A JJ:

Wikipedia soporta formato LaTeX sin ningún problema. Respecto a PLoS me he quedado horrorizado con los precios, no son 1250 $ por publicación sino…. 2000!

Tres pequeñas puntualizaciones para JJ:

1) La tecnología wiki, como la CVS, también permite un control de versiones y da cuenta del histórico de todsa las modificaciones, inlcuido lo que cada quien ha escrito en cualquier documento.

2) Si un texto no lo lee nadie (JJ quiere decir, no lo cita nadie) , la culpa no es de la tecnología que se emplee (Latex, OOo, wiki,…).

3) Quien difunde vía un repositorio (por ejemplo arxiv) lo hace sin control de calidad por pares. Quien opta por una revista (muchas veces pagando por el espacio que ocupan sus palabras) debe elegir por una que sea propietaria, con o sin Open Access. Si es con Open Access alquien debe pagar el coste que tiene la tramitacíon de un artículo (es decir, la gestión del proceso de peer review). Si no es propietaria, pero sí Open Access, alguien igualmente debe hacerse cargo de los costes asociados al proceso de revisión.

Hay un estudio británico que, en términos generales prueba lo siguiente:

a) Basta con 1% de la inversión que hace un país en ciencia para financiar el Open Access. Es decir, que la repercusión sobre el monto total no es dramática.

b) Se sabe que los artículos publicados en Open Access son muchísimos más citados (a veces, segun la esopecialidad, mejoran su impacto hasta hasta un 150%). La visibilidad es un activo decisivo para el científico, pues los recursos y reconocimientos que obtiene son un elemento clave en el diseño de su carrera, incluidos los temas de investigación que emprende.

Las mencionadas citas son también importantes para la institución y departamento al que pertenece, lo que implica que lo sean para su propio país. Tan importantes en nuestra actual sociedad o economía del conocimiento que hay estudios que tratan estas citaciones como si se tratara de un retorno que obtienen las instituciones/países a cambio de sus políticas de apoyo a la ciencia.

En definitiva que el Openn Access es un asunto estratégico y de accountability, pues a cambio de un pequeño aumento/reconfiguración del presupuesto invertido en ciencia se optienen beneficios para los científicos (mejoran su impacto), para sus instituciones (mejoran su visibilidad) y para sus países (mejoran su eficacia).

Nótese que nada he dicho de la cuestión ética que, desde luego, no es un asunto menor y que ya he tratado varias veces en este blog.

Está muy clarito que estas ideas, este pensamiento, es muy necesario hoy día. Le estoy muy agradecido por difundirlo. GRACIAS.

Hola,

Nature, la revista lider en ciencia (o una de las 2 lideres) hizo hace poco un pequeno experimento para evaluar la viabilidad del "open peer review":

http://www.nature.com/nature/peerreview/debate/nature05535.html

Los resultados fueron muy malos:

"Nature and its publishers will continue to explore participative uses of the web. But for now at least, we will not implement open peer review."

El tema del "review" es muy complicado. El sistema actual tiene fallos, pero eso no sifnifica que cualquiera sea mejor solo por llevar la palabra "open". Por otra parte, la mezcla que se hace aqui de este tema con el opensource, etc. me parece que no viene al caso.

Saludos,

Se me olvidaba… Eso que dicen arriba de que el open-access implica mayor indice de impacto no ha sido aun comprobado. La razon es que esos inices de impacto se calculan con respecto a las publicaciones de los 2 ultimos anhos. Y ninguna revista open-access importante (PLoS_XXXX) tiene aun ese tiempo.

Hay datos PROVISIONALES/PARCIALES que indican que los indices de impacto de estas revistas (cuando se calculen) podrian andar sobre la media. Pero ni se acercan a los de Nature, Science, etc.

Va a parecer que estoy criticando el openaccess, etc. Nada mas lejos de la realidad. Me parece un modelo con sus ventajas y que el tiempo dira si es viable o no. Solo intento aclarar ciertas cosas.

Saludos,

Eatá claro que utilizamos fuentes de informacion distintas. Quien firma "Ciencia" debería leer un post que puse hace tiempo sobre el indice de impacto de las revistas open access que prueba que sí, que mejoran espectacularmente sun índice de impacto.

El link mencionado:

http://weblogs.madrimasd.org/tecnocidanos/archive/2005/06/28/2446.aspx

Es conocido que Nature es la cima a donde todo cientítico quiere llegar. Publicar en Nature puede salvarte la vida (estoy pensando en el dictum "Publicar o morir" que amenaza a todos los investigadores). Así las cosas, no creo que Nature sea el mejor de los los lugares imaginables para iniciar un experimento como el Open Peer Review, pues obviamente se trata de una nueva metodología de trabajo que incrementa considerablemente el reisgo de suscitar rechazo. Y es que, en efecto, la discusión pública de los papers puede perjudicar la carrera del comentador y la del comentado.

Desde luego la palabra open no es talismán de nada, como se dice en uno de los comentarios firmados por "ciencia". Tiene razón, pero al mismo tiempo muchos pensamos que se trata de una filosofía que contiene una nueva (debería decir renovada) voluntad de mejorar las cosas.

Negar que las instituciones científicas (universidades, revistas, sociedades, laboratorios) son, entre otras cosas, escenario de duras batallas por su control y que, en términos generales, adquieren más visibilidad quienes más poder "conquistan" no es situarse en la dinámica de las soluciones sino anudarse con los problemas para hacerlos todavía más opacos. Mucha gente, científicos (respetados) incluidos, que tiene prisa por llegar a las conclusiones hablan sin tapujos de mafias científicas. ¡Ojalá se animaran a dejar escritas sus experiencias en un blog!

Pero, en fin, no es necesario usar un lenguaje de tan grueso calibre para admitir que PlosOne (como otras iniciativas en marcha basadas en el Open Peer Review) es un mecanismo eficaz para combatir los muchas formas de opacidad que se han introducido en la práctica científica y académica en todas las disciplinas e instituciones.

Escribe un comentario

(requerido)

(requerido)