Extensiones de OpenOffice para cálculo científico (I): Tavernalc

OpenOffice se usa cada día más en el trabajo bioinformático diario, no por ser la mejor suite de ofimática (que no lo es), ni por ser gratuita. Una de las razones principales es que, pese a sus limitaciones, OpenOffice se puede ejecutar tanto en nuestro portátil como en la misma estación de trabajo que usamos para crear nuestros programas en C, Java, Perl o Python y para lanzar BLAST, HMMER, R, ClustalW, CD-HIT o Coot. ¡Y esto ahorra mucho tiempo por no tener que estar cambiando de ordenador o formatos cada dos por tres!

Dentro de poco se va a celebrar en Barcelona el OOoCon 2007, la principal conferencia de anual de OpenOffice. Echándole un vistazo al programa de la conferencia, me encontré con un par de ponencias asociadas a nuevas extensiones de OpenOffice, potencialmente útiles para el cálculo científico: Tavernalc y R and Calc. En esta entrada hablaré de la primera, dejando la segunda para la siguiente entrada.
Lo primero de todo es que no he podido probar Tavernalc, principalmente porque la página principal del proyecto está en polaco, no hay buenos traductores online de polaco a inglés, y no parece que esté aún disponible para su descarga. La información que he encontrado viene de la descripción de la charla que aparece en el programa de la conferencia OOoCon 2007, y es en ella en la que baso mis conclusiones.

A grandes rasgos, la extensión Tavernalc para OpenOffice Calc permite usar los ‘procesadores’ de Taverna como funciones de OpenOffice Calc. Para los que no conozcais o no useis Taverna, es una herramienta de integración de servicios web (ya sean CGIs, SOAP+WSDL, BioMOBY, SOAPlab, etc..) y creación de flujos de trabajo a partir de los mismos. Las operaciones a realizar en los workflows de Taverna se representan mediante los denominados ‘procesadores’, que son manejados como cajas negras: toman como entrada una serie de parámetros y generan una serie de salidas. Estos ‘procesadores’ están especializados en función de la tarea que realizan: llamar a determinados servicios web, ejecutar sub-workflows, representar información, ejecutar un bean-shell etc…

Como ya sabeis, las hojas de cálculo permiten definir el contenido de una celda como el resultado de una fórmula que depende de los valores de otras celdas, ya sean constantes o a su vez, calculados. La idea que hay detrás de Tavernalc es permitir usar cualquier ‘procesador’ de Taverna como función a llamar para calcular el valor de las celdas de una hoja de cálculo, trasladando así la capacidad de construir flujos de trabajo desde Taverna hasta la hoja de cálculo como tal.

Por ejemplo, supongamos que tenemos una hoja de cálculo que contiene los valores de expresión de un experimento de microarrays, y queremos normalizar los datos para luego analizar mediante clustering esos valores mediante SOTA u otro método disponible como servicio web, y finalmente integrarlo con algún análisis estadístico propio. Buena parte de esta tarea se puede realizar mediante GEPAS, pero cada vez que tengamos que realizarla tendremos que estar pasando datos desde nuestro sistema hasta los servicios correspondientes, recuperar los resultados, realizar nuestro propio análisis estadístico en integrar y representar los datos en el informe final, con la posibilidad de introducir errores en el proceso.

Si Tavernalc llega a hacer medianamente bien lo que prometen sus desarrolladores en el abstract de su charla para la OOoCon 2007, permitirá que el flujo de tareas a realizar en el ejemplo descrito en el párrafo anterior no sea tan tedioso y propenso a fallos. Pero como siempre, el tiempo lo dira…

ACTUALIZACIÓN 2007-09-22 13:37:47 CEST

Tavernalc tiene una página de proyecto en Google Code y es:

http://tavernalc.googlecode.com/

Además, ya están disponibles las transparencias de la charla en el OOoCon 2007, en formato PDF:

http://marketing.openoffice.org/ooocon2007/programme/thursday_171.pdf

Compartir:

3 comentarios

  1. Creo que no, principalmente por falta de tiempo. Pero sí, tienes toda la razón, parece interesante.

Deja un comentario