La Bioinformática y los sistemas operativos (I): Gentoo Linux

    Hace tiempo que llevo dándole vueltas a la cabeza acerca de cuál es el mejor sistema operativo para hacer bioinformática (aquí se me nota que estudié Ingeniería Informática). Y si os soy sincero, lo único que he sacado en claro es que no es Windows 🙂 Éste es el primero de una serie de artículos sobre sistemas operativos y bioinformática, e intentaré mencionar los sistemas más representativos.

    Much@s de nosotr@s estamos usando distribuciones Linux (Debian/Ubuntu/etc, RedHat/Fedora, SuSE/OpenSuSE, Madrake/Mandriva, Gentoo, etc…), Unix (FreeBSD, Solaris/OpenSolaris, IRIX, Tru64, HP/UX, AIX, …), Mac OS X, ¡o incluso Windows! Y tod@s nosotr@s, en mayor o menor medida hemos sufrido con los siguientes problemas:

  1. Tras leernos un artículo, hemos querido instalar un programa o librería (por ejemplo, t-coffee o BioPerl), pero como no hay paquetes instalables para nuestro sistema, hemos tenido que compilarlos a mano.
  2. Como estos programas y librerías dependen muchas veces de paquetes que no están en nuestra distribución/sistema operativo, ¡también los hemos tenido que compilar!
  3. Pasa el tiempo, y hemos querido actualizar el sistema operativo, y entonces, ¡se va todo al garete! ¡Vuelta a empezar!

    Hace un par de años estaba ya totalmente harto de compilar, por todo el tiempo que perdía buscando qué tenía que instalar, probando, etc… Además, también estaba harto de que cada vez que actualizaba el sistema operativo, pudieran surgir problemas entre lo que compilé y lo que se ha actualizado. En ese momento pensé en usar algún sistema operativo con actualizaciones continuas, como alguna variante de Debian Linux, FreeBSD o Gentoo Linux (éstos dos últimos para los radicales entre los radicales). Por curiosidad, me puse a ver qué paquetes había disponibles en Gentoo, y quedé gratamente sorprendido al encontrar muchos relacionados con la bioinformática. Si mirais en:

http://packages.gentoo.org/packages/?category=sci-biology

vereis lo que hay disponible de serie para la biología/bioinformática. Aunque Gentoo Linux es una de las distribuciones más complicadas (todo paquete lo compila el sistema antes de ser instalado), me volví un radical entre los radicales al ver que buena parte del trabajo ya lo tenía hecho, ¡dado que es el sistema y no yo quien tiene que compilar! ¿Alguno de vosotros ha intentado alguna vez instalar molmol? ¡Es una pesadilla hacerlo a mano! ¿Y mantener al día BioPerl o mySQL? Seguro que sí.

    Todos los sistemas operativos disponen en mayor o menor medida de un sistema de gestión de paquetes. Casi todos los paquetes disponibles están en formato binario: los programas ya están compilados, y el sistema de paquetes tiene que plantar los ficheros y poco más. Una opción no tan conocida (disponible en casi todas las distribuciones Linux) es la posibilidad de usar paquetes-fuente: sólo contienen las instrucciones de compilación.

    Tanto Gentoo Linux como FreeBSD optan por esta alternativa, para preparar los paquetes ‘a medida’ del sistema que tenemos. El gran inconveniente de este método es el tiempo que pierde el sistema compilando los programas y librerías. ¡Imaginaos cuánto tiempo puede llevar instalar un sistema completo, con todas las herramientas, programas y librerías! ¡Alrededor de una semana! Sin embargo, una vez hecho esto os puedo asegurar que R, BioPerl, NCBI Blast, ClustalW, etc… van a funcionar mejor de lo que pensais.

    Por tanto, si sois radicales hasta la médula, buscais rendimiento y teneis un buen ordenador, os recomiendo Gentoo para la Bioinformática. Si no, tendreis que esperar a los siguientes artículos, el primero sobre Bio-Linux (salvo que convenza a un colega amante de Debian de que escriba algo).

Compartir:

5 comentarios

  1. No trabajo excatamente en bioinformática, soy microbiólogo clínico

    y estudio informática de sistemas (voy por la mitad de los créditos)

    así que no queria comentar lo que has dicho, pero si decir que uso .

    Uso RedHat (hace años usaba Slack, pero no me sobra el tiempo

    para compilaciones) y como que en los laboratorios sólo ves windows

    hace tiempo que uso Ruby (es un lenguaje de programación puro

    orientado a objetos, scripting y multiplataforma). Estan desarrollando

    BioRuby aunque no pienso usarlo para nada, porque ese no

    es mi campo. Espero que este comentario le sirva a alguien.

  2. Bueno, yo creo que soy de los que todavía no ha pegado el salto a linux. Lo he probado más de una vez pero mis raices en la tierra windows son muy profundas.

    He probado con SUSE, Mandrake, he probado con Ubuntu y ahora he decidido probar con Gentoo.

    La cuestión es que, como he dicho antes, mi arraigo hacia windows es muy profundo. Os quiero hacer una pregunta, seguramente este no es el mejor lugar, pero bueno, tengo dos discos duros, me gustaría dar el salto a linux (como tambien he dicho antes quiero instalarme gentoo) así que tenía pensado instalar: XP, WIN98 (quiero programar con texto en arabe y es el unico que me acepta el teclado que tengo), Gentoo y Solaris 10.

    Bueno, como tendría que realizar las instalaciones??? Primero Win98, luego Win xp (estos dos en un disco) Luego Solaris y luego Linux???

    un saludo

  3. Gracias, bueno, Si eso dejo solaris para otro dia, je je.

    Gracias por la direccion que me has proporcionado.

    Un saludo

  4. Solaris en sparc es muy distinto a intel a nivel de firmware, como es logico (informáticamente hablando).

    Solaris 10 va de lujo en Intel (a no ser que tengas mala suerte con algun componente hw imp).

    Instala win, luego solaris en otra particion y luego Linux en otra. No compartiría el swap entre linux/solaris, porque total los discos ahora son baratos. Recuerda poner el swap en discos diferentes y si es posible en diferente controladora (IDE1:hda,hdb IDE2:hdc,hdd), aumenta el rendimiento mucho mucho.

    ——————- DEBIAN vs GENTOO

    Me encanta gentoo, es muy pionera.

    Pero prefiero Debian. Si quieres sencillez se instala como si nada (y hay hibridos como ubuntu que son ya el colmo de la sencillez). Si te gusta compilarlo todo todo todo, puedes tirar de SRC en vez de binarios. Y es mas facil modificar el codigo que con gentoo.

    ¿Para que si no quieres compilarlos? El rendimiento aumenta a veces, eso si…. (sobre todo con el …. muscle (alineamiento prot).

Deja un comentario