Hardware necesario para trabajar en bioinformática

Hace unos días me llegó por el sistema de contacto de los blogs el siguiente mensaje de David:

Hola,
Soy un futuro estudiante de Bioinformática y quería consultarle acerca de los requerimientos de hardware de un ordenador a la hora de utilizar programas y dedicarse a la Bioinformática. ¿Es necesario algun requisito especial en cuanto a memoria, disco duro, tarjeta grafica, procesador…. para alguna de las tareas de esta ciencia?Muchas gracias y enhorabuena por el blog.

Supongo que es una pregunta que se puede hacer la gente en general. ¿Qué tiene que tener un ordenador para poder usarlo en bioniformática? Las necesidades varían en función del tipo de herramientas que se vayan a usar, y aquí vienen algunos posibles escenarios:

  • Si vas a trabajar mucho en temas de modelado por homología, búsqueda de sitios de unión, interacciones entre proteínas, complejos, pequeñas moléculas, etc… lo más probable es que necesites tarde o temprano una buena tarjeta gráfica NVidia o ATI, y un monitor de al menos 19» (lo cuál es muy común a día de hoy).
  • Si vas a hacer muchas búsquedas de secuencia en bases de datos locales, usando por ejemplo Blast, FASTA, SSEARCH, Smith&Waterman, PSI-BLAST, etc… necesitarás espacio en disco para almacenar tanto las bases de datos en los distintos formatos como para almacenar los resultados. Es recomendable tener suficiente memoria para que no se eternicen las búsquedas, y que el acceso a ficheros sea rápido.
    Por poner números, como mínimo 4 GB de memoria y 1TB de disco, tal vez distribuido en dos discos de 500GB en RAID0 para que vaya más rápido el acceso. Y el sistema de ficheros debe ser de los buenos: en Windows el NTFS (nada de FAT), en Linux XFS, EXT4 (si usas el último kernel) o EXT3, ReiserFS, etc… En Mac tendrías que configurar el sistema de ficheros HFS+ para que distinguiera entre mayúsculas y minúsculas.
  • Si vas a hacer mucho cálculo numérico, como por ejemplo simulaciones de dinámica molecular, clustering de algún tipo (por ejemplo mediante CD-HIT), búsqueda de motivos mediante HMMer, etc… entonces necesitarás mucha memoria (un mínimo de 8 GB) y si es paralelizable el cálculo, bastantes procesadores/cores (mínimo 4) para empezar a hacer algo razonable. En estos casos es mejor tener 2 procesadores de 4 cores que 1 procesador de 8 cores por temas de cuellos de botella, ¡y nada de HyperThreading!

Y por último, una buena conexión a Internet (mínimo 20Mb). Las bases de datos públicas se encuentran disponibles para que cualquiera las descargue, pero tienen unos tamaños sencillamente brutales ¡aún estando los ficheros comprimidos! Por dar números de algunas de ellas, wwPDB son casi 10GB, UniProt son unos 44GB, IntAct 5GB, EMBL 126GB. Y muchas de ellas se actualizan semanal, mensual o trimestralmente… Aún sólo usando los servicios bioinformáticos disponibles en internet (NCBI, EBI, UniProt, DDBJ, wwPDB, etc…) es necesaria una buena conexión, por el volumen de resultados que hay que recuperar.

También hay hardware especializado muy caro que se usa cuando aumentan mucho las necesidades y el dinero disponible. Pero ésa es otra historia…

Compartir:

8 comentarios

  1. Como bien dices depende mucho de lo que se vaya hacer, pero en todo caso yo añadiría a la lista:

    – Tener 2 monitores. Uno siempre acaba quedando corto, sobre todo si se va ha trabajar con estructuras.

    – Usar solo linux, preferentemente de 64 bits. Muy útil si instalas mas de 4 Gb de ram, sino los tendrás mas de decoración que de otra cosa.

    Y si vas ha hacer dinámicas molecular, tener una cuenta en algún servicio de super computación, ya que cualquier workstation tardara semanas en dar un resultado util.

  2. Sobre dinámica molecular no te creas que siempre es necesaria supercomputación. En mi propio centro de investigación he visto hace poco un montaje con 4 tarjetas NVidia Quadro donde hacen los cálculos usando las GPUs (y cada una creo que tiene 192 stream processors). GPGPU es el presente…

  3. Hombre tienes razón, también he odio hablar muy de clusters hechos con PS3. Pero creo que estos sistemas ‘caseros’ aunque den buenos resultados requieren bastante mano de obra, sobre todo en las primeras etapas. Es decir, que te pasas mas tiempo poniendo a punto la maquina que lanzando experimentos. Bueno no se, es un punto de vista, imagino que también depende que quieras conseguir.

  4. cuando se trata de una sola aplicación o juego o sistema operativo, sí que tiene sentido hablar de requisitos mínimos. Cuando se trata de multíples aplicaciones, y en un campo tan amplio como la bioformática, la respuesta solo puede ser plural. (es decir, un vector no un escalar).

    La respuesta ha sido más que adecuada, pero más interesante es preguntar ¿cuán viejo ha sido el ordenador del cual se ha podido extraer resultados útiles (para hoy en día) para la bioinformática? cualquier aplicación vale.

    En mi trastero, mi Pentium 800MHz del 2000 sí que quiere saber la respuesta a esa pregunta.

  5. Sobre dinámica molecular no te creas que siempre es necesaria supercomputación. En mi propio centro de investigación he visto hace poco un montaje con 4 tarjetas NVidia Quadro donde hacen los cálculos usando las GPUs (y cada una creo que tiene 192 stream processors). GPGPU es el presente…

  6. Hola Muy buenas,

    Veo que es un post que tiene algún tiempo ya, pero les escribía para ver si me pueden resolver una duda con información actual y requerimientos de hardware para bioinformática hoy en día.

    La cuestión es que quiero introducirme en la bioinformatica a nivel personal; esto es sacarme cursos y trabajar desde casa. Sería para mejorar mi CV para después buscar trabajo en un sitio donde me proporcionarían un buen equipo.

    Pero de momento, tengo que comprarme un equipo para trabajar por mi cuenta, y sería como para 12 meses.

    Tras buscar información, he decidido adquirir el Nuevo Macbook Pro 2016, sin Touch bar.
    De base viene con un procesador i5 a 2 GHz (que he decidido no mejorar), una RAM de 8 Gb y un SSD de 256Gb.

    LA DUDA es que no se si mejorar la RAM y/o SSD. Respectivamente, sería mejorar a 16 Gb de RAM y a 512Gb SSD. Cada una de estas mejoras sería un incremento de 210 euros en el precio.

    Creen que es buena elección y que merece la pena? Que mejorarías? Crees que 8Gb de RAM se me quedaría corto para trabajar o lento? Consideras que 256Gb SSD puede verse afectado a la hora de ser poco espacio para algunos archivos?

    Una opción es comprar un disco duro como alternativa a mejorar la memoria, pero no se si para correr algunos programas y análisis de datos estaría bien desde un disco duro externo.

    Un saludo y gracias de antemano!!

  7. Hola Cristian,
    mi recomendación personal es que le mejores la RAM, y si con el tiempo necesitas más espacio, uses un disco externo. Y la razón es que al principio no vas a empezar a probar datasets enormes, pero hay muchos algoritmos bioinformáticos devoradores de memoria, así como entornos de análisis y desarrollo tipo R y RStudio (todo en función del uso, claro).

    ¡Saludos!
    José María

Deja un comentario