Nuevo algoritmo para análisis de microarrays de expresión

Jose Pablo ha mandado este comentario sobre un artículo que ha leído recientemente en Bioinformatics:

    En el número del 1 de Noviembre de la revista Bioinformatics se publica un artículo que puede ser muy útil para el análisis de resultados de microarrays de expresión.

    En este tipo de experimentos es muy habitual que, de cara a una interpretación biológica de los datos, se empleen técnicas de clustering para identificar grupos de genes o/y muestras subyacentes.

    Sin embargo, en algunas ocasiones diferentes algoritmos de clustering pueden dar lugar a diferentes resultados con los mismos datos. En estas situaciones puede ser interesante intentar comprender cómo se relacionan los grupos encontrados mediante técnicas distintas.


    En el artículo los autores describen un nuevo algoritmo para comparar y visualizar las relaciones existentes entre grupos identificados mediante distintos métodos de clustering. El algoritmo ha sido implementado en el Expression Profiler del EBI (http://www.ebi.ac.uk/expressionprofiler) y también está disponible como software independiente en SourceForge (http://ep-sf.sourceforge.net).


    La referencia del artículo es:

Torrente A, Kapushesky M, Brazma A.
A new algorithm for comparing and visualizing relationships between hierarchical and flat gene expression data clusterings.
Bioinformatics 2005; 21(21): 3993-3999.


    Espero que os sea útil.

    Saludos.

Yo por mi parte me comprometo a leérmelo, porque tiene pinta de ser interesante.

Compartir:

2 comentarios

  1. Es interesante. Hay dos cosas a tener muy encuenta respecto a los microchips de ADN a las que me gustaría hacer referencia:

    1- Diferentes experimentos tienden a dar diferentes resultados.

    2- Diferentes técnicas de análisis pueden dar lugar a diferentes conclusiones.

    El artículo del post cae en el 2. Pero ya en el punto 1 uno se debería preocupar de tener todo controlado antes de seguir al punto 2.

    Tan solo quiero decir que respecto al problema 1, solo microchips realizados con técnicas comparables puenden compararse. Si los tejidos son diferentes debe tenerse en cuenta en cada tejido al hacer inferencia matemática de cualquier tipo. Y con estas medidas puedes usar resultados de chips diferentes para diseñar un mismo experimento de data-mining específico para una hipótesis bien definida dentro de un dominio fuera de la cual, hay que ser conservadores, no es extensible nada de lo observado.

    Este artículo se mueve dentro del caso 2 y hace referencia al problema mismo del clustering. No tiene nada que ver con la técnica misma de hibridazion y diseño de chips. Por eso, es muy importante que cuando vas a hacer algo, primero lo diseñes a conciencia y no te limites a ejecutar un algoritmo sin pensar. Lo mejor es que un método de clustering de los que existen y se usan ampliamente por toda la comunidad científica te valga para tus fines.

    Para ello conoces el algoritmo en profundidad y comprendes que justamente eso es lo que necesitas. Si no lo es, tienes que programar tu propio clustering y esto viene con el problema asociado de como explicas el método en la revista donde publiques tus resultados… Siempre es mejor tirar de cosas ya publicadas, aceptadas y valoradas.

    En el ámbito del problema del clustering aplicado a los chips de ADN, este artículo tiene cierto interés. Pero me parece más interesante definir cuales son los tipos de clustering necesarios para los diferentes tipos de inferencias y no comprar entre clusterings simplemente porque si, antes de responder a la primera pregunta.

  2. Usando facultyof1000 aparece esto. En mi opinión una lectura obligada para todo aquel que trabaje con chips de ADN.

    Why most published research findings are false.

    PLoS Med. 2005 Aug;2(8):e124. Epub 2005 Aug 30.

    PMID: 16060722

Deja un comentario