"Los datos y los problemas reales son los que provocan nuevas líneas de investigación"

Entrevista a Rosa Elvira Lillo Rodríguez, catedrática de Estadística de la Universidad Carlos III de Madrid y directora del Instituto de investigación sobre Big Data, IBiDat

Preséntenos su investigación

Actualmente tengo abiertas varias líneas de investigación que voy a resumir en cuatro, (1) como herencia de mi tesis doctoral continúo investigando en procesos estocásticos complejos (Markovian Arrival Processes) que ayudan a modelizar situaciones como call centers, fallos de sistemas de todo tipo, evolución de recaídas en enfermedades oncológicas o procesos actuariales. En este campo ponemos el foco no sólo en los aspectos probabilísticos sino en la estimación de los modelos con datos reales. (2) La segunda línea se centra en el análisis de datos funcionales, una línea de investigación que ha emergido en las últimas décadas por la facilidad con la que se pueden recoger datos de climatología, bursátiles, demográficos o industriales que, en esencia, son funciones. En este sentido, se ha hecho necesario trasladar al campo de las funciones todas las definiciones (media, operador covarianza…) y todas las técnicas estadísticas (clasificación supervisada/no supervisada, regresión…) desarrolladas para Rn. Nuestras aportaciones más significativas han sido en el campo de la definición de medidas de profundidad y de dependencia en el contexto funcional y la detección de atípicos en entornos de Big Data. (3) La tercera línea viene impulsada por la necesidad que existe hoy en día de analizar datos que surgen en el contexto principalmente genético y que se llaman datos en alta dimensión, en los que el número de elementos muestrales es significativamente menor que el número de variables disponibles. Este tipo de datos impulsa el desarrollo de nuevos algoritmos que se espera que sean a la vez, buenos en predicción y en la selección de variables que impactan en el problema. Por ejemplo, ¿cuáles son los genes que determinan una respuesta positiva a un tratamiento de quimioterapia?  (4). La última línea en la que estamos implicados es en el tópico tan actual de la interpretabilidad de modelos de machine learning o inteligencia artificial, que trata de acabar con el concepto de caja negra de algunos de los algoritmos tan utilizados en las empresas y que tan efectivos son desde el punto de vista predictivo, pero que carecen de la interpretación que demandan los sectores regulatorios. Nosotros estamos centramos principalmente en conectar redes neuronales con regresión polinómica, pero es una línea en la que el horizonte futuro es muy esperanzador.

¿De qué  manera contribuye su investigación a afrontar los desafíos de la sociedad?

Como se puede deducir de la respuesta anterior, casi toda la investigación que realizamos en mi grupo de investigación viene motivada por problemas reales que nos han planteado empresas o instituciones y que demandan soluciones que sean metodológicamente robustas y a la vez satisfactorias para el problema que las suscita. Por poner algún ejemplo, la línea (3) de trabajo que he señalado anteriormente es consecuencia de la colaboración estrecha con el departamento de oncología del Gregorio Marañón y la línea (4) surge por nuestra relación con el sector bancario a través del Banco Santander. En resumen, son los datos y los problemas reales los que provocan nuevas líneas de investigación y por lo tanto, la aplicabilidad está asegurada; aunque nosotros como académicos que somos, estamos siempre intentando que las soluciones que se aportan estén basadas en fundamentos teóricos fuertes y con buenas propiedades.

¿Cómo hacer llegar a la sociedad en trabajo de los científicos y las científicas?

La divulgación es una actividad que ha ido creciendo con el tiempo y cada día es más necesaria para visibilizar la labor de los científicos en todas las áreas del conocimiento, principalmente, cuando estamos subvencionados por fondos públicos para llevar a cabo nuestro trabajo. En mi caso, he estado involucrada en labores de divulgación desde hace más veinte años cuando fui consciente de que la Estadística era percibida por la sociedad en general y por los estudiantes de secundaria en particular, como una disciplina desconocida, manipulable y no representaba una opción factible de estudios universitarios. Para darla a conocer, inventamos en la uc3m una forma divertida y lúdica de hacer llegar a la sociedad las ventajas y el enorme potencial de la Estadística o Ciencia de Datos y diseñamos los eventos STAT WARS  que han pasado a tener una dimensión nacional a través de la red Biostatnet y el patrocinio continuado de la FECYT. Aparte de este proyecto del que me siento muy orgullosa por toda la gente que está implicadas en su viabilidad, he participado en eventos dedicados a promover las vocaciones STEAM y he impartido conferencias en distintos foros en lo que es necesario poner en valor el pensamiento cuantitativo crítico y las bondades de la Ciencia de Datos y el Big Data

¿Qué retos de futuro se plantea  con su investigación?

Los retos que tenemos planteados los científicos que nos dedicamos a la ciencia de datos  vienen marcados por los avances tecnológicos tan potentes que se están produciendo en los últimos años: la computación cuántica, impresión 3D, marketing online, penetración de las redes sociales cuyo principal vehículo de transmisión de datos son imágenes y vídeos…. A la par que la tecnología evoluciona, es necesario fomentar algoritmos nuevos y escalables con fundamentos metodológicos para que la analítica asociada a los nuevos datos pueda usarse en beneficio de todos. 


Desarrollo mi investigación en una universidad pública de la Comunidad de Madrid, donde tengo acceso a un tejido empresarial moderno y abierto, principalmente de la Comunidad de Madrid, por lo que el círculo de beneficios repercute directamente en Madrid.

Por particularizar un poco más la respuesta, me gustaría resaltar que durante la pandemia me involucré en un proyecto que ha venido monotorizando la pandemia mediante encuestas indirectas a nivel internacional, con resultados muy buenos a nivel predictivo y con muy poco coste. Este proyecto, que ha tenido una gran repercusión a nivel mediático, ha sido el germen de mucho trabajo a nivel teórico, computacional, analítico  y sociológico que tiene a posteriori un campo de aplicación infinito en muchos aspectos de nuestro entorno: político, social, económico, sicológico o epidemiológico. Madurar este proyecto es uno de los retos que más me ilusiona actualmente.

Explíquenos su caso de éxito

Mi caso de éxito no se circunscribe a una investigación concreta, sino a la consolidación de una idea que, bajo mi punto de vista, ha sido pionera en España. Se trata del Instituto de investigación sobre Big Data que se fundó en la Universidad Carlos III,  bajo el patrocinio del Banco Santander, IBiDat . Dirigir esta institución está siendo todo un reto por la convivencia de diferentes perfiles entre los doctores contratados y por la colaboración estrecha en problemas de gran alcance con el sector empresarial. La conjunción Universidad-Empresa está funcionando a buen ritmo y a nivel personal, estoy teniendo la oportunidad de aprender muchas aristas que desconocía de la investigación aplicada.

¿Qué papel ha desempeñado la Oficina de Transferencia de Resultados de la Investigación (OTRI) de su universidad en el desarrollo de su caso de éxito?

La OTRI es un buen bastón donde apoyarse para toda la parte jurídica que los investigadores desconocemos y también contribuye a difundir IBiDat allá donde nosotros no llegamos.

¿Cómo avanza Madrid cuando avanza la ciencia en Madrid?

Como he respondido en la pregunta relativa a la divulgación científica, soy una firme defensora de que el dinero público tiene que revertir en un desarrollo sostenible de la sociedad en general. En mi caso, desarrollo mi investigación en una universidad pública de la Comunidad de Madrid, donde tengo acceso a un tejido empresarial moderno y abierto, principalmente de la Comunidad de Madrid, por lo que el círculo de beneficios repercute directamente en Madrid. La sociedad se ha dado cuenta, durante las horas álgidas de la pandemia, de la necesidad de contar con un plantel de científicos que puedan hacerle cara a todas las desgracias que la naturaleza nos manda y que contribuya a que seamos cada vez más autosuficientes como país. Esa necesidad de tener una ciencia saneada requiere del compromiso continuado de la clase política y, por supuesto, de fondos públicos con los que poder avanzar en la ciencia básica y para ello es necesario agilizar y desburocratizar los procedimientos que llevan implícitos la concesión de fondos públicos. Si todo esto se produjera con cierta diligencia, se crearía un círculo virtuoso que produciría un avance significativo de Madrid  y de España, en general.

¿Alguna cuestión que quiera añadir?

Quisiera añadir que el trabajo científico no se debe adscribir a una persona en concreto porque es fruto de un equipo de investigación que ha trabajado de forma organizada para conseguir los retos planteados. En ese sentido,  no me quiero olvidar de mis colaboradores usuales, de todos los estudiantes a los que he dirigido o dirijo tesis actualmente y de las personas tan valiosas que integran IBiDat.  Entre todos hemos logrado un ecosistema de trabajo en el que fluye la buena sintonía que posibilita la consecución de buenos resultados.

Añadir nuevo comentario

Para el envío de comentarios, Ud. deberá rellenar todos los campos solicitados. Así mismo, le informamos que su nombre aparecerá publicado junto con su comentario, por lo que en caso que no quiera que se publique, le sugerimos introduzca un alias.

    Normas de uso:  
  • Las opiniones vertidas serán responsabilidad de su autor y en ningún caso de www.madrimasd.org  
  • No se admitirán comentarios contrarios a las leyes españolas o buen uso.  
  • El administrador podrá eliminar comentarios no apropiados, intentando respetar siempre el derecho a la libertad de expresión.  


CAPTCHA de imagen
Introduzca los caracteres mostrados en la imagen.

Responsable del tratamiento: FUNDACIÓN PARA EL CONOCIMIENTO MADRIMASD con domicilio en C/ Maestro Ángel Llorca 6, 3ª planta 28003 Madrid. Puede contactar con el delegado de protección de datos en dpd@madrimasd.org. Finalidad: Publicar los comentarios recibidos y conocer el interés que suscita el boletín por áreas geográficas. Por qué puede hacerlo: Por el interés legítimo de favorecer la participación y el debate en el ámbito de la tecnología, la ciencia y la innovación, y en atención a su solicitud. Comunicación de datos: Su comentario es publicado al pie de la noticia junto con su nombre o alias. Derechos: Acceso, rectificación, supresión, oposición y limitación del tratamiento. Puede presentar una reclamación ante la Agencia Española de Protección de datos (AEPD). Más información: En el enlace Política de Privacidad..