web analytics

Posts etiquetados con ‘big data’

Todo el mundo miente

Reseñamos en Matemáticas y sus fronteras el libro que con este provocativo título, Todo el mundo miente, ha publicado Capitán Swing en su colección de ensayo.

El subtítulo de este libro aclara mucho de su contenido: Lo que Internet y el Big data pueden decirnos sobre nosotros mismos. El libro es obra de Seth Stephens-Davidowitz, licenciado en Filosofía por la Universidad de Stanford, y doctor en Economía por Harvard. Escribe para The New York Times y es profesor en The Wharton School. Stephens-Dadidowitz ha trabajado también como científico de datos para Google, y ha publicado numerosos artículos de investigación en revistas especializadas. Vaya esto para garantizar que es un experto que conoce muy bien el tema de los datos en internet.

La tesis del autor es que vivimos en un mundo digital, la que aportamos continuamente millones de datos, y que estos dicen muchas cosas sobre nosotros mismos. Somos bastante sinceros con internet, mucho más que cuando accedemos a participar en una encuesta en la que nuestra identidad es conocida. Ese supuesto anonimato que nos proporciona internet consigue que mosremos nuestras verdaderas opiniones y nuestros deseos. Cuando hacemos una búsqueda en Google, Google sabe que somos nosotros porque la identidad de nuestro ordenador es conocida, pero nadie nos responde como si eso no fuera conocido; y nos c onfiamos.

 

Seth Stephens-Davidowitz

Toda esa información queda registarda, puede ser analizada con algoritmos matemáticos, y proporcionar una información precisa de nosotros como individuos. De ahí que si hacemos una determinada búsqueda, digamos un viaje al Caribe, en cualquier interacción con la red nos aparecerán anuncios de compañías aéreas y hoteles ofreciendo sus servicios. Pero esta es una cara de la moneda. Como defiende el autor, “nuestro historial de búsqueda es una herramienta poderosa que revela los miedos, deseos y comportamientos que nos impulsan”.  ¿Por qué no usar estos macrodatos para la investigación social? La gente en Internet acumula un promedio de 8 billones de gigabytes de datos por día. Esta enorme cantidad de información ofrece una ventana al comportamiento humano y a la toma de decisiones. Internet es el suero de la verdad, mediante el cúal vertemos al ciberespacio nuestras grandezas y nuestras miserias.

Este flujo de datos y su análisis puede ser usado para el bien o para el mal. Debemos estar conscientes de que las grandes corporaciones los usarán para conocer lo que nos interesa y ofrecer esos servicios, e incluso (y en el libro hay varios ejemplos, a que lo compremos a precios abusivos). Pero también (y nos da ejemplos) los ciudadanos podemos usar esa información para defendernos. Y nos advierte además del peligro de que los gobiernos puedan usar la información para controlarnos (tenemos ejemplos recientes de campañas políticas en Facebook o Twitter).

El análisis de datos se basa en las matemáticas, una razón más para que esta disciplina sea cuidada muy especialmente en cualquier sistema educativo. Y con las matemáticas y la ciencia de datos, puede que todavía estemos a tiempo de cambiar nuestra visión del mundo y hacerlo más sostenible y justo.

Les dejo con un video del autor

Imagen de previsualización de YouTube

En este enlace se puede encontrar más información sobre el libro.

___________

Manuel de León (CSIC, Fundador del ICMAT, Real Academia de Ciencias, Real Academia Canaria de Ciencias, Real Academia Galega de Ciencias).

 

Etiquetas: , ,
Categorias: General

Big Data. Conceptos, tecnologías y aplicaciones

El libro que tengo en las manos es una excelente aportación para el conocimiento del público en general del gran paradigma que conmueve los cimientos de nuestro mundo, el Big Data. Se trata de Big Data. Conceptos, tecnologías y aplicaciones, en la colección Qué sabemos de, escrito por dos expertos, David Ríos Insúa y David Gómez Ullate.

Comentaremos brevemente el contenido de este libro, aunque en entradas sucesivas seguiremos hablando de algunos de los temas que, al menos a mí, me han resultado tan interesantes como para querer saber más sobre ellos.

Una de las cuestiones más preocupantes del big data es que una gran parte de ese tsunami de datos lo estamos proporcionando nosotros mismos de manera gratuita y casi sin darnos cuenta, como si no nos importara. Y con esos datos, hay compañías que hacen negocios.  Google recibe 4 millones de peticiones por minuto, en Facebook compartimos 2 millones y medio de piezas por minuto, cada día enviamos 400 millones de tuits.

La importancia de los datos y su análisis tiene un origen comercial, como conocer mejor a los clientes, sus gustos, como llegar mejor a ellos. Y si antiguamente (por ejemplo, Gallup) había que hacer encuestas, los avances tecnológicos (internet, móviles, GPS, …) han facilitado la tarea. Se dice que hay unos 15.000 millones de sensores distribuidos en el mundo, y no paran,

Pero estos datos se dan en bruto, tenemos que pulirlos y almacernarlos para poder usarlos. Y después tenemos que aplicar diferentes tecnologías para extraer información útil de los mismos. Y ahí es donde entran las matemáticas. Los autores muestran como una de las bases claves es la Estadística. El otro pilar es la Infomática. A lo largo del libro describen ampliamente como estas dos disciplinas interactúan en el Big Data. Y ello les lleva a hablar del aprendizaje automático (machine learning), redes neuronales, inteligencia artificial, ciberseguridad, y muchos otros temas.

Es muy relevante como las administraciones públicas están tan lejos de las grandes corporaciones empresariales y no están utilizando estas nuevas herramientas en beneficio de la sociedad; hay un enorme potencial en su uso, por ejemplo, en la medicina, tal y como detallan en uno de sus capítulos.

Aunque a veces la lectura nos produce el temor al Gran Hermano, los aspectos positivos son muchos, como ocurre casi siempre con la ciencia. El Big Data no es la panacea a todos los problemas de este mundo pero si que nos ofrece un gran cantidad de oportunidades. Enhorabuena a los autores por este magnífico libro que en apenas 134 páginas no nos da respiro.

 

Sobre los autores

David Ríos Insúa

 

David Ríos Insúa. Es AXA-ICMAT Chair en Análisis de Riesgos Adversarios en el ICMAT-CSIC y numerario de la Real Academia de Ciencias Exactas, Físicas y Naturales. Es catedrático de Estadística e Investigación Operativa (en excedencia). Previamente ha sido profesor o investigador en Manchester, Leeds, Duke, Purdue, Paris-Dauphine, Aalto, CNR-IMATI, IIASA, SAMSI y UPM. Entre otros, ha recibido el Premio DeGroot de la ISBA por su libro Adversarial Risk Analysis. Es asesor científico de Aisoy Robotics. Ha escrito más de 130 artículos con revisión y 15 monografías sobre sus temas de interés que incluyen la inferencia bayesiana, la ciencia de datos, el análisis de decisiones y el análisis de riesgos, y sus aplicaciones, principalmente, a seguridad y ciberseguridad.

 

David Gómez Ullate

David Gómez-Ullate Oteiza. Es investigador distinguido en la Universidad de Cádiz y profesor titular de Matemática Aplicada en la Universidad Complutense de Madrid, actualmente en excedencia. Su labor reciente se centra en la transferencia de conocimiento al sector industrial en ciencia de datos e inteligencia artificial. En la actualidad dirige proyectos en el sector aeronáutico, seguros y biomédico aplicando técnicas de visión artificial y procesamiento de lenguaje natural.

___

Manuel de León (CSIC, Fundador del ICMAT, Real Academia de Ciencias, Real Academia Canaria de Ciencias, Real Academia Galega de Ciencias).

Etiquetas: , , , ,
Categorias: General

CORBI DATA SUMMIT 2017

Los próximos 19 y 20 de junio, en La Coruña, la Fundación CorBI (Coruña Biomedical Institute Foundation) organiza su primer Summit, esta vez dedicado a la Ciencia de Datos.

CorBI Foundation es una institución cuyo objetivo es apoyar la investigación biomédica con las matemáticas y la computación para abrir nuevas vías de búsqueda del conocimiento, que permitan avanzar en campos como la neurociencia, la cardiología, la genética o la oncología, entre otros. CorBI es una fundación que surge de la sociedad civil, promovida por personas tanto de la esfera científica como del mundo empresarial y cultural.

En este First CorBI Summit se debatirá sobre la relevancia de la Ciencia de Datos en la Neurociencia y y los cambios sociales. El summit se estructura con una conferencia inaugural, a cargo del prestigioso investigador Richard Bonneau, del Flatiron Institute (Simons Foundation) a la que seguirán las intervenciones de cuatro conferenciantes distribuidos en dos sesiones: Neurociencia Computacional (coordinada por David Ríos, Catedrático AXA en el ICMAT) y Ciencia de Datos para los cambios sociales (coordinada por Eduardo Sánchez Vila, de CITIUS-Universidade de Santiago de Compostela). Los invitados son: Cengiz Pehlevan, del Flatiron Institute (Simons Foundation. Nueva York); Julio Mayol, director del Hospital Clínico de Madrid; Pedro Larrañaga, de la Universidad Politécnica de Madrid; y Nuria Oliver, de Data-Pop Alliance (Harvard University).

En cada sesión participarán también con charlas más cortas investigadores españoles:

  • Javier Moguerza, (Universidad Rey Juan Carlos)
  • David Gómez Ullate, (Instituto de Ciencias Matemáticas, ICMAT)
  • Juan Carlos Pichel, (CITIUS-Universidade de Santiago de Compostela)
  • Manuel Mucientes, (CITIUS-Universidade de Santiago de Compostela)
  • Pablo Rodríguez-Mier,  (CITIUS-Universidade de Santiago de Compostela)
  • Joaquín Triñanes, (School of Engineering-Universidade de Santiago de Compostela)
  • María Loureiro, (School of Business-Universidade de Santiago de Compostela)

El evento se realizará en AFUNDACIÓN A Coruña (Cantón Grande, 24, 15003 A Coruña, Spain). En este enlace se puede encontrar el boletín de inscripción.

Richard Bonneau

Acompañando al evento, se ofrecerá una conferencia de Richard Bonneau, para el público general, sobre el funcionamiento de las redes biológicas y las redes sociales, como Twitter. Richard Bonneau, biólogo e investigador de 41 años, dirige un equipo de trabajo en el Flatiron Institute, recientemente creado por la Simons Foundation en la ciudad de Nueva York.

Las personas interesadas pueden inscribirse a través de la página web de CorBI.

______

Manuel de León (CSIC, Fundador del ICMAT, Real Academia de Ciencias, Real Academia Canaria de Ciencias, ICSU, CorBI)

Etiquetas: , , ,
Categorias: General

Analizando datos: nuevas iniciativas internacionales

Hemos comentado en este blog varias veces la importancia de la transferencia del conocimiento matemático, que no solo se centra en la creación de modelos para los procesos industriales, sino que, últimamente, ha visto como la Estadística y la Investigación de Operaciones se han revelado imprescindibles para tratar los aluviones de datos que hemos dado en bautizar como Big Data.

John W. Tukey

En muchas universidades punteras se han dado cuenta de lo que se avecinaba, y han puesto en marcha centros para afrontar estas necesidades, y, por qué no, aprovechar la marea.

La Universidad de Princeton ha creado el Center for Statistics and Machine Learning (CSML), en julio de 2014, para que sirva para canalizar en su campus las actividades educativas y de investigación en estadística, machine learning, y los análisis de datos.

CSML es un grupo interdisciplinar, con gente de diferentes áreas, y siempre profundamente conectado con las aplicaciones al mundo real, como la astrofísica, economía, finanzas, genómica, neurociencia, ciencias políticas, políticas públicas y sociología.

La Universidad de Princeton había quizás olvidado su rica historia en estadística y machine learning, con figuras claves como Samuel Wilks, John Tukey, William Feller, Alonzo Church, Alan Turing y John Von Neumann. El Deparatmento de Estadística, fundado por John Tukey, funcionó desde 1965 hasta 1985. Princeton vuelve ahora a sus raíces, y marca una tendencia que otros están también considerando.

Citaremos solo dos ejemplos más, aunque en futuras entradas daremos más detalles.

El Instituto Flatiron, hospedado en el emblemático edificio Flatiron (la plancha de hierro) de la Quinta Avenida de Nueva York, creado por la Fundación Simons, y cuya misión es la investigación mediante métodos computacionales, incluyendo análisis de datos, modelización y simulación.

Y el Instituto Alan Turing, para la ciencia de datos, hospedado en la Biblioteca Británica. Este instituto es una iniciativa de cinco universidades: Cambridge, Edinburgh, Oxford, UCL y Warwick , junto con el UK Engineering and Physical Sciences Research Council. Ha sido creado en 2015 para responder a las necesidades británicas en el análisis de datos.

Iniciativas que no tienen análogos hasta ahora en nuestro país, donde la prospectiva científica parece haber quedado en el olvido.

______

Manuel de León (CSIC, Fundador del ICMAT, Real Academia de Ciencias, Real Academia Canaria de Ciencias, ICSU).

Guardar

Etiquetas: , ,
Categorias: General