web analytics

Posts etiquetados con ‘Ciencia de Datos’

Todo el mundo miente

Reseñamos en Matemáticas y sus fronteras el libro que con este provocativo título, Todo el mundo miente, ha publicado Capitán Swing en su colección de ensayo.

El subtítulo de este libro aclara mucho de su contenido: Lo que Internet y el Big data pueden decirnos sobre nosotros mismos. El libro es obra de Seth Stephens-Davidowitz, licenciado en Filosofía por la Universidad de Stanford, y doctor en Economía por Harvard. Escribe para The New York Times y es profesor en The Wharton School. Stephens-Dadidowitz ha trabajado también como científico de datos para Google, y ha publicado numerosos artículos de investigación en revistas especializadas. Vaya esto para garantizar que es un experto que conoce muy bien el tema de los datos en internet.

La tesis del autor es que vivimos en un mundo digital, la que aportamos continuamente millones de datos, y que estos dicen muchas cosas sobre nosotros mismos. Somos bastante sinceros con internet, mucho más que cuando accedemos a participar en una encuesta en la que nuestra identidad es conocida. Ese supuesto anonimato que nos proporciona internet consigue que mosremos nuestras verdaderas opiniones y nuestros deseos. Cuando hacemos una búsqueda en Google, Google sabe que somos nosotros porque la identidad de nuestro ordenador es conocida, pero nadie nos responde como si eso no fuera conocido; y nos c onfiamos.

 

Seth Stephens-Davidowitz

Toda esa información queda registarda, puede ser analizada con algoritmos matemáticos, y proporcionar una información precisa de nosotros como individuos. De ahí que si hacemos una determinada búsqueda, digamos un viaje al Caribe, en cualquier interacción con la red nos aparecerán anuncios de compañías aéreas y hoteles ofreciendo sus servicios. Pero esta es una cara de la moneda. Como defiende el autor, “nuestro historial de búsqueda es una herramienta poderosa que revela los miedos, deseos y comportamientos que nos impulsan”.  ¿Por qué no usar estos macrodatos para la investigación social? La gente en Internet acumula un promedio de 8 billones de gigabytes de datos por día. Esta enorme cantidad de información ofrece una ventana al comportamiento humano y a la toma de decisiones. Internet es el suero de la verdad, mediante el cúal vertemos al ciberespacio nuestras grandezas y nuestras miserias.

Este flujo de datos y su análisis puede ser usado para el bien o para el mal. Debemos estar conscientes de que las grandes corporaciones los usarán para conocer lo que nos interesa y ofrecer esos servicios, e incluso (y en el libro hay varios ejemplos, a que lo compremos a precios abusivos). Pero también (y nos da ejemplos) los ciudadanos podemos usar esa información para defendernos. Y nos advierte además del peligro de que los gobiernos puedan usar la información para controlarnos (tenemos ejemplos recientes de campañas políticas en Facebook o Twitter).

El análisis de datos se basa en las matemáticas, una razón más para que esta disciplina sea cuidada muy especialmente en cualquier sistema educativo. Y con las matemáticas y la ciencia de datos, puede que todavía estemos a tiempo de cambiar nuestra visión del mundo y hacerlo más sostenible y justo.

Les dejo con un video del autor

Imagen de previsualización de YouTube

En este enlace se puede encontrar más información sobre el libro.

___________

Manuel de León (CSIC, Fundador del ICMAT, Real Academia de Ciencias, Real Academia Canaria de Ciencias, Real Academia Galega de Ciencias).

 

Etiquetas: , ,
Categorias: General

Algoritmos ciudadanos, ¿son tan inocentes como parecen?

Esta entrada de la serie “La ciudad matemática” entrada está inspirada en el artículo Seeing the smart city: Mapping technologies in Canada, publicado en la sección canadiense de The Conversation.

Bancos inteligentes

Es posible que usted se haya encontrado alguna vez en la carretera a un automóvil de Google Maps con esa extraña cámara en la parte superior. Google está trazando un mapa global del planeta, que de momento, nos está resultando muy útil cuando planificamos un desplazamiento entre dos puntos, dentro o fuera de nuestra ciudad. Obviamente, con la colaboración del sistema de GPS, sistema que usa la simple geometría analítica unida a las correcciones relativistas.

Pero probablemente lo que usted no se imagina es que si se sienta en un banco público de un parque y usa su móvil con la aparente wifi gratuita, sus datos están siendo anotados. Esta tarea y algunas otras que comentaremos, son las que desarrolla el grupo Sidewalk Labs, una filial de Google, cuyos objetivos son “idear, diseñar, comprobar y elaborar innovaciones urbanas para ayudar a que las ciudades afronten sus grandes desafíos”.

Así que usted está navegando gratuitamente, lo que es una maravilla, pero sus datos están siendo recogidos: si usted reserva un restaurante, o un billete de tren o avión, o conecta con determinadas webs, etc. Pero también hay sensores que analizan sus desplazamientos, y cámaras que hacen lo mismo con el tráfico. Dicho esto, ¿dónde queda la privacidad? ¿quién garantiza que estos datos son usados con buenos fines y no para sacar provecho y utilizarnos como clientes sin que nosotros lo sepamos?

El artículo citado al comienzo de esta entrada se refiere precisamente a este tema. Es importante informar a los ciudadanos del uso y los peligros de este tipo de tecnologías de los que en muchas ocasiones no son conscientes.

¿Y cómo se analizan todos esos datos que se obtienen cuando nos movemos por la ciudad inteligente o matemática? Los pasos son varios, tal y como se describe en el artículo Essential Math for Data Science, escrito por Tirthajyoti Sarkar: :

  • Se hace un modelo del proceso.
  • Se construye una hipótesis.
  • Se hace una estimación rigurosa de la calidad de la fuente de datos.
  • Se cuantifica la incerteza sobre los datos y las predicciones.
  • Se identifican los patrones ocultos en la enorme cantidad de datos.
  • Se analiza las limitaciones del modelo.
  • Se trabaja la demostración matemática y la lógica que hay detrás.

En su artículo, da unos consejos sobre las matemáticas que se deberían estudiar para llevar esto adelante (y por qué hacerlo):

  • Funciones, variables, ecuaciones y grafos
  • Estadística
  • Álgebra lineal
  • Cálculo diferencial
  • Matemática discreta
  • Optimización e Investigación de Operaciones

Como ven, las matemáticas están detrás y lo iremos desvelando a lo largo de este año.

___

Manuel de León (CSIC, Fundador del ICMAT, Real Academia de Ciencias, Real Academia Canaria de Ciencias).

 

Etiquetas: , ,
Categorias: General

El palacio de los números

En esta entrada vamos a contar algunos detalles del último y ambicioso gran proyecto de Jim Simons, el instituto Flatiron, continuando con esta historia de números y algoritmos.

El edificio Flatiron

Si en Renaissance, Simons se rodeó de matemáticos, astrónomos, y físicos, para tomar ventaja de las matemáticas sobre sus competidores y actuar de manera eficaz en el complejo mundo de los mercados, su idea para Flatiron fue muy parecida. En este artículo de David Fernández se describe muy acertadamente como Simons pasó de chico de almacén a ser el matemático más rico del mundo; resulta curiosos como su incapacidad de recordar donde estaba cada cosa en el almacén se transformó después en una rara habilidad de captar por donde iban los mercados.

Jim y Marilyn Simons

Recordemos su gestación. En 2012, él y sus esposa Marilyn organizaron un congreso informal en el hotel Buttermilk Falls, en Nueva York. Pidieron a los participantes que aportaran ideas sobre proyectos colaborativos que no pudiesen ser financiados por otras fuentes. Como dice el matemático Jeff Cheeger, del Courant Institute of Mathematical Sciences, y también especialista en geometría diferencial: “No es ese tipo millonario, es una leyenda en la comunidad matemática”. Nada más cierto, y de ahí que a una convocatoria de Simons acudieran muchos personajes brillantes, entre ellos, una mujer que ha hecho historia, Ingrid Daubechies, la primera mujer en presidir la Unión Matemática Internacional.

El supercomputador Gordon del Flatiron

La sugerencia de Daubechies, una investigadora en wawelets, y experta en como utilizar y comprimir los datos, fue que Simons invirtiera, no en generar nueva investigación, sino en como interpretar mejor los millones de datos que genera la investigación existente.

Y así comenzó el instituto Flatiron. Simons quería su instituto cerca de su Fundación, en Manhattan. Inaugurado en 2016, está situado en la esquina de la Calle 21 y la Quinta Avenida, un lugar privilegiado y un edificio característico de Nueva York. Está organizado con cuatro centros: Center for Computational Astrophysics, Center for Computational Biology, Center for Computational Quantum Physics, y el Scientific Computing Core. A día de hoy, las cifras son mareantes. Son ya unas 90 personas las que trabajan allí, pero espera llegar a las 200; el presupuesto está rondando los 80 millones de dólares mauales, la capacidad de computación es equivalente a unos 6000 portátiles de altas prestaciones. Pero esto es nada en compración con el presupuesto de 3000 millones de dólares que Simons dedicó a sus actividades que no buscan beneficios.

Trabajando en la pizarra

He tenido la oportunidad de compartir algunos días con varios de los investigadores de Flatiron, en un reciente summit organizado en la Coruña, así como intercambiar algunos mensajes con Marilyn Simons. Estamos ante un proyecto que hará histotia, movido por gente con los pies en la tierra, y con una visión de futuro envidiable.

La combinación de talento con la capacidad de computación es la receta perfecta. Este es el tipo de proyectos que un gobiernovisit organizado en la Coruña, as, fue que Simons invirtiera enón es la receta perfecta. Este es el tipo de proyectos que un país como España podría abordar, una apuesta dentro de lo que cabe moderada y asumible. La Ciencia de Datos ofrece enormes oportunidades para el futuro. Así lo han entendido en el Reino Unido, con la puesta en marcha del Instituto Alan Turing. En nuestro instituto se está poniendo en marcha un Data Lab, del que esperamos resultados notables en los próximos tiempos.

_______

Manuel de León (CSIC, Fundador del ICMAT, Real Academia de Ciencias, Real Academia Canaria de Ciencias, ICSU).

 

 

Guardar

Guardar

Guardar

Guardar

Etiquetas: , ,
Categorias: General

CORBI DATA SUMMIT 2017

Los próximos 19 y 20 de junio, en La Coruña, la Fundación CorBI (Coruña Biomedical Institute Foundation) organiza su primer Summit, esta vez dedicado a la Ciencia de Datos.

CorBI Foundation es una institución cuyo objetivo es apoyar la investigación biomédica con las matemáticas y la computación para abrir nuevas vías de búsqueda del conocimiento, que permitan avanzar en campos como la neurociencia, la cardiología, la genética o la oncología, entre otros. CorBI es una fundación que surge de la sociedad civil, promovida por personas tanto de la esfera científica como del mundo empresarial y cultural.

En este First CorBI Summit se debatirá sobre la relevancia de la Ciencia de Datos en la Neurociencia y y los cambios sociales. El summit se estructura con una conferencia inaugural, a cargo del prestigioso investigador Richard Bonneau, del Flatiron Institute (Simons Foundation) a la que seguirán las intervenciones de cuatro conferenciantes distribuidos en dos sesiones: Neurociencia Computacional (coordinada por David Ríos, Catedrático AXA en el ICMAT) y Ciencia de Datos para los cambios sociales (coordinada por Eduardo Sánchez Vila, de CITIUS-Universidade de Santiago de Compostela). Los invitados son: Cengiz Pehlevan, del Flatiron Institute (Simons Foundation. Nueva York); Julio Mayol, director del Hospital Clínico de Madrid; Pedro Larrañaga, de la Universidad Politécnica de Madrid; y Nuria Oliver, de Data-Pop Alliance (Harvard University).

En cada sesión participarán también con charlas más cortas investigadores españoles:

  • Javier Moguerza, (Universidad Rey Juan Carlos)
  • David Gómez Ullate, (Instituto de Ciencias Matemáticas, ICMAT)
  • Juan Carlos Pichel, (CITIUS-Universidade de Santiago de Compostela)
  • Manuel Mucientes, (CITIUS-Universidade de Santiago de Compostela)
  • Pablo Rodríguez-Mier,  (CITIUS-Universidade de Santiago de Compostela)
  • Joaquín Triñanes, (School of Engineering-Universidade de Santiago de Compostela)
  • María Loureiro, (School of Business-Universidade de Santiago de Compostela)

El evento se realizará en AFUNDACIÓN A Coruña (Cantón Grande, 24, 15003 A Coruña, Spain). En este enlace se puede encontrar el boletín de inscripción.

Richard Bonneau

Acompañando al evento, se ofrecerá una conferencia de Richard Bonneau, para el público general, sobre el funcionamiento de las redes biológicas y las redes sociales, como Twitter. Richard Bonneau, biólogo e investigador de 41 años, dirige un equipo de trabajo en el Flatiron Institute, recientemente creado por la Simons Foundation en la ciudad de Nueva York.

Las personas interesadas pueden inscribirse a través de la página web de CorBI.

______

Manuel de León (CSIC, Fundador del ICMAT, Real Academia de Ciencias, Real Academia Canaria de Ciencias, ICSU, CorBI)

Etiquetas: , , ,
Categorias: General