{"id":135039,"date":"2020-10-14T16:52:02","date_gmt":"2020-10-14T15:52:02","guid":{"rendered":"http:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/?p=135039"},"modified":"2020-10-14T16:52:02","modified_gmt":"2020-10-14T15:52:02","slug":"cerca-de-150-millones-de-sitios-web-entre-un-billon-a-estudio-contienen-contenidos-sensibles-y-rastreados","status":"publish","type":"post","link":"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/2020\/10\/14\/135039","title":{"rendered":"Cerca de 150 millones de sitios web, entre un bill\u00f3n a estudio, contienen contenidos sensibles (y rastreados)"},"content":{"rendered":"<h4>Un destacado esfuerzo de investigaci\u00f3n para proteger nuestra intimidad: la Ley sobre Privacidad est\u00e1 hecha para ser usada por humanos\u2026<\/h4>\n<h4>\u00bfC\u00f3mo podemos ense\u00f1\u00e1rsela a las m\u00e1quinas? Nikolaos Laoutaris, Profesor de Investigaci\u00f3n en IMDEA Networks Institute, participa en el mayor estudio sobre rastreo de aspectos sensibles en la red<\/h4>\n<p><a href=\"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/files\/2020\/10\/websites-content.png\"><img decoding=\"async\" class=\"aligncenter size-full wp-image-135040\" title=\"websites-content\" src=\"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/files\/2020\/10\/websites-content.png\" alt=\"\" width=\"700\" height=\"400\" srcset=\"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/files\/2020\/10\/websites-content.png 700w, https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/files\/2020\/10\/websites-content-300x171.png 300w\" sizes=\"(max-width: 700px) 100vw, 700px\" \/><\/a><\/p>\n<p>El Reglamento General de Protecci\u00f3n de Datos incluye clausulas espec\u00edficas que marcan restricciones a la captaci\u00f3n y procesamiento de datos personales sensibles, definidos como cualquier dato que revele el origen racial o \u00e9tnico, opiniones pol\u00edticas, religiosas o creencias filos\u00f3ficas y de pertenencia sindical, adem\u00e1s de datos gen\u00e9ticos, datos biom\u00e9tricos con el prop\u00f3sito de identificar a una persona, datos relativos a la salud o a la vida y a la orientaci\u00f3n sexuales\u2026<\/p>\n<p>Despu\u00e9s de dos a\u00f1os de duro trabajo, y de haber cruzado datos de m\u00e1s de un bill\u00f3n de sitios web (la mayor\u00eda de la web en lengua inglesa) un equipo internacional, con Nikolaos Laoutaris (Profesor de Investigaci\u00f3n en IMDEA Networks Institute, Madrid) e investigadores de TU Berlin y Cyprus University of Technology, han desarrollado clasificadores de aprendizaje de m\u00e1quinas especializadas capaces de identificar urls sensibles en internet y as\u00ed buscarlas entre un bill\u00f3n de ellas.\u00a0 Como principal (y preocupante) conclusi\u00f3n, cerca de 150 millones fueron detectadas por incluir contenido sensible sobre Salud, Creencias Pol\u00edticas, orientaci\u00f3n Sexual\u2026 etc., tan rastreables como las del resto de internet.<\/p>\n<h3>Detecci\u00f3n en tiempo real<\/h3>\n<p>La legislaci\u00f3n actual sobre datos personales sensibles est\u00e1 dirigida sobre todo al uso humano, como en los casos de presentaci\u00f3n de denuncias y realizaci\u00f3n de investigaciones, incluso en el seguimiento de casos por tribunales de justicia. Con el uso de los nuevos clasificadores de aprendizaje de m\u00e1quinas especializadas, se pueden poner por primera vez en pr\u00e1ctica adicionales medidas proactivas. Por ejemplo, el navegador de un usuario, o un programa a\u00f1adido que puede avisarle antes de \u2018hacer clic\u2019 y seguir urls que lleven a contenido sensible.<\/p>\n<p>Al visitar este tipo de sitios, los rastreadores pueden quedar bloqueados, y las quejas pueden archivarse autom\u00e1ticamente. Algo que depende de poder clasificar autom\u00e1ticamente si una URL es sensible o no en tiempo real, algo que es m\u00e1s f\u00e1cil decir que hacer. El motivo radica en la ambig\u00fcedad de t\u00e9rminos como \u2018Salud\u2019, usado en documentos legales para indicar qu\u00e9 tipo de informaci\u00f3n se considera sensible. De hecho, la palabra se puede encontrar en sitios web como los relativos a alimentaci\u00f3n saludable, deportes y comida org\u00e1nica, pero tambi\u00e9n en aquellos sobre enfermedades cr\u00f3nicas, enfermedades de transmisi\u00f3n sexual y c\u00e1ncer. La mayor parte del esfuerzo para crear el sistema clasificador antes mencionado se centr\u00f3 en recopilar suficientes datos aut\u00e9nticos de verdad para entrenar al clasificador y permitirle distinguir entre el uso realmente sensible de palabras como \u2018salud\u2019 frente a otras menos sensibles.<\/p>\n<p>Los resultados del trabajo se presentar\u00e1n como documento cient\u00edfico en el ACM IMC\u201920 (ACM Internet Measurement Conference 2020, 27-29 October, Pittsburgh, EE.UU.). Laoutaris tambi\u00e9n participa en\u00a0<a href=\"https:\/\/networks.imdea.org\/es\/proyectos\/pimcity\/\" rel=\"noopener noreferrer\" target=\"_blank\">PIMCity<\/a>\u00a0(Construyendo las plataformas de datos personales de pr\u00f3xima generaci\u00f3n), el proyecto con financiaci\u00f3n de la Uni\u00f3n Europea para incrementar la transparencia y dotar a los usuarios con el control sobre sus datos. \u00abLa Privacidad se hizo para ser usada por humanos -comenta Laoutaris-, normalmente despu\u00e9s de una violaci\u00f3n de la privacidad -por ejemplo, en un proceso ilegal de tratamiento de esos datos-\u2026 pero \u00bfc\u00f3mo podemos ense\u00f1ar esto a las m\u00e1quinas y hacer que nos protejan antes de que se produzcan violaciones de la privacidad?\u00bb. El equipo est\u00e1 trabajando para ofrecer esta soluci\u00f3n tecnol\u00f3gica al usuario durante 2021.<\/p>\n<p>\u00abRastrear a la gente -se\u00f1ala el investigador- cuando visitan sitios web con contenido perteneciente a las categor\u00edas sensibles de la RGPD es el aut\u00e9ntico \u2018elefante en la habitaci\u00f3n\u2019 de la privacidad. A mucha gente no le importa ser rastreada por asuntos que consideran inocentes, pero probablemente se alarmar\u00edan al saber que sus visitas a sitios web sensibles tambi\u00e9n se registran y se divulgan a terceros. Nuestro estudio es, con diferencia, el mayor sobre asuntos sensibles en la web. Muestra que una considerable parte de ella incluye contenidos de ese car\u00e1cter. Desafortunadamente, este tipo de p\u00e1ginas aparecen rastreadas de la misma forma que las del resto de las presentes en internet\u00bb.<\/p>\n<hr \/>\n<h5>Sobre Nikolaos Laoutaris<\/h5>\n<p><a href=\"https:\/\/networks.imdea.org\/es\/equipo\/equipo-imdea-networks\/personas\/nikolaos-laoutaris\/\">Profesor de investigaci\u00f3n en IMDEA Networks<\/a>\u00a0desde diciembre de 2018. Laoutaris es doctor en Ciencias de la Computaci\u00f3n por la Universidad de Atenas (Grecia) y ha sido investigador en las universidades de Harvard y Boston. Sus \u00e1reas de investigaci\u00f3n est\u00e1n centradas en la privacidad, la transparencia y la protecci\u00f3n de datos; la econom\u00eda de redes e informaci\u00f3n; el transporte inteligente; los sistemas distribuidos y los protocolos y mediciones de redes.<\/p>\n<div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Un destacado esfuerzo de investigaci\u00f3n para proteger nuestra intimidad: la Ley sobre Privacidad est\u00e1 hecha para ser usada por humanos\u2026 \u00bfC\u00f3mo podemos ense\u00f1\u00e1rsela a las m\u00e1quinas? Nikolaos Laoutaris, Profesor de Investigaci\u00f3n en IMDEA Networks Institute, participa en el mayor estudio sobre rastreo de aspectos sensibles en la red El Reglamento General de Protecci\u00f3n de Datos incluye clausulas espec\u00edficas que marcan restricciones a la captaci\u00f3n y procesamiento de datos personales sensibles, definidos como cualquier dato que revele el origen racial o \u00e9tnico, opiniones pol\u00edticas, religiosas o creencias filos\u00f3ficas y de pertenencia sindical, adem\u00e1s de datos gen\u00e9ticos, datos biom\u00e9tricos con el prop\u00f3sito\u2026<\/p>\n","protected":false},"author":58,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"ngg_post_thumbnail":0},"categories":[1],"tags":[40910,37185,40919],"blocksy_meta":{"styles_descriptor":{"styles":{"desktop":"","tablet":"","mobile":""},"google_fonts":[],"version":4}},"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/wp-json\/wp\/v2\/posts\/135039"}],"collection":[{"href":"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/wp-json\/wp\/v2\/users\/58"}],"replies":[{"embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/wp-json\/wp\/v2\/comments?post=135039"}],"version-history":[{"count":2,"href":"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/wp-json\/wp\/v2\/posts\/135039\/revisions"}],"predecessor-version":[{"id":135042,"href":"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/wp-json\/wp\/v2\/posts\/135039\/revisions\/135042"}],"wp:attachment":[{"href":"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/wp-json\/wp\/v2\/media?parent=135039"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/wp-json\/wp\/v2\/categories?post=135039"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.madrimasd.org\/blogs\/sociedadinformacion\/wp-json\/wp\/v2\/tags?post=135039"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}