El anonimato está en proceso de extinción ante la posibilidad de que con solo 15 atributos demográficos se pueda identificar, con una probabilidad de 99.98%, a cada uno de los ciudadanos de Estados Unidos.
Hasta ahora, bastaba nuestro nombre, un número de DNI, el número telefónico, una dirección postal o de email para identificarnos suficientemente.
El volumen y reguero de datos que dejamos, más la capacidad de almacenarlos y gestionarlos, hacen que cada vez sea más sencillo identificarnos individualmente a partir de lo que hacemos y somos.
El anonimato ya no depende de que alguien averigüe nuestro nombre o teléfono; ahora, nuestro comportamiento o identidad puede identificarnos plenamente.
Un nuevo estudio publicado por Nature Communications determina que la incertidumbre es cuantificable, y puede eliminarse. La coinciencia de unos datos no tenía por qué implicar lo que exactamente era una persona; con 15 atributos es suficiente para distinguir a cada uno de los estadounidenses, sea cual sea el tamaño de la muestra.
‘Aunque podría haber mucha gente que tiene 35 años, es un hombre, vive en Nueva York, muchos menos nacieron en un 5 de enero de 1985, conducen deportivo rojo y viven con dos niñas de un perro’, dice Yves de Alexandre de Montjoye, profesor del Imperial College de Londres y uno de los autores de la investigación.
Los actores decisivos no son siempre los mismos o en la misma medida: a veces es el estado civil y otra la raza o cualquier otro. Pero solo tomando 15 factores, el modelo es capaz de certificar con una probabilidad de 99.98% que la persona que buscamos es un perfil único entre un enorme base de datos.
A lo largo de la última década, dos investigadores encontraron que puede desanonimarse con multitud de variables si el número de datos es suficiente: uso de redes sociales, datos genéticos, localización, gasto de tarjeta de crédito, historial de navegación, estilo de escritura, código informático.
‘Nuestra recomendación es que la carga de la prueba recaiga en el controlador de los datos para que demuestre fehacientemente que los mismos no pueden ser ligados a individuos, en lugar de que sean los defensores de la privacidad los que deban probar que esa relación es posible’ dice Arvind Narayanan.
Los organismos o empresas que compartan o pierdan parte de sus bases de datos anonimizadas, creían ser invulnerables al no estar vinculados a información personal. Cada vez más, sin embargo, lo que hacemos queda registrado y es información personal esté o no ligada a un nombre o identificador único.
‘Necesitamos estándares más altos para los datos anónimos y empezar a usar herramientas de ingenería que permitan utilizar datos que logren preservar la privacidad de la gente’, dice De Montjoye.