El origen de la filtración de datos de Facebook

Cómo Cambridge Analytica utilizó datos del gigante de las redes sociales para influir en los resultados de la campaña presidencial de Donald Trump

Guardar
Michal Kosinski
Michal Kosinski

El 9 de noviembre de 2016, alrededor de las 8:30 de la mañana, el investigador Michal Kosinski se despertó en el Hotel Sunnehus de Zurich.

Cuando encendió la televisión, inmediatamente comprendió que se había destapado la olla: contra todos los pronósticos de las encuestadoras y estadísticas más fiables, Donald J. Trump había sido elegido presidente de los Estados Unidos.

En ese momento, tuvo un presentimiento de que el resultado de la elección podría tener algo que ver con su investigación. Finalmente, respiró hondo, apagó la televisión y se volvió a dormir.

Unas horas más tarde, una empresa británica por entonces poco conocida llamada Cambridge Analytica envió un comunicado de prensa: "Estamos encantados de que nuestro enfoque revolucionario de la comunicación basada en datos haya jugado un papel tan importante en la extraordinaria victoria del presidente electo Trump", dijo su CEO, Alexander James Ashburner Nix.

Alexander Nix, CEO de Cambridge
Alexander Nix, CEO de Cambridge Analytica

Unos años antes, Kosinski era un estudiante en Varsovia cuando, en 2008, su vida tomó una nueva dirección: fue aceptado por la prestigiosa Universidad de Cambridge para hacer su doctorado en el Centro de Psicometría de la institución.

Su investigación se basaba en un modelo desarrollado en la década de 1980 por dos equipos de psicólogos para evaluar a los seres humanos en base a cinco rasgos de personalidad. Conocidos como el "modelo de los cinco grandes", estos son:

1. Apertura (¿Hasta que punto estás abierto a nuevas experiencias?)
2. Responsabilidad (¿Hasta que punto eres perfeccionsita?)
3. Extraversión (¿Hasta que punto eres sociable?)
4. Amabilidad (¿Hasta que punto eres considerado y cooperativo?)
5. Neuroticismo (¿Hasta que punto eres emocionalmente estable?)

A partir de estas dimensiones de personalidad, los psicólogos conjeturaban que podían hacer una valoración relativamente precisa del tipo de persona siendo examinada, incluyendo sus necesidades, sus miedos y su comportamiento más probable.

Con el tiempo, el modelo de los cinco grandes se convirtió en la técnica estándar de la psicometría, pero su principal obstáculo era la recopilación de datos, un proceso que implicaba la cumplimentación de una serie de cuestionarios complejos y en gran medida personales.

Luego llegó el Internet, Google, Facebook, y Kosinski…

Cambridge Analytica está acusada de
Cambridge Analytica está acusada de haber obtenido datos de 50 millones de usuarios en Facebook sin permiso (por Rodrigo Acevedo Musto)

Junto a su compañero David Stillwell, actualmente profesor en la Judge Business School de la Universidad de Cambridge, lanzaron una app en Facebook llamada MyPersonality que permitía a los usuarios de la red social rellenar una variedad de cuestionarios psicométricos a cambio de un "perfil de personalidad". Los encuestados de la app no solo rellenaron cuestionarios basados en el modelo de los cinco grandes ("Me asusto fácilmente", "contradigo a otros"), sino que también podían optar por compartir sus datos personales de su perfil de Facebook.

Ni Kosinski ni Stillwell, que esperaban la participación de apenas decenas de personas en el experimento, se imaginaron lo que sucedió después. Cientos, miles y luego millones de personas aceptaron compartir sus convicciones más íntimas con la app. Involuntariamente, ambos se convirtieron, de repente, en los dueños del mayor conjunto de datos que combinaba las puntuaciones psicométricas con los perfiles de Facebook que jamás se habían recopilado.

El siguiente paso de su investigación no solo era lógico sino increíblemente simple. Los estudiantes compararon los resultados de su prueba de personalidad original con todo tipo de datos de los sujetos en estudio: lo que les "gustaba" en Facebook, lo que compartían, lo que publicaban, su género, edad, lugar de nacimiento y residencia, entre otros.

Esto permitió a los investigadores unir los puntos y hacer correlaciones, un proceso que abrió las puertas a una nueva rama de estudio que hoy se conoce ampliamente como Big Data.

Big Data es el análisis
Big Data es el análisis de un mundo constantemente inundado de datos

Las correlaciones que encontraron fueron asombrosas. Los hombres a quienes les gustaba ciertas marcas de cosméticos, por ejemplo, eran ligeramente más propensos a ser homosexuales. Los seguidores de Lady Gaga tendían a ser más extrovertidos, mientras que a aquellos que les gustaba la filosofía tenían más probabilidades de ser introvertidos.

Si bien dicha información no es suficiente para producir una predicción fiable por sí sola, al analizar la combinación de un conjunto de datos individuales, los resultados son realmente precisos.

En 2012, Kosinski demostró que, basándose en un promedio de 68 "me gusta" de Facebook, era posible predecir el color de piel de una persona (con un 95% de precisión), su orientación sexual (88%) y su afiliación política (85%).

Con tan solo 70 "me gusta", los candidatos al doctorado podían superar lo que sabían los amigos de una persona. Con 150, lo que sus padres sabían de sus hijos. Y con 300, lo que sabía su pareja.

"Nuestro smartphone", concluyó Kosinski, "es un vasto cuestionario que estamos constantemente rellenando, tanto consciente como inconscientemente".

Groundgame, una aplicación para el
Groundgame, una aplicación para el escrutinio electoral que integra los datos de los votantes con “tecnología de visualización geoespacial”, fue utilizada por los activistas de Trump y Brexit

Su descubrimiento era tan prometedor que, en 2014, Kosinski contactado por un joven profesor asistente en el departamento de psicología llamado Aleksandr Kogan que trabajaba para una empresa llamada Strategic Communication Laboratories (SCL) que quería acceder a su base de datos.

Al principio, Kosinski consideró la oferta, ya que significaba una gran contribución para la institución, pero cuando investigó qué tipo de compañía era SCL, entonces se dio cuenta del peligro detrás de su descubrimiento. 

SCL se define como "la principal agencia de gestión electoral" cuyo principal objetivo es diseñar modelos de marketing en base a modelos psicológicos para, entre otras cosas, influenciar los resultados de las elecciones políticas.

"Fue entonces que todo comenzó a apestar", dijo Kosinski, tras descubrir que algunos de los miembros de SCL habían participado en elecciones desde Ucrania hasta Nigeria.

Pese a profundizar su conocimiento sobre la compañía de marketing, lo que el investigador desconocía de la empresa en aquel momento era que SCL es la empresa matriz de un conjunto de compañías y que, en 2013, creó una nueva organización para participar en las elecciones estadounidenses llamada Cambridge Analytica. 

Mark Turnbull, director de Política
Mark Turnbull, director de Política Global de Cambridge Analytica, durante la cámara oculta hecha por Channel 4 News: “No sirve pelear una campaña electoral con hechos”

El resto de la historia ha salido a la luz en los últimos días, tras ser revelado por medios británicos y estadounidenses que dicha organización recopiló y utilizó, sin permiso, la información de 50 millones de usuarios de Facebook para promocionar la campaña presidencial de Donald Trump.

Kosinski, por su parte, que desde que enfrentó a Kogan ha intentado advertir sobre los riesgos de utilizar el enfoque psicológico en un contexto político, está recibiendo nuevamente correos electrónicos acusadores.

"No", afirma el científico. "Esto no es culpa mía. Yo no construí la bomba. Sólo mostre que existe".

Más sobre este tema:

7 claves para entender el escándalo de Facebook y Cambridge Analytica

Sobornos, mujeres y noticias falsas: el CEO de Cambridge Analytica confesó en una cámara oculta los métodos que salpican a Facebook

Big Data: cómo está ocurriendo la revolución de los datos ocultos y los secretos más íntimos

Guardar