Así lo revela un estudio realizado sobre las aplicaciones de videoconferencia y la recolección de audio. Un grupo de investigadores logró descubrir que estaban haciendo los usuarios en base a la lectura de los paquetes de telemetría de los programas.
Kaseem Fawaz es profesor asistente de ingeniería eléctrica y computación de la Universidad de Wisconsin y experto en privacidad online. Un día su hermano le comentó que durante una videoconferencia luego de silenciar su micrófono la luz que indica su uso permaneció encendida. Fawaz se mostró interesado por este pequeño detalle y se propuso investigar si se trataba de un extraño incidente aislado o había un problema mayor con el modo en que las apps acceden a los micrófonos.
Según explica el invetigador en la gran mayoría de los casos, cuando el usuario silencia el micrófono, las aplicaciones siguen teniendo acceso al mismo. Esto quiere decir que las aplicaciones, técnicamente, siguen recabando datos.
Percepción
Para la investigación Fawaz contó con la ayuda, primero, del estudiante Yucheng Yang, posteriormente se unieron colegas de la Universidad de Loyola, Chicago.
Para el estudio se le preguntó a 223 usuarios de aplicaciones de videoconferencia como pensaban que funcionaba el botón de silenciado y cómo debían tratarse los datos del audio. Las partes que pensaban que las aplicaciones accedían al micrófono y las que no estuvieron bastante equilibradas. Sin embargo hubo una importante coincidencia respecto a que no debía realizarse una recolección de datos.
Información capturada
A continuación se investigó la función en varias aplicaciones para determinar que datos se tomaban.
Los investigadores descubrieron que todos los programas tomaban audio de forma ocasional cuando el micrófono estaba silenciado. En uno de los casos la información era suministrada al servidor con el mismo ritmo sin importar si el micrófono estaba silenciado o no.
Como tercer paso se buscó determinar si los datos recolectados por las aplicaciones podían ser utilizados para determinar lo que los usuarios estaban haciendo. Para tal fin entrenaron a un sistema de clasificación bajo un esquema de aprendizaje automatizado y con audios tomados de YouTube que representaban actividades comunes (cocinar, comer, escuchar música, limpiar, entre otras).
El sistema logró identificar lo que sucedía en un 82% de los casos leyendo los paquetes de telemetría que las aplicaciones enviaban. Esto es posible porque las actividades generan diferentes tipos de marcas acústicas. No es necesario en sí escuchar los audios.