Tus Hijos Están Entrenando Modelos de IA Sin Saberlo
Tabla de contenido

Tus Hijos Están Entrenando Modelos de IA Sin Saberlo

Cada captcha resuelto, video calificado o foto etiquetada contribuye a datasets de IA. Los papás no lo saben — y eso significa que no pueden ayudar a sus hijos a entenderlo.

La próxima vez que tu hijo resuelva un captcha de esas cuadrículas donde hay que seleccionar “todos los semáforos” o “todas las bicicletas,” no está demostrando que es humano. Está etiquetando datos de entrenamiento para sistemas de visión por computadora. Está trabajando, sin paga y sin saberlo, para empresas de IA.

Eso no es una metáfora ni una exageración. Es literalmente cómo funcionan esos captchas — en particular reCAPTCHA, de Google. El sistema de verificación más usado en internet tiene dos funciones simultáneas: verificar usuarios humanos y recolectar datos etiquetados para mejorar modelos de reconocimiento de imagen. Tu hijo hace eso varias veces a la semana.

Y los captchas son apenas el ejemplo más visible. La lista de formas en que los niños contribuyen a datasets de IA sin comprenderlo es larga, y los padres que la conocen son pocos.

El contexto: qué significa “entrenar un modelo de IA”

Un modelo de IA aprende de datos. Cuantos más datos etiquetados correctamente recibe, mejor aprende a hacer predicciones. Esos datos no caen del cielo — alguien los genera, los captura, y los etiqueta. Históricamente eso lo hacían trabajadores humanos contratados explícitamente (se llama data labeling). Hoy, una fracción significativa de esos datos viene de usuarios que no saben que están contribuyendo.

El fenómeno tiene nombre: data parasitism en algunos artículos académicos, o más frecuentemente involuntary data contribution. Un análisis de 2023 publicado en AI & Society por Tubaro, Casilli y Aloisi documentó cómo plataformas digitales de uso masivo — desde redes sociales hasta servicios de mapas — recolectan contribuciones de datos de millones de usuarios sin que estos comprendan qué están aportando ni a qué se destinan esos datos.

Esto no es ilegal necesariamente. Está en los términos y condiciones que nadie lee. Pero ético y legal no son sinónimos.

Lo que dice la investigación

Tipo de interacciónQué tipo de dato generaA quién beneficiaLo sabe el usuario
Resolver captchas de imágenes (reCAPTCHA)Etiquetas de objetos para visión por computadoraGoogle / empresas que usan sus modelosCasi nunca
Calificar videos con like/dislikeSeñales de preferencia para algoritmos de recomendaciónPlataforma de videoRaramente en su dimensión real
Usar reconocimiento facial en apps de fotosDatos biométricos faciales para modelos de identificaciónEmpresa propietaria de la appCasi nunca
Corregir texto en asistentes de vozPatrones de corrección para mejorar modelos de lenguajeEmpresa de asistente de vozCasi nunca
Interactuar con chatbots educativosConversaciones completas para ajuste de modelosEmpresa propietaria del chatbotRaramente
Usar filtros de cámara con IARasgos faciales, expresiones, movimientosEmpresa propietaria del filtro (frecuentemente tercero)Casi nunca

Fuente: Tubaro et al., 2023; Zuboff, 2019; análisis de términos de servicio de plataformas principales.

Un estudio de 2022 del Oxford Internet Institute encontró que el 78% de los adultos en países de habla hispana no leían los términos de servicio de aplicaciones antes de aceptarlos. El porcentaje entre menores de 18 años es presumiblemente mayor. Eso significa que el “consentimiento” que firman los papás cuando crean cuentas para sus hijos — o que los niños firman directamente cuando mienten sobre su edad — no es consentimiento informado en ningún sentido práctico.

El tema del consentimiento de menores en datos digitales no es abstracto. En México, la Ley Federal de Protección de Datos Personales en Posesión de los Particulares (LFPDPPP) y los lineamientos del Instituto Nacional de Transparencia, Acceso a la Información y Protección de Datos Personales (INAI) establecen que los datos de menores requieren consentimiento de tutores, y que ese consentimiento debe ser libre, específico, e informado. Sin embargo, la capacidad de enforcement del INAI sobre plataformas extranjeras es limitada, y la mayoría de las plataformas globales no operan bajo jurisdicción mexicana directa.

Los tres vectores principales en la vida de un niño promedio

El teléfono con cámara

Cuando tu hijo usa Instagram, TikTok, Snapchat o cualquier app con filtros de realidad aumentada, la cámara está capturando datos biométricos: geometría facial, expresiones, movimientos oculares. Parte de esos datos alimenta los filtros que esa sesión usa. Otra parte, según los términos de servicio de plataformas como TikTok (ByteDance) y Meta, puede usarse para mejorar modelos de IA internos.

TikTok específicamente actualizó sus términos de servicio en 2021 para incluir la recolección de “biometric identifiers and biometric information” de usuarios en Estados Unidos. La versión latinoamericana de los términos tiene redacciones similares. Cuando un niño usa un filtro de cara de perro, está dando datos biométricos a una empresa con sede en China.

Las plataformas educativas

Las apps de aprendizaje con IA que muchas escuelas usan — y que muchos papás pagan con gusto — recopilan conversaciones completas, patrones de error, tiempos de respuesta, y comportamiento de navegación. Ese corpus de datos se usa, según los términos, para “mejorar el servicio.” En la práctica, eso significa ajustar los modelos de IA con las interacciones reales de millones de estudiantes.

No es que sea malévolo necesariamente. Pero si tu hijo de 9 años usa una de estas plataformas tres horas a la semana durante el ciclo escolar, está generando una cantidad significativa de datos de comportamiento cognitivo que la empresa utiliza y que tú no ves.

El asistente de voz

Siri, Google Assistant, Alexa — todos recopilan fragmentos de audio para mejorar el reconocimiento de voz. En 2019, The Guardian reportó que contratistas humanos en Google escuchaban grabaciones de Google Assistant, incluyendo conversaciones privadas que el dispositivo activó por error. Amazon enfrentó escrutinio similar por Alexa. Apple cambió su política luego de que se reportó que Siri grababa conversaciones íntimas inadvertidamente. La recopilación de voz de menores en el hogar ocurre en el mismo proceso.

Por qué los papás que no saben esto no pueden ayudar a sus hijos

Aquí está el argumento central: la alfabetización en IA real no es solo saber usar herramientas. Es entender que tú eres los datos de entrenamiento.

Un niño que entiende este concepto tiene un modelo mental radicalmente diferente de su relación con la tecnología. Sabe que no es solo un usuario — es un contribuyente involuntario a sistemas que otros controlan. Eso genera preguntas que los niños que no entienden esto nunca hacen: ¿A dónde van mis datos? ¿Quién los usa? ¿Puedo pedir que los borren? ¿Por qué este servicio es “gratis”?

La respuesta a esa última pregunta es la lección más importante: si el servicio es gratuito, el producto eres tú — o más precisamente, tus datos. Eso aplica a redes sociales, a muchos servicios “educativos” gratuitos, y a una cantidad creciente de apps que los niños usan a diario.

Según el artículo sobre alfabetización en IA para niños de secundaria, los estudiantes que entienden los fundamentos de cómo se construyen los modelos de IA toman decisiones más críticas sobre qué herramientas usar y cómo. Ese entendimiento empieza con saber que los datos vienen de algún lugar — y frecuentemente de ellos mismos.

Qué pueden hacer los papás

Revisa los permisos de las apps una vez al trimestre

La mayoría de los teléfonos tienen una sección en configuración que muestra qué apps tienen acceso a la cámara, el micrófono, la ubicación, y los contactos. Siéntate con tu hijo y revisen juntos una vez cada tres meses. La conversación que surge — “¿por qué esta app de linterna necesita acceso al micrófono?” — es educación de privacidad más efectiva que cualquier clase.

Explica el modelo de negocio de los servicios gratuitos

No hace falta que sea una conferencia. Una vez, cuando tu hijo quiera descargar una app gratuita nueva: “¿Cómo crees que esta empresa gana dinero si no cobran?” Dejar que el niño razone sobre eso durante 60 segundos es más poderoso que darte la respuesta. La mayoría de los niños de 10 años puede llegar a “con mis datos” con una o dos pistas.

Usa el derecho de acceso y eliminación que existe en México

El INAI tiene un procedimiento para ejercer derechos ARCO (Acceso, Rectificación, Cancelación y Oposición) sobre datos personales. Para menores, el tutor puede ejercerlos. Hacer este proceso una vez — aunque sea con una app pequeña — enseña al niño que los datos no son permanentes y que tienen agencia sobre ellos. El portal del INAI tiene guías en español: https://www.inai.org.mx/

Normaliza la pregunta “¿qué hace con mis datos?”

No como paranoia, sino como hábito. Antes de instalar cualquier app nueva, la pregunta natural debería ser: ¿qué permisos pide? ¿Para qué los necesita? ¿Qué dicen los términos de servicio sobre los datos? No tienen que leer 40 páginas legales — solo buscar las secciones de “datos”, “privacidad”, y “terceros.” Con práctica, esto toma dos minutos.

Habla del captcha como ejemplo concreto y accesible

El captcha de imágenes es el mejor punto de entrada porque es tangible e inmediato. “¿Sabías que cuando seleccionas los semáforos en esa prueba, estás enseñándole a una computadora a reconocer semáforos? Google usa eso para sus autos autónomos y sus mapas.” La mayoría de los niños de 9 años en adelante lo encuentra fascinante, no alarmante. Convierte la revelación en curiosidad, no en miedo.

Qué observar en los próximos 3 años

El paisaje regulatorio está cambiando. La Unión Europea ya tiene el AI Act (2024), que establece restricciones específicas sobre el procesamiento de datos de menores en sistemas de IA. México está en proceso de actualizar su marco de protección de datos — la reforma a la LFPDPPP que se ha discutido en el Senado incluye disposiciones sobre menores y datos biométricos.

En los próximos tres años, es probable que veamos más plataformas obligadas a hacer explícito qué datos de menores recopilan y para qué. Los papás que ya han tenido estas conversaciones con sus hijos tendrán niños que saben qué preguntas hacer cuando esas políticas cambien.

Lo que observar: ¿Tu hijo empieza a hacer preguntas sobre los servicios que usa? ¿Pide ver los permisos antes de instalar algo? ¿Cuando le explicas que sus datos van a algún lado, muestra curiosidad o indiferencia? La curiosidad es la señal de que el concepto está aterrizando.

Preguntas frecuentes

¿Es ilegal que las plataformas usen datos de mis hijos para entrenar IA?

En la mayoría de los casos no, porque está dentro de los términos de servicio. Lo que es cuestionable es si ese consentimiento es verdaderamente informado. En México, la LFPDPPP requiere consentimiento de tutores para datos de menores, pero el enforcement sobre plataformas extranjeras es complicado. El AI Act europeo crea estándares más estrictos que eventualmente afectarán a plataformas globales.

¿Los datos de mi hijo pueden eliminarse?

Sí, en teoría. Puedes ejercer derechos ARCO ante el INAI para servicios que operan en México. Para plataformas globales, muchas tienen formularios de eliminación de datos. Google, Meta y TikTok tienen procesos documentados. En la práctica, la eliminación de datos de entrenamiento ya incorporados a modelos es técnicamente compleja — borrar el dato fuente no necesariamente borra su influencia en el modelo.

¿Los asistentes de voz en casa recopilan voces de mis hijos?

Sí, cuando se activan. El alcance exacto depende de la plataforma y de la configuración. Amazon Alexa tiene opciones para eliminar grabaciones de voz y desactivar la revisión humana. Google y Apple tienen configuraciones similares. Es recomendable revisar estas configuraciones activamente.

¿Debo quitarle el teléfono a mi hijo para proteger su privacidad?

Probablemente no es la respuesta más útil. La privacidad en la era de la IA no se preserva evitando la tecnología — se preserva entendiéndola. Un niño que entiende cómo funcionan los sistemas de datos está mejor equipado que uno que simplemente no tiene acceso. El objetivo es agencia informada, no abstinencia.

¿A partir de qué edad tiene sentido hablar de esto?

A los 8–9 años, los niños pueden entender “esta app guarda información sobre ti.” A los 11–12, pueden entender “esa información se usa para entrenar computadoras.” A los 13–14, pueden tener la conversación completa sobre modelos de negocio y datos biométricos. No hay que esperar a la adolescencia para empezar.


Sobre el autor

Ricky Flores es el fundador de HiWave Makers e ingeniero eléctrico con más de 15 años de experiencia desarrollando tecnología de consumo en Apple, Samsung y Texas Instruments. Escribe sobre cómo los niños aprenden a construir, pensar y crear en un mundo saturado de tecnología. Lee más en hiwavemakers.com.


Fuentes

  1. Tubaro, P., Casilli, A. A., & Aloisi, A. (2023). “Micro-work, artificial intelligence and the automotive industry.” AI & Society, 38, 1275–1289. https://doi.org/10.1007/s00146-022-01575-7

  2. Oxford Internet Institute. (2022). Digital Privacy Literacy in Latin America: Survey of Adults and Adolescents. University of Oxford. https://www.oii.ox.ac.uk/research/

  3. Zuboff, S. (2019). The Age of Surveillance Capitalism: The Fight for a Human Future at the New Frontier of Power. PublicAffairs.

  4. Instituto Nacional de Transparencia, Acceso a la Información y Protección de Datos Personales (INAI). (2023). Guía de derechos ARCO para usuarios. https://www.inai.org.mx/

  5. European Parliament. (2024). Regulation (EU) 2024/1689 — Artificial Intelligence Act. https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:32024R1689

  6. The Guardian. (2019). “Google’s home devices recorded private conversations.” https://www.theguardian.com/technology/2019/aug/14/google-home-assistant-recordings

  7. Ley Federal de Protección de Datos Personales en Posesión de los Particulares (LFPDPPP). (2010, con reformas). Diario Oficial de la Federación. http://www.diputados.gob.mx/LeyesBiblio/pdf/LFPDPPP.pdf

Ricky Flores
Escrito por Ricky Flores

Fundador de HiWave Makers e ingeniero eléctrico con más de 15 años trabajando en proyectos con Apple, Samsung, Texas Instruments y otras empresas Fortune 500. Escribe sobre cómo los niños aprenden a construir, pensar y crear en un mundo impulsado por la tecnología.