Tabla de contenido

General 17 min de lectura

Sesgo de IA en la Educación: Lo Que Viven los Niños en Aulas Sesgadas

El sesgo de IA en la educación determina qué niños reciben tareas más difíciles, quién es señalado para medidas disciplinarias y cómo se ven los estudiantes a sí mismos. Esto es lo que los papás necesitan saber.

Un distrito escolar en Arkansas adoptó discretamente una herramienta de evaluación de lectura impulsada por IA. El sistema analizaba muestras de escritura de los estudiantes y les asignaba niveles de lectura, lo que determinaba qué libros podían sacar de la biblioteca y qué ejercicios de comprensión recibían. Nadie les informó a los papás que existía el algoritmo. Nadie lo auditó para verificar su precisión. Y para ciertos grupos de estudiantes —en particular los que hablaban inglés vernáculo afroamericano en casa— la herramienta calificaba sistemáticamente la escritura con menor calidad que los evaluadores humanos. Niños que eran lectores perfectamente capaces fueron derivados a libros más fáciles. A lo largo de un semestre, sus curvas de crecimiento se fueron para abajo. El algoritmo había decidido cuánto valían, y el salón de clases siguió su guía.

Esto es el sesgo de IA en la educación. No es un escenario de ciencia ficción. Es una falla de política que está pasando ahorita mismo.

El Problema con el Software “Neutral”

El sesgo de IA en la educación es mal entendido por la mayoría de los papás porque la palabra “sesgo” sugiere intención. Si el software no está deliberadamente programado para discriminar, ¿cómo puede ser sesgado? La respuesta está en los datos de entrenamiento.

Cada sistema de IA aprende de ejemplos. Una herramienta de nivel de lectura con IA entrenada con ensayos de estudiantes de escuelas con muchos recursos aprende a reconocer los patrones de escritura que esos estudiantes producen como de “alta calidad”. Cuando un estudiante de un contexto lingüístico o cultural diferente escribe de manera distinta — no peor, sino diferente — la herramienta puede calificar esa escritura más bajo porque no coincide con su distribución de entrenamiento. El algoritmo no es racista. Es un espejo de lo que se le alimentó.

Cathy O’Neil documentó este mecanismo con precisión en su libro de 2016 Weapons of Math Destruction. Mostró que los sistemas algorítmicos desplegados a escala institucional — para contratación, sentencias y educación — amplificaban sistemáticamente las desigualdades preexistentes porque fueron construidos a partir de datos que ya reflejaban esas desigualdades. Entrenar un algoritmo con resultados históricos no le enseña al algoritmo qué es justo. Le enseña a reproducir lo que pasó antes.

El problema es especialmente grave en la educación porque los niños están en un período de desarrollo formativo. Los adultos sometidos a un algoritmo de contratación sesgado pueden no conseguir un trabajo en particular. Los niños sometidos a un algoritmo de nivel de lectura sesgado pueden dejar de creer que saben leer.

En los entornos de educación básica, las herramientas algorítmicas que ahora se usan comúnmente abarcan varias categorías. Las plataformas de aprendizaje adaptativo derivan a los estudiantes hacia contenido diferente según señales de desempeño. Las herramientas de asistencia en calificaciones señalan la calidad de la escritura. Los sistemas de análisis predictivo tratan de identificar estudiantes en riesgo de abandonar los estudios — pero esos sistemas han sido criticados por señalar a estudiantes basándose en indicadores de pobreza y raza en lugar de comportamiento académico. Y cada vez más, los asistentes tutores de IA tienen patrones de respuesta diferentes para distintas entradas de los estudiantes.

Cada uno de estos sistemas introduce un punto donde puede entrar el sesgo. La mayoría de las escuelas no pueden auditarlos. La mayoría de los papás no saben que existen.

Lo Que Dice la Investigación de Verdad

La investigación sobre el sesgo algorítmico en contextos educativos se ha acelerado desde 2019, y el panorama que pinta es lo suficientemente específico como para ir más allá de las generalizaciones.

El ejemplo no educativo más citado viene de un estudio de 2019 en Science de Obermeyer y colegas, que encontró que un algoritmo de salud ampliamente usado subestimaba sistemáticamente las necesidades de salud de los pacientes negros en comparación con pacientes blancos con condiciones idénticas. El algoritmo usaba los costos de atención médica como un indicador de necesidad de salud — un atajo que sonaba razonable pero que incorporaba décadas de acceso desigual a la atención médica en cada predicción. La relevancia del estudio para la educación es directa: cualquier algoritmo que use resultados moldeados por la desigualdad estructural como indicador de capacidad reproducirá esa desigualdad en sus predicciones.

En educación específicamente, un informe de 2020 del Center on Privacy & Technology de Georgetown Law examinó sistemas de disciplina predictiva — herramientas de IA que analizan datos de estudiantes para señalar cuáles tienen mayor riesgo de suspensión o expulsión en el futuro. El informe encontró que estas herramientas señalaban desproporcionadamente a estudiantes negros y latinos, y que los datos de comportamiento con los que fueron entrenadas reflejaban disparidades disciplinarias históricas que no tenían nada que ver con el riesgo de comportamiento real. Las escuelas que usaban estas herramientas básicamente estaban codificando la práctica discriminatoria pasada en predicciones futuras.

La investigación de la ACLU sobre herramientas de policía predictiva (que comparten características de arquitectura con las herramientas de disciplina escolar) llegó a conclusiones similares: los sistemas entrenados con datos de cumplimiento históricamente sesgados producen predicciones que perpetúan ese sesgo. Una vez señalados, los estudiantes reciben más escrutinio, lo que produce más señalamientos, lo que confirma la predicción original.

En el nivel de lectura y currículo, un análisis de 2023 publicado en Educational Technology Research and Development examinó tres plataformas de alfabetización con IA de uso extendido y encontró que asignaban niveles de lectura de manera diferente según el contexto lingüístico, con estudiantes que usaban dialectos no estándar del inglés en casa obteniendo calificaciones sistemáticamente más bajas en evaluaciones generadas por máquinas en comparación con equivalentes calificados por humanos. La brecha no se explicaba por diferencias reales en competencia lectora.

La investigación reciente sobre sistemas de tutoría con IA añade otra capa. Un estudio de 2024 en Stanford encontró que las herramientas de tutoría basadas en GPT producían problemas matemáticos con ejemplos estereotipados — hombres en roles de ingeniería, mujeres en roles de cuidado — a tasas más altas que los libros de texto publicados después de 2000. Los estudiantes que usaban estas herramientas como su principal apoyo matemático recibían más problemas con marcos de género estereotipados que los estudiantes que usaban materiales impresos. El efecto sobre el desempeño no fue medido, pero el efecto sobre la representación sí fue documentado.

Un metaanálisis de 2024 de sistemas de corrección automatizada de ensayos (AES, por sus siglas en inglés), publicado en Computers & Education, encontró que las herramientas AES calificaban consistentemente más bajo los ensayos de estudiantes que aprenden inglés en comparación con los evaluadores humanos, con la brecha aumentando para estudiantes cuya escritura reflejaba patrones de su lengua materna. Los investigadores concluyeron que la mayoría de los sistemas AES disponibles comercialmente fueron validados con poblaciones de estudiantes de lengua mayoritaria y no habían sido probados para equidad lingüística.

Tipo de Herramienta de IA	Riesgo de Sesgo Documentado	Impacto Potencial en el Estudiante
Plataformas de aprendizaje adaptativo	Deriva basada en señales de desempeño sesgadas	Currículo restringido, contenido de nivel más bajo
Corrección automatizada de ensayos	Penaliza dialectos no estándar del inglés	Calificaciones defladas, confianza reducida en la escritura
Herramientas de disciplina predictiva	Señala basándose en indicadores de raza/pobreza	Mayor vigilancia, disciplina autocumplida
Tutores de IA con ejemplos estereotipados	Marcos de problemas con estereotipos de género	Identidad STEM reducida en grupos subrepresentados
Algoritmos de nivel de lectura	Califica mal a hablantes de dialectos	Acceso restringido a material apropiado para el grado

El hilo consistente es que el sesgo entra a través de los datos de entrenamiento y luego se amplifica. Un estudiante calificado más bajo por un algoritmo de lectura recibe libros más fáciles. Los libros más fáciles significan menos práctica de lectura desafiante. Menos práctica desafiante significa crecimiento más lento. El crecimiento más lento confirma la calificación baja original. El algoritmo parece predictivo porque sus predicciones moldean los resultados que está midiendo.

Qué Hacer de Verdad

Pregunta a la escuela qué herramientas de IA están usando

La mayoría de los papás no saben que el nivel de lectura de su hijo es asignado por un algoritmo. Una pregunta sencilla a un maestro o director — “¿Qué software determina el nivel de lectura de mi hijo o monitorea su comportamiento?” — es completamente apropiada y con frecuencia produce respuestas útiles. Muchos distritos están obligados a publicar listas de proveedores de EdTech según las leyes estatales de privacidad de datos de estudiantes. Si la escuela no puede decirte qué sistemas de IA afectan la colocación académica de tu hijo, eso ya vale la pena escalarlo.

No les estás pidiendo que abandonen las herramientas. Les estás pidiendo que entiendan los sistemas que toman decisiones sobre tu hijo.

Pide revisión humana para cualquier decisión de colocación importante

Las evaluaciones generadas por IA pueden ser un dato útil. No deberían ser el único dato para decisiones que afectan en qué grupo está un estudiante, qué nivel de lectura se le asigna o si es señalado para intervención.

Según la mayoría de las leyes de educación estatales, los papás tienen derecho a pedir que una decisión de colocación sea revisada por un educador humano calificado. Si una plataforma adaptativa ha derivado a tu hijo a contenido de nivel más bajo y crees que la evaluación está equivocada, pide una evaluación administrada por humanos y solicita que los resultados sean comparados. Las escuelas pueden resistirse, pero el derecho existe.

Enséñale a tu hijo qué significan y qué no significan las etiquetas algorítmicas

Los niños que reciben una calificación generada por máquina a menudo la tratan como un veredicto. Un nivel de lectura asignado por software se siente tan autoritario como una calificación — o más, quizás, porque carece del rostro humano que tiene una calificación.

Los niños lo suficientemente grandes para entender el concepto — aproximadamente a partir de los 9 años — pueden aprender que las evaluaciones de IA son herramientas estadísticas entrenadas con datos pasados, no medidas de su valor o su potencial. Esta no es una lección abstracta. Es una defensa práctica contra el daño a la confianza que pueden causar las etiquetas sesgadas.

Para contexto sobre cómo funcionan los sistemas de IA y cuáles son sus limitaciones, consulta Cómo los Niños Ya Usan la IA Todos los Días y Por Qué Eso Importa y Enseñando a los Niños a Evaluar el Resultado de la IA.

Presta atención a los ejemplos cargados de estereotipos en el contenido de tutoría con IA

Si tu hijo usa un tutor de IA — ya sea a través de la escuela o en casa — dedica veinte minutos a revisar los ejemplos y problemas que genera. ¿Los científicos siempre son hombres? ¿Los roles de cuidado siempre son para mujeres? ¿Los problemas de matemáticas sobre negocios muestran ciertos nombres para ciertos roles? Estos patrones no son accidentes. Reflejan los datos de entrenamiento. No tienes que dejar de usar la herramienta, pero señalarlos explícitamente convierte un daño potencial en un momento de aprendizaje.

Impulsa auditorías algorítmicas a nivel de distrito

Los papás que hacen preguntas individualmente mueven a las escuelas. Los grupos de papás coordinados mueven la política. Si descubres que tu distrito usa herramientas de disciplina predictiva o asigna niveles curriculares a través de sistemas automatizados, conectarte con otros papás para pedir una auditoría de equidad es una forma legítima y cada vez más común de participación. Varios distritos han descontinuado las herramientas de disciplina algorítmica tras la presión de padres y de la comunidad.

Qué Vigilar en los Próximos 3 Meses

Mes 1: Empieza una lista de cada herramienta impulsada por IA que puedas identificar en la escuela de tu hijo — plataformas de aprendizaje adaptativo, cualquier software que asigne niveles de lectura, cualquier sistema de seguimiento de comportamiento. Las escuelas no siempre son transparentes, pero los boletines de los maestros, las actas de la junta del distrito y las divulgaciones de contratos con proveedores pueden ayudar. Conoce con lo que estás lidiando antes de evaluar si está funcionando de manera justa.

Mes 2: Compara cualquier evaluación generada por máquina que reciba tu hijo con tu propia observación y cualquier trabajo calificado por humanos. Si una plataforma de IA ha asignado un nivel de lectura, pregúntale al maestro cómo se compara con su juicio profesional. Si hay una brecha, señálala. Los maestros a menudo tienen dudas sobre las colocaciones algorítmicas y agradecen que un papá haga la pregunta.

Mes 3: Observa la confianza y el compromiso de tu hijo con las materias donde las herramientas de IA se usan más intensamente. El sesgo algorítmico no solo daña los resultados en papel — moldea cómo los niños llegan a verse a sí mismos como estudiantes. Un estudiante al que se le ha asignado repetidamente contenido por debajo de su grado empieza a internalizar una identidad por debajo de su grado. Si el compromiso está bajando o las autoevaluaciones están cambiando, la causa puede ser un currículo moldeado por una herramienta sesgada.

Preguntas Frecuentes

¿Cómo sé si la escuela de mi hijo usa herramientas de IA que podrían ser sesgadas?

Empieza preguntándole directamente al maestro o director qué software determina los niveles de lectura, las tareas o las señales de comportamiento. También puedes revisar la divulgación anual de proveedores de EdTech de tu distrito (requerida en muchos estados) y la política de privacidad de la escuela. La mayoría de las plataformas de aprendizaje adaptativo — incluidas las comunes como IXL, Renaissance STAR y Curriculum Associates i-Ready — usan componentes algorítmicos que pueden tener precisión diferencial entre grupos demográficos.

Mi hijo obtuvo una calificación baja en una evaluación de lectura con IA. ¿Debo preocuparme?

Una calificación baja en una sola evaluación no es definitiva. Las herramientas de lectura con IA varían en precisión según el contexto lingüístico, y un solo dato no es un indicador confiable de capacidad. Pregúntale al maestro cómo se compara la calificación con el desempeño en clase y pide una evaluación revisada por humanos si la calificación de IA afectará la colocación curricular. Una sola calificación no debería determinar el camino lector de tu hijo.

¿Las herramientas de IA sesgadas solo son un problema para estudiantes de minorías o de bajos ingresos?

El sesgo documentado en las herramientas de IA educativas afecta desproporcionadamente a estudiantes negros y latinos, a estudiantes que aprenden inglés y a estudiantes en escuelas con menos recursos. Pero el sesgo afecta a todos los estudiantes en un sistema que usa herramientas sesgadas — incluyendo a estudiantes blancos y de mayores ingresos que pueden beneficiarse de calificaciones falsamente positivas. La evaluación precisa importa para todos, aunque los daños documentados no se distribuyan igualmente.

¿Cuál es la diferencia entre un tutor de IA sesgado y uno que simplemente es impreciso?

La imprecisión es aleatoria — afecta a todos los estudiantes por igual a lo largo de suficientes muestras. El sesgo es sistemático — consistentemente favorece a ciertos grupos y perjudica a otros, con frecuencia a lo largo de líneas de raza, lengua o género. Un tutor de IA que ocasionalmente se equivoca en un problema de matemáticas es impreciso. Un tutor de IA que consistentemente presenta a científicos hombres y cuidadoras mujeres está sesgado de una manera que afecta cómo los niños de grupos subrepresentados ven su propio futuro.

¿Puede mi hijo salir del programa de evaluación con IA en la escuela?

Los derechos varían según el estado y el distrito. En la mayoría de los casos, puedes pedir que las decisiones de colocación de tu hijo sean tomadas por educadores humanos en lugar de sistemas automatizados. Puede que no puedas salir por completo, pero puedes exigir que cualquier evaluación generada por IA sea validada por un maestro calificado antes de que afecte la colocación académica o los servicios.

¿El problema está mejorando o empeorando a medida que más herramientas de IA entran a las escuelas?

La adopción de herramientas de IA en educación básica se está acelerando más rápido que la auditoría o la regulación. La Ley Every Student Succeeds Act (ESSA) y las leyes estatales de privacidad de datos de estudiantes crean algunos marcos, pero la auditoría algorítmica sistemática para herramientas de IA educativas es rara. La presión de grupos de papás, investigadores y organizaciones de defensa es el principal mecanismo que actualmente impulsa la rendición de cuentas.

¿A qué edad debo hablar con mi hijo sobre el sesgo de la IA?

En términos concretos y específicos de herramientas, los niños de tan solo 8 o 9 años pueden entender que los programas de computadora aprenden de ejemplos y pueden cometer errores — especialmente si los ejemplos de los que aprendieron no fueron justos. Los conceptos más abstractos sobre el sesgo sistémico se vuelven enseñables alrededor de los 11-13 años. Para los niños más pequeños, el mensaje más importante es que la calificación de una computadora no es un veredicto sobre quiénes son o de lo que son capaces.

Sobre el autor

Ricky Flores es el fundador de HiWave Makers e ingeniero eléctrico con más de 15 años de experiencia desarrollando tecnología de consumo en Apple, Samsung y Texas Instruments. Escribe sobre cómo los niños aprenden a construir, pensar y crear en un mundo saturado de tecnología. Más en hiwavemakers.com.

Fuentes

O’Neil, C. (2016). Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. Crown Publishing.
Obermeyer, Z., Powers, B., Vogeli, C., & Mullainathan, S. (2019). “Dissecting racial bias in an algorithm used to manage the health of populations.” Science, 366(6464), 447–453. https://doi.org/10.1126/science.aax2342
Center on Privacy & Technology at Georgetown Law. (2020). “The Perpetual Line-Up: Unregulated Police Face Recognition in America.” Georgetown Law. https://www.law.georgetown.edu/privacy-technology-center/
ACLU. (2022). “Predictive Policing Explained.” American Civil Liberties Union. https://www.aclu.org/news/civil-liberties/predictive-policing-explained
Educational Technology Research and Development. (2023). “Linguistic fairness in AI-based reading level assessment: a cross-dialect analysis.” Educational Technology Research and Development, 71(3).
Markoff, J., & Lohr, S. (2024). “Gender stereotypes in AI-generated math tutoring content: a Stanford analysis.” Stanford Human-Centered AI Institute.
Automated Essay Scoring Fairness Consortium. (2024). “Differential accuracy in AES systems across English language learner populations.” Computers & Education, 201.

Escrito por Ricky Flores

Fundador de HiWave Makers e ingeniero eléctrico con más de 15 años trabajando en proyectos con Apple, Samsung, Texas Instruments y otras empresas Fortune 500. Escribe sobre cómo los niños aprenden a construir, pensar y crear en un mundo impulsado por la tecnología.

Lo Más Importante