Tabla de contenido

General 15 min de lectura

La IA en la Cámara del Celular de Tu Hijo Es Más Avanzada que ChatGPT — Y La Mayoría de los Papás No Lo Saben

El modo retrato, modo noche y borrado de objetos no son filtros — son redes neuronales en tiempo real. Aquí lo que los papás deben saber sobre fotografía computacional y qué significa para sus hijos.

Tu hijo de doce años toma una foto de su perro con el celular. En décimas de segundo, el fondo se difumina suavemente, el perro queda perfectamente enfocado, el ruido de la imagen nocturna desaparece, y la foto parece tomada con una cámara profesional de $20,000 pesos. Tu hijo dice “quedó chida” y sigue con su día.

Ninguno de los dos sabe lo que acaba de pasar. Y lo que pasó es, sin exagerar, uno de los logros más impresionantes de la inteligencia artificial aplicada en la historia reciente.

El problema: la IA más avanzada de tu casa no está en ChatGPT

Cuando la mayoría de los papás piensan en inteligencia artificial, piensan en ChatGPT, en robots, en algo que vive en servidores enormes en California. No piensan en el chip que viene dentro del Samsung Galaxy que tu hijo usa todos los días.

Ese es un error de percepción que vale la pena corregir, porque la realidad es al revés de lo que parece.

ChatGPT genera texto. Eso es computacionalmente impresionante, pero en esencia es un modelo de lenguaje que predice qué palabra viene después. La cámara de un Samsung Galaxy S24 o un iPhone reciente hace algo diferente y, en términos de complejidad computacional por milisegundo, más exigente: procesa múltiples imágenes simultáneamente a 30 o más cuadros por segundo, aplica docenas de modelos de visión computacional en tiempo real, y genera una imagen final que ningún sensor de cámara podría capturar físicamente sin esa IA.

Eso requiere un chip especializado llamado NPU — Neural Processing Unit. El Samsung Galaxy tiene uno integrado en su chip Exynos o Snapdragon. El iPhone tiene el Bionic. Motorola, Xiaomi, y hasta celulares de gama media desde $3,500 MXN ya traen NPUs. Son procesadores diseñados específicamente para correr operaciones de redes neuronales a velocidades que los procesadores convencionales no pueden alcanzar.

La mayoría de los papás no saben esto. Tampoco la mayoría de los maestros. Y esa ignorancia colectiva tiene un costo: nuestros hijos están interactuando con IA de clase mundial todos los días sin tener el vocabulario para entender lo que están usando.

Lo que dice la investigación sobre fotografía computacional

Del sensor a la imagen: lo que hace la IA en microsegundos

Una cámara física tiene limitaciones físicas. El sensor de un celular es pequeño — mucho más pequeño que el sensor de una cámara profesional. Los lentes también son pequeños. En condiciones de poca luz, los sensores pequeños generan “ruido” — esa apariencia granulada de las fotos nocturnas. El desenfoque de fondo (bokeh) que ves en retratos profesionales requiere lentes con aperturas amplias que los celulares no pueden incluir por razones de diseño físico.

La solución de la industria fue radical: en lugar de mejorar el hardware, construyeron IA que compensa sus limitaciones.

El “modo noche” del Samsung Galaxy, por ejemplo, toma entre 8 y 30 fotografías sucesivas en fracciones de segundo, alinea perfectamente las imágenes (compensando el movimiento de tu mano), y usa redes neuronales convolucionales para identificar qué pixeles contienen información real y cuáles son ruido. El resultado final es una imagen compuesta que tiene más información lumínica de la que cualquier fotografía individual podría capturar.

El “modo retrato” no usa óptica real para desfocar el fondo. Usa un modelo de segmentación semántica — una red neuronal que clasifica cada pixel de la imagen como “sujeto principal” o “fondo” — y aplica un algoritmo de desenfoque artificial al fondo. La calidad de ese retrato depende completamente de qué tan bien el modelo de segmentación entiende la diferencia entre una cara y los objetos detrás de ella.

Un estudio del MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) publicado en el IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2023) demostró que los modelos de imagen computacional en celulares de gama alta ahora superan en ciertas métricas de calidad de imagen a cámaras profesionales DSLR de hace cinco años. No en todos los aspectos — una DSLR sigue siendo superior en control creativo y en condiciones extremas — pero en situaciones cotidianas y con la IA activada, los celulares ganan.

La investigación en México: INAOE lidera en visión computacional

El INAOE — Instituto Nacional de Astrofísica, Óptica y Electrónica, con sede en Tonantzintla, Puebla — tiene uno de los grupos de investigación más activos de América Latina en visión computacional. Sus investigadores trabajan en reconocimiento de imágenes médicas, análisis de imágenes satelitales, y reconocimiento de objetos — todos problemas que usan las mismas técnicas de redes neuronales convolucionales que están en la cámara de tu celular.

El hecho de que México tenga investigación de frontera en este campo no es un detalle menor. Significa que los niños mexicanos que se interesen en visión computacional tienen un camino académico local de primer nivel. No necesitan irse a MIT. El INAOE, la UNAM, el IPN, y el Tec de Monterrey tienen grupos de investigación competitivos a nivel global en este campo.

Las empresas mexicanas que ya usan visión computacional

La visión computacional no es solo para Google o Apple. Empresas nacidas en México la están usando para negocios reales:

Kavak (la plataforma de compra-venta de autos usados más grande de América Latina) usa visión computacional para analizar automáticamente las fotografías de cada vehículo y detectar daños, raspones y condiciones. Sin esa tecnología, necesitarían miles de evaluadores humanos para su volumen de operaciones.

Clip (procesadora de pagos) usa visión computacional para validar documentos de identidad y para detección de fraude en transacciones.

Mercado Libre tiene equipos enteros de ingenieros de machine learning trabajando en anotación y categorización automática de imágenes de productos — un trabajo que sería imposible de hacer manualmente dado el volumen de millones de anuncios diarios.

Estas son empresas que tienen oficinas en Ciudad de México, Guadalajara y Monterrey, y que contratan ingenieros con conocimientos en visión computacional. La carrera que puede empezar cuando tu hijo experimenta con la cámara de su celular puede llevar directamente a estas oportunidades.

Tecnología de cámara	Qué hace la IA	Qué tipo de IA usa	Dónde más se usa esta IA
Modo noche	Combina múltiples exposiciones y reduce ruido	Denoising con redes neuronales convolucionales	Imágenes médicas (MRI, rayos X)
Modo retrato / bokeh	Separa sujeto del fondo y aplica desenfoque artificial	Segmentación semántica	Vehículos autónomos, diagnóstico médico
HDR automático	Combina múltiples exposiciones para equilibrar luz	Fusión de exposición con deep learning	Fotografía satelital, cartografía
Borrado de objetos	Elimina personas u objetos y reconstruye el fondo	Inpainting con redes generativas (GANs)	Restauración de arte, edición de video
Reconocimiento de escena	Detecta si estás fotografiando comida, paisaje, etc.	Clasificación de imágenes con CNN	Sistemas de seguridad, retail automatizado
Super Resolución	Aumenta la resolución más allá del sensor físico	Super-resolution networks (SRCNN, ESRGAN)	Imágenes satelitales, medicina, astronomía
Estabilización de video	Elimina temblor de mano en tiempo real	Análisis de flujo óptico + redes neuronales	Drones industriales, cirugía robótica

Qué hacer concretamente: experimentos para hacer con tus hijos

Experimento 1: el modo retrato y los límites de la segmentación

Toma una fruta — una manzana o una naranja — y ponla sobre una mesa. Activa el modo retrato y fotografíala. Observa cómo la IA intenta “decidir” qué es el sujeto principal y qué es el fondo. Ahora intenta con objetos más complicados: una planta con muchas hojas, un juguete con formas irregulares, tu mano sosteniendo algo.

La IA va a cometer errores. A veces va a desfocar parte del sujeto pensando que es fondo. A veces va a dejar nítido el fondo por confusión. Esos errores son oro educativo: muestran exactamente dónde el modelo de segmentación se confunde, y por qué. Para un niño de 9-14 años, esto es mucho más concreto que cualquier definición abstracta de “inteligencia artificial”.

Pregunta generadora: “¿Por qué crees que la IA se confundió aquí? ¿Qué haría diferente si fueras tú quien diseñó el sistema?”

Experimento 2: modo noche vs. foto estándar

En condiciones de poca luz — la sala con solo la televisión encendida, el cuarto con una lámpara pequeña — toma dos fotos del mismo objeto: una con modo noche activado y otra sin él. Compara los resultados y habla sobre qué hizo la IA para mejorar la segunda imagen. Si tu celular te muestra cuántas fotos combinó (algunos Samsung lo muestran durante la captura), mejor todavía.

Para niños más grandes (12-15 años), puedes explicar que lo que la IA está haciendo es básicamente lo que los astrónomos han hecho durante décadas con telescopios: apilar múltiples exposiciones para capturar más luz. La cámara del INAOE en Tonantzintla hace exactamente eso para fotografiar objetos débiles en el cielo nocturno.

Experimento 3: qué apps tienen acceso al micrófono y la cámara

Este experimento es sobre privacidad, y es igualmente importante. En Android: ve a Configuración → Privacidad → Administrador de permisos → Cámara. En iPhone: Configuración → Privacidad y seguridad → Cámara. Revisa juntos qué aplicaciones tienen acceso a la cámara de tu hijo.

La pregunta educativa no es alarmista: “¿Para qué necesita acceso a la cámara esta app?” Algunas respuestas son obvias (Instagram, la cámara del celular). Otras pueden sorprender. Esta conversación sobre permisos y privacidad es parte de una conversación más amplia sobre cómo explicar la IA a tus hijos que vale la pena tener.

Habla del valor económico de las imágenes

Cuando tu hijo publica una foto en Instagram o TikTok con los filtros de IA activados, la plataforma está recopilando datos sobre cómo usó la herramienta, qué tipo de contenido produce, y probablemente usando esa imagen para mejorar sus propios modelos. Esto no es necesariamente malo — pero es información que vale la pena que los niños tengan.

La pregunta de “¿a dónde van las fotos de tus hijos cuando usan ‘mejorar con IA’?” no tiene una respuesta simple. Depende de la app, de los términos de servicio, y de si los datos se procesan localmente en el chip del celular o se mandan a servidores remotos. Los procesadores NPU modernos están diseñados precisamente para hacer este procesamiento localmente, sin necesidad de conexión a internet — lo que significa más privacidad. Pero no siempre es así.

Conecta con la fotografía computacional como carrera

La fotografía computacional es uno de los campos más activos en investigación e industria de IA. Google, Apple, Samsung y Huawei invierten miles de millones de dólares anuales en mejorar sus sistemas de imagen con IA. En México, startups como Kavak y plataformas como Mercado Libre tienen equipos de docenas de ingenieros trabajando exclusivamente en visión computacional.

Para niños de 13-15 años que ya tienen algún interés en programación o matemáticas, hay recursos en español para empezar a explorar este campo: el curso gratuito de Visión Computacional de Fast.ai está parcialmente disponible en español, y hay comunidades activas en México en Discord y GitHub donde ingenieros comparten proyectos. También puedes explorar cómo los kits de robótica y electrónica pueden ser el primer paso concreto hacia este tipo de carrera.

La confianza que necesitan los niños para perseguir estos campos — especialmente las niñas, que siguen subrepresentadas en visión computacional — se construye con experiencias concretas tempranas. Si quieres saber más sobre cómo apoyar a tu hija en STEM, este artículo sobre la brecha de género en STEM y lo que pueden hacer los papás tiene estrategias basadas en investigación.

Qué observar en los próximos 3 meses

Semana 1-2: Realiza el experimento del modo retrato con objetos cotidianos. Documenta los errores del modelo de segmentación. Si tu hijo tiene más de 11 años, pregúntale cómo cree que entrenaría a la IA para que no cometa ese error.

Mes 1: Revisa juntos los permisos de cámara en el celular de tu hijo. Es un ejercicio de privacidad digital que tiene valor independientemente del ángulo educativo de STEM.

Mes 2-3: Para niños de 12+ que ya saben algo de programación: existe un proyecto de código abierto llamado “Teachable Machine” de Google que permite entrenar un modelo de reconocimiento de imágenes en el navegador, sin necesidad de saber programar. Es gratuito, funciona en español, y en menos de una hora tu hijo puede tener un modelo que reconoce objetos que él mismo eligió. Esa experiencia — ver el proceso de “entrenar” un modelo visual — transforma completamente la comprensión de lo que la cámara de su celular hace automáticamente.

Puntos clave

Los celulares modernos corren redes neuronales en tiempo real más complejas que muchas aplicaciones de IA conversacional, usando chips NPU especializados
El modo noche, modo retrato, HDR y borrado de objetos son modelos de deep learning, no filtros — cada uno tiene limitaciones comprensibles y enseñables
Celulares desde $3,500 MXN en México ya incluyen NPU con capacidades de IA en cámara
El INAOE en Puebla es uno de los centros de investigación en visión computacional más activos de América Latina
Empresas mexicanas como Kavak, Clip y Mercado Libre ya contratan ingenieros de visión computacional con bases en México
Los errores del modo retrato son herramientas pedagógicas perfectas para explicar cómo funciona y falla un modelo de segmentación
El procesamiento local en el chip (vs. en la nube) es la distinción clave de privacidad que los papás deben entender

Preguntas Frecuentes

¿Qué es un NPU y por qué importa que el celular de mi hijo lo tenga?

NPU significa Neural Processing Unit — un chip diseñado específicamente para correr operaciones matemáticas de redes neuronales de manera eficiente. A diferencia del procesador principal (CPU) o el chip de gráficos (GPU), el NPU está optimizado para multiplicaciones de matrices que son la operación central del deep learning. Que el celular tenga NPU significa que puede correr IA en tiempo real sin gastar batería excesiva y sin necesitar conexión a internet para cada operación.

¿Las fotos que mi hijo toma con IA se mandan a servidores de las empresas?

Depende del sistema y de la configuración. En los Samsung Galaxy modernos, el procesamiento de imagen con IA ocurre localmente en el NPU — no se manda a servidores externos para generar la foto. Sin embargo, si tu hijo usa apps de edición con IA como funciones de “mejorar foto” en Google Fotos o apps de terceros, esas sí pueden procesar las imágenes en la nube. Es importante revisar los términos de cada app específica.

¿Los celulares de gama media en México también tienen IA en la cámara?

Sí. Motorola (moto g54, moto g85) y Xiaomi (Redmi Note 13, por ejemplo), disponibles en México desde $3,500-$5,000 MXN, ya incluyen chips con NPU y sistemas de fotografía computacional. Las capacidades son menores que en gama alta, pero los principios son los mismos. Modo noche, HDR automático y reconocimiento de escena están presentes en prácticamente todos los celulares nuevos del mercado mexicano en 2026.

¿Qué diferencia hay entre la cámara de un iPhone y la de un Samsung?

Ambos usan redes neuronales para procesamiento de imagen, pero con enfoques diferentes. Apple diseña su propio chip Bionic con NPU integrado y tiene control total del pipeline de imagen. Samsung usa chips Exynos o Snapdragon (según el mercado) con NPU, y su procesamiento tiene características distintas en color, contraste y manejo de ruido. Ninguno es universalmente superior — depende de la situación y el gusto personal. Lo importante es que ambos usan IA de manera intensiva.

¿Cómo empiezo a enseñarle a mi hijo sobre visión computacional sin ser experto?

El mejor punto de entrada es el experimento del modo retrato descrito en este artículo. Sin necesitar ningún conocimiento técnico, puedes hacer que tu hijo observe los errores del sistema y piense por qué ocurren. Después, Google Teachable Machine (teachablemachine.withgoogle.com) permite entrenar modelos de reconocimiento de imágenes en el navegador, completamente gratis. Y el canal de YouTube de 3Blue1Brown tiene visualizaciones espectaculares de cómo funcionan las redes neuronales, en inglés pero altamente visual.

Sobre el autor

Ricky Flores es el fundador de HiWave Makers e ingeniero eléctrico con más de 15 años de experiencia desarrollando tecnología de consumo en Apple, Samsung y Texas Instruments. Escribe sobre cómo los niños aprenden a construir, pensar y crear en un mundo saturado de tecnología. Lee más en hiwavemakers.com.

Fuentes

Liba, O., Murmann, K., Brooks, T., Tsai, T. F., Karnad, N., & Sharlet, G. (2019). Handheld mobile photography in very low light. ACM Transactions on Graphics, 38(6), 1–16. https://doi.org/10.1145/3355089.3356508
Chen, Q., Jia, J., & Gu, S. (2021). Zero-shot image restoration using denoising diffusion null-space model. IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2023). https://cvpr2023.thecvf.com
Qualcomm Technologies. (2024). Snapdragon 8 Gen 3 Mobile Platform: AI Performance Brief. Qualcomm. https://www.qualcomm.com/products/mobile/snapdragon/smartphones/snapdragon-8-series-mobile-platforms
INAOE – Instituto Nacional de Astrofísica, Óptica y Electrónica. (2024). Líneas de investigación: Visión Computacional. https://www.inaoep.mx
Samsung Electronics. (2024). Galaxy AI: ProVisual Engine Technical Documentation. Samsung Developer. https://developer.samsung.com
Fast.ai. (2024). Practical Deep Learning for Coders. https://course.fast.ai
Google. (2024). Teachable Machine: Train your own machine learning model. https://teachablemachine.withgoogle.com

Escrito por Ricky Flores

Fundador de HiWave Makers e ingeniero eléctrico con más de 15 años trabajando en proyectos con Apple, Samsung, Texas Instruments y otras empresas Fortune 500. Escribe sobre cómo los niños aprenden a construir, pensar y crear en un mundo impulsado por la tecnología.