Tabla de contenido

General 14 min de lectura

Qué es un NPU: el chip de IA que ya tiene el celular de tu hijo

Cada celular de gama alta desde 2020 tiene un NPU — la unidad de procesamiento neural que hace funcionar el desbloqueo facial y el modo retrato sin agotar la batería.

Tu hijo toma el celular. La pantalla se enciende y se desbloquea antes de que lo toque siquiera — reconocimiento facial, instantáneo. Toma una foto y el fondo se difumina precisamente alrededor de él — modo retrato, en tiempo real. Apunta la cámara a texto en inglés en un menú de restaurante y lo traduce al español en pantalla — traducción en vivo, sin internet.

Las tres cosas se sienten como magia. Ninguna es magia. Las tres corren en un chip dentro del celular llamado NPU — Unidad de Procesamiento Neural.

Es probablemente el chip más importante que tus hijos nunca han escuchado mencionar. Está en cada celular de gama alta vendido desde 2020. Es lo que permite que la IA corra en el dispositivo sin drenar la batería ni necesitar conexión a internet. Y el hecho de que casi nadie lo explique — ni siquiera en la educación tecnológica — es una brecha que vale la pena cerrar.

Por qué nadie habla del NPU

El CPU se discute en toda clase de computación. La GPU se hizo famosa con los videojuegos y luego con la IA. Pero el NPU vive en un espacio extraño intermedio: demasiado nuevo para los libros de texto, demasiado específico para cobertura generalista, demasiado invisible en su operación para que la mayoría de los usuarios lo noten.

Por qué importa entenderlo: el NPU es evidencia de que la IA se mudó de la nube al dispositivo. Cuando el desbloqueo facial se introdujo por primera vez en los celulares, funcionaba enviando tu cara a un servidor, corriendo el reconocimiento de forma remota y enviando de vuelta un “sí” o “no.” Ese proceso tardaba y requería conectividad.

El desbloqueo facial moderno — usando el NPU — corre completamente en el celular. Sin servidor involucrado. Respuesta instantánea. Funciona en modo avión. Este cambio de IA en la nube a IA en el dispositivo es uno de los desarrollos más significativos en tecnología de consumo, y el NPU es el hardware que lo hizo posible.

Explicado como si tuvieras 5 años: el especialista que hace una sola cosa perfectamente

Imagina un restaurante con tres empleados:

El gerente general (CPU) maneja todo lo complejo: horarios, resolver problemas, administrar la operación. Puede hacer cualquier cosa pero siempre está ocupado.

El cocinero de línea (GPU) trabaja en paralelo — cocinando muchos platillos a la vez, excelente en trabajo repetitivo de alto volumen.

El especialista en postres (NPU) hace solo una cosa: prepara el postre perfecto. Lo hace increíblemente rápido, usa casi nada de energía haciéndolo, y libera al gerente y al cocinero para otras cosas.

El NPU es el especialista en postres. Hace inferencia de IA — ejecutar redes neuronales entrenadas sobre datos de entrada — de manera extremadamente eficiente. Hace casi nada más. Pero esa sola cosa, hecha de la manera correcta, permite el desbloqueo facial en menos de un segundo, mejora de fotos en tiempo real y procesamiento de lenguaje local sin nunca llamar a la nube.

Cómo funciona en realidad

Una red neuronal es un modelo matemático — un conjunto masivo de números (llamados pesos) organizados en capas, entrenados para reconocer patrones. Cuando corre el desbloqueo facial, toma una imagen de la cámara y la pasa a través de cientos de operaciones matemáticas en esas capas para determinar: ¿esto coincide con la cara almacenada? Sí o no.

Estas operaciones — multiplicaciones matriciales, funciones de activación — parecen cargas de trabajo de GPU. Pero el NPU es diferente de la GPU en una forma crucial: está optimizado para inferencia (ejecutar modelos entrenados) en lugar de entrenamiento (aprender los pesos en primer lugar).

Entrenar un modelo requiere matemáticas de punto flotante con alta precisión — eso es lo que hacen las GPUs. Ejecutar un modelo entrenado para inferencia puede usar matemáticas de menor precisión (INT8 o incluso INT4 — enteros en lugar de números de punto flotante) y aun así obtener resultados correctos. El NPU está construido alrededor de estas matemáticas de menor precisión enfocadas en inferencia. Usa mucha menos energía que una GPU para la misma tarea de inferencia.

El Neural Engine del Apple A17 Pro puede realizar 35 billones de operaciones por segundo (TOPS) mientras consume una fracción de la energía que una GPU necesitaría para la misma tarea.¹ Eso es la ingeniería: no potencia bruta, sino potencia eficiente. Un celular que pudiera hacer reconocimiento facial usando la GPU agostaría su batería en horas. Usando el NPU, puede hacerlo miles de veces al día sin impacto medible en la batería.

Por qué tu hijo debería saber esto hoy

La IA en el dispositivo no es una tendencia — es un cambio arquitectónico. Apple, Google, Qualcomm y Samsung tomaron decisiones estratégicas explícitas para incluir NPUs en sus chips porque reconocieron que la IA corriendo localmente (sin latencia de nube, sin preocupaciones de privacidad, sin requisitos de conectividad) es fundamentalmente mejor para la mayoría de las tareas cotidianas.

Un niño que entiende por qué la IA en el dispositivo importa — los intercambios entre nube y dispositivo, el rol del NPU, la diferencia entre entrenamiento e inferencia — entiende el desarrollo más importante actual en IA de consumo. La mayoría de los adultos que usan estas funciones diariamente no pueden explicarlas.

Según la SEP, las habilidades en inteligencia artificial y tecnologías emergentes son parte del currículo de secundaria técnica en México.² Entender el hardware detrás de la IA coloca a los estudiantes en una posición ventajosa para aprovechar ese currículo.

Cómo enseñárselo a tu hijo

De 5 a 8 años: el juego del ayudante especialista

Juega un juego de clasificación. Dale a tu hijo una pila de bloques de colores mezclados. Pídele que los clasifique por color lo más rápido posible mientras también resuelve un problema matemático en su cabeza. Es difícil — las dos tareas compiten.

Ahora asigna a un ayudante cuyo único trabajo es clasificar los bloques. Tu hijo hace el problema matemático; el ayudante maneja la clasificación. El trabajo total se termina más rápido, y ninguno está distraído por la tarea del otro.

Eso es lo que hace el NPU. Maneja las tareas de IA para que el CPU y la GPU no tengan que hacerlo, haciendo que todo corra más rápido y eficientemente.

De 9 a 12 años: encuentra el NPU en tu celular

Busca el chip de tu celular y averigua si tiene un NPU. Estos son los chips clave:

Apple: chips serie A (A14 y posteriores) todos tienen un “Neural Engine”
Qualcomm: Snapdragon serie 8 tiene un NPU Hexagon
Google Pixel: chips Tensor tienen una Unidad de Procesamiento Tensor (TPU)
Samsung: chips Exynos tienen un NPU dedicado

Luego pruébalo: apaga el WiFi y los datos celulares. Abre la cámara y prueba el modo retrato, el desbloqueo facial y la traducción en tiempo real (en Google Lens o la función de traducción de la cámara). Todo funciona sin internet. Eso significa que corre en el NPU, en el dispositivo — sin nube requerida.

De 13 años en adelante: entrenamiento vs. inferencia

Ayuda a tu hijo adolescente a entender la diferencia entre entrenamiento e inferencia — la distinción técnica más importante en IA práctica.

Entrenamiento: Alimentar millones de ejemplos a una red neuronal, ajustando los pesos hasta que el modelo se vuelve bueno en una tarea. Requiere enorme capacidad de cómputo (GPUs, semanas de tiempo, energía masiva). Sucede una vez (o periódicamente cuando se actualiza el modelo). Se hace en centros de datos.

Inferencia: Tomar un modelo entrenado y correrlo sobre nueva entrada para obtener una salida. Se puede hacer con menos cómputo. Sucede millones de veces al día en dispositivos individuales. Esto es lo que hace el NPU.

Analogía: el entrenamiento es escribir un libro de recetas. La inferencia es usar el libro de recetas para cocinar una comida. Escribes el libro una vez; cocinas de él todos los días.

NPUs en los principales chips de celular

Chip (Año)	Celulares ejemplo	Nombre del NPU	Rendimiento	Funciones clave en dispositivo
Apple A18 Pro (2024)	iPhone 16 Pro/Max	Neural Engine (16 núcleos)	35 TOPS	Siri local, IA de fotos, Face ID
Qualcomm Snapdragon 8 Elite (2024)	Samsung Galaxy S25, OnePlus	NPU Hexagon	45 TOPS	Traducción en tiempo real, procesamiento de fotos
Google Tensor G4 (2024)	Pixel 9 series	TPU (custom Google)	~20 TOPS (est.)	Pantallas en vivo, subtítulos, desenfoque de fotos
Samsung Exynos 2500 (2025)	Galaxy S25 (regiones selectas)	NPU (custom)	~30 TOPS	Bixby local, IA de fotos
MediaTek Dimensity 9400 (2024)	Varios Android de alta gama	APU 890	35 TOPS	IA en dispositivo, inferencia en el borde

TOPS = Billones de Operaciones Por Segundo

La carrera de rendimiento en NPUs se mueve más rápido que cualquier otra parte del diseño de chips. Del Neural Engine del A11 con 600 mil millones de operaciones por segundo en 2017 a los 35+ TOPS de hoy — aproximadamente 50 veces de mejora en siete años.³

Este chip en los dispositivos de tu hijo

iPhone: El Neural Engine corre continuamente en segundo plano — Face ID, procesamiento de fotos, reconocimiento de voz de Siri, predicciones de texto. Hace computación real de IA docenas de veces por minuto.

Android de gama alta: Cada celular con Qualcomm Snapdragon 8 tiene un NPU Hexagon. Cada Google Pixel tiene un chip Tensor con hardware ML dedicado. Las funciones de subtítulos en dispositivo, traducción y fotos todas lo usan.

Bocinas inteligentes: Amazon Echo y Google Nest usan pequeños aceleradores ML tipo NPU para reconocer palabras de activación (“Alexa,” “OK Google”) localmente, enviando audio a la nube solo después de que se detecta la palabra de activación. Esto mejora la velocidad de respuesta y reduce la exposición de privacidad.

Apple Watch: Los chips en los Apple Watch recientes incluyen aceleradores ML específicamente para análisis de salud en tiempo real — detección de irregularidades del ritmo cardíaco, análisis de sueño, detección de accidentes — todo corriendo en el dispositivo.

Qué esperar en los próximos 3 meses

Semanas 2–4: Tu hijo debería poder explicar una función impulsada por NPU en su dispositivo y describir por qué puede correr sin internet. “El desbloqueo facial funciona sin internet porque el NPU procesa las matemáticas localmente” es una buena respuesta.

Mes 2: Entender la distinción entrenamiento vs. inferencia es el siguiente hito. ¿Puede explicar por qué no puedes entrenar un nuevo modelo en tu celular pero sí puedes correr uno existente? Las restricciones computacionales y de energía son la respuesta.

Mes 3: Una comprensión sólida se muestra cuando puede identificar qué funciones en un dispositivo son IA basada en nube (cualquier cosa que requiere conectividad) vs. IA en dispositivo (funciones que funcionan sin internet). Esta distinción predice latencia, exposición de privacidad y requisitos de conectividad al mismo tiempo.

Preguntas frecuentes

¿El celular de mi hijo tiene un NPU?

Si es un celular de gama alta o media-alta lanzado después de 2020, casi con certeza sí. Apple A14 y posteriores, Qualcomm Snapdragon serie 7 y 8, Google Tensor, Samsung Exynos 2100 y posteriores, MediaTek Dimensity 9000 y posteriores — todos incluyen hardware NPU dedicado. Los celulares de bajo costo pueden tener NPU limitado o ninguno.

¿Es el NPU lo mismo que el “chip de IA” en la mercadotecnia?

Sí. “Chip de IA,” “Neural Engine,” “chip Tensor,” “NPU” y “acelerador ML” todos se refieren a la misma categoría de hardware. Los nombres de marketing varían; la función subyacente es la misma: ejecutar inferencia de redes neuronales eficientemente en el dispositivo.

¿Puede el NPU entrenar modelos de IA en mi celular?

En la práctica, no. Los chips NPU en el dispositivo manejan solo inferencia. El entrenamiento requiere mucho más cómputo y memoria de lo que cualquier celular actual puede proporcionar. Eso sucede en centros de datos en clústeres de GPU.

¿Qué significa la IA en el dispositivo para la privacidad?

Significa que tus datos no salen de tu celular para esas funciones. El desbloqueo facial, la transcripción en dispositivo, la traducción local — nada de esto envía tu cara, voz o texto a un servidor. Eso es un beneficio significativo de privacidad. Las funciones que sí requieren nube (como hacer preguntas que necesitan información de internet) son separadas de la inferencia de IA en dispositivo.

¿Los NPUs reemplazarán a las GPUs?

No — sirven roles diferentes. Las GPUs manejan entrenamiento e inferencia de alto rendimiento en servidores. Los NPUs manejan inferencia eficiente en dispositivos con restricciones como celulares, relojes y audífonos. Ambos están creciendo en importancia. Los dos no compiten tanto como manejan diferentes partes de la carga de trabajo de IA.

¿Cuánta batería ahorra realmente el NPU?

Cantidades significativas para tareas continuas. Correr el desbloqueo facial usando la GPU consumiría órdenes de magnitud más energía que el NPU. Para tareas de siempre activo — detección de palabras de activación, monitoreo de salud, traducción persistente — la eficiencia del NPU es lo que hace práctico correrlas continuamente.

Sobre el autor Ricky Flores es el fundador de HiWave Makers e ingeniero eléctrico con más de 15 años de experiencia desarrollando tecnología de consumo en Apple, Samsung y Texas Instruments. Escribe sobre cómo los niños aprenden a construir, pensar y crear en un mundo saturado de tecnología. Lee más en hiwavemakers.com.

Fuentes

Apple Inc. (2023). A17 Pro Chip Overview. https://www.apple.com/iphone-15-pro/a17-pro/
Secretaría de Educación Pública. (2022). Plan de Estudios 2022 — Tecnologías de la Información. https://www.sep.gob.mx/
Apple Inc. (2017). A11 Bionic Chip — Neural Engine Overview. https://www.apple.com/newsroom/2017/09/iphone-x/
Qualcomm Technologies. (2024). Snapdragon 8 Elite Platform Technical Overview. https://www.qualcomm.com/products/mobile/snapdragon/smartphones/snapdragon-8-series-mobile-platforms/snapdragon-8-elite-mobile-platform
Dally, W. J., Turakhia, Y., & Han, S. (2020). “Domain-specific hardware accelerators.” Communications of the ACM, 63(7), 48–57. https://doi.org/10.1145/3361682
MediaTek. (2024). Dimensity 9400 AI Processing Overview. https://www.mediatek.com/products/smartphones-2/dimensity-9400

Apple A17 Pro Chip Overview, 2023. ↩
SEP Plan de Estudios 2022. ↩
Apple A11 Bionic Overview, 2017. ↩

Escrito por Ricky Flores

Fundador de HiWave Makers e ingeniero eléctrico con más de 15 años trabajando en proyectos con Apple, Samsung, Texas Instruments y otras empresas Fortune 500. Escribe sobre cómo los niños aprenden a construir, pensar y crear en un mundo impulsado por la tecnología.