Qué es una GPU y cómo funciona: la IA, los juegos y tu celular en un chip
Tabla de contenido

Qué es una GPU y cómo funciona: la IA, los juegos y tu celular en un chip

Una GPU tiene miles de trabajadores simples en lugar de un CPU genial — y esa diferencia es exactamente por qué toda la IA del mundo corre en GPUs. Aquí te platico cómo enseñárselo.

Tu hijo está jugando un videojuego. La pantalla está renderizando 120 cuadros por segundo. Cada cuadro tiene millones de píxeles, y cada píxel necesita saber su color basado en iluminación, sombras, reflejos y objetos en movimiento — todo recalculado 60 a 120 veces por segundo.

Ningún procesador rápido individual podría hacer eso. Un chef brillante no puede cocinar 8 millones de platillos simultáneamente, por más hábil que sea.

Por eso existe la GPU.

Las Unidades de Procesamiento Gráfico se inventaron para renderizar videojuegos. Pero las matemáticas que hacen — ejecutar millones de cálculos simples idénticos en paralelo — resultan ser exactamente las matemáticas que impulsan cada sistema de inteligencia artificial del mundo hoy. ChatGPT, generadores de imágenes, todos los modelos de lenguaje grandes: entrenados en GPUs, ejecutándose en GPUs.

Un niño que entiende por qué las GPUs son el motor de la IA entiende algo que la mayoría de los adultos no. Esa es una ventaja genuinamente interesante.

Por qué “la computadora” en realidad son varias computadoras

Cuando la gente dice “mi computadora es rápida,” generalmente habla del CPU. Pero la computación moderna usa chips especializados para diferentes trabajos — y entender qué chip hace qué es el primer paso para comprender por qué algunas cosas son rápidas y otras no.

El CPU es el generalista. Pocos núcleos muy potentes que pueden manejar tareas complejas, variadas y secuenciales rápidamente. Bueno para ejecutar el sistema operativo, gestionar archivos, manejar lógica ramificada. No tan bueno para hacer 8 millones de cálculos idénticos al mismo tiempo.

La GPU es el especialista. Una cantidad masiva de núcleos más pequeños y simples diseñados para ejecutar la misma operación en muchos datos simultáneamente. Originalmente diseñada para píxeles. Ahora usada para cualquier cosa donde la misma matemática debe suceder en conjuntos de datos enormes en paralelo.

Los niños a menudo confunden el poder de la GPU con “poder de juegos” sin entender la razón subyacente. Una vez que entienden la arquitectura, ven por qué los juegos y el entrenamiento de IA son cargas de trabajo fundamentalmente similares — y por qué empresas como NVIDIA se volvieron algunas de las más valiosas del mundo.

Explicado como si tuvieras 5 años: un experto vs. mil trabajadores

Imagina que necesitas pintar un mural enorme en una pared — un millón de cuadrados individuales, cada uno de un color específico.

El CPU es un maestro pintor. Extremadamente hábil. Puede manejar decisiones complejas, adaptarse, resolver problemas. Pero pintar un millón de cuadrados uno por uno tarda para siempre, incluso para un maestro.

La GPU es mil trabajadores con pinceles. Cada uno es menos hábil — solo pueden pintar cosas simples, seguir instrucciones simples. Pero cada uno puede pintar una sección diferente simultáneamente. Mil trabajadores pintando mil cuadrados a la vez: el mural se termina en una fracción del tiempo.

Esta es la diferencia fundamental. Los CPUs se optimizan para tareas complejas y secuenciales. Las GPUs se optimizan para tareas simples y masivamente paralelas. Los videojuegos necesitan renderizar millones de píxeles por cuadro. Los modelos de IA necesitan hacer multiplicaciones matriciales sobre miles de millones de parámetros. Ambos son problemas de “pintar un millón de cuadrados” — perfectamente adaptados al procesamiento paralelo.

Cómo funciona en realidad

Una GPU de consumo moderna como una NVIDIA RTX 4090 tiene 16,384 núcleos CUDA — el equivalente de la GPU a los núcleos del CPU, pero mucho más simples. Cada núcleo CUDA puede ejecutar una operación simple de punto flotante o entero. Ejecutar 16,384 de ellos simultáneamente en un solo cuadro de un videojuego — o en un solo paso hacia adelante a través de una red neuronal — es lo que hace poderosos a estos chips.

La GPU también tiene memoria dedicada llamada VRAM (RAM de video). Está separada de la RAM del sistema y se encuentra directamente en la tarjeta gráfica. Cuando un juego renderiza una escena, las texturas, modelos y datos de cuadros viven en VRAM, donde la GPU puede acceder a ellos a altísima velocidad.

Cómo funciona el gaming a nivel de GPU:

  1. El motor del juego envía a la GPU una lista de triángulos 3D que conforman cada objeto en la escena.
  2. La GPU calcula dónde aparece cada triángulo en pantalla dada la posición de la cámara.
  3. Determina el color de cada píxel basado en texturas, iluminación y sombras — miles de millones de cálculos por cuadro.
  4. El cuadro terminado se envía a tu monitor.

A 120 cuadros por segundo, la GPU hace todo este proceso 120 veces cada segundo.

Cómo funciona la inferencia de IA a nivel de GPU:

Cuando escribes algo en un chatbot de IA, el modelo procesa tu entrada como una serie de multiplicaciones matriciales — exactamente el tipo de matemática paralela para la que fueron construidas las GPUs. Los miles de núcleos de la GPU manejan estos cálculos en paralelo. Por eso la IA responde en segundos en lugar de horas.

Por qué tu hijo debería saber esto hoy

La capitalización de mercado de NVIDIA superó los $3 billones de dólares en 2024, impulsada casi en su totalidad por la demanda de GPUs para computación de IA.1 Los gobiernos han puesto restricciones de exportación en GPUs avanzadas, reconociéndolas como tecnología estratégicamente crítica.2 Entender las GPUs ya no es conocimiento de semiconductores de nicho — es entender la infraestructura física de la era de la IA.

El Foro Económico Mundial identifica la IA y el aprendizaje automático como el principal motor de creación de empleo en la próxima década.3 Los ingenieros que construyen, optimizan y despliegan sistemas de IA trabajan directamente con hardware GPU. Entender lo básico ahora le da a tu hijo una década de ventaja.

Para los papás: un niño que entiende por qué el procesamiento paralelo de la GPU hace posible la IA tiene un modelo mental más preciso de la IA que la mayoría de los periodistas, políticos y ejecutivos que encontrará en su vida. Eso no es poca cosa.

Cómo enseñárselo a tu hijo

De 5 a 8 años: colorear en paralelo vs. en secuencia

Dale a tu hijo una hoja con 100 cuadros pequeños para colorear con un patrón específico. Que los coloree solo — eso es secuencial (estilo CPU). Toma el tiempo.

Luego involucra a toda la familia — cada persona colorea una sección simultáneamente. Toma el tiempo de nuevo. La diferencia es el procesamiento paralelo. Pregunta: “¿Por qué el segundo fue más rápido?” La respuesta no es que todos sean más inteligentes o trabajen individualmente más rápido. Es que el trabajo sucedió al mismo tiempo.

De 9 a 12 años: comparar CPU y GPU en tiempo real

La próxima vez que tu hijo esté jugando un videojuego exigente, activa el overlay de rendimiento del juego (la mayoría los tienen — prueba con F1 o F12, o usa el software de NVIDIA o AMD).

Señala el porcentaje de uso de GPU. Cuando está cerca del 100%, el juego está limitado por la GPU — la GPU es el cuello de botella. Cuando el CPU sube al 100% pero la GPU está al 50%, el CPU es el cuello de botella. Entender qué chip está trabajando más intensamente es como los ingenieros depuran problemas de rendimiento.

También es buen momento para explorar por qué entender el hardware ayuda a los niños a liderar en la era tecnológica.

De 13 años en adelante: por qué NVIDIA domina la IA

Pide a tu hijo que investigue CUDA — la plataforma de programación de NVIDIA que permite a los desarrolladores escribir programas específicamente para GPUs. Lee sobre cómo NVIDIA convirtió un chip de juegos en la columna vertebral de la computación de IA poniendo CUDA disponible para computación científica a mediados de los 2000, mucho antes de que la IA fuera popular.

La idea clave: el hardware era suficientemente potente para la IA, pero se necesitó un ecosistema de software (CUDA) que hiciera las GPUs programables para problemas matemáticos generales. Esta es una historia sobre estrategia de plataforma y visión técnica, no solo diseño de chips.

Para trabajo práctico: Kaggle.com ofrece acceso gratuito a GPU en notebooks en la nube. Un adolescente motivado puede correr código real de machine learning en una GPU real de forma gratuita — sin hardware propio.

CPU vs. GPU: las diferencias clave

PropiedadCPUGPU
Número de núcleos4–24 (consumidor)1,000–16,384+
Complejidad del núcleoMuy altaBaja-moderada
Mejor paraTareas secuenciales, complejas, con ramificacionesOperaciones paralelas, repetitivas, uniformes
MemoriaHasta 192 GB (RAM del sistema)8–80 GB VRAM dedicada
Uso principalSO, apps, lógica de juegos, bases de datosRenderizado gráfico, IA, simulación científica
Consumo de energía15–250 W75–700 W
Precio consumidor$3,000–$10,000 MXN$3,000–$35,000+ MXN

La fila de consumo de energía explica por qué las cargas de trabajo pesadas en GPU — entrenamiento de IA, gaming en 4K — generan tanto calor y consumen tanta electricidad. Un PC gamer corriendo una RTX 4090 a plena carga puede consumir más de 600 watts en total.

Esta tecnología en los dispositivos de tu hijo

Su celular: La GPU del celular renderiza la interfaz de usuario, los juegos, el video y los efectos de la cámara. El modo retrato — difuminando el fondo, ajustando la iluminación — usa la GPU y el NPU para procesar millones de píxeles en milisegundos. Sin GPU no hay efectos de cámara fluidos.

Consola de videojuegos: La GPU está haciendo esencialmente todo el trabajo visual. La GPU de la PS5 puede teóricamente procesar 10.3 teraflops — 10.3 billones de operaciones de punto flotante por segundo. Cada segundo.

Laptop: Incluso las laptops delgadas tienen GPUs integradas (a menudo en el mismo chip que el CPU). Las GPUs integradas comparten la RAM del sistema y usan menos energía, lo que explica por qué las laptops delgadas manejan video pero tienen problemas con juegos o edición de video.

Chatbots e IA generativa: Estos corren en clústeres masivos de GPUs en centros de datos. Cada consulta a un modelo de IA grande activa computación GPU en servidores que nunca verás, como los de Amazon Web Services que sirven a empresas mexicanas como Mercado Libre.

Qué esperar en los próximos 3 meses

Semanas 2–4: Después de la explicación del mural, tu hijo debería poder explicar con sus palabras por qué las GPUs son buenas para la IA — no “porque son potentes,” sino porque la IA implica hacer la misma matemática en muchos datos simultáneamente, que es exactamente para lo que fueron diseñadas las GPUs.

Mes 2: Debería entender la diferencia entre GPUs integradas y dedicadas — que la GPU en una laptop delgada comparte la RAM del sistema y tiene rendimiento limitado, mientras que una GPU dedicada tiene su propia VRAM rápida y mucho mayor poder computacional.

Mes 3: Un buen indicador es ver un overlay de rendimiento durante un juego e identificar si el juego está limitado por CPU o GPU — y saber qué implica cada uno sobre dónde está el cuello de botella.

Preguntas frecuentes

¿Necesito una GPU dedicada para la laptop escolar de mi hijo?

Para trabajo escolar básico y videollamadas, no. Una GPU integrada (dentro del CPU) maneja esas tareas bien. Si tu hijo hace diseño 3D, edición de video o gaming, una GPU dedicada se vuelve valiosa.

¿Por qué los precios de las GPU están tan altos?

La alta demanda de computación de IA ha impulsado los precios en el extremo superior. Para una familia comprando un PC gamer, las tarjetas de gama media (RTX 4060, RX 7600) son más estables en precio que las tarjetas insignia.

¿Cuál es la diferencia entre una GPU y una tarjeta gráfica?

La GPU es el chip. La tarjeta gráfica es el componente completo: el chip GPU más su propia VRAM, sistema de enfriamiento, conectores de alimentación, y la placa en que todo está montado.

¿Puede la GPU ayudar con tareas escolares además de juegos?

Sí, cada vez más. El software de edición de video (DaVinci Resolve, Premiere) usa la GPU intensamente para reproducción y renderizado en tiempo real. Las herramientas de diseño 3D la usan para renderizado en el viewport. Y algunas herramientas de IA que corren localmente necesitan aceleración GPU.

¿La GPU es diferente del NPU?

Sí. El NPU (Unidad de Procesamiento Neural) es un chip separado optimizado específicamente para inferencia de IA con bajo consumo de energía. La GPU es un procesador paralelo general suficientemente potente para entrenamiento de IA, pero con mayor consumo. Los celulares modernos tienen los tres: CPU, GPU y NPU.

¿Por qué las Mac tienen tan buen rendimiento gráfico con specs aparentemente modestos?

La arquitectura de memoria unificada de Apple — en los chips serie M — comparte un solo pool de memoria rápida entre CPU y GPU, con muy alto ancho de banda. Esto compensa no tener un pool grande de VRAM separado. Las GPUs de Apple también tienen excelente optimización de drivers.


Sobre el autor Ricky Flores es el fundador de HiWave Makers e ingeniero eléctrico con más de 15 años de experiencia desarrollando tecnología de consumo en Apple, Samsung y Texas Instruments. Escribe sobre cómo los niños aprenden a construir, pensar y crear en un mundo saturado de tecnología. Lee más en hiwavemakers.com.


Fuentes

  1. Reuters. (2024). “Nvidia’s market cap hits $3 trillion.” https://www.reuters.com/technology/nvidia-crosses-3-trillion-market-cap-2024-06-05/
  2. U.S. Department of Commerce. (2023). Export Controls on Advanced Computing Items. https://www.bis.doc.gov/index.php/documents/about-bis/newsroom/press-releases/3209-2023-10-17-bis-press-release-acs-controls-final-rule-2023/file
  3. Foro Económico Mundial. (2023). Future of Jobs Report 2023. https://www.weforum.org/publications/the-future-of-jobs-report-2023/
  4. NVIDIA Corporation. (2024). NVIDIA Ada Lovelace GPU Architecture Technical Brief. https://images.nvidia.com/akamai/solutions/geforce/ada/nvidia-ada-gpu-architecture.pdf
  5. Dally, W. J., Turakhia, Y., & Han, S. (2020). “Domain-specific hardware accelerators.” Communications of the ACM, 63(7), 48–57. https://doi.org/10.1145/3361682
  6. Patterson, D., et al. (2022). “Carbon emissions and large neural network training.” arXiv. https://arxiv.org/abs/2104.10350

Footnotes

  1. Reuters, 2024.

  2. U.S. DOC Export Controls, 2023.

  3. WEF Future of Jobs, 2023.

Ricky Flores
Escrito por Ricky Flores

Fundador de HiWave Makers e ingeniero eléctrico con más de 15 años trabajando en proyectos con Apple, Samsung, Texas Instruments y otras empresas Fortune 500. Escribe sobre cómo los niños aprenden a construir, pensar y crear en un mundo impulsado por la tecnología.