La IA No Siempre Corre en la Nube — Por Qué la 'Computación en el Borde' Está Creando una Nueva Carrera de Ingeniería
Tabla de contenido

La IA No Siempre Corre en la Nube — Por Qué la 'Computación en el Borde' Está Creando una Nueva Carrera de Ingeniería

Cuando las decisiones deben tomarse en milisegundos, la IA no puede esperar un viaje de ida y vuelta a un centro de datos. Los ingenieros de computación en el borde construyen el hardware especializado y los sistemas que ejecutan la IA localmente — y es uno de los campos de ingeniería de más rápido crecimiento.

El sistema de prevención de colisiones de tu auto no puede esperar 200 milisegundos para un viaje de ida y vuelta a un centro de datos. Necesita tomar una decisión en menos de 10. Por eso la IA que corre en tu auto, en tu bocina inteligente, en la máquina de imágenes de un hospital, y cada vez más en el piso de una fábrica no corre “en la nube” — corre localmente, en hardware especializado, en el “borde” de la red. La computación en el borde es uno de los subcampos de más rápido crecimiento en ingeniería, y apenas existía como trayectoria de carrera hace 10 años. Los ingenieros que construyen sistemas de IA en el borde están escribiendo las reglas de un campo que se está inventando en tiempo real.

Nube vs. Borde: Por Qué Importa la Distinción

Para entender por qué existe la computación en el borde, necesitas entender qué es realmente “la nube”: una colección de centros de datos masivos, típicamente propiedad de Amazon (AWS), Microsoft (Azure) o Google (Google Cloud), que proveen recursos computacionales a través de internet. Cuando le preguntas algo a ChatGPT, tu consulta sale de tu dispositivo, viaja a un centro de datos, es procesada por servidores allí, y la respuesta regresa a ti. Este viaje de ida y vuelta tarda entre 50 y 500 milisegundos dependiendo de las condiciones de la red.

Para la mayoría de las aplicaciones, esta latencia está bien. Pero considera:

Un sistema de piloto automático de Tesla que detecta un peatón cruzando la calle necesita iniciar el frenado en 10–20 milisegundos. Un brazo de robot industrial que detecta la mano de un trabajador en su trayectoria necesita detenerse en 5 milisegundos. Un escáner CT de hospital que ejecuta detección de anomalías con IA necesita procesar cada fotograma de imagen a medida que se adquiere, no después de un viaje de ida y vuelta por la red. Una bocina inteligente que detecta su palabra de activación necesita responder inmediatamente, sin enviar el audio de cada conversación a un servidor en la nube.

Para todas estas aplicaciones, el modelo de nube no funciona — ya sea porque los requisitos de latencia lo hacen físicamente imposible, o porque los requisitos de privacidad lo hacen legal y éticamente problemático, o porque la conectividad de red no puede garantizarse (un piso de fábrica, un sensor agrícola en zona rural, un barco en medio del océano).

La computación en el borde es la solución: ejecutar el cómputo de IA localmente, en hardware embebido en el dispositivo o desplegado cerca, con suficiente poder de procesamiento para manejar la carga de trabajo dentro de las restricciones requeridas.

Los Desafíos de Ingeniería de la IA en el Borde

Construir sistemas de IA que corran en el borde es fundamentalmente diferente de construir IA que corre en hardware de nube sin restricciones. Las restricciones son severas:

Restricciones de energía. Una GPU de centro de datos puede consumir 700 watts. Un chip de IA en el borde en una cámara o dispositivo wearable puede tener un presupuesto de energía de 1–5 watts. Correr un modelo de IA útil dentro de esa restricción requiere optimización extrema.

Restricciones de memoria. Los servidores de centro de datos tienen terabytes de RAM e interconexiones rápidas entre chips. Un dispositivo en el borde puede tener 4–16 GB de memoria. Encajar un modelo que normalmente requeriría 80 GB de memoria GPU en 4 GB requiere elecciones arquitectónicas, cuantización y técnicas de compresión de modelos que son áreas activas de investigación.

Restricciones térmicas. Los dispositivos en el borde a menudo no pueden usar enfriamiento activo. Una cámara montada al aire libre o un dispositivo médico no puede tener ventiladores; el enfriamiento pasivo a través de la carcasa del dispositivo es la única opción.

Requisitos de tiempo real. La IA en el borde a menudo significa plazos duros en tiempo real — respuestas que son correctas pero llegan 1 milisegundo tarde son fallas. Los sistemas de software con garantías en tiempo real usan diferentes paradigmas de programación, sistemas operativos y métodos de validación que el software convencional.

Restricciones de conectividad. Los dispositivos en el borde pueden tener acceso intermitente o ningún acceso a internet. Necesitan operar completamente de forma autónoma, actualizar sus modelos periódicamente y sincronizar datos cuando la conectividad esté disponible.

El Hardware de la IA en el Borde

La plataforma Jetson de NVIDIA — una familia de módulos de computación de IA pequeños y de bajo consumo — es la plataforma de hardware de IA en el borde dominante para aplicaciones de alta capacidad. El Jetson Orin, lanzado en 2022, entrega 275 TOPS (billones de operaciones por segundo) en un módulo del tamaño de una tarjeta de crédito, consumiendo aproximadamente 60 watts. Esto es suficiente para correr modelos sofisticados de visión computacional y lenguaje natural en tiempo real.

El Edge TPU de Google — un chip personalizado diseñado para correr modelos TensorFlow Lite — está optimizado para un consumo de energía aún menor: puede ejecutar inferencia a 2 TOPS mientras consume aproximadamente 2 watts. Esto lo hace adecuado para dispositivos con batería y sistemas embebidos.

Las plataformas Snapdragon de Qualcomm — que impulsan la mayoría de los celulares Android — incluyen cada vez más aceleradores de IA dedicados (Unidades de Procesamiento Neural, o NPU) que corren modelos de IA en el dispositivo. Cuando el asistente de Google se activa en un celular Android, la inferencia está corriendo en una NPU en el teléfono, no en un centro de datos.

El Motor Neural de Apple, integrado en cada chip A-series y M-series desde el A11 en 2017, está diseñado específicamente para inferencia de IA eficiente en el dispositivo. Face ID, el procesamiento de fotos, el reconocimiento de voz y el texto predictivo corren en este hardware sin enviar datos a los servidores de Apple.

La ingeniería de semiconductores requerida para diseñar estos chips — que necesitan lograr cómputo de IA con restricciones de energía y área radicalmente diferentes a los procesadores de centros de datos — es una disciplina altamente especializada y extremadamente bien compensada.

La Evidencia Científica

El Ciclo de Hype de Gartner identifica consistentemente la IA en el borde como más allá del pico de expectativas infladas y moviéndose hacia el trough productivo — lo que significa despliegue real a escala en lugar de bombo especulativo. Sus análisis de 2023 y 2024 encontraron que los despliegues de IA en el borde estaban creciendo del 30 al 40% anualmente en manufactura, salud, comercio minorista y transporte.

La Guía de Gasto Mundial en Computación en el Borde de IDC proyecta que el gasto en computación en el borde crecerá de aproximadamente $232,000 millones en 2024 a $350,000 millones para 2027. La IA en el borde es citada como el principal impulsor de este crecimiento.

La investigación académica en MIT, Stanford y CMU se ha enfocado en las técnicas de eficiencia de modelos que hacen viable la IA en el borde. La iniciativa TinyML del MIT, que se enfoca en correr modelos de aprendizaje automático en microcontroladores con kilobytes de memoria, ha demostrado capacidades notables a partir de hardware extraordinariamente restringido.

AplicaciónRequisito de LatenciaRestricción de EnergíaImpulsora de PrivacidadBorde vs. Nube
ADAS automotriz<20msLimitada (energía vehicular)NoBorde (latencia crítica de seguridad)
Imágenes médicas IA<100msBaja (dispositivo portátil)Sí (HIPAA)Borde (privacidad + latencia)
Robótica industrial<5msModeradaA vecesBorde (tiempo real duro)
Bocinas inteligentes (palabra de activación)<50msMuy baja (batería)Borde (siempre activo, privacidad)
Analítica de comercio minorista<1sModeradaSí (GDPR)Borde o híbrido
Sensores agrícolasVariableMuy baja (solar/batería)NoBorde (sin conectividad)

Fuentes: Gartner, IDC, proyecto TinyML del MIT

La compensación para los ingenieros de IA en el borde refleja tanto la escasez del conjunto de habilidades como la criticidad de las aplicaciones. Los ingenieros de IA embebida en etapa media de carrera — también titulados Ingeniero de ML en el Borde, Ingeniero de ML de Sistemas Embebidos, o Ingeniero de IA en Tiempo Real — ganan entre $145,000 y $195,000 en empresas como NVIDIA, Qualcomm, Apple, Tesla o startups de robótica.

Qué Significa Esto para Tu Hijo

La computación en el borde se encuentra en la intersección de tres disciplinas que rara vez se superponen en un solo ingeniero: hardware de sistemas embebidos, software de aprendizaje automático, e ingeniería de sistemas en tiempo real. Esa combinación es genuinamente rara, y su rareza es la oportunidad de carrera.

Los niños más propensos a encontrar este campo gratificante son los que están interesados en dispositivos físicos — que quieren saber no solo que la IA funciona, sino cómo corre la IA en el chip en su mano, cómo el chip gestiona su presupuesto de energía, cómo el software se comunica con el hardware en tiempo real. Esta es ingeniería que puedes ver y tocar.

Uno de los puntos de entrada más accesibles es el ecosistema de Raspberry Pi y Arduino, combinado con frameworks de aprendizaje automático diseñados para dispositivos con recursos restringidos. TensorFlow Lite y PyTorch Mobile permiten a los estudiantes correr modelos entrenados en una Raspberry Pi o incluso en hardware de clase Arduino.

En el contexto latinoamericano, hay aplicaciones locales fascinantes para la IA en el borde: sistemas de monitoreo agrícola en zonas sin conectividad, sensores de calidad del aire en ciudades latinoamericanas, sistemas de seguridad que procesan video localmente sin enviar imágenes a la nube. Un niño que construye un clasificador de plantas que corre sin internet en una Raspberry Pi está construyendo habilidades directamente aplicables a estos problemas del mundo real.

  • Edades 10–13: Proyectos con Raspberry Pi que conectan sensores a software. La experiencia de un programa corriendo en un dispositivo físico — y siendo restringido por lo que ese dispositivo puede hacer — es fundamental
  • Edades 14–17: Tutoriales de TensorFlow Lite o PyTorch Mobile. Correr un clasificador de imágenes en una Raspberry Pi. Medir cuánto tarda. Intentar hacerlo más rápido. Este es el ciclo central de ingeniería de IA en el borde
  • Edades 17+: Programas de ingeniería en computación o ingeniería eléctrica con cursos de sistemas embebidos y aprendizaje automático

Qué Observar en los Próximos 3 Meses

  • Anuncios de chips M-series y A-series de Apple. Las generaciones del Motor Neural de Apple son puntos de referencia para la capacidad de IA en el dispositivo
  • Actualizaciones de la plataforma Jetson Orin NX de NVIDIA. La hoja de ruta de la plataforma de borde de NVIDIA muestra hacia dónde va el hardware profesional de IA en el borde
  • Actualizaciones de frameworks TensorFlow Lite y PyTorch Mobile. Las mejoras en frameworks de optimización de modelos facilitan el despliegue de IA capaz en el borde
  • Noticias de automatización de salud e industrial en América Latina. Mercado Libre, Walmart México, hospitales del IMSS e ISSSTE, y empresas manufactureras en el Bajío son deployadores de IA en el borde que crean demanda local de estos ingenieros

La trayectoria profesional está emergiendo lo suficientemente rápido como para que un estudiante que comienza a construir proyectos de IA en el borde a los 15 años tendrá un portafolio que pocos compañeros de pregrado poseerán. Esa ventaja se multiplica a través de solicitudes de pasantía, oportunidades de investigación y posicionamiento temprano en la carrera.

Preguntas Frecuentes

¿Es la computación en el borde lo mismo que la computación de niebla? La computación en el borde coloca el cómputo en o cerca del dispositivo que genera datos. La computación de niebla es una capa intermedia entre el borde y la nube — pequeños servidores locales que agregan datos de muchos dispositivos en el borde y realizan procesamiento más complejo. En la práctica, los términos se usan a menudo de manera intercambiable.

¿Necesitan los ingenieros de IA en el borde entender el diseño de hardware? Depende del rol. Los ingenieros del lado del software (optimización de modelos, desarrollo de frameworks de inferencia) necesitan entender las restricciones y características del hardware, pero no necesariamente diseñan chips. Los roles del lado del hardware (diseño de chips, co-diseño hardware-software) requieren expertise de hardware más profundo.

¿Se usa Python en la IA en el borde? Python se usa para el entrenamiento y desarrollo de modelos, pero la IA en el borde desplegada típicamente usa C, C++ o frameworks especializados. TensorFlow Lite y PyTorch Mobile usan runtimes de C++. Los niños que aprenden Python pueden comenzar en el desarrollo de IA en el borde; el trabajo de producción requiere lenguajes de bajo nivel.

¿Hay oportunidades en México y América Latina específicamente? Sí. La industria manufacturera en el Bajío (Guanajuato, Querétaro, Jalisco) está adoptando automatización industrial que usa IA en el borde. Las ciudades latinoamericanas están desplegando sensores inteligentes. Las empresas agrícolas grandes como Bayer y BASF en México están explorando IA en el borde para monitoreo de cultivos. La demanda es local y creciente.

¿Qué empresas contratan ingenieros de IA en el borde? Apple, NVIDIA, Qualcomm, Google, Amazon (Alexa), Tesla, Waymo, empresas de dispositivos médicos (Medtronic, GE Healthcare), empresas de automatización industrial (Fanuc, Rockwell Automation, Siemens), y un gran ecosistema de startups de robótica e IoT.


Sobre el autor Ricky Flores es el fundador de HiWave Makers e ingeniero eléctrico con más de 15 años de experiencia desarrollando tecnología de consumo en Apple, Samsung y Texas Instruments. Escribe sobre cómo los niños aprenden a construir, pensar y crear en un mundo saturado de tecnología. Lee más en hiwavemakers.com.


Fuentes

  1. Warden, P., Situnayake, D. TinyML: Machine Learning with TensorFlow Lite. O’Reilly Media, 2019.
  2. Gartner. Hype Cycle for Emerging Technologies 2023. https://www.gartner.com/en/articles/what-s-new-in-the-2023-gartner-hype-cycle-for-emerging-technologies
  3. IDC. Worldwide Edge Computing Spending Guide. https://www.idc.com/getdoc.jsp?containerId=IDC_P33170
  4. MIT TinyML Initiative. https://tinyml.mit.edu
  5. NVIDIA. Jetson Platform Overview. https://www.nvidia.com/en-us/autonomous-machines/embedded-systems/
  6. Qualcomm Technologies. AI for Edge Devices. https://www.qualcomm.com/research/artificial-intelligence
  7. Ray, P.P. “A survey on Internet of Things architectures.” Journal of King Saud University, 2018. https://doi.org/10.1016/j.jksuci.2016.10.003
Ricky Flores
Escrito por Ricky Flores

Fundador de HiWave Makers e ingeniero eléctrico con más de 15 años trabajando en proyectos con Apple, Samsung, Texas Instruments y otras empresas Fortune 500. Escribe sobre cómo los niños aprenden a construir, pensar y crear en un mundo impulsado por la tecnología.