Tabla de contenido
Ingeniero en ML o Científico de Datos: ¿Cuál Carrera de IA Planear con Tus Hijos?
Diferencias reales entre ML engineer y científico de datos: qué hacen día a día, salarios en México y LatAm, profundidad matemática y qué perfil encaja mejor con tu hijo.
Una conversación que ocurre frecuentemente en preparatorias del Tec de Monterrey y la UNAM: un chico dice que quiere trabajar en IA. El orientador le pregunta si quiere ser científico de datos o ingeniero de machine learning. El chico no sabe la diferencia. El orientador tampoco la explica bien. El joven elige el nombre que suena más impresionante.
Cinco años después, ese mismo estudiante llega a su primer empleo y descubre que en realidad le encantaba la parte de comunicar análisis a directivos — pero estudió para optimizar sistemas de producción de modelos. O al revés.
Esa confusión se puede evitar. Pero requiere que alguien se tome el tiempo de explicar la diferencia con honestidad.
El problema: los títulos de trabajo no dicen nada
El mercado laboral de IA tiene un problema de naming que afecta directamente la orientación vocacional. Según una revisión de más de 50,000 ofertas de trabajo en LinkedIn realizada por Burtch Works en 2023, los títulos “Data Scientist” y “Machine Learning Engineer” se usan de forma inconsistente entre empresas — la misma función puede llamarse diferente en dos compañías distintas, y el mismo título puede referirse a funciones muy distintas en diferentes organizaciones.
Esto significa que los papás que buscan información en Google sobre “salario de científico de datos” o “qué hace un ML engineer” están viendo datos mezclados que no corresponden necesariamente a un perfil coherente.
Por eso este artículo se enfoca en qué hace cada perfil en su día de trabajo, no en qué dice el título de su tarjeta de presentación.
Lo que dicen los datos
| Categoría | ML Engineer | Científico de Datos |
|---|---|---|
| Salario promedio en EE.UU. | $130,000–$185,000 USD/año | $100,000–$155,000 USD/año |
| Salario en México (CDMX/MTY) | $40,000–$90,000 MXN/mes | $30,000–$70,000 MXN/mes |
| Lenguajes principales | Python, C++, Rust, Scala | Python, R, SQL, Julia |
| Herramientas clave | PyTorch, TensorFlow, MLflow, Kubernetes, Docker | Pandas, Scikit-learn, Spark, Tableau, Power BI |
| Profundidad matemática requerida | Alta: álgebra lineal, cálculo, optimización, probabilidad | Alta: estadística, probabilidad, teoría de hipótesis, econometría |
| Tipo de output principal | Sistemas de ML en producción, APIs de modelos | Insights, reportes, dashboards, experimentos |
| ¿Trabaja con ingenieros de software? | Sí, muy estrechamente | A veces; también con stakeholders de negocio |
| Demanda en México (2024–2030) | Alta en fintech, e-commerce, salud digital | Alta en banca, retail, telecomunicaciones, gobierno |
Según el Future of Jobs Report 2025 del Foro Económico Mundial, los especialistas en IA y machine learning están entre los cinco perfiles con mayor crecimiento proyectado para el período 2025–2030, con una demanda estimada de 1 millón de nuevos roles a nivel global. La escasez de talento es real y persistente.
Qué hace un ML engineer en un día de trabajo real
El título suena a alguien que inventa algoritmos de IA. La realidad es más mundana — y más interesante.
Llevar modelos a producción
Un modelo de machine learning entrenado en un notebook de Jupyter puede tener 95% de precisión en los datos de prueba. Hacer que ese mismo modelo funcione correctamente cuando lo usan 50,000 personas por hora, en tiempo real, sin degradarse, sin caerse, y sin consumir recursos excesivos — eso es MLOps, y es el núcleo del trabajo de un ML engineer.
Esto involucra contenedorizar el modelo con Docker, servirlo como una API con FastAPI o TorchServe, monitorear el rendimiento en producción, detectar cuando la calidad del modelo se degrada (data drift), y reentrenarlo automáticamente cuando es necesario.
Optimización de latencia
Una startup de fintech en CDMX que usa un modelo de ML para evaluar solicitudes de crédito no puede permitir que esa evaluación tarde 10 segundos. Necesita que tarde 200 milisegundos. El ML engineer toma el modelo entrenado por el científico de datos y lo optimiza: cuantización, pruning, destilación de conocimiento, compilación del modelo para el hardware específico donde correrá.
Arquitectura de pipelines de entrenamiento
Cuando el modelo necesita reentrenarse con datos nuevos (lo cual ocurre con frecuencia), alguien tiene que diseñar el pipeline automatizado que tome los datos crudos, los limpie, los procese, entrene el modelo, evalúe su calidad, y lo despliegue sin intervención manual. Ese alguien es el ML engineer.
Qué hace un científico de datos en un día de trabajo real
El título suena a alguien que hace magia con datos. El trabajo cotidiano es más parecido a ser un detective que trabaja con estadística.
Análisis exploratorio y generación de insights
Una empresa de retail en México quiere entender por qué las ventas en una categoría bajaron 15% el último trimestre. El científico de datos analiza los datos de ventas, compras, precios, competencia, y comportamiento del consumidor para generar hipótesis y evidencia. No solo dice “bajaron las ventas” — dice “bajaron 15%, el 80% de la caída ocurrió en 3 SKUs, y el patrón temporal sugiere correlación con el lanzamiento de un competidor, no con cambios estacionales”.
Diseño y análisis de experimentos
¿Este nuevo algoritmo de recomendaciones funciona mejor que el anterior? Para responder esa pregunta con rigor, un científico de datos diseña un experimento A/B: cuántos usuarios necesita en cada grupo, cómo asignarlos aleatoriamente, qué métricas medir, cómo analizar los resultados para que sean estadísticamente válidos, y cómo comunicar los hallazgos a quien toma decisiones.
Esto no es sencillo. La estadística de los experimentos online tiene varios trampas: el problema de las comparaciones múltiples, el sesgo de selección de la muestra, los efectos de red que invalidan la aleatorización. Los científicos de datos buenos son expertos en detectar estas trampas.
Comunicación con stakeholders no técnicos
Aquí está una de las diferencias más prácticas entre los dos perfiles: el científico de datos pasa más tiempo presentando resultados a personas que no son ingenieros — directores de marketing, equipos de producto, gerentes de operaciones, en ocasiones el CEO. La capacidad de traducir un hallazgo estadístico complejo a una recomendación de negocio clara es una habilidad central, no periférica.
Dónde se traslapan y dónde divergen
Los dos perfiles comparten terreno en el entrenamiento de modelos de ML. Ambos usan Python y librerías como Scikit-learn o PyTorch. Ambos necesitan entender estadística y probabilidad. Ambos trabajan con datos.
Pero la divergencia es real:
El ML engineer vive más cerca de la ingeniería de software. Necesita entender sistemas distribuidos, bases de datos, infraestructura cloud (AWS, GCP, Azure), y principios de diseño de software. Si le preguntas si prefiere trabajar en un producto que millones de usuarios usan o analizar un dataset interesante, probablemente elige lo primero.
El científico de datos vive más cerca de la estadística y el análisis. Necesita entender teoría de probabilidad, inferencia estadística, econometría, y visualización de datos. Si le preguntas si prefiere entender por qué algo ocurrió o construir el sistema que lo predice automáticamente, probablemente elige lo primero.
Profundidad matemática: la conversación incómoda
Ambas carreras requieren matemáticas serias. Pero los tipos difieren.
Para ML engineer: El énfasis está en álgebra lineal (multiplicación de matrices, eigenvalores, descomposición SVD — son la base de cómo funcionan los modelos de deep learning), cálculo multivariable (gradientes, derivadas parciales — así entrenan los modelos), y optimización (descenso de gradiente, Adam, funciones de pérdida).
Para científico de datos: El énfasis está en estadística inferencial (pruebas de hipótesis, intervalos de confianza, corrección de Bonferroni), probabilidad (distribuciones, cadenas de Markov, modelos bayesianos), y econometría o regresión avanzada (controlar por confounders, interpretar coeficientes causalmente).
Ninguno de los dos caminos es para alguien que quiera evitar las matemáticas. La diferencia está en el tipo de matemáticas que disfrutas.
Un estudiante que encuentra placer en la elegancia algebraica de la factorización de matrices puede inclinarse hacia ML engineering. Un estudiante que encuentra satisfacción en diseñar un experimento que responda una pregunta causal con precisión puede inclinarse hacia ciencia de datos.
Qué perfil de estudiante encaja con cada carrera
Esta es la pregunta que más importa para papás con hijos en preparatoria o secundaria. No hay fórmula perfecta, pero hay patrones.
Señales de posible ML engineer:
- Disfruta construir sistemas que automatizan tareas.
- Le interesa la eficiencia y la escala — que algo funcione rápido para muchos usuarios.
- Tiene afinidad con la programación de bajo nivel o la arquitectura de sistemas.
- Cuando algo no funciona, su reacción instintiva es revisar el código, no los datos.
- Le gusta el trabajo de ingeniería de software clásica tanto como el machine learning.
Señales de posible científico de datos:
- Hace preguntas del tipo “¿por qué pasó esto?” con frecuencia.
- Disfruta leer estudios, analizar resultados, cuestionar metodologías.
- Es bueno explicando cosas complejas a personas no técnicas.
- Le importa la historia que cuentan los números, no solo los números en sí.
- Tiene curiosidad genuina por fenómenos sociales, económicos o de comportamiento.
Para ayudar a tus hijos a desarrollar el tipo de pensamiento que requieren ambas carreras, el artículo sobre pensamiento computacional vs. programación para niños ofrece un buen punto de partida práctico desde edades tempranas.
Cómo se ve este mercado en México y LatAm
Fintech y banca: BBVA México, Santander, Citibanamex, Clip, Kueski, y docenas de fintechs más pequeñas tienen equipos de datos y ML en CDMX. Los proyectos incluyen modelos de riesgo crediticio, detección de fraude, personalización de productos financieros, y análisis de comportamiento de clientes.
E-commerce y retail: Mercado Libre tiene uno de los equipos de ML más grandes de LatAm. Liverpool, Coppel, y Amazon México usan científicos de datos para forecasting de inventario, optimización de precios y sistemas de recomendación.
Telecomunicaciones: Telmex, Telcel, y AT&T México usan ML para predicción de churn (cuando un cliente va a cancelar el servicio), optimización de redes, y análisis de uso.
Gobierno y sector público: El IMSS, el SAT, y varias secretarías federales tienen proyectos incipientes de análisis de datos. Es un mercado menos maduro pero con enorme potencial y necesidad de talento.
Qué pueden hacer los papás
1. Introducir la estadística como habilidad de razonamiento, no solo de cálculo
Los niños aprenden estadística en la escuela como fórmulas. Lo que necesitan para estas carreras es estadística como herramienta de pensamiento: ¿cómo sé si este resultado es real o es ruido? ¿Qué evidencia necesito para creer esta afirmación? Esas preguntas se pueden practicar con cualquier dato cotidiano — resultados deportivos, encuestas de opinión, publicidad con estadísticas dudosas.
2. Proyectos con datos reales antes de la universidad
Hay conjuntos de datos públicos en plataformas como Kaggle, datos del INEGI, o del IMCO que un joven de 14–17 años puede explorar con Python y pandas. Elegir algo que le apasione — demografía de su ciudad, estadísticas de su deporte favorito, datos de calidad del aire en CDMX — hace la práctica mucho más efectiva que ejercicios genéricos.
3. No asumir que “más IA” siempre es mejor
El ML engineering está más de moda que la ciencia de datos en este momento. Eso no significa que sea la mejor opción para todos los estudiantes. Un científico de datos talentoso que sabe comunicar insights claros a equipos de negocio tiene valor enorme y consistente en el mercado — quizás más estable que el ML engineer cuyo rol depende de que los sistemas de IA sigan siendo lo suficientemente complejos como para requerir optimización manual.
4. Seguir las universidades con programas de investigación activos
La UNAM tiene el Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS) con proyectos activos en ML y estadística. El CINVESTAV tiene grupos de investigación en inteligencia artificial. El Tec de Monterrey tiene el Instituto de Ciencia de Datos e Inteligencia Artificial. Para estudiantes que piensan en posgrado, conocer estos grupos antes de elegir carrera puede orientar mejor la decisión.
5. Conectar el interés de tu hijo con el dominio donde quiere aplicarlo
Un joven que quiere usar ML en medicina tiene un camino muy diferente al que quiere usarlo en videojuegos o en política pública. El dominio importa tanto como las habilidades técnicas — y empezar a pensar en él desde preparatoria da ventaja.
La investigación sobre el futuro de las carreras en IA, incluyendo el rol de investigadores de seguridad en IA, está documentada en el artículo sobre investigador de seguridad IA: lo que padres y niños deben saber.
Qué observar en los próximos 3 años
El rol de ML engineer está evolucionando hacia un perfil que muchas empresas están llamando “AI Engineer” o “GenAI Engineer” — alguien que no solo entrena modelos tradicionales sino que construye sistemas con LLMs, pipelines de RAG, y agentes de IA. Esta evolución ampliará el tipo de trabajo pero mantendrá los fundamentos: infraestructura, optimización, producción.
El científico de datos está evolucionando hacia un perfil más estratégico — menos análisis repetitivo (que se está automatizando con herramientas de BI y con IA) y más diseño de estrategias de datos, gobierno de datos, y análisis causal profundo. Los científicos de datos que solo hacen dashboards básicos van a sentir presión; los que entienden experimentación rigurosa y razonamiento causal, no.
En México, la madurez del mercado de datos en empresas medianas (no solo las grandes) creará demanda creciente de ambos perfiles en ciudades como Monterrey, Guadalajara, y Querétaro — no solo en CDMX.
Preguntas frecuentes
¿Puede alguien ser las dos cosas?
Al inicio de la carrera, sí — muchos roles junior mezclan las dos funciones. Con el tiempo, las especializaciones divergen. Los perfiles verdaderamente híbridos existen, pero son más comunes en startups pequeñas donde un equipo de tres personas hace todo. En empresas grandes, los roles tienden a diferenciarse claramente.
¿Cuánta programación necesita un científico de datos?
Suficiente para manipular datos, construir visualizaciones y entrenar modelos básicos. Python con pandas, matplotlib y scikit-learn es el estándar mínimo. SQL es obligatorio. Un científico de datos no necesita ser tan hábil en ingeniería de software como un ML engineer, pero el que no sabe programar tiene opciones muy limitadas.
¿Qué tan importante es el inglés?
Muy importante en ambos perfiles. Los papers, la documentación de las herramientas, los tutoriales, y los foros donde se resuelven problemas técnicos están principalmente en inglés. Un joven con inglés técnico sólido tiene acceso a recursos que multiplican su capacidad de aprendizaje. Además, los roles remotos bien pagados con empresas en EE.UU. o Europa casi siempre requieren inglés conversacional.
¿Hay buenas opciones de estudio en México sin salir del país?
Sí. La UNAM, el Tec de Monterrey, el ITAM, el CIMAT (Centro de Investigación en Matemáticas, en Guanajuato), y el CINVESTAV tienen programas de posgrado en estadística, ciencia de datos e inteligencia artificial de calidad reconocida. Para pregrado, cualquier carrera en Ciencias de la Computación, Matemáticas Aplicadas, o Ingeniería con concentración en IA es un buen punto de partida.
¿Estas carreras van a desaparecer cuando la IA se vuelva más poderosa?
Es la pregunta que todos los papás hacen, y la respuesta honesta es: no en el horizonte relevante para un niño de 12 años hoy. Las herramientas de IA automatizan partes del trabajo — el análisis exploratorio básico, la generación de código repetitivo — pero el diseño de experimentos, la interpretación de resultados en contexto de negocio, y la construcción de sistemas de producción confiables siguen requiriendo criterio humano. La forma del trabajo cambiará; la demanda de personas que entiendan profundamente los sistemas de ML no desaparecerá.
Sobre el autor
Ricky Flores es el fundador de HiWave Makers e ingeniero eléctrico con más de 15 años de experiencia desarrollando tecnología de consumo en Apple, Samsung y Texas Instruments. Escribe sobre cómo los niños aprenden a construir, pensar y crear en un mundo saturado de tecnología. Lee más en hiwavemakers.com.
Fuentes
-
World Economic Forum. (2025). Future of Jobs Report 2025. Ginebra: WEF. https://www.weforum.org/publications/the-future-of-jobs-report-2025/
-
Burtch Works. (2023). Burtch Works Study: Data Scientists & Predictive Analytics Professionals. https://www.burtchworks.com/
-
Bureau of Labor Statistics, U.S. Department of Labor. (2024). Occupational Outlook Handbook: Data Scientists. https://www.bls.gov/ooh/math/data-scientists.htm
-
Stack Overflow. (2024). Developer Survey 2024. https://survey.stackoverflow.co/2024/
-
OCC Mundial. (2024). Reporte de tendencias salariales: Ciencia de datos e IA en México. https://www.occ.com.mx/
-
McKinsey Global Institute. (2023). The economic potential of generative AI: The next productivity frontier. https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-ai
-
Jordan, M. I., & Mitchell, T. M. (2015). “Machine learning: Trends, perspectives, and prospects.” Science, 349(6245), 255–260. https://doi.org/10.1126/science.aaa8415
-
CINVESTAV. (2024). Departamento de Computación: líneas de investigación en inteligencia artificial. https://cs.cinvestav.mx/