Un dato del MIT debería cambiar la forma en que las empresas piensan sobre la inteligencia artificial. En su último informe sobre adopción de IA, el instituto reveló que el 95% de los pilotos de IA generativa en empresas no llegó a producción. No fallaron por limitaciones técnicas. Fallaron porque las organizaciones no estaban preparadas para integrar la tecnología en su operación real.

El número se complementa con otro dato de Gartner. En 2025, el 75% de las compañías experimentó con agentes de IA. Pero solo el 15% implementó sistemas que funcionan de manera autónoma en producción. La gran mayoría se quedó en la etapa de prueba, usando modelos de lenguaje para tareas aisladas sin impacto medible en el negocio.

Gastón Milano, CTO de Globant Enterprise AI, lo resume con claridad en un artículo publicado esta semana. Lo que ocurrió en 2025 fue la fase beta de los agentes de IA. El error no fue tecnológico, sino organizacional. La pregunta que importa ahora no es si la IA funciona, sino por qué tantas empresas no logran hacerla funcionar dentro de su operación.

La brecha de aprendizaje

El MIT le puso nombre al problema. Lo llama brecha de aprendizaje. Cualquier tecnología, por más poderosa que sea, requiere un proceso de adaptación cuando se integra en un sistema existente. Las personas necesitan aprender a trabajar con máquinas, pero sobre todo necesitan aprender a supervisarlas y a mantener una mirada estratégica sobre lo que hacen.

En la práctica, esto se manifiesta de formas muy concretas. Una empresa instala un chatbot de atención al cliente alimentado por IA. Los clientes terminan frustrados y piden hablar con una persona. El fundador concluye que la IA no sirve para su negocio. Pero el problema no era la tecnología. Era el diseño del flujo de trabajo. Nadie definió qué conversaciones debía manejar el agente, cuáles debía escalar a un humano, ni cómo debía responder cuando no tenía información suficiente.

Otro escenario frecuente. Un equipo de operaciones conecta un agente de IA a su correo electrónico para clasificar mensajes automáticamente. La primera semana funciona razonablemente bien. La segunda semana empiezan los errores porque los datos de entrenamiento no contemplaban ciertos tipos de correo que llegan con frecuencia. Nadie había asignado la responsabilidad de revisar y ajustar el sistema. El piloto se abandona.

En ambos casos la tecnología hacía lo que se le pidió. El problema fue que nadie diseñó el proceso alrededor de ella.

Qué hacen diferente las empresas que sí lo logran

Los casos de éxito que documenta Milano tienen un patrón claro. Una empresa de logística que pasó de tardar dos horas a responder consultas de soporte en apenas 90 segundos. Una compañía de semiconductores que desarrolló un agente capaz de resolver problemas técnicos tres veces más rápido, con una tasa de éxito del 75%. En ambos casos la implementación fue quirúrgica, no genérica.

Las empresas que logran resultados reales con agentes de IA comparten tres características.

  • Eligen una fricción específica, no un objetivo ambiguo. No dicen "vamos a implementar IA en la empresa". Dicen "vamos a reducir el tiempo de respuesta en soporte de dos horas a menos de cinco minutos". La diferencia parece semántica, pero es operacional. Un objetivo específico permite medir resultados en semanas, no en meses.
  • Limpian e integran los datos antes de conectar el agente. Un agente de IA que opera con datos incompletos, desactualizados o dispersos en cinco planillas diferentes va a producir resultados mediocres. Las empresas exitosas dedican tiempo a ordenar la información que el agente necesita antes de ponerlo a trabajar.
  • Asignan a alguien la responsabilidad de supervisar el sistema. No se trata de un equipo técnico completo. Se trata de una persona del equipo que revisa periódicamente qué está haciendo el agente, identifica errores y ajusta las instrucciones. Sin esta figura, los pilotos se degradan en semanas.

El framework de implementación que funciona

Gartner proyecta que en los próximos 12 meses, el 42% de las empresas planea desarrollar agentes de IA. Para quienes están en ese grupo, existe un camino probado que reduce drásticamente la probabilidad de fracaso.

El primer paso es mapear las fricciones operativas del negocio. No las tareas que podrían beneficiarse de IA en teoría, sino los puntos donde el equipo pierde tiempo, comete errores recurrentes o donde los clientes expresan insatisfacción. La cobranza manual, la coordinación de agenda, la generación de reportes repetitivos y las respuestas estándar a clientes son ejemplos clásicos.

El segundo paso es elegir una sola fricción y diseñar el flujo completo antes de tocar la tecnología. Eso significa definir qué información necesita el agente, de dónde la obtiene, qué decisiones puede tomar solo, cuándo debe escalar a un humano y cómo se mide el éxito. Este diseño previo es lo que separa a los pilotos que llegan a producción de los que mueren en la prueba.

El tercer paso es implementar, medir durante dos semanas y ajustar. Los primeros días siempre revelan situaciones que no se contemplaron en el diseño. Eso es normal y esperado. Lo importante es que alguien esté mirando los resultados y haciendo correcciones antes de que el equipo pierda confianza en el sistema.

El cuarto paso, una vez que la primera automatización está estable y el equipo confía en ella, es pasar a la siguiente fricción y repetir el proceso.

El debate ya no es tecnológico

Según Switas Consultancy, para finales de 2026 el 40% de las aplicaciones empresariales incorporará agentes de IA específicos para cada tarea. Los agentes ya pueden gestionar bandejas de correo, actualizar CRMs, realizar análisis financieros y coordinar procesos completos con mínima supervisión humana. La tecnología está lista.

Lo que falta en la mayoría de las empresas no es acceso a herramientas. Es el diseño organizacional para integrarlas. Es definir quién supervisa, qué se mide y cuándo se ajusta. Es pasar de "probemos IA a ver qué pasa" a "implementemos IA para resolver este problema específico y midamos el resultado en dos semanas".

El 95% de los pilotos fracasa porque se lanzan sin ese diseño. El 5% que funciona no tiene mejor tecnología. Tiene mejor proceso.