Esta semana Anthropic revocó el acceso de herramientas de terceros a las suscripciones de Claude Pro y Claude Max. La razón fue directa: una suscripción de 200 dólares al mes, usada a través de agentes automatizados, generaba entre 1.000 y 5.000 dólares de carga real en los servidores de la empresa.
La noticia es relevante porque expone algo que muchos equipos descubren demasiado tarde. El costo de usar inteligencia artificial no es lo que dice el plan mensual. Es lo que consume el agente cuando trabaja de verdad.
La diferencia entre usar IA y operar con IA
Cuando una persona abre ChatGPT o Claude para hacer una consulta, el consumo es predecible. Una pregunta, una respuesta, unos pocos miles de tokens. Las suscripciones de 20 o 200 dólares al mes están diseñadas para ese patrón de uso.
Pero cuando un agente de IA opera de forma autónoma, el patrón cambia por completo. Un agente que gestiona correos, consulta bases de datos, toma decisiones y genera reportes puede ejecutar decenas de llamadas al modelo en una sola tarea. Multiplica eso por las tareas del día y el consumo se dispara.
Eso es exactamente lo que pasó con OpenClaw, una plataforma de código abierto que conectaba agentes automatizados a las suscripciones de Claude. Los usuarios pagaban una tarifa plana, pero el uso real superaba esa tarifa entre 5 y 25 veces. Anthropic cerró esa puerta el 4 de abril de 2026.
Suscripción, API o ambas
Existen dos modelos principales para acceder a los modelos de lenguaje que alimentan a los agentes de IA.
- Suscripción mensual (ejemplo: Claude Pro a 20 USD/mes, ChatGPT Plus a 20 USD/mes). Pagas una tarifa fija y tienes acceso al modelo con límites de uso. Funciona bien para uso personal o consultas esporádicas. No está pensada para agentes que operan todo el día.
- API con pago por uso (ejemplo: API de Anthropic o de OpenAI). Pagas por cada token que el modelo procesa. No hay tarifa fija, pero tampoco hay límites artificiales. El costo depende directamente de cuánto trabaja tu agente.
Para una PYME que quiere automatizar procesos con agentes, la API es casi siempre la opción correcta. No porque sea más barata en abstracto, sino porque permite controlar, medir y optimizar el gasto real.
Cuánto cuesta realmente operar un agente
El costo de un agente de IA depende de tres variables: el modelo que usa, la cantidad de tokens por tarea y la frecuencia con la que opera.
Un agente que responde preguntas simples de clientes usando un modelo rápido puede costar centavos por interacción. Pero un agente que analiza contratos, cruza datos de múltiples fuentes y redacta informes usando un modelo de razonamiento avanzado consumirá significativamente más.
La clave está en elegir el modelo adecuado para cada tarea. No todo necesita el modelo más potente. Un agente de triaje que clasifica correos puede usar un modelo económico. El agente que redacta la respuesta compleja puede usar uno más capaz. Esa combinación reduce costos sin sacrificar calidad.
Cinco preguntas antes de escalar
Antes de poner un agente en producción, conviene responder estas preguntas:
- ¿Cuántas tareas ejecutará por día? No es lo mismo un agente que responde 10 consultas que uno que procesa 500 documentos.
- ¿Qué modelo necesita cada tarea? Asignar el modelo más caro a todo es el error más común y más costoso.
- ¿Cuánto contexto necesita en cada llamada? Cada vez que el agente envía historial, documentos o instrucciones al modelo, esos tokens se cobran. Reducir el contexto innecesario es la forma más directa de bajar costos.
- ¿Tienes visibilidad del consumo? Si no puedes ver cuántos tokens usa cada agente por tarea, estás operando a ciegas. La primera inversión debería ser en monitoreo.
- ¿Qué pasa si el proveedor cambia las reglas? Lo que ocurrió con Anthropic y OpenClaw es un recordatorio. Tener tus propias claves de API te da independencia. Si un proveedor cambia precios o políticas, puedes migrar sin reconstruir todo.
El modelo que ya aplican las empresas grandes
Esta semana, La Nación reportó que Mercado Libre escaló su atención al cliente con ingresos creciendo un 40%, sin aumentar la cantidad de personas en el equipo. Lo hicieron automatizando el soporte con IA. Pero no lo hicieron con suscripciones de 20 dólares al mes. Lo hicieron con infraestructura propia, modelos vía API y un control granular del costo por interacción.
Microsoft, por su parte, lanzó Critique, un sistema donde un modelo de OpenAI redacta y un modelo de Anthropic revisa. La empresa reportó que este enfoque multimodelo mejora la calidad en casi un 14%, pero también implica pagar por dos modelos en cada consulta. El costo se justifica solo cuando el valor de la tarea lo amerita.
La lección para empresas más pequeñas no es copiar la escala, sino copiar la lógica. Medir el costo por tarea, asignar el modelo correcto a cada función y mantener el control de tus propias claves de acceso.
El precio real no es el que aparece en la landing page
La IA es cada vez más accesible, pero no es gratis. Y el costo real no está en la suscripción mensual, sino en cómo se usa el modelo en producción. Las empresas que entienden esto temprano pueden escalar con control. Las que no, se enteran cuando llega la factura o cuando el proveedor cambia las condiciones.
Lo que pasó esta semana con Anthropic no es un incidente aislado. Es una señal de que la industria está madurando y que los modelos de precio están evolucionando. La mejor protección es entender tus costos, usar tus propias claves y elegir el modelo justo para cada tarea.