Jueves, 09 de abril de 2026 Jue 09/04/2026
RSS Contacto
MERCADOS
Cargando datos de mercados...
Tecnología

La “economía de los tokens” se ha roto: las tarifas planas de IA para programar son matemáticamente insostenibles

La “economía de los tokens” se ha roto: las tarifas planas de IA para programar son matemáticamente insostenibles
Artículo Completo 816 palabras
Un usuario de Claude Max, que paga 100 dólares al mes, ha generado 5.600 dólares en costes reales de API en un solo ciclo de facturación. Es solo un ejemplo (extremo) de la enorme brecha que hay entre el precio de un plan así y su potencialidad de gasto. Otros análisis lo fijan en la horquilla de entre 1.000 y 5.000 dólares. Precisamente Anthropic acaba de cortar el acceso de herramientas de terceros (como OpenClaw) a sus planes de suscripción. Además de por proteger su jardín vallado, es también la consecuencia aritmética inevitable de vender tokens a precio de buffet libre cuando el consumo real se ha disparado entre 10 y 100 veces. Por qué es importante. El modelo de negocio que ha financiado la explosión de la IA para programadores (tarifas planas, acceso ilimitado, modelo de suscripción) se ha construido sobre una ficción estadística que los agentes de desarrollo se han cargado. Lo que se asume cuando se vende una tarifa plana en cualquier ámbito es que los usuarios ligeros subvencionan a los más intensivos y las medias se sostienen. Eso funciona en las tarifas de datos de una teleco, en los gimnasios, en Netflix y en un buffet libre. Pero no funciona cuando cualquier usuario puede convertirse, de un día para otro, en un consumidor bestial de computación. Y eso es exactamente lo que ocurre cuando un agente entra en juego. Y desde diciembre estamos en la era de los agentes. En Xataka ChatGPT, dime qué opinar:  la IA está convirtiendo a los universitarios en el mismo alumno Entre líneas. La persona que mejor ha explicado este problema es Luo Fuli, responsable del equipo del modelo MiMo en Xiaomi y ex-DeepSeek, que ha publicado un largo tuit que se ha movido especialmente en los círculos tecnológicos chinos. Su diagnóstico es que las herramientas de terceros como OpenClaw no están optimizadas para reutilizar el caché de contexto de Claude, de modo que cada consulta regenera ventanas de contexto de más de 100.000 tokens desde cero. El número real de peticiones por consulta es varias veces superior al que generaría el propio Claude Code. "Eso no es una brecha. Es un cráter", ha dicho Luo. El telón de fondo. En China, los planes de programación con IA se han convertido en uno de los productos tecnológicos más codiciados del mercado. Los cupos de Alibaba Cloud se suelen agotar en las primeras horas de la jornada laboral, y los de Tencent aparecen como "no disponibles" de forma permanente. Los desarrolladores llegan a programarse alarmas matutinas y escriben scripts de autocompra para hacerse con un acceso mensual. La demanda es real, pero la economía subyacente apunta en sentido opuesto: los planes de suscripción, diseñados para un mundo donde cada interacción consumía unos pocos cientos de tokens, ahora absorben cargas de trabajo de agentes que consumen entre 10 y 100 veces más por tarea. Sí, pero. Anthropic no ha cerrado el acceso a los agentes de terceros. Los ha movido a otra factura: de la tarifa plana a la API de pago por uso. La medida incluye un crédito puntual equivalente al precio mensual del plan y descuentos de hasta el 30% para quienes precompren paquetes de "uso extra". El problema es que para muchos desarrolladores independientes, el salto de costes, potencialmente diez veces superior, hace que el uso de agentes deje de ser viable económicamente. Algunos ya han anunciado que migrarán a otros modelos. Alguien tiene que pagar esa fiesta, y hasta que llegue una nueva solución más eficiente, nadie sabe quién va a poder ser. La gran pregunta. Si la tarifa plana no puede sobrevivir al uso real de agentes, ¿qué modelo de precios podrá hacerlo? Luo Fuli cree que la presión económica acabará obligando a los desarrolladores de herramientas de terceros a optimizar su gestión de contexto y maximizar la reutilización de caché. Puede que tenga razón y su planteamiento es lógico. Pero mientras tanto, la industria entera está operando con un modelo de negocio cuyas matemáticas no cuadran, y la pregunta de quién va a absorber la diferencia (proveedores, desarrolladores o usuarios finales) sigue sin respuesta. En Xataka | Las empresas llevan años invirtiendo en IA. El problema es que muchos proyectos no están dando resultados Imagen destacada | Fotis Fotopoulos - La noticia La “economía de los tokens” se ha roto: las tarifas planas de IA para programar son matemáticamente insostenibles fue publicada originalmente en Xataka por Javier Lacort .
La “economía de los tokens” se ha roto: las tarifas planas de IA para programar son matemáticamente insostenibles

Pagar una tarifa plana por usar IA como agente de programación es matemáticamente insostenible. Una ejecutiva de Xiaomi lo ha explicado de maravilla

3 comentariosFacebookTwitterFlipboardE-mail 2026-04-09T15:30:13Z

Javier Lacort

Editor Senior - Tech

Javier Lacort

Editor Senior - Tech Linkedintwitter2017 publicaciones de Javier Lacort

Un usuario de Claude Max, que paga 100 dólares al mes, ha generado 5.600 dólares en costes reales de API en un solo ciclo de facturación. Es solo un ejemplo (extremo) de la enorme brecha que hay entre el precio de un plan así y su potencialidad de gasto. Otros análisis lo fijan en la horquilla de entre 1.000 y 5.000 dólares.

Precisamente Anthropic acaba de cortar el acceso de herramientas de terceros (como OpenClaw) a sus planes de suscripción. Además de por proteger su jardín vallado, es también la consecuencia aritmética inevitable de vender tokens a precio de buffet libre cuando el consumo real se ha disparado entre 10 y 100 veces.

Por qué es importante. El modelo de negocio que ha financiado la explosión de la IA para programadores (tarifas planas, acceso ilimitado, modelo de suscripción) se ha construido sobre una ficción estadística que los agentes de desarrollo se han cargado.

Lo que se asume cuando se vende una tarifa plana en cualquier ámbito es que los usuarios ligeros subvencionan a los más intensivos y las medias se sostienen. Eso funciona en las tarifas de datos de una teleco, en los gimnasios, en Netflix y en un buffet libre. Pero no funciona cuando cualquier usuario puede convertirse, de un día para otro, en un consumidor bestial de computación. Y eso es exactamente lo que ocurre cuando un agente entra en juego. Y desde diciembre estamos en la era de los agentes.

En XatakaChatGPT, dime qué opinar:  la IA está convirtiendo a los universitarios en el mismo alumno

Entre líneas. La persona que mejor ha explicado este problema es Luo Fuli, responsable del equipo del modelo MiMo en Xiaomi y ex-DeepSeek, que ha publicado un largo tuit que se ha movido especialmente en los círculos tecnológicos chinos.

Su diagnóstico es que las herramientas de terceros como OpenClaw no están optimizadas para reutilizar el caché de contexto de Claude, de modo que cada consulta regenera ventanas de contexto de más de 100.000 tokens desde cero. El número real de peticiones por consulta es varias veces superior al que generaría el propio Claude Code. "Eso no es una brecha. Es un cráter", ha dicho Luo.

El telón de fondo. En China, los planes de programación con IA se han convertido en uno de los productos tecnológicos más codiciados del mercado. Los cupos de Alibaba Cloud se suelen agotar en las primeras horas de la jornada laboral, y los de Tencent aparecen como "no disponibles" de forma permanente.

Los desarrolladores llegan a programarse alarmas matutinas y escriben scripts de autocompra para hacerse con un acceso mensual. La demanda es real, pero la economía subyacente apunta en sentido opuesto: los planes de suscripción, diseñados para un mundo donde cada interacción consumía unos pocos cientos de tokens, ahora absorben cargas de trabajo de agentes que consumen entre 10 y 100 veces más por tarea.

Sí, pero. Anthropic no ha cerrado el acceso a los agentes de terceros. Los ha movido a otra factura: de la tarifa plana a la API de pago por uso. La medida incluye un crédito puntual equivalente al precio mensual del plan y descuentos de hasta el 30% para quienes precompren paquetes de "uso extra".

El problema es que para muchos desarrolladores independientes, el salto de costes, potencialmente diez veces superior, hace que el uso de agentes deje de ser viable económicamente. Algunos ya han anunciado que migrarán a otros modelos. Alguien tiene que pagar esa fiesta, y hasta que llegue una nueva solución más eficiente, nadie sabe quién va a poder ser.

La gran pregunta. Si la tarifa plana no puede sobrevivir al uso real de agentes, ¿qué modelo de precios podrá hacerlo? Luo Fuli cree que la presión económica acabará obligando a los desarrolladores de herramientas de terceros a optimizar su gestión de contexto y maximizar la reutilización de caché.

Puede que tenga razón y su planteamiento es lógico. Pero mientras tanto, la industria entera está operando con un modelo de negocio cuyas matemáticas no cuadran, y la pregunta de quién va a absorber la diferencia (proveedores, desarrolladores o usuarios finales) sigue sin respuesta.

En Xataka | Las empresas llevan años invirtiendo en IA. El problema es que muchos proyectos no están dando resultados

Imagen destacada | Fotis Fotopoulos

Fuente original: Leer en Xataka
Compartir