Por qué los presupuestos de TI están quebrando por el costo de los tokens de IA

Eduardo Cubillo
hace 6 horas
4 min de lectura

Para las empresas que se encuentran en fase de experimentación con suscripciones fijas hacia la implementación de sistemas avanzados y autónomos, se presenta una realidad financiera sensible para los líderes de tecnología, que se enfrentan a un desafío crítico: el costo de los tokens.

En la narrativa sobre la inteligencia artificial generativa ha estado predominada la velocidad de adopción, la productividad y la promesa de automatización total. Sin embargo, para las empresas que se encuentran en fase de experimentación con suscripciones fijas hacia la implementación de sistemas avanzados y autónomos, se presenta una realidad financiera más compleja para los líderes de tecnología, que se enfrentan a un desafío crítico: el costo de los tokens.

El medio especializado TechCrunch reveló que este fenómeno está afectando incluso a los gigantes mejor preparados. Por ejemplo, Uber agotó su presupuesto de codificación con IA proyectado para todo el año en apenas abril.

También Microsoft se vio obligado a tomar decisiones internas; revocó las licencias de Claude Code a sus desarrolladores pocos meses después de haberlas habilitado. En empresas como Priceline, las renovaciones rutinarias de contratos con herramientas de desarrollo como Cursor están sufriendo incrementos de entre 4 y 5 veces su valor original.

La respuesta a esta crisis de infraestructura no radica en las tarifas individuales de los modelos, sino en las dinámicas de uso de la IA avanzada. La industria de TI está migrando rápidamente de los tradicionales asistentes basados en chat (donde un humano pregunta y la IA responde) hacia los agentes autónomos o agénticos.

Los sistemas operan en bucles continuos en segundo plano: analizan un objetivo, trazan un plan, generan código, lo ejecutan en entornos virtuales, procesan los errores y reformulan sus instrucciones en milisegundos. En una sola hora de ejecución automatizada, un agente avanzado puede realizar miles de llamadas a los modelos de lenguaje, devorando decenas de millones de tokens en un parpadeo.

Hubo registro de incidentes alarmantes en el mundo corporativo, como el caso de una compañía que recibió una factura imprevista de 500 millones de dólares tras olvidar configurar los límites de consumo para sus empleados en entornos de desarrollo.

Otra complejidad que se está revelando es que, a diferencia del software tradicional, los modelos de lenguaje avanzado carecen de memoria estática.

¿Qué quiere decir? Cada vez que un desarrollador o un agente interactúa en una sesión interactiva larga, por ejemplo, en el análisis de un repositorio de código complejo, el sistema debe reenviar todo el historial completo de la conversación y los archivos adjuntos al modelo. Si el archivo base inicial equivale a 100,000 tokens, la primera pregunta procesa esa cantidad; pero para la décima pregunta, el modelo tendrá que "volver a leer" todo el historial acumulado, transformando una jornada ordinaria de trabajo en un consumo masivo y multimillonario de datos de entrada (input tokens).

La magnitud de este desafío está transformando las prioridades de los CIOs. De acuerdo con Alexander Embiricos, director de empresas en OpenAI, las conversaciones corporativas han cambiado radicalmente.

“Hace seis meses, cuando hablaba con un cliente, la conversación giraba enteramente en torno a "¿Qué puede hacer? ¿Es lo suficientemente bueno? Oye, estamos gastando muchísimo. ¿Qué visibilidad nos ofreces? ¿Qué auditabilidad tienes? ¿Qué controles de tokens posees? ¿Cuál es la eficiencia de tus modelos?”, señaló Embiricos.

En ese contexto, la Fundación Linux anunció recientemente sus planes para la creación de la Tokenomics Foundation, un nuevo organismo de estandarización que busca replicar el éxito de las metodologías de las operaciones financieras en la nube, pero adaptadas al gasto específico de la inteligencia artificial.

Paralelamente, está emergiendo un ecosistema de plataformas de observabilidad como Pay-i, Paid, Faros AI y Jellyfish, diseñadas para monitorear el rendimiento de los agentes, medir el uso real frente a los reportes de los proveedores y enrutar las consultas de manera dinámica hacia los modelos más económicos de acuerdo con la complejidad de la tarea.

Esto representa un gran dilema para los directores de tecnología: la medición del retorno de inversión (ROI). Plataformas de análisis de ingeniería de software confirman que los desarrolladores que consumen más tokens duplican la productividad de aquellos que usan menos la IA, pero el costo de la infraestructura de tokens necesaria para alcanzar esa métrica se multiplica por diez.

Dado que la mayoría de las organizaciones aún carecen de métricas precisas para correlacionar el gasto extremo en tokens con el valor comercial final del código entregado o los ingresos generados, la recomendación de los expertos apunta hacia una estrategia de adopción moderada pero generalizada. El mayor valor financiero no se encuentra en presionar a los usuarios intensivos a consumir más infraestructura avanzada, sino en capacitar a la base media de la organización para alcanzar un nivel de uso moderado y controlado.

Ahora el éxito técnico y la sostenibilidad operativa de las organizaciones en los próximos años dependerán exclusivamente de su capacidad para implementar barandillas de control eficientes y adoptar una disciplina estricta de gobernanza en la arquitectura de sus tokens.

Por qué los presupuestos de TI están quebrando por el costo de los tokens de IA

Para las empresas que se encuentran en fase de experimentación con suscripciones fijas hacia la implementación de sistemas avanzados y autónomos, se presenta una realidad financiera sensible para los líderes de tecnología, que se enfrentan a un desafío crítico: el costo de los tokens.

Le puede interesar: ¿Qué pasaría si los modelos de IA gobernaran sociedades? De la democracia ideal de Claude al caos de Grok

Entradas relacionadas

Comentarios

24 / 7 Actualizaciones en nuestras Redes Sociales