El fracaso de la gamificación: Amazon prohíbe a sus empleados usar IA “solo por usarla” tras dispararse los costes

Amazon cancela su experimento Kirorank tras descubrir que sus desarrolladores inflaban el uso de IA, disparando los costes de infraestructura.

La adopción de la inteligencia artificial en el entorno corporativo está atravesando una fase de maduración acelerada, donde el entusiasmo inicial choca frontalmente con la realidad financiera. Amazon, uno de los gigantes tecnológicos más influyentes del mundo, acaba de protagonizar un caso de estudio fascinante sobre los peligros de forzar la adopción tecnológica sin métricas de valor real. La compañía ha tenido que cancelar abruptamente un ambicioso experimento interno que obligaba a sus desarrolladores a utilizar herramientas de IA de forma intensiva.

Amazon frena el uso forzado de IA por altos costes
El experimento Kirorank de Amazon disparó los costes de infraestructura al fomentar el uso inútil de IA.

Lo que comenzó como una iniciativa para acelerar la productividad y mantener el liderazgo en innovación, rápidamente se transformó en un agujero negro de recursos computacionales. Los ingenieros, presionados por cumplir con las cuotas establecidas por la dirección, encontraron formas creativas de “engañar” al sistema, generando un consumo masivo de tokens sin aportar valor real al código de la empresa. Este fenómeno, bautizado como “tokenmaxxing”, ha obligado a la cúpula directiva a intervenir y cambiar radicalmente su enfoque sobre cómo y cuándo debe implementarse la inteligencia artificial en el desarrollo de software.

El experimento Kirorank y la presión por la adopción

En su afán por liderar la carrera de la automatización, la dirección de Amazon implementó un sistema interno conocido como Kirorank. Este tablón de puntuaciones fue diseñado para medir y fomentar la actividad de los desarrolladores dentro de Kiro, una herramienta corporativa basada en modelos avanzados de lenguaje, descrita internamente como el equivalente al “Claude Code” de la compañía.

El objetivo establecido por la alta dirección era sumamente ambicioso: lograr que el 80% de los programadores de la plantilla utilizaran la inteligencia artificial cada semana. La premisa subyacente era lógica desde una perspectiva teórica; a mayor uso de herramientas de asistencia al código, mayor velocidad de despliegue y eficiencia operativa. Sin embargo, la implementación de esta métrica como un indicador clave de rendimiento (KPI) desencadenó consecuencias imprevistas que terminaron saboteando el propósito original del proyecto.

El nacimiento del “Tokenmaxxing” y la picaresca laboral

Cuando el rendimiento y, potencialmente, las evaluaciones laborales de los empleados se vinculan a una métrica puramente cuantitativa, la naturaleza humana tiende a buscar el camino de menor resistencia. Los desarrolladores de Amazon, lejos de utilizar la IA para resolver problemas complejos de arquitectura o depurar código crítico, comenzaron a optimizar sus interacciones para maximizar su puntuación en el Kirorank.

La estrategia adoptada por muchos ingenieros consistió en desplegar agentes autónomos basados en MeshClaw (la versión interna de OpenClaw) programados para ejecutar procesos en bucle. Estos agentes realizaban consultas redundantes, automatizaban tareas completamente inútiles y devoraban tokens de procesamiento sin generar ningún impacto positivo en los productos de la empresa. Esta práctica ha sido acuñada en la industria con el término “tokenmaxxing”: la acción de inflar artificialmente el consumo de tokens para simular una alta productividad y escalar posiciones en los rankings corporativos.

El impacto económico y la intervención directiva

El resultado de esta gamificación mal planteada fue desastroso a nivel financiero. El consumo descontrolado de tokens disparó de forma absurda los costes de computación e infraestructura en la nube de Amazon. La situación alcanzó tal gravedad que Dave Treadwell, vicepresidente sénior de la compañía, tuvo que intervenir de urgencia esta semana ante toda la plantilla de ingeniería.

Durante su intervención, Treadwell anunció la cancelación inmediata del requisito de uso de la herramienta. Aunque reconoció que el experimento Kirorank había sido diseñado con “buenas intenciones”, admitió que el resultado práctico se había convertido en un sumidero económico inaceptable. “Por favor, no uséis la IA solo por el mero hecho de usar la IA”, fue el mensaje contundente del ejecutivo, instando a los equipos a reenfocarse en la creación de mejores productos en lugar de quemar recursos de servidor de manera estéril.

Este giro de timón cobra especial relevancia en el contexto actual del mercado de la IA. Empresas proveedoras de modelos fundacionales, como Anthropic (de la cual Amazon es el principal inversor), han abandonado recientemente las tarifas planas mensuales para adoptar modelos de precios basados estrictamente en el consumo por uso. Bajo este nuevo esquema de facturación, el “juego” de los ingenieros multiplicaba exponencialmente la factura operativa de la compañía.

Un problema endémico en la industria tecnológica

El caso de Amazon está lejos de ser un incidente aislado. Fuentes de la industria confirman que gigantes como Meta y Microsoft han experimentado situaciones idénticas en sus propias oficinas, enfrentándose a empleados que sabotean los rankings internos mediante el consumo masivo e injustificado de tokens.

Para Amazon, la ironía de esta situación es particularmente amarga. La corporación lleva meses ejecutando severos planes de reestructuración y despidos masivos con el objetivo de recortar gastos operativos. Estos recortes están destinados, paradójicamente, a financiar su gigantesco plan de inversiones en infraestructura de centros de datos e inteligencia artificial, cuyo gasto de capital (capex) proyectado para 2026 se estima en la asombrosa cifra de 200.000 millones de dólares. Desperdiciar estos valiosos recursos en consultas inútiles representaba una contradicción insostenible para la estrategia financiera de la empresa.

El nuevo paradigma: de la cantidad a la calidad

El fracaso del experimento Kirorank ha dejado una lección invaluable para Amazon y para el resto del ecosistema tecnológico: la adopción de la inteligencia artificial no puede medirse al peso. Para evitar que la historia se repita, los equipos de ingeniería de la compañía están rediseñando por completo sus métricas de evaluación.

El nuevo enfoque abandona la medición del consumo bruto de tokens para centrarse en lo que han denominado “despliegues normalizados”. A partir de ahora, el éxito de la integración de la IA se evaluará en función de cuántas veces la interacción con el modelo se traduce en líneas de código útiles, funcionales y verdaderamente integradas en los repositorios de producción de la empresa.

Conclusión

La abrupta cancelación del programa de adopción forzada de IA en Amazon marca un punto de inflexión en la madurez de la industria tecnológica. Demuestra que la verdadera transformación digital no se logra imponiendo cuotas de uso, sino integrando las herramientas de manera orgánica donde realmente aportan valor. A medida que los costes de computación continúan siendo un factor crítico, las empresas deberán aprender a equilibrar la innovación con la eficiencia operativa. El fin del “tokenmaxxing” es, en última instancia, el principio de una era donde la inteligencia artificial empresarial será evaluada por su impacto real en el negocio, y no por el volumen de su procesamiento.