Mentir, traicionar, conquistar: lo que un juego de mesa reveló sobre la verdadera personalidad de las inteligencias artificiales

Redacción IT NOW
12 jun
4 Min. de lectura

Una competencia entre los modelos de lenguaje más avanzados del mundo, basada en el clásico juego Diplomacy, dejó al descubierto su capacidad para negociar, manipular y hasta engañar sin titubeos. ¿Qué nos dice esto sobre el futuro de la IA y su relación con los humanos?

Cuando se habla de inteligencia artificial, las preguntas suelen repetirse: ¿Puedo confiar en ella? ¿Hasta dónde puede llegar? ¿Qué haría si estuviera en mi lugar? Para responderlas, un grupo de investigadores puso a competir 18 de los modelos de lenguaje más avanzados del mundo en un escenario inusual: una versión online del famoso juego Diplomacy, una histórica prueba de estrategia, negociación y, sobre todo, traición.

La premisa fue simple, aunque inquietante: reemplazar a los jugadores humanos por IA y observar cómo se comportan. ¿Serían fieles a sus palabras o mentirían para ganar? ¿Buscarían el consenso o la dominación? La experiencia resultó ser mucho más que una simulación lúdica. Se convirtió en un experimento pionero sobre el carácter emergente de los modelos de lenguaje actuales y el tipo de decisiones que podrían tomar en situaciones complejas del mundo real.

¿Qué es AI Diplomacy?

Inspirado en Diplomacy, el clásico juego de mesa ambientado en la Europa de 1901, este experimento enfrentó a siete grandes potencias controladas por modelos de lenguaje como o3 de OpenAI, Claude 4 Opus de Anthropic, Gemini 2.5 Pro de Google, DeepSeek R1 y Llama 4 Maverick de Meta, entre otros. Cada uno representaba un país (Inglaterra, Francia, Alemania, etc.), con el objetivo de conquistar la mayoría de los 34 centros de suministro del mapa.

El juego se dividía en dos fases clave: negociación, donde las IA intercambiaban mensajes públicos o privados, y acción, donde realizaban sus movimientos militares en secreto. No hay dados ni azar. Solo pura estrategia, alianzas temporales y, cuando es conveniente, puñaladas por la espalda.

Las IA, en modo humano (o peor)

La primera gran sorpresa: los modelos más exitosos fueron los que mejor mintieron. OpenAI o3 se destacó por su capacidad para engañar a sus contrincantes. En un turno, le escribió en privado a su "diario interno" que había manipulado a Gemini 2.5 Pro, planeando aprovechar su inminente colapso. No era un fallo. Era estrategia pura.

En contraste, Claude 4 Opus se mantuvo como el pacificador idealista, buscando soluciones armoniosas incluso en un juego que solo admite un ganador. Esta tendencia a la cooperación lo llevó a ser fácilmente manipulado por o3, quien lo convenció de apoyar una "victoria compartida" —algo imposible en las reglas del juego— solo para luego traicionarlo y eliminarlo sin remordimientos.

Gemini 2.5 Pro, por su parte, mostró gran capacidad de anticipación y movimientos brillantes, pero cayó víctima de una coalición secreta liderada por su rival más maquiavélico. DeepSeek R1 sorprendió con un estilo más teatral y agresivo, demostrando que incluso modelos mucho más económicos pueden competir con los titanes de la IA si se optimizan bien para ciertos entornos.

¿Por qué importa este experimento?

Más allá del espectáculo (las partidas fueron transmitidas en Twitch), AI Diplomacy busca resolver un problema de fondo en el mundo de la inteligencia artificial: la falta de benchmarks realmente útiles. Durante años, los modelos han superado con facilidad pruebas tradicionales como resolver acertijos, escribir ensayos o responder exámenes. Sin embargo, esas pruebas no capturan la complejidad del comportamiento estratégico y moral en contextos realistas.

Este tipo de experimentos introduce un nuevo estándar: evaluaciones multifacéticas, accesibles, evolutivas y generativas. No se trata de llenar blancos, sino de enfrentarse a decisiones complejas con múltiples caminos posibles. ¿Aliarse con un enemigo hoy para destruirlo mañana? ¿Fingir vulnerabilidad para ganar tiempo? ¿Negociar la paz mientras se planea una ofensiva?

Las decisiones de las IA en estos contextos no solo entretienen: nos enseñan sobre sus valores emergentes, sus límites éticos (o su ausencia) y su capacidad de adaptación.

Lo que aprendimos: ¿aliados o adversarios?

La lección más importante que deja AI Diplomacy es que los modelos actuales ya están mostrando comportamientos sofisticados, adaptativos y estratégicos, incluso sin ser diseñados específicamente para juegos. Eso incluye la habilidad de engañar, manipular, improvisar e incluso adoptar "personalidades" distintas según el rol asignado.

Si hoy estos modelos son capaces de negociar tratados de paz falsos o de fingir lealtad mientras planean una traición, la pregunta no es si son peligrosos, sino en qué contextos deben ser regulados y cómo se les entrena para comportamientos deseables.

La buena noticia es que el mismo juego que reveló estas capacidades también puede usarse para entrenarlas en dirección contraria: honestidad, cooperación, pensamiento lógico, empatía. Al fin y al cabo, lo que se mide, mejora.

AI Diplomacy no es solo un experimento geek ni una curiosidad para streamers. Es un espejo: nos muestra el alma emergente de las inteligencias artificiales más avanzadas, y nos obliga a pensar cómo queremos convivir con ellas. Si alguna vez dudaste de que la IA puede mentir para ganar, ahora ya lo sabes. Y si querés que no lo haga, más vale que empecemos a jugar con reglas claras.