Google DeepMind da vida a mundos virtuales con IA en tiempo real
- Malka Mekler
- 7 ago
- 2 Min. de lectura
El nuevo modelo Genie 3 genera entornos 3D interactivos a partir de texto o imágenes, con memoria visual extendida y eventos controlados por comandos.
Google DeepMind presentó su nuevo modelo de inteligencia artificial, Genie 3, un sistema capaz de crear entornos 3D completamente interactivos a partir de simples instrucciones escritas o imágenes. A diferencia de sus versiones anteriores, este modelo permite explorar los mundos generados durante varios minutos con una fidelidad visual notable, manteniendo la coherencia espacial y temporal de los elementos en pantalla. Es decir, si un objeto está en cierto lugar dentro del entorno, permanecerá ahí incluso cuando el usuario deje de mirarlo por un momento y luego regrese.
Según explicó The Verge, la principal innovación radica en la memoria visual extendida y la capacidad de respuesta en tiempo real. Genie 3 puede retener la disposición de los elementos durante alrededor de un minuto, una mejora significativa respecto a los 10–20 segundos de Genie 2. Los entornos creados se renderizan a una resolución de 720p a 24 cuadros por segundo, lo que los hace visualmente más consistentes, aunque no exentos de fallos típicos de los modelos generativos, como texto ilegible o movimientos corporales poco naturales.
Además, DeepMind introdujo lo que denomina “eventos de mundo activables por comandos”, lo que permite a los usuarios modificar el clima, insertar personajes o alterar las condiciones del entorno en tiempo real mediante instrucciones escritas. Esto abre posibilidades no solo para el entretenimiento interactivo, sino también para el entrenamiento de agentes de IA y la generación de datos sintéticos con fines de investigación.
Como destacó Ars Technica, aunque el modelo no puede replicar locaciones reales ni mantiene la fidelidad durante horas, representa un paso importante en el desarrollo de lo que se conoce como world models, sistemas diseñados para simular entornos donde se pueden entrenar agentes inteligentes. Este tipo de simulación cuadro por cuadro no solo permite una navegación fluida, sino también estudiar cómo una IA puede desenvolverse en contextos dinámicos sin depender de datos del mundo real.
Genie 3 sigue siendo una herramienta de investigación y aún no está disponible al público general. DeepMind planea abrirlo primero a un grupo reducido de expertos para seguir afinando sus capacidades. Mientras tanto, el modelo se posiciona como una muestra del potencial técnico de la IA generativa para construir experiencias interactivas complejas, marcando un nuevo hito en el cruce entre videojuegos, simulación y aprendizaje automático.




Comentarios