Google DeepMind presentó Project Genie, una IA que genera y explora mundos interactivos
- Redacción IT NOW
- hace 2 horas
- 2 Min. de lectura
La empresa anunció Project Genie, un prototipo de inteligencia artificial que permite a usuarios generar, explorar y remixar mundos interactivos basados en texto o imágenes en tiempo real, un paso significativo en la evolución de los llamados world models y hacia computación inmersiva con IA.
Google DeepMind abrió el acceso a Project Genie, un proyecto experimental que pone a prueba la capacidad de las IA para crear mundos interactivos y navegables a partir de simples descripciones textuales o imágenes.
Disponible inicialmente para suscriptores de Google AI Ultra en Estados Unidos, Project Genie se basa en la tecnología de mundo modelo Genie 3, combinada con los sistemas generadores de imágenes Nano Banana Pro y el asistente Gemini, para construir entornos tridimensionales que los usuarios pueden explorar, modificar y volver a mezclar en tiempo real.
A diferencia de la generación de imágenes o videos tradicionales, este prototipo no se limita a producir contenido estático: los entornos creados evolucionan al ritmo de las acciones del explorador, proporcionando interacción (como caminar, volar o conducir) y simular dinámicas físicas básicas. Aunque hay limitaciones actuales en realismo visual y control de personajes, Google considera estas experiencias cruciales para avanzar hacia sistemas de IA más robustos y generalistas.
La iniciativa representa un enfoque distinto en investigación de modelos de mundo (world models), arquitecturas diseñadas para simular entornos y predecir cómo evolucionan con base en las acciones. Para DeepMind, estos modelos son esenciales para dotar a las IA de una comprensión profunda del mundo, un componente considerado clave en el camino hacia la inteligencia artificial general.
Además de las posibilidades creativas y lúdicas, Project Genie ya está siendo observado por desarrolladores de juegos, medios interactivos y entornos virtuales, que ven en esta tecnología una nueva forma de producción generativa para mundos digitales. La disponibilidad temprana y experimental también permitirá a Google recopilar datos de uso que impulsen mejoras continuas en el rendimiento y la escalabilidad de estos sistemas.




Comentarios