OpenAI redobla la apuesta visual: lanzó GPT Image 1.5 y acelera la carrera con Google
- Redacción IT NOW
- hace 4 horas
- 3 Min. de lectura
La nueva versión de ChatGPT Images promete generar imágenes hasta cuatro veces más rápido, seguir instrucciones con mayor precisión y ofrecer edición visual avanzada, en un contexto de competencia directa con Gemini y los últimos modelos de Google.
OpenAI presentó una nueva evolución de su generador de imágenes integrado en ChatGPT. Se trata de GPT Image 1.5, un modelo que busca resolver uno de los grandes déficits históricos de la generación visual por IA: la dificultad para iterar y editar sin perder coherencia. Disponible desde esta semana para todos los usuarios de ChatGPT y también a través de la API, la actualización marca un movimiento estratégico en plena escalada competitiva con Google.
El anuncio no llega en el vacío. En las últimas semanas, la presión sobre OpenAI se intensificó tras la irrupción de Gemini 3 y Nano Banana Pro, el generador de imágenes de Google que lidera múltiples benchmarks en LMArena. Incluso después del lanzamiento de GPT-5.2, que OpenAI posicionó como su modelo más avanzado para desarrolladores y uso profesional cotidiano, Google mantiene ventaja en varios indicadores clave. En ese contexto, la llegada anticipada de GPT Image 1.5 —originalmente prevista para comienzos de enero— funciona como una respuesta directa para recuperar terreno en el frente visual.
Edición precisa, no reinterpretación total
La principal promesa de GPT Image 1.5 es una mejor capacidad de seguir instrucciones específicas. A diferencia de muchos generadores actuales, que tienden a rehacer por completo una imagen ante cualquier cambio solicitado, el nuevo modelo apunta a ediciones quirúrgicas: ajustar una expresión facial, modificar la iluminación o alterar el tono de color sin romper la continuidad visual. Este enfoque es clave para usos profesionales donde la consistencia —rostros, composición, estilo o branding— es un requisito, no un detalle.
OpenAI reconoce implícitamente una limitación extendida en el sector: la mayoría de las herramientas de generación de imágenes son buenas creando desde cero, pero pobres en iterar. GPT Image 1.5 intenta cerrar esa brecha con controles de postproducción más granulares, alineándose con una tendencia que ya exploran modelos como Nano Banana Pro, pero con una integración directa en el flujo conversacional de ChatGPT.
Más velocidad y un enfoque “production-ready”
Otro diferencial técnico es el rendimiento. Según OpenAI, la nueva versión puede generar imágenes hasta cuatro veces más rápido que su antecesora, GPT Image 1, lanzada en abril. Este salto no solo mejora la experiencia del usuario final, sino que refuerza la idea de que los generadores de imágenes y video están dejando atrás la fase experimental para convertirse en herramientas listas para producción.
Para empresas, equipos de marketing, diseño o e-commerce, esta combinación de velocidad, coherencia visual y edición precisa reduce tiempos y costos, y abre la puerta a flujos creativos más ágiles sin depender exclusivamente de software especializado.
ChatGPT como estudio creativo
El lanzamiento de GPT Image 1.5 viene acompañado de cambios en la experiencia de uso. OpenAI habilitó un acceso dedicado a imágenes en la barra lateral de ChatGPT, concebido como un “estudio creativo” más que como una simple función adicional. Nuevas pantallas de visualización y edición, prompts en tendencia y filtros predefinidos buscan facilitar la inspiración y el control creativo, incluso para usuarios sin formación técnica.
Además, la compañía anticipó una mayor integración de elementos visuales en otras áreas de ChatGPT, como las búsquedas. La idea es que consultas cotidianas —conversiones de medidas, resultados deportivos, explicaciones rápidas— puedan apoyarse en visuales claros y con fuentes visibles, reforzando la utilidad práctica del asistente.
En palabras de Fidji Simo, CEO de aplicaciones de OpenAI, el objetivo es acortar la distancia entre la idea y su materialización: cuando lo visual comunica mejor que el texto, ChatGPT debería mostrarlo; cuando el siguiente paso está en otra herramienta, debería estar al alcance inmediato.
Con GPT Image 1.5, OpenAI no solo presenta un nuevo modelo, sino que redefine el rol de ChatGPT como plataforma creativa integral. En una carrera donde Google pisa fuerte, la batalla por liderar la generación visual ya no se libra solo en benchmarks, sino en quién logra convertir la IA en una herramienta verdaderamente usable, consistente y lista para el mundo real.
