OpenAI lanzó o3-pro: el modelo de IA que razona mejor que nunca
- Malka Mekler
- 12 jun
- 2 Min. de lectura
Demuestra mayor precisión, claridad y seguimiento de instrucciones en tareas complejas, aunque sacrifica velocidad de respuesta.

OpenAI presentó su nuevo modelo de inteligencia artificial o3-pro, una evolución tecnológica que consolida avances en razonamiento computacional. A diferencia de los modelos tradicionales de lenguaje, o3-pro se basa en un enfoque de razonamiento paso a paso, lo que le permite resolver con mayor precisión problemas complejos en áreas como física, matemáticas y programación.
Este modelo sustituye al anterior o1-pro y ya está disponible para los usuarios de ChatGPT Pro y Team, mientras que los clientes Enterprise y Edu lo recibirán la próxima semana. También se encuentra activo en la API para desarrolladores, con una tarifa de US$20 por millón de tokens de entrada y US$80 por millón de tokens de salida. En términos prácticos, un millón de tokens de entrada equivale a unas 750.000 palabras.
Desde una perspectiva técnica, o3-pro integra múltiples herramientas que lo dotan de capacidades ampliadas: puede buscar en la web, analizar archivos, razonar con entradas visuales, ejecutar código en Python y personalizar respuestas utilizando memoria. No obstante, la incorporación de estas funciones tiene un impacto en la velocidad de respuesta, que es más lenta comparada con su predecesor, y presenta limitaciones como la falta de generación de imágenes, la ausencia de soporte para Canvas y la desactivación temporal de chats.
En evaluaciones internas, OpenAI destaca que evaluadores expertos prefirieron consistentemente a o3-pro frente a su versión base en todas las categorías analizadas, especialmente en ciencia, educación, programación y escritura. La compañía señala además mejoras sustanciales en claridad, precisión y capacidad de seguir instrucciones.
Los resultados en benchmarks también refuerzan su rendimiento, en el AIME 2024, una prueba centrada en habilidades matemáticas, o3-pro superó a Gemini 2.5 Pro de Google. Asimismo, venció al modelo Claude 4 Opus de Anthropic en GPQA Diamond, un riguroso test de conocimientos científicos a nivel doctoral. Estas métricas posicionan a o3-pro como uno de los modelos más sólidos en razonamiento especializado disponibles hasta la fecha.
Comments