top of page

El nuevo ChatGPT-4 ya está aquí y sorprende con sus capacidades a los primeros usuarios

La última versión del chatbot de OpenAI puede superar exámenes de ingreso a universidades y resolver complejas tareas en segundos. Desde programar videojuegos hasta diseñar sitios web solo a partir de un boceto en papel.

OpenAI anunció el lanzamiento de ChatGPT-4 que, según la compañía, muestra un "rendimiento a nivel humano" en varias pruebas profesionales.


La empresa señaló que la última versión de su modelo de lenguaje producirá menos respuestas objetivamente incorrectas y tendrá menos instancias de "descarrilamiento" o charlas sobre temas prohibidos. Además, afirmó que ChatGPT-4 incluso funcionará mejor que los humanos en muchas pruebas estandarizadas.


Según la firma, GPT-4 se desempeñó en el percentil 90 en un examen de barra simulado, el percentil 93 en un examen de lectura SAT y el percentil 89 en el examen de Matemáticas SAT.


Al igual que sus antecesores, puede seguir instrucciones complejas en lenguaje natural y generar trabajos técnicos o creativos, pero hacerlo con más profundidad: admite generar y procesar alrededor de 25.000 palabras de texto, lo que permite la creación de contenido o análisis de documentos más largos que los modelos anteriores.


OpenAI hizo que el modelo tomara diversas pruebas, como el examen de barra uniforme, la prueba de admisión a la facultad de derecho (LSAT) y el examen cuantitativo de registro de graduados (GRE), entre otras. En muchas de las tareas, obtuvo una puntuación a nivel humano, lo que representa que si se juzgara a ChatGPT-4 únicamente por su capacidad para tomar esas pruebas, podría ingresar a la facultad de derecho y potencialmente a muchas universidades.

El nuevo modelo está disponible para los suscriptores pagos de ChatGPT y como parte de una API que permite a los programadores integrar la IA en sus aplicaciones. OpenAI planea cobrar alrededor de 3 centavos por unas 750 palabras de indicaciones y 6 centavos por unas 750 palabras de respuesta.


Los primeros usuarios se están mostrando sorprendidos con las capacidades de GPT-4: desde poder diseñar automáticamente un sitio web solo a partir de haberle presentado un boceto dibujado a mano alzada en un papel, hasta un usuario que creó una variante del famoso videojuego Pong en apenas 60 segundos.



Otro usuario mostró como pudo con GPT-4 recrear el famoso juego Snake ("La viborita" muy presente en los antiguos celulares) sin tener el más mínimo conocimiento de programación y en apenas minutos.

Aún así, OpenAI advirtió que el nuevo software tiene sus limitaciones y todavía es menos capaz que los humanos en muchos escenarios. Un problema importante con el que todavía lucha GPT-4 es la "alucinación" o la generación de información falsa. El modelo no siempre es fidedigno en cuanto a los hechos y tiende a insistir en que es correcto cuando en realidad es incorrecto.


"En una conversación informal, la distinción entre GPT-3.5 y GPT-4 puede ser sutil. La diferencia surge cuando la complejidad de la tarea alcanza un umbral suficiente: GPT-4 es más confiable, creativo y capaz de manejar mucho más instrucciones matizadas que GPT-3.5", informó OpenAI en su blog.



bottom of page