Anthropic lanzó Claude 4 y apunta al trono técnico de la IA

Malka Mekler
26 may
3 Min. de lectura

Los nuevos modelos de la empresa introducen funciones como “pensamiento extendido”, manejo de archivos locales y edición contextual en IDEs.

En medio de una carrera cada vez más competitiva por desarrollar modelos de inteligencia artificial más precisos, útiles y adaptables, Anthropic dio paso técnico relevante con el lanzamiento de Claude 4. Esta nueva generación, compuesta por Claude Opus 4 y Claude Sonnet 4, introduce avances sustanciales en programación, razonamiento prolongado y colaboración con agentes autónomos. Lejos de ser una simple iteración, estos modelos redefinen los estándares de desempeño técnico en tareas complejas de software, extendiendo el alcance de lo que hoy puede lograrse con IA generativa en entornos reales de desarrollo.

Claude Opus 4, descrito por Anthropic como su modelo más potente hasta la fecha, lidera los principales benchmarks del sector, incluyendo SWE-bench (72,5%) y Terminal-bench (43,2%). Su rendimiento sostenido en tareas que requieren miles de pasos y varias horas de procesamiento lo posiciona como una herramienta especialmente apta para automatizar procesos de desarrollo complejos. Empresas como Cursor y Replit destacan su precisión en modificaciones distribuidas en múltiples archivos, mientras que Block reporta mejoras en la calidad del código durante la edición y depuración. Rakuten, por su parte, validó su desempeño en un entorno exigente con una refactorización autónoma de siete horas. Según Cognition, Opus 4 resuelve desafíos técnicos que antes quedaban fuera del alcance de otros modelos.

Claude Sonnet 4, aunque más contenido en alcance, también representa una mejora significativa sobre su predecesor, con una puntuación de 72,7% en SWE-bench. Su fortaleza radica en combinar eficiencia con alto rendimiento, lo que lo convierte en una opción práctica para una variedad de casos de uso. Por su parte, GitHub anunció que Sonnet 4 será el modelo detrás de su nuevo agente de codificación en Copilot. Otras compañías como iGent, Sourcegraph y Augment Code subrayan su habilidad para seguir instrucciones complejas, reducir errores de navegación en grandes bases de código y mantener un enfoque más riguroso en tareas de programación asistida.

Ambos modelos introducen capacidades técnicas que elevan el potencial de los agentes inteligentes. Entre ellas se encuentra el “pensamiento extendido”, que permite a Claude alternar entre razonamiento interno y el uso de herramientas externas, como búsquedas web, durante la ejecución de tareas. Esta función, junto con la ejecución paralela de herramientas y una memoria mejorada, permite al modelo conservar información crítica entre sesiones. Según datos de Anthropic, este enfoque reduce en un 65% la aparición de atajos o soluciones erróneas en tareas complejas.

Claude Opus 4, en particular, muestra mejoras en el manejo de memoria contextual. Cuando se le proporciona acceso a archivos locales, puede generar y mantener archivos de referencia que almacenan información clave, una función que permite un seguimiento coherente en tareas de largo plazo. Esta capacidad técnica amplía de forma tangible el horizonte de aplicación de agentes inteligentes en entornos exigentes.

Otra novedad tecnológica relevante es Claude Code, que ahora se encuentra disponible de forma general. Esta herramienta extiende el modelo a los flujos de trabajo de desarrollo, integrándose de manera nativa con editores como VS Code y JetBrains. A través de un SDK extensible, la herramienta permite construir agentes personalizados capaces de ejecutar tareas en segundo plano, responder a cambios en código, corregir errores en CI o automatizar revisiones en GitHub, con respuestas que se insertan directamente en el entorno de desarrollo.

Finalmente, la incorporación de “resúmenes de pensamiento” busca optimizar la interfaz del modelo con los usuarios: utilizando un modelo auxiliar, Claude puede condensar procesos de razonamiento extensos sin perder contexto. Esta funcionalidad solo se activa en alrededor del 5% de los casos, pero los usuarios que necesiten acceso completo a las cadenas de pensamiento pueden habilitar un “modo desarrollador” orientado a casos de ingeniería de prompts avanzados.

Claude Opus 4 y Sonnet 4 están disponibles en la API de Anthropic, Amazon Bedrock y Google Cloud Vertex AI. Los precios se mantienen respecto a las versiones anteriores: US$15/US$75 por millón de tokens (entrada/salida) para Opus 4 y US$3/US$15 para Sonnet 4.

Anthropic lanzó Claude 4 y apunta al trono técnico de la IA

Los nuevos modelos de la empresa introducen funciones como “pensamiento extendido”, manejo de archivos locales y edición contextual en IDEs.

Le puede interesar: Claude aprende de tus herramientas y actúa con contexto

Entradas relacionadas

Comentarios

24 / 7 Actualizaciones en nuestras Redes Sociales