Claude Sonnet 4.5 trabaja 30 horas seguidas y eleva el estándar de la IA autónoma

Malka Mekler
1 oct 2025
2 Min. de lectura

El nuevo modelo de Anthropic lidera en benchmarks de uso real de computadoras, genera miles de líneas de código sin intervención humana y llega con un SDK para que los desarrolladores construyan agentes avanzados.

Anthropic presentó Claude Sonnet 4.5, un modelo que marca un salto importante en el uso de inteligencia artificial para programación, agentes autónomos y operaciones complejas en computadoras. La compañía asegura que se trata de su sistema más avanzado hasta la fecha, capaz de mantener tareas activas durante más de 30 horas y generar hasta 11.000 líneas de código de forma continua, según reportó The Verge.

Entre las mejoras más destacadas está su desempeño en evaluaciones de uso real de software, donde lidera el benchmark OSWorld con un 61,4% de efectividad, frente al 42,2% que alcanzaba su versión previa, Claude Sonnet 4. Según Anthropic, esta capacidad le permite ejecutar flujos completos de trabajo, como crear aplicaciones similares a Slack o Teams, manipular hojas de cálculo, producir presentaciones o automatizar análisis de datos sin intervención humana.

El modelo también introduce nuevas funciones para desarrolladores a través del Claude Agent SDK, un conjunto de herramientas que replica la infraestructura usada por la propia empresa para Claude Code. Esto incluye manejo de memoria en tareas de larga duración, control de permisos y coordinación de subagentes, lo que abre la posibilidad de diseñar agentes más robustos y especializados en distintos sectores como finanzas, ciberseguridad o investigación científica.

Dianne Penn, directora de gestión de producto en Anthropic, reconoció en entrevista con The Verge que incluso el equipo se sorprendió con los avances en el uso del modelo como operador de computadoras. Scott White, responsable de producto de Claude.ai, lo describió como un asistente de “nivel jefe de gabinete”, capaz de coordinar calendarios, elaborar reportes y extraer insights de tableros de datos.

Además de su potencia técnica, la compañía afirma que Claude Sonnet 4.5 incorpora mejoras en alineamiento y seguridad, con defensas reforzadas contra ataques de inyección de prompts y mecanismos de filtrado diseñados para prevenir riesgos en áreas críticas.

Con estas capacidades, Anthropic busca reforzar su posición en un mercado donde la competencia con Google y OpenAI se intensifica con actualizaciones casi semanales. Claude Sonnet 4.5 no solo incrementa la autonomía de los modelos de IA, sino que también redefine cómo las máquinas pueden integrarse en los procesos de desarrollo y operación tecnológica.

Claude Sonnet 4.5 trabaja 30 horas seguidas y eleva el estándar de la IA autónoma

El nuevo modelo de Anthropic lidera en benchmarks de uso real de computadoras, genera miles de líneas de código sin intervención humana y llega con un SDK para que los desarrolladores construyan agentes avanzados.

Le puede interesar: Claude estrena memoria para equipos de trabajo

Entradas relacionadas

Comentarios

24 / 7 Actualizaciones en nuestras Redes Sociales