Llega Claude Opus 4.5 de Anthropic, que dice liderar en programación, agentes y uso informático

0
2

Anthropic ha lanzado su nuevo modelo de inteligencia artificial (IA) actualizado Claude Opus 4.5, que llega como “el mejor modelo” para la programación, los agentes y el uso informático, con capacidades de ingeniería de software que superan las de otros modelos insignia del sector como Gemini 3 Pro de Google o GPT-5.1-Code Max de OpenAI.

Seis meses después del lanzamiento de Claude Opus 4, la compañía de IA ya ha anunciado su modelo sucesor actualizado que, gracias a sus capacidades mejoradas, supone “un avance en la capacidad de los sistemas de IA”, así como cambios en la forma de trabajar con modelos.

En concreto, Anthropic ha detallado que Claude Opus 4.5 es mejor a la hora de llevar a cabo tareas cotidianas como la investigación exhaustiva y el trabajo con diapositivas y hojas de cálculo, pensado para un ámbito laboral.

Siguiendo esta línea, la compañía también ha subrayado especialmente sus capacidades de programación, de gestión de agentes y uso informático, respecto a lo que lo ha definido como “el mejor modelo del mundo”.

El puntaje de Claude Opus 4.5 respecto de otras plataformas de IA generativa en su aplicación para software

Como ha explicado en un comunicado en su blog, todo ello se refleja en que tras someter a un examen práctico de ingeniería de software “notoriamente difícil” a Claude Opus 4.5 y a otros modelos insignia del sector, el nuevo modelo de Anthropic superó a los modelos Gemini 3 Pro de Google o GPT-5.1-Code Max de OpenAI, incluso superó a Claude Sonnet 4.5.

Igualmente, también ofrece mejores habilidades de visión, razonamiento y matemáticas que sus predecesores, como ha remarcado Anthropic, así como de codificación multilingüe.

Siguiendo esta línea, Anthropic también ha puesto en valor las capacidades creativas y de entendimiento que ha mostrado Claude Opus 4.5 a la hora de resolver tareas complejas o cuestiones con una solución aparentemente difícil, buscando opciones alternativas. Además, ha remarcado que utiliza considerablemente menos tokens que sus predecesores para alcanzar resultados “similares o mejores”.

Concretamente, supera los parámetros de programación internos, reduciendo a la mitad el uso de tokens, lo que la compañía ha aclarado que es especialmente adecuado para tareas de migración y refactorización de código.

Para los desarrolladores, con el nuevo parámetro de esfuerzo en la API de Claude, permite decidir cuándo minimizar el tiempo de búsqueda y la inversión o, por el contrario, maximizar la capacidad. Por ejemplo, con un nivel de esfuerzo medio, Opus 4.5 iguala la mejor puntuación de Sonnet en 4.5 SWE-bench Verified, pero utiliza un 76 por ciento menos de tokens de salida.

Además de todo ello, Anthropic ha valorado que Claude Opus 4.5 también es “muy eficaz” en la gestión de un equipo de subagentes, lo que permite la construcción de sistemas multiagente complejos y bien coordinados.

En cuanto a la seguridad de este modelo, la compañía ha adelantado que han logrado avances en la robustez contra ataques de inyección rápida, que introducen instrucciones engañosas para inducir al modelo a un comportamiento dañino.

Anthropic ha detallado que Claude Opus 4.5 ya está disponible en sus aplicaciones, así como en la API y en las tres principales plataformas en la nube.

Actualizaciones de productos

De la mano del nuevo modelo Claude Opus 4.5, Anthropic también ha detallado algunas actualizaciones que llegan a sus productos para mejorar la experiencia de los usuarios, impulsadas por las capacidades avanzadas del modelo actualizado.

Una de estas actualizaciones es que, dentro de la aplicación de Claude, las conversaciones largas “ya no se estancan”, esto se debe a que Claude resumirá automáticamente el contexto anterior según sea necesario, de cara a poder seguir conversando de forma fluida.

Asimismo, la versión especializada del modelo enfocado en programación, Claude Code, también se ha lanzado para la aplicación de escritorio del modelo de IA, lo que, según ha matizado la compañía, permite ejecutar múltiples sesiones locales y remotas en paralelo para ejecutar diversas acciones de agentes de IA al mismo tiempo.

Por otra parte, la herramienta de Claude para el navegador Chrome, que permite gestionar tareas en cada pestaña, ya está disponible para todos los usuarios suscritos a la versión Max. Igualmente, Claude para el servicio de Excel ya está disponible en versión beta para los usuarios suscritos a Max, Team y Enterprise.

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí