Durante meses, Anthropic insinuó que estaba preparando un salto importante. Y ese salto acaba de llegar con Claude Opus 4.5, una inteligencia artificial que —según los datos publicados por la propia compañía— no solo supera a GPT-5.1 Codex-Max y Gemini 3 Pro, sino que también rinde mejor que los ingenieros humanos en pruebas reales de programación.
Este no es un eslogan publicitario: Opus 4.5 fue sometido a un examen de nivel profesional diseñado para seleccionar candidatos a ingeniería, con un límite estricto de dos horas y resolución de problemas en Python. La sorpresa llegó cuando el modelo obtuvo una puntuación superior a la de cualquier persona, combinando paralelización de intentos con una notable capacidad para razonar pasos complejos.
Una nueva generación de IA para escribir código (y entenderlo)

Anthropic describe Opus 4.5 como “el mejor modelo del mundo para programación, agentes y uso informático general”. Habrá que ver si la competencia responde, pero los números publicados son difíciles de ignorar.
En las métricas SWE-bench, el estándar para medir la capacidad de una IA de resolver incidencias reales de software, Opus 4.5 supera a GPT-5.1, Gemini 3 Pro y al anterior Claude Sonnet 4.5. No solo arregla bugs: también refactoriza, migra repositorios completos, revisa código con precisión quirúrgica y es capaz de desarrollar herramientas funcionales desde cero.
Uno de los puntos que más destaca Anthropic es su razonamiento profundo. Frente a modelos anteriores, Opus 4.5 desarma problemas ambiguos y los ordena en una secuencia lógica; si algo no está claro, genera hipótesis y las contrasta en paralelo antes de entregar la solución final.
También incorpora una ventana de contexto de 200.000 tokens, suficiente para meter dentro un repositorio completo, documentación adjunta, ejemplos previos y una conversación larga sin perder coherencia. Para los desarrolladores que trabajan con bases de código gigantes, este detalle no es menor.
Un modo “esfuerzo” para pensar más (o más rápido)

Una de las novedades curiosas es un parámetro llamado effort (“esfuerzo”). Permite elegir entre más velocidad o más profundidad de análisis.
Si el usuario activa el modo de máximo esfuerzo, Opus 4.5 dedica más tiempo a generar múltiples rutas de solución antes de quedarse con la mejor. Para tareas urgentes, basta con rebajar ese ajuste y priorizar la entrega inmediata.
La combinación entre este parámetro y la capacidad de razonamiento paralelo es, según Anthropic, uno de los factores que explican su rendimiento superior al de los humanos en pruebas cronometradas.
De la ingeniería al Excel: un modelo que hace de todo

Aunque el foco está en la programación, Opus 4.5 también obtuvo resultados llamativos en tareas de oficina.
Según Anthropic, la IA mejora un 20% en precisión y 15% en eficiencia en análisis financieros de Excel frente a modelos anteriores. Además es capaz de:
- organizar bases de datos grandes,
- generar presentaciones completas,
- redactar documentos extensos con análisis profundo,
- planificar estrategias de extremo a extremo sin perder consistencia,
- y coordinar flujos de trabajo como un agente autónomo.
Esta última capacidad —la de agente— apunta directamente al futuro: tareas largas, repetitivas o multipaso que pueden automatizarse por completo sin intervención humana.
El ataque final: coste casi irrisorio
Pero quizá el golpe más fuerte para la competencia está en el precio. Anthropic rebajó el coste a 5 dólares por millón de tokens, una cifra extremadamente baja para un modelo de gama alta.
Si la mejora en rendimiento ya era llamativa, la relación potencia/precio puede obligar a Google y OpenAI a replantear su estrategia. Es un movimiento diseñado para capturar a desarrolladores, empresas y equipos que buscan usar IA de manera intensiva sin disparar costes.
Un aviso para la industria: el listón acaba de subir
Claude Opus 4.5 ya está disponible en la app de Claude, en la API y en la nube. Con él, Anthropic envía un mensaje claro: el terreno del desarrollo asistido por IA se está moviendo rápido, y quien domine el software dominará todo lo demás.
La pregunta, inevitable, es qué ocurre ahora con los ingenieros humanos. No se trata de reemplazo inmediato, pero sí de un cambio profundo: la IA ya no es un asistente que corrige errores; empieza a ser un colega de trabajo que programa, documenta, organiza y toma decisiones con un nivel que hace un año parecía imposible.
Y lo más inquietante —o emocionante— es que esto no parece un punto final, sino el nuevo punto de partida.