Claude Sonnet 4.5: la IA del día en el Observatorio

12 nov 2025
7 Min. de lectura

Antecedentes

En el otoño de 2025, Anthropic —empresa cofundada por Dario y Daniela Amodei y financiada por compañías como Google y Amazon— lanzó Claude Sonnet 4.5, la versión más reciente de su modelo de lenguaje de propósito general. Con su sede en San Francisco, Anthropic ha buscado articular modelos que combinen potencia de cálculo con seguridad y alineación éticas, posicionándose como competidor de OpenAI. Entre sus aportaciones se encuentran las series Claude Haiku, Claude Sonnet y Claude Opus, modelos que han demostrado un rendimiento notable en tareas de programación y razonamiento. La compañía destaca que Sonnet 4.5 es su modelo más alineado, con menores tasas de “sicofancia” y mejoras frente a ataques de inyección de instrucciones.

La publicación de Claude Sonnet 4.5 coincide con una competencia feroz entre los grandes proveedores de modelos: OpenAI lanzó GPT‑5, Google actualizó Gemini 2.5 Pro y plataformas como Perplexity o DeepSeek buscan nichos específicos . Al situarse como el “mejor modelo de codificación del mundo” según la propia Anthropic, Sonnet 4.5 se ubica en el segundo lugar de las clasificaciones de popularidad de modelos de IA de 2025. Su valor consiste no sólo en el rendimiento técnico, sino también en la apuesta por la transparencia y el cumplimiento normativo; Anthropic ha divulgado informes de seguridad y de entrenamiento sobre modelos como Haiku 4.5, subrayando el uso de datos públicos y fuentes no públicas cuidadosamente seleccionadas. Sin embargo, a la fecha no se ha publicado un informe completo de entrenamiento para Sonnet 4.5 y la opacidad podría dificultar el cumplimiento de normativas como el AI Act europeo.

Ficha técnica

Campo	Información
Modelo	Claude Sonnet 4.5
Tipo de IA	Modelo de lenguaje de propósito general con capacidades de codificación y agentes
Compañía desarrolladora	Anthropic (Estados Unidos)
Fecha de lanzamiento	29 de septiembre de 2025
Capacidades principales	Razonamiento, codificación de larga duración, ejecución de código, creación y edición de archivos, uso de extensiones en VS Code y Chrome
Contexto máximo	Soporta contextos extensos (100 000 tokens) gracias a su motor Claude Code; posibilita proyectos de 30 horas
Precio (API)	US$ 3 por millón de tokens de entrada y US$ 15 por millón de tokens de salida
Benchmarks destacados	61,4 % en la prueba OSWorld (frente a 42,2 % de Sonnet 4); mejora del 30 % en SWE‑Bench
Áreas de dominio	Finanzas, derecho, medicina y ciencias naturales.
Acceso	A través de la aplicación web de Claude, la API y extensiones oficiales; es necesario un registro en la plataforma oficial (claude.ai)

Descripción de la aplicación

Claude Sonnet 4.5 es un modelo capaz de mantener conversaciones de contexto largo, razonamiento matemático y lógico, y ejecución de tareas complejas. Anthropic lo posiciona como su mejor modelo para programar; en pruebas internas, el modelo creó aplicaciones de producción y realizó operaciones administrativas como configurar bases de datos, adquirir dominios y ejecutar auditorías SOC 2 en un periodo continuo de 30 horas. La actualización integra un sistema de puntos de control y una extensión nativa para VS Code, permitiendo dividir proyectos extensos en segmentos y retomar ejecuciones sin reiniciar los procesos. También incorpora un ejecutor de código y capacidad para crear archivos directamente dentro de la conversación, así como una extensión para Chrome que lee y navega páginas web de forma autónoma.

El modelo destaca por su alineación y seguridad: según los portavoces de Anthropic, se reducen las tasas de respuestas engañosas, la “sicofancia” y la susceptibilidad a ataques de inyección de instrucciones. Los informes de la compañía sobre Haiku 4.5 muestran que con protecciones apropiadas se negaron el 99,2 % de solicitudes dañinas y se asistió el 87,7 % de tareas legítimas; aunque estas cifras corresponden a la versión ligera, se asume que el mismo enfoque se aplica a Sonnet 4.5. Para desarrolladores, la empresa lanzó el Claude Agent SDK, que permite crear agentes personalizados con la misma infraestructura que impulsa Claude Code .

Ventajas

Rendimiento sobresaliente en codificación y tareas de larga duración: supera a Sonnet 4 y a muchos competidores en la prueba OSWorld, logrando un 61,4 % de éxito . Puede mantener sesiones de 30 horas y construir aplicaciones completas.
Infraestructura de agentes y herramientas integradas: los puntos de control, la extensión para VS Code y la ejecución de código facilitan proyectos complejos y reproducibles . La extensión para Chrome permite navegar y extraer información de sitios web.
Alineación y reducción de riesgos: la empresa destaca mejoras en la resistencia a ataques de inyección y en la disminución de respuestas sesgadas o engañosas. Los informes de transparencia de Anthropic describen el uso de datos públicos y protocolos de seguridad avanzados.
Versatilidad interdisciplinaria: su conocimiento especializado en finanzas, derecho, medicina y ciencias naturales lo hace útil para investigaciones multidisciplinarias.

Desventajas

Riesgos de autonomía y control: estudios independientes advierten que la capacidad del modelo para generar código y ejecutar operaciones durante horas puede provocar efectos catastróficos si se despliega en entornos sensibles sin un control de versiones robusto. El uso de puntos de control mitiga parte del riesgo, pero la responsabilidad final recae en el usuario humano.
Falta de transparencia total: aunque Anthropic publica reportes de seguridad, la compañía aún no ha divulgado todos los detalles del conjunto de datos y del proceso de entrenamiento para Sonnet 4.5. La normativa europea AI Act obliga a publicar resúmenes de datos de entrenamiento y evaluaciones de riesgo para modelos lanzados después de agosto de 2025; la ausencia de esa información podría dificultar su adopción en la Unión Europea.
Consumo energético: como todo modelo de gran tamaño, su ejecución puede requerir un consumo energético considerable. Aunque no existen cifras oficiales, análisis de modelos comparables estiman que modelos de última generación consumen decenas de vatios‑hora por solicitud, por lo que el impacto ambiental es un factor a considerar.
Limitaciones en conversaciones creativas: usuarios han señalado que modelos como GPT‑5 o Gemini 2.5 Pro ofrecen un estilo más creativo y empático; Sonnet 4.5 se centra en precisión y seguridad, lo que puede resultar menos “humano” en interacción.

Diferencias frente a otras inteligencias artificiales

Comparación con GPT‑5: el modelo de OpenAI combina capacidades de razonamiento y velocidad en un único sistema y se enfoca en tareas creativas y de investigación. GPT‑5 ofrece puntuaciones superiores en SWE‑Bench Verified y proporciona acceso generalizado a funciones multimodales. Sin embargo, su enfoque en proactividad y la unificación de modelos ha generado críticas por cambios en la personalidad y pérdida de control. En contraste, Claude Sonnet 4.5 prioriza la estabilidad en proyectos de codificación y ofrece herramientas como puntos de control y agentes personalizados, con una orientación más conservadora.

Comparación con Gemini 2.5 Pro (AI Mode de Google): el modo AI de Google Search utiliza el modelo Gemini 2.5 Pro, que resuelve consultas complejas, realiza búsquedas profundas y genera informes extensos. Gemini está integrado en productos de Google y ofrece experiencias multimodales, pero su enfoque principal es la búsqueda y la síntesis de información. Sonnet 4.5 se centra en la programación y la construcción de agentes, lo que lo convierte en una opción más robusta para desarrolladores que necesitan crear software desde cero.

Comparación con modelos especializados: en comparación con Perplexity o DeepSeek V3.1 —que se orientan a la búsqueda semántica y la generación de código con eficiencia— Sonnet 4.5 brinda herramientas completas de entorno de desarrollo y seguridad. Su integración con VS Code y su SDK de agentes lo diferencian como plataforma para construir agentes complejos de largo plazo.

Potencial para profesionales, académicos, investigadores, administrativos, usuarios cotidianos y egresados

El alcance de Claude Sonnet 4.5 es transversal y puede beneficiar a distintos grupos profesionales:

Desarrolladores y profesionistas de tecnología: la capacidad para generar código, ejecutar pruebas y mantener proyectos de larga duración lo convierte en un aliado para desarrolladores de software, ingenieros de datos y científicos computacionales. El SDK de agentes facilita la creación de asistentes especializados que automatizan procesos rutinarios o supervisan operaciones en sistemas empresariales.
Investigadores de ciencias sociales y humanidades: aunque la especialidad de Sonnet 4.5 radica en la codificación, su amplio conocimiento en derecho, medicina, finanzas y ciencias naturales lo hace valioso para investigar bases de datos complejas, analizar jurisprudencia o desarrollar aplicaciones de análisis de datos. Para comunicólogos y expertos en comunicación digital, Sonnet 4.5 puede asistir en la automatización de flujos de trabajo, procesamiento de grandes volúmenes de datos textuales y análisis de audiencias, permitiendo explorar temas como la cibercultura y la ética de la IA a partir de evidencia cuantitativa.
Profesionales de negocios y administración: la capacidad de ejecutar tareas administrativas —como gestionar dominios, bases de datos y auditorías de seguridad — convierte a Sonnet 4.5 en un asistente para áreas de gestión de proyectos, compliance y gobierno corporativo. Su precisión y control de versiones ayudan a reducir errores y a aumentar la eficiencia en procesos administrativos y financieros.
Académicos y estudiantes de todas las disciplinas: el acceso a contextos largos y la posibilidad de crear documentos o códigos extensos favorece la preparación de materiales de investigación, tesis o artículos técnicos. Las funciones de codificación también permiten desarrollar herramientas personalizadas para análisis de datos o visualización.
Usuarios cotidianos y egresados: para quienes no son especialistas en tecnología, Sonnet 4.5 puede ofrecer asistencia en tareas como automatización de hojas de cálculo, generación de informes o planificación de proyectos personales. No obstante, se recomienda un uso responsable, ya que la autonomía del modelo exige supervisión para evitar resultados no deseados.

Índice de valoración del Observatorio

La siguiente tabla evalúa Claude Sonnet 4.5 a partir de criterios de usabilidad, normatividad, ética y transparencia, y valoración de usuarios e influencers, para ofrecer una calificación integral.

Criterio	Descripción	Puntuación (0–10)
Usabilidad y rendimiento	Alto rendimiento en codificación, contextos largos y agentes; integración con herramientas de desarrollo	9
Cumplimiento normativo y transparencia	Publica informes de seguridad y se adhiere a protocolos de reducción de riesgos; sin embargo, aún no divulga un resumen completo de datos de entrenamiento, lo que afecta la transparencia y cumplimiento futuro del AI Act	6
Consideraciones éticas y legales	Implementa medidas para evitar respuestas dañinas y reduce la propensión a engañar; la autonomía prolongada conlleva riesgos de uso indebido y requiere supervisión humana	7
Valoración de usuarios, influencers y expertos	Desarrolladores y empresas elogian su capacidad para tareas de largo alcance y su fiabilidad; su sesgo de seguridad puede percibirse como falta de empatía comparada con modelos más creativos. La comunidad académica valora su potencial interdisciplinario, aunque se cuestiona la falta de transparencia.	8

Índice de valoración global: 7,5/10. La puntuación refleja el equilibrio entre un rendimiento técnico excepcional y la necesidad de mayor transparencia y supervisión ética.

Conclusión

Claude Sonnet 4.5 representa un avance significativo en la generación de código y la construcción de agentes autónomos. Su capacidad para sostener proyectos de larga duración, junto con herramientas como puntos de control y ejecución de código, lo posiciona como un aliado robusto para desarrolladores y organizaciones que demandan soluciones complejas. No obstante, desde la perspectiva de la ciudadanía digital y de la ética de la comunicación, es fundamental mantener un control humano riguroso y exigir transparencia sobre los datos de entrenamiento y el impacto ambiental. Como señala la literatura sobre la cibercultura, la incorporación de tecnologías emergentes debe basarse en la dignidad de la persona y en el principio de corresponsabilidad, evitando la dependencia ciega y garantizando un uso responsable.

Para explorar y probar Claude Sonnet 4.5, puedes visitar el sitio oficial de Anthropic en https://claude.ai/. Se recomienda acceder siempre a enlaces oficiales y evitar portales no verificados, en concordancia con los principios de seguridad y confianza digital de la Universidad Anáhuac México.

THE DAILY PULSE