La presentación del modelo Claude Sonnet 4.5 de Anthropic marca un avance significativo - DAVID RAUDALES DRUK
Mantenganse informado de las noticias de negocios internacionales. Contacto
Posts

La presentación del modelo Claude Sonnet 4.5 de Anthropic marca un avance significativo





La presentación del modelo Claude Sonnet 4.5 de Anthropic marca un avance significativo en la inteligencia artificial (IA) dirigida a clientes empresariales y usuarios avanzados, con un enfoque particular en las capacidades de codificación y el uso de agentes de IA.

Características Clave de Claude Sonnet 4.5

Anthropic ha posicionado a Claude Sonnet 4.5 como su modelo más potente hasta la fecha, destacando las siguientes mejoras:

Habilidades de Codificación y Agentes

  • Mejor modelo de codificación del mundo: La compañía lo presenta como el modelo líder en el mundo para codificación, lo que se refleja en un puntaje del 77.2% en SWE-bench Verified, una evaluación que mide la habilidad en tareas de codificación de software en entornos reales.

  • Codificación Autónoma Extendida: En pruebas internas, el modelo demostró la capacidad de mantener el código de un chatbot de IA de forma autónoma durante 30 horas, un aumento notable en comparación con las 7 horas de su predecesor (Claude Opus 4).

  • Creación de Agentes Complejos: Es considerado el modelo más fuerte para construir agentes de IA complejos, que pueden operar software y completar trabajos de varios pasos en nombre de los humanos.

  • Herramientas para Desarrolladores (Claude Code): Se lanzaron actualizaciones importantes, incluyendo:

    • "Checkpoints" (puntos de control) para guardar el progreso y revertir a estados anteriores del código.

    • Una extensión nativa para Visual Studio Code (VS Code), que lleva el modelo directamente al entorno de desarrollo.

    • En la API, se añadió una herramienta de edición de contexto y memoria para gestionar tareas de larga duración sin alcanzar los límites de contexto.

Razonamiento y Uso de Computadoras

  • Mejor uso de ordenadores: Claude Sonnet 4.5 ha mejorado sustancialmente en la capacidad de interactuar y operar sistemas informáticos, alcanzando un 61.4% en OSWorld, un benchmark que evalúa modelos de IA en tareas informáticas del mundo real.

  • Rendimiento en Campos Especializados: Muestra mejoras significativas en finanzas y razonamiento científico. Expertos en derecho, medicina y STEM (ciencia, tecnología, ingeniería y matemáticas) notaron un conocimiento y razonamiento dramáticamente mejores en comparación con modelos anteriores.

  • Productividad en la Suite de Oficina: El modelo ahora permite la ejecución de código y la creación de archivos (hojas de cálculo, diapositivas, documentos) directamente dentro de la conversación en las aplicaciones de Claude.


Integración con Microsoft 365 Copilot

Microsoft ha anunciado la integración de los modelos de Anthropic, incluyendo Claude Sonnet 4.5, en su ecosistema de Microsoft 365 Copilot, lo que representa una diversificación en su estrategia de IA más allá de su socio de mucho tiempo, OpenAI.

  • Diversificación Estratégica: Esta integración forma parte de la estrategia de "foso de múltiples modelos" de Microsoft, buscando reducir la dependencia de un solo proveedor y priorizando el rendimiento para los clientes.

  • Funciones Específicas: La integración comenzó a implementarse en áreas como Researcher dentro de Copilot y Copilot Studio (para la creación de agentes personalizados).

    • Se anunciaron nuevas funciones impulsadas por Anthropic como el "Modo Agente" en Excel y Word, y un "Agente de Office" en el chat de Copilot.

  • Ventaja de Rendimiento: Pruebas internas de Microsoft sugieren que los modelos de Claude ofrecen ventajas de rendimiento en tareas de productividad, como la automatización de funciones financieras en Excel y la creación de presentaciones en PowerPoint.


Estrategia de Anthropic

Anthropic, fundada por exejecutivos de OpenAI y respaldada por Alphabet y Amazon.com, se enfoca en el entorno laboral y clientes empresariales en lugar del consumo masivo.

  • Seguridad y Alineamiento: La empresa promueve a Claude para su uso en entornos regulados gracias a medidas de seguridad que, según afirman, reducen los resultados riesgosos y mejoran el alineamiento del modelo.

  • Disponibilidad: Claude Sonnet 4.5 está disponible a través de la Plataforma para Desarrolladores de Claude, Amazon Bedrock y Vertex AI de Google Cloud.

  • Modelo de Negocio: La compañía se centra en industrias reguladas y equipos que necesitan que los modelos funcionen a través de múltiples herramientas de software, aprovechando las capacidades de codificación y análisis de datos de Claude.

 

Post a Comment

-->