🤖

Actualización del modelo Sonet 3.7 de Antropic

Mar 9, 2025

Actualización del Modelo Sonet 3.7 de Antropic

Introducción

  • Antropic lanza la versión 3.7 de su modelo Sonet, avanzando hacia modelos razonadores.
  • Implementa diferencias significativas respecto a otros modelos de la industria.
  • Se prepara para la próxima fase de agentes autónomos.

Modelos de Antropic

  • Catálogo de modelos:
    • Haiku: Modelo más pequeño.
    • Sonet: Modelo intermedio.
    • Opus: Modelo más grande.
  • La comunidad ha favorecido al modelo Sonet desde la versión 3.5.

Características del Modelo Sonet 3.7

  • Razonador: Utiliza tiempo de computación durante la inferencia para mejorar respuestas.
  • Test Time Compute: Proceso en el que el modelo "piensa" más para mejorar resultados.
  • Modo Thinking: Dos configuraciones: normal y extendida.
  • Antropic busca un enfoque unificado, usando un solo modelo tanto para respuestas rápidas como reflexivas.

Comparativa y Rendimiento

  • Modelo Sonet 3.7 frente a otros modelos de la industria.
  • Mejora en tareas matemáticas y preguntas de razonamiento.
  • Benchmark S Bench Verified: Mide capacidades agentic; Sonet 3.7 muestra un rendimiento destacable.

Proyecto Cloud Code

  • Herramienta experimental para tareas de ingeniería de software en repositorios de código.
  • Permite refactorizaciones, creación de nuevo código, evaluaciones de tests, etc.

Pruebas y Resultados

  • Visualizador de Redes Neuronales:
    • Sonet 3.5 mostró buenos resultados frente a otros modelos en pruebas de razonamiento.
    • Pruebas de Programación:
      • Cloud Sonet 3.7 ofrece resultados estéticamente completos pero con fallas en funcionalidad.
      • Comparativa con O3 Mini High, Grock 3, Dips R1.

Conclusión

  • Sonet 3.7 es un modelo competitivo en una industria con creciente competencia.
  • Se espera la próxima actualización de OpenAI, GPT 4.5.
  • Antropic sigue siendo un fuerte competidor en el campo de la IA, especialmente en tareas agentic y de programación.

Recomendación

  • Probar los modelos personalmente para determinar su efectividad en casos de uso específicos.