Início Tecnologia Anthropic lança Claude Sonnet 4.6: Desempenho de referência, como experimentar

Anthropic lança Claude Sonnet 4.6: Desempenho de referência, como experimentar

25
0
Anthropic lança Claude Sonnet 4.6: Desempenho de referência, como experimentar

A Anthropic acaba de lançar seu mais recente Large Language Model (LLM), Claude Sonnett 4.6. O lançamento de terça-feira segue rapidamente o lançamento do Claude Opus 4.6, o modelo premium de IA da empresa, em 5 de fevereiro.

De acordo com a Anthropic, “Claude Sonnet 4.6 é nosso modelo Sonnet mais capaz até agora”. A empresa diz que o Sonnet 4.6 tem uma janela de contexto de 1 milhão de tokens em beta. Crucialmente, a Anthropic relata que o Sonnet 4.6 teve um bom desempenho em testes internos de segurança, mostrando uma baixa tendência a alucinar e a se envolver em bajulação.

“O Sonnet 4.6 traz habilidades de codificação muito aprimoradas para mais usuários”, disse Anthropic, referindo-se à popularidade de Claude entre os desenvolvedores que usam IA para codificar.

Se você deseja usar o modelo de IA mais recente da Anthropic, a empresa tornou isso muito fácil. Veja como acessar a Cláusula Soneto 4.6.

Como usar Claude Soneto 4.6

Para usuários gratuitos e Pro, Claude Sonnett 4.6 já está disponível como modelo padrão em Claude.ai e Claude Cowork. A Anthropic também lançou o modelo por meio de sua API e de todas as principais plataformas de nuvem.

Velocidade da luz mashável

Os usuários gratuitos terão taxas de uso limitadas que dependem da demanda atual. Os limites são redefinidos a cada cinco horas. Para quem precisa de limites maiores, o Claude Sonnet 4.6 custa o mesmo preço do modelo anterior. O plano Claude Pro custa US$ 20 por mês ou US$ 17 por mês se pago anualmente. Se passar pela API, Claude Sonnett 4.6 começa com US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída.

Desempenho de referência de Claude Sonnet 4.6

De acordo com os testes de benchmark da Anthropic, Claude Sonnet 4.6 é o modelo mais poderoso da empresa para análise financeira de agentes e tarefas de escritório, superando concorrentes como o Gemini 3 Pro do Google e o GPT 5.2 da OpenAI.

Nessas tarefas, Claude Sonnet 4.6 também supera o próprio Opus 4.6 da Anthropic, o modelo de IA mais poderoso da Anthropic.

Em seu anúncio de lançamento, a Anthropic disse que muitos desenvolvedores com acesso antecipado ao Claude Sonnet 4.6 preferiram o modelo – não apenas ao seu antecessor, Claude Sonnet 4.5, mas também ao Claude Opus 4.5. De acordo com a placa do sistema Sonnet 4.6, o novo modelo melhora em benchmarks importantes como o Último Exame da Humanidade, embora Claude Opus 4.6 tenha pontuado mais alto.

Desempenho de referência

  • Diamante GPQA: 89,9 por cento

  • ARC-AGI-2: 58,3 por cento

  • MMMLU: 89,3 por cento

  • Banco SWE verificado: 79,6 por cento

  • HLE (Último Exame da Humanidade): Com ferramentas 49,0 por cento, sem ferramentas 33,2 por cento

A seguradora Pace, movida a IA, disse à VentureBeat que o Sonnet 4.6 obteve a melhor pontuação de qualquer modelo Claude em seu complexo benchmark de uso de computador para seguros.

Esses resultados são notáveis, pois os modelos de Claude Opus são geralmente os mais inteligentes e preferíveis para raciocínios complexos.

Claude Sonnet 4.6 não é apenas mais poderoso que alguns modelos Opus, mas também mais acessível. Como mencionado anteriormente, o Claude Sonnet 4.6 custa US$ 3/US$ 15, enquanto as taxas do Opus 4.6 custam US$ 5/US$ 25.

Tópicos
Inteligência artificial

Fuente