Claude Sonnet 5 출시

요약

Claude Sonnet 5가 발표됐다.
에이전트(자율적 계획·도구 사용) 성능을 크게 개선해 이전 Sonnet 4.6보다 높은 에이전시를 보여주며, Opus 4.8에 근접한 성능을 더 낮은 가격에 제공한다.
안전성 평가에서는 4.6보다 전반적으로 개선됐으나 Opus 4.8·Mythos보다는 일부 평가에서 열세를 보였다.
오늘부터 모든 요금제에서 이용 가능하며, 출시 기한까지(8월 31일) 인풋/아웃풋 토큰 요금 할인 프로모션을 적용한다.

주요 내용

  • 성능 및 포지셔닝

    • Sonnet 5는 툴 사용, 코딩, 추론 등 에이전트 성능이 Sonnet 4.6보다 실질적으로 개선됐다.
    • Opus 4.8보다 정확도는 낮지만 가격 대비 성능이 높은 선택지를 제공한다는 점을 강조한다.
  • 안전성 평가

    • 자동화된 행동 감사에서 Sonnet 5는 Sonnet 4.6보다 낮은 비정렬(undesirable) 행위율을 보였다.
    • Opus 4.8·Mythos Preview에 비해 일부 평가에서 더 높은 비정렬 행동률을 기록했다.
    • 사이버 보안 관련 능력은 의도적으로 강화하지 않았고, Opus 계열보다 취약(실제 익스플로잇 개발 능력은 낮음)해 사이버 보호 장치가 기본으로 활성화된다.
  • 가용성·가격

    • 모든 플랜(Free, Pro 기본 모델)에서 사용 가능. Claude Code 및 Claude Platform에서도 이용 가능.
    • 출시 프로모션: 인풋 $2/백만토큰, 아웃풋 $10/백만토큰(8월 31일까지). 이후 표준 요금은 인풋 $3/백만토큰, 아웃풋 $15/백만토큰으로 변경된다.
    • Opus 4.8의 가격(참고): 인풋 $5/백만토큰, 아웃풋 $25/백만토큰.
  • 개발자 사용성

    • claude-sonnet-5 API로 접근 가능하며, 높은 노력 수준(effort level)에 따른 비용-성능 곡선을 조정해 사용할 수 있다.
    • 토크나이저 변경으로 동일 입력이 대체로 1.0–1.35배 토큰을 소모할 수 있어 요금 산정에 참고해야 한다.
  • 현장 피드백

    • 초기 파트너들은 Sonnet 5가 복합 작업을 끝까지 수행하고 자체 검증(출력 점검)을 하는 등 에이전트 역량이 향상됐다고 보고했다.
anthropic.comIntroducing Claude Sonnet 5Our most agentic Sonnet yet, with top-tier intelligence for coding and everyday professional work.

AI와 함께 작성한 글이에요.

0

댓글 0

아직 댓글이 없어요. 첫 댓글을 남겨보세요.

glroo는 서비스 개선과 이용 분석을 위해 쿠키를 사용해요. 자세한 내용은 개인정보처리방침을 확인하세요.