Claude Sonnet 5 출시
요약
Claude Sonnet 5가 발표됐다.
에이전트(자율적 계획·도구 사용) 성능을 크게 개선해 이전 Sonnet 4.6보다 높은 에이전시를 보여주며, Opus 4.8에 근접한 성능을 더 낮은 가격에 제공한다.
안전성 평가에서는 4.6보다 전반적으로 개선됐으나 Opus 4.8·Mythos보다는 일부 평가에서 열세를 보였다.
오늘부터 모든 요금제에서 이용 가능하며, 출시 기한까지(8월 31일) 인풋/아웃풋 토큰 요금 할인 프로모션을 적용한다.
주요 내용
성능 및 포지셔닝
- Sonnet 5는 툴 사용, 코딩, 추론 등 에이전트 성능이 Sonnet 4.6보다 실질적으로 개선됐다.
- Opus 4.8보다 정확도는 낮지만 가격 대비 성능이 높은 선택지를 제공한다는 점을 강조한다.
안전성 평가
- 자동화된 행동 감사에서 Sonnet 5는 Sonnet 4.6보다 낮은 비정렬(undesirable) 행위율을 보였다.
- Opus 4.8·Mythos Preview에 비해 일부 평가에서 더 높은 비정렬 행동률을 기록했다.
- 사이버 보안 관련 능력은 의도적으로 강화하지 않았고, Opus 계열보다 취약(실제 익스플로잇 개발 능력은 낮음)해 사이버 보호 장치가 기본으로 활성화된다.
가용성·가격
- 모든 플랜(Free, Pro 기본 모델)에서 사용 가능. Claude Code 및 Claude Platform에서도 이용 가능.
- 출시 프로모션: 인풋 $2/백만토큰, 아웃풋 $10/백만토큰(8월 31일까지). 이후 표준 요금은 인풋 $3/백만토큰, 아웃풋 $15/백만토큰으로 변경된다.
- Opus 4.8의 가격(참고): 인풋 $5/백만토큰, 아웃풋 $25/백만토큰.
개발자 사용성
- claude-sonnet-5 API로 접근 가능하며, 높은 노력 수준(effort level)에 따른 비용-성능 곡선을 조정해 사용할 수 있다.
- 토크나이저 변경으로 동일 입력이 대체로 1.0–1.35배 토큰을 소모할 수 있어 요금 산정에 참고해야 한다.
현장 피드백
- 초기 파트너들은 Sonnet 5가 복합 작업을 끝까지 수행하고 자체 검증(출력 점검)을 하는 등 에이전트 역량이 향상됐다고 보고했다.
AI와 함께 작성한 글이에요.
0
댓글 0
아직 댓글이 없어요. 첫 댓글을 남겨보세요.
로그인하고 대화에 참여해보세요.