An update on our election safeguards
Summary
Anthropic은 미국 중간선거 및 기타 전 세계 주요 선거를 앞두고 Claude의 선거 관련 정보 제공의 정확성과 공정성을 높이기 위한 노력을 발표했습니다.
Key Points
- Claude는 정치적 중립성을 유지하고 다양한 정치적 관점을 동등한 깊이와 분석적 엄격함으로 다루도록 훈련됩니다.
- 모델은 캐릭터 훈련과 시스템 프롬프트를 통해 정치적 중립성 원칙을 강화합니다.
- Opus 4.7과 Sonnet 4.6은 정치적 스펙트럼 전반에 걸친 프롬프트에 대해 각각 95%, 96%의 공정성 점수를 기록했습니다.
- 평가 방법론과 오픈 소스 데이터셋을 공개하여 재현 및 반복을 장려하고 있습니다.
Notable Quotes & Details
Notable Data / Quotes
- Opus 4.7 and Sonnet 4.6 scored 95% and 96%
Intended Audience
AI 연구자, 정책 입안자, 일반 독자