#Evaluation AIニュース

重要度: 高 OpenAI Safety / Evaluation / Governance

Third-party evaluations for OpenAI’s frontier models

2026-05-29 / 関連製品: OpenAI frontier models

短い要約

OpenAIがフロンティアモデルに対する第三者評価の取り組みを紹介しました。自社評価だけでなく、外部専門家・組織による安全性や能力評価を重視する内容です。

詳細

これは新機能ではありませんが、将来モデルの公開条件や安全性レビューに関わります。高性能モデルでは、サイバー、バイオ、欺瞞、説得、モデル自律性などのリスク評価が重要になります。第三者評価を入れることで、社内だけでは見落としやすいリスクを検出しやすくする狙いです。OpenAIのガバナンス標準と合わせて、モデル公開前のチェックがより制度化されていく流れです。

#OpenAI #OpenAI frontier models #Safety #Evaluation #Governance

公式ソースを読む

重要度: 高 Anthropic Research / Safety / Evaluation

Anthropic’s Frontier Red Teaming Protocol

2026-05-26 / 関連製品: Claude, Anthropic frontier models

短い要約

Anthropicが、フロンティアAIモデルの危険能力を評価するための **Frontier Red Teaming Protocol** を公開しました。モデルがサイバー、生物、化学、核、AI研究開発などの高リスク領域でどの程度危険な支援能力を持つかを測る枠組みです。

詳細

これはClaudeなどの高性能モデルを安全に展開するための評価手順で、AnthropicのResponsible Scaling Policyと接続する重要な研究更新です。評価対象には、悪用可能な専門知識、実行可能な手順の生成、攻撃・開発支援能力などが含まれます。単なるベンチマークではなく、専門家によるレッドチーミングと実践的なタスク評価を組み合わせる設計です。開発者や企業ユーザーに直接新機能を提供する発表ではありませんが、今後のClaudeモデルの提供条件、安全制限、公開タイミングに影響する可能性があります。AI安全性・ガバナンス観点では重要度が高いです。

#Anthropic #Claude #Anthropic frontier models #Research #Safety #Evaluation

公式ソースを読む