Tag

#Safety

ニュース

重要度: 中 OpenAI Safety / Youth / Policy

Advancing youth safety and opportunity through global leadership

2026-06-02 / 関連製品: ChatGPT

短い要約
OpenAIが若年層のAI安全性に関する国際的な取り組みを提案しました。専用のAI Safety Instituteを通じて、年齢に適した安全なAI利用の標準化を進める内容です。
詳細
新機能ではなく、政策・安全性領域の発表です。若者がAIを学習、言語練習、就職準備、創造活動に使う機会を広げつつ、発達段階に応じた安全性を確保する必要があるという主張です。教育や未成年向けChatGPT利用、学校導入、保護者・政策当局の関心に関係します。
公式ソースを読む
重要度: 高 OpenAI Safety / Evaluation / Governance

Third-party evaluations for OpenAI’s frontier models

2026-05-29 / 関連製品: OpenAI frontier models

短い要約
OpenAIがフロンティアモデルに対する第三者評価の取り組みを紹介しました。自社評価だけでなく、外部専門家・組織による安全性や能力評価を重視する内容です。
詳細
これは新機能ではありませんが、将来モデルの公開条件や安全性レビューに関わります。高性能モデルでは、サイバー、バイオ、欺瞞、説得、モデル自律性などのリスク評価が重要になります。第三者評価を入れることで、社内だけでは見落としやすいリスクを検出しやすくする狙いです。OpenAIのガバナンス標準と合わせて、モデル公開前のチェックがより制度化されていく流れです。
公式ソースを読む
重要度: 高 OpenAI Governance / Safety / Frontier Models

Advancing Frontier AI Governance

2026-05-28 / 関連製品: OpenAI frontier models, ChatGPT, OpenAI API

短い要約
OpenAIが、フロンティアAIモデルの開発・評価・展開に関する社内ガバナンス標準を公開しました。モデルの能力評価、安全性レビュー、展開判断をより体系化する内容です。
詳細
新機能の発表ではなく、今後の高性能モデルをどう評価し、どの条件で公開するかに関わる方針です。OpenAIは、モデル能力が高まるほど、リスク評価・外部専門家との協力・段階的展開・監視が重要になると位置づけています。ChatGPTやAPIの利用者にすぐ使える機能が増える話ではありませんが、将来モデルの提供速度、制限、公開条件に影響します。AnthropicのResponsible Scaling Policyに近い領域の動きとして見ておく価値があります。
公式ソースを読む
重要度: 中 OpenAI Global Affairs / Safety / Trust

Election information and safeguards in 2026

2026-05-27 / 関連製品: ChatGPT, Codex, OpenAI API

短い要約
OpenAIが2026年の選挙に向けた情報提供・安全対策を発表しました。ChatGPTでの投票情報案内、APとの選挙結果連携、SynthID/C2PAによるAI生成画像の透明性向上などが含まれます。
詳細
ユーザーがChatGPTで投票方法・投票所・締切・選挙結果などを尋ねた際、信頼できる情報源へ誘導する方針です。米国とブラジルでは、選挙夜にAPからライブ投票結果を提供する予定です。Codex SecurityやTrusted Access for Cyberを選挙インフラ防衛に活用する方向も示されています。画像生成では、ChatGPT、Codex、OpenAI API由来の画像に対し、SynthID透かしとC2PAメタデータを組み合わせる方針です。無料/有料機能というより、政治・選挙・生成コンテンツの安全性に関する全体方針です。
公式ソースを読む
重要度: 高 Anthropic Research / Safety / Evaluation

Anthropic’s Frontier Red Teaming Protocol

2026-05-26 / 関連製品: Claude, Anthropic frontier models

短い要約
Anthropicが、フロンティアAIモデルの危険能力を評価するための **Frontier Red Teaming Protocol** を公開しました。モデルがサイバー、生物、化学、核、AI研究開発などの高リスク領域でどの程度危険な支援能力を持つかを測る枠組みです。
詳細
これはClaudeなどの高性能モデルを安全に展開するための評価手順で、AnthropicのResponsible Scaling Policyと接続する重要な研究更新です。評価対象には、悪用可能な専門知識、実行可能な手順の生成、攻撃・開発支援能力などが含まれます。単なるベンチマークではなく、専門家によるレッドチーミングと実践的なタスク評価を組み合わせる設計です。開発者や企業ユーザーに直接新機能を提供する発表ではありませんが、今後のClaudeモデルの提供条件、安全制限、公開タイミングに影響する可能性があります。AI安全性・ガバナンス観点では重要度が高いです。
公式ソースを読む