OpenAI、Anthropic、Google、Microsoftの公式発表をAIが毎日自動で要約し、要点、変更点、影響を整理します。
ニュース
OpenAIは、脆弱性発見から修正自動化までを支援するDaybreakの拡張を発表しました。
Codex Security、GPT-5.5-Cyber、Daybreak Cyber Partner Program、Patch the Planetを組み合わせ、認可された防御者向けのサイバーAI活用を広げます。
Codex Security pluginは、深いスキャン、最近の変更レビュー、既存 findings のトリアージ、攻撃経路分析、脅威モデル作成、検証証跡、修正パッチ生成までを支援する防御ワークフローとして更新されました。
Codex Security cloudは研究プレビュー以降、3万超のコードベースと3,000万超のコミットをスキャンし、手動で7万件超、自動で50万件超の修正済み判定が行われたとされています。
GPT-5.5-Cyberは、認可された高度な防御作業向けの限定提供モデルとして更新され、CyberGymで85.6%、ExploitGymで39.5%、SEC-bench Proで69.8%のスコアが示されました。
Daybreak Cyber Partner Programでは、セキュリティ製品・サービス事業者がGPT-5.5とTrusted Access for Cyberを自社サービスに組み込む形で利用できます。
OpenAIは日本を含む複数国・機関とのTrusted Access for Cyber連携にも触れており、政府・重要インフラ・企業の防御用途を重視しています。
一般ユーザー向け無料/有料機能ではなく、認可された防御者、企業、セキュリティパートナー、開発者向けの限定・管理された提供です。APIの一般提供や料金は記事内では示されていません。
Patch the Planet: a Daybreak initiative to support open source maintainers
OpenAIはTrail of Bitsと共同で、重要なオープンソースソフトウェアの脆弱性修正を支援するPatch the Planetを発表しました。
AI支援の脆弱性探索に人間の専門レビューを組み合わせ、発見だけでなく検証、パッチ、テスト、開示までを支援します。
Patch the PlanetはDaybreakの取り組みで、Trail of Bitsに加えHackerOneとCalifも脆弱性トリアージ、協調開示、集中的な発見作業に関与します。
初期参加プロジェクトにはcURL、NATS Server、pyca/cryptography、Sigstore、aiohttp、Go、freenginx、Python、python.orgが含まれます。
参加プロジェクトにはChatGPT Pro、条件付きのCodex Securityアクセス、APIクレジットが提供され、保守作業、リリースワークフロー、開発自動化に使えます。
Trail of Bitsは19のオープンソースプロジェクトでCodexとGPT-5.5-Cyberを使い、数百件のセキュリティ課題を特定し、すでに数十件のパッチをマージしたとされています。
ファジングラボ構築、過去CVEからの派生脆弱性探索、差分テスト、仕様ベーステスト、脅威モデル、重複排除、誤検知フィルタリングなど、再利用可能なセキュリティ基盤も作られています。
保守者がそのまま大量のAI生成レポートを受け取るのではなく、専門家が再現、重複除去、重大度確認、パッチ作成を行う設計です。無料/有料の一般製品更新ではなく、対象OSS保守者向け支援プログラムです。
Build Cross-Language Multi-Agent Team with Google’s Agent Development Kit and A2A
Google Developers Blogは、PythonのGemini抽出エージェントとGoのコンプライアンス検証エージェントをA2Aで連携する実装例を公開しました。
Google ADKのRemoteA2aAgentを使い、異なる言語・実装のエージェントを一つのパイプラインとして扱う方法を示しています。
記事では、契約書から重要項目を抽出するPythonエージェントと、企業ポリシーに照らして検証するGoエージェントを連携するContract Compliance Multi-Agent Pipelineが例示されています。
A2AはAgent Card、JSON-RPC、Taskライフサイクルを使い、実装言語やフレームワークが異なるエージェント同士をHTTP越しに接続します。
Google ADKのRemoteA2aAgentにより、遠隔のA2A対応サービスをローカルのサブエージェントのように扱えます。
Gemini 3.5 Flashは契約項目の抽出側で使われ、Go側は決定的なポリシー検証を行うため、LLMの非決定性と監査要件を分離できます。
障害時には手動レビュー状態へ遷移するフェイルセーフや、Agent Cardの公開、共有状態、ライブのハンドオフ確認など、本番向けマルチエージェント設計の具体例が含まれています。
サンプルはオープンソースアプリとして提供されます。Gemini APIの破壊的変更、料金、提供地域の更新ではありません。
Measuring What Matters with Jules
Google Developers Blogは、Julesを含むプロアクティブなAIコーディングエージェントを評価するための研究的取り組みを紹介しました。
SWE-Benchのようなタスク完了評価ではなく、目標に対して何を重要と判断して通知するかを測る「insight policy」が焦点です。
記事では、AIコーディングエージェントが単発タスクを解くだけでなく、コードベースを探索し、リスクや診断的洞察を能動的に提示する段階へ移っていると説明されています。
Google Labsの研究では、実際のバグ修正履歴を使い、時間的近接性と意味的類似性から、複数のバグが示す上位目標を推定する評価セットを作っています。
初期評価では、705件のバグと1,178件のCLを使い、修正前の状態に戻したコードベースをエージェントに探索させ、予測した洞察をLLMで1〜5点評価しました。
1回の探索では平均4.5/5の関連性が出た一方、複雑な問題では探索予算を2回から3回へ増やすことでHit@5が33%から57%へ改善したとされています。
Julesや将来のプロアクティブな開発エージェントでは、いつ通知し、いつ黙るべきかを評価することが重要になります。
製品の一般提供条件、無料/有料、日本での利用可否、APIの破壊的変更はこの記事では示されていません。
Codex-maxxing for long-running work
OpenAIは、Codexを長期プロジェクトの永続的な作業空間として使うためのホワイトペーパーを公開しました。
単発プロンプトではなく、複雑な目標を検証可能なステップへ分解し、複数ワークストリームの文脈を保つ使い方が中心です。
この公開は新機能発表というより、Codexを長時間・長期作業に使うための実務ガイドです。
Jason Liuによるホワイトペーパーでは、Codexを文脈を保持する作業空間として扱い、複雑なワークフローを管理し、長期プロジェクトの進捗を維持する戦略が説明されています。
大きな目標を検証可能なステップへ分解すること、作業ストリーム間の継続性を保つこと、人間が監督すべき場面とCodexへ実行委任すべき場面を見極めることが主題です。
企業・開発者がCodexを単なるコード補完ではなく、継続的なプロジェクト実行支援として使う際の設計指針になります。
提供条件、無料/有料、日本での利用条件、APIの破壊的変更は記事内では示されていません。
Large pastes are now handled as attachments for more plans
ChatGPTで長文を貼り付けた場合、自動的に添付ファイルとして扱う挙動がFreeとGoにも拡大されました。
Plus、Pro、Businessでは既に利用可能で、添付化のしきい値も5,000文字超から10,000文字超へ引き上げられました。
ChatGPT FreeとGoユーザーは、composerへ1万文字を超えるテキストを貼り付けると、本文欄へ直接挿入されず自動的に添付ファイルとして扱われます。
これにより入力欄が長文で埋まることを防ぎ、長い貼り付けが会話のコンテキストを過度に消費する問題を軽減します。
添付化された内容は、必要に応じて「Show in text field」から通常の直接貼り付けに戻せます。
Plus、Pro、Businessでは既にこの仕組みが利用可能で、従来は5,000文字超で添付扱いでしたが、今回しきい値が1万文字超に引き上げられました。
個人利用・業務利用どちらにも関係するUX改善ですが、API変更、移行期限、破壊的変更はありません。日本での個別提供条件は記載されていません。
Samsung Electronics brings ChatGPT and Codex to employees
OpenAIは、Samsung ElectronicsがChatGPT EnterpriseとCodexを従業員へ展開すると発表しました。
韓国のSamsung Electronics全社員と、世界のDevice eXperience部門従業員が対象で、OpenAIにとって最大級の企業導入の一つです。
対象はSamsung Electronicsの韓国全社員、および世界のDevice eXperience(DX)部門の全従業員です。
用途はR&D、製造、マーケティング、製品開発、社内業務、ソフトウェア開発など広範囲に及びます。
ChatGPT Enterpriseは情報検索、分析、文書作成、アイデア開発、データ解釈を支援し、企業向けのデータ保護、ユーザー/アクセス管理、セキュリティ管理を含むと説明されています。
Codexはコード作成、レビュー、デバッグだけでなく、非技術部門が内部ツール、Webサイト、自動化ワークフローを作る用途にも使われます。
OpenAIによるとCodexの週次アクティブユーザーは500万人超で、韓国での週次アクティブユーザーは2026年2月1日以降約800%増加しています。
個人向けの無料/有料プラン更新ではなく、法人向け導入事例です。日本での提供条件やAPIの破壊的変更は記載されていません。
ChatGPT app experience updates
OpenAIはChatGPTのWeb、iOS、Android体験を更新し、発音支援、World Cup関連の会話支援、接続アプリ権限、整理・共有・写真アップロードを改善しました。
一部機能は有料プラン向けで、モバイルとWebで改善内容が分かれています。
ChatGPTは60以上の言語で、単語の発音について音声とテキストで案内できるようになりました。
World Cupについて、日程、対戦、チーム、選手、国別ストーリー、予測、試合結果の意味を会話形式で確認できる導線が追加されています。
接続アプリでは、ChatGPTがアプリを使う前に常に確認する、変更前だけ確認する、重要な変更前だけ確認する、といった権限管理をSettings > Appsで選べます。
Webでは、チャットやプロジェクトのピン留め、サイドバー整理、会話共有、回答テキストからノートを作成してLibraryへ保存する操作が改善されています。
iOSではカメラと写真アップロードが高速化・安定化し、Androidでは有料プラン利用者が送信ボタン長押しで一回限りのモデル選択をできるようになりました。
Androidのcomposerにはinline mentionsと更新されたPluginsメニューも追加されています。APIの破壊的変更や移行期限は記載されていません。
Scheduled tasks in ChatGPT
OpenAIはChatGPTのscheduled tasksを更新し、リマインダー、定期実行、監視タスクを見つけやすく管理しやすくしました。
新しいScheduledページ、実行時刻の管理、Web検索や接続アプリを使った監視通知が追加されています。
ChatGPTのサイドバーから見つけられる新しいScheduledページで、アクティブなタスク、次回実行予定、停止、再開、編集、削除をまとめて扱えるようになりました。
タスクは全体として高速化・信頼性向上が行われ、特定時刻だけでなく朝・昼・夜といった幅のある時間帯でもスケジュールできます。
監視タスクはWeb検索や接続アプリの変化確認を行い、報告すべき内容がある場合だけ通知する方向に整理されています。
提供対象はPlus、Pro、Business、Enterpriseへのロールアウトで、アクティブタスク数の上限はプランごとに異なります。
タスクは1時間に1回を超える頻度では実行できず、無人タスクは一定期間使われないと自動停止される場合があります。
Pulseはscheduled tasksへ統合される形で終了予定となり、Proユーザーはこの日から14日間アクセスを継続できます。
個人利用では日次ブリーフィングやリマインダー、業務利用では定期調査や接続アプリ監視の入口が明確になります。APIの破壊的変更や移行期限は記載されていません。
How A2A is Building a World of Collaborative Agents
Google Developers Blogで、A2Aプロトコル1周年に合わせて、エージェント同士の安全な連携ユースケースが紹介されました。
生命科学向けのFoldRunはGemini Enterprise、Gemini CLI、A2A対応環境に追加できるエージェント例として示されています。
A2Aは、エージェントを単なるAPIのように扱うのではなく、意図理解、確認、タスク分担、長時間処理を行う協調相手として接続するためのプロトコルです。
記事では、企業内の専門エージェントに作業を委任し、内部データや独自ロジックを外部LLMに露出させない「安全な境界」が利点として説明されています。
FoldRunはタンパク質3D構造予測向けのエージェント型インターフェースで、AlphaFold 2、OpenFold 3、Boltz-2などを分子に応じて使い分ける例として紹介されています。
開発者はFoldRunをGemini Enterprise、Gemini CLI、または任意のA2A準拠環境に追加し、自然言語で構造予測タスクを委譲できます。
A2Aのユースケースとして、B2B取引、リアルタイムストリーミング、DevOps、通信/規制産業での安全なエージェント連携も挙げられています。
公式SDKはPythonとGoが1.0 GA、JavaはBeta、.NETはPreview、JavaScript/TypeScriptは安定版v0.3系で1.0作業中とされています。
Announcing the Agentic Resource Discovery specification
Google Developers Blogで、エージェントがツール、スキル、他エージェントを発見・検証するためのAgentic Resource Discovery仕様が発表されました。
Gemini Enterprise Agent PlatformのAgent Registryにも今後ネイティブ対応予定です。
Agentic Resource Discovery(ARD)は、Web上のAI能力を公開、発見、検証するためのオープン仕様です。
組織が自社ドメイン配下にカタログを公開し、レジストリがそれをクロール・索引化することで、エージェントが必要なMCPサーバー、A2Aエージェント、OpenAPIツールなどを見つけられるようにします。
本番利用向けには、発行元の暗号学的検証や信頼メタデータを使い、安全に接続先を確認する仕組みが説明されています。
Google CloudはGemini Enterprise Agent PlatformのAgent Registryでこの構想を支え、エージェント、スキル、MCPサーバー、ツールの検索・発見・ホスティングを提供します。
Agent Registryでは一意なURN、エージェントのegress policy、仕様の固定、Agent Identityによるtrust manifest検証なども扱うとされています。
ARD仕様自体は公開済みで、Agent Platformでのネイティブ対応は今後数か月で提供予定です。破壊的変更ではなく、新しい相互運用仕様の公開です。
A2UI + MCP Apps: Combining the best of declarative and custom agentic UIs
Google Developers Blogで、A2UIとMCP Appsを組み合わせる3つのアーキテクチャパターンが公開されました。
MCPサーバーからA2UI JSONを返す方法、A2UI内にMCP Appを埋め込む方法、MCP App内でA2UIを動かす方法が説明されています。
この更新は、エージェントがテキストだけでなくリッチなUIを返すための実装パターンを整理したものです。
A2UIはJSONでUIを宣言し、ホストアプリ側のネイティブコンポーネントで安全に描画する方式です。一方、MCP Appsはiframe内で標準Web技術を使えるため自由度が高い反面、見た目や性能、セキュリティ境界に課題があります。
Pattern 1では、MCPサーバーが `application/a2ui+json` のペイロードを返し、ホスト側がネイティブUIとして描画します。
Pattern 2では、A2UIコンポーネント内にMCP Appを安全なiframeとして包み込み、複雑な状態管理やカスタム体験を委譲します。
Pattern 3では、MCP App自体にA2UIレンダラーを含め、既存アプリや非A2UI環境に生成UIを後付けできます。
特定のGemini API変更ではなく、MCP/A2UIを使う開発者向けの実装ガイドとサンプルコード公開です。
Achieving success with AI
Microsoft公式ブログで、企業AI導入に必要な「Intelligence + Trust」の考え方が整理されました。
Microsoft 365 Copilot、GitHub Copilot、Copilot Studio、Microsoft IQ、Agent 365、Agent Factoryを、企業内データ・統制・コスト管理の基盤として位置づけています。
この記事は、個人向けCopilotではなく、組織がAIを導入・運用するためのMicrosoftの方針整理です。
Microsoftは、企業が自社の業務知識や知的財産を外部モデルに吸収されるのではなく、自社内のIQとして蓄積・活用する必要があると説明しています。
Microsoft 365 CopilotとGitHub Copilotはモデル多様性を前提にし、タスクごとにモデル性能とコストを最適化する方針です。
Microsoft IQは組織データをAIが使いやすい意味構造に変換し、Agent 365はエージェントの可視化、ガバナンス、管理、セキュリティ、コスト管理の制御面として説明されています。
Copilot CoworkはMicrosoft 365 Copilotのユーザーサブスクリプションに加えて使用量ベース課金が必要な例として挙げられています。
実務上は、企業がAIを使う際のデータ保護、モデル選択、FinOps、エージェント統制をMicrosoftスタック内で閉じて管理する方向性がより明確になりました。
Microsoft 365 Copilot release notes: June 16, 2026
Microsoft 365 Copilotの6月16日リリースノートで、Copilot ChatのClaude対応やPowerPointの生成・説明機能が追加されました。
PowerPointではFLUX.2 Flexの画像生成、図形/画像のExplain、複数SharePoint OALの組織アセット利用が含まれます。
Microsoft 365 Copilot Chatでは、AnthropicのClaudeをモデル選択肢として使えるようになり、複雑な分析、文書理解、構造化コンテンツ生成に利用できるとされています。
PowerPointではBlack Forest LabsのFLUX.2 Flexモデルが画像生成に追加され、文字やレイアウト表現の品質向上が説明されています。
PowerPointのExplain機能は、従来のテキスト、表、スライドなどから、図形や画像にも対象が広がりました。
Copilot for PowerPointは、複数のSharePoint Organizational Asset Librariesから承認済み画像を利用できるようになり、ブランド準拠の資料作成に使いやすくなります。
Microsoft EdgeではCopilot体験の見た目がMicrosoft AI系のUIに寄せられ、15Five向けCopilot connectorも追加されています。
対象はMicrosoft 365 Copilot利用組織です。個人無料版向けの更新ではなく、展開はMicrosoft 365 AppsのCurrent Channelや組織内の段階的ロールアウトに従います。
Unlocking the Power of the TPU Stack: Introducing our new Developer Hub
Google Developers Blogで、TPU Developer Hubの正式公開が発表されました。
モデル開発者向けに、TPUの設計、最適化、デバッグ、分散学習、低レイテンシ推論までをまとめたコード中心の学習・実装リソースです。
TPU Developer Hubは、Google Cloud TPUを使うモデル開発者、最適化担当、MLインフラ担当向けの公式リソースです。
内容は、TPUハードウェア、XLAなどのソフトウェアスタック、XProfによるトレース/デバッグ、並列化、Pallasカーネル、ネットワーク/セキュリティまで広く扱います。
PyTorch on TPUの移行、低レイテンシ推論、KV cache offloadingなど、実装に近いトピックも含まれます。
GoogleはこのHubを、AI支援開発ツールにも取り込みやすい「agent-ingestion friendly」なリソースとして位置づけています。
特定モデル/APIの破壊的変更ではなく、TPU活用のドキュメント・レシピ集の公開です。利用条件はGoogle Cloud TPUの利用形態に依存します。
Project Fetch: Phase two
Anthropicは、ロボット犬を使ったProject Fetchの第2フェーズを公開しました。
Claude Opus 4.7をClaude Codeで使い、人間チームが以前完了したタスクを大幅に短時間で進めたと報告しています。
Project Fetchは、非ロボティクス専門家が市販の四足歩行ロボットを使って高度なタスクを行う実験として始まりました。
第2フェーズでは、Claude Opus 4.7をClaude Codeで使い、研究者はラップトップ接続、初期プロンプト入力、コマンド承認、次タスク移行承認に限定した役割を担いました。
Anthropicによると、Opus 4.7は過去に少なくとも1つの人間チームが完了した全タスクを10倍以上高速に完了しました。
両方の人間チームが完了した4タスクでは、Claude単独の所要時間は9分35秒で、Claudeなしチームより37.7倍、Claudeありチームより18.9倍速かったとされています。
ただし、ロボット制御が解決されたわけではなく、ビーチボールを正確に動かす「fetching」部分や低レベルのアクチュエーション方策は依然として難しいと明記されています。
Gemini/Gemma系ではありませんが、物理世界AI、ロボティクス、embodied reasoningに近い研究更新として重要です。製品提供、API、料金、日本での利用条件は記載されていません。
Codex app 26.616
OpenAIはCodex app 26.616を公開し、macOS向けRecord & Replay、オートメーション履歴の一括操作、Browser Use改善などを追加しました。
Record & Replayは実演した作業フローを再利用可能なスキルに変換する機能です。
Record & Replayは、ユーザーが実演したワークフローを再利用可能なスキルとして扱うmacOS機能です。
初期提供ではEEA、UK、Switzerlandは対象外で、利用にはユーザーまたは管理者がComputer Useを有効にする必要があります。
オートメーションの実行履歴では、すべて既読にする、対象実行をアーカイブする、といった一括操作が追加されました。
SSH接続管理へのディープリンクが追加され、リモート環境管理への導線も改善されています。
Browser Useでは、表示タブのルーティングと注釈が、ドラフトのブラウザセッションがサーバーへ移動した場合も維持されるよう改善されています。
開発者・Codex利用者向けのアプリ更新で、APIの破壊的変更や移行期限は記載されていません。日本での利用条件変更は記載されていません。
Improving health intelligence in ChatGPT
OpenAIは、GPT-5.5 InstantによりChatGPTの健康・医療関連応答が改善したと発表しました。
緊急受診の必要性、追加文脈の確認、不確実性の説明、分かりやすい案内などが改善点として挙げられています。
OpenAIによると、毎週2億3000万人以上がChatGPTを健康・ウェルネス関連の質問に使っており、GPT-5.5 Instantで健康領域の応答品質を改善しました。
HealthBenchやHealthBench Professionalなどの医療評価で、GPT-5.5 Instantは最新のThinking系フロンティアモデルに近い水準に達したとされています。
5.5 InstantはChatGPTの無料ユーザーにも制限付きで提供されるため、改善は無料利用者にも関係します。
医師による評価では、赤旗症状の見落とし、紹介・受診案内、追加文脈の確認、地域医療文脈への適合などで古いモデルより失敗が少ないと説明されています。
OpenAIは60カ国、49言語、26専門分野の260人超の医師ネットワークからフィードバックを受け、70万件超の応答例をレビューしたとしています。
医療判断の代替ではなく、情報理解や受診準備を支援する位置づけです。日本での追加提供条件や料金変更は記載されていません。
New usage analytics and updated spend controls for enterprises
OpenAIは、ChatGPT Enterprise向けにクレジット利用分析と支出管理機能を更新しました。
管理者はChatGPTとCodexの利用・クレジット消費をユーザー、製品、モデル単位で把握できるようになります。
Global Admin Consoleで、ChatGPTとCodexのクレジット利用を一つの画面で確認できるようになりました。
管理者は利用量とクレジット傾向、上位利用者、ワークスペース全体の消費内訳をユーザー、製品、モデル単位で確認できます。
同じクレジット利用データは統合Cost APIからも取得でき、社内の分析・管理システムへ取り込めます。
支出管理では、ワークスペース既定の上限、グループ別上限、個人別の上書き設定が可能になり、利用者は自分のクレジット使用状況と予算を確認できます。
利用者が追加クレジットを申請し、作業内容の文脈を添えて管理者が判断する流れも用意されています。
対象はChatGPT Enterprise管理者と同ワークスペースの利用者です。個人向け無料/有料プランや日本での新しい提供条件は記載されていません。
Using AI to help physicians diagnose rare genetic diseases affecting children
OpenAIは、Boston Children’s Hospital、Harvard Universityとの研究で、未解決の小児希少遺伝性疾患376例をAIで再解析した結果を発表しました。
OpenAI o3 Deep Researchが専門家に検討候補を提示し、18例で診断につながったとされています。
研究では、過去に専門家が解析しても未解決だった376件の匿名化された臨床・ゲノム情報を、OpenAI o3 Deep Research reasoning modelで再解析しました。
モデルは診断を下すのではなく、研究者と臨床医が確認するためのエビデンス付き候補仮説を提示しました。
専門家レビュー、追加検査、臨床確認を経て18例で診断が成立し、過去の専門家解析後に4.8%の追加診断率が得られたとされています。
希少疾患では、新しい遺伝子疾患関連や症例報告が蓄積されるため、以前は未解決だったケースが後から解釈可能になることがあります。
実務上は、AIが臨床判断を代替するのではなく、専門家主導の定期的な再解析をスケールさせる研究ワークフローとしての意味が大きいです。
製品提供やAPI公開ではなくNEJM AI掲載の研究発表です。日本での利用条件、無料/有料、個人/法人向け条件は記載されていません。
Codex CLI 0.141.0
OpenAIはCodex CLI 0.141.0を公開しました。
リモート executor の通信に認証済みエンドツーエンド暗号化Noiseリレーを使う更新や、MCP/プラグイン関連の改善が含まれます。
対象パッケージは `@openai/codex@0.141.0` で、`npm install -g @openai/codex@0.141.0` により導入できます。
リモート executor は認証済みのエンドツーエンド暗号化Noiseリレーチャネルを使うようになりました。
クロスプラットフォームのリモート実行では、executor側の作業ディレクトリやシェル、ファイルシステム権限パスの扱いが改善されています。
選択されたexecutorプラグインがスレッド単位でstdio MCPサーバーを有効化でき、プラグイン発見にもマーケットプレイス/認証関連のカタログ改善が加わっています。
破壊的変更や移行期限は記載されていません。開発者向けのCLI更新で、個人/法人や日本向けの提供条件変更は記載されていません。
Anthropic opens Seoul office and announces new partnerships across the Korean AI ecosystem
Anthropicはソウル拠点の開設と、韓国の企業・スタートアップ・研究機関とのClaude関連パートナーシップを発表しました。
NAVER、Nexon、LG CNS、Samsung SDSなどでClaude CodeやClaudeの導入事例が示されています。
韓国科学技術情報通信部とのMOUにより、公共部門での安全で責任あるAI導入、韓国語でのモデル安全性評価、AIを使ったサイバー脅威情報の共有で協力するとしています。
企業導入では、NAVERがエンジニアリング組織全体にClaude Codeを展開し、Nexonもライブサービスゲームの開発・レビュー・出荷にClaude Codeを使っていると説明されています。
LG CNSは従業員とLGグループ向けにClaudeを展開し、Samsung SDSはSamsung Electronicsの従業員向けにClaude、Claude Cowork、Claude Codeを導入するとされています。
研究面では、KAISTなどを含むNational AI Research Lab関係者最大60人にClaudeアクセスを提供し、安全性、評価、アラインメント、堅牢性研究を支援します。
日本での新しい提供条件や価格変更は記載されていませんが、韓国でClaude for Startupsが利用可能であることが明記されています。
Agentic coding and persistent returns to expertise
Anthropicは、Claude Codeの実利用セッションを分析し、エージェント型コーディングでは利用者の専門性が成功率に強く効くと発表しました。
人間は何を作るかを主に決め、Claudeはどのように実装するかを担う分業が多いと説明されています。
Claude Codeのセッション分析では、利用者が計画判断の約70%を担い、実装・実行判断の多くをClaudeが担う構図が示されています。
利用目的は、新規開発、修正、テスト/オーケストレーション、運用、既存システム理解、変更計画、データ分析、文章作成などに分類されています。
専門性が高いユーザーほど成功率が上がり、失敗や誤解が起きた場合にも立て直しやすい傾向があるとされています。
一方で、専門家と中級者の差は限定的で、深いコーディング経験よりも対象ドメインを正確に理解していることが重要だと位置づけられています。
実務上は、Claude Codeを「実装を丸投げする道具」ではなく、業務知識を持つ人が目的・制約・検証観点を与えて動かすツールとして設計する重要性が高いです。
製品の新機能提供ではなく研究分析です。無料/有料、個人/法人、日本での利用可能性に関する新しい条件は記載されていません。
Google advances its AMIE research medical AI from diagnosis to treatment
Googleは、医療推論・対話AI「AMIE」を単発の診断支援から長期的な疾患管理へ拡張する研究をNatureで発表しました。
Geminiの長文脈能力を使い、患者対話エージェントと管理推論エージェントが臨床ガイドラインや薬剤情報を参照します。
GoogleのAMIE研究は、診断後の慢性疾患管理、症状追跡、更新される臨床ガイドラインの解釈、薬剤調整といった継続的な医療タスクを対象にしています。
AMIE for disease managementは、リアルタイム患者会話を行う共感的な対話エージェントと、権威ある臨床知識を横断参照する深い推論エージェントで構成されています。
Geminiモデルの長文脈能力を使い、薬剤フォーミュラリや臨床ガイドラインなど数百ページ規模の情報を扱うと説明されています。
患者役を使ったブラインド研究では、専門医がAMIEと21人のプライマリケア医を比較し、AMIEは全体的な管理推論で臨床医と同等、計画の具体性とガイドライン整合性でより高い評価を得たとされています。
Googleは、これが将来の医療現場で医師の時間を患者対応に回す支援になり得るとしつつ、臨床環境での検証や全国規模の実世界バーチャルケア研究を進めるとしています。
製品提供やAPI公開ではなく研究発表です。日本での利用可能性、無料/有料、個人/法人向け条件は記載されていません。
A near-autonomous AI chemist improves a challenging reaction in medicinal chemistry
OpenAIは、GPT-5.4をMolecule.oneのMaria AI/Labに接続し、医薬化学で使われるChan-Lam coupling反応の改善を示しました。
GPT-5.4が提案したTEMPO系添加剤により、テストした基質の多くで収率が改善し、人間の化学者がベンチスケールで代表例を再現しました。
OpenAIは、GPT-5.4をMolecule.oneのMariaというエージェント型化学AIと高スループット実験ラボに接続し、反応改善というオープンエンドな研究目標を与えました。
システムは研究提案、実験設計、実験データ分析、追試提案を行い、人間の化学者はプロンプト設計、候補選定、実験計画の限定的修正、ラボ操作、最終結果の独立検証を担当しました。
対象は一次スルホンアミドのChan-Lam couplingで、GPT-5.4はTEMPOなどの穏やかな酸化剤が改善に効く可能性を提案しました。
Maria Labで合計10,080反応を実行し、最適条件ではホウ酸側で88%、スルホンアミド側で83%のテスト基質で収率が改善しました。平均収率は16.6%から25.2%へ上がり、30%超の反応割合も15.6%から37.5%へ増えています。
人間の化学者による代表14組のベンチスケール再現では11組で収率改善が確認され、多くで2倍超の改善が見られました。
これはAPIや製品提供の変更ではなく研究発表です。化学・生物領域の悪用リスクを踏まえ、OpenAIはPreparedness Framework、専門家監督、有害用途を避けたスコープ設定を明記しています。
Introducing LifeSciBench
OpenAIは、実際の生命科学研究ワークフローに近いAI評価ベンチマーク「LifeSciBench」を発表しました。
750件の専門家作成タスク、1,062件の添付アーティファクト、19,020件のルーブリック基準で、研究支援能力を細かく評価します。
LifeSciBenchは、AIが単なる生物学知識の回答ではなく、実際の生命科学研究タスクを支援できるかを測るベンチマークです。
タスクはPh.D.レベルの訓練とバイオテック/製薬業界経験を持つ173人の専門家が作成し、453人の専門レビュー担当者が評価しました。
750件のタスクは、エビデンス処理、分析、設計・最適化、科学的推論、検証・運用、トランスレーション、科学コミュニケーションの7ワークフローと7生物領域をカバーします。
タスクの79%は複数ステップの推論や意思決定を必要とし、53%は図、PDF、表、配列ファイル、構造/化学ファイル、Web参照など少なくとも1つの添付アーティファクトの解釈・統合を要求します。
評価は最終答えだけでなく、科学的に妥当な理由づけ、重要な caveat、運用上有用な形式まで、19,020件の詳細ルーブリックで採点します。
開発者向けAPI変更、モデル移行期限、破壊的変更はありません。生命科学向けAIエージェントや研究支援モデルの評価に関わる研究者・開発者に重要です。
Gemini API: streaming support for speech generation
Gemini APIで、`gemini-3.1-flash-tts-preview`モデルの音声生成ストリーミングがサポートされました。
`streamGenerateContent`とInteractions APIの`stream: true`で利用でき、テキスト読み上げの低遅延化に関係します。
Gemini APIの6月17日更新として、音声生成のストリーミング対応が追加されました。対象モデルは`gemini-3.1-flash-tts-preview`です。
利用経路は`streamGenerateContent`、およびInteractions APIで`stream: true`を指定する方法です。
TTS応答をまとめて生成完了まで待つのではなく、ストリーミングで受け取れるため、音声アシスタント、読み上げ、会話UIなどで体感待ち時間を下げやすくなります。
開発者向け更新ですが、この項目自体には移行期限や破壊的変更はありません。対象API/モデルはGemini API、`gemini-3.1-flash-tts-preview`、Text-to-Speech機能です。
無料/有料枠、日本での利用可否、レート制限について、このchangelog項目内では追加説明はありません。
Copilot Cowork is now generally available
Microsoftは、長時間・複数ツールの業務タスクを実行するCopilot Coworkの一般提供を世界向けに開始しました。
Microsoft 365 Copilotライセンスが前提で、タスク実行分はCopilot Creditsによる従量課金です。
Copilot Coworkは、単なる下書きや提案ではなく、複雑で長時間のマルチツール業務をエンドツーエンドで実行して完了結果を返すエージェント型機能です。
Preview中はFortune 500の半数以上が利用し、ファイル比較、営業パイプライン確認、スプレッドシート編集、依存関係チャート生成などの例が示されています。
クラウドホスト型のため、ローカルにファイルを保存せず、PCがオフでもタスクが継続します。Work IQによりMicrosoft 365内の業務コンテキストを使い、組織の既存ポリシーやMicrosoft 365 trust boundary内で動作する設計です。
利用にはMicrosoft 365 Copilot User Subscription Licenseが必要で、Cowork自体はモデル利用、コンテキスト取得、ツール呼び出し、実行時間に基づくCopilot Credits従量課金です。
新しいCowork 1モデルも今後数週間で提供予定とされています。これは低コストでタスク処理できるようポストトレーニングされたセキュアなfine-tuned modelと説明されています。
個人向け無料Copilotのニュースではなく、組織向けMicrosoft 365 Copilot利用者が対象です。日本での個別提供条件は記事内では明記されていません。
Predicting model behavior before release by simulating deployment
OpenAIは、新モデル公開前に実運用に近い会話文脈を再現して望ましくない挙動を予測する「Deployment Simulation」を紹介しました。
GPT-5系Thinkingモデルやエージェント的なツール利用環境で、従来評価より実運用時のリスク推定を改善できたと説明しています。
従来の安全性評価は、合成プロンプトや高リスクケースに偏りやすく、実際の利用分布でどの程度問題が起きるかを推定しにくい課題がありました。
Deployment Simulationは、過去の会話から元のアシスタント応答を取り除き、公開候補モデルで応答を再生成して、実運用に近い分布で望ましくない挙動を測ります。
OpenAIは、GPT-5系Thinkingモデルの複数デプロイで、望ましくない挙動の発生率推定、未知のミスアラインメント検出、モデルが評価中だと認識するリスクの低減に役立ったとしています。
約130万件の匿名化済み会話を分析し、GPT-5.4 Thinkingでは20種類の望ましくない挙動について事前登録した予測も行っています。
エージェント的なコーディング環境では、ライブ環境に実ツールを実行せず、リポジトリ状態や過去のツール応答を使ってツール呼び出しをシミュレーションする方法も示されています。
開発者向けのAPI変更や移行期限はありませんが、モデル公開前評価、レッドチーム、システムカード、エージェント安全性評価に関わるチームには重要な研究更新です。
Unlocking UK house-building with AI-accelerated planning
Google DeepMindは、英国政府と連携し、Geminiを使った住宅計画申請処理向けAIプロトタイプを発表しました。
自治体の計画担当者が文書確認、政策照合、意見要約、報告書ドラフト作成に使う補助ツールで、判断権限は人間の担当者に残す設計です。
英国は2029年までに150万戸の新築住宅を目指しており、地方計画当局では書類処理や行政バックログがボトルネックになっています。
Google DeepMindは英国政府、Google Cloud、Faculty、Barnet、Dorset、Camdenの地方当局と協力し、計画担当者向けAIプロトタイプを共同開発します。
このツールは、申請書類やPDFからのデータ抽出、関連する国・地方ポリシーの提示、相談書面の要点整理、最終報告書ドラフト作成を支援します。
初期試験後、英国政府は2027年から全国の自治体に利用可能にする計画です。
最終判断は計画担当者が行い、ツール生成内容を人間がレビュー・編集し、承認または却下の権限を保持します。監査証跡も残す設計です。
Geminiを使ったExtractの流れを拡張する公共サービス向けAI事例であり、Gemini APIやGoogle AI Studioの開発者向け変更ではありません。日本での提供条件も関係しません。
Codex app features are available in the EEA, UK, and Switzerland
OpenAIは、EEA、英国、スイスのユーザー向けにCodex appの機能展開を拡大しました。
対象地域でComputer Use、Codex Chrome extension、Memories、ChatGPT Pro向けChronicleプレビューが利用可能になります。
EEA、英国、スイスでCodex appの利用可能機能が増えました。macOS/WindowsのComputer Useにより、Codexが画面を見てクリックや入力を行い、デスクトップアプリを操作できます。
Codex Chrome extensionも対象地域で利用でき、ログイン済みChromeの文脈が必要なブラウザタスクを、ユーザーのブラウザを占有せずバックグラウンドで扱えます。
Memoriesは、好み、繰り返しのワークフロー、技術スタック、リポジトリ慣習などを記憶できます。ただしEEA、英国、スイスではデフォルトでオフです。
ChronicleはmacOS上のChatGPT Pro加入者向けの任意参加リサーチプレビューで、最近の画面文脈からCodexのメモリ構築を支援します。
日本での提供条件変更はこのchangelogでは明記されていません。開発者向けAPI変更、移行期限、破壊的変更も記載されていません。