Tag

#GPT-5.5

ニュース

重要度: 高 OpenAI Developer / Codex / Engineering Workflow

How Braintrust uses Codex with GPT-5.5 to manage and scale engineering tasks

2026-05-29 / 関連製品: Codex, GPT-5.5

短い要約
BraintrustがCodexとGPT-5.5を使い、エンジニアリングタスクの管理・実装・評価を拡張している事例です。Codexを単なるコード生成ではなく、継続的な開発運用に組み込む方向性が示されています。
詳細
BraintrustはLLMアプリの評価・改善基盤を提供する企業で、Codexを実装補助やタスク分解、評価駆動の改善に活用しています。重要なのは、AIコーディングを「一回コードを書かせる」用途ではなく、評価、レビュー、修正、再実行を含む開発ループに組み込んでいる点です。Codex/GPT-5.5を使う企業開発チームにとって、エージェント型開発をどう管理するかの参考になります。無料/有料機能の新発表ではなく、実務導入事例です。
公式ソースを読む
重要度: 高 OpenAI Engineering / Codex / Agentic Workflow

Building self-improving tax agents with Codex

2026-05-27 / 関連製品: Codex, GPT-5.5, agentic coding

短い要約
OpenAIとThrive Holdingsが、税務エージェントをCodexで継続改善する実例を公開しました。実務者の修正、プロダクトトレース、評価セットをCodexに渡し、エージェント自身の性能改善ループを作る内容です。
詳細
Tax AIはCreteの30以上の会計事務所向けに、1040/1041などの税務申告準備を支援しました。7,000件の申告を処理し、税務準備時間を約3分の1削減、最大97%の精度、スループット約50%向上とされています。重要なのは、単にCodexがコードを書く話ではなく、実務者の修正ログを「評価可能な失敗」として構造化し、Codexが対象コード・プロダクトトレース・評価コマンドを使って改善する点です。エージェントを本番投入した後、失敗を集めてeval化し、Codexに改善タスクとして渡すパターンは、税務以外の業務エージェントにも応用できます。
公式ソースを読む
重要度: 中 OpenAI Startup / Developer Workflow

Warp’s big bet on building open source with GPT-5.5

2026-05-27 / 関連製品: GPT-5.5, Codex-like coding agents, Warp

短い要約
WarpがGPT-5.5を使って、ローカル・クラウド・オープンソース開発を横断するエージェント型開発ワークフローを構築している事例です。ターミナルをエージェント運用の中心に置く方向性が示されています。
詳細
Warpはターミナルを、コマンド実行、コンテキスト管理、レビュー、協働の場として捉えています。Open Agentic Developmentという形で、人間が目的を定義し、エージェントが計画・実装・テスト・PR作成を進めるモデルを打ち出しています。OpenAI側の直接的な新機能発表ではありませんが、GPT-5.5を使った開発者向け実運用事例として重要です。Codexそのものの更新ではないものの、今後のコーディングエージェント運用の方向性を見る材料になります。
公式ソースを読む