#Speech Generation AIニュース

New

重要度: 中 Google 開発者向け更新 / Gemini API / 音声生成

Gemini API: streaming support for speech generation

2026-06-17 / 掲載更新: 2026/06/18 10:57 JST / 関連製品: Gemini API, gemini-3.1-flash-tts-preview, streamGenerateContent, Interactions API

短い要約

Gemini APIで、`gemini-3.1-flash-tts-preview`モデルの音声生成ストリーミングがサポートされました。 `streamGenerateContent`とInteractions APIの`stream: true`で利用でき、テキスト読み上げの低遅延化に関係します。

詳細

Gemini APIの6月17日更新として、音声生成のストリーミング対応が追加されました。対象モデルは`gemini-3.1-flash-tts-preview`です。利用経路は`streamGenerateContent`、およびInteractions APIで`stream: true`を指定する方法です。 TTS応答をまとめて生成完了まで待つのではなく、ストリーミングで受け取れるため、音声アシスタント、読み上げ、会話UIなどで体感待ち時間を下げやすくなります。開発者向け更新ですが、この項目自体には移行期限や破壊的変更はありません。対象API/モデルはGemini API、`gemini-3.1-flash-tts-preview`、Text-to-Speech機能です。無料/有料枠、日本での利用可否、レート制限について、このchangelog項目内では追加説明はありません。

#Google #Gemini API #TTS #Speech Generation #streaming #gemini-3.1-flash-tts-preview

公式ソースを読む