LogoAICore Docs

Gemini TTS接口

Gemini 文本转语音(TTS)接口

文本转语音

将文本转换为语音音频。

URL
https://api.xty.app/v1/audio/speech
方法
POST

兼容 OpenAI 的 /v1/audio/speech 请求规范,具体参数以模型支持为准。

支持模型

  • gemini-2.5-pro-preview-tts
  • gemini-2.5-flash-preview-tts

支持音色

音色音色音色
Zephyr - 明亮Puck - 欢快Charon - 信息丰富
Kore - FirmFenrir - ExcitableLeda - 青春
Orus - 公司Aoede - BreezyCallirrhoe - 轻松
Autonoe - 明亮Enceladus - 气声Iapetus - 清晰
Umbriel - 轻松自在Algieba - 平滑Despina - 平滑
Erinome - 清除Algenib - GravellyRasalgethi - 信息丰富
Laomedeia - 欢快Achernar - 软Alnilam - Firm
Schedar - EvenGacrux - 成熟Pulcherrima - 直率
Achird - 友好Zubenelgenubi - 随意Vindemiatrix - 温柔
Sadachbia - 活泼Sadaltager - 知识渊博Sulafat - 偏高

请求参数

参数名类型是否必需描述
modelstring使用的模型ID,支持 gemini-2.5-pro-preview-ttsgemini-2.5-flash-preview-tts
inputstring要转换为语音的文本
voicestring语音音色,见上方支持音色列表;多人说话可用 角色:音色 逗号分隔

多人说话格式

  • voice小明:Puck,小光:Leda
  • input:使用相同角色名前缀标注台词

请求示例