首页/text-to-speech

text-to-speech

F
FishAudio

Fish Audio S2 Pro Text to Speech

Fish Audio S2 Pro 文本转语音模型,将文本转换为自然语音,支持参考音色、采样控制、分段、音频格式和韵律控制。

MiniMax
MiniMax

MiniMax 声音设计

通过文字描述生成个性化定制声音。返回可用于 T2A 语音合成 API 的 voice_id,以及十六进制编码的预览音频样本。

Google
Google

Gemini 2.5 Flash TTS Text-to-Speech

Google Gemini 系列强调多模态理解与指令遵循,兼顾速度与成本,适合生产级调用。Gemini 2.5 Flash 侧重低延迟与性价比,在实时场景更友好。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

MiniMax
MiniMax

MiniMax Speech 2.8 Turbo Async Text-to-Speech

Minimax 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

MIniMax
MIniMax

MiniMax Speech 2.8 HD Async Text-to-Speech

Minimax 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

MIniMax
MIniMax

MiniMax Speech 2.8 Turbo Sync Text-to-Speech

Minimax 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

MIniMax
MIniMax

MiniMax Speech 2.8 HD Sync Text-to-Speech

Minimax 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

Z
ZhipuAI

GLM Text to Speech

Glm 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

E
Elevenlabs

Elevenlabs flash v2.5 Text to Speech

Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

E
Elevenlabs

Elevenlabs flash v2 Text to Speech

Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

E
Elevenlabs

Elevenlabs multilingual v2 Text to Speech

Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

E
Elevenlabs

Elevenlabs turbo v2.5 Text to Speech

Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

E
Elevenlabs

Elevenlabs turbo v2 Text to Speech

Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

E
Elevenlabs

Elevenlabs v3 Text to Speech

Elevenlabs 系列提供稳定的生成能力,适合生产场景。该系列面向生产级调用,强调稳定性与可控输出。语音合成支持多语种与情绪语气控制,可用于配音、播报、客服与角色对白。即时推理 API,性能稳定,无需等待,价格亲民

联系我们