本信息图全面对比了主流商业TTS服务、中文TTS服务以及开源/自部署TTS方案,
帮助您快速了解各服务的特点、优势和适用场景。
🌍 商业TTS服务
-
Microsoft Azure TTS:
多语言支持,SSML控制,情绪语调
-
Google Cloud TTS:
WaveNet技术,中文普通话和台语
-
Amazon Polly:
AWS集成,多语言,Speech Marks
🇨🇳 中文TTS服务
-
科大讯飞:
流式合成,自定义音色,音色克隆
-
百度TTS:
离线SDK与云服务,企业级应用
-
MiniMax TTS:
实时合成,多语言音色,AI Agent适用
🔓 开源/自部署方案
-
Fish Speech:
8种语言,音色克隆,流式播放
-
CosyVoice:
多语言支持,流式推理,轻量化部署
-
Coqui TTS:
中文模型配置,模型训练和微调
📊 功能对比表(中英文TTS)
名称 |
中文 |
英文 |
流式 |
克隆 |
开源 |
特点 |
价格 |
Azure TTS |
✅✅✅ |
✅✅✅ |
✅ |
❌ |
❌ |
商业标准,情感支持强 |
$4/百万字符 |
🎵
🎶
数据更新至2023年,具体价格和功能请以官方最新信息为准