ElevenLabs于6月25日发布了声音克隆API 2.0版本,大幅降低了声音克隆的门槛和技术要求。
2.0版本核心升级:
- 音频样本需求从1分钟缩短至3秒
- 克隆准确度提升40%(MOS评分达到4.3/5.0)
- 支持29种语言的自然语音合成
- 新增情感控制参数(开心/悲伤/愤怒/平静)
- 安全水印技术:所有生成音频嵌入不可见数字水印
安全机制:新版本强化了滥用检测,包括实时语音验证(需用户读出随机文本以确认身份)、名人声音库主动拦截等。
相关工具:ElevenLabs详细评测 | TTSMaker对比