网易有道推出Confucius4-TTS语音合成引擎:3秒音频即可实现语音克隆
时间:2026-06-24 09:38:47
小编:china
阅读:
6月23日消息,据报道,网易有道近日正式发布子曰4.0 TTS语音合成引擎Confucius4-TTS,这是业内首个支持14种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。
该模型在跨语种语音克隆、免参考文本建模、情感韵律迁移及本地化部署等关键维度上均达到国际前沿水平,为多语种内容生成、数字人配音、跨语言教学、短剧出海及全球化传播提供了低门槛、国产化的技术底座。
目前,Confucius4-TTS已全面覆盖中文、英语、西班牙语、法语、德语、韩语、泰语、越南语等14种语言的自然流利表达。
用户仅需提供3秒音频素材,无需参考文本或前期训练,模型即可完成音色克隆,相似度超过85%,克隆任务准确度达到97%。
输入中文音频后,模型能够使用原声音色输出多语种语音,并在全过程中保持音色高度一致;同时,模型可自动提取参考音频中的情感特征,实现语调、韵律与情绪的完整迁移。

在底层架构上,Confucius4-TTS引入GPT式语义大模型作为主干,搭配可学习说话人编码器,并采用Flow Matching流匹配生成框架,不再沿用传统的声码器方案,显著提升了生成质量与可控性。
值得关注的是,网易有道已将Confucius4-TTS全量开源,采用Apache开源协议,面向全球开发者开放完整模型权重及配套工具链,商用无限制。开发者可下载54GB完整资源包,进行本地离线部署,满足数据安全与定制化需求。
GitHub开源地址:https://github.com/netease-youdao/Confucius4-TTS
-
网易有道推出Confucius4-TTS语音合成引擎:3秒音频即可实现语音克隆6月23日消息,据报道,网易有道近日正式发布子曰4 0 TTS语音合成引擎Confucius4-TTS,这是业内首个支持14种语言跨语种无口音、且无需参考时间:2026-06-24 - 徐良演唱会伴舞吸引110万新粉丝,网友称主角变伴唱徐良2026年时间折叠巡回演唱会青岛站上,一位伴舞意外走红。23岁的专业编舞煜宸,凭借一段松弛感十足的舞蹈迅速刷屏全网,两周内个人账号涨时间:2026-06-24
- 女孩中考获高分揭秘“潜藏款”,成功进入绵阳中学6月22日晚10点,四川绵阳中考成绩公布。一名考生输入准考证号后,页面显示各科成绩均为空白,没有任何分数。全家愣住了——这是系统出问题时间:2026-06-24
- 男子公司如厕感染粪便病菌,导致扁桃体发炎无法吞咽上海杨女士在公司上洗手间时,闻到一股恶臭。当晚,扁桃体便开始发炎,后半夜肿到无法咽口水。没有发烧或感冒症状,她并未考虑细菌感染。第时间:2026-06-24
-
热门阅读
-
哥哥抚慰腮腺炎弟弟 得知传染秒变脸
阅读:130
-
华为FreeClip 2推送鸿蒙OS 6晋级,支撑星闪音频 抗搅扰才能提拔
阅读:92
-
95岁广东白叟扮演一字马火了 自己谈长命诀要,1天喝2瓶可乐
阅读:72
-
刘文祥塌房紫薯精改吃大理寺米线 网友,筹办整理升咖
阅读:65
-
这才是东北春季最霸气的开场,百万只大雁春季迁移
阅读:63








