只需一步,快速开始
您需要 登录 才可以下载或查看,没有账号?注册
凤凰网科技讯 12月15日,阿里通义宣布开源Fun-CosyVoice3-0.5B,该版本提供了zero-shot(注:零样本)音色克隆能力,只需要你提供一段3秒以上的参考音频,即可复刻其音色并合成新语音,并且支持本地部署和二次开发。
此外,通义推出轻量化版本Fun-ASR-Nano模型,总参数量压缩到0.8B,推理成本更低,现已开源,支持本地部署与定制化微调。
值得一提的是,通义还增强了Fun-ASR模型,噪声场景准确率93%、支持歌词与说唱识别。
使用道具 举报
本版积分规则 发表回复 回帖并转播 回帖后跳转到最后一页
文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )|网站地图
GMT+8, 2025-12-17 02:31 , Processed in 0.124980 second(s), 4 queries , Redis On.
Powered by Discuz! X3.5
© 2001-2025 Discuz! Team.