趣丸科技开源语音大模型MaskGCT
10月24日,趣丸科技宣布与香港中文大学(深圳)联合研发的语音大模型“MaskGCT”正式在Amphion系统中开源,面向全球用户开放使用。区别于传统TTS模型,该模型采用掩码生成模型与语音表征解耦编码的技术范式,在声音克隆、跨语种合成、语音控制等任务中性能表现突出。据介绍,MaskGCT在三个TTS基准数据集上都达到了SOTA效果。
相关资讯
- ▣ 文化湾企说丨广州趣丸科技:联合港中大(深圳)开源首个语音大模型,效果全球领先跻身第一梯队
- ▣ 国产AI音乐生成效果几何?实测趣丸科技天谱乐大模型
- ▣ 盈趣科技:已接入多个大语言模型、视觉大模型和多模态大模型等,并积极开展相关应用
- ▣ 广州海珠打造最盈利大模型产业集聚高地,趣丸科技等大模型企业入驻
- ▣ AI早知道|商汤科技发布东风泰语大模型;Meta计划开源 AI 模型Llama3 405B
- ▣ 全球科技早参丨OpenAI发布语音模型Voice Engine
- ▣ 腾讯混元大语言模型和3D模型正式开源
- ▣ AI早知道|国内首个端到端语音大模型Lingo;摩尔线程开源音频理解大模型MooER摩耳
- ▣ 豆包实时语音大模型和大模型1.5线,美政府联手科技巨头启动“星际之门”
- ▣ 腾讯混元宣布大语言模型和3D模型正式开源
- ▣ 盈趣科技:暂无自主研发AI大模型,开发相关AI应用
- ▣ 科大讯飞行业首发端到端语音同传大模型
- ▣ 天津大学“伏羲传语”多语言大模型正式发布并开源,应对大模型多语言能力不足
- ▣ xAI宣布开源大语言模型Grok-1并开放下载
- ▣ AI早知道|百度将推出人工智能模型 Ernie5.0;小红书开源语音识别模型FireRedASR
- ▣ AI早知道|B 站开源轻量级 AI 语言模型;阿里通义Qwen2成最强开源大模型
- 科大讯飞大模型竞速2年多,答卷不只是语音
- ▣ 宁夏电力能源科技申请模型训练相关专利,完成语音识别测试时的自适应
- ▣ 科大讯飞星火语音大模型“星火极速超拟人交互”8月底开放
- ▣ 豆包实时语音大模型上线
- ▣ AI早知道|腾讯推全球首个语音指挥FPS AI ;摩尔线程开源音频理解大模型
- ▣ OpenAI开发者大会派礼包:大幅降低模型成本,AI语音加持App,小模型“蹭”大模型性能
- ▣ 中电信数智科技申请基于端到端跨语言大模型语音识别方法专利,提升语音识别准确度及鲁棒性
- ▣ 从趣丸集团天谱乐AI音乐大模型看算法如何催生行业新质生产力
- ▣ 联发科 推繁中大型语言模型
- ▣ AI早知道|科大讯飞发布星火同传语音大模型;阿里巴巴推出多模态大模型Valley2
- ▣ 字节跳动全量开放豆包即时语音大模型
- ▣ 全球科技早参丨全球首个芯片设计开源大模型诞生
- ▣ 商汤科技发布新版日日新·商量大语言模型