AI早知道|国内首个端到端语音大模型Lingo;摩尔线程开源音频理解大模型MooER摩耳

1.西湖心辰推出的端到端语音大模型Lingo,具备实时打断、指令控制、超级拟人等能力,支持多种语音风格表达,提供高自然流畅度的交互体验。

2.云知声推出山海多模态大模型,该模型实现了多模态输入和输出,提供流畅的语音交互和个性化的视觉体验,支持文本、音频、图像等多种模态输入和任意组合输出,实现高效语音交互。

3.摩尔线程开源了音频理解大模型 -MooER(摩耳),是业界首个基于国产全功能 GPU 进行训练和推理的大型开源语音模型。基于摩尔线程夸娥(KUAE)智算平台,MooER 大模型用 38 小时完成了 5000 小时音频数据和伪标签的训练。

4.苹果正式进军机器人市场,计划推出搭载生成式AI的桌面设备,预计在2026年或2027年上市。这一举措将为智能家居带来革命性变革,为用户提供更便捷的生活体验。

5.xAI团队的Grok-2和Grok-Mini模型在LMSys聊天机器人Arena排行榜上脱颖而出,Grok-2以第二名的佳绩超越了OpenAI的GPT-4o,与Gemini并列。

6.Meta Reality 实验室最新推出了名为Sapiens 的AI视觉模型,专门设计用于理解图片和视频中的人类动作。它支持多种任务,包括2D姿态估计、身体部位分割、深度估计和表面法线预测等。

想要了解更多AI 行业资讯以及ChatGPT和AI绘画实战案例,欢迎加入我们的「互联网AI早读课」知识星球!

在这个星球,你可以更加系统的学习AIGC相关知识:

1. ChatGPT和AI绘画(Midjourney+Stable Diffusion+Photoshop beta)基础+进阶全攻略;

2. ChatGPT和AI绘画最直接变现案例;

3. 与200+行业先行者链接,积累你的专属人脉资源;

4. 社群保姆级一站式服务,包教包会包讨论;

现在加入,立享99元早鸟价优惠,星球用户每涨100人,价格上调100元,直到恢复499元原价!

这个风口抓不抓的住,就看你愿不愿意迈出第一步了!

越晚加入成本越贵!最后两个名额又要涨价了!