AI早知道|阿里云发布音频模型;OpenAI发布新技术PVG

1.阿里云最新发布的Qwen2-Audio 大规模音频语言型模型,革新了语音交互体验,用户无需输入文字即可与其进行语音交互,提供更便捷的体验。

2.百度网盘推出了名为「盘盘单词」的全球首个结合个人照片场景与英语学习的AI工具,旨在解决传统英语学习中的记忆困难和表达问题。用户可通过照片呈现单词和场景化内容,创造熟悉的英语环境。

3.OpenAI最近推出了Prover-Verifier Games(PVG)技术,旨在解决人工智能模型输出的“黑盒”问题。这项技术通过小模型监督大模型输出,提高了内容的准确性和可控性。

4.智源研究院联合大连理工大学、北京大学等高校推出了新一代无编码器的视觉语言模型EVE,通过精细化训练策略和额外的视觉监督,解决了多模态大模型训练分离导致的视觉归纳偏置问题。

5.微软推出了一款名为SpreadsheetLLM的新AI系统,它结合了大型语言模型的能力和电子表格中的结构化数据,能够更高效地处理数据,帮助企业获得更深入的见解。

6.Runway的iOS客户端迎来了重大更新,苹果用户也能在手机上体验到Gen3模型的强大功能。Gen-3Alpha支持多种生成工具,包括文本到视频、图像到视频、文本到图像转换,为创作者提供丰富创作选择。

7.小冰公司最近宣布了其AI数字员工产品线的全新升级,旨在进一步丰富产品并提升实时交互效果。新技术包括“零样本”数字人技术、超千亿大模型基座和透影音画传输系统,展现了小冰公司在数字人领域的技术创新和发展动力。

想要了解更多AI 行业资讯以及ChatGPT和AI绘画实战案例,欢迎加入我们的「互联网AI早读课」知识星球!

在这个星球,你可以更加系统的学习AIGC相关知识:

1. ChatGPT和AI绘画(Midjourney+Stable Diffusion+Photoshop beta)基础+进阶全攻略;

2. ChatGPT和AI绘画最直接变现案例;

3. 与200+行业先行者链接,积累你的专属人脉资源;

4. 社群保姆级一站式服务,包教包会包讨论;

现在加入,立享99元早鸟价优惠,星球用户每涨100人,价格上调100元,直到恢复499元原价!

这个风口抓不抓的住,就看你愿不愿意迈出第一步了!

越晚加入成本越贵!最后两个名额又要涨价了!