AI早知道|苹果Siri AI新功能;百度新模型可生成1小时长视频

1.OpenAI发布了gpt-4o-audio-preview模型,能生成自然语音响应,分析音频情感,并支持语音交互。该模型专注于语音处理细节,提供灵活的输入输出模式。

2.武蔵野大学数据科学学院的研究人员开发了一种名为 AMT-APC 的全新算法,可以更加精准地自动生成钢琴曲。这项技术利用了自动音乐转录模型的优势,通过对其进行微调,使其能够更好地捕捉音乐的细节和表现力。

3.特斯拉最新发布的Optimus机器人,从自主导航能力、能源管理自主性、负载能力提升等方面都展现出巨大潜力。能在复杂环境中自如穿行,多台机器人可协同工作优化导航效率。

4.苹果正致力于为iOS18、iPadOS18和macOS15添加新的Apple Intelligence功能,其中包括ChatGPT集成和图像生成。ChatGPT将为Siri提供更先进的文本和图像生成能力,而Visual Intelligence则将为iPhone16用户提供相机控制按钮功能。

5.复旦大学和百度公司的研究人员联合开发了一种名为 Hallo2的全新 AI 模型,该模型可以生成长达数小时的4K 分辨率人物动画,并且可以通过语音和文字提示进行精准控制。

想要了解更多AI 行业资讯以及ChatGPT和AI绘画实战案例,欢迎加入我们的「互联网AI早读课」知识星球!

在这个星球,你可以更加系统的学习AIGC相关知识:

1. ChatGPT和AI绘画(Midjourney+Stable Diffusion+Photoshop beta)基础+进阶全攻略;

2. ChatGPT和AI绘画最直接变现案例;

3. 与200+行业先行者链接,积累你的专属人脉资源;

4. 社群保姆级一站式服务,包教包会包讨论;

现在加入,立享99元早鸟价优惠,星球用户每涨100人,价格上调100元,直到恢复499元原价!

这个风口抓不抓的住,就看你愿不愿意迈出第一步了!

越晚加入成本越贵!最后两个名额又要涨价了!