AI早知道|苹果Siri AI新功能;百度新模型可生成1小时长视频
1.OpenAI发布了gpt-4o-audio-preview模型,能生成自然语音响应,分析音频情感,并支持语音交互。该模型专注于语音处理细节,提供灵活的输入输出模式。
2.武蔵野大学数据科学学院的研究人员开发了一种名为 AMT-APC 的全新算法,可以更加精准地自动生成钢琴曲。这项技术利用了自动音乐转录模型的优势,通过对其进行微调,使其能够更好地捕捉音乐的细节和表现力。
3.特斯拉最新发布的Optimus机器人,从自主导航能力、能源管理自主性、负载能力提升等方面都展现出巨大潜力。能在复杂环境中自如穿行,多台机器人可协同工作优化导航效率。
4.苹果正致力于为iOS18、iPadOS18和macOS15添加新的Apple Intelligence功能,其中包括ChatGPT集成和图像生成。ChatGPT将为Siri提供更先进的文本和图像生成能力,而Visual Intelligence则将为iPhone16用户提供相机控制按钮功能。
5.复旦大学和百度公司的研究人员联合开发了一种名为 Hallo2的全新 AI 模型,该模型可以生成长达数小时的4K 分辨率人物动画,并且可以通过语音和文字提示进行精准控制。
想要了解更多AI 行业资讯以及ChatGPT和AI绘画实战案例,欢迎加入我们的「互联网AI早读课」知识星球!
在这个星球,你可以更加系统的学习AIGC相关知识:
1. ChatGPT和AI绘画(Midjourney+Stable Diffusion+Photoshop beta)基础+进阶全攻略;
2. ChatGPT和AI绘画最直接变现案例;
3. 与200+行业先行者链接,积累你的专属人脉资源;
4. 社群保姆级一站式服务,包教包会包讨论;
现在加入,立享99元早鸟价优惠,星球用户每涨100人,价格上调100元,直到恢复499元原价!
这个风口抓不抓的住,就看你愿不愿意迈出第一步了!
越晚加入成本越贵!最后两个名额又要涨价了!