AI早知道|智源发布多模态模型Emu3;阿里巴巴达摩院开源文档处理模型

1.智源研究院发布了多模态模型Emu3,它基于下一个token预测训练,在图像、文本和视频的生成和感知任务上达到先进性能。Emu3能生成高保真视频,简化了多模态模型设计,释放了扩展潜力,并已开源关键技术。

2.人工智能搜索初创公司Perplexity计划进行新一轮融资,目标是筹集约5亿美元资金,以将其估值提升至80亿美元或更高。该公司在一年内完成了三轮重要融资,年初估值为5.2亿美元,夏季飙升至30亿美元。

3.阿里巴巴达摩院与中国人民大学近日联合开源了一款名为mPLUG-DocOwl1.5的文档处理模型,该模型主打无需 OCR 识别即可理解文档内容,并在多个视觉文档理解基准测试中取得了领先的性能。

4.新加坡卫生部最近宣布将投资2亿新元(约合1.5亿美元),计划在未来五年内在全国的医疗系统中大力推行新型人工智能技术。

5.索尼集团和本田的合资公司“索尼本田移动出行”计划在其共同开发的纯电动汽车Afeela中引入AI自动驾驶辅助功能。这将是日本车企首次引入此类功能,预计于2026年在美国和日本市场推出。

6.亚马逊与Databricks合作开发生成式AI,旨在通过AWS提升市场竞争力。此举响应了Ark Invest的预测,即到2030年,颠覆性创新将占全球股市的60%。亚马逊的合作是多元化AI投资策略的一部分。

想要了解更多AI 行业资讯以及ChatGPT和AI绘画实战案例,欢迎加入我们的「互联网AI早读课」知识星球!

在这个星球,你可以更加系统的学习AIGC相关知识:

1. ChatGPT和AI绘画(Midjourney+Stable Diffusion+Photoshop beta)基础+进阶全攻略;

2. ChatGPT和AI绘画最直接变现案例;

3. 与200+行业先行者链接,积累你的专属人脉资源;

4. 社群保姆级一站式服务,包教包会包讨论;

现在加入,立享99元早鸟价优惠,星球用户每涨100人,价格上调100元,直到恢复499元原价!

这个风口抓不抓的住,就看你愿不愿意迈出第一步了!

越晚加入成本越贵!最后两个名额又要涨价了!