☰

西部证券：具有视觉能力的多模态大模型将对视觉 SoC和存储带来新需求

每经AI快讯，西部证券研报称，ChatGPT升级视觉能力，迎来里程碑式的更新。OpenAI发布季的第六天，5月份预告的语音和视觉功能（Advanced Voice with Vision）终于发布。用户可以在对话过程中展示实时视频或共享屏幕。我们一直认为视觉能力是大模型能力的核心，因为视觉输入占据人类交互信息的绝大多数。我们可以预期，未来字节亦有望推出带有视觉能力的交互式多模态大模型，因而在包括AI玩具或AI眼镜等的下一代AI硬件终端中，视觉SoC将有望成为标配。另外这也将新增对Nand存储芯片的需求。

相关资讯

▣ 科大讯飞：星火大模型底座能力将升级，将首次发布多模态视觉交互及超拟人虚拟人交互能力
▣ 阿里云推出两款大规模视觉语言模型具中英图文识别能力
AI「百模大战」带新风向陆企先后出招视觉大模型
▣ AI早知道｜Kimi 发布 k1 视觉思考模型；腾讯发布多模态大模型POINTS 1.5
▣ 视觉中国与快手科技达成AI多模态大模型战略合作
▣ 国信证券：字节全新发布豆包AI视频模型 AI多模态有望迎来爆发期
▣ 科大讯飞Q3净利转正 10月24日将首发多模态视觉交互能力
▣ LeCun谢赛宁首发全新视觉多模态模型，等效1000张A100干翻GPT-4V
▣ 商汤星云发布新一代面向智慧园区场景的智能服务器新增视觉多模态大模型算法
▣ 华泰证券：大模型持续迭代有望带来大量算力基础设施需求
▣ 美图视觉大模型MiracleVision（奇想智能）将向公众开放
▣ 科大讯飞：将首次发布多模态视觉交互及超拟人虚拟人交互能力
▣ 美图发布AI视觉大模型4.0
▣ 开源视觉大模型黑马Molmo AI 来袭！超越GPT-4o 和 Claude 3.5
▣ 华金证券：多模态AI叠加赋能影视创作
▣ 豆包视觉理解模型发布
▣ 海通证券：AI的大模型训练及应用提升通信能力需求
▣ 中通服软件科技申请基于单模态监督对比学习和推理增强的视觉问答专利，提高问答模型推理能力和可解释性
▣ 浙商证券：OpenAI&谷歌相继发力有望引领多模态大模型浪潮
▣ 星宸科技：公司持续投入支持多模态大模型的SoC芯片研发，积极规划客户需求
▣ 直击WAIC2023|旷视科技CTO唐文斌：多模态会是大模型的未来
▣ Sora：大型视觉模型的背景、技术、局限性和机遇综述【官方论文】
▣ 华创证券：多模态AI技术高速发展，文生图、文生视频能力未来可期
▣ 中信证券：文生视频Sora等模型发布有望继续推动算力与网络需求升级
阿里通义万相视觉生成大模型升级，支持文生视频功能
▣ 千方科技：公司的梧桐多模态大模型目前具有文生图、图生图的能力
▣ 独家直击Liquid AI发布会：非Transformer架构AI模型有了听觉和视觉｜甲子光年
▣ 中信证券：OpenAI推出视频生成模型Sora AI产业围绕多模态不断加码
▣ 视频｜周鸿祎：原来觉得自动驾驶很难，是因为没有大模型

DMCA | PRIVACY | s@bg3.co