「缓冲」圈圈转不停有解? MIT盼用AI改善串流体验

实习记者黄肇祥综合报导

影片总是被「缓冲」搞得兴致全无吗?观众会因此离开,创作者失去点阅率,广告商曝光减少,为让串流影片更流畅的播放,麻省理工学院研究团队希望借由人工智慧(AI)改善串流体验

▲看影片被迫中断进入缓冲,时常让人动气。(图/翻摄 Youtube)

观看串流影音时,系统并不会将整部影片直接下载到手机电脑,而是拆成一小部分分别传送,但传输速度时候无法跟上观众的收看进度,也因此许多时候网页会选择稍微降低影片画质优先影像呈现,接着等待网路稳定再恢复观看画质,YouTube 就是采用这种做法,衡量网路速度,并保持足够缓冲区让观看不中断。

相同的研究不只 Google,卡内基美隆大学也曾开发出一款「预测控制模型」(MPC),该系统会依据网路速度的改变途径,进而分析推理出合适的缓冲策略,然而类似常见的系统,基本架构建立于一套运算法,依据网路状况的起伏来调整,然而手机网路时常受限于外在环境,若只依靠运算法来行事,并无法对应不同网速变化

麻省理工学院的 CSAIL 团队希望摆脱模型与演算法,让 AI 自行选择合适的演算方法。他们研发一款名为「Pensive」的 AI 来处理这方面问题,他们引入神经网路系统,透过不断学习、改善,寻找最佳影像观看体验的缓冲模式

▲同一支影片、相同的网路速度,但若有不同的运算方式,将能提升观看品质。(图/翻摄 Youtube)

从 CSAIL 团队释出的影片中可以发现,对比 MPC 模型,Pensive 在网路持续下滑到最低点之前,率先将影片画质降低至 360p,相同的时段 MPC 仍处于 720p 的高画质,导致网路持续低速后,MPC 再转换运行 240p 已经来不及,被迫中断播放进入缓冲,CSAIL 也与其他模式进行测试,最后发现 Pensive 的再缓冲减少 10-30%,体验品质获得 10-25% 的明显提升。

▲Pensive 会针对不同的情况,进行画质的调整。(图/翻摄Youtube)

CSAIL 的带队教授 Mohammad Alizadeh 在一份声明当中说道,这套系统还能够针对用户进行客制化,「我们的系统各方面都是灵活的,你可以想像一个使用者也能个性化他的串流体验,基于他想要的优先顺序去调整缓冲。」Alizadeh 教授也表示团队将陆续应用在 VR 系统上,他坦言若网路要传输 VR 影像,目前的环境是有难度的,透过 Pensive 或许是很好的第一步。

或许未来我们有机会看到 YouTube、Netflix 采用这项技术,透过 AI 辅助现有的串流平台,让使用者有更好的影视体验,相信也有利于推广 VR 影像的应用。