理财周刊/从云端到大数据
文.翁伟捷
大数据(Big Data)相关产业蓬勃发展,从纸牌屋效应到生活上最夯的科技新应用,不难发现正要起飞的流行趋势。
「云端运算」一词从2006年由谷歌执行长提出后,自此云端便广为科技业所使用且积极提出相关的运算科技,也将云端运算分门别类,分别有:公有云、私有云、社群云以及混合云。每朵云有每朵云的特性以及应用层面,至于为何要称作「云」端?据称是由于网路运算与云、水回圈的特性相似,因而得名。解读大数据 应用商机广云端运算的基本结构是:载具、网路、伺服器再回到载具,载具包含了个人PC、NB、手机等,经过网路的传输到远端伺服器运算,再透过网路传输回到个人PC、NB等载具,这样的一个循环即是一个完整的运算过程。不过随着手持式行动装置的日渐普及,网路社群及即时通讯软体呈现爆炸性的成长,以及积体电路制造中的新摩尔定律的推波助澜之下,每日透过云端运算的资料已多到无法正确地计算其数量。从消费者端来讲,以上这些资料听起来有点难以理解,的确!云端的概念用生硬的文字解释起来的确有些死气沉沉,让我们这样解释吧!当本栏的读者用灵活的手指每按下一次《理财周刊》脸书的赞,用Line传送一次贴图,甚至是在推特、微博上回应近况的同时,都已经参与了云端运算的过程。
想像一下:附图只是单纯的传输回圈之一,若是有几十亿个传输回圈透过互联网联通,所产生的资料数量是无法详细计数的,简单来说,由于近期全球的数字化以及网路化,累积庞大的数据,造就近期出现「Big Data」(大数据)这样的名词。
所谓的「大数据」,基本上包括三V特色:Volume(资料大小)、Velocity(资料输入出的速度)以及Variety(多样性),因为应用广泛,甚至有人提出第四个定义Veracity(真实性)的特点。也由于数据内容包括结构式以及非结构式的图像、文字以及字串等,因为资料内容过于庞大,必须经过强大的运算才能提供结果,如果没有经过整里,所有数据资料都是无意义的,这就好比是一间拥有无数房间的城堡,透过不同的钥匙可以通往存放不同宝藏的空间,因此想要得到有用的数据宝藏,就必须先找到对的钥匙。大数据的时代凸显出资料解读以及应用的重要性。纸牌屋热播 收视喜恶即时传输近期应用大数据最广为人知的,便是席卷全球的美剧「纸牌屋」,奈飞透过长期搜集来的资料解读后所得出的结果,应用在实际生活中的成功案例。详细说来,奈飞透过顾客在线上收看的各种行为,就能搜集观众的收视喜好与习惯,比如观众会因为哪种剧情太闷而快转、哪种精彩情节则会重复播放收看等等,当消费者按下暂停或快转等收视的过程中,就能产生足以让该公司参考的数据。
总体来说,「大数据」整个过程包括三个步骤:一、数据采集,二、数据分析运算,三、数据的应用。数据采集的方法是透过个人PC、手机、平板或甚至是一个晶片,就能将使用者因使用相关内容所产生的数据透过无线传输上传到资料库储存。试衣间成智慧商店 PRADA时尚变身举例来说,当你进到一间服饰店,开始挑选自己喜欢的衣服,从翻阅到在镜子前试看,直到确定要进入试衣间试穿,最后决定买或不买,整个选购过程都会透过衣服上装置的晶片,将所产生的数据,上传到服饰店的总公司,总公司进行数据分析之后,就知道每件衣服被试穿的次数、试穿的时间以及最终购买与否的结果为何。接下来就能够针对商品进行微调,比如什么颜色在哪个季节受欢迎或是找出更有效的销售市场,比如亚洲喜欢什么款式,欧美倾向何种布料等等,进一步有效开发商品甚至避免资源浪费。觉得这种智慧商店遥不可及吗?以上的过程已经发生在众所皆知的名牌「PRADA」的试衣间里。(文未完)