赛仕电脑SAS贡献专业 助各产业淘金Big Data
Big Data正夯 SAS走在产业最前端
由于目前市场上各行各业几乎都积极且疯狂的尝试导入Big Data相关技术或服务,来让自家企业能获得更好的获利或更佳的生意机会,尤其是国内外金融业、实体零售业、电子商务业、电信业暨各类相关服务业…。
而也因此目前市场上有非常多国内外相关技术或服务的供应商出现,提供相关产品或服务的解决方案,这也让各行各业的业者一则以喜有这么多成熟且优异的解决方案,却也一则以忧从这么多解决方案中应如何挑选?尤其,有时候即使做了正确的服务选择,但在实际导入的过程中,往往面对的挑战是双方沟通的适应及合作默契,都会影响最后导入的产出成果,而这些都是各行各业业主所头痛的问题…。
◄SAS美国总公司最新的绿建筑,曾出借给电影《钢铁人》拍过电影(图/SAS提供)
本次《ETtoday东森新闻云》产经研究室采访赛仕电脑(以下简称SAS)副总经理高芬蒂,请其为广大对Big Data有兴趣的网友与企业人士,分享SAS这样一个提供世界级统计分析产品与服务的企业,建议国内外企业应如何从BigData淘金?如何帮企业获得期望的Big Data导入结果?
认识Big Data的特性:4个『V』
高芬蒂表示,大数据资料的特性就是指4个『V』,也就是资料的『volume(大量性)』、『variety(多样性)』、『velocity(速度性,包含产生资料的速度、以及电脑处理的速度)』、『veracity(真实性,意指从海量资料背后统计分析出关联与真相)』。亦即,当一个企业面对大量的资料快速生成,且资料的种类已经不限於单纯的结构化资料,而是有更多种类的非结构化资料生成时,如何从这些资料中,透过电脑运算能力与高端统计技巧,成功观察出如此海量资料背后的各类关联关系,这样的描述就符合所谓导入Big Data应用的情境。
举例来说,未来进入物连网(又称智慧连网)时代,人对人、人对物、物对物的沟通,将产生不可思议大量的资料,相关研究指出,其资料产生速度10年内将会比现在增加44倍以上,尤有甚者,未来很多资料的产生方式都不一样了,且更多是属于非结构化的资料…,这些『海量』资料未来如何透过Big Data技术分析出有意义的关联,并据以让政府、企业、法人组织乃至民众得以有效运用,就是未来Big Data领域的重点显学。
Big Data专注的不是『精准』,而是『关连』
意指,当资料大到无法用人力或一般资讯技术来做统计分析的程度时,Big Data就获得了表现的舞台。举例,Facebook或新浪微博这类大型社群网站会员非常多,其会员们每天产生的多媒体资料堪称海量,此时若不使用Big Data技术,就无法快速且有效的分析出各种资料的关联,也因此无法做出很多的行销或广告应用,当然,这些都是业主与广告主最关心的资讯,因而可以想见,其业主于Big Data的分析投入一定是可观的。
▲赛仕电脑(以下简称SAS)副总经理高芬蒂(图/SAS提供)
同样的,Amazon的成功也可归功于Big Data的应用,其能透过BigData做到广告与商品的精准推荐,因而让其网站广告的转换率一向非常高并获得广告主青睐。而这些广告主所关心的,也的确都不是『精准』,而是『关连』。例如,哪类商品推荐给哪类顾客转换率会高?哪类广告跟哪些商品放在一起时消费者会有兴趣一起购买?这些关连性资讯,就是帮助广告主、网路卖家与网站经营者淘金的关键。
另外,高芬蒂举例, Amazon的Big Data应用已经发展到第三代了!第一代是于2001时Amazon推出的书评推荐服务、第二代是隔了几年后推出的依据顾客过往买什么、浏览记录、购物车记录…资料所做的『推荐书单』功能、第三代是开始透过『关连分析』,推荐消费者可能感兴趣的看似不相关的衣物、电影、零嘴…商品。到了第三代时,Amazon早已不只是单纯网路书店,而是网路超级百货公司了。
另举一例,Big Data不只对网路购物有帮助,对于政府与非营利组织更是有远大的帮助。例如,当年H1N1流行时,各国平均要两周以上才能找到病源并予以控制,其实这两周的病毒扩散才是最可怕的风险。因此,当时Google便做了一个实验,利用海量资料分析技术与建立4,500万个数学模型,透过对5,000万个关键字结合搜寻地区的相关连分析2008~2009年的资料,最后找到50个核心关键字,并发现只要这50个关键字于某地区网友搜寻出现评率高时,就可以提前两个礼拜知道这个地区的H1N1将要大流行了。这样的技术成功帮助各国政府未来可监控H1N1的扩散,而这样的分析能力就是Big Data海量分析最重要的也是与传统的统计分析最大的根本差异。
零售业(用于行销)、银行业(用于风险管控)、制造业(用于排程规划)、半导体业(用于品管与设备维护)…是应用Big Data的先锋产业
高芬蒂特别分享,过往大家对Walmart Big Data经典『啤酒尿布』案例的认识早已经是过去式了,现在式是Walmart每天都会结合POS机的交易资料、交易日期、天气气候、地理资讯、其他可得的各类与交易相关资讯…,全都投入做Big Data分析『关连』,然后立即把分析结果资料提供给相关供应商,让供应商据以参考后,『及早』、『精准』的决定应提前备货、铺货的数量与时间。透过这样的资料,成功降低供应商的库存与仓储成本,并成功帮助供应商获得更高营收。
高芬蒂并举一国内案例,万泰银行为了针对刷卡服务做到较好的风险控管,原本月中才拿的到上个月底的刷卡客户信用报告资料,这样的时效性不够并容易面对呆帐与欠款风险,因此首要需求是(1)希望能『即时』获得daily的刷卡客户信用报告分析资料。 (2)次要需求是该类分析报告必须能『视觉化』的呈现以利相关管理单位能够更直观、便利的据以快速做出正确决策。 (3)第三个需求是相关分析结果要能支援于『行动载具』上顺畅呈现,如此一来,对于经常必须移动前往各处开会的主管,就能透过行动载具顺利掌握风险控管情形。高副总表示,SAS已成功与万泰银行合作,解决了上列问题。
▲SAS总公司赞助员工自行车比赛(图/SAS提供)
又例如新加坡摩根史坦利原本就是SAS的老客户,为了服务好摩根史坦利并满足其对于『分析速率』的追求,SAS不断改进与提升产品服务,近来获得的成绩是,过往摩根史坦利透过SAS服务原本要24小时才能算出的金融市场分析资料,现在SAS的新服务只要20分钟,就能帮摩根史坦利透运算分析出来,成功解决客户需求。
其它在台湾像是台北医学大学医疗体系以及万泰商业银行,亦早已是Big Data导入的成功单位。
导入Big Data要成功,高芬蒂给大家的建议
1. 资料的准备:资料准备的工作没完成,或资料搜集与整理的不完整,都无法顺利运作Big Data分析,当然也遑论分析出有意义的『关连』资料。因此,欲速则不达,从资料的准备开始一直到分析出有意义的关连资讯,一般来说平均需要半年左右的时间。建议有意愿导入的企业不要着急,必须按部就班的扎稳基本功才能获得好的成效。
2. 人才的专业:Big Data分析所需要的人才跟传统统计分析需要的人才不一样,因此,建议各单位对外寻找或对内培育相关Big Data人才时,应注意相关人才除了需具备最基本的统计分析能力外,更须具备资管能力(或有资管类人员支援)才更容易导入成功。也因此,SAS特别培育其自家全球近10,000多位Big Data相关成为统计、商业管理、资讯科学三合一人才。当然,很多企业客户也提到目前Big Data人才很难找,高副总建议,可从国内外知名企管、工业工程、统计、经济研究所寻找可造之才。至于判断是不是Big Data人才的关键指标,就是人才的『逻辑分析』能力。
3. 用正确工具:高副总强调,选对Big Data工具真的很重要,例如SAS为了提供给客户最好的服务与产品,几乎每半年就更新释出一个新版本产品,其并深信唯有不断进化与进步,并强化各类功能,才能长久获得客户青睐。