网路资讯/驾驭海量资料优化储存率先行

作/IBM系统暨科技事业技术顾问Rick Terry

我们很常收到本地店家送的折价券,但笔者发现店家总是乱枪打鸟,不知道哪种商品的折价券该给谁,促销效果才是最好;这样的问题在海量资料的年代有了新解法。

消费者机会获得常购商品的升级版,或是受邀试用同类但更高价的商品,这些判断都来自于店家分析消费者购物纪录后的结果。

笔者相信很快地,我们就可以根据自己的身高和体重、就诊纪录,买到客制化的止痛药,而不会与其它药物发生抵触,这就是海量资料(Big Data)的真义

什么是海量资料?每一天,我们大约要产生万兆(百万的三次方)」位元的资料,其中有90%产生在过去2年间。资料来源无所不在,从收集气象资讯的感测设备、社交媒体的贴文数位相片影音、购物纪录到手机定位讯号等等。

海量资料有四大面向数量速率种类以及真实性。海量资料的数量增长以TB或PB为单位起跳,企业面临的挑战有可能是要把每天产生12TB的推特(Twitter)推文,转换成有用的产品意见分析,或是把每年3,500万则量测数值转换成更好的电力使用预测

在速率方面若需等待2分钟才有所回应将遭人唾弃,因为企业可能需要检视每天产生的500万笔交易事件,以找出诈欺嫌犯;或是即时分析每天5亿通电话的细部纪录,以更快速地预测用户可能变心离去的原因。

在种类方面,海量资料形形色色,有结构式和非结构式,包括文字、量测资料、影音、点击串流、登入档案等;而综合分析这些资料,将获得崭新的洞察。例如,分析100支监控摄影机的影片,找出特征点;或是挖掘最近在影像、影音与文件当中新增的80%资料,有助于改进客户满意度

至于真实性,有1/3商业领袖并不相信他们做决策的参佐资讯;既然不信任,又该如何做出正确的决策呢?因此,对海量资料建立信赖度的挑战,会随着资料来源越趋复杂、数量爆炸成长而显得困难重重。

储存预算停滞 SIO优化解套

海量技术会影响企业的供应链、客户,还有本身的维运。即使你不是产生海量资料的那一方,也是这些资料产生过程的某个环节,例如客户满意度调查、Twitter和Facebook的贴文、没有如期交货的纪录等,你的一举一动都被观察、衡量和盘算。

然而,庞大多元的资料却面临一个现实:储存预算停滞不增,这也是企业面临的艰难挑战。既然增加经费并不容易,就从优化储存基础设施的层面切入。

为了打造一座稳固的储存设施,IBM提出Storage Infrastructure Optimization(SIO)架构,采用的「Easy Tier」资料分析技术能更妥善利用快取、固态磁碟和容量以优化磁碟,降低储存的成本,同时加速储存的效能

这么一来,客户将能有效管理成本、减轻风险,同时增强服务,而这些作为旨在为明日的海量资料应用做足准备。

储存减重 投资花在刀口

企业要优化储存基础设施的目的,在于追求卓越的组织营运成效,借以打造企业的竞争优势。这个过程就像是盖房子底层要降低储存的成长,顶层要提升敏捷性与优化成本。透过IBM的SIO架构,企业能因应未来的需求,打造真正的营运优势,让储存架构转换成商业需求与计划。

而企业最终目的在于降低成本、提高服务等级并管理风险,展现整体的商业竞争优势。降低企业的资料储存挑战并没有特效药,最优先要做的三件事就是:停止储存过多资料、提高储存坪效、储存在对的地方。

企业的储存主管、资讯长或执行长在认清环绕在海量资料应用的储存挑战后,不要迟疑,赶快行动,为贵公司的资料量瘦身减重。当企业能在储存端获得高效率与低成本后,就有足够的资金能投入在智慧运算上。

终极效益:挖掘商业新洞察

值得一提的是,海量资料并不只是数量大小的议题,还要能让企业有机会从不断衍生的各种资料中,找出新的商业洞察,增强营运的敏捷度,延伸到前所未有的新触角。这种需求其实一直都存在,只是以前缺乏实际驾驭这类机会的方法。

此刻,你采取了什么行动?传统的应用资料,与来自各种关联式和非关联式的资料来源,其数量庞大、甚至混乱,或许也会越长越大,但它们蕴含对企业发展的重要洞察。这些资料的生命可能非常短暂,因此企业必须加快挖掘速度,尽早从砂砾中找到珍珠