网路资讯/企业资料淘金术 Big Data三大主流入门实战

采访/何升龙 主笔曹乙帆

近年来Big Data迅速爆红,面对巨量资料洪流,当前企业最迫切想知道的莫过于,如何去芜存菁地从中撷取出商业智慧?如何寻求符合自己现况目标与需求的不同阶段解决方案?不同阶段下需要什么样的人才?如何培养?借由这次的报导,将带领读者了解台湾有哪些先驱已经开始运用Big Data来取得商机,还有他们是如何做的!

巨量资料三样貌DB、search、Hadoop各领风骚

直到现在为止,巨量资料(Big Data)做为当前最热门话题之一已经延烧了一年多, 相信许多人对于这个议题不致于太过陌生。即使不见得每个企业都有处理巨量资料的必要性与迫切性,但多少能够感受它是改变今后资料储存、处理、分析与使用的重要驱动力,甚至会对今后企业决策, 乃至商业流程的改善、新应用的开发、客户服务的强化与竞争力的提升都会有巨大的冲击与影响。

资讯重要性,从古至今、从个人到企业再到国家皆然,资讯的掌握可以让个人成为博学之士而受人敬重,资讯的掌控也可让企业与国家分别在商场与战场上打赢胜仗

随着各类型资料量的激增,个人早已经历过资讯爆炸的洗礼,如今企业更进一步地被卷入巨量资料的洪流之中,如何快速有效且精准地从浩瀚的资料大海中萃取出能够满足,甚至引领顾客需求,并在商场上出奇致胜的智慧,俨然成为当前企业不可避免的最大考验与挑战, 否则企业不是被一波又一波的资料洪流所吞噬,就是被巨量无用甚至有害的内容所拖累。

面对巨量资料洪流,当前企业最迫切想知道的莫过于,如何去芜存菁地从中撷取出商业智慧?如何寻求符合自己现况、目标与需求的不同阶段解决方案?新方案与撷取的资讯如何与企业既有流程、系统、应用、服务及人力相整合?不同阶段下需要什么样的人才?如何培养?

事实上,企业对于资料的搜集、处理与分析不会太过陌生,毕竟同样的事情,在处理结构性资料时便早已亲身经历过,其目的一样是从中萃取出商业智慧精华,只不过今天碰到的是更多、再多、超级多的资料,且比例上会是以半结构性与非结构性资料居多的新局面罢了。由于传统与结构性资料较活络资料库、资料仓储与商业智慧,无法直接搞定这些资料新成员的搜集、储存、转换、处理及整合问题,这方面需要全新的技术架构与平台来面对。讲明白点,只要将半结构性与非结构性资料转换成为传统资料库及资料仓储看得懂的样子,那么传统资料分析体系一样能为企业从中撷取出可帮助企业做出重大决策的商业智慧。

说穿了,当前巨量资料技术主要就是搞定半结构性与非结构性资料,毕竟结构性资料再怎么爆量,传统资料库及资料仓储皆可轻松驾驭。

同时,为了更精准掌握产品良率、客户脾胃市场脉动,将更多的半结构性与非结构性资料一并纳入分析自然成为非常重要的事情。

如果企业决定迎接巨量资料, 那么势必要面临巨量资料处理的3个基本阶段,首先要面对的莫过于半结构性与非结构性资料的撷取与储存,由于这类资料的数量太过庞大,所以传统技术架构很难符合成本地解决储存问题,于是乎Hadoop遂应运而生,成为解决巨量资料的当红炸子鸡

接下来是将整并好的资料,交由资料仓储来进行资料分析、处理及转换,这是整个巨量资料处理阶段中最关键也最复杂的一环,对于一些拥有特定需求的企业,若要满足特定应用之分析需求的话,可能得借助资料科学家(Data Scientist) 的协助。相对于过去资料分析师来说,资料科学家不但具备数学、统计及演算法等专家背景,在透过特定演算法开发出应用模型的同时,也能清楚描绘出模型背后所敏锐察觉出的特定市场应用商机轮廓。当然,并非所有企业都有挖掘特定应用的需求与必要,自然也不一定非得聘请昂贵的资料科学家不可,全凭企业需求及预算而定。

至于第3个阶段亦即商业智慧的报表仪表板呈现,让经由上述2 个步骤获取的资讯,转变成为企业各面向重大决策的有力参考。这方面可以透过传统商业智慧方案进行,不过,目前市场上已出现标榜支援In-memory Computing或In-memory DB技术,且效能更精进的商业智慧方案。

当前举凡传统资料库、资料仓储、商业智慧厂商、系统整合商及代理商,甚至搜寻式的商业智慧厂商等,莫不看好巨量资料的庞大商机。

当然这些厂商所推出的解决方案种类繁多,有的提供资料撷取及储存的专属设备,有的则全力投入资料分析或商业智慧领域,也不乏上述3个阶段都有产品提供的整体方案商。原则上,3个阶段中的后2个阶段,仍然是传统资料仓储及商业智慧厂商的天下,不过两者自然地特别为巨量资料进行最佳化及改版。

为了兼顾全面性,本文将介绍进入巨量资料3种不同面貌及专业背景的厂商及解决方案,不同需求的不同企业,都可以从中找到属于自己的巨量资料解决方案。

其中,资料库厂商出身的甲骨文,提供了从资料撷取、储存,到资料仓储分析,再到商业智慧呈现的整体解决方案。

丽台科技看好并代理达梭系统具备介面与化繁为简能力的搜寻式商业智慧方案,企业可以透过亲和搜寻引擎找出巨量资料的新蓝海

系统整合商精诚资讯,结合IT as a Service、咨询顾问及教育训练的实力,提供自家开发的Hadoop设备型巨量资料解决方案,协助企业避开艰涩的Hadoop技术门槛,快速拥抱巨量资料的好处。

网路资讯256期