何宗武/名嘴化的大数据和金融科技--现代人随机起哄

▲大数据席卷台湾文化圈学术单位亦随之起舞。(图/翻摄自台湾立报脸书

文/何宗武世新大学财务金融学系教授

大四毕业那年在台大文学院选修一门哈佛杜维明教授客座时的东西哲学对话课,课程主要是批判哲学和新儒家。课堂上杜老师讲到一个很生动的同心圆比喻,迄今受用不少:成熟的社会发展,核心是学术圈的教学研究方向,向外扩散到知识圈的讨论,最后是文化圈的热门话题;然而,像巨蛋面包一样,台湾则是文化圈肤浅无聊的话题,影响了知识圈的讨论,再影响了学术圈的教学研究方向。

大数据和金融科技不知不觉席卷了台湾文化圈,知识名嘴纷纷出笼,FinTech/大数据的媒体热度,驱使着学术单位随后追赶。像极了金融市场:热钱流进来,分析师纷纷谈股市上万点;一旦热钱撤离,汇率贬值,股市跌到底,再来找题材。

大数据三个字几乎浮滥到无以复加,从前一阵子「成绩不好的学生,未来捐款比较多」,到最近媒体一则「大数据分析打破迷思,繁星课业表现优」,一再出现这种现象。学术单位闻鸡起舞,奔相走告大数据好伟大。

以前有奈米、云端和 .com,近年大数据充斥一堆「冬虫夏草/经纪人/月下老人」之类的事务,只是ㄧ个枢纽分析就要冠上大数据吸引阅读效果。社媒行销则善用很多这类句型:「因为她做了这三件事,所以30岁赚进人生第一个一千万。」社会科学有许多学术论文,使用大量跨国百年资料库,深入探索的些许发现,都没有宣称大数据研究了。现在一个简单的资料枢纽比对,再计算平均数就醉醺醺不知所云。

金融科技呢?数十年前的「贩卖债务的银行」和「卡奴事件」,庄家将换成金融科技公司。科技型剥削,俨然成形。极小化交易成本,不一定是效率。唯快不破吗?货币幻觉没消失前,就完成支付,这样的经济活动,泡沫连连。时髦字眼纷纷出笼,区块链,深层学习,人工智慧排名居首

只要在特定场合讲话,嘴角不带到这些字眼,就不是现代人。甚至许多人把区块链等同于金融科技,认为区块链是一个神奇的链加上奇妙的区块,这和经过某某开山法师加持过的项链手环一模一样。

柯文哲在脸书上贴「台北大数据」,说明北市的问题。(图/翻摄自柯文哲脸书)

教育单位的大数据和金融科技相关的学习必须要扎实,不能名嘴化。以大数据而论,不是多大量的数据。大数据分析的特点有下列几点:

第一.目前手上资料库,即便容量不大,但是分析者串连「多样」的资料,让数据维度(Dimension)变大了。以繁星为例,资料库不论多大,若只是Excel式的枢纽分析,并构不成大数据分析;举例说明,大数据分析的例子可以是这样:以繁星资料库为基础,串接了学生的社交网路或中小学资料,在「多样」这一面,扩大了数据维度,再探索出新发现。也就是说,资料科学家面对手上的繁星资料,有两条思路:一个是传统的资料库枢纽分析,一个是大数据分析。

另一个例子是中央银行的汇率升值贬值的预测,传统计量模型建构一个汇率方程式,以大量数据估计大模型之后,产生统计预测点和信赖区间。这是传统的既定工作,下一步走大数据可以思考如何引用多样资料扩大维度,一个方向就是透过文字的情绪分析,将社会的乐观悲观资讯建立指标,综合研判。今年3月10日星期五因热钱撤离导致的新台币贬值,并无法从数量方程式的历史数据预测出来;但是,散布于社群网站的文字,或许有重要资讯。

第二.大数据要有大思维,大数据分析不是一个SOP的事情。科学家和工程师差别何在?资料科学之称为科学,就不只是资料挖掘工程。大数据分析需要分析者面资料时,跳脱SOP框架,以创意的设计方法去透析。检而言之,不是一个把资料丢进软体的游戏。

举例而言,透过金融市场的毫秒资料,我们发现股市巨幅涨跌前1分钟,会有一个交叉的重要讯号。这种发现,就是面对一大堆没头没脑的资料时,研究人员必须有创意和巧思,设计研究方法,从不同的频宽中萃取有价值的讯号。所以,只要遇到一个号称大数据分析的成果,可以这样检视:这种结果,事先需要什么特殊的想法吗?这样的成果,何大之有?挖出「繁星生课业表现优」这样的结论,何大之有?

金融科技端也是这样,大众媒体报导可以幼稚肤浅,学术机构要深层耕耘。没有扎实的学术研究成果当基础,闻鸡起舞,随机起哄只会造就浅碟的社会。

大学是有社会责任的,世新大学的「媒体识读」依然任重道远,要继续耕耘奋斗,框正视听。

►掌握最新观点,给88论坛粉丝团按个赞!

●作者:何宗武,世新大学财务金融学系教授,本文经立报同意授权转载,以上言论不代表本报立场。88 论坛欢迎更多声音与讨论,来稿请寄editor88@ettoday.net