Open Data -来自资讯界的社会运动

雨苍

美国独立宣言主要起草人 Thomas Jefferson 曾在1787年写下这段话:

“And were it left to me to decide whether we should have a government without newspapers or newspapers without a government, I should not hesitate to prefer the latter.But I should mean that every man should receive those papers and be capable of reading them.”

「如果要我在没有报纸政府或是只有报纸而没有政府之间选择,我会毫不犹豫的选择后者。我的意思是,所有人都应该可以收到这些报纸,并且能够阅读它们。」

开放政府资料

在一个真正民主的社会选民应该要能理解政府的任何行为,并且有能力去监督政府。这些都需要资讯流通才能做到。资讯的流通可以让选民在投票的时候更理解他们的选择,以及这些选择所带来的后果。也能让人民理解政府究竟做了什么,人们税金到底是怎么花的。

政府在施政的过程中也收集并产生了大量的资讯,例如台湾历年来的 GDP、物价指数或经济相关数据等等。这些数据通常是施政团队在拟定和施行政策时所需要参考的资料。因为政府官僚的组织十分庞大,通常只有具有权限的公务人员或是政务人员才有能力取得这些资料。但人民需要监督政府的施政。如果无法取得,或是无法理解这些资讯,民间的监督就无法落实,人民也容易做出错误的决定。所以 Thomas Jefferson 才会特别说明:单纯开放资讯还不够。这些资讯要让人民可以理解,才是有用的资讯。近年来,由于许多资讯陆续数位化,云端运算的功能也逐渐普及,世界各国开始发起开放政府资讯(Open Government Data,以下称为 Open Data)的运动,要求政府开放这些资料,让民间可以更好的落实对政府的监督,也方便人民对这些资讯进行再处理。美国,英国等国家在2009已经启用了 Open data 的网站,而其他如澳大利亚,加拿大等政府也陆续于2011年开始 Open data(注1、2)。

Open data 对民众有哪些利益呢?一般来说,政府的 Open data 对民众的利益主要有两个方向:一个方向是监督政府。例如公开议会及立法院的院会纪录以及影片,可以让人民清楚自己选出来的立委,究竟在立法院里是支持怎样的议案,可以作为投票的参考。或如政府的预算编列,可以让人民清楚自己的税金是怎么被使用的。另一个方向是便民,例如开放查询门牌号码服务,可以让许多的移动开发者开发相关的应用程式,方便人们使用手机来查询店家资料。开放历年来的经济数据,可以作为人民投资的参考依据,开放公车到站资讯,让开发者可以制作应用程式,把公车到站资讯传输到需要的人的手上(注3);又如不动产交易实价登录,可以让人民清楚真正的不动产成交价,防止地产商哄抬不动产价格。毕竟,政府成立的目的是为了服务民众,这些资料也是使用人民的税金收集而来的。人民理应有权利要求政府开放这些资料供人民使用。

台湾近期发生最有名的事件,莫过于地产实价登录相关事件。台湾于2012年8月开始实施实价登录,也就是不动产交易成功后,需要登录交易价格到政府;而政府可开放民众查询,方便民众作为不动产购置参考。这可以防止地产商哄抬不动产价格,避免房价不断飙高。但是台湾内政部在此政策实施后所开放的查询介面(注4)却非常不好用。有一群台湾的资讯人员看不下去,自己跳出来撰写网站,使用网路蜘蛛(注5)去收集内政部的实价登录查询网页里面的各笔交易资料,并且使用 Google Map 提供的工具做出了非常便民使用的介面(注6)。

如果政府是电力公司

如果把资料用电来比喻,台湾政府运作就像电力公司一样。平常电力公司(政府)会跟民众收取电费(税金),然后透过发电厂,把各处收集来的发电原料(原始资料)转换成电力(资料)。这个电力公司会制作一些电器便民服务),用这些电来运作这些电器。不过这些电器的线路是直接接上发电厂的,里面的电力一般民众没有办法拿去接上自己做的电器。虽然这些电器的效率不是很好,但是服务人民也还算过得去。实价登录这件事情其实就像是因为依据法律规定,电力公司需要制作一个装置,让人民可以享有凉爽的空气,因此电力公司做了一台使用这些电(实价登录资料)的电风扇(内政部查询网站);但是这个电风扇做的不好,很难用,每用几分钟还会停止运作。所幸有个开发团队自己重新做了一台冷气机(民间版网站)。因为电力公司没有提供插座,因此他们只好改造了政府的电风扇,找出里面的线路,把电接上他们的冷气机(图1)。如此一来,希望可以凉快一点的消费者只要使用他们的冷气机就好了。

事实上,为了提升资料使用的亲和度国外政府在Open data的同时往往还会额外提供API(Application Programming Interface,应用程式介面,注7)。API 和网站有什么不同?API 就像插座,民间开发者制作的各种电器只要接上统一格式的插座,就可以引电来用。无论是电视机,冷气机,还是洗衣机,只要制作适当的插头接上插座就可以使用,这样就不用改装政府提供的烂电风扇了(图2)。

图1、目前台湾作法,政府不提供 API,因此只能从政府提供的网站捞出资料。

图2、若以国外作法,政府额外提供 API,民间开发者就可以很方便的取得资料。

人会问:使用政府的资料会不会违法?事实上,以电力公司的比喻来说,这个电风扇的电力是由民众付出的电费来制作出来的。电力公司该做的,就是提供稳定的电力和统一格式的插座,而民众要怎么用这些电,根本就不在电力公司的职责之中;就算有人拿电来犯罪,责任也在犯罪的人身上,而不在电力公司(注8)。

如果使用 API ,电力公司只要提供一个简单的,格式统一的插座就好;对想要用各种电器的人来说,他们只要在需要的时候在插座上插上插头,就可以使用他们想要用的各种家电,不用花费时间来破解电力公司做出来的烂电风扇。以台湾实价登录网站的状况开发人员需要花费时间精力在解析政府的网站内容,而且必须每隔一段时间就要重新解析,否则无法取得最新的资料。这只会增加民间版网站的开发成本。

从这件事情来看,就可以很清楚:台湾的政府事实上并不了解 Open data 的原意及意义。甚至在日后的改版中,还将所有的成交价数字改变为图档,意图阻止其他民间版网站开发者使用网路蜘蛛来收集资料(注9)。这就像是电力公司发现消费者会偷接电风扇的电以后,就把电风扇改版,封死各种可能会被接出电的地方,防止消费者使用冷气机。

在许多专案开发的过程中,往往会出现这种产品不符合客户需求的状况。通常会发生这种状况最大的原因,就是因为资讯不流通,产品提供者无法得知需求者真正需要的是什么。因此在生活中,如果人们需要一个东西,人们往往会到处去问人,去确认这项东西是否真的满足自己的需求。甚至如果可以,会动手下去做出一个满足自己需求的物品出来。毕竟,由使用者动手,做出来的东西最符合需求。也因此,民间开发者制作的网站,往往比政府制作的网站还要好用。

对于这些民间开发人员来说,他们只需要政府提供一个好用的资料查询 API ,就像插头一样,让开发者可以很快的得到需要的资料。至于这些资料要怎么利用,相信人民和开发者会找到最有效率的用途。不过相信各位也很清楚,要政府理解并且改变,可能还需要两三年,甚至更久的时间。

台湾人等不下去了。

如果我们不动手,或许再也没有人会动手了

所幸,有一群热血的开发者站出来。g0v.tw 这个团体在 Yahoo hackday 的活动中,以政府预算的可视化网站(注10)得了奖,并且将奖金捐出来举办了一个 Open data 相关的 hackathon 开发活动(注11)。目前预计在活动上会有动作的专案,除了实价登录网站以外,还包含了解析立法院会议记录国营事业预算监督, 空气品质监测及气象站资料等等不同的专案。这些开发者在工作上就常常与各种资料打交道,而现在,他们打算将政府的资料想方设法的处理成一般人也能理解的数字和文字。

但是这些开发者也需要帮忙。毕竟这些开发者习惯和电脑打交道,他们需要有人可以协助做一些文件处理,以及和政府机关的接触和协调。而且,如果更多人参与,这些开发者做出来的成果将会更符合人们的需求。如果您有意愿,可以到这个地方(https://hackpad.com/ul6fMthof2S)看看,或是参加这些开发者的活动,看看有什么地方可以帮的上忙。套句自由软体开发者最常说的一句话:「如果我们不动手,或许再也没有人会动手了。」 您的任何一个行动,都可以帮助所有的台湾人更容易取得Thomas Jefferson所提到的「可以理解的资讯」。

希望台湾变得更好吗?加入他们一起行动吧!

● 注1、开放资料:http://zh.wikipedia.org/wiki/%E9%96%8B%E6%94%BE%E8%B3%87%E6%96%99● 注2、各国政府资料入口网站及授权方式清单:http://www.opendata.tw/government-data/list-of-government-data-portal-around-the-world-and-the-license-they-choose/● 注3、政府资讯再利用—从Speed Bus事件谈起:http://creativecommons.tw/blog/20110701● 注4、内政部地政司全球资讯网-实价登录专区:http://lvr.land.moi.gov.tw/N11● 注5、网路蜘蛛:http://zh.wikipedia.org/wiki/%E7%BD%91%E7%BB%9C%E7%88%AC%E8%99%AB● 注6、实价登录地图:http://real-price.appspot.com/● 注7、应用程式介面:http://zh.wikipedia.org/wiki/API● 注8、实价登录地图 FAQ:https://docs.google.com/document/pub?id=1ztOae45bbXCnIs6yM5b0QkdecW478TZ6ZKhNN8JBoaQ● 注9、恭喜内政部成功开倒车, 朝 open data 的 "反" 方向, 加速驶去!:https://plus.google.com/111976375055288262207/posts/PNvJfcSmWWL● 注10、中央政府总预算:http://g0v.tw/view4● 注11、g0v hackath0n | 台湾零时政府第零次动员戡乱黑客松:https://hackpad.com/ul6fMthof2S● 注12、本文线上网址为:http://goo.gl/3CMVw。本文由 g0v hackath0n 相关开发人员协力完成,在此感谢这些开发人员的协助。图片由@Luise Wei 提供,在此感谢她的协力。

●作者雨苍,自由软体工作者,Python软体工程师。目前于上海担任软体工程师,兴趣为社会文化观察。雨苍的介绍:http://about.me/billy3321。雨苍的Google+:http://goo.gl/HsZDM。雨苍的文章采用创用cc by-nc授权发布:http://goo.gl/4GxCZ。以上言论不代表本报立场。ET论坛欢迎更多声音与讨论,来稿请寄editor@ettoday.net