AI搜集个资恐侵权
(图/路透)
大数据的风潮由来已久,第一波浪潮是2008年,当时有研究者各自利用Yahoo!及Google使用者在网路搜寻的关键字研究,并且分别发布论文指出,可以借由输入关键字的使用者分布情形,来预测流感传染情况,其结果与官方的发现非常接近,时效则远远早了好几天。尽管后来这些模式被发现有问题,还被指称是大数据分析的陷阱。这主要是因为查询者未必就是罹病者,所以可能有落差。这种落差,技术上可以克服。
随着技术的进步,大数据浪潮再起,尤其ChatGPT登场,更让传统的网路搜寻引擎,开始真正出现了AI人工智慧的样貌,难怪越来越受到欢迎与爱用。但很多人可能没有发现,AI大数据很可能侵犯了隐私与个资,而且违反了个资法,但却被忽略了。
我国的《个人资料保护法》第六条明文规定:「有关病历、医疗、基因、性生活、健康检查及犯罪前科之个人资料,不得搜集、处理或利用。」但如果是搜寻引擎或者是其他基于AI的程式例如ChatGPT在搜集呢?
前项法条的例外规定,不在此限:一、法律明文规定。二、公务机关执行法定职务或非公务机关履行法定义务必要范围内,且事前或事后有适当安全维护措施。三、当事人自行公开或其他已合法公开之个人资料。四、公务机关或学术研究机构基于医疗、卫生或犯罪预防之目的,为统计或学术研究而有必要,且资料经过提供者处理后或经搜集者依其揭露方式无从识别特定之当事人。五、为协助公务机关执行法定职务或非公务机关履行法定义务必要范围内,且事前或事后有适当安全维护措施。六、经当事人书面同意。但逾越特定目的之必要范围或其他法律另有限制不得仅依当事人书面同意搜集、处理或利用,或其同意违反其意愿者,不在此限。」
人们在网路搜寻或是利用ChatGPT进行对答,不符合前述的自行公开,但使用相关服务前所同意的服务条款是否已经包含而且符合第六项「书面同意」,还有不少讨论空间。
个资法还规定如果搜集的不是由当事人提供之个人资料,应于处理或利用前向当事人告知其法律权利,除非是「基于公共利益为统计或学术研究之目的而有必要,且该资料须经提供者处理后或搜集者依其揭露方式,无从识别特定当事人者为限。」所以严格说,病历与性生活是绝对不能搜集的,其他资料如果不是当事人提供还要善尽告知义务。
问题是大数据从一开始引起注意,就是跟流感等病例有关,坊间许多谈论大数据的专书,也常常引用网友自行输入的性生活问题作为分析的案例。这算违反个资法吗?
有人可能会说,那是利用网路搜寻关键字,不是真实病例,也不是真实性生活。没错,就像前面提到的大数据分析陷阱,查询流感的未必真的得了流感。但是反过来说,查询流感的绝对有很高比例,已经得了流感。这里面有多少泄漏个资的风险?
还有人会主张说,大数据搜集到的是「大」数据,不是个别资料。关键就在于:搜寻引擎与AI程式所获得的大数据,可以识别特定当事人吗?技术上绝对是可以的,用最简单的网路足迹就可以,如果进一步结合会员资料,更是清清楚楚。当使用搜寻引擎或是ChatGPT等AI程式,我们应该不太愿意自己的隐私或个资被搜集甚至揭露,所以更应该落实个资法。
个资法第三条明文规定:「当事人就其个人资料依本法规定行使之下列权利,不得预先抛弃或以特约限制之:一、查询或请求阅览。二、请求制给复制本。三、请求补充或更正。四、请求停止搜集、处理或利用。五、请求删除。」业者应该主动说明如何落实。(作者为国立台湾艺术大学广播电视学系教授)