LINE DEVELOPER DAY 2019 盛大展开

LINE 于今(2019)年11月20日至11月21日于日本东京举办年度科技盛会-LINE DEVELOPER DAY 2019,吸引各国将近3,000名开发好手齐聚。今年 LINE 首度将 LINE DEVELOPER DAY 2019 扩大为连续两天的活动,LINE 技术朴懿彬于开场演说从人工智慧、数据平台基础设施资安与隐私三大关键技术领域来说明 LINE 如何为用户汇聚更便利有趣的数位生活应用 - LIFE with LINE;其中,人工智慧尤其是今年的重头戏,有多项创新应用于开场时段现场展示;同时,朴懿彬也鼓励外部开发者利用 LINE MINI App 平台发表创新应用,将应用连结到 LINE 平台,丰富 LINE 的生态圈

今年的 LINE DEVELOPER DAY 是第五届,也创下有史以来最多台湾开发工程师参与的纪录,将近30位来自台湾的开发工程师在现场分享有关人工智慧、非技术性主题,如 UI/UX 及专案管理资料及 API 应用等内容,并透过实作工作坊大方分享专业领域知识;近两年,LINE 在台湾投入越来越多的开发资源在人工智慧、资料科学与资料工程上,且透过机器学习不断精进中文的自然语言处理,目前已应用在「LINE 客服小帮手」中的客服机器人,用以更精确的理解和回复用户的问题、在「LINE讯息查证」中,用以判断用户回报的错假讯息是否查核过,以及比对查核结果,也应用于 LINE MUSIC 的歌曲搜寻、LINE 购物的相关商品推荐;另外,台湾的团队也与总部协作将技术应用在 LINE TODAY 的新闻推荐、Smart Channel个人化推播的内容推荐,以及跨服务的搜寻功能等。

LINE 的生态圈中除了有 LINE 开发的多元服务以外,也串接越来越多的外部应用。为促进外部开发社群蓬勃发展,今年大会也发表为外部开发者持续优化的各种 API 工具,包括新版的 LIFF v2、Messaging API、flex message simulator(beta)、以及新推出的 friends statistics API 等,并鼓励外部开发者透过 LINE MINI App 发表平台将应用直接连结到 LINE 平台,让用户在 LINE 的主页聊天室下方的+选单等环节,就可以搜寻或使用这些服务。

同时,LINE 生态系中的服务已累积巨量的用户授权的可用资料,且透过机器学习不断精进以达到更人性化的使用体验,更精确的推论用户偏好。但数据平台上的资料庞大且复杂,为了让大数据发挥效益,产生更大的价值,LINE 一方面利用人工智慧技术进行资料分析,一方面依循两大原则来设计所有系统流程:一切以保护用户隐私为优先考量,以及避免资料孤岛。LINE 建置统一管理的自助式数据平台(Unified Self-Service Data Platform)与基础设施,克服跨服务,整合异质性与非结构化资料的挑战,让资料分析师与资料科学家可以取得完整的学习数据,同时做好严谨的资料管理,以确保资料运用的有效性与适切性。

以下是 LINE 于三大关键技术领域的进展

1. 人工智慧 – 实现人性化的使用体验LINE 于今年大会中展示诸多人工智慧技术的实际应用,包括首度采用脸部辨识加快千人入场报到的程序。与会者在活动前将自己的脸部照片上传至 LINE DEVELOPER DAY 官方帐号中,入场时在柜台仅需不到一秒钟就能透过脸部辨识完成报到,快速消化人潮。将人工智慧发挥得最引人入胜的应用,是开幕时段现场展示的个人化字体产生技术,书写机器经学习后,可以产生一套完整的与个人字迹相仿的日文字体,取代学生手写报告的辛苦。

另一注目焦点则是 LINE BRAIN 计划。LINE BRAIN 整合了 LINE 旗下所发展的各项人工智慧技术,包括 Clova云端虚拟助理,向外推广寻找合作伙伴。在地化的发展策略让 LINE 的人工智慧技术在亚洲掌握了优势,透过日语等亚洲语言数据库的训练,辅以在地用户的行为数据做分析,让 LINE BRAIN OCR 光学字元辨识技术与 LINE BRAIN VISION 人脸及影像辨识技术的准确性较欧美技术高。

今年6月于 LINE东京年会中所展示的以人工智慧协助餐厅处理顾客电话订位语音应答技术,也有具体的进展;采用此技术的 LINE AiCall 服务已正式上线,结合了 LINE BRAIN 的语音识别、聊天机器人和语音合成做自然语言处理,实现自然对话,目前已与日本 My Grill&Bakery Otemachi 等几家特定餐厅开启实际的合作。

2. 统一管理的自助式数据平台与基础设施在 LINE 数据平台上,每日产生超过1兆笔的新记录、压缩过的新数据超过390 TB、执行7万个不同的资料处理程序、在 Presto 上有3万个资料查询程序,每日的资料处理与计算的规模惊人。因此,LINE 采用统一管理的一套可让内部资料分析师和资料科学团队自助使用的数据平台,有效且严谨的运用与分析跨服务所累积的资料;并在云端系统建构和运行基础设施,以支撑全球用户每日传送高达50亿则讯息,以及超过1 Tbps 的网络流量。由于资料位于各服务的数据平台,更需要资讯安全管理,例如确保资料的可搜索性、数据目录的创建、通讯机密等,因此 LINE 以开源技术自建私有云 Verda,将各服务的数据平台整合成一个大平台,有效提升和完成各方面的升级。为处理庞大的网路流量,LINE 建置超过4万台伺服器,若堆叠起来,高度约2,200公尺,超过3.5座日本最高的建筑物东京晴空塔 TOKYO SKYTREE(634公尺)。

3.资安傻隐私 – 一切以保护用户隐私为优先考量LINE 致力保护用户资料和隐私,在合法运用资料的同时,也严格遵守法律和隐私注意事项。为了更严谨的使用数据来优化服务,资料治理是不可或缺的要素。LINE 在所有服务开发初期的功能设计阶段即导入隐私设计(Privacy by Design),隐私和法律团队会进行最严格的审查并提供建议。

LINE 从多个层面同步维护资安与用户隐私,其中包括自2016年推出的 LINE 资安漏洞回报奖金计划,从今(2019)年11月15日起,正式转移到 HackerOne 平台上,向全球顶尖的骇客开放,并定期公开弱点修复报告,持续强化资安防护;自2016年开始每半年定期公布的 LINE 透明度报告,也清楚公开全球执法单位调阅要求之数据;此外,LINE 于每年春秋两季各举办一场围绕资安与用户隐私权议题的高峰论坛,邀请世界各地的专家学者针对数位身份、生物识别、隐私、用户评分机制、人权问题等主题进行广泛且深入的讨论,期为用户提供更安全、可信任的使用环境。同时,LINE 导入机器学习技术打击令人头痛的滥用与垃圾讯息。最初,由于无法即时修正机器学习模型,因而散播垃圾讯息的攻击者隔一段时间就会找到规避的方法,对此 LINE 采用「概念偏移分析」及「无尺度网路」的演算法概念,从攻击者行为的变化中自动学习并修正模型,提高检测准确性且有效抑制垃圾讯息问题。