辨别假新闻、实时下单 AI在新闻行业走到哪一步?

本文转载自本站新闻学院

8月22日,本站新闻“闻学社沙龙”以《人工智能将如何重塑新闻业》为主题,邀请了来自北大、中大路透社、新华社等机构专家学者,探讨新技术影响下的传媒生态重塑。

以下是路透社市场开发经理王海明主题演讲的整理。

监测核查,人工智能为记者辨别假新闻

Reuters News Tracer是一个监测社交媒体工具,最早用于路透内部,帮助记者和编辑监测社交媒体中出现的新闻信源。后来随着算法的深入,我们发现用机器学习还可以做更多的事情,比如对于社交媒体上发出的信息,可以通过算法区别哪些是新闻,哪些是一般性对话。这个项目经过三四年的不断优化,现在正逐步测试开放给外部用户使用。

News Tracer能够对Twitter上搜集起来的所有可能视为新闻的内容做分析:是谁最先发出消息的;是谁最先转发的;信息的可信度如何。如果分析结果判定消息的真实性存疑,就会在上面标注出来相应的从0%到100%的可信度数值

Reuters News Tracer的界面

段时间我刚好亲历一则上市公司谣言从发布到爆发的传播过程

这则假消息刚刚发布时,我用News Tracer这个工具监测,看新闻源就知道是假的。慢慢增长到800多个点击量,然后有大V或其它媒体转载,当被网站转载以后它就变成新闻发酵了,但不到24小时又被澄清了。“我见证了整个过程,因为我收到第一新闻源特别早,整个假消息传播链条是一开始局限在小范围内,随着新闻网站的转发和大V转发而爆发。”

News Tracer目前的应用范围有以下几个方面:

1. 自动验证新闻真假,它会用算法去分析记者平时可能会关注的问题,去验证新闻的真实性。

2. 通过算法和机器学习剔除广告、垃圾、谣言、一般性谈话等无用信息,摘出要点。根据不同的数据源确定它的真实程度有多高,同时它能够去除噪音,而且会把相同类别的叠在一块儿,作为一个数据组,同时显示未来的更新。

3. 进行实时监测,验证Twitter和其他社交媒体上的新闻。

4. 凭借后台数据库客户可以根据需求搜索相关新闻,分辨真假

传统上说到的人工智能应用都是在分发那一端,而Reuters News Tracer是从新闻来源一端就做了大数据、人工智能、机器学习的应用。

Reuters News Tracer可以通过社交媒体直接抓取由见证者第一时间发布的信息,如果信息真实就直接发布。比如日本地震,网络上最早的消息可能比第一个发布的媒体还早4分钟,由于有亲历者发布,Reuters News Tracer可以进行交叉验证,验证为真就发布出来,发布时还会标注这条新闻的可信度为多少,是50%,70%还是100%,而且会把数据来源显示出来让你辨别。

2机读新闻(Machine Readable News),帮助用户实时下单

2009年起我们就推出了机读新闻 (Machine Readable News) 的产品。用户的下单系统对接我们的Machine Readable News可以自动下单,这个产品到现在为止已经革新了几代,相对来说比较成熟。

通过机器自动读取和分析新闻,系统可以判断事件是正面还是负面,随后便会将结果与历史数据库比较,如:事件正面程度有多高、具体涉及到哪些公司、消息利好程度有多大,从而判断新闻对商品、股价的影响程度。通过以上方式得出的实时数据和分析,能够让机器自行辨别买卖信号直接下单。

更进一步,这个产品还可以根据新闻分析出市场情绪,即给出一个指数指标跟踪市场对资产类别或股票的情绪变化。比如大宗商品或者黄金,根据这段时间的新闻报道来看,大家的情绪是高还是低?我们前端已经将结果做了可视化呈现,用户能很明显地看到结果。

另外就是给出一些经济指标,经济指标相对来说比新闻简单,特别是股票市场外汇市场,现在股票、外汇、大宗商品市场很多交易都来自于这种指标的直接下单。

3通过语义分析,建立企业关系图谱

从新闻里还能发现什么价值?路透社通过对新闻的分析建立了企业关联关系的供应链

人与人之间有各种各样的关系网络,公司之间也是如此。我们有一个引擎,可以根据某些公司新闻做分析,分析之后就能看出这些新闻中提到的其它公司是它的客户、竞争对手母公司、消费者还是子公司,机器分辨出来后会将它们做成一条关联关系。

苹果公司的供应链数据

这里会用到路透原有积累的产品或数据,全球99%的上市公司在我们的数据库里都有ID,这样比较容易找到那些公司。我们还有两个关键数据库,一个是组织机构数据库,另一个是人的数据库,一个是做公司关联,另外一个是做上市公司高管之间的关联,打出标签以后很容易分出上下游和关联关系。第三方用户如果也想做数据处理,直接把原材料放在云端就可以用我们的机器生成关联关系。