在美国,人们是怎么给电影评分的?
最近几天,中文互联网上最专业的影评网站“豆瓣电影”成为了电影界激烈讨论的对象。一篇来自广电总局官办的《中国电影报》的文章,称豆瓣电影以及其他社交平台上“个别大V、公众号为博眼球、圈粉丝、流量变现等目的,发布恶意的、不负责任的言论,严重破坏了中国电影的生态环境。”
这件事还真是挺有点活久见的。在美国,如果有这样的批评来自无论民间还是官方,那简直是要笑掉大牙了——从来没听说过一两篇影评,一两家网站就能糟蹋了一国电影生态环境的。如果真有,这国的电影生态环境是有多脆弱呀。
在美国,也有这么几个和豆瓣类似,跟电影有关,主流网民经常访问的网站:专业存储电影信息兼职打分的IMDb(Internet Movie Database互联网电影数据库)、创立快二十年几经易手的烂番茄 (Rotten Tomatoes)、 专业网络购票副业打分的“美国版猫眼”Fandango,以及专门聚合书籍和视听出版产品批评意见的Metacritic。
随着互联网和社交网站的快速普及,这几个网站也形成了独特的电影打分机制,虽然各不相同,但还都挺受电影市场片方、观众和专业批评人士的信任。这也让它们在国内甚至国际上成为了具有公信力的电影评分网站。
它们是怎样工作的呢?
IMDb
现在市面上有一个比较流行的IMDb加权分计算公式,大概长这个样子:
v = 投票人数,实际上是经常投票的人数,也即IMDb活跃用户投票数
m = 进入IMDb Top 250榜单所需的最小票数
C = IMDb数据库所有电影的平均分
这是一个在统计学上公认比较科学的贝叶斯算法实例。但需要明确的是,这个公式只是IMDb维护Top 250电影榜单所使用的,并不是每一部新电影打分都采用这个方法。
平常,IMDb的用户可以用1-10颗星来为一部电影打分,最后IMDb会计算出一个加权平均星数作为得分。用最近上映的星战外传电影《侠盗一号》举例,在IMDb上的得分是8.2。目前《侠盗一号》在Top 250榜单里排名205,也就是说我们可以确定它的得分是用上面那个公式计算得到得了。
但是,为了维护评分的公正,这个日常评分的计算公式仍然是个不能公开的秘密——可知的是,结果依然是加权分,采用了算术平均数(Arithmetic mean)的计算方法,但由于算数平均数容易受到极端数据的影响,IMDb也设计了一些过滤机制。
很明显,IMDb得分是一个普通观众打分的结果。就像美国总统大选有全民投票(popular vote)和选举人票 (electoral vote) 一样,IMDb在全面和公正的同时,也想要追求专业,体现一下电影人的意见。于是在 上图的 “Ratings”后面,还有一个百分制的“Metascore”。
这第二个得分又是怎么来的呢?这就要提到Metascore的来源Metacritic了。
Metacritic
Metacritic是一个出版物专业批评聚合网站,成立于1999年。最早从书评起家,现在的Metacritic的批评对象已经涵盖了音乐专辑、电影、电视剧、电子游戏等视听出版物。注意,重点在于“专业”二字。
要体现专业,首先,Metacritic为电影打出的Metascore是从主流媒体和专业影评机构的影评人那里聚合而来的,这是它和IMDb评分最主要的不同。这些影评人和他们供职的机构,大多在影评方面具有公信力,比如《卫报》、《纽约时报》、《滚石》、《好莱坞记者》,《时代周刊》和NPR等这样的大报和电台,都是能参与Metascore计算的专业影评来源。
但不是每个机构和影评人都会自己给出一个准确的分数。实际上Metacritic是这样做的:来源有分数就用来源分数;来源有星数就大概换算成百分制的分数;如果来源的影评只有文字没有评分,他们就自己找人去阅读影评,然后根据读完的感受自己给一个分,然后再用这个分拿去计算……
虽然这样计算出的Metascore,看上去不是特别能够准确和真实地体现批评家的感受,但至少这十几年过来Metacritic没怎么被质疑过。尽管如此,Metacritic在Metascore之外也还是设立了一个Userscore——不会展现在一部电影的页面上,但用户投票的工具会直接放在Metascore的下方,给用户一种投了票就能影响得分的错觉(详见下图)。
Metascore采用百分制,Userscore打分采用十分制。还是用《侠盗一号》举例,现在的Metascore是65, 整合了51个专业来源;Userscore是7.7,基于1489个用户打分。
烂番茄
烂番茄创立于1998年,一直致力于提供具有公信力的电影打分。其创始人帕特里克·李曾经在Pingwest品玩的SYNC 2016科技大会上介绍过烂番茄的极盛时的风光和设立的机制。这么来看,烂番茄也算是影评界的不老松。
烂番茄没有评分!必须明确烂番茄采用的评价系统叫做Tomatometer,一般翻译成“新鲜度”。一部电影的新鲜度,同样是由专业的影评意见所决定的。在烂番茄上影评人不打分,也不给星,只能给出Fresh(一个新鲜番茄)和Rotten(一个烂番茄)两种标记,分别代表推荐和不推荐。
如果超过60%的影评人推荐一部电影,电影的新鲜度就会整体为Fresh,旁边有一个百分比显示新鲜度,也即具体多大比例的影评人推荐;如果超过75%的影评人推荐,像《侠盗一号》一样,新鲜度就会变成“Certified Fresh”;但如果给Fresh的影评人低于60%,电影就只能得到那一坨绿色的烂番茄了。
和Metacritic一样,烂番茄也需要确保用户的意见能够得到体现,于是又设定了一个Audience Score(观众分数)。这个观众分数采集来源是观众打星,但最后体现出来的所有打出3星半以上的用户比例。
用打好评的影评人/用户占总影评人/用户人数的比例,而不是一个简单的数值来评价一部电影,是烂番茄和其他影评网站在本质上的最大区别。它突出的是人群对一部电影持有的主流观点,而不是用一个无法让每个评价者都感同身受的数值。
这个设定让烂番茄获得了相当高的信誉,但也不是所有粉丝都能接受的了。比如今年的美国大厂烂片代表作《自杀小队》的粉丝,就被糊了一脸只有26%新鲜度的烂番茄。结果这些粉丝以烂番茄敌视DC扩展宇宙电影的罪名,在网上发起集体签名,要求烂番茄关站谢罪……
Fandango
2000年成立的Fandango(原名Tickemaker),可以被理解为美国版猫眼。它慢慢统一了美国混乱的网络票务市场,现在最主要的功能就是网上买电影票,查座位情况,以及查看影评等等。
Fandango对粉丝、用户的地位和意见非常重视,在影评机制上得到了体现。Fandango的电影评价完全采用粉丝打分作为依据。在该网站上,超过17000名粉丝给《侠盗一号》打出了4星半的评价。
Fandango的评分计算方式看上去并不复杂,应该没有什么加权和过滤机制。这也导致了该网站上3星以下电影的数量比烂番茄、Metacritic和IMDb要少得多。幸好Fandango加上了比较专业和严苛的烂番茄新鲜度,以及专业的家庭电影评价机构意见(上图右上角),来中和什么烂片都能咽得下去的粉丝打分。比如星爵克里斯·普拉特和大表姐珍妮佛·劳伦斯主演的《太空旅客》,粉丝打了4分,却得到了一颗只有31%新鲜度的烂番茄,也被负责任的专业机构
所以你看,资深人士从电影的艺术和学术的角度进行的专业批判,和普通观众以获得的感官愉悦和心理满足程度给出的打分,就是这样在互联网上和平共处的。
幸运的是,美国商业电影市场经过了一百年的发展已经格外成熟,无论是创作、制作、院线、影评还是周边开发,都已经走在一条相当专业化的道路上,不太可能像这几天的中国电影界一样,发生如此严重的争吵。在美国,佳片会收到它应得的票房和好评作为奖赏,烂片就算进了电影院也不可能躲得开差评——无论在报纸、电台还是互联网上。在美国,对电影的批评,也是言论自由保护的一部分。
若差评不自由,则高分无意义。连中国前总理周恩来都《在文艺工作座谈会和故事片创作会议上的讲话》里说过,“人民喜闻乐见,你不喜欢,你算老几?”