电影评分的两个世界:1 豆瓣分相当于几个猫眼评分?
一位朋友最近在朋友圈分享了一张截图,当前正在热映的电影,在豆瓣和猫眼电影上有着截然不同的评分。
比如《流浪地球》的猫眼评分高达 9.3,豆瓣为 7.9 分;《疯狂的外星人》,猫眼评分 8.4 分,豆瓣为 6.5 分,差异最大的是《熊出没·原始时代》,在猫眼上 9.2 分的高分电影,豆瓣评分仅为 6.6。
▲ 《流浪地球》的豆瓣评分还掀起过轩然大波
豆瓣和猫眼的评分愈发分裂为两个世界。
普遍认为,豆瓣更接近文艺青年社区,豆瓣电影的评分也更符合这群人的口味;而猫眼电影作为观众观影的「第一入口」,附带的评分也更接近大众口味。一个最直观的不同是,猫眼的评分普遍要比豆瓣评分高一些。
绝大多数时间里,这两个世界并无交集。但是,如果把这两个平台的评分进行横向比较,会发现「文艺青年」和「大众口味」之间诸多有趣的不同,甚至,我们可以据此换算出两个平台的评分间的换算率。
豆瓣电影 Top 250 vs 猫眼电影 Top 100
豆瓣创始人阿北介绍过豆瓣电影的评分机制:把豆瓣用户的打分(一到五星换算为零到十分)加起来,再除以打分人数。每过几分钟,程序会自动重跑一遍,以便把最新的分数加进来。
简单得可怕。
▲ 豆瓣创始人杨勃(阿北)
但这个「一人一票」的打分机制至今都在完美运行,豆瓣电影依然是最有价值的观影参考平台。这主要得益于豆瓣用户群的稳步扩大,以及豆瓣对水军的「非正常打分」的零容忍政策。
最能体现豆瓣用户观影趣味的是「豆瓣电影 Top 250」,这个榜单类似 IMDb(互联网电影数据库)的 Top 250,目标是从所有电影中选出「最好的 250 部」。
豆瓣工程师解释过豆瓣 250 的算法,它比单部电影的评分机制要复杂很多。概括来说,除了评分,这个机制的关键指标有两个:
1、入选的电影应该具备人群的广泛适应性。
2、入选的电影还需要具备持续关注度,不能昙花一现。
因此,《肖申克的救赎》比动漫作品《EVA》更值得进入榜单,1957 年的《十二怒汉》依然能高居榜单的第 32 名。
▲ 《十二怒汉》剧照
猫眼 Top 100 榜是和豆瓣 250 对应的榜单,它是猫眼的观众认为的最好的 100 部电影。
如果将豆瓣 250 和猫眼 Top 100 做一下对比可以发现:
- 豆瓣 250 前100 名的电影的平均分为 9.037,猫眼电影 top 100 的平均分为 9.034。
- 豆瓣 250 前 100 名和猫眼 Top 100 有 64 部电影重合,重合率为 64%。
- 如果将范围扩大,豆瓣 250 和 猫眼 Top 100 有 95 部电影重合,猫眼的榜单中,只有《速度与激情5》、《迁徙的鸟》、《哈利·波特与死亡圣器(下)》、《爱·回家》和《夜访吸血鬼》未入选豆瓣 250。
仅从这两个榜单来看,豆瓣和猫眼只有极其细微的差别。这似乎和我们的印象截然不同。
但仔细观察会发现其中的玄机,猫眼没有公布过 Top 100 榜的算法,在对榜单的介绍中,猫眼对入选的电影加了一个定语「猫眼电影库中的经典影片」,这和豆瓣以全部电影为对象是不同的。
猫眼 Top 100 榜的第一名是《霸王别姬》,评分 9.5 分,但评分人数只有 5900 多人。榜单中的前 10 名,从《肖申克的救赎》到《新喜剧之王》,评分人数从 500 到 5000 不等,这和新电影动辄数万甚至过百万的评分人数形成鲜明的对比。
▲ 《霸王别姬》剧照
作为对比,豆瓣 250 榜单中的前 10 名的评分人数在 50 万至 130 万之间。
所以,猫眼是先圈定了一部分经典电影,然后在这个范围内根据评分和评分人数选出排名最高的前 100 名。它类似猫眼电影的「专业评分」,代表的并不是猫眼观众的趣味。
真正反映豆瓣和猫眼区别的是热映的院线电影的评分。
1 豆瓣分 = x 猫眼分?
我选取了 2 月 27 日广州地区正在院线上映的电影,除去评分人数过少及尚在点映期的电影,共有 18 部,在这些电影的评分上,豆瓣和猫眼截然不同。
这 18 部电影中,猫眼的评分全部高于豆瓣评分,豆瓣的平均平均为 6.5 分,猫眼为 8.5 分,平均分差 1.9 分。
差距最大的电影是《神探蒲松龄》,猫眼 7.8 分,豆瓣 4.1 分,差距 3.7 分;差距最小的电影是《四个春天》,评分相差 0.1 分。
因此,最近热映的电影中,1 豆瓣分 ≈ 1.3 猫眼分。
不过,这个数据量过小,如果以这个结论套用在其他电影上,很容易产生诸如机器学习中的过拟合现象,泛化性极差。
所以,我选用了「一起拍电影」评出的 2018 年度评分最高的 100 部院线电影,并按照票房做了排序,比较了两个平台不同的评分。
100 部电影,猫眼的平均分是 8.1 分,豆瓣的平均分是 5.7 分,比值约为 1.4。
如果根据票房对这 100 部电影进行分层,每个区间也有明显的差别。
当电影的票房小于 100 万或大于 10 亿时,两个平台的分歧最小,猫眼平均分和豆瓣平均分的比值约为 1.2;当票房在 1 亿 – 5 亿之间时,两个平台的评分差距最大,比值约为 1.6。
整体来看,一个比较公允的换算率为:
1 豆瓣分 ≈ 1.4 猫眼分
所以,当你在猫眼看到一部高分电影时,大致可以打 7 折换算为豆瓣评分;如果这部电影是 10 亿票房的超级大片或排期很少的冷门片,可以放宽为 8 折;而如果一部电影引发了一些热度但还不能成为大片,它很正在猫眼和豆瓣上经历截然不同的评分。
电影评分的意义
豆瓣和猫眼其实在 2016 年底共同经历过一段至暗时刻。
《中国电影报》一篇《豆瓣、猫眼电影评分面临信用危机,恶评伤害电影产业》的文章,把两个平台推到了风口浪尖,当时上映的三部国产贺岁电影《长城》、《摆渡人》、《铁道飞虎》,被认为普遍评分过低。
▲ 《摆渡人》口碑曾引发巨大争议,王家卫的一句「我喜欢」引发了半个娱乐圈转发,但也有人喊出了「我不喜欢」
这个文章引发了很多联想和猜测,甚至有媒体报道说,豆瓣和猫眼都因为「评分过低」而被电影局约谈。
但这些猜测最终都被确认为乌龙,电影局出面辟谣,并没有约谈过这两个平台。人民日报随后的评论文章《中国电影,要有容得下 「一星」的肚量》,也作为了此事的最终回应。
这件事还是引起了一些变化:猫眼取消了由影评人、媒体人和电影学者组成评审团打分的「专业评分」,只保留了观众评分,这也是两个世界分裂的开始。
但评分对于电影的意义一直没有改变。
复旦经济学院研究员陈沁 2015 年在上海电影节的报告显示,评分可以直接影响票房:周末上映的电影,豆瓣平均评分每高一分,一家电影院就多赚 35 万的票房。
虽然电影的上映时间、宣发,甚至水军会对票房造成很大影响,但长期来看,评分影响票房的机制会驱动电影制作者专注于提高电影质量。
▲ 电影《后来的我们》收获了 13 亿票房,但它被曝出「退票门」的闹剧
一个值得关注的现象是,2018 年票房前 10 的电影,其猫眼平均评分和豆瓣平均评分的比值为 1.2。而在 2017 年,这个数字为 1.32,如果去除引进片的影响,2017 年这个比值更大,为 1.4。
票房前 10 的电影一般都有接近或超过百万的评分人数,这些看上去差距不大的数字,其实表明了两个世界对国产卖座电影的分歧,正在明显缩小。
今年春节档,沈腾、黄渤这样的演员成了观众、资本、票房共同青睐的对象,流量明星们已经很少出现在大银幕上。
所以,摒弃偏见,更公正地给电影评分,也是想看好电影的我们每一个人的责任。