看啥推荐读物
专栏名称: 不散
相聚有时 电影不散以前是这样,以后也是这样总之,很高兴遇见你们!【不散观影团】往期回顾第1期《何以为家》北京+上海第2期《哥斯拉2》北京第3期《绝杀慕尼黑》广州第4期《X战警:黑凤凰》上海+广州 IMAX第5期《监护风云》北京第6期《蜘蛛侠:英雄远征》上海第7期《素人特工》北京(主创:王大陆、张榕容)第8期《看不见的小孩》北京(主创:泰国导演伊萨拉·纳迪、女主裴蒂·赫格莉)第9期《哪吒之魔童降世》北京+上海+广州第10期《未来机器城》北京亲子场(主创:导演安恪温 / 龙子乔、配音石班瑜)第11期《烈火英雄
今天看啥  ›  专栏  ›  不散

这次,你们真的冤枉豆瓣了

不散  · 豆瓣  ·  · 2020-11-04 18:20
作者: 连城易脆

今年已经是豆瓣网创建的第15个年头,作为国内相对来说最为权威的电影评分平台,豆瓣评分一直是大多数影迷在遴选电影时首选的参考对象。

这就使得豆瓣电影评分在业内备受关注,某种程度上甚至会影响一部电影的票房以及在市场上的具体表现。

然而这两年豆瓣也持续遭受着各式各样公信力的考验,不断有站外媒体以及站内用户质疑起豆瓣电影评分的公正性,唱衰的声音可谓不绝于耳。

就在前几天,豆瓣某用户在小组内的一条名为《豆瓣电影为了控评悄悄改版了》的帖子又引起了轩然大波。

大量的站内用户转载并评价,纷纷表示这样的改版降低了他们对于豆瓣电影评分的信任度,表达了强烈的不解甚至是极大的愤慨。

但上来就指责豆瓣这样的改版是为了控评显然是非常武断的,如同《让子弹飞》中陈坤饰演的胡万直接指责六子吃了两碗粉只给了一碗的钱,然后让其自证清白。

那么豆瓣电影究竟是做了什么样的改版呢?

这样改版到底是出于什么样的目的?是否意味着平台的控评呢?

改版会影响豆瓣电影评分的公正性吗?用户的体验会更好还是更差呢?

改版的方向体现了产品经理的哪些思路,这些思路是否科学呢?

下面就从我自己的观察出发,以Q&A的形式试图给出一些尽量详细的解答。


Q1:豆瓣电影做了哪些改版?

豆瓣电影条目的短评显示页面有这样一条公告:

整理一下,这条公告的内容主要分为三部分:

①短评区不再显示该条目下所有提交的短评内容; ②算法会根据时间及热度等因素筛选出部分短评随机展示给查看的用户; ③与电影无关或者带有人身攻击内容的短评将不计入评分。

根据实际使用体验会发现,短评展示区如果不断向下滑动,最多只会显示500条用户的短评,且不同用户在不同时间段打开同一部电影条目所看到的短评内容也会有所不同。

Q2:豆瓣电影是何时进行改版的?

虽然本次争议是最近才发生的,但是短评区展示规则早在3年前就已经改版了

那为什么改版之初没有引发大规模的争议,反而在3年后却突然发酵呢?

显然,绝大多数用户在查看电影条目下的短评时一般不会看完全部评价,毕竟少则数千条,多则数十万条,用户在多数情况下是没有这样的需求、时间和精力的。

国庆档票房冠军《我的我的家乡》目前已有50000+短评

因此大多数用户只会看两三屏至多四五屏的评价即会关闭该页面,因此不少用户没有觉察到这样的改版。

当然不可否认,一定会有下图这样的用户或者在某个特殊的时刻下,会查看数量较大的评价内容:

只是说,这类用户需求是比较稀少的、特殊的,对于绝大多数用户而言,查看所有短评是一种伪需求,或者说至少不是强需求。

Q3:豆瓣电影为何要做出这样的改变?

反爬虫!反水军!同时引导一个更加积极和正常的讨论氛围。

为此,豆瓣电影昨日也在站内做出了比较正式的回应。不过了解豆瓣网风格的用户都知道,豆瓣的调性始终是比较柔和的,即便面对用户比较激烈的质疑甚至是辱骂,也保持着一贯inner peace的态度,并没有做特别充分的解释,只是站在产品经理的角度针对改版原因进行了简单的阐释:

然而这样朴素的回应估计并不能打消大部分用户的疑虑,反而可能被反污为在寻找借口或者托辞罢了。 而我作为近10年的豆瓣用户,且以数据控自居,常年观察各类电影评分网站,想在下文中用一些具体的案例来为上述回应内容做一个比较充分的注脚,让大家真正理解豆瓣电影改版的目的和苦衷。

Q4:豆瓣电影折叠部分短评为什么可以反爬虫?

折叠部分短评内容可以有效反爬虫,避免用户数据被盗取,且保护服务器。 首先理解一下什么是爬虫?就是由于网页信息量巨大,手动获取效率太低,利用一定规则自动获取网页信息的脚本或者程序。

这里正好可以以我自己作为典型案例加以说明。

我在一些平台上会有“豆瓣电影TOP250观察者”这样的抬头,因为我会持续观察豆瓣电影TOP250榜单的变化,并将变化内容制作成表格数据提供给我的读者:

显然,对比榜单每日变化的情况是一项比较耗时费力的工作,为了更加高效且准确地完成观察,我利用Python自行开发了一个针对该榜单的爬虫小程序,每天只要点一下鼠标,就能在不到15秒内获取完整的榜单信息,再点一下鼠标即可完成历史数据的对比,非常快捷轻松。

我可以瞬间了解到榜单上有哪些电影上榜,又有哪些电影下榜,评分的变化以及评价数量的变化都可以一目了然,程序会帮我自动进行计算。

我利用该爬虫程序自动对比豆瓣电影TOP250榜单数据的显示页面

然而,豆瓣后来应该察觉到了服务器的数据存在被爬虫的情况,进行了适当的调整,如今我的程序已经彻底阵亡了。

这是我后续UI界面升级过的爬虫程序,现在打开后点击右下角的“爬取当前数据”控件,不到几秒钟程序就会被强制退出。这之后的榜单对比我完全是纯手工进行的,脆脆流下了伤心的泪水。

即便豆瓣反爬虫的机制增加了我对比榜单的时间成本,我依然非常理解且赞同豆瓣在这方面的提升与改进。

因为这可以有效避免网站内数据被大量盗取,且可以降低服务器的压力,减少崩溃的次数。

是的,因为爬虫的原理其实就是利用程序自动快速访问页面,大量爬虫程序的存在且反复工作会给网站的服务器带来明显的压力和运行风险。

话题#豆瓣崩了#屡上热搜

采取部分机制反爬虫可以一定程度减少豆瓣服务器崩溃的概率,折叠部分短评自然也能从源头上直接杜绝利用爬虫程序盗取海量用户数据的可能性。

Q5:豆瓣电影折叠部分短评为什么可以反水军?

因为一般只有水军才需要海量用户数据进行画像分析并向自己的甲方爸爸邀功请赏。

任何电影评分平台其实都会面临水军的压力,因此,不能因为有水军就武断地认为平台评分缺乏公正性,而是应该看该平台处理水军并降低其负面影响的手段的有效性。

今天正好是美国的大选日,贿选自然会被认为是非常负面的内容,但是在选举层面也有一个较大的共识,即贿选反而证明了选票的价值。 所以,当大量的水军选择影响豆瓣电影评分,其实恰好证明了豆瓣电影评分的权威性和有效性。而电影评分可以说是豆瓣网的核心资产,豆瓣自然不会放任水军去肆意破坏自己评分的公正性。

还记得2年前微博上出现令人咋舌的“一亿加”转发吗?

毋庸置疑这一定是水军刷出来的数据,但在当时引发了全社会的热议,甚至惊动了央视。为此,微博调整了页面数据显示的规则:当超过100万以后就不再显示具体的数字,只有100万+的字样。

类似的,微信公众号的10万+,网易云音乐的10万+等等显示规则都是为了引导用户不要过度关注数据,也同时让水军在刷数据层面有了一个明显的天花板。

对于豆瓣电影来说,具体的评分是不能模糊的,因此选择对短评展示区进行一定的修改,只做部分展示,而不是全面展示,是一种规避水军的有效方法,可以打击他们的工作积极性。

为什么这么说呢?我们可以尝试代入水军的角度思考一下。

比如你现在是一个水军,你接到某电影宣发方的任务,要求为该电影新增至少1000条好评向的短评,完成即可获得一份还不错的报酬。那么你为了挣这笔钱,收买1000个账号进行无脑好评后,显然还需要向你的甲方爸爸提供你完成任务的证明呀。如何提供?自然是把那些好评以截图的形式打包发给甲方爸爸。

从上述微信对话可以推断出,当豆瓣电影调整了短评显示界面以后,水军就无法快速有效地确认自己的无脑好评是不是被纳入到豆瓣电影评分的计算中去了。有时候确认1条都会有较大的难度,更别说确认1000条这样大量的数据了。

短评显示界面500条的上限,多数情况下可以满足普通用户的需求,同时也直接规避了水军利用短评区来进行KPI考核的方式。这对于水军来说绝对是非常有效的打击。

另外这里,还要着重强调两点:

①豆瓣电影评分是综合所有打分的结果,即包含了不带有短评但是直接打分的评价,以及长评的评价,短评展示的规则是不影响评分的计算逻辑的。

②豆瓣电影评分为了保证自己的有效性,即便发现水军也肯定不会直接告诉你我发现你是水军了。也就是说,即便你的短评出现在了展示页面,也不一定说明你的评分被采纳了。

这是非常科学且聪明的做法,否则一旦水军意识到自己的策略失效,就会重新选择新的进攻方式,豆瓣就只能疲于应对了。当下的策略可以一定程度上麻痹水军,让水军误以为自己成功地完成了任务,实际上只是徒劳罢了。 Q6:豆瓣电影折叠部分短评为什么可以引导更加积极正常的讨论氛围?

你有遇到过因为打了低分而被人私信追着骂的情况吗?

相信有不少用户都经历过类似的事件,这自然是不利于良好讨论氛围的营造的。当然,对部分短评进行折叠不可能完全杜绝这种现象,但是一定能有效地减少。 毕竟当你打开短评区却看到整版整版的污言秽语时,终归不是一件什么好事。而且用户需要明白,对于豆瓣来说,即便他们不想管,也会有网信办工信部的人来管。 如下图所示,这样的短评自然会成为引发攻讦辱骂的导火索,严重影响豆瓣社区的讨论氛围。

其实国外的IMDb网站一样面临过此类争议和困扰,而他们的解决方式则更加简单粗暴——直接关闭了留言板的功能!

随着互联网的不断迭代发展,我们已经进入到一个争议式的社会,任何一个很小的分歧都可能引爆一场巨大的舆论风波,彼此撕得不可开交。

豆瓣应对的策略则是将这类极度不友善的短评内容进行折叠,可谓用心良苦。豆瓣尽了最大努力来保护正常用户的公共讨论空间,却遭受了许多并不公正的质疑。

另外豆瓣显然希望用户对于一部电影的评价更多是基于电影本身质量的判断,而非情绪化地进行与另外一方在数据层面的拉锯战斗。比如有用户看到有人无脑1星评价,于是就选择无脑5星平衡,对于该影视作品来说,无论是1星还是5星,都是欠妥的。

豆瓣并不希望用户通过打反向分数的方式自发反水军,而是希望直接通过算法的方式来屏蔽水军的效应。为了尽可能规避用户出于平衡心理做出的打分,豆瓣自然也会适当地折叠这类评价来减少所谓1星5星大战的情况。

Q7:豆瓣电影改版对于用户的使用体验是更加积极还是消极呢?

总体来说应该是利大于弊。

首先一定要明白一点,这个世界上是没有完美的算法和展示方案的,任何一种选择势必会牺牲一部分用户的体验,同时提升另外一部分用户的体验。因此判断的依据自然是看利大于弊还是弊大于利。

豆瓣当下选择的改版方向,从产品的角度来说应该是利大于弊的。一方面,上文已详细阐释了这些举措对反爬虫、反水军、引导积极正常的讨论氛围所起的作用;另一方面,随机展示也会增加豆瓣用户之间的社交属性。 有下图这样的用户质疑豆瓣短评区的改版使得短评的社交功能丧失,其实并非如此。

这里以电影《寄生虫》为例:

同样是《寄生虫》条目下的热门评论,上午8点22分显示在第一屏上的评价用户是西楼尘、朝暮雪、大旗虎皮,而下午13点55分显示在第一屏上的评价用户则变成了西楼尘、大旗虎皮、舒农、Peter Cat。 由此可见,不同的时间段,豆瓣会显示不同的短评内容给你,不同的用户看到的评价也会有所不同。这其实增加了短评展示的覆盖面,提升了短评区的社交属性

否则如果短评展示死板地基于热度规则进行展示,就会产生明显的马太效应,即热门评论永远是这几个人,基本上看不见其他用户的评论。而这些常年占据热门评论的账号也就更容易成为水军收买的对象。

而短评展示区同时还有【最新】【好友】两种筛选方案进行弥补,因此无论从数量上还是丰富性上,多数情况下都是可以满足用户需求的。 因此用户的体验并不会因为改版有明显的降低,反而会更好地保护评分的公正性,且避免那些极不友善的短评出现在你的手机屏幕上。

Q8:豆瓣电影评分为什么这些年愈发受到更多的质疑呢?

当利益相关的人刷不动评分的时候,自然会选择直接泼脏水的方式污名化豆瓣评分。

在2015年,豆瓣的创始人阿北写过一篇文章《豆瓣评分八问》,文中这样说道:

刷分基本无效之后,干扰豆瓣评分的努力在向“社会工程”进化:针对具体一部片子制造“豆瓣评分有问题”的舆论,想办法打击豆瓣评分整体的公信力,或者直接对豆瓣的工作人员施加心理压力。行业变化很快,不知道将来会变成怎样,但豆瓣自己的想法和立场可以是不变的。

长此以往污名化豆瓣,就可以让豆瓣陷入到所谓的“塔西佗陷阱”中,这样下去,无论豆瓣怎么解释,都无法获得用户的信任,即便说的都是真话、心里话,也都会被歪曲解读为假话。

这其实是对豆瓣网以及豆瓣电影评分最大的伤害,而很多豆瓣用户对此浑然不知,反而被轻易地煽动,进而攻击平台,在无意中为虎作伥,助纣为虐。

这就是典型的杀人还要诛心啊!不仅要毁了豆瓣电影评分,还要污蔑这样一个与商业几乎绝缘的豆瓣收黑钱。

试想一下,什么样的电影片方最希望豆瓣电影评分被唾弃?不就是那些大烂片吗?况且,如今一次又一次地反噬案例证明,刷分反而会起到反作用。

可见折叠部分短评整体上没有太多牺牲用户的体验,反而规避了大量冗余、无效且不友善的信息,同时形成更好的反水军机制,避免水军有针对性地投入。

综上,面对这次针对豆瓣电影短评区展示规则的争议,还请诸位能以更加理性的态度去面对和审视,甚至愿意尝试从产品工程师的视角去看待这个问题,而不要轻易被人利用。

堡垒最容易从内部被攻破,我们作为豆瓣用户应该要有更加清晰的思维逻辑去进行判断,避免亲者痛仇者快,逼得豆瓣不得不剖腹来证明究竟吃了一碗粉还是两碗粉!

*本文仅代表不散作者 连城易脆 个人观点,欲了解更多,可以查看作者另一篇长文——《详解豆瓣、IMDb、猫淘、烂番茄、时光网各大平台电影评分的差异》。




原文地址:访问原文地址
快照地址: 访问文章快照