我们先来看看2019年国内几个比较主流的动画评价网站的评分:

豆瓣剧场动画评分

豆瓣剧集动画评分

MAL十佳

bangumi十佳

bilibili十佳

和bilibili评分最接近的是豆瓣剧集动画评分,这是因为在豆瓣会给剧集动画打分的受众远比剧场动画更为忠实,但是9.9分的bili平均评分相比之下更显夸张。

在我看来,bili的评分总的来说是很失败的。总有人说这样的话「bili的高分都值得看」「bili的低分」都不值得看,这就能参考了。但是,说到这我就有个问题,「值得看」和「不值得看」仅仅是二选一的答案,为何评分这里要却给出5个选择呢?

那么为什么bili能不能看的及格线是9分(十分制),而不是像我们的普通考试一样是60分(百分制)呢?

有的人说bili和淘宝/steam很像,只要不太坑爹都能有个还不错的评价,但是我个人觉得本质完全不一样。因为淘宝/steam的商品是明码标价的,价格因素影响了用户的期望。

举个例子,比如手机。

1000块钱的手机98%好评率和3000块钱手机95%好评率,大部人依然会觉得是3000块钱的商品质量更好——这是客观的评价。

好评率大家心中的这个评价其实是「我花了1000块钱买这个商品,我觉得在这个档位挺值得」——这是主观的评价。虽然可能出现高价买了低配的手机这样的情况,但是大部分时候价格是能够反应手机这类商品的价值的。

而bili评分的动画是没有价格参考因素的,这样就变成所有价位的商品在比拼好评率,这不就乱了套了吗?」

评分系统「相对于「好/差评系统」最大的意义,就是文艺作品是很难明码标价的,需要用户去给这样的文艺作品附带一个可以当作价格那样去参考的价值。一些人说什么bili高分不一定好,但是低分一定不好;实际上就是在混淆评分的概念。

在弹幕文化发源地niconico,他们也搞了个评分系统。在作品播放结束后就有个满意度评分:

「非常满意,比较满意,一般,比较不满意,非常不满意」

因为在头几集的时候筛选出了目标观众,到故事中段留下来的普遍是固定粉丝了,因此N站的好评率走向规律一般是越来越高的。

BILIBILI的评分系统有点类似这个,因为bilibili的评分性质其是「推荐榜」,而不是「排名榜」,代表了观众对一部作品的满意程度以及推荐度。所以我们能看到niconico面对合胃口的片子时,打分对比bilibili一点也不吝啬:

其实客观上看上去,nico的5种满意程度其实和bilibili的1星-5星的打分机制区别不大,但是反应的结果和对观众的引导却比bilibili更加直观。而另外一个动画评分网站BGM在评分机制上,也远比bilibili直观、引导也做得更好:

bili的5星评分机制,10分显示,评分无引导

10星评分机制,10分显示,评分带引导

bili一开始引入评分功能时,很多人还以为这个功能要和之前bili搞得那个兴趣圈那样创业未办而中道崩殂。不过毕竟评分栏就在新番动画的下端,非常方便就能顺手打个分。对于现在表达欲望极其强烈可大部分肚子里又没啥墨水还非常懒的年轻学生而言,没有比这个更加方便的途径。

——上图是2017年网友制作的一张bili全站动画评分参考,你找不到第二个9分档位这么密集的的评分网站的,在全世界都堪称独树一帜。

而在欧美最大的动画评分网站MAL呢,他们的评分分布是怎么样的?

——基本符合类正态分布。

为何两个网站的分布会出现这么大的差异呢?这里就不多谈了。

然而评分反映的只是一方面,在bilibili评分系统中还有其他的一些不可忽视的问题,随著这些问题「评分警察」一词也应运而生。

首先,在我看来,bilibili对评分和评分者的保护是做的非常失败的,很多作品的爱好者一方面给自己的喜欢的作品打满分,一方面却不能接受低评价用户的差评,还会滥用举报功能甚至对低评价用户私信辱骂,这完全已经违背了评分系统建立的初衷。

评分系统是什么?在我看来评分系统是一面镜子:

一部作品的评分中有特别喜欢的人、有一般喜欢的人、有不怎么喜欢的人、有比较讨厌的人...这些人的主观客观评价共同构成了一部作品最终评分的一部分。喜欢/不喜欢的人群永远是客观存在的,但是不刻意刷分的前提下,这些人所占的比例最终会处于一个稳定的数字,使得某一部作品评分也会趋于稳定,从而反映出作品的品质。

但是bili的评分系统无疑是容不下差评的,盲目追求的10分的结果是违背客观事实的,但像上图「我可以给好评,你不能给差评」这样破坏评分体系的做法得到了大多数人极大的推崇,这无疑是不合理的。

其次,bilibili的评分对比其他的评分网站还有一个特点,那些被「大UP带过节奏」的动画评分是比较极端的,这相当于一个信号「UP觉得这部动画怎么怎么样,那么我去打高/低分也是对UP的支持」、「我自己一般不打好/差评,虽然我没看过这部动画,但是我会证明我喜欢UP观点去打好/差评」

这对于一个评分系统更是非常恶劣的影响。很多人看过zhihu、微信等公众号的影评后大概率不会去给作品的豆瓣评分添砖加瓦,但是bilibili的评分系统作为一个社区内部功能,给作品打分却是举手之间。前段时间革命机风波已经能上升成一个可笑的集体行为艺术。

在我看来评分之所以是评分,是因为7分有7分的特征,8分有8分的特征,9分有9分的特征。每个区间比较之下差异是明显的,这个我们平时也听得多了,在叫「区分度」。正因为不可能有完美的动画,所以我们才能通过评分以及评价更加清楚一部动画优劣好坏,去了解这部动画的价值。

——而bili的评分社交意义大过了评分参考,UP主认同感大过了作品认同感。而一个优秀的评分网站并不需要「我喜欢的动画是最棒的」这样的自我陶醉。


开局崩了,补不回来了。

就这么简单啊

说白了,因为评分系统上线的太晚,所以有大量老番凭借死忠粉在系统上线的短时间内就冲到了极高的分数。

而后续补番的绝大多数是被安利(心动)以后才来补番的,给低分的人群会很少。

这就导致产生了一大批9.5评分的老番,甚至冷门+老番+不错质量=9.8分以上。

这就导致了评分系统的崩坏——因为只要低于5?的评价实际上的结果都是差评。

所以选项实际上的意思是,好评,差评,特别差,极其差和屎 。

这就导致了,这个评分展现的不是有多少喜欢,而是有多少人不喜欢,

评分展现的不是作品质量,而是作品「受欢迎度」「普遍性」「争议性」,前两者是正比,后者是反比。

(冷门作品除外)


对于b站的大部分观众来说,评分只需要有

喜欢和不喜欢两个选择就好。

多给他们其他选项反而是麻烦(狗头),就好像小孩子看人只知道好人和坏人两个选项,你硬要教他世界不是非黑即白的,他会接受不能,并且满地打滚。

PS: 从b站九分满地爬来看你就知道b站用户多喜欢打5星了。。。而且狂热者不允许他人不给五星。

@艾蕾 的回答给出了图表,说明了事实。


虽然b站的评分确实虚高 但这并不意味著b站的评分没有意义。

毋庸置疑 b站高分作品数不胜数 绝大多数作品都在9分以上 甚至没有9分都算烂作了。

但b站低分的作品却绝对都有低分的理由 可以让入宅不久的爱好者能够对于烂作一目了然。

妹非妹 迷家 平职 超人高中生 兽娘2 正确的卡多 魔法战争 博人传 轻羽飞扬 皇帝圣印战记 为我而生 圣约女武神 铁血奥尔芬斯 笑容的代价 甚至…我英。

由此可见 b站的高分可能不一定真的就特别好 但低分一定有著让大部分观众都无法接受的不足之处。

而能够让入宅不久的观众分清烂作和佳作 这不就是对于评分来说最重要的部分么?

在b站 没有哪一部很优秀的作品被评的很离谱吧?

b站的评分 相比起对于作品的整体评价 更多的还是「喜欢」和「不喜欢」 仅此而已。

作品质量和喜好是两回事 很多个人喜欢的作品 作品质量并不见得能够高到什么程度。

b站评分最大的败笔在于观众没有评价作品质量 而是以自身的喜好评价一部作品。

但b站评分最大的亮点也在于此 比如《这个勇者明明超强却过分慎重》这样的作品 若平摊作画 剧情 情节设计 主题 人设等等等分支项 可能慎重勇者最后的得分只能有6-7分。

这对于新观众来说无疑是劝退的 但《慎重勇者》这样的作品却又的确值得新观众一看 在这种情况下 b站宽容的评分效果就会意外的不错 让刚入宅不久的新观众不容易错过像这样的好作品。


在我看来 b站的评分更像是对于一部作品的满意度 我想也没有多少人会把它当成作品的综合评价来看吧 ?

我想 比起动画评分 b站评分更接近点外卖 看的开心 觉得这个片子有意思 觉得达到了期待值 甚至超乎预料 那就给个五星好评 很正常。

当然 没有必要戾气那么重 到处说b站评分是笑话 说b站用户群体低龄 这就自讨无趣了。


区分度太低了 ,就跟小学考试一样人均90+ 很优秀的的98 99 普普通通的也能混个95 96 完全看不出有多大差距

有些番剧,比如钢炼cl拿9.9基本上是应为b站最高只有这么高 至于很多其他9.8 9.9,你觉得跟他两只有0.1不到的差距嘛,反正我是不觉得的(类比与学神拿满分是应为试卷只有100)

而 BGM这种虽然小众 但人家就跟高考一样有区分度 9+的只有4部作品,8+都已经是难得一见的佳作了 7分就已经值得一看了 平均分在6.7左右 6分往下的基本上才算是烂作 我反正如果要靠评分找好片子,排雷的话首选就是BGM,b站评分看著乐就行。


推荐阅读:
相关文章