我們先來看看2019年國內幾個比較主流的動畫評價網站的評分:

豆瓣劇場動畫評分

豆瓣劇集動畫評分

MAL十佳

bangumi十佳

bilibili十佳

和bilibili評分最接近的是豆瓣劇集動畫評分,這是因為在豆瓣會給劇集動畫打分的受眾遠比劇場動畫更為忠實,但是9.9分的bili平均評分相比之下更顯誇張。

在我看來,bili的評分總的來說是很失敗的。總有人說這樣的話「bili的高分都值得看」「bili的低分」都不值得看,這就能參考了。但是,說到這我就有個問題,「值得看」和「不值得看」僅僅是二選一的答案,為何評分這裡要卻給出5個選擇呢?

那麼為什麼bili能不能看的及格線是9分(十分制),而不是像我們的普通考試一樣是60分(百分制)呢?

有的人說bili和淘寶/steam很像,只要不太坑爹都能有個還不錯的評價,但是我個人覺得本質完全不一樣。因為淘寶/steam的商品是明碼標價的,價格因素影響了用戶的期望。

舉個例子,比如手機。

1000塊錢的手機98%好評率和3000塊錢手機95%好評率,大部人依然會覺得是3000塊錢的商品質量更好——這是客觀的評價。

好評率大家心中的這個評價其實是「我花了1000塊錢買這個商品,我覺得在這個檔位挺值得」——這是主觀的評價。雖然可能出現高價買了低配的手機這樣的情況,但是大部分時候價格是能夠反應手機這類商品的價值的。

而bili評分的動畫是沒有價格參考因素的,這樣就變成所有價位的商品在比拼好評率,這不就亂了套了嗎?」

評分系統「相對於「好/差評系統」最大的意義,就是文藝作品是很難明碼標價的,需要用戶去給這樣的文藝作品附帶一個可以當作價格那樣去參考的價值。一些人說什麼bili高分不一定好,但是低分一定不好;實際上就是在混淆評分的概念。

在彈幕文化發源地niconico,他們也搞了個評分系統。在作品播放結束後就有個滿意度評分:

「非常滿意,比較滿意,一般,比較不滿意,非常不滿意」

因為在頭幾集的時候篩選出了目標觀眾,到故事中段留下來的普遍是固定粉絲了,因此N站的好評率走向規律一般是越來越高的。

BILIBILI的評分系統有點類似這個,因為bilibili的評分性質其是「推薦榜」,而不是「排名榜」,代表了觀眾對一部作品的滿意程度以及推薦度。所以我們能看到niconico面對合胃口的片子時,打分對比bilibili一點也不吝嗇:

其實客觀上看上去,nico的5種滿意程度其實和bilibili的1星-5星的打分機制區別不大,但是反應的結果和對觀眾的引導卻比bilibili更加直觀。而另外一個動畫評分網站BGM在評分機制上,也遠比bilibili直觀、引導也做得更好:

bili的5星評分機制,10分顯示,評分無引導

10星評分機制,10分顯示,評分帶引導

bili一開始引入評分功能時,很多人還以為這個功能要和之前bili搞得那個興趣圈那樣創業未辦而中道崩殂。不過畢竟評分欄就在新番動畫的下端,非常方便就能順手打個分。對於現在表達慾望極其強烈可大部分肚子裏又沒啥墨水還非常懶的年輕學生而言,沒有比這個更加方便的途徑。

——上圖是2017年網友製作的一張bili全站動畫評分參考,你找不到第二個9分檔位這麼密集的的評分網站的,在全世界都堪稱獨樹一幟。

而在歐美最大的動畫評分網站MAL呢,他們的評分分佈是怎麼樣的?

——基本符合類正態分佈。

為何兩個網站的分佈會出現這麼大的差異呢?這裡就不多談了。

然而評分反映的只是一方面,在bilibili評分系統中還有其他的一些不可忽視的問題,隨著這些問題「評分警察」一詞也應運而生。

首先,在我看來,bilibili對評分和評分者的保護是做的非常失敗的,很多作品的愛好者一方面給自己的喜歡的作品打滿分,一方面卻不能接受低評價用戶的差評,還會濫用舉報功能甚至對低評價用戶私信辱罵,這完全已經違背了評分系統建立的初衷。

評分系統是什麼?在我看來評分系統是一面鏡子:

一部作品的評分中有特別喜歡的人、有一般喜歡的人、有不怎麼喜歡的人、有比較討厭的人...這些人的主觀客觀評價共同構成了一部作品最終評分的一部分。喜歡/不喜歡的人羣永遠是客觀存在的,但是不刻意刷分的前提下,這些人所佔的比例最終會處於一個穩定的數字,使得某一部作品評分也會趨於穩定,從而反映出作品的品質。

但是bili的評分系統無疑是容不下差評的,盲目追求的10分的結果是違背客觀事實的,但像上圖「我可以給好評,你不能給差評」這樣破壞評分體系的做法得到了大多數人極大的推崇,這無疑是不合理的。

其次,bilibili的評分對比其他的評分網站還有一個特點,那些被「大UP帶過節奏」的動畫評分是比較極端的,這相當於一個信號「UP覺得這部動畫怎麼怎麼樣,那麼我去打高/低分也是對UP的支持」、「我自己一般不打好/差評,雖然我沒看過這部動畫,但是我會證明我喜歡UP觀點去打好/差評」

這對於一個評分系統更是非常惡劣的影響。很多人看過zhihu、微信等公眾號的影評後大概率不會去給作品的豆瓣評分添磚加瓦,但是bilibili的評分系統作為一個社區內部功能,給作品打分卻是舉手之間。前段時間革命機風波已經能上升成一個可笑的集體行為藝術。

在我看來評分之所以是評分,是因為7分有7分的特徵,8分有8分的特徵,9分有9分的特徵。每個區間比較之下差異是明顯的,這個我們平時也聽得多了,在叫「區分度」。正因為不可能有完美的動畫,所以我們才能通過評分以及評價更加清楚一部動畫優劣好壞,去了解這部動畫的價值。

——而bili的評分社交意義大過了評分參考,UP主認同感大過了作品認同感。而一個優秀的評分網站並不需要「我喜歡的動畫是最棒的」這樣的自我陶醉。


開局崩了,補不回來了。

就這麼簡單啊

說白了,因為評分系統上線的太晚,所以有大量老番憑藉死忠粉在系統上線的短時間內就衝到了極高的分數。

而後續補番的絕大多數是被安利(心動)以後才來補番的,給低分的人羣會很少。

這就導致產生了一大批9.5評分的老番,甚至冷門+老番+不錯質量=9.8分以上。

這就導致了評分系統的崩壞——因為只要低於5?的評價實際上的結果都是差評。

所以選項實際上的意思是,好評,差評,特別差,極其差和屎 。

這就導致了,這個評分展現的不是有多少喜歡,而是有多少人不喜歡,

評分展現的不是作品質量,而是作品「受歡迎度」「普遍性」「爭議性」,前兩者是正比,後者是反比。

(冷門作品除外)


對於b站的大部分觀眾來說,評分只需要有

喜歡和不喜歡兩個選擇就好。

多給他們其他選項反而是麻煩(狗頭),就好像小孩子看人只知道好人和壞人兩個選項,你硬要教他世界不是非黑即白的,他會接受不能,並且滿地打滾。

PS: 從b站九分滿地爬來看你就知道b站用戶多喜歡打5星了。。。而且狂熱者不允許他人不給五星。

@艾蕾 的回答給出了圖表,說明瞭事實。


雖然b站的評分確實虛高 但這並不意味著b站的評分沒有意義。

毋庸置疑 b站高分作品數不勝數 絕大多數作品都在9分以上 甚至沒有9分都算爛作了。

但b站低分的作品卻絕對都有低分的理由 可以讓入宅不久的愛好者能夠對於爛作一目瞭然。

妹非妹 迷家 平職 超人高中生 獸娘2 正確的卡多 魔法戰爭 博人傳 輕羽飛揚 皇帝聖印戰記 為我而生 聖約女武神 鐵血奧爾芬斯 笑容的代價 甚至…我英。

由此可見 b站的高分可能不一定真的就特別好 但低分一定有著讓大部分觀眾都無法接受的不足之處。

而能夠讓入宅不久的觀眾分清爛作和佳作 這不就是對於評分來說最重要的部分麼?

在b站 沒有哪一部很優秀的作品被評的很離譜吧?

b站的評分 相比起對於作品的整體評價 更多的還是「喜歡」和「不喜歡」 僅此而已。

作品質量和喜好是兩回事 很多個人喜歡的作品 作品質量並不見得能夠高到什麼程度。

b站評分最大的敗筆在於觀眾沒有評價作品質量 而是以自身的喜好評價一部作品。

但b站評分最大的亮點也在於此 比如《這個勇者明明超強卻過分慎重》這樣的作品 若平攤作畫 劇情 情節設計 主題 人設等等等分支項 可能慎重勇者最後的得分只能有6-7分。

這對於新觀眾來說無疑是勸退的 但《慎重勇者》這樣的作品卻又的確值得新觀眾一看 在這種情況下 b站寬容的評分效果就會意外的不錯 讓剛入宅不久的新觀眾不容易錯過像這樣的好作品。


在我看來 b站的評分更像是對於一部作品的滿意度 我想也沒有多少人會把它當成作品的綜合評價來看吧 ?

我想 比起動畫評分 b站評分更接近點外賣 看的開心 覺得這個片子有意思 覺得達到了期待值 甚至超乎預料 那就給個五星好評 很正常。

當然 沒有必要戾氣那麼重 到處說b站評分是笑話 說b站用戶羣體低齡 這就自討無趣了。


區分度太低了 ,就跟小學考試一樣人均90+ 很優秀的的98 99 普普通通的也能混個95 96 完全看不出有多大差距

有些番劇,比如鋼煉cl拿9.9基本上是應為b站最高只有這麼高 至於很多其他9.8 9.9,你覺得跟他兩隻有0.1不到的差距嘛,反正我是不覺得的(類比與學神拿滿分是應為試卷只有100)

而 BGM這種雖然小眾 但人家就跟高考一樣有區分度 9+的只有4部作品,8+都已經是難得一見的佳作了 7分就已經值得一看了 平均分在6.7左右 6分往下的基本上纔算是爛作 我反正如果要靠評分找好片子,排雷的話首選就是BGM,b站評分看著樂就行。


推薦閱讀:
相關文章