作者:NEXT Studios 音頻設計總監 張磊

最近我們又在開發新遊戲《不思議的皇冠》、《Biped 只只大冒險》,感興趣的朋友可以加波願望單支持下~:

https://store.steampowered.com/app/1000010/Crown_Trick/?

store.steampowered.com

biped / 只只大冒險 on Steam?

store.steampowered.com圖標


NEXT Audio DevNotes

Unheard 疑案追聲

雙耳立體聲?環繞立體聲?

3D 聲場、空間混響、人頭效應、ASMR 和其他……

通常,在為一個項目做聲場設計的時候,第一個要解決的是定義聲場的維度。《疑案追聲》中,這也是第一個讓我頗費思量的事,畢竟,遊戲的場景只是……一張房型圖。

2D 遊戲的聲音設計並不新鮮,遊戲本身就是從 2D、2.5D、3D 發展過來的,但《疑案追聲》中,我們的設計目標是讓玩家能夠「聲臨其境」,在 2D 的視覺信息的基礎上,創建一個生動的 3D 聲場,在技術上保證玩家可以獲取足夠的信息來推動遊戲的進程。

我們嘗試的第一個方案,是將場景麥克風吸附在遊戲中的 Phatom 小黑人身上,以他的正面為麥克風的指向,輔以距離-音量衰減等調製手段。實現的效果並不差,但存在兩個問題:

1. 當表徵玩家的小黑人不是面朝屏幕正上方時,畫面的左右和聲場的左右是不一致的,玩家需要自己有一個反應的過程來辨別聽到的聲音和圖示的內容之間的位置關係。經過一些測試後,發現學習成本因人而異,平均下來不算低。

2. 如果連續控制小黑人不停變換方向移動,聲場因為朝向的變化而會發生連續變化,效果是挺酷的,但對玩家不太友好也是真的……

由此,我們嘗試了另一種方案,也是最終在遊戲中保留的方案,那就是場景麥克風的位置依然吸附在小黑人身上,但朝向始終指向屏幕正上方。這就相當於將屏幕上的 2D 場景往前方推倒,翻轉 90 度,避免了音畫方位不同給玩家帶來的困擾。

人走遠了,聲音只是輕了麼?

聲場維度和基本原則的確定只是一個開始,既然我們的目標是讓玩家「聲臨其境」,那麼就得將現實生活中的聽覺規律在聲場中復現。比如,離聲源距離近,聽到的聲音響,離得遠,聲音輕,這就是遊戲中最常用到的距離 - 音量衰減。

可是,擬真怎麼可能這麼容易呢?聲音的傳播是一個複雜的過程,很多因素會對結果產生幹擾,不同的聲音本身在傳播過程中的變化也會有不同。建立一個客觀、完美的聲音傳播模型,可以是物理聲學博士論文的好課題,但不是遊戲音頻設計師的,我們的任務是使用相對簡單的規則,創造令玩家可信的效果。在《疑案追聲》中,除了上述提及的距離 - 音量衰減的調製外,我們還運用了低通濾波、混響比例、相展等不同的調製方法,而不同的音源,每種調製的參數也是不一樣的。

記得有位先賢說過:做遊戲是很費腦子的體力活兒……對的!

前、後、左、右?

解決了距離變化對聲音傳播的影響之後,還要解決聲源和麥克風指向的角度差帶來的影響。在 VR 熱潮之後,類似 ASMR 這一類著重強調雙聲道立體聲逼真效果的音頻內容,在流媒體中頗受用戶青睞。然而這類音頻數據使用了人頭錄音的方式,數據是預渲染的,無法在實時變化的遊戲聲場中重現,這也促使一眾軟、硬體廠商爭相開發相應的產品和工具來增強遊戲中雙聲道立體聲的效果,一時間,你方唱罷我登場,頗為熱鬧。

但是進一步分析會發現,目前行業內大部分的雙耳立體聲增強效果的實現方法都是基於 HRTF 演算法,而這一演算法的問題在我看來:

1. 這是基於統計數值歸納的,而聽覺的主觀判斷很強,得到的效果並不能讓每個人都認同。

2. 這套演算法的年紀……比我都大。

Spatial Audio - Microsoft Research?

www.microsoft.com圖標

好吧,我偷換了概念,但事實是目前大多數的演算法還是過去的幾十年裏幾家大學的研究成果,實際效果差強人意。 在《疑案追聲》的開發過程中,我們嘗試了數種不同的雙聲道立體聲增強演算法之後,還是最終選擇了基於環繞聲進行調製的辦法。這句話有點繞,簡單理解就是,我們沒有使用操作簡單但效果不可靠的方法,而是選擇了效果相對可靠但是操作複雜的方法。

陋室?華堂?

定義聲場還有一個很重要的指標,就是混響,它能讓人第一時間感知到聲源所在空間的細節。在《疑案追聲》中我們選擇的是卷積混響,在增加了可控參數的同時,使聲場特徵更加明確,有助實現「聲臨其境」的設計目標。

在混響的使用中還有一個好玩的設置,就是之前提到過的,通過距離變化來控制直達聲和反射聲的比例。想像一下兩個人在一個大廳中對話,距離近的話,很容易聽清楚對方說話的內容,距離遠的時候,如果說話音量不變,那麼聽到的更多是混響和回聲。

雙聲道立體聲 和 多聲道環繞立體聲

習慣上,大家將這兩種音頻制式籠統地稱為「立體聲」和「環繞聲」。

《疑案追聲》的主平臺是 PC,考慮到 PC 用戶更多會使用 2.0 桌面音箱或耳機,所以我們的縮混工作是以雙聲道立體聲為主來進行的。但同時,我們在縮混的時候依然花了比較多的精力去保證多聲道環繞立體聲條件下,遊戲依然能夠有良好的表現。我的想法是:如果玩家購置了多聲道的設備,即使他/她不是為了我們的這款遊戲而做的投資,事實上他/她確實是比沒有購置的玩家多花了錢,也就理應能夠享受到不同的遊戲體驗。從另一角度,一個用戶用實際行動尊重你的工作、支持你的工作,有什麼理由不讓對方得到你的尊重和回報呢?

對個人而言,我更偏愛在多聲道的環境下體驗《疑案追聲》的效果。有一次我和程序員在製作室裏檢查版本,他坐在靠近門口的地方,身後是左側環音箱,正好遊戲劇情中同樣方位的門打開,他一下子跳起來,以為真有人開門進來…… 《疑案追聲》支持 2.0、5.1 和 7.1 回放,大家有機會可以試一下。

《疑案追聲》的縮混工作都是在 NEXT Sound Room 中完成的

語音製作

「你也會說話,你為什麼要花錢聽我說話?」 —— 郭德綱

專業人員的修養

首先,無論《疑案追聲》最後能否為玩家和市場所接受,都要誠摯地感謝參與配音的中美兩國所有的配音演員、配音導演和相關工作人員,是他們的專業能力和職業素養,為這個項目提供了最紮實的基礎。

與專業人員共事並建立良好溝通是有訣竅的,那就是,自己也足夠專業(對的,不是用你的熱情感染他,不好意思……) !

在《疑案追聲》的語音設計、製作、整合的過程中,有如下一些經驗和教訓:

1. 完整、清晰、充分的角色說明,可以在錄音之前幫助團隊和導演更準確的甄選演員。

2. 劇本的推敲一定要在錄音之前完成,避免錄音時臨時要求數量和劇情結構的改動,這樣的改動在後期很容易造成數據的錯漏,同時也很不專業。

3. 專業配音演員通常可以一人分飾數個角色,但 Casting 的時候還是要盡量避免一人分飾的角色產生對話的情況……

4. 《疑案追聲》是情節為主的語音錄音,在錄音前我們要求每個角色除了臺詞之外,再讓演員提供不同情緒的語氣或短語,這些素材在後期整合的時候常常能幫上大忙。(溝通良好的話,只要不是激烈的情緒表達,這些一般不會另外收費。)

5. 文件命名要規範!文件命名要規範!文件命名要規範!下圖是《疑案追聲》中的語音文件命名,這樣當我們拿到後期完成的數據時,可以快速知道這個文件的基本信息。而且在音頻數據組織完成後,遊戲設計師很方便就能依照簡單邏輯找到需要的事件。

按人物組織數據以便屬性編輯

按場景組織事件以便其他同事使用下方的 ONO 是第 4 點提到的不同情緒的短語

6. 主動、有意識地控制補錄的次數。錄音是很精細的工作,不說演員的狀態,光是演員離話筒的距離發生變化,都會導致錄音數據的無法修正的差異。在《疑案追聲》中,我們的工作時間很大一部分都浪費在這些調整上。在行業狀態無法立即改變的情況下,我們能做的,只能是盡量減少補錄。

夜已深 ?

先在這裡停一下,雖然還有很多內容沒有提及,比如「預算都花在語音製作上了,音樂怎麼弄的?」、「關於主播配音」等等? 但實在是欠了另一個項目太多債要補上,否則進度就來不及了!

NEXT 音頻團隊的 DevNote 還會繼續不定期更新,謝謝知乎的朋友看到這裡。

Sleep No More,繼續幹活兒了!


我也來分享一下關於遊戲音頻聲景(SoundScape)的營造,以下是我的一點簡單分享,給對遊戲音頻設計感興趣的夥伴:

遊戲音頻有一個非常重要的概念,叫做「聲景(SoundScape)」 ,設計並創造聲景,首先要學會「聽」。

通常遊戲音頻設計,就是重現或創造聲景的過程。 創造聲景首先要學會傾聽,聽周圍的事物每一層的聲音是如何的。因為好的聲音設計都是會和人類的一有認知存在聯繫的,這個叫做「適當」。所以要想做出好的聲音 首先要建立系統認知 學會傾聽。

什麼是「傾聽」?

關於「聽」 這裡要講到一個方法,叫「刻意練習」。 其實我們認真聽是可以聽到很多聲音的,包括自己身體正在發出的聲音。 可以試著到一個環境,先嘗試聽離自己近的聲音,想想都有些什麼 是大還是小,是什麼材質,是怎麼樣的 位置如何。然後再逐漸擴大範圍。 掌握一定技巧後 開始嘗試在一些「聲景」環境比較複雜的場景再去「刻意練習」,比如一開始是在自己房間內,後來是到了圖書館裡,然後是路邊,然後是樹林裏雨林裏。

把你聽到的聲音 嘗試去分析、解構。然後 在製作聲音時 嘗試重組那些你聽到的「聲景」。好的聲音設計 都是 需要建立在一些已有認知基礎上的。遊戲聲音設計的本質就是 混合聲音 匹配視覺。好的聲音設計 就是自然生活的解構與重組。 最根本需要認真瞭解聲音的基本知識 學會傾聽。才能創造「聲景」(SoundScape)。


推薦閱讀:
相關文章