如何評價Epic Games今日公布的虛幻引擎5？

（摘自官網）就在不久之前，我們剛剛揭開了虛幻引擎5的神秘面紗。我們對於次世代的願景之一就是讓實時渲染細節能夠媲美電影CG和真實世界，並通過高效的工具和內容庫讓不同規模的開發團隊都能實現這一目標。
演示視頻請見（翻譯來自 @游研社）：
更多背景請見：
http://unrealengine.com/blog/a-first-look-at-unreal-engine-5

很多專業回答了，別的就不多說了，補充一點兒（竊以為的）Nanite背後的核心要素技術（之一）的細節。不是科普文，只適合有一定渲染基礎的人看。

https://devblogs.nvidia.com/introduction-turing-mesh-shaders/?

devblogs.nvidia.com

解釋幾個常見的誤解：

3D scan或者Z brush的模型（幾千萬或者上億面）可以直接用：對也不對。可以直接扔進遊戲引擎編輯器。但是並不能直接扔進渲染管道。中間有個meshlet的剖分預計算過程。簡單來說，烘培（或者模型導入）的時間更長了。（所以我覺得今後美術和關卡之間還會有一個雲伺服器的距離）而且，對於複雜模型，meshlet的自動剖分不見得理想，有時候還是需要手工輔助調整；但是低模-LOD-法線烘培流水線的確可能是要被淘汰了。（well，在移動端還沒有追上來之前，其實也不會淘汰，而是更加分裂）
模型存儲高達*TB：對也不對。製作環境當中的原始文件（3D掃描結果或者zbrush）的存儲開銷的確會很大。所以採用這個新工作流的團隊要考慮用中心存儲替代開發人員的本地存儲，並且要上萬兆網。但是經過meshlet剖分計算之後的頂點存儲，因為meshlet剖分，每個碎片的頂點索引可以被控制在16bit，這就可以大大壓縮存儲容量。

（以上回答基於技術原理推測，不代表UE5或者任何商用產品實際表現）

5/16 更新

先貼兩篇很有見地的分析：

https://zhuanlan.zhihu.com/p/140943267?

zhuanlan.zhihu.com

為什麼UE5支持的多邊形面數一下子提升了這麼多？?

www.zhihu.com

不管猜中沒猜中，能夠快速給出自己的模型，甚至付諸實踐去驗證，真的是非常了不起的。

在這個基礎上，從我的角度點評幾句。一樣只是一家之言，而且也是靠猜，所以隨便看看就好。

Nanite這個技術的重點是實現了高模的渲染。也就是原汁原味地渲染原始的高模，這應該是一個前提條件。無論是Tess，還是用頻域變換的方法，這其實都是在低模上模擬高模，並不是也不能原汁原味地還原原本的高模。也就是說，添加出來的細節其實和原版有很多偏差。

尤其重要的是UV。Tess技術之所以沒有大流行，就是因為UV極難控制。從各位大神分享的Tess的結果mesh上大家也可以看到，哪個3D模型師敢那樣切割多邊形，我覺得無論哪家公司都會讓他第二天捲鋪蓋走人。

所以，我相信Nanite所存儲的是原始的模型。它所解決的是如何根據屏幕自適應載入模型的問題。而不是如何從低模添加細節模仿高模的問題。

我覺得有一個細節很有意思。視頻當中提到貼圖基本都是8k。8k貼圖的像素數是64M。這看起來好像沒啥？但是視頻當中還提到有個模型是3300萬面。這就很有意思了，因為3300萬（33M）差不多正好是64M的一半。

熟悉渲染的同學應該知道，雖然一個三角形需要3個頂點才能描述，但是對於連續的三角形，如果用triangle strip，那麼理想情況下每增加一個頂點就可以增加一個三角形（另外兩個頂點與別的共享）。而在實際項目當中，當然不會那麼理想，但是2:1這個比例是比較常見的。

所以我們不妨大膽假設如 @ycz 所說的那樣，頂點是存儲在貼圖上的。那麼8K貼圖差不多正好能存儲33M三角形。也就是說，3300萬面的模型頂點數據，差不多一張8K貼圖就可以存完。（當然，因為頂點還有頂點屬性，如UV等，可能還需要配套的一張或者幾張8K貼圖）。

那麼這個貼圖多大一張呢？對於高模，我們保守估計頂點坐標需要fp32才行。在這種情況下，一個頂點是12個位元組。當然因為GPU的對齊關係，恐怕實際按照16位元組排列會效率更高。當然多出來的4個位元組也不必浪費，用來存存PBR要的粗糙度金屬度啥的，或者乾脆就是頂點所在的三角形編號（面序號），都可以。

這樣的情況下，非壓縮紋理：64M x 16 = 1GB。很恐怖是吧，但是在PS5的5GB/s+的SSD帶寬下，整體的載入時間也在200ms以下。況且這是非壓縮的情況。

結合VT技術，根據實際需要載入這個紋理當中的一小塊，那麼就更快了。

然後這張紋理還可以做Mips。如果巧妙地在這張圖上排列頂點，使得在3D空間上相鄰的頂點在圖上也排列在一起，那麼Mips實際上就等於求相鄰幾個三角形的退化三角形。也就是自動實現了減面的效果。

當然這有個前提，就是要將模型正確地剖分成小碎片，避免跨越邊界（導數不連續或者激變的地方）。否則Mips會將這些邊緣給平滑掉。我想，Epic也有提到對導出模型的DCC工具有要求，應該也是指這個意思。可能導出的模型當中不僅僅要有mesh，還需要有子表面的分組信息，以便引擎正確將其分割到不同的VT小格子當中。

Anyway，所有一切在UE5正式公布的時候，隨著文檔以及源代碼可見，自然會有確定的答案。但是看到即便是知乎這種並不專業的地方也能有那麼多有見地的分析，十分受鼓舞，對國內數字媒體的將來發展，至少在技術層面，更加感到有信心。

順便再說一下Lumen（對GI自身修養不夠所以就只說一句）：看到有回答調侃數mm到數千米的說法，其實我倒是覺得可能。這種說法其實恰恰是在暗示Lumen的GI是基於屏幕空間（像素）的，而不是基於場景坐標尺寸的。無論是幾mm還是幾千米，只要顯示在屏幕上，就是那麼點兒像素，是吧。所以它們的確是可以都被cover掉的。