英文: Alexander Zlatkov 譯文:Troland

github.com/Troland/how-javascript-works/blob/master/webassembly.md

這是 JavaScript 工作原理的第六章。

現在,我們將會剖析 WebAssembly 的工作原理,而最重要的是它和 JavaScript 在性能方面的比對:加載時間,執行速度,垃圾回收,內存使用,平臺 API 訪問,調試,多線程以及可移植性。

我們構建網頁程序的方式正面臨着改革-這只是個開始而我們對於網絡應用的思考方式正在發生改變。

首先,認識下 WebAssembly 吧

WebAssembly(又稱 wasm) 是一種用於開發網絡應用的高效,底層的字節碼。

WASM 讓你在其中使用除 JavaScript 的語言以外的語言(比如 C, C++, Rust 及其它)來編寫應用程序,然後編譯成(提早) WebAssembly。

構建出來的網絡應用加載和運行速度都會非常快。

加載時間

爲了加載 JavaScript,瀏覽器必須加載所有文本格式的 js 文件。

瀏覽器會更加快速地加載 WebAssembly,因爲 WebAssembly 只會傳輸已經編譯好的 wasm 文件。而且 wasm 是底層的類彙編語言,具有非常緊湊的二進制格式。

執行速度

如今 Wasm 運行速度只比原生代碼慢 20%。無論如何,這是一個令人驚喜的結果。它是這樣的一種格式,會被編譯進沙箱環境中且在大量的約束條件下運行以保證沒有任何安全漏洞或者使之強化。和真正的原生代碼比較,執行速度的下降微乎其微。另外,未來將會更加快速。

更讓人高興的是,它具備很好的瀏覽器兼容特性-所有主流瀏覽器引擎都支持 WebAssembly 且運行速度相關無幾。

爲了理解和 JavaScript 對比,WebAssembly 的執行速度有多快,你應該首先閱讀之前的 JavaScript 引擎工作原理的文章。

讓我們快速瀏覽下 V8 的運行機制:

WebAssembly 對比 JavaScript 及其使用場景

V8 技術:懶編譯

左邊是 JavaScript 源碼,包含 JavaScript 函數。首先,源碼先把字符串轉換爲記號以便於解析,之後生成一個語法抽象樹。

語法抽象樹是你的 JavaScript 程序邏輯的內存中圖示。一旦生成圖示,V8 直接進入到機器碼階段。你基本上是遍歷樹,生成機器碼然後獲得編譯後的函數。這裏沒有任何真正的嘗試來加速這一過程。

現在,讓我們看一下下一階段 V8 管道的工作內容:

WebAssembly 對比 JavaScript 及其使用場景

V8 管道設計

現在,我們擁有 TurboFan ,它是 V8 的優化編譯程序之一。當 JavaScript 運行的時候,大量的代碼是在 V8 內部運行的。TurboFan 監視運行得慢的代碼,引起性能瓶頸的地方及熱點(內存使用過高的地方)以便優化它們。它把以上監視得到的代碼推向後端即優化過的即時編譯器,該編譯器把消耗大量 CPU 資源的函數轉換爲性能更優的代碼。

它解決了性能的問題,但是缺點即是分析代碼及辨別哪些代碼需要優化的過程也是會消耗 CPU 資源的。這也即意味着更多的耗電量,特別是在手機設備。

但是,wasm 並不需要以上的全部步驟-它如下所示插入到執行過程中:

WebAssembly 對比 JavaScript 及其使用場景

V8 管道設計 + WASM

wasm 在編譯階段就已經通過了代碼優化。總之,解析也不需要了。你擁有優化後的二進制代碼可以直接插入到後端(即時編譯器)並生成機器碼。編譯器在前端已經完成了所有的代碼優化工作。

由於跳過了編譯過程中的不少步驟,這使得 wasm 的執行更加高效。

內存模型

WebAssembly 對比 JavaScript 及其使用場景

WebAssembly 可信和不可信狀態

舉個栗子,一個 C++ 的程序的內存被編譯爲 WebAssembly,它是整段連續的沒有空洞的內存塊。wasam 中有一個可以用來提升代碼安全性的功能即執行堆棧和線性內存隔離的概念。在 C++ 程序中,你有一塊動態內存區,你從其底部分配獲得內存堆棧,然後從其頂部獲得內存來增加內存堆棧的大小。你可以獲得一個指針然後在堆棧內存中遍歷以操作你不應該接觸到的變量。

這是大多數可疑軟件可以利用的漏洞。

WebAssembly 採用了完全不同的內存模型。執行堆棧和 WebAssembly 程序本身是隔離開來的,所以你無法從裏面進行修改和改變諸如變量值的情形。同樣地,函數使用整數偏移而不是指針。函數指向一個間接函數表。之後,這些直接的計算出的數字進入模塊中的函數。它就是這樣運行的,這樣你就可以同時引入多個 wasm 模塊,偏移所有索引且每個模塊都運行良好。

更多關於 JavaScript 內存模型和管理的文章詳見這裏。

內存垃圾回收

你已經知曉 JavaScript 的內存管理是由內存垃圾回收器處理的。

WebAssembly 的情況有點不太一樣。它支持手動操作內存的語言。你也可以在你的 wasm 模塊中內置內存垃圾回收器,但這是一項複雜的任務。

目前,WebAssembly 是專門圍繞 C++ 和 RUST 的使用場景設計的。由於 wasm 是非常底層的語言,這意味着只比彙編語言高一級的編程語言會容易被編譯成 WebAssembly。C 語言可以使用 malloc,C++ 可以使用智能指針,Rust 使用完全不同的模式(一個完全不同的話題)。這些語言沒有使用內存垃圾回收器,所以他們不需要所有複雜運行時的東西來追蹤內存。WebAssembly 自然就很適合於這些語言。

另外,這些語言並不能夠 100% 地應用於複雜的 JavaScript 使用場景比如監聽 DOM 變化 。用 C++ 來寫整個的 HTML 程序是毫無意義的因爲 C++ 並不是爲此而設計的。大多數情況下,工程師用使用 C++ 或 Rust 來編寫 WebGL 或者高度優化的庫(比如大量的數學運算)。

然而,將來 WebAssembly 將會支持不帶內存垃圾回功能的的語言。

平臺接口訪問

依賴於執行 JavaScript 的運行時環境,可以通過 JavaScript 程序來直接訪問這些平臺所暴露出的指定接口。比如,當你在瀏覽器中運行 JavaScript,網絡應用可以調用一系列的網頁接口來控制瀏覽器/設備的功能且訪問 DOM,CSSOM,WebGL,IndexedDB,Web Audio API 等等。

然而,WebAssembly 模塊不能夠訪問任何平臺的接口。所有的這一切都得由 JavaScript 來進行協調。如果你想在 WebAssembly 模塊內訪問一些指定平臺的接口,你必須得通過 JavaScript 來進行調用。

舉個栗子,如果你想要使用 console.log,你就得通過JavaScript 而不是 C++ 代碼來進行調用。而這些 JavaScript 調用會產生一定的性能損失。

情況不會一成不變的。規範將會爲在未來爲 wasm 提供訪問指定平臺的接口,這樣你就可以不用在你的程序中內置 JavaScript。

源碼映射

當你壓縮了 JavaScript 代碼的時候,你需要有合適的方法來進行調試。

這時候源碼映射就派上用場了。

大體上,源碼映射就是把合併/壓縮了的文件映射到未構建狀態的一種方式。當你爲生產環境進行代碼構建的時候,與壓縮和合並 JavaScript 一起,你會生成源碼映射用來保存原始文件信息。當你想在生成的 JavaScript 代碼中查詢特定的行和列的代碼的時候,你可以在源碼映射中進行查找以返回代碼的原始位置。

由於沒有規範定義源碼映射,所以目前 WebAssembly 並不支持,但最終會有的(可能快了)。

當你在 C++ 代碼中設置了斷點,你將會看到 C++ 代碼而不是 WebAssembly。至少,這是 WebAssembly 源碼映射的目標吧。

多線程

JavaScript 是單線程的。有很多方法來利用事件循環和使用在之前的文章中有提到的異步編程。

JavaScript 也使用 Web Workers 但是隻有在極其特殊的情況下-大體上,可以把任何可能阻塞 UI 主線程的密集的 CPU 計算移交給 Web Worker 執行以獲得更好的性能。但是,Web Worker 不能夠訪問 DOM。

目前 WebAssembly 不支持多線程。但是,這有可能是接下來 WebAssembly 要實現的。Wasm 將會接近實現原生的線程(比如,C++ 風格的線程)。擁有真正的線程將會在瀏覽器中創造出很多新的機遇。並且當然,會增加濫用的可能性。

可移植性

現在 JavaScript 幾乎可以運行於任意的地方,從瀏覽器到服務端甚至在嵌入式系統中。

WebAssembly 設計旨在安全性和可移植性。正如 JavaScript 那樣。它將會在任何支持 wasm 的環境(比如每個瀏覽器)中運行。

WebAssembly 擁有和早年 Java 使用 Applets 來實現可移植性的同樣的目標。

WebAssembly 使用場景

WebAssembly 的最初版本主要是爲了解決大量計算密集型的計算的(比如處理數學問題)。最爲主流的使用場景即遊戲-處理大量的像素。

你可以使用你熟悉的 OpenGL 綁定來編寫 C++/Rust 程序,然後編譯成 wasm。之後,它就可以在瀏覽器中運行。

瀏覽下(在火孤中運行)-http://s3.amazonaws.com/mozilla-games/tmp/2017-02-21-SunTemple/SunTemple.html。這是運行於Unreal engine(這是一個可以用來開發虛擬現實的開發套件)中的。

另一個合理使用 WebAssembly (高性能)的情況即實現一些處理計算密集型的庫。比如,一些圖形操作。

正如之前所提到的,wasm 可以有效減少移動設備的電力損耗(依賴於引擎),這是由於大多數的步驟已經在編譯階段提前處理完成。

未來,你可以直接使用 WASM 二進制庫即使你沒有編寫編譯成它的代碼。你可以在 NPM 上面找到一些開始使用這項技術的項目。

針對操作 DOM 和頻繁使用平臺接口的情況 ,使用 JavaScript 會更加合理,因爲它不會產生額外的性能開銷且它原生支持各種接口。

在 SessionStack 我們一直致力於持續提升 JavaScript 的性能以編寫高質量和高效的代碼。我們的解決方案必須擁有閃電般的性能因爲我們不能夠影響用戶程序的性能。一旦你把 SessionStack 整合進你的網絡應用或網站的生產環境,它會開始記錄所有的一切:所有的 DOM 變化,用戶交互,JavaScript 異常,堆棧追蹤,失敗的網絡請求和調試數據。所有的這一切都是在你的生產環境中產生且沒有影響到你的產品的任何交互和性能。我們必須極大地優化我們的代碼並且儘可能地讓它異步執行。

我們不僅僅有庫,還有其它功能!當你在 SessionStack 中重放用戶會話,我們必須渲染問題產生時你的用戶的瀏覽器所發生的一切,而且我們必須重構整個狀態,允許你在會話時間線上來回跳轉。爲了使之成爲可能,我們大量地使用異步操作,因爲 JavaScript 中沒有比這更好的替代選擇了。

有了 WebAssembly,我們就可以把大量的數據計算和渲染的工作移交給更加合適的語言來進行處理而把數據收集和 DOM 操作交給 JavaScript 進行處理。

番外篇

打開 webassembly 官網就可以在頭部醒目地看到顯示它兼容的瀏覽器。分別是火孤,Chrome,Safari,IE Edge。點開 learn more 可以查看到這是於 2017/2/28 達成一致推出瀏覽器預覽版。現在各項工作開始進入實施階段了,相信在未來的某個時刻就可以在生產環境使用它了。官網上面介紹了一個 JavaScript 的子集 asm.js。另外,這裏有一個 WebAssembly 和 JavaScript 進行性能比對的測試網站。

相關文章