JavaScript 數組的演進及其性能

英文:Paul Shan 譯文:衆成翻譯

zcfy.cc/article/diving-deep-into-javascript-array-8211-evolution-038-performance-void-canvas-4202.html

正式開始前需要聲明,本文並不是要講解 JavaScript 數組基礎知識,也不會涉及語法和使用案例。本文講得更多的是內存、優化、語法差異、性能、近來的演進。

在使用 JavaScript 前,我對 C、C++、C# 這些已經頗爲熟悉。與許多 C/C++ 開發者一樣,JavaScript 給我的第一印象並不好。

Array 是主要原因之一。JavaScript 數組不是連續(contiguous)的,其實現類似哈希映射(hash-maps)或字典(dictionaries)。我覺得這有點像是一門 B 級語言,數組實現根本不恰當。自那以後,JavaScript 和我對它的理解都發生了變化,很多變化。

爲什麼說 JavaScript 數組不是真正的數組

在聊 JavaScript 之前,先講講 Array 是什麼。

數組是一串連續的內存位置,用來保存某些值。注意重點,“連續”(continuous,或 contiguous),這很重要。

JavaScript 數組的演進及其性能

上圖展示了數組在內存中存儲方式。這個數組保存了 4 個元素,每個元素 4 字節。加起來總共佔用了 16 字節的內存區。

假設我們聲明瞭 tinyInt arr[4];,分配到的內存區的地址從 1201 開始。一旦需要讀取 arr[2],只需要通過數學計算拿到 arr[2] 的地址即可。計算 1201 + (2 X 4),直接從 1209 開始讀取即可。

JavaScript 數組的演進及其性能

JavaScript 中的數據是哈希映射,可以使用不同的數據結構來實現,如鏈表。所以,如果在 JavaScript 中聲明一個數組 var arr = new Array(4),計算機將生成類似上圖的結構。如果程序需要讀取 arr[2],則需要從 1201 開始遍歷尋址。

以上急速 JavaScript 數組與真實數組的不同之處。顯而易見,數學計算比遍歷鏈表快。就長數組而言,情況尤其如此。

JavaScript 數組的進化

不知你是否記得我們對朋友入手的 256MB 內存的電腦羨慕得要死的日子?而今天,8GB 內存遍地都是。

與此類似,JavaScript 這門語言也進化了不少。從 V8、SpiderMonkey 到 TC39 和與日俱增的 Web 用戶,巨大的努力已經使 JavaScript 成爲世界級必需品。一旦有了龐大的用戶基礎,性能提升自然是硬需求。

實際上,現代 JavaScript 引擎是會給數組分配連續內存的 —— 如果數組是同質的(所有元素類型相同)。優秀的程序員總會保證數組同質,以便 JIT(即時編譯器)能夠使用 c 編譯器式的計算方法讀取元素。

不過,一旦你想要在某個同質數組中插入一個其他類型的元素,JIT 將解構整個數組,並按照舊有的方式重新創建。

因此,如果你的代碼寫得不太糟,JavaScript Array 對象在幕後依然保持着真正的數組形式,這對現代 JS 開發者來說極爲重要。

此外,數組跟隨 ES2015/ES6 有了更多的演進。TC39 決定引入類型化數組(Typed Arrays),於是我們就有了 ArrayBuffer。

ArrayBuffer 提供一塊連續內存供我們隨意操作。然而,直接操作內存還是太複雜、偏底層。於是便有了處理 ArrayBuffer 的視圖(View)。目前已有一些可用視圖,未來還會有更多加入。

var buffer = new ArrayBuffer(8);

var view = new Int32Array(buffer);

view[0] = 100;

瞭解更多關於類型化數組(Typed Arrays)的知識,請訪問 MDN 文檔。

高性能、高效率的類型化數組在 WebGL 之後被引入。WebGL 工作者遇到了極大的性能問題,即如何高效處理二進制數據。另外,你也可以使用 SharedArrayBuffer 在多個 Web Worker 進程之間共享數據,以提升性能。

從簡單的哈希映射到現在的 SharedArrayBuffer,這相當棒吧?

舊式數組 vs 類型化數組:性能

前面已經討論了 JavaScript 數組的演進,現在來測試現代數組到底能給我們帶來多大收益。下面是我在 Mac 上使用 Node.js 8.4.0 進行的一些微型測試結果。

舊式數組:插入

var LIMIT = 10000000;

var arr = new Array(LIMIT);

console.time("Array insertion time");

for (var i = 0; i< LIMIT; i++) {

arr[i] = i;

}

console.timeEnd("Array insertion time");

用時:55ms

Typed Array:插入

var LIMIT = 10000000;

var buffer = new ArrayBuffer(LIMIT * 4);

var arr = new Int32Array(buffer);

console.time("ArrayBuffer insertion time");

for (var i = 0; i < LIMIT; i++) {

arr[i] = i;

}

console.timeEnd("ArrayBuffer insertion time");

用時:52ms

擦,我看到了什麼?舊式數組和 ArrayBuffer 的性能不相上下?不不不。請記住,前面提到過,現代編譯器已經智能化,能夠將元素類型相同的傳統數組在內部轉換成內存連續的數組。第一個例子正是如此。儘管使用了 new Array(LIMIT),數組實際依然以現代數組形式存在。

接着修改第一例子,將數組改成異構型(元素類型不完全一致)的,來看看是否存在性能差異。

舊式數組:插入(異構)

var LIMIT = 10000000;

var arr = new Array(LIMIT);

arr.push({a: 22});

console.time("Array insertion time");

for (var i = 0; i< LIMIT; i++) {

arr[i] = i;

}

console.timeEnd("Array insertion time");

用時:1207ms

改變發生在第 3 行,添加一條語句,將數組變爲異構類型。其餘代碼保持不變。性能差異表現出來了,慢了 22 倍。

舊式數組:讀取

var LIMIT = 10000000;

var arr = new Array(LIMIT);

arr.push({a: 22});

for (var i = 0; i< LIMIT; i++) {

//arr[i] = i;

p = arr[i];

}

console.timeEnd("Array read time");

用時:196ms

Typed Array:讀取

var LIMIT = 10000000;

var buffer = new ArrayBuffer(LIMIT * 4);

var arr = new Int32Array(buffer);

console.time("ArrayBuffer insertion time");

for (var i = 0; i< LIMIT; i++) {

arr[i] = i;

}

console.time("ArrayBuffer read time");

for (var i = 0; i < LIMIT; i++) {

var p = arr[i];

}

console.timeEnd("ArrayBuffer read time");

用時:27ms

結論

類型化數組的引入是 JavaScript 發展歷程中的一大步。Int8Array,Uint8Array,Uint8ClampedArray,Int16Array,Uint16Array,Int32Array,Uint32Array,Float32Array,Float64Array,這些是類型化數組視圖,使用原生字節序(與本機相同)。我們還可以使用 DataView 創建自定義視圖窗口。希望未來會有更多幫助我們輕鬆操作 ArrayBuffer 的 DataView 庫。

JavaScript 數組的演進非常 nice。現在它們速度快、效率高、健壯,在內存分配時也足夠智能。

相关文章