LLVM中的JIT

原創內容，轉載請註明出處

作者：汪巖

1. JIT編譯

JIT（just-in-time）即時編譯技術是在運行時（runtime）將調用的函數或程序段編譯成機器碼載入內存，以加快程序的執行。所以，JIT是一種提高程序時間和空間有效性的方法。程序運行時編譯和執行的概念最早出自John McCarthy在1960年發表的論文《Recursive functions of symbolic expressions and their computation by machine》，James Gosling在1993年在關於Java的論文中使用了」JIT」這個術語。JIT可以分為兩個階段：在運行時生成機器碼和在運行時執行機器碼。其中，第一個階段的生成機器碼方式與靜態編譯並無本質不同，只不過生成的機器碼被保存在內存中，而靜態編譯是在程序運行前將整個程序完全編譯為機器碼保存在二進位文件中。運行時 JIT 緩存編譯後的機器碼，當再次遇到該函數時，則直接從緩存中執行已編譯好的機器。因此，從理論上來說，JIT編譯技術的性能會越來越接近靜態編譯技術。

為了模擬JIT的運行原理，如下代碼演示瞭如何在內存中動態生成add函數並執行，該函數的C語言原型如下：

long add(long num) {

return num + 1; }

void* alloc_writable_memory(size_t size) {

void* ptr = mmap(0, size, PROT_READ | PROT_WRITE, MAP_PRIVATE | MAP_ANONYMOUS, -1, 0); if (ptr == (void*)-1) {

perror("mmap");

return NULL; } return ptr; } void emit_code_into_memory(unsigned char* m) { unsigned char code[] = { 0x48, 0x89, 0xf8, // mov %rdi, %rax 0x48, 0x83, 0xc0, 0x01, // add $1, %rax

0xc3 // ret

}; memcpy(m, code, sizeof(code));} int make_memory_executable(void* m, size_t size) { if (mprotect(m, size, PROT_READ | PROT_EXEC) == -1) { perror("mprotect"); return -1; }

return 0;

} const size_t SIZE = 1024;typedef long (*JittedFunc)(long); // Allocates RWX memory directly. void emit_to_rw_run_from_rx() { void* m = alloc_writable_memory(SIZE); emit_code_into_memory(m);

make_memory_executable(m, SIZE);

JittedFunc func = m; int result = func(2); printf("result = %d
", result); }

上述代碼主要可分為三步：

a. alloc_writable_memory調用mmap在堆上分配可讀/可寫/可執行內存塊；

b. emit_code_into_memory將實現add函數的字元串形式機器碼拷貝到內存塊中。這一步驟可類比為JIT中調用運行時生成機器碼；

c. 將內存塊轉換為指針類型並調用執行。這一步驟可類比為JIT中通過獲得函數地址調用函數。

2. LLVM執行引擎(LLVM Execution Engine)

LLVM JIT使用執行引擎(execution engine)來支持LLVM模塊的執行。ExecutionEngine類的申明在<llvm_source>/include/llvm/ExecutionEngine/ExecutionEngine.h中，執行引擎既可以用JIT也可以用解釋器的方式支持執行。執行引擎負責管理整個客體(guest)程序的執行，分析需要執行的下一個程序片段。客體程序是指不能被硬體平臺原生支持的代碼，比如，對於x86平臺來說，LLVM IR模塊就是客體程序，因為x86平臺不能直接執行LLVM IR代碼。

在LLVM中有三個持續演進的JIT執行引擎實現：llvm::JIT類、llvm::MCJIT類和llvm::ORCJIT類，llvm::JIT類在新的LLVM已經不再支持。JIT客戶端會首先產生一個ExecutionEngine對象。ExecutionEngine對象以IR模塊為輸入，通過調用ExecutionEngine:: EngineBuilder()初始化。接下來，ExecutionEngine::create()方法生成一個JIT或MCJIT引擎實例。