A Tour to LLVM IR（上）

内容概要

什么是LLVM IR?如何得到IR?
LLVM编译的流程，IR文件之间的链接简介
C++ name mangling的用途，「extern C"作用的极简介绍
IR文件的布局
IR中函数定义的结构，什么是BB，什么是CFG
IR是一个强类型语言，如何用工具检查IR的合法性
如何理解Language reference
常见的terminator instruction介绍
如何利用工具得到函数的CFG
什么是SSA？SSA的好处和问题，以及如何解决这个问题

参考文献

what is tail reursion
make clang compile to ll
-cc1的含义
clang和clang++的区别
what is a linkage unit?
LLVM LanguageRef
extern "C"的作用
what is name mangling
what is static single assignment?
what is reaching definition?

1. 什么是LLVM IR？

LLVM IR 是 LLVM Intermediate Representation，它是一种 low-level languange，是一个像RISC的指令集。
然而可以很表达high-level的ideas，就是说high-level languange可以很干净地map到LLVM IR
这使得我们可以高效地进行代码优化

2. 如何得到IR？

我们先以尾递归的形式实现一个阶乘，再在main函数中调用中这个阶乘

// factorial.c int factorial(int val, int total) { if(val==1) return total; return factorial(val-1, val * total); }

// main.cpp extern "C" int factorial(int); int main(int argc, char** argv) { return factorial(2, 1) * 7 == 42; }

注：这里的extern "C"是必要的，为了支持C++的函数重载和作用域的可见性的规则，编译器会对函数进行name mangling, 如果不加extern "C"，下文中生成的main.ll文件中factorial的函数名会被mangling成类似_Z9factoriali的样子，链接器便找不到要链接的函数。

LLVM IR有两种等价的格式，一种是.bc(Bitcode)文件，另一种是.ll文件，.ll文件是Human-readable的格式。我们可以使用下面的命令得到这两种格式的IR文件

$ clang -S -emit-llvm factorial.c # factorial.ll $ clang -c -emit-llvm factorial.c # factorial.bc

我们可以利用grep命令查看clang参数的含义

$ clang --help | grep -w -- -[Sc] -c Only run preprocess, compile, and assemble steps -S Only run preprocess and compilation steps

既然两种格式等价，自然就可以相互转换

$ llvm-as factorial.ll # factorial.bc $ llvm-dis factorial.bc # factorial.ll

对于cpp文件，只需将clang命令换成clang++即可。

$ clang++ -S -emit-llvm main.cpp # main.ll $ clang++ -c -emit-llvm main.cpp # main.bc

A Tour to LLVM IR（上）

内容概要

参考文献

1. 什么是LLVM IR？

2. 如何得到IR？

3. IR文件之间的链接以及将IR转为Target machine code

4. IR文件的布局

4.1 Target information

4.2 函数定义的主要结构

5. IR是一个强类型语言

6. LangRef is your friend

6. 常见的terminator instruction介绍

6.1 `ret`

语法

概述

Example

6.2 `br`

语法

概述

Example

6.3 `switch`

语法

概述

Example

6.4 `unreachable`

语法

概述

Example

6. 控制流图（Control Flow Graph）

7. IR是静态单一赋值的（Static Single Assignment）

7.1 SSA的好处

7.3 SSA带来的问题

7.4 `phi`指令来救场

语法

概述

7.5 `alloca`指令来救场

语法

概述

热门新闻

周热门

A Tour to LLVM IR（上）

内容概要

参考文献

1. 什么是LLVM IR？

2. 如何得到IR？

3. IR文件之间的链接以及将IR转为Target machine code

4. IR文件的布局

4.1 Target information

4.2 函数定义的主要结构

5. IR是一个强类型语言

6. LangRef is your friend

6. 常见的terminator instruction介绍

6.1 ret

语法

概述

Example

6.2 br

语法

概述

Example

6.3 switch

语法

概述

Example

6.4 unreachable

语法

概述

Example

6. 控制流图（Control Flow Graph）

7. IR是静态单一赋值的（Static Single Assignment）

7.1 SSA的好处

7.3 SSA带来的问题

7.4 phi指令来救场

语法

概述

7.5 alloca指令来救场

语法

概述

A Tour to LLVM IR（下）

LLVM每日谈之四十五 LLVM IR TUTORIAL

LLVM每日谈之三十四 LLVM IR生成和转换的几条指令

把华为方舟编译器改造为Go语言编译器会不会比Google官方的Go语言编译器更快？

LLVM物理寄存器分配顺序问题

LLVM每日谈之四十七 LLVM后端文档解析

LLVM中的JIT

[技术论坛]6月22日HelloLLVM上海线下聚会

LLVM每日谈之四十九 LLVM后端文档解析2

使用LLVM + PLY 实现一个C语言子集的玩具编译器

Philis的LLVM魔导书（1）：实现一个简单的Function Pass来优化你的IR

把华为方舟编译器改造为Dart语言编译器会不会比Google官方的Dart语言编译器更快？

iOS编译过程的原理和应用

最难学的十大编程语言，Java排第三，它竟是第一名！

谷歌云游戏平台Stadia更多细节 实际体验取决于玩家带宽

热门新闻

周热门

6.1 `ret`

6.2 `br`

6.3 `switch`

6.4 `unreachable`

7.4 `phi`指令来救场

7.5 `alloca`指令来救场

谷歌云游戏平台Stadia更多细节实际体验取决于玩家带宽