后端 · Hitchhiker

计算 MAXLIVE
如果 k < MAXLIVE，则需要spilling
如果 k > MAXLIVE，则需要重新调度：对于所有\(R_j （j > k）\)，找到一个没有被使用的寄存器\(R_i (i < k)\)，把\(R_j\)的值存到\(R_i\)中，然后更新\(R_j\)的值为\(R_i\)

全局寄存器分配的核心思想是：将整个程序的变量分配到有限数量的寄存器中，尽量减少变量存放在内存（溢出）的次数。常用的方法有冲突图（Conflict Graph）和K-着色（K-coloring），以及Chaitin算法。

冲突图（Conflict Graph）：

首先分析程序的活跃变量信息，确定哪些变量在同一时间段内都“活跃”。
构建一个无向图，图的每个节点代表一个变量。如果两个变量在某个程序点（say, 某条指令）同时活跃，就在它们之间连一条边，表示它们不能分配到同一个寄存器，这两个就是相邻的。
这个图叫做冲突图（或干涉图，Interference Graph）。

K-着色（K-coloring）：

Part3 指令调度
#

硬件角度：可以更好利用处理器的并行性软件角度：重排指令，让更高并行度的指令放在靠近的位置，方便硬件执行

程序实际能跑多快，既取决于程序本身的并行性，也取决于硬件支持、编译器分析能力和调度算法的好坏。

truedependence（真依赖，也叫数据依赖、flow dependence）：
指令B需要用到指令A产生的数据，也就是A写某个变量，B读这个变量。
例如：

A: x = 1
B: y = x + 2

B依赖于A，因为B要用A写入的x的值。

独立的指令可以被并行调度，也就是说没有依赖关系的指令可以同时执行，提高指令级并行性。

通过寄存器重命名，可以消除“假依赖”（即反依赖和输出依赖）。假依赖是因为多个指令使用了同一个寄存器名，但实际上它们之间没有真实的数据传递关系。只要给它们分配不同的寄存器名，这种依赖就不存在了。

然而，物理寄存器的数量是有限的。寄存器分配时必须考虑这个限制，不能无限制地为每个变量分配新的寄存器，否则会超出硬件资源。

寄存器分配的目标是尽量减少寄存器的使用数量，而指令调度则希望有更多寄存器可用以实现更好的并行度。两者之间存在矛盾，实际编译器中往往需要反复权衡和多次迭代。到底先做哪一个，没有统一答案，要根据具体应用场景和优化目标来决定。

节点是基本块中的指令，边是真依赖关系。

构建方法：

把每一条指令（或操作）作为图中的一个节点。
对于每一对指令A和B，判断它们之间是否存在依赖关系（包括数据依赖、反依赖、输出依赖）：
- 如果A写入某个变量，B读取这个变量，并且A在B之前，则A到B画一条有向边（真依赖）。
- 如果A读取某个变量，B随后写这个变量，则A到B画一条虚线（反依赖）。
- 如果A和B都写同一个变量，则A到B画一条虚线（输出依赖）。
删除所有假依赖关系的虚线，重命名寄存器
重复上述过程，直到所有指令对都检查完毕。