编译与链接详解-代码优化

转自：旧友与酒

C语言编译原理中间代码优化的好处是多方面的，它可以在不同层面上提升软件的质量和性能。提高执行速度、减少内存使用、降低能耗、改善响应时间、提升代码可维护性、增强可扩展性、减少错误和异常、提高资源利用率、适应不同的硬件架构、满足性能要求、减少开发成本、提升竞争力。
代码优化是一项重要的软件开发活动，它不仅可以提升软件的性能，还可以在多个方面为开发者和用户带来好处。下面简要介绍中间代码优化的一些常见步骤：

解析优化

在解析阶段，编译器可以进行一些简单的优化，比如消除未使用的变量和常量折叠。

//优化前：
int a = 5;
int b = 10;
int c = a + b;

//优化后：
int a = 5;
int b = 10;
int c = 15;

中间代码生成

编译器将源代码转换成一种中间形式，常见的中间代码有三地址码（Three-Address Code）和四元组（Quadruples）。

公共子表达式消除（Common Subexpression Elimination, CSE）

识别并消除程序中重复的表达式，避免重复计算。

//优化前：
int a = 5;
int b = 10;
int c = a * b;
int d = a * b; 	// 重复计算相同的表达式

//优化后：
int a = 5;
int b = 10;
int c = a * b;
int d = c; 		// 直接使用c的值，避免重复计算

死代码消除（Dead Code Elimination, DCE）

移除那些计算结果不会被使用的代码，减少程序的执行时间和空间占用。

//优化前：
int a = 5;
int b = 10;
int c = a + b; 	// 假设c的值后面不再使用

//优化后：
int a = 5;
int b = 10;		// 因为c的值不再使用，所以整个计算可以被删

循环不变代码外提（Loop Invariant Code Motion, LICM）

将循环体内的循环不变表达式移到循环外部计算，减少循环内的计算量。

//优化前：
for (int i = 0; i < 10; i++) {  
	int x = i * 2; // 循环不变表达式  
	int y = a + x; // a是循环外定义的变量
}

//优化后：
int x = 0; // 循环不变表达式移动到循环外
for (int i = 0; i < 10; i++) {  
	x = i * 2;  
	int y = a + x;
}

强度削弱（Strength Reduction）

将一些复杂或耗时的操作替换为等价但更简单或更快速的操作，例如将乘法操作替换为加法。

//优化前：
for (int s = 0; s < 100; s++) {  
	int x = s * 2; // 使用乘法
}

//优化后：
int x=0;
for (int s = 0, x = 0; s < 100; s++) {  
	x += 2; // 使用加法代替乘法
}

循环展开（Loop Unrolling）

复制循环体的一部分或全部，以减少循环控制开销和提高指令级并行性。

//优化前：
for (int i = 0; i < 100; i++) {  
	process(i); // 假设process是一个函数调用
}

//优化后：
for (int i = 0; i < 100; i += 4) {  
	process(i);  
	process(i+1);  
	process(i+2);  
	process(i+3);
}

代码调度（Code Scheduling）

重新安排指令的执行顺序，以减少数据依赖和提高指令执行的并行度。

寄存器分配

优化变量的存储位置，尽可能将频繁访问的变量放在寄存器中，减少内存访问时间。

//优化前：
int a, b, c;
a = 5;
b = 10;
c = a + b;

//优化后（伪代码）：
assembly
// 假设编译器将变量a和b分配到寄存器R1和R2
MOV R1, 5
MOV R2, 10
ADD R3, R1, R2 // 将结果存储在另一个寄存器R3

全局优化

在全局范围内进行优化，比如全局常量传播、全局死代码消除等。

结构化优化

对程序的结构进行优化，比如通过循环融合、循环分割等技术来改善程序的结构。

代码生成

将优化后的中间代码转换成目标机器的指令序列。

总结

这些步骤并不是一成不变的，不同的编译器可能会采用不同的优化策略和顺序。
此外，编译器的优化能力也会影响到最终生成代码的性能。
在实际应用中，编译器通常会提供不同的优化级别供用户选择，以平衡编译时间和生成代码的性能。

解析优化​

中间代码生成​

公共子表达式消除（Common Subexpression Elimination, CSE）​

死代码消除（Dead Code Elimination, DCE）​

循环不变代码外提（Loop Invariant Code Motion, LICM）​

强度削弱（Strength Reduction）​

循环展开（Loop Unrolling）​

代码调度（Code Scheduling）​

寄存器分配​

全局优化​

结构化优化​

代码生成​

总结​

解析优化

中间代码生成

公共子表达式消除（Common Subexpression Elimination, CSE）

死代码消除（Dead Code Elimination, DCE）

循环不变代码外提（Loop Invariant Code Motion, LICM）

强度削弱（Strength Reduction）

循环展开（Loop Unrolling）

代码调度（Code Scheduling）

寄存器分配

全局优化

结构化优化

代码生成

总结