我记得以前的一些规则(32 位之前的英特尔处理器),当时(至少对我而言)非常频繁地必须分析 C/C++ 编译器(在我的情况下,当时是 Borland/Turbo)生成的汇编输出找到性能瓶颈,并安全地将汇编程序与 C/C++ 代码混合。诸如将 SI 寄存器用于this指针、将 AX 用于返回值、在汇编例程返回时应保留哪些寄存器等。
现在我想知道是否有更流行的 C/C++ 编译器(Visual C++、GCC、Intel ...)和处理器(Intel、ARM、...)的参考,如果没有,在哪里可以找到要创建的部分一。想法?