我正在尝试使用 gperftools 分析多线程工作负载,但难以解释产生的输出。我编写了一个简单的程序,它启动两个具有相同工作负载的线程并使用 gperftools cpu 分析器进行分析。在输出中,我可以看到每个线程的两个函数,但是每个线程的开销从一次运行到下一次变化很大。我希望这两个函数显示相同的结果,因为它们是相同的工作负载,但实际上,一个可能是 90%,另一个是 10%,或者有时是 80%/20%、95%/5% 等。我不了解为什么函数显示不同的开销,或者为什么结果从一次运行到下一次变化如此之大。基准运行大约 5 秒,有 1600 个样本,所以应该是稳定的。
是否有任何文档解释分析如何适用于多线程工作负载,以及如何解释输出?例如,分析器是否对每个样本的每个线程进行回溯,如果没有,它在做什么?
#include <vector>
#include <cstdlib>
#include <thread>
using namespace std;
void thread_func() {
int size = 500000;
vector<int> V(size);
for(int i = 0; i < 100000; i++) {
V.erase(V.begin() + (rand() % size));
V.insert(V.begin() + (rand() % size), rand() % 10);
}
}
void thread_func2() {
int size = 500000;
vector<int> V(size);
for(int i = 0; i < 100000; i++) {
V.erase(V.begin() + (rand() % size));
V.insert(V.begin() + (rand() % size), rand() % 10);
}
}
int main() {
srand(1234);
thread t1(thread_func);
thread t2(thread_func2);
t1.join();
t2.join();
return 0;
}
样本输出:
0 0.0% 100.0% 1429 89.3% thread_func
0 0.0% 100.0% 172 10.7% thread_func2
89.3% 和 10.7% 来自哪里?(这些是函数及其被调用者中总样本的百分比)