我试图在多个线程上尽可能准确地测量某些代码的执行时间,同时考虑上下文切换和线程停机时间。该应用程序是用 C# (VS 2008) 实现的。例子:
public void ThreadFunc ()
{
// Some code here
// Critical block #1 begins here
long lTimestamp1 = Stopwatch.GetTimestamp ();
CallComplex3rdPartyFunc (); // A
long lTimestamp2 = Stopwatch.GetTimestamp ();
// Critical block #1 ends here
// Some code here
// Critical block #2 begins here
long lTimestamp3 = Stopwatch.GetTimestamp ();
CallOtherComplex3rdPartyFunc (); // B
long lTimestamp4 = Stopwatch.GetTimestamp ();
// Critical block #2 ends here
// Save timestamps for future analysis.
}
public int Main ( string[] sArgs )
{
// Some code here
int nCount = SomeFunc ();
for ( int i = 0; i < nCount; i++ )
{
Thread oThread = new Thread ( ThreadFunc );
oThread.Start ();
}
// Some code here
return ( 0 );
}
我想尽可能准确地测量上述两个关键代码块的执行时间。这两个调用标记为A and B可能是长函数调用,有时可能需要几秒钟才能执行,但在某些情况下可能会在几毫秒内完成。
我在多个线程上运行上述代码 - 1 到 200 个线程之间,具体取决于用户输入。运行此代码的计算机有 2-16 个核心 - 用户在较弱的计算机上使用较低的线程数。
问题是A and B两者都可能是长函数,因此在执行期间很可能至少会发生一次上下文切换 - 可能不止一次。因此代码获取lTimestamp1,然后另一个线程开始执行(并且当前线程等待)。最终当前线程重新获得控制权并检索 lTimestamp2。
这意味着之间的持续时间l时间戳1 and l时间戳2包括线程实际未运行的时间 - 当其他线程执行时,它正在等待再次调度。然而,滴答计数无论如何都会增加,所以持续时间现在实际上是
代码块时间 = A + B +在其他线程中花费了一些时间
虽然我希望它只是
代码块时间 = A + B
对于大量线程来说,这尤其是一个问题,因为它们都有机会运行,因此上述计时会更高,而所有其他线程在相关线程获得另一次运行机会之前运行。
所以我的问题是:是否有可能以某种方式计算线程运行的时间not运行然后相应地调整上述时间?我想完全或至少尽可能多地消除(减去)第三项。该代码运行了数百万次,因此最终的时间是根据大量样本计算出来的,然后取平均值。
我不是在寻找探查器产品等 - 应用程序需要尽可能准确地对这些标记的部分进行计时。功能A and B是第三方功能,我无法以任何方式更改它们。我还意识到以纳秒精度测量时间时可能出现的波动以及这些第三方函数内部可能存在的开销,但我仍然需要进行此测量。
任何建议将不胜感激 - C++ 或 x86 汇编代码也可以工作。
Edit:似乎不可能实现这一点。 Scott 下面的想法(使用 GetThreadTimes)很好,但不幸的是 GetThreadTimes() 是一个有缺陷的 API,它几乎从不返回正确的数据。感谢所有的答复!