clock_gettime()是否适合亚微秒级计时?

在我们的应用程序的Linux构建中,我需要一个用于嵌入式探查器的高分辨率计时器。我们的探查器可测量的范围与单个功能一样小,因此其计时器精度必须高于25纳秒。

以前,我们的实现使用内联汇编和rdtsc操作直接从CPU查询高频计时器,但这是有问题的,需要经常重新校准。

因此,我尝试使用该clock_gettime函数来查询CLOCK_PROCESS_CPUTIME_ID。文档声称这给了我纳秒级的计时,但是我发现单次调用的开销clock_gettime()超过了250ns。这使得不可能为事件设置100ns的时间,并且计时器功能的开销如此之大,严重降低了应用程序的性能,使配置文件超出了价值。(我们每秒有数十万个分析节点。)

还是有其他方法可以可靠地获得开销小于25ns的时间戳计数器?还是我坚持使用rdtsc

下面是我习惯的代码clock_gettime()

// calls gettimeofday() to return wall-clock time in seconds:

extern double Get_FloatTime();

enum { TESTRUNS = 1024*1024*4 };

// time the high-frequency timer against the wall clock

{

double fa = Get_FloatTime();

timespec spec;

clock_getres( CLOCK_PROCESS_CPUTIME_ID, &spec );

printf("CLOCK_PROCESS_CPUTIME_ID resolution: %ld sec %ld nano\n",

spec.tv_sec, spec.tv_nsec );

for ( int i = 0 ; i < TESTRUNS ; ++ i )

{

clock_gettime( CLOCK_PROCESS_CPUTIME_ID, &spec );

}

double fb = Get_FloatTime();

printf( "clock_gettime %d iterations : %.6f msec %.3f microsec / call\n",

TESTRUNS, ( fb - fa ) * 1000.0, (( fb - fa ) * 1000000.0) / TESTRUNS );

}

// and so on for CLOCK_MONOTONIC, CLOCK_REALTIME, CLOCK_THREAD_CPUTIME_ID.

结果:

CLOCK_PROCESS_CPUTIME_ID resolution: 0 sec 1 nano

clock_gettime 8388608 iterations : 3115.784947 msec 0.371 microsec / call

CLOCK_MONOTONIC resolution: 0 sec 1 nano

clock_gettime 8388608 iterations : 2505.122119 msec 0.299 microsec / call

CLOCK_REALTIME resolution: 0 sec 1 nano

clock_gettime 8388608 iterations : 2456.186031 msec 0.293 microsec / call

CLOCK_THREAD_CPUTIME_ID resolution: 0 sec 1 nano

clock_gettime 8388608 iterations : 2956.633930 msec 0.352 microsec / call

这是在标准Ubuntu内核上。该应用程序是Windows应用程序的端口(我们的rdtsc内联程序集可以正常工作)。

回答:

x86-64 GCC是否具有__rdtsc()的内在等效项,因此至少可以避免内联汇编?

回答:

否。您必须使用特定于平台的代码来执行此操作。在x86和x86-64上,您可以使用’rdtsc’读取时间戳计数器。

只需移植您正在使用的rdtsc程序集。

__inline__ uint64_t rdtsc(void) {

uint32_t lo, hi;

__asm__ __volatile__ ( // serialize

"xorl %%eax,%%eax \n cpuid"

::: "%rax", "%rbx", "%rcx", "%rdx");

/* We cannot use "=A", since this would use %rax on x86_64 and return only the lower 32bits of the TSC */

__asm__ __volatile__ ("rdtsc" : "=a" (lo), "=d" (hi));

return (uint64_t)hi << 32 | lo;

}

以上是 clock_gettime()是否适合亚微秒级计时? 的全部内容, 来源链接: utcz.com/qa/426961.html

回到顶部