1
nvprof --metrics gld_efficiency,gst_efficiency ./myproc
检测内存加载存储效率
2
nvprof --query-metrics
# 查看所有能用的参数命令
3
nvprof --metrics stall_sync ./myproc
检测核函数的线程束阻塞情况
4
nvprof --metrics gld_throughput ./myproc
检测内存加载吞吐量
5
nvprof --metrics inst_per_warp ./myproc
检测每个线程束上执行指令数量的平均值,越少越好
6
nvprof --metrics branch_efficiency ./myproc
检测分支分化性能
7
nvprof ./a.out
profiling result中显示的是kernel执行的time情况 api calls则显示的是程序调用的api所耗费的time情况