TensorRT对face_boxes进行加速:
难点:priorbox layer和mobileNet SSD中的priorbox layer实现不太一样了,所以要对这层自己进行实现,当前遇到的报错:
问题1:
nvinfer1::DimsCHW nvinfer1::getCHW(const nvinfer1::Dims&): Assertion ` d.nbDims >= 3'failed.
解决方法:
查了TensorRT论坛,上面说是TensorRT中的bug,链接是这样的:
https://devtalk.nvidia.com/search/more/sitecommentsearch/nvinfer1%3A%3ADimsCHW%20nvinfer1%3A%3AgetCHW(const%20nvinfer1%3A%3ADims%26)%3A%20Assertion%20%60d.nbDims%20%3E%3D%203'%20failed./#
然后看了看时间,然后又自己查了以下,发现问题出在batch normal层,后来通过仔细查看,发现问题的主要原因是:我自己把加载的模型绝对路径写错了(因为yoloV2运行正常).