VoTT是微软发布的用于图像目标检测的标注工具,它是基于javascript开发的,因此可以跨Windows、Linux和Mac平台运行,并且支持从图片和视频读取标注。此外,其还提供了基于CNTK训练的faster-rcnn模型进行自动标注然后人工矫正的方式,这样大大减轻了标注所需的工作量。其分为V1和V2两个版本,目前V1已经废弃,V2是V1版本的重构和优化,V1的工程可以直接转化为V2来用,因此建议大家直接用V2.
它的特性如下:
- 支持从图片和视频读取进行标注
- 计算机辅助标注和使用camshift进行跟踪标注
- 导出VOC、CNTK、tesnorflow和YOLO等各种格式的标注
- 使用Active Learning来提升模型的性能
安装有两种方式,一种是使用预编译的包,可以在github下载,解压后通过双击VoTT.exe运行。或者是从源码进行编译,步骤略微麻烦些,先要克隆项目
git clone https://github.com/Microsoft/VoTT
然后安装node.js,这个网上有很多教程,数不赘述,最后将命令行切换到VoTT所在的文件夹,先安装所需的依赖,然后执行
npm install
npm start
即可。如果你也想编译上述第一种方法的包,可以执行
electron-packager . VoTT --win --out VoTT --app-version 1.1.0 --overwrite --ignore=node_modules
会自动生成可执行文件。
VoTT需要你自己准备相关的数据,这些数据被一个叫connection的名称所描述,所以要先新建它,选择插头那个图标
数据集那根据自己的需要描述,Provider选择本地文件系统,然后点Home那个图标新建一个工程
在输TAGS那有个坑,输完记得敲回车,换下一个TAG,不然不起作用
点击SaveProjects后就可以开始标了
工具栏提供了矩形框、多边形框登工具,还有个博士帽的图标,是一个用来从预训练模型加载的工具,可以自动的打标,你也可以换成自己的模型。
如果想持续的选择一个标签进行标注,可以按Ctrl+数字键,第几个数字就是第几个标,比如Ctrl+1就是选择第一个一直标。