标注方法
1 自己获取的数据集,人工进行标注(全人工)
2 自己获取的数据集,首先使用训练好的网络标注一遍,然后手动进行微调(半人工)
3 仿真数据集(GAN网络来生成自己的数据集-- synthetic data)
标注工具
1 CVAT(需要安装)
2 makesense.ai(在线标注工具)
makesense.ai 标注过程
1 输入图片
2 选择Object Detection
3 创建自己的分类
4 根据自己的分类开始进行标注(标注的时候也可以使用action中的load models进行半人工标注)
5 导出文件(action-》export annotation-》yolo format)
文件组织过程
1 将images和labels分别放入对应的文件夹中
2 参照coco.yaml, 写自己数据集的配置
# train and val data as 1) directory: path/images/, 2) file: path/images.txt, or 3) list: [path1/images/, path2/images/]
train: mydata/images/train
val: mydata/images/train
# number of classes
nc: 3
# class names
names: [ 'person', 'car', 'bike' ]
3 修改train.py中的--data
参数
parser.add_argument('--data', type=str, default='mydata/mydata.yaml', help='data.yaml path')
4 运行train.py开始训练
5 使用detect测试自己训练的模型
修改detect 中的权重文件为自己训练的模型(一般问train当中最新的那个exp)
tips
1 pycharm左侧工程目录文件个数太多了会占用大量的资源(需要检索)
2 可以右键文件夹,在此处选择exclude, 则可以节省资源
3 需要有路径的地方,只要路径正确, exclude的文件依然可以找到,知识在目录视图中找不到