人工智能知名数据集

2023-05-16

网上有很多可以用于深度学习算法验证的数据集,这里仅列出个人进行人工智能学习和研究工作涉及到的常用数据集,比较适合初学者和刚开始从事人工智能方向研究的工作者。

1. MNIST

MNIST 数据集来自美国国家标准与技术研究所(National Institute of Standards and Technology,NIST),训练集 (training set) 由来自 250 个不同人手写的数字构成,其中 50% 是高中学生,50% 来自人口普查局 (the Census Bureau) 的工作人员。

网址:http://yann.lecun.com/exdb/mnist/

MNIST是一个初级的人工智能学习的数据集,很多人工智能学习课程都包含了在这个数据集之上的数字识别示例,里面包含60000个训练样本(图像和标签)和10000个测试样本。

训练集目前由Yann LeCun维护。

2. Fashion-MNIST

Fasion-MNIST是一个类似MNIST的训练和测试数据集,它由德国一家时尚科技公司(Zalando)提供,包含了70000张10个类别的服装相关的图片,如T恤、外套、鞋子等。其中包含60000张训练图片和标签以及10000张测试图片和标签。

网址:https://github.com/zalandoresearch/fashion-mnist

它的数据格式和操作方式和MNIST相同。

Fashion-MNIST是一个可以替代MNIST的数据集。MINST数据集较为简单,很多简单的识别程序就可以做到准确率99%以上。Fashion-MNIST数据集的对象内容更为复杂,在识别难度上较MNIST更大。Fashion-MNIST也是一个常用于深度学习教学的数据集,同MNIST一样,在有些深度学习框架(如Tensorflow)中集成了数据集的导入。

3. CIFAR-10,CIFAR-100

CIFAR-10是由Hinton的学生Alex Krizhevsky和Ilya Sutskever整理的一个用于普适物体识别的数据集。一共包含了10个类别的RGB彩色图片,如飞机、汽车、鸟类、猫、狗等。每个图片的尺寸为32 × 32 ,每个类别有6000个图像,数据集中一共有50000 张训练图片和10000 张测试图片。

网址:http://www.cs.toronto.edu/~kriz/cifar.html

CIFAR-10也是一个初级的人工智能学习的数据集,很多人工智能学习教程都包含在这个数据集上的图像识别示例。

CIFAR-100是类似CIFAR-10的一个数据集,其中包含了100个类别的图像,每个类别包含600张图片,其中500张为训练图片,100张为测试图片。整个数据集包含60000张图片,其中包含50000张训练图片和10000张测试图片。

4. ImageNet

ImageNet图像数据集是在2009年由斯坦福的李飞飞主导的一个项目形成的一个数据集。李飞飞在CVPR2009上发表了一篇名为《ImageNet: A Large-Scale Hierarchical Image Database》的论文,之后从2010年开始每年举行基于ImageNet数据集的ILSVRC大赛,极大地推动了深度学习和计算机视觉的发展。

ImageNet总共有14197122张图像,分为21841个类别

网址:http://www.image-net.org/

ILSVRC历年的知名网络有
2012年        AlexNet                误检率16.42%
2013年        ZFNet                   13.51%
2014年        GoogLeNet           6.67%
                    VGG                     6.8%
2015年        ResNet                 3.57%
2016年        ResNeXt               3.03%
2017年        SENet                   2.25%
 

5. PASCAL VOC

PASCAL VOC挑战赛(The PASCAL Visual Object Classes)是一个世界级的计算机视觉挑战赛, 从2005年开始到2012年结束。PASCAL全称为Pattern Analysis, Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。PASCAL VOC最初主要用于目标检测,很多经典的目标检测网络都是在PASCAL VOC上训练出来的,比如Fast R-CNN系列的各种网络。

目前PASCAL VOC主要分为VOC2007和VOC2012两个版本,数据分为人、鸟、猫、汽车等20个分类,数据统计如下

3cf8376972e2463d9f68fe246e8da893.png

网址:http://host.robots.ox.ac.uk/pascal/VOC/

74b53c5c880b750f057ce4f69b421f54.png

 4. Microsoft COCO

Microsoft COCO(Common Objects in Context)是微软研发维护的一个丰富大型的目标识别数据集。 其数据集内容包含了各种生活场景中的通用对象。包含91类目标,328,000影像和2,500,000个标签。可以用来做目标分割、场景感知、目标识别等算法研究。

网址:https://cocodataset.org/

它的特点是数据集样本来源于生活场景,很多样本图片中包含多个类别和多个目标,适合在此基础上做和实际场景结合的目标识别、目标分割等算法研究。很多算法研究和学术比赛在这个数据集基础上进行,是目前被采用最为广泛的目标识别算法的测试数据集。

参考链接:

https://blog.csdn.net/simple_the_best/article/details/75267863
https://blog.csdn.net/qq_41185868/article/details/82793025
https://blog.csdn.net/u013832707/article/details/93710810
https://blog.csdn.net/qq_42722197/article/details/123540644

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能知名数据集 的相关文章

随机推荐

  • Ubuntu绕不开之ROS

    除了前面的OpenCV xff0c ROS也是Ubunt绕不开的软件 Ubuntu 18 04对应的ROS是melodic版本 xff0c 安装推荐参考官方教程 xff1a http wiki ros org melodic Install
  • Ubuntu 18.04之安装中文输入法

    Ubuntu 18 04在安装时可以选择中文界面安装 xff0c 这样会默认安装中文输入法 xff0c 不过这样生成的系统目录名称等都变成中文 xff0c 对于有些技术人员不是很习惯 xff0c 更喜欢安装英文的Ubuntu xff0c 然
  • MySQL视图Duplicate column name问题的解决

    本文将介绍MySQL view视图出现 Duplicate column name 问题的解决解决方法 xff0c 在这里 xff0c 我用的是SQLyog程序 xff0c 其实和在MySQL命令行打代码是一样的 xff0c 只不过用SQL
  • Linux下逐页翻看文件内容的方法

    Linux下用cat查看文件的话会全部打印出文件的所有内容 xff0c 用gedit查看的话可能会死机 xff08 当文件大于5M的时候 xff09 xff0c 用more命令可以逐页翻看需要查看的文件内容 xff0c 命令格式 more
  • Linux下搜索包含指定文字内容文件的方法(grep)

    用grep命令可以方便地在Linux系统下搜索包含指定文字内容的文件 grep r lt text to find gt lt dir gt 搜索指定目录 lt dir gt 下 xff0c 所有包含 lt text to find gt
  • Ubuntu设置登录自动启动程序的方法

    参考链接 xff1a https www cnblogs com the wang p 11230087 html 如上 xff0c 设置自动启动程序的方法有多种 xff0c 分别在系统启动的不同阶段启动 xff0c 在这里需要在用户登录图
  • Linux下脚本自动输入sudo密码的方法

    在设置自启动程序时 xff0c 希望可以自动输入sudo密码以运行一些需要超级用户权限的程序 xff0c 可以如下例子 echo 123456 sudo S apt get update 其中123456为sudo密码 xff0c sudo
  • Linux Shell脚本参数传递与条件判断的方法

    参考链接 xff1a https www runoob com linux linux shell html 参数传递 Shell脚本中参数用 来表示 xff0c 如 1 第一个参数 2 第二个参数 xff0c 以此类推 xff0c 比如t
  • Linux下C检测按键按下并即时反馈的方法(不需要回车)

    在Linux下检查按键按下并即时反馈的方法 xff0c 如下 include lt stdio h gt include lt termio h gt int main termios tms old tms new tcgetattr 0
  • Linux下C语言检测多个按键按下状态的方法

    在需要同时监听多个按键按下状态的情况下 xff0c 可以通过监听 dev input event事件的方法来判断按键的状态 比如对于通过键盘控制小车时 xff0c 有可能多个方向键同时按下 xff0c 需要同时监测到 xff0c 通过前面文
  • Ubuntu ROS常用包安装

    参考链接 xff1a https www it610 com article 1290751077485977600 htm 在Ubuntu下进行ROS相关研究 xff08 比如SLAM等 xff09 xff0c 有一些常用的包需要安装 x
  • Linux下用户退出仍运行程序的方法

    在设置服务器上的应用程序时 xff0c 需要退出用户登录时仍然运行提供服务 xff0c 通过如下的命令 nohup cmd amp nohup表示不挂断程序运行 xff0c amp 表示后台运行 xff0c cmd表示需要运行的指令 xff
  • Linux下开启/关闭无线网络的方法

    参考链接 xff1a https www cnblogs com ztguang p 12648367 html 通过iwconfig命令查询和开启 关闭无线网络 iwconfig 列出启用的无线网络 sudo iwconfig lt 网络
  • 【Uni-App】出现Cannot read property ’apply’ of undefined错误

    错误日志如下 xff1a span class token number 14 span span class token punctuation span span class token number 47 span span clas
  • 通过SSH协议在本地和服务器之间传输文件和目录的方法

    参考链接 xff1a https blog csdn net w8827130 article details 90574699 通过SSH协议在本地和服务器之间传输文件 目录 xff0c 从一个地址拷贝至另一个地址 xff0c 如下 sc
  • Ubuntu强制修改用户口令的方法

    在忘记用户密码或者想要强制修改密码的时候 xff0c 可以采用启动至recovery mode的方式进行修改 在Ubuntu启动选项中 xff0c 选择Ubuntu advanced option xff0c 之后选择recovery mo
  • mqtt服务搭建及通过python进行消息交互

    参考链接 xff1a https www runoob com w3cnote mqtt intro html 对于需要与远程服务器进行数据交互的应用场景 xff0c mqtt是一种非常简便实用的数据交互机制 xff0c 通过消息的发布 订
  • RTMP服务器搭建

    参考链接 xff1a https www cnblogs com lidabo p 6404513 html 在Ubuntu 18 04上搭建一个RTMP服务器实现视频流的转播 xff0c 可以用以实现远程的监控 xff0c 通过nginx
  • CentOS下后台运行程序的方法

    参考链接 xff1a https www cnblogs com loveLands articles 10809333 html 方法一 xff1a amp 在运行命令后面加上 amp xff0c 程序就会放到后台执行 xff0c 不会占
  • 人工智能知名数据集

    网上有很多可以用于深度学习算法验证的数据集 xff0c 这里仅列出个人进行人工智能学习和研究工作涉及到的常用数据集 xff0c 比较适合初学者和刚开始从事人工智能方向研究的工作者 1 MNIST MNIST 数据集来自美国国家标准与技术研究