计算机视觉常用数据集


概述

本仓库主要收集计算机视觉相关领域的常用数据集。 - CV Datasets on the web cvpapers提供的分类好的常用计算机视觉数据集网站,包括detection,classification,recognition等等。 - ComputerVisionDatasets 作者提供的常用数据集;


数据集增强方法

  • AutoAugment
  • albumentations,其中包含了RandomCrop64、PadToSize512、HorizontalFlip、VerticalFlip、Rotate、ShiftScaleRotate、Brightness、ShiftHSV、ShiftRGB、Gamma、Grayscale等数据集增强方法,同时和imgaug、torchvision、Keras的数据集增强方法的速度进行了比较。

视频预测数据集

video-understanding-dataset 视频理解数据集收集,可以参考部分

Moving MNIST

Moving MNIST

Moving MNIST包含了10000序列,每一个序列在64x64帧中包含了20个长度显示2个数字运动。

UCF101

UCF101 - Action Recognition Data Set

e-VDS

e-VDS

TwenBN数据集

TwenBN发布两个大型DL视频数据集:助力机器视觉通用智能 其中提供了手势识别和物体移动的两个数据集

THE 20BN-JESTER DATASET 手势识别数据集

THE 20BN-SOMETHING-SOMETHING DATASET 人和物交互视频数据集

twentybn-dl 数据集下载脚本

Push Dataset

机械臂操作视频

Push Dataset

DAVIS

davis-2017

DAVIS Challenge on Video Object Segmentation 2017


语义分割数据集

Datasets for ADAS

语义分割常用数据集

各领域公开数据集下载

Multimodal Brain Tumor Segmentation Challenge 2018 肿瘤检测数据集。


语义分割数据代码

dataset_loaders fvision提供的常用的语义和视频数据loader,其中同时提供了数据集的扩充方法。


合成数据集

相关论文


LSUN

大尺度场景理解挑战,该挑战从2015年开始,直至现在,PASCAL VOC和ImageNet ILSVRC的挑战在过去十年中已经使对象识别取得了显着进步。我们计划借这个机制,加快场景理解的进度。与ICCV / ECCV每年举办的以物象为中心的ImageNet ILSVRC挑战赛相辅相成,我们每年都会在CVPR主办一个以场景为中心的挑战。我们的挑战主要集中在现场理解中的四个主要任务,包括场景分类,显着预测,房间布局估计和字幕生成(由MS COCO主办)。受到最近使用大数据(如深度学习)的成功启发,我们将重点提供比现有数据大至少几倍的基准,以支持培训这些数据饥饿算法。通过以年度挑战格式提供一套大型基准测试,我们预计未来几年将会为现场认识取得重大进展。

Large-scale Scene Understanding Challenge

LSUN2015

LSUN2015

LSUN2016

LSUN2016

LSUN2017

LSUN2017


cityscapes

该数据集包含了5000张高质量标注的图像,20000张粗略标注的图像,同时覆盖了50个不同的城市。总共有30类语义,实例,稠密像素标注。同时还包括附加的元数据,比如前后视频帧、双目、GPS和车辆里程计。

The Cityscapes Dataset for Semantic Urban Scene Understanding

cityscapesScripts

cityscapes数据集


CamVid数据集

Motion-based Segmentation and Recognition Dataset

数据集示例

标签分布情况


Mapillary Vistas数据集

近日Mapillary发布了Mapillary Vistas数据集 - 世界上最大和最多样化的公众可用的像素精确和实例特定的街道级图像数据集,以帮助全球范围内的无人驾驶和自主运输技术。网页链接 数据集和相应的研究论文等:网页链接 1)25,000个高分辨率图像(分为18,000个用于训练,2,000个验证,5,000个测试;平均分辨率约为900万像素),具有从200万个手动绘制的多边形的像素点注释 2)100个对象类别,其中60个实例特定(即枚举对象) 3)涵盖北美和南美,欧洲,非洲,亚洲和大洋洲的全球地理覆盖 4)天气条件(太阳,雨,雪,雾,阴霾)和捕获时间(黎明,白天,黄昏甚至夜晚)的高度变异性 5)相机传感器范围广泛,焦距变化,图像宽高比以及不同类型的相机噪音 6)不同的拍摄观点(从道路,人行道和越野)

Street-level imagery for the future of maps

【Mapillary Vistas数据集】像素精确和实例特定的街道级图像数据集

The Mapillary Vistas Dataset for Semantic Understanding of Street Scenes


bdd-data数据集

bdd-data 包含了目标检测和语义分割数据集,对应主页http://bdd-data.berkeley.edu/,论文BDD100K: A Diverse Driving Video Database with Scalable Annotation Tooling。


分类数据集


102 Category Flower Dataset

Automated flower classification over a large number of classes

102 Category Flower Dataset


CIFAR-10


目标检测数据集


PETS 2009 Benchmark Data

该数据集包含了不同人群活动的多传感器数据。

PETS 2009 Benchmark Data


其他数据集

Landscape-Dataset 风景数据集,包括7268张320x180大小的风景照片