概述
本仓库主要收集计算机视觉相关领域的常用数据集。 - CV Datasets on the web cvpapers提供的分类好的常用计算机视觉数据集网站,包括detection,classification,recognition等等。 - ComputerVisionDatasets 作者提供的常用数据集;
数据集增强方法
- AutoAugment
- albumentations,其中包含了RandomCrop64、PadToSize512、HorizontalFlip、VerticalFlip、Rotate、ShiftScaleRotate、Brightness、ShiftHSV、ShiftRGB、Gamma、Grayscale等数据集增强方法,同时和imgaug、torchvision、Keras的数据集增强方法的速度进行了比较。
视频预测数据集
video-understanding-dataset 视频理解数据集收集,可以参考部分
Moving MNIST
Moving MNIST包含了10000序列,每一个序列在64x64帧中包含了20个长度显示2个数字运动。
UCF101
UCF101 - Action Recognition Data Set
e-VDS
TwenBN数据集
TwenBN发布两个大型DL视频数据集:助力机器视觉通用智能 其中提供了手势识别和物体移动的两个数据集
THE 20BN-JESTER DATASET 手势识别数据集
THE 20BN-SOMETHING-SOMETHING DATASET 人和物交互视频数据集
twentybn-dl 数据集下载脚本
Push Dataset
机械臂操作视频
DAVIS
DAVIS Challenge on Video Object Segmentation 2017
语义分割数据集
Multimodal Brain Tumor Segmentation Challenge 2018 肿瘤检测数据集。
语义分割数据代码
dataset_loaders fvision提供的常用的语义和视频数据loader,其中同时提供了数据集的扩充方法。
合成数据集
相关论文
- UnrealCV: Connecting Computer Vision to Unreal Engine 论文 代码 项目主页 这个提供了常用的合成数据集的相关论文
- Playing for Data: Ground Truth from Computer Games 论文 代码 项目主页
LSUN
大尺度场景理解挑战,该挑战从2015年开始,直至现在,PASCAL VOC和ImageNet ILSVRC的挑战在过去十年中已经使对象识别取得了显着进步。我们计划借这个机制,加快场景理解的进度。与ICCV / ECCV每年举办的以物象为中心的ImageNet ILSVRC挑战赛相辅相成,我们每年都会在CVPR主办一个以场景为中心的挑战。我们的挑战主要集中在现场理解中的四个主要任务,包括场景分类,显着预测,房间布局估计和字幕生成(由MS COCO主办)。受到最近使用大数据(如深度学习)的成功启发,我们将重点提供比现有数据大至少几倍的基准,以支持培训这些数据饥饿算法。通过以年度挑战格式提供一套大型基准测试,我们预计未来几年将会为现场认识取得重大进展。
Large-scale Scene Understanding Challenge
LSUN2015
LSUN2016
LSUN2017
cityscapes
该数据集包含了5000张高质量标注的图像,20000张粗略标注的图像,同时覆盖了50个不同的城市。总共有30类语义,实例,稠密像素标注。同时还包括附加的元数据,比如前后视频帧、双目、GPS和车辆里程计。
The Cityscapes Dataset for Semantic Urban Scene Understanding
CamVid数据集
Motion-based Segmentation and Recognition Dataset
数据集示例
标签分布情况
Mapillary Vistas数据集
近日Mapillary发布了Mapillary Vistas数据集 - 世界上最大和最多样化的公众可用的像素精确和实例特定的街道级图像数据集,以帮助全球范围内的无人驾驶和自主运输技术。网页链接 数据集和相应的研究论文等:网页链接 1)25,000个高分辨率图像(分为18,000个用于训练,2,000个验证,5,000个测试;平均分辨率约为900万像素),具有从200万个手动绘制的多边形的像素点注释 2)100个对象类别,其中60个实例特定(即枚举对象) 3)涵盖北美和南美,欧洲,非洲,亚洲和大洋洲的全球地理覆盖 4)天气条件(太阳,雨,雪,雾,阴霾)和捕获时间(黎明,白天,黄昏甚至夜晚)的高度变异性 5)相机传感器范围广泛,焦距变化,图像宽高比以及不同类型的相机噪音 6)不同的拍摄观点(从道路,人行道和越野)
Street-level imagery for the future of maps
【Mapillary Vistas数据集】像素精确和实例特定的街道级图像数据集
The Mapillary Vistas Dataset for Semantic Understanding of Street Scenes
bdd-data数据集
bdd-data 包含了目标检测和语义分割数据集,对应主页http://bdd-data.berkeley.edu/,论文BDD100K: A Diverse Driving Video Database with Scalable Annotation Tooling。
分类数据集
102 Category Flower Dataset
Automated flower classification over a large number of classes
CIFAR-10
目标检测数据集
PETS 2009 Benchmark Data
该数据集包含了不同人群活动的多传感器数据。
其他数据集
Landscape-Dataset 风景数据集,包括7268张320x180大小的风景照片