深度学习开源数据集整理

数据集介绍备注网址
Flickr30k图片描述31,783 images,每张图片5个语句标注链接
Microsoft COCO图片描述330,000 images,每张图片至少5个语句标注链接
ESP Game多标签定义图像20,770 images,268 tags,诸如bed, light man,music链接
IAPRTC-12多标签定义图像19,452 images,291 tags链接
NUS-WIDE多标签定义图像269,648 images,several tags (2-5 on average) per image链接
CUHK-PEDES以文搜图34,054 images,每张图片2条描述链接
VRD视觉关系检测5,000 images, 100目录,37,993对关系链接
sVG视觉关系检测108,000 images, 998,000对关系链接
Visual Genome Dataset图像属性检测108,077 images, 5.4 M 区域块,2.8 M 属性,2.3 M 关系链接
VQA问答系统1,105,904问题,11,059,040 回答链接
Visual7W问答系统327,939 问答对链接
TID2013图像质量评价25张参考图像,24个失真类型链接
CSIQ图像质量评价30张参考图像,6个失真类型链接
LIVE图像质量评价29张参考图像,5个失真类型链接
WATERLOO图像质量评价4744张参考图像,20个失真类型链接
photo .net图像美观评价20,278张图像,打分[0,10]链接
DPChallenge .com图像美观评价16,509张图像,打分[0,10]链接
CUHK图像美观评价28,410张图像,只分高质量和低质量链接
AVA图像美观评价255,500张图像,打分[0,10]链接

Image Motion & Tracking

数据集介绍备注网址
CUHK03Person re-identification(人重识别)image num:13164 person num:1360 camera num:10( 5 pairs)链接
CUHK02Person re-identification(人重识别)image num:7264 person num:1816 camera num:10( 5 pairs)链接
CUHK01Person re-identification(人重识别)image num:3884 person num:971 camera num: 2链接
VIPeRPerson re-identification(人重识别)image num:1264 person num:632 camera num:2链接
ETH1,2,3Person re-identification(人重识别)image num:8580 person num:83,35,28 camera num:1链接
PRID2011Person re-identification(人重识别)image num:24541 person num:934 camera num:2链接
MARSPerson re-identification(人重识别)image num:11910031 person num:1261 camera num:6链接
Market1501Person re-identification(人重识别)image num:32217 person num:1501 camera num:6链接
Epic Fail (EF) datasetRisk Assessment(风险评估)video num:3000链接
Street Accident (SA) datasetRisk Assessment(风险评估)video num:1733链接
OTB-50visual tracking(跟踪)video num:50链接
OTB-100visual tracking(跟踪)video num:100链接
VOT2015visual tracking(跟踪)video num:60链接
ALOV300visual tracking(跟踪)video num:314链接
MOTvisual tracking(跟踪)video num train:11 test:11链接
THUMOSTemporal action localization(动作定位)video num:~3K activities class:20 instances:~3K链接
ActivityNetTemporal action localization(动作定位)video num:20k activities class:200 instances:7.6K链接
Mexaction2Temporal action localization(动作定位)activities class:2 instances:1975链接
FlyingChairs datasetoptical flow(光流)image pairs:22k链接
FlyingThings3Doptical flow(光流)image pairs:22k链接
KITTI benchmark suiteoptical flow(光流)image pairs:1600链接
MPI Sinteloptical flow(光流)image pairs:1064链接

Video Analysis & Scene Understanding

数据集介绍备注网址
UCF101动作行为识别13320 video,101类动作,主要是五大类:1)人-物交互;2)肢体运动;3)人-人交互;4)弹奏乐器;5)运动链接
HMDB51动作行为识别7000 videos,51类,包括人脸表情动作,身体动作,人与人交互等链接
Moments-in-Time动作行为识别1,000,000 videos,339类链接
ActivityNet 1.3动作行为识别20,000 videos,200类链接
Kinetics动作行为识别300,000 videos,400类链接
AVA动作行为识别57,600 videos,80类链接
Collective Activity Dataset群体活动行为识别44 videos,穿叉、行走、等待、交谈和排队 五类链接
Choi’s New Dataset群体活动行为识别32 videos,聚会,谈话,分开,一起走,追逐和排队 六类None
ActivityNet 1.3检测动作事件的起始时间和终止时间20,000 videos,200类动作的起始时间和终止时间链接
THUMOS检测动作事件的起始时间和终止时间15,000 videos,101类动作的起始时间和终止时间链接
MED事件检测32,744 videos,20个事件链接
EventNet事件检测90,000 videos,500个事件链接
Columbia Consumer Video事件检测9,317 videos,20个事件链接
ADE20K事件检测20,210 videos,900个事件链接
DAVIS视频主物体分割50 videos,分割标注链接
FBMS视频主物体分割59 videos,分割标注链接
IJB-C视频人脸识别11,000 videos链接
YouTube Faces视频人脸识别3,425 videos,1595 人链接
MS-Celeb-1M视频人脸识别1,000,000 images,21,000人链接
MSVD视频描述1,970 videos链接
MSR-VTT-10K视频描述10,000 videos链接

3D Computer Vision

数据集介绍备注网址
photoface database基于光度立体视觉的二维和三维人脸识别数据库总共7356张图像,包含1839个session和261个subjectsNone
NYU Depth V2 dataset关于RGBD 图像场景理解的数据库提供1449张深度图片和他们的密集2d点类标注链接
SUN RGBD dataset是上面的NYU Depth V2 dataset的超集,多了3D bounding boxes和room layouts的标注。有10,000张RGB-D图片,有58,657个3D包围框和146,617 个2d包围框。链接
PASCAL3D+新的三维物体检测和姿态估计数据集,从PASCAL VOC 演化而来,包含图像,注解,和3D CAD模型总共12个类,平均每个类别有3000多个实例链接
IKEA包含典型室内场景的三维模型的数据库,例如桌子椅子等包含大约759张图片和219个3D模型链接
New Tsukuba Dataset包含了很多立体物体对的数据库,用于立体物体匹配总共1800个立体物体对,以及每立体对的立体视差图、遮挡图和不连续图链接
Oxford RobotCar Dataset关于户外自动驾驶的数据集。包含在驾驶汽车过程从6个摄像头收集的2000w张图片,和当时的激光雷达,GPS和地面实况标注。链接
Middlebury V3包含高分辨率物体立体视差标注的数据库包含33个类,没有明说每类有多少数据链接
ShapeNet包含3D模型,和3d模型的类别标注的数据集,覆盖了常用的3D数据集PASCAL 3D+。它涵盖55个常见的对象类别,有大约51,300个3D模型链接
MICC dataset包含了3D人脸扫描和在不同分辨率,条件和缩放级别下的几个视频序列的数据库。有53个人的立体人脸数据链接
CMU MoCap Dataset包含了3D人体关键点标注和骨架移动标注的数据集。有6个类别和23个子类别,总共2605个数据。链接
DTU dataset关于3D场景的数据集。有124个场景,每场景有49/64个位置的RGB图像和结构光标注。链接

Analyzing Humans in Images

数据集介绍备注网址
MSR-Action3D包含深度的动作识别数据集, 有20个动作,总共557个序列。链接
Florence-3D包含深度的动作识别数据集,有9个动作,总共215个动作序列。链接
Berkeley MHAD包含深度的动作识别数据集,有11个动作,产生660个动作序列。链接
Online Action Detection包含深度的动作识别数据集,数据集包含59个长序列,包含10种不同的日常生活行为。链接
ChaLearn LAP IsoGD DatasetRGB-D图像的手势识别的数据集。包括47933个RGB-D手势视频,有249个手势标签。Training有35878视频,Validation有5784个,test有6271个链接
MAFA dataset关于面部遮挡问题的数据集有30, 811张人脸和35806张有遮挡的脸组成。链接
MSRC-12 Kinect Gesture Dataset手势识别数据集有4900张图片,包含12个不同手势,链接
2013 Chalearn Gesture Challenge dataset手势识别数据集有11000张图片,包含20个不同手势,链接
WIDER FACE人脸检测数据集有 32,203 张图片,标注了393703个人脸。链接
FDDB人脸检测数据集2845张图片,标注了5171张人脸。链接
300-VW dataset面部表情数据集包含114个视频和总计218,595帧。链接
HMDB51人类行为识别的数据集包含51个动作,总共有6766个视频剪辑链接
MPII Cooking Activities Dataset人类行为识别的数据集包含65个动作,有5609个视频链接
UCF101人类行为识别的数据集包含101个动作,有13320个视频链接
IJB-A dataset包含视频和图片人脸识别的数据集包含5712个图像和2085个视频链接
YouTube celebrities视频人脸识别的数据集包含47位名人的1910个视频链接
COX视频人脸识别的数据集包含1000个主题的4000个视频链接
Human3.6M人体姿态估计的数据集360万张3D照片,11名受试者在4个视点下执行15个了不同的动作链接
iLIDS行人重识别的数据集476 张图像,包含119个人链接
VIPeR行人重识别的数据集632个行人图片对(由两个相机拍摄)链接
CUHK01行人重识别的数据集包含971行人, 3884张图片链接
CUHK03行人重识别的数据集包含1360行人, 13164张图片链接
RWTH-PHOENIX-Weather multi-signer 2014手语识别的数据集包含了5672个德语手语的句子,有65,227个手语姿势和799,006帧链接
AFLW人类面部关键点的数据集总共约有25k张脸,每幅图像标注了大约21个位置。链接
CMU mocap database动作识别的数据集2235个数据,包含144个不同的动作。链接
Georgia Tech (GT) database人脸识别数据库50个人每人15张人脸。链接
ORL人脸识别数据库40个人每个人10张图。链接

Application

数据集介绍备注网址
DogCentric Activity Dataset第一视角的狗和人之间的相互行为的数据集(视频)总共有10类,具体数据量没有明说,y是动作类别链接
JPL First-Person Interaction Dataset第一视角观察动作的数据集57个视频,8个大类,y是动作类别链接
NUS-WIDE关于图像文本匹配的数据集269,648个图像和对应的标签链接
LabelMe Dataset关于图像文本匹配的数据集3825个图像和对应标签链接
Pascal Dataset关于图像文本匹配的数据集5011张训练图像和4952张测试图像None
ICDAR 2015关于文本检测的数据集1500张训练,1000张测试,y为四边形的四个顶点。链接
COCO-Text关于文本检测的数据集63686张图片,其中43686张被选为训练集,剩下的2万用于测试。链接
MSRA-TD500关于文本检测的数据集300个训练,200个测试图像链接
Microsoft 7-Scenes Dataset室内人体运动的数据集有7种不同室内环境,每包含500-1000张图像视频序列。链接
Oxford RobotCar户外自动驾驶数据集包含图像,激光扫描结果和GPS数据。链接

Low- & Mid-Level Vision

数据集介绍备注网址
Deep Video Deblurring for Hand-held Camerasvideo/image deblurring(图像去模糊)video num:71 video time: 3-5s blurry and sharp pair image num:6708链接
GOPRO datasetvideo/image deblurring(图像去模糊)blurry and sharp pair image num:3214 train num:2103 test num:1111链接
BSD68image restoration(图像修复)/高斯降噪image num:68链接
BSD100“image restoration(图像修复)super resolution超分辨率重建”image num:100链接
Set5“image restoration(图像修复)super resolution超分辨率重建”image num:5链接
Set14“image restoration(图像修复)super resolution超分辨率重建”image num:14链接
Urban100“image restoration(图像修复)super resolution超分辨率重建”image num:100链接
NYU v2 dataset“image restoration(图像修复)depth super resolution深度超分辨率重建”image num:1449链接
Middlebury dataset“image restoration(图像修复)depth super resolution深度超分辨率重建”image pair num: 33链接
alpha matting benchmarkNatural image matting(抠图)“train num:27,test num:8”链接
real image benchmarkNatural image matting(抠图)“train num:49300,test num:1000”链接
MSRA10K/MSRA-BImage saliency detection(显著性区域检测)image num(MSRA10K):10000 image num(MSRA-B):5000链接
ECSSDImage saliency detection(显著性区域检测)image num:1000链接
DUT-OMRONImage saliency detection(显著性区域检测)image num:5168链接
PASCAL-SImage saliency detection(显著性区域检测)image num:850链接
HKU-ISImage saliency detection(显著性区域检测)image num:4447链接
SODImage saliency detection(显著性区域检测)image num:300链接
Describable Textures Datasettexture synthesis(纹理合成)image num:5640 category num:47 split train:val:test = 1:1:1链接
CVPPP leaf segmentationInstance segmentation(样例分割)image num: 161 train num: 128 test num: 33链接
KITTI car segmentationInstance segmentation(样例分割)image num: 3976 train num: 3712 test num: 144 val:120链接
CityscapesInstance segmentation(样例分割)image num: 5000 train num: 2975 test num: 1525 val:500链接
SYMMAXSymmetry Detection(对称性检测)image num: train:200 test:100链接
WHSYMMAXSymmetry Detection(对称性检测)image num: train:228 test:100 object num: 1链接
SK506Symmetry Detection(对称性检测)image num: train:300 test:206 object num: 16链接
Sym-PASCALSymmetry Detection(对称性检测)image num: train:648 test:787 object num: 14链接
Color Checker DatasetColor constancy(颜色恒定)image num: 568链接
NUS 8-Camera DatasetColor constancy(颜色恒定)image num: 1736链接

Text

数据集介绍备注网址
Stanford Sentiment Treebank文本情感分析11855个句子划分为239231个短语,每个短语有个概率值,越小越负面,越大越正面链接
IMDB文本情感分析100,000句子,正面负面两类链接
Yelp文本情感分析链接
Multi-Domain Sentiment Dataset(Amazon product)文本情感分析100,000+句子,正面负面2类或强正面、弱正面、中立、弱负面、强负面5类链接
SemEval文本情感分析20,632句子,三类(正面、负面、中立)链接
Sentiment140(STS)文本情感分析1,600,000句子,三类(正面、负面、中立)链接
相关推荐
©️2020 CSDN 皮肤主题: 游动-白 设计师:白松林 返回首页