深度学习数据集近百个开源数据集

2024-07-12 12:35:06| 来源: 网络整理| 查看: 265

深度学习开源数据集 Images Analysis 图像分析数据集介绍备注网址 Flickr30k 图片描述 31,783 images，每张图片5个语句标注传送门 Microsoft COCO 图片描述 330,000 images,每张图片至少5个语句标注传送门 ESP Game 多标签定义图像 20,770 images，268 tags，诸如bed, light man,music 传送门 IAPRTC-12 多标签定义图像 19,452 images,291 tags 传送门 NUS-WIDE 多标签定义图像 269,648 images,several tags (2-5 on average) per image 传送门 CUHK-PEDES 以文搜图 34,054 images，每张图片2条描述传送门 VRD 视觉关系检测 5,000 images, 100目录，37,993对关系传送门 sVG 视觉关系检测 108,000 images, 998,000对关系传送门 Visual Genome Dataset 图像属性检测 108,077 images, 5.4 M 区域块，2.8 M 属性，2.3 M 关系传送门 VQA 问答系统 1,105,904问题，11,059,040 回答传送门 Visual7W 问答系统 327,939 问答对传送门 TID2013 图像质量评价 25张参考图像，24个失真类型传送门 CSIQ 图像质量评价 30张参考图像，6个失真类型传送门 LIVE 图像质量评价 29张参考图像，5个失真类型传送门 WATERLOO 图像质量评价 4744张参考图像，20个失真类型传送门 photo .net 图像美观评价 20,278张图像，打分[0,10] 传送门 DPChallenge .com 图像美观评价 16,509张图像，打分[0,10] 传送门 CUHK 图像美观评价 28,410张图像，只分高质量和低质量传送门 AVA 图像美观评价 255,500张图像，打分[0,10] 传送门 Image Motion & Tracking 图像运动与跟踪数据集介绍备注网址 CUHK03 Person re-identification(人重识别) image num:13164 person num:1360 camera num:10( 5 pairs) 传送门 CUHK02 Person re-identification(人重识别) image num:7264 person num:1816 camera num:10( 5 pairs) 传送门 CUHK01 Person re-identification(人重识别) image num:3884 person num:971 camera num: 2 传送门 VIPeR Person re-identification(人重识别) image num:1264 person num:632 camera num:2 传送门 ETH1,2,3 Person re-identification(人重识别) image num:8580 person num:83,35,28 camera num:1 传送门 PRID2011 Person re-identification(人重识别) image num:24541 person num:934 camera num:2 传送门 MARS Person re-identification(人重识别) image num:11910031 person num:1261 camera num:6 传送门 Market1501 Person re-identification(人重识别) image num:32217 person num:1501 camera num:6 传送门 Epic Fail (EF) dataset Risk Assessment(风险评估) video num:3000 传送门 Street Accident (SA) dataset Risk Assessment(风险评估) video num:1733 传送门 OTB-50 visual tracking(跟踪) video num:50 传送门 OTB-100 visual tracking(跟踪) video num:100 传送门 VOT2015 visual tracking(跟踪) video num:60 传送门 ALOV300 visual tracking(跟踪) video num:314 传送门 MOT visual tracking(跟踪) video num train:11 test:11 传送门 THUMOS Temporal action localization(动作定位) video num:~3K activities class:20 instances:~3K 传送门 ActivityNet Temporal action localization(动作定位) video num:20k activities class:200 instances:7.6K 传送门 Mexaction2 Temporal action localization(动作定位) activities class:2 instances:1975 传送门 FlyingChairs dataset optical flow(光流) image pairs：22k 传送门 FlyingThings3D optical flow(光流) image pairs：22k 传送门 KITTI benchmark suite optical flow(光流) image pairs：1600 传送门 MPI Sintel optical flow(光流) image pairs：1064 传送门 Video Analysis & Scene Understanding 影像分析与情景理解数据集介绍备注网址 UCF101 动作行为识别 13320 video,101类动作，主要是五大类：1)人-物交互；2)肢体运动；3)人-人交互；4)弹奏乐器；5)运动传送门 HMDB51 动作行为识别 7000 videos,51类，包括人脸表情动作，身体动作，人与人交互等传送门 Moments-in-Time 动作行为识别 1,000,000 videos,339类传送门 ActivityNet 1.3 动作行为识别 20,000 videos,200类传送门 Kinetics 动作行为识别 300,000 videos，400类传送门 AVA 动作行为识别 57,600 videos，80类传送门 Collective Activity Dataset 群体活动行为识别 44 videos,穿叉、行走、等待、交谈和排队五类传送门 Choi’s New Dataset 群体活动行为识别 32 videos，聚会，谈话，分开，一起走，追逐和排队六类 None ActivityNet 1.3 检测动作事件的起始时间和终止时间 20,000 videos,200类动作的起始时间和终止时间传送门 THUMOS 检测动作事件的起始时间和终止时间 15,000 videos，101类动作的起始时间和终止时间传送门 MED 事件检测 32,744 videos,20个事件传送门 EventNet 事件检测 90,000 videos，500个事件传送门 Columbia Consumer Video 事件检测 9,317 videos，20个事件传送门 ADE20K 事件检测 20,210 videos，900个事件传送门 DAVIS 视频主物体分割 50 videos，分割标注传送门 FBMS 视频主物体分割 59 videos，分割标注传送门 IJB-C 视频人脸识别 11,000 videos 传送门 YouTube Faces 视频人脸识别 3,425 videos，1595 人传送门 MS-Celeb-1M 视频人脸识别 1,000,000 images，21,000人传送门 MSVD 视频描述 1,970 videos 传送门 MSR-VTT-10K 视频描述 10，000 videos 传送门 3D Computer Vision 3d计算机视觉数据集介绍备注网址 photoface database 基于光度立体视觉的二维和三维人脸识别数据库总共7356张图像，包含1839个session和261个subjects None NYU Depth V2 dataset 关于RGBD 图像场景理解的数据库提供1449张深度图片和他们的密集2d点类标注传送门 SUN RGBD dataset 是上面的NYU Depth V2 dataset的超集，多了3D bounding boxes和room layouts的标注。有10,000张RGB-D图片，有58,657个3D包围框和146,617 个2d包围框。传送门 PASCAL3D+ 新的三维物体检测和姿态估计数据集，从PASCAL VOC 演化而来，包含图像，注解，和3D CAD模型总共12个类，平均每个类别有3000多个实例传送门 IKEA 包含典型室内场景的三维模型的数据库，例如桌子椅子等包含大约759张图片和219个3D模型传送门 New Tsukuba Dataset 包含了很多立体物体对的数据库，用于立体物体匹配总共1800个立体物体对，以及每立体对的立体视差图、遮挡图和不连续图传送门 Oxford RobotCar Dataset 关于户外自动驾驶的数据集。包含在驾驶汽车过程从6个摄像头收集的2000w张图片，和当时的激光雷达，GPS和地面实况标注。传送门 Middlebury V3 包含高分辨率物体立体视差标注的数据库包含33个类，没有明说每类有多少数据传送门 ShapeNet 包含3D模型，和3d模型的类别标注的数据集，覆盖了常用的3D数据集PASCAL 3D+。它涵盖55个常见的对象类别，有大约51,300个3D模型传送门 MICC dataset 包含了3D人脸扫描和在不同分辨率，条件和缩放级别下的几个视频序列的数据库。有53个人的立体人脸数据传送门 CMU MoCap Dataset 包含了3D人体关键点标注和骨架移动标注的数据集。有6个类别和23个子类别，总共2605个数据。传送门 DTU dataset 关于3D场景的数据集。有124个场景，每场景有49/64个位置的RGB图像和结构光标注。传送门 Analyzing Humans in Images 人类分析形象化数据集介绍备注网址 MSR-Action3D 包含深度的动作识别数据集，有20个动作，总共557个序列。传送门 Florence-3D 包含深度的动作识别数据集，有9个动作，总共215个动作序列。传送门 Berkeley MHAD 包含深度的动作识别数据集，有11个动作，产生660个动作序列。传送门 Online Action Detection 包含深度的动作识别数据集，数据集包含59个长序列，包含10种不同的日常生活行为。传送门 ChaLearn LAP IsoGD Dataset RGB-D图像的手势识别的数据集。包括47933个RGB-D手势视频，有249个手势标签。Training有35878视频，Validation有5784个，test有6271个传送门 MAFA dataset 关于面部遮挡问题的数据集有30, 811张人脸和35806张有遮挡的脸组成。传送门 MSRC-12 Kinect Gesture Dataset 手势识别数据集有4900张图片，包含12个不同手势，传送门 2013 Chalearn Gesture Challenge dataset 手势识别数据集有11000张图片，包含20个不同手势，传送门 WIDER FACE 人脸检测数据集有 32,203 张图片，标注了393703个人脸。传送门 FDDB 人脸检测数据集 2845张图片，标注了5171张人脸。传送门 300-VW dataset 面部表情数据集包含114个视频和总计218,595帧。传送门 HMDB51 人类行为识别的数据集包含51个动作，总共有6766个视频剪辑传送门 MPII Cooking Activities Dataset 人类行为识别的数据集包含65个动作，有5609个视频传送门 UCF101 人类行为识别的数据集包含101个动作，有13320个视频传送门 IJB-A dataset 包含视频和图片人脸识别的数据集包含5712个图像和2085个视频传送门 YouTube celebrities 视频人脸识别的数据集包含47位名人的1910个视频传送门 COX 视频人脸识别的数据集包含1000个主题的4000个视频传送门 Human3.6M 人体姿态估计的数据集 360万张3D照片，11名受试者在4个视点下执行15个了不同的动作传送门 iLIDS 行人重识别的数据集 476 张图像，包含119个人传送门 VIPeR 行人重识别的数据集 632个行人图片对（由两个相机拍摄）传送门 CUHK01 行人重识别的数据集包含971行人, 3884张图片传送门 CUHK03 行人重识别的数据集包含1360行人, 13164张图片传送门 RWTH-PHOENIX-Weather multi-signer 2014 手语识别的数据集包含了5672个德语手语的句子，有65,227个手语姿势和799,006帧传送门 AFLW 人类面部关键点的数据集总共约有25k张脸，每幅图像标注了大约21个位置。传送门 CMU mocap database 动作识别的数据集 2235个数据，包含144个不同的动作。传送门 Georgia Tech (GT) database 人脸识别数据库 50个人每人15张人脸。传送门 ORL 人脸识别数据库 40个人每个人10张图。传送门 Application 应用数据集介绍备注网址 DogCentric Activity Dataset 第一视角的狗和人之间的相互行为的数据集（视频）总共有10类，具体数据量没有明说，y是动作类别传送门 JPL First-Person Interaction Dataset 第一视角观察动作的数据集 57个视频，8个大类，y是动作类别传送门 NUS-WIDE 关于图像文本匹配的数据集 269,648个图像和对应的标签传送门 LabelMe Dataset 关于图像文本匹配的数据集 3825个图像和对应标签传送门 Pascal Dataset 关于图像文本匹配的数据集 5011张训练图像和4952张测试图像 None ICDAR 2015 关于文本检测的数据集 1500张训练，1000张测试，y为四边形的四个顶点。传送门 COCO-Text 关于文本检测的数据集 63686张图片，其中43686张被选为训练集，剩下的2万用于测试。传送门 MSRA-TD500 关于文本检测的数据集 300个训练，200个测试图像传送门 Microsoft 7-Scenes Dataset 室内人体运动的数据集有7种不同室内环境，每包含500-1000张图像视频序列。传送门 Oxford RobotCar 户外自动驾驶数据集包含图像，激光扫描结果和GPS数据。传送门 Low- & Mid-Level Vision 中低水平视觉数据集介绍备注网址 Deep Video Deblurring for Hand-held Cameras video/image deblurring(图像去模糊) video num:71 video time: 3-5s blurry and sharp pair image num:6708 传送门 GOPRO dataset video/image deblurring(图像去模糊) blurry and sharp pair image num:3214 train num:2103 test num:1111 传送门 BSD68 image restoration(图像修复)/高斯降噪 image num:68 传送门 BSD100 “image restoration(图像修复)super resolution超分辨率重建” image num:100 传送门 Set5 “image restoration(图像修复)super resolution超分辨率重建” image num:5 传送门 Set14 “image restoration(图像修复)super resolution超分辨率重建” image num:14 传送门 Urban100 “image restoration(图像修复)super resolution超分辨率重建” image num:100 传送门 NYU v2 dataset “image restoration(图像修复)depth super resolution深度超分辨率重建” image num:1449 传送门 Middlebury dataset “image restoration(图像修复)depth super resolution深度超分辨率重建” image pair num: 33 传送门 alpha matting benchmark Natural image matting(抠图) “train num:27,test num:8” 传送门 real image benchmark Natural image matting(抠图) “train num:49300,test num:1000” 传送门 MSRA10K/MSRA-B Image saliency detection(显著性区域检测) image num(MSRA10K):10000 image num(MSRA-B):5000 传送门 ECSSD Image saliency detection(显著性区域检测) image num:1000 传送门 DUT-OMRON Image saliency detection(显著性区域检测) image num:5168 传送门 PASCAL-S Image saliency detection(显著性区域检测) image num:850 传送门 HKU-IS Image saliency detection(显著性区域检测) image num:4447 传送门 SOD Image saliency detection(显著性区域检测) image num:300 传送门 Describable Textures Dataset texture synthesis(纹理合成) image num:5640 category num:47 split train:val:test = 1:1:1 传送门 CVPPP leaf segmentation Instance segmentation(样例分割) image num: 161 train num: 128 test num: 33 传送门 KITTI car segmentation Instance segmentation(样例分割) image num: 3976 train num: 3712 test num: 144 val:120 传送门 Cityscapes Instance segmentation(样例分割) image num: 5000 train num: 2975 test num: 1525 val:500 传送门 SYMMAX Symmetry Detection(对称性检测) image num: train:200 test:100 传送门 WHSYMMAX Symmetry Detection(对称性检测) image num: train:228 test:100 object num: 1 传送门 SK506 Symmetry Detection(对称性检测) image num: train:300 test:206 object num: 16 传送门 Sym-PASCAL Symmetry Detection(对称性检测) image num: train:648 test:787 object num: 14 传送门 Color Checker Dataset Color constancy(颜色恒定) image num: 568 传送门 NUS 8-Camera Dataset Color constancy(颜色恒定) image num: 1736 传送门 Text 文本数据集介绍备注网址 Stanford Sentiment Treebank 文本情感分析 11855个句子划分为239231个短语，每个短语有个概率值，越小越负面，越大越正面传送门 IMDB 文本情感分析 100,000句子，正面负面两类传送门 Yelp 文本情感分析无传送门 Multi-Domain Sentiment Dataset(Amazon product) 文本情感分析 100,000+句子，正面负面2类或强正面、弱正面、中立、弱负面、强负面5类传送门 SemEval 文本情感分析 20,632句子，三类（正面、负面、中立）传送门 Sentiment140(STS) 文本情感分析 1,600,000句子,三类（正面、负面、中立）传送门情感/观点/评论倾向性分析数据集备注网址 ChnSentiCorp_htl_all 7000 多条酒店评论数据，5000 多条正向评论，2000 多条负向评论传送门 waimai_10k 某外卖平台收集的用户评价，正向 4000 条，负向约 8000 条传送门 online_shopping_10_cats 10 个类别，共 6 万多条评论数据，正、负向评论各约 3 万条，包括书籍、平板、手机、水果、洗发水、热水器、蒙牛、衣服、计算机、酒店传送门 weibo_senti_100k 10 万多条，带情感标注新浪微博，正负向评论约各 5 万条传送门 simplifyweibo_4_moods 36 万多条，带情感标注新浪微博，包含 4 种情感，其中喜悦约 20 万条，愤怒、厌恶、低落各约 5 万条传送门 dmsc_v2 28 部电影，超 70 万用户，超 200 万条评分/评论数据传送门

yf_dianping 24 万家餐馆，54 万用户，440 万条评论/评分数据传送门 yf_amazon 52 万件商品，1100 多个类目，142 万用户，720 万条评论/评分数据传送门

更多数据集可前往github搜索“chineseNLP”下载，传送门：

　　https://github.com/search?utf8=%E2%9C%93&q=chineseNLP&type=

以及大规模数据及：

【本文地址】

公司简介

联系我们

今日新闻

点击排行

实验室常用的仪器、试剂和: 说到实验室常用到的东西，主要就分为仪器、试剂和耗

不用再找了，全球10大实验: 01、赛默飞世尔科技（热电）Thermo Fisher Scientif

三代水柜的量产巅峰T-72坦: 作者：寞寒最近，西边闹腾挺大，本来小寞以为忙完这

通风柜跟实验室通风系统有: 说到通风柜跟实验室通风，不少人都纠结二者到底是不

集消毒杀菌、烘干收纳为一: 厨房是家里细菌较多的地方，潮湿的环境、没有完全密

实验室设备之全钢实验台如: 全钢实验台是实验室家具中较为重要的家具之一，很多

图片新闻

实验室药品柜的特性有哪些: 实验室药品柜是实验室家具的重要组成部分之一，主要

小学科学实验中有哪些教学: 计算机计算器一般打孔器打气筒仪器车显微镜

实验室各种仪器原理动图讲: 1.紫外分光光谱UV分析原理：吸收紫外光能量，引起分

高中化学常见仪器及实验装: 1、可加热仪器：2、计量仪器：（1）仪器A的名称：量

微生物操作主要设备和器具: 今天盘点一下微生物操作主要设备和器具，别嫌我啰嗦

浅谈通风柜使用基本常识: 　众所周知，通风柜功能中最主要的就是排气功能。在

深度学习数据集近百个开源数据集

深度学习数据集近百个开源数据集

今日新闻

点击排行

推荐新闻

图片新闻

专题文章

深度学习数据集 近百个开源数据集

深度学习数据集 近百个开源数据集

今日新闻

点击排行

推荐新闻

图片新闻

专题文章

深度学习数据集近百个开源数据集

深度学习数据集近百个开源数据集