机器学习和计算机视觉的前20个图像数据集

消耗积分:0 | 格式:pdf | 大小:505.77KB | 2021-01-28

分享资料个

作者 | Meiryum Ali
翻译 | 火火酱,责编 | 晋兆雨
出品 | AI科技大本营

计算机视觉使计算机能够理解图像和视频的内容。计算机视觉的目标是使人类视觉系统可以实现任务自动化。

计算机视觉任务包括图像采集、图像处理和图像分析。图像数据可以采用不同的形式，例如视频序列，从多个角度的不同的摄像机查看图像或来自医疗扫描仪的多维数据。

用于计算机视觉训练的图像数据集

Labelme：麻省理工学院计算机科学与人工智能实验室（CSAIL）创建的大型数据集，包含187,240张图像、62,197条带注释的图像和658,992张带标签的对象。

乐高积木：通过文件夹和使用Blender渲染的计算机对大约16700种乐高积木进行分类的大约12,700张图像。

ImageNet：用于新算法的实际图像数据集。根据WordNet层次结构进行组织，其中层次结构的每个节点都以成千上万的图像进行描绘。

LSUN：具有许多辅助任务的场景理解（房间布局估计、显着性预测等）

MS COCO：COCO是包含200,000多个标记图像的大规模对象检测、分割和字幕数据集。它可以用于对象分割，上下文识别以及许多其他用例。

哥伦比亚大学图像库：COIL100是一个数据集，其中包含360个旋转角度中每个角度成像的100个不同对象。

视觉基因组：视觉基因组是一个数据集和知识库，旨在将结构化图像概念与语言联系起来。该数据库具有详细的视觉知识库，并带有108,077张图像的字幕。

Google的开放图像：“Creative Commons”下900万个URL的图像集合，这些URL已用6000多个类别的标签进行了注释。

来自“打开图像”数据集的带注释的图像。左：Kevin Krejci的《鬼拱门》。右：J B制造的银制厨房用具。两个图像均在CC BY 2.0许可下使用。

Youtube-8M：带有标签的大规模数据集，由数百万个YouTube视频ID组成，带有超过3,800多个视觉实体的注释。

带标签的野外面孔：13,000个带标签的人脸图像，用于开发涉及面部识别的应用程序。

斯坦福犬类数据集：包含20,580张图像和120种不同的犬种类别，每个类别约有150张图像。

地点：以场景为中心的数据库，其中包含205个场景类别和250万个带有类别标签的图像。

CelebFaces：具有超过200,000张名人图像的人脸数据集，每个图像带有40个属性注释。

来自CelebFaces数据集的样本图像。

花卉：在英国常见的花朵图像数据集，包含102个不同类别。每个花类由40至258张图像组成，这些图像具有不同的姿势和光线变化。

植物图像分析：涵盖超过一百万张植物图像的数据集。可以从11种植物中选择。

家庭对象：一个数据集，其中包含来自家庭的随机对象，大部分来自厨房、浴室和客厅，这些对象分为训练和测试数据集。

CIFAR-10：包含60,000张32×32彩色图像的大型图像数据集，分为10类。数据集分为五个训练批次和一个测试批次，每个批次包含10,000张图像。

CompCars：包含163种车型，包含1,716种车型，每种车型都标有五个属性，包括最大速度、排量、门数、座位数和汽车类型。

室内场景识别：非常具体的数据集，非常有用，因为大多数场景识别模型在“外部”效果更好。包含67个室内类别，共15620张图像。

VisualQA：VQA是一个数据集，包含有关265,016张图像的开放式问题。这些问题需要对视觉和语言的理解。对于每个图像，至少有3个问题，每个问题10个答案。

原文链接：https://hackernoon.com/top-20-image-datasets-for-machine-learning-and-computer-vision-rq3w3zxo

本文由AI科技大本营翻译，转载请注明出处
译文链接：https://mp.weixin.qq.com/s/aRQXJ2_VP4SHeed6N52CVQ

下载并关注上传者

开通VIP，低至0.08元下载/次

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

ES9038PRO解码芯片的电路原理图介绍
2024-03-27 33次下载

下载
DC-DC电路(Buck)的设计与仿真
2024-03-24 22次下载

下载
UHD智能显示SoC VS680产品简介
2024-03-26 11次下载

下载
采用 Impedance Track™ 技术的宽量程电量监测计BQ34Z100-G1数据表
2024-03-21 7次下载

下载
16A 输出电流，高可靠、高效率同步降压转换器PCD3201产品手册
2024-04-01 6次下载

下载
电池管理系统(BMS)软硬件介绍
2024-03-27 6次下载

下载

机器学习和计算机视觉的前20个图像数据集

计算机视觉是什么 计算机视觉历史及发展趋势

计算机视觉中的注意力机制

模式识别和计算机视觉手册

基于计算机视觉的客机舱门识别与定位方法

机器视觉中的图像增广技术综述

详谈机器视觉与计算机视觉的异同

自动化机器视觉系统的发展

基于1602加矩阵键盘的简易计算机原理图及源码

机器视觉与计算机视觉的区别的讲解

机器视觉在汽车制造业中的应用的总结

基于计算机视觉和NLP的跨媒体问答与推理

基于C#的密尔计算机工具MilCalc

计算机视觉之目标检测

中国机器视觉行业发展现状与前景分析

如何通过深度学习，完成计算机视觉中的所有工作？

机器视觉与计算机视觉的概念到底有什么区别

计算机视觉和机器人和机器学习的线性代数基础知识详细说明

机器视觉与计算机视觉到底有什么区别

如何快速学习计算机视觉图像的分类

计算机视觉算法与应用的PDF电子书明细账

计算机体系结构的深度学习PDF电子书免费下载

OpenCV3计算机视觉Python语言实现第二版PDF电子书免费下载

学习计算机视觉的必读和选读书籍清单你学习过吗

OpenCV 3计算机视觉使用Python语言实现第二版PDF电子书免费下载

人工智能计算机视觉的详细资料概述

学习OpenCV中文版PDF电子书免费下载

Python计算机视觉编程中文版电子教材免费下载

二维小波包分解在计算机图像重构中的应用

计算机视觉贾云德pdf版

Lecture 2.2计算机视觉的多视几何

机器视觉、工业视觉和计算机视觉这三者的关系

计算机视觉与图像处理、模式识别、机器学习学科之间的关系

计算机视觉：AI如何识别与理解图像

计算机视觉中的九种深度学习技术

人工智能计算机视觉方向是什么

机器视觉和计算机视觉的区别

什么是机器视觉？机器视觉与计算机有什么关系？

计算机视觉与图像处理、机器学习之间的关系

机器视觉和计算机视觉的区别

计算机视觉就业前景

什么是机器视觉计算机？

计算机视觉技术：机器如何“看到”图像

计算机视觉的重要性及如何帮助解决问题

用于计算机视觉训练的图像数据集

攻读计算机视觉和机器学习硕士有啥好的？

用于计算机视觉训练的图像数据集

计算机视觉的实现基本过程

深度学习在计算机视觉上的四大应用

基于计算机视觉的多维图像智能

计算机视觉原理分析及其应用

三大厂商推出AI嵌入式视觉入门套件，用于计算机视觉和机器学习设计

计算机视觉和机器学习如何让回收变得智能化

计算机视觉与机器视觉之间有什么差异

你真的了解什么是计算机视觉吗?

计算机视觉的应用服务于机器学习 各个环节缺一不可相辅相成

计算机视觉就业怎么样

基于计算机视觉的自动搜索图像语义分割架构

计算机视觉与机器视觉区别

计算机视觉是什么

计算机视觉与图像处理、模式识别、机器学习学科之间的关系

下载排行榜

ES9038PRO解码芯片的电路原理图介绍

DC-DC电路(Buck)的设计与仿真

UHD智能显示SoC VS680产品简介

采用 Impedance Track™ 技术的宽量程电量监测计BQ34Z100-G1数据表

16A 输出电流，高可靠、高效率 同步降压转换器PCD3201产品手册

电池管理系统(BMS)软硬件介绍

计算机视觉是什么计算机视觉历史及发展趋势

计算机视觉的应用服务于机器学习各个环节缺一不可相辅相成

16A 输出电流，高可靠、高效率同步降压转换器PCD3201产品手册