细粒度图像分析技术详解

消耗积分:1 | 格式:rar | 大小:0.3 MB | 2017-09-30

分享资料个

　　“有别于我们熟悉的图像识别，“细粒度图像分析”所属类别和粒度更为精细，本文将向读者全面介绍这一领域的相关技术。 ”

　　有别于通用图像分析任务，细粒度图像分析的所属类别和粒度更为精细，它不仅能在更细分的类别下对物体进行识别，就连相似度极高的同一物种也能区别开来。本文将分别围绕“细粒度图像分类”和“细粒度图像检索”两大经典图像问题来展开，从而使读者对细粒度图像分析领域有全面的理解。

　　大家应该都会有这样的经历：逛街时看到路人的萌犬可爱至极，可仅知是“犬”殊不知其具体品种；初春踏青，见那姹紫嫣红丛中笑，却桃杏李傻傻分不清……实际上，类似的问题在实际生活中屡见不鲜。如此问题为何难？究其原因，是普通人未受过针对此类任务的专门训练。倘若踏青时有位资深植物学家相随，不要说桃杏李花，就连差别甚微的青青河边草想必都能分得清白。为了让普通人也能轻松达到“专家水平”，人工智能的研究者们希望借助计算机视觉技术（Computer Vision，CV）来解决这一问题。如上所述的这类任务在CV研究中有个专门的研究方向，即“细粒度图像分析”（Fine-Grained Image Analysis）。

　　细粒度图像分析任务相对通用图像（General/Generic Images）任务的区别和难点在于其图像所属类别的粒度更为精细。以图1为例，通用图像分类其任务诉求是将“袋鼠”和“狗”这两个物体大类（蓝色框和红色框中物体）分开，可见无论从样貌、形态等方面，二者还是很容易被区分的；而细粒度图像的分类任务则要求对“狗”该类类别下细粒度的子类，即分别为“哈士奇”和“爱斯基摩犬”的图像分辨开来。正因同类别物种的不同子类往往仅在耳朵形状、毛色等细微处存在差异，可谓“差之毫厘，谬以千里”。不止对计算机，对普通人来说，细粒度图像任务的难度和挑战无疑也更为巨大。

　　细粒度图像分析技术详解

　　图1 通用图像分析

　　在此，本文针对近年来深度学习方面的细粒度图像分析任务，分别从“细粒度图像分类”（Fine-Grained Image Classification）和“细粒度图像检索”（Fine-Grained Image Retrieval）两大经典图像问题进行进展综述，以期读者可以对细粒度图像分析领域提纲挈领地窥得全貌。

　　细粒度图像分类

　　诚如刚才提到，细粒度物体的差异仅体现在细微之处。如何有效地对前景对象进行检测，并从中发现重要的局部区域信息，成为了细粒度图像分类算法要解决的关键问题。对细粒度分类模型，可以按照其使用的监督信息的强弱，分为“基于强监督信息的分类模型”和“基于弱监督信息的分类模型”两大类。

　　基于强监督信息的细粒度图像分类模型

　　所谓“强监督细粒度图像分类模型”是指：在模型训练时，为了获得更好的分类精度，除了图像的类别标签外，还使用了物体标注框（Object Bounding Box）和部位标注点（Part Annotation）等额外的人工标注信息，如图2所示。

　　细粒度图像分析技术详解

　　图2 物体标注框和部位标注点

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

暂无相关数据

细粒度图像分析技术详解

2023可穿戴设备行业技术与市场分析

图像隐写分析算法及途径研究综述

程度多粒度软粗糙集模型综述

基于BiLSTM-CRF的细粒度知识图谱问答模型

基于安全漏洞威胁模式的网络表示学习算法

面向用户评论的方面级情感分析技术综述

结合词特征与语义特征的网络评价对象识别

基于深度迁移学习网络的肺结节辅助CT诊断

基于文本的细粒度美妆图谱视觉推理问题

结合非局部和多区域注意力机制的细粒度识别方法

基于卷积神经网络多层面二阶特征融合模型

基于近邻传输的粒度支持向量机学习算法

一种中文电子病历医疗实体关系识别方法

基于深度图注意力卷积CNN的三维模型识别方法

结合CSPPNet与集成学习的人类蛋白质图像分类

一种多粒度融合的模糊规则系统图像特征学习算法

如何使用FPGA实现可选主元LU分解流水线算法的设计

基于工控协议功能码特征的同源攻击分析方法

关于类脑和神经计算

基于深度学习的X射线胸部疾病诊断算法

基于双向长短期记忆神经网络的交互注意力模型

分析总结基于深度神经网络的图像语义分割方法

基于LSTM模型的多时间尺度融合预测方法

一种基于深度学习的焊点位置检测方法

一种利用GPU并行计算提升杂波生成实时性的方法

一种采用深度残差网络的头部姿态估计方法

针对遥感图像场景分类的多粒度特征蒸馏方法

如何使用神经网络实现实体属性情感分析

Unroll & Pipeline | 细粒度并行优化的完美循环

如何使用神经网络技术实现实体属性的情感分析

MATLAB图像处理工具箱的函数介绍和图像处理与分析的技术实现分析

大规模专家并行模型在TensorRT-LLM的设计

Commvault Cloud平台如何应对勒索软件攻击

Perforce Helix Core通过ISO 26262认证！为汽车软件开发团队提供无限可扩展性、细粒度安全性、文件快速访问等

如何设定机器人语义地图的细粒度级别

微信大模型扩容并开源，推出首个中英双语文生图模型，参数规模达15亿

ICLR 2024 清华/新国大/澳门大学提出一模通吃的多粒度图文组合检索MUG：通过不确定性建模，两行代码完成部署

Kubernetes RBAC：掌握权限管理的精髓

详解时域瞬态分析技术

一个用于周视语义占用网格感知的基准测试

激光粒度分析仪的调整精确原理

论文插图也能自动生成了！用到了扩散模型，还被ICLR 2023接收！

基于实体和动作时空建模的视频文本预训练

图模型在方面级情感分析任务中的应用

细粒度图像识别深度学习开源工具库Hawkeye解析

Leptos利用细粒度的响应式来构建声明性用户界面

如何通过改进计算核心架构提高神经网络内存和算力需求

NLP的经典任务——句法（Syntactic）分析

pwru的使用方法、经典场景及实现原理

通过对比学习的角度来解决细粒度分类的特征质量问题

机器翻译中细粒度领域自适应的数据集和基准实验

中科曙光发布新一代StackCube-K超融合一体机

利用NVIDIA安培结构和TensorRT部署神经网络

浪潮信息ISPIM平台基于AI算法，整个数据中心细粒度管理

激光粒度分析仪的工作流程是什么

情感分析常用的知识有哪些呢？

绍华为云在细粒度情感分析方面的实践

Google推出地标实例识别和图像检索人物数据集

激光粒度仪的应用

细粒度图像分析任务在发展过程中面临着独特的挑战

FGIA 中的主要问题和挑战

下载排行榜