在这项工作中,我们重温了〔13〕中提出的全局平均池层,并阐明了它如何明确地使卷积神经网络(CNN)具有显著的定位能力,尽管它是在图像级标签上训练的。虽然这种技术以前被提出作为正则化训练的一种手段,但我们发现它实际上建立了一个通用的可本地化的深层表示,从而暴露出cnn对图像的内隐注意。尽管全球平均池明显简单,但我们能够在ILSVRC 2014上实现37.1%的目标定位前5名错误,而无需对任何边界框进行培训注释。我们在各种实验中证明,我们的网络能够定位有区别的图像区域,尽管只是训练解决分类任务
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !