一种新的分割模型Stable-SAM

描述

0. 笔者个人体会

分割一切模型(SAM)这几年在CV领域应用很多,很多文章都在努力提高SAM的分割精度,但SAM分割的前提是高质量的提示(点、框)。但是实践中的SAM经常遇到不准确的提示,尤其是众包标注平台,这种不准确的提示会导致分割错误。

这也就是Stable Segment Anything Model这篇文章想要解决的问题,提出了一种新的分割模型Stable-SAM,希望遇到错误提示时也能实现稳定分割!

1. 效果展示

SAM、HQ-SAM、Stable-SAM在提供次优提示时的性能比较,Stable-SAM明显优于其他算法。

dsp

SAM和Stable-SAM的预测Mask和图像特征的权重对比,橙色圆圈表示注意力权重,半径越大表示得分越高。(a) 当提供高质量提示时,SAM分割结果很好。(b) 微小的提示修改会导致不稳定的分割输出,SAM错误分割了背景。(c) Stable-SAM通过将更多的特征采样注意力转移到目标对象上来准确地分割目标对象。

2. 具体原理是什么?

Stable-SAM的具体pipeline由三部分组成:

(a)是SAM的Mask解码器中的可变形采样插件(DSP)和可变形路由插件(DRP)。DSP采用小偏移网络(b)来预测特征采样偏移。随后DSP在更新的采样位置对可变形图像特征进行重新采样,并将它们馈送到SAM的标记到图像注意力。DRP采用一个小型MLP网络(c)来根据输入提示质量调节DSP激活的程度。注意,DSP自适应地单独调整图像特征采样位置,不会改变原始SAM模型。

dsp

3. 和其他SOTA方法对比如何?

在不同质量的提示下,SAM、DT-SAM(微调SAM的Mask解码器)、PT-SAM(微调SAM的提示token及其对应的输出MLP层)、HQ-SAM和Stable-SAM在HQ数据集上的对比。这里也推荐工坊推出的新课程《如何将深度学习模型部署到实际工程中?(分类+检测+分割)》。

dsp

MS COCO和SGinW数据集上的对比,Stable-SAM最优。

dsp

审核编辑:黄飞

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分