语言模型的弱监督视频异常检测方法
三项SOTA!MasQCLIP:开放词汇通用图像分割新网络
马里兰&NYU合力解剖神经网络,CLIP模型神经元形似骷髅头
深度解析CLIP在视觉语言理解与定位任务上的无监督迁移研究
车规模块系列(四):Cu-Clip互连技术简析
APE:对CLIP进行特征提纯能够提升Few-shot性能
复旦和Meta提出Open-VCLIP:兼顾时序建模与开集识别的视频理解模型
形状感知零样本语义分割
计算机视觉中的主动学习
LERF:当CLIP遇见NeRF!让自然语言与3D场景交互更直观
如何利用Transformers了解视觉语言模型
AIGC可编辑的图像生成方案
开源模型OpenCLIP达成ImageNet里程碑成就!
一种用于生成3D对象的替代方法
为什么不同模态的embedding在表征空间中形成不同的簇
用于学习对象级、语言感知和语义丰富视觉表征的GLIP模型
一种新的基于视觉语言模型的零镜头分类框架
如何充分挖掘预训练视觉-语言基础大模型的更好零样本学习能力
介绍一个基于CLIP的zero-shot实例分割方法
基于将 CLIP 用于下游few-shot图像分类的方案