采用双塔BERT模型对文本字符和label进行编码
视频目标跟踪分析
文本预训练的模型架构及相关数据集
5种前沿的点云分割网络
CNN根本无需理解图像全局结构,一样也能SOTA?
常见的异常检测方法
KITTI 3D检测数据集
Swin Transformer在MIM中的应用
关于Prompt在NER场景的应用总结
关于GoPro-陀螺仪数据集
视频P图新SOTA:推理速度快近15倍
基于e-CARE的因果推理相关任务
一个“枪枪爆头”的视觉AI自瞄程序!
Multilingual多语言预训练语言模型的套路
全面总结深度学习中的归一化技术
数据分析将成为创新起源与企业核心能力
通过RAPIDS加速单细胞DNA和RNA基因组分析
实现宽光谱感算一体智能器件
机器翻译中细粒度领域自适应的数据集和基准实验
多模态机器学习的图像语言转换器