电子说
刚刚,CVPR 2019最佳论文公布了:来自CMU的辛书冕等人合作的论文获得最佳论文奖,最佳学生论文也由加州大学圣巴巴拉分校Xin Wang等人摘得。此外,经典论文奖授予了李飞飞等人的杰出工作ImageNet。
备受瞩目的CVPR 2019正在美国加州长滩举行。作为计算机视觉和模式识别的顶级学术会议,每年的 CVPR 都汇聚了领域技术发展的前沿。而 CVPR 的最佳论文则更是备受关注,多有经典。
CVPR 2019大会现场
而就在刚刚,CVPR 2019揭晓了最佳论文奖以及其他奖项。
最佳论文奖授予了卡内基梅隆大学、多伦多大学、伦敦大学学院的辛书冕(Shumian Xin), Sotiris Nousias等人合作的论文A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction
最佳学生论文授予了加州大学圣巴巴拉分校、微软研究院、杜克大学的Xin Wang, Qiuyuan Huang等人合作的论文Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation。
此外,经典论文奖Longuet-Higgins 奖被授予了李飞飞、李佳等人的ImageNet工作。
根据CVPR官网的介绍,今年CVPR一共收到创纪录的5165篇有效投稿,比去年的3309篇多出近2000篇。
经过132位领域主席和2887位审稿人三个月的辛勤工作,最终有1294篇论文被接收,最终录取率为25.2%。1294篇录取论文中,有288篇被录用为Oral论文。参会人数上,本届CVPR也是盛况空前,超过9000人注册。
CVPR 2019相关数据
本届CVPR大会主席是马里兰大学Larry Davis教授、牛津大学Philip Torr教授,以及加州大学洛杉矶分校(UCLA)朱松纯教授。本届CVPR组织者中也不乏华人学者面孔,除UCLA朱松纯教授担任大会主席外,便利蜂 AI 研究院的华刚博士、加州大学圣地亚哥分校的屠卓文担任程序主席。
会议的132位领域主席中,也有多位华人面孔,比如白翔、程明明、孙剑、贾佳亚、林达华、吕乐、马毅、苏昊颜水成、虞晶怡、张正友等等(不完全统计)。
接下来,新智元带来CVPR 2019最佳论文奖及其他奖项的介绍:
最佳论文
最佳论文:
A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction
作者:Shumian Xin, Sotiris Nousias, Kiriakos N. Kutulakos, Aswin C. Sankaranarayanan, Srinivasa G. Narasimhan and Ioannis Gkioulekas
作者机构:卡内基梅隆大学、多伦多大学、伦敦大学学院
论文地址:https://www.ri.cmu.edu/publications/a-theory-of-fermat-paths-for-non-line-of-sight-shape-reconstruction/
摘要:
我们提出了一个新的理论,即在一个已知的可见场景和一个不在瞬态相机视线范围内的未知物体之间的Fermat path。这些光路要么遵守镜面反射,要么被物体的边界反射,从而编码隐藏物体的形状。
我们证明费马路径对应于瞬态测量中的不连续性。然后,我们推导出一种新的约束,它将这些不连续处的路径长度的空间导数与表面法线相关联。
基于这一理论,我们提出了一种名为Fermat Flow的算法来估计非视距物体的形状。我们的方法首次允许复杂对象的精确形状恢复,范围从隐藏在拐角处以及隐藏在漫射器后面的漫反射到镜面反射。
最后,我们的方法与用于瞬态成像的特定技术无关。因此,我们展示了使用SPAD和超快激光从皮秒级瞬态恢复的毫米级形状,以及使用干涉测量法从飞秒级瞬态微米级重建。我们相信我们的工作是非视距成像技术的重大进步。
最佳论文提名
获得最佳论文提名奖的是:
Learning the Depths of Moving People by Watching Frozen People
作者:Zhengqi Li, Tali Dekel, Forrester Cole, Richard Tucker, Noah Snavely, Ce Liu, William T. Freeman
作者机构:Google Research
论文链接:https://arxiv.org/abs/1904.11111
A Style-Based Generator Architecture for Generative Adversarial Networks
作者:Tero Karras, Samuli Laine, Timo Aila
作者机构:NVIDIA
论文链接:https://arxiv.org/abs/1812.04948
最佳学生论文
最佳学生论文:
Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation
题目:面向语言视觉导航(VLN)的强化交叉模型匹配和半监督模仿学习
作者:Xin Wang,Qiuyuan Huang,AsliCelikyilmaz,Jianfeng Gao,Dinghan Shen,Yuan-Fang Wang,William Yang Wang,Lei Zhang
Xin Wang,Yuan-FangWang,William Yang Wang 加州大学圣芭芭拉分校
Qiuyuan Huang,Asli Celikyilmaz,Jianfeng Gao,Lei Zhang 微软研究院
Dinghan Shen 杜克大学
摘要:
视觉语言导航(VLN)是对真实智能体在真实 3D 环境内执行自然语言指令的任务。本文研究了如何解决这项任务的三个关键挑战:跨模态基础、不适定反馈和泛化问题。
首先,我们提出了一种基于强化学习的新的强化交叉模型匹配(RCM)方法。我们特别将匹配的批评内容作为内在奖励,以促进指令和智能体运动轨迹之间的全局性匹配,并利用推理导航器在本地视觉场景中执行跨模态 grounding。对 VLN 基准数据集的评估表明,我们的 RCM 模型在 SPL 上显着优于以前的方法,优化幅度高达 10%,并达到了最先进的性能。
为了提高学习政策的可泛化性,文章进一步引入了自我监督模仿学习(SIL)方法,通过模仿自己过去的高质量决策来探索未见过的环境。结果表明,SIL 方法可以近似地获得更好、更有效的策略,极大地降低了已见过和未见过的环境之间的成功率上的性能差距(由 30.7%降低至 11.7%)。
经典论文:Longuest-Higgins 奖
Longuet-Higgins 奖是 IEEE 计算机协会模式分析与机器智能(PAMI)技术委员会在每年的 CVPR 颁发的 “计算机视觉基础贡献奖”,表彰十年前对计算机视觉研究产生了重大影响的 CVPR 论文。奖项以理论化学家和认知科学家 H. Christopher Longuet-Higgins 命名。
2019 年的 Longuet-Higgins 奖被授予了李飞飞、李佳等人的ImageNet工作:ImageNet: A Large-Scale Hierarchical Image Database。ImageNet可以说是计算机视觉领域最负盛名的工作,这篇论文发表于 2009 年CVPR,目前已有11508次引用。
全部0条评论
快来发表一下你的评论吧 !