计算机视觉的发展将能够有效提高多媒体系统的性能

描述

2020年10月12-16日,多媒体领域的国际顶级会议ACM MM 2020在美国西雅图举行,深兰科技再传捷报,获得了Video Relation Understanding竞赛/视频目标检测任务的第一名,以及异常事件检测挑战赛/常规异常事件检测任务的第三名。此次获奖方案均对现实应用场景有着实际意义,将有效提升自动驾驶、安防监控等领域的安全性。

尽管计算机视觉的最新进展有效地提高了多媒体系统的性能,但仍然不能明确回答一个核心问题:机器是否理解视频中发生的事情,分析结果是否可以被人类用户解释?为了推动上述问题的研究,新加坡国立大学推出了VidOR数据集,同时在ACM MM 2020上举办了Video Relation Understanding竞赛。视频目标检测(Video Object Detection)作为竞赛任务,要求参与者开发鲁棒的目标检测器,在每个视频帧中使用检测框定位目标,并将指示同一目标实体的检测框链接到轨迹中,这将帮助机器在视频级别上理解目标实体的身份和动态,还可以使需要细粒度视频理解的许多应用程序受益(举例),还包括自动驾驶场景中对车身周围动态目标的有效检测,可提高驾驶安全性。

深兰科技DeepBlueAI团队面对诸多难点,包括检测器需要重新识别视频中消失重现的目标;画面剧烈抖动;视频分辨率较低,存在照明、模糊、物体外形发生变化;目标类别多及目标类别不均衡;很多非人工标注信息不准确等。经过分析,团队采用了目标检测+多目标跟踪的解决思路,通过检测器设计、深度度量学习模型设计与多目标跟踪算法实现构建了解决方案,最终战胜三星、厦门大学等团队斩获第一。

而获得第三的异常事件检测挑战赛/常规异常事件检测任务,更具现实意义,在城市管理、公共安全、交通控制和环境保护等方面起着关键作用。任务包含1000多个未修剪的真实视频,需要识别争吵,打架,抢劫,偷窃,爆炸,道路事故等近二十种异常事件。深兰科技的明星产品“熊猫智能公交车” 就有多个功能获益于这些获奖方案,除了领先的自动驾驶技术,车内还打造了“智能客舱”,其中的“异常行为识别系统”就包括了车厢内摔倒、偷盗等行为报警等功能。

近日,深兰科技的自动驾驶产品喜讯频传,熊猫智能公交车在上海临港新片区正式启动测试、在辽宁鞍山正式投入运行;AI智能扫路机在上海长宁正式启动无人驾驶模式的保洁作业;熊猫智能公交车和AI智能扫路机还分别获得,湖北国际物流机场颁发的“无人驾驶摆渡车组第一名”,以及“无人驾驶清扫组第一名”的奖状,有望在该机场运行并提供服务。而这些落地应用背后的保障正是在国际顶会竞赛上获奖的实力,以及对科研的敬畏。深兰科技将秉持人工智能服务民生的理念,稳步推进基础研究和落地应用,为百姓生活造福、为经济发展出力。
       fqj

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分