欧博手机版(www.aLLbetgame.us):CVPR 2021大奖宣布!何恺明获最佳论文提名,代码已开源!

欧博电脑版

欢迎进入欧博电脑版(www.aLLbetgame.us),欧博官网是欧博集团的官方网站。欧博官网开放Allbet注册、Allbe代理、Allbet电脑客户端、Allbet手机版下载等业务。

,

新智元报道

泉源:CVPR2021

编辑:小匀,LQ

【新智元导读】昨晚,CV界三大顶会之一的2021CVPR在clubhouse拉开了帷幕。今年, *** 收到了21000名作者的7000篇投稿,经由7400名审稿人和280名区域主席的审查,最终有1600篇论文被吸收,吸收率约0.24。 其中,何恺明团队论文获得了「最佳论文提名」。

CVPR 2021 来了!

推特上,有学者玩笑说,CV论文可以分为这几类:「只想混文凭」、「教电脑天生更多猫的照片」、「ImageNet上实验效果提升0.1%!」、「手握超酷数据集但并不设计公然」、「3年已往了,代码仍在赶来的路上」、「实验证实照样老baseline性能更牛」、「我们的数据集更大!」、「研究局限超广,无他,我们有钱」、「花钱多,效果好」......

仅为挖苦,请勿对号入座。

图源:Jia-Bin Huang的推特

不外,言归正传,让我们来看看今年被CVPR选中的都有哪些幸运论文。

2021 CVPR 论文奖

最佳论文奖(Best Paper)

今年的最佳论文是马克斯・普朗克智能系统研究所和蒂宾根大学团队的Michael Niemeyer, Andreas Geiger,他们的论文是

GIRAFFE: Representing Scenes as Compositional Generative Neural Feature Fields(GIRAFFE:将场景显示为组合天生的神经特征场)

https://arxiv.org/abs/2011.12100

论文简介:

深度天生模子可以在高分辨率下举行真切的图像合成。但对于许多应用来说,这还不够:内容创作还需要可控。虽然最近有几项事情研究了若何剖析数据中的潜在转变因素,但它们大多在二维中操作,忽略了我们的天下是三维的。此外,只有少数作品思量到了场景的组成性子。我们的要害假设是,将组合式三维场景示意纳入天生模子,可以使图像合成加倍可控。将场景示意为天生性神经特征场,使我们能够从靠山中星散出一个或多个物体,以及单个物体的形状和外观,同时无需任何分外的监视就能从非结构化和unposed的图像集中学习。将这种场景示意与神经渲染管道连系起来,可以发生一个快速而真实的图像合成模子。正如我们的实验所证实的那样,我们的模子能够剖析单个物体,并允许在场景中平移和旋转它们,还可以改变摄像机的姿势。

最佳论文声誉提名(Best Paper Honorable Mentions)

何恺明和Xinlei Chen的论文Exploring Simple Siamese Representation Learning(探索简朴的连体表征学习)获得了最佳论文提名。

https://arxiv.org/abs/2011.10566

论文主要研究了:

「连体网络」(Siamese networks)已经成为最近种种无监视视觉表征学习模子中的一种常见结构。这些模子最大限度地提高了一个图像的两个增量之间的相似性,但必须相符某些条件以阻止collapse的解决方案。在本文中,我们讲述了令人惊讶的履历效果,即简朴的连体网络纵然不使用以下任何一种情形也能学习有意义的表征。(i) 负样本对,(ii) 大batch,(iii) 动量编码器。我们的实验解释,对于损失和结构来说,collapse的解决方案确实存在,但stop-gradient操作在防止collapse方面施展了主要作用。我们提供了一个关于stop-gradient寄义的假设,并进一步展示了验证该假设的看法验证实验。我们的 「SimSiam 」方式在ImageNet和下游义务中取得了有竞争力的效果。我们希望这个简朴的基线能促使人们重新思索连体结构在无监视表征学习中的作用。

代码已开源 https://github.com/facebookresearch/simsiam

另一篇最佳论文提名是明尼苏达大学团队Yasamin Jafarian, Hyun Soo Park的

Learning High Fidelity Depths of Dressed Humans by Watching Social Media Dance Videos

https://arxiv.org/abs/2103.03319

最佳学生论文奖(Best Student Paper)

Task Programming: Learning Data Efficient Behavior Representations(义务编程:学习数据有用的行为表征)

作者团队来自加州理工和西北大学――Jennifer J. Sun, Ann Kennedy, Eric Zhan, David J. Anderson, Yisong Yue, Pietro Perona

https://openaccess.thecvf.com/content/CVPR2021/html/Sun_Task_Programming_Learning_Data_Efficient_Behavior_Representations_CVPR_2021_paper.html

论文简介:

专门的领域知识对于准确注释用于深度剖析训练集来说往往是需要的,但从领域专家那里获得这些知识可能会很穷苦,而且耗时。这个问题在自动行为剖析(automated behavior *** ysis)中异常突出,在自动行为剖析中,从视频跟踪数据中检测出署理的运动或感兴趣的行动。为了削减注释事情,我们提出了TREBA:一种基于多义务自监视学习的学习注释-样本高效轨迹嵌入(annotation-sample efficient trajectory embedding)的方式,用于行为剖析。我们的方式中的义务可以由领域专家通过我们称之为 「义务编程」(task programming)的历程举行有用设计,该历程使用程序对领域专家的结构化知识举行明确编码。通过用数据注释时间换取少量编程义务的构建,可以削减领域专家的总事情量。我们使用行为神经科学的数据来评估这种trade-off,在这些数据中,专门的领域知识被用来识别行为。我们在两个领域的三个数据集中展示了实验效果:小鼠和果蝇。与最先进的特征相比,使用TREBA的嵌入,我们将注释肩负削减了「10倍」,然而并不影响准确性。因此,我们的效果解释,义务编程和自我监视可以成为削减领域专家注释事情的有用途径。

最佳学生论文声誉提名(Best Student Paper Honorable Mentions)

获得「最佳学生论文」提名的有三篇

Less is More: ClipBERT for Video-and-Language Learning via Sparse Sampling(少即是多:通过希罕取样举行视频和语言学习的ClipBERT)

作者团队来自北卡罗来纳大学教堂山分校和Microsoft Dynamics 365 AI Research的Jie Lei, Linjie Li, Luowei Zhou, Zhe Gan, Tamara L. Berg, Mohit Bansal, Jingjing Liu

https://openaccess.thecvf.com/content/CVPR2021/html/Lei_Less_Is_More_ClipBERT_for_Video-and-Language_Learning_via_Sparse_Sampling_CVPR_2021_paper.html

欧博手机版

欢迎进入欧博手机版(www.aLLbetgame.us),欧博官网是欧博集团的官方网站。欧博官网开放Allbet注册、Allbe代理、Allbet电脑客户端、Allbet手机版下载等业务。

Binary TTC: A Temporal Geofence for Autonomous Navigation(二进制TTC:用于自主导航的时间地理围栏)

作者团队来自英伟达和加州大学圣巴巴拉分校的Abhishek Badki, Orazio Gallo, Jan Kautz, Pradeep Sen

https://openaccess.thecvf.com/content/CVPR2021/html/Badki_Binary_TTC_A_Temporal_Geofence_for_Autonomous_Navigation_CVPR_2021_paper.html

Real-Time High-Resolution Background Matting(实时高分辨率的靠山消隐)

作者团队来自华盛顿大学的Shanchuan Lin, Andrey Ryabtsev, Soumyadip Sengupta, Brian Curless, Steve Seitz, Ira Kemelmacher-Shlizerman

https://openaccess.thecvf.com/content/CVPR2021/papers/Lin_Real-Time_High-Resolution_Background_Matting_CVPR_2021_paper.pdf

最佳论文评选委员会

以上最佳(学生)论文及提名由以下委员会评选:Deva Ramanan (主席),Lourdes Agapito, Zeynep Akata, Karteek Alahari, Xilin Chen, Emily Denton, Piotr Dollar, Ivan Laptev, Kyoung Mu Lee

其中,中科院盘算所视觉信息处置与学习组的陈熙霖博士是委员会成员。

陈熙霖博士,研究员,ACM Fellow, IEEE Fellow, IAPR Fellow, 中国盘算机学会会士,国家卓越青年基金获得者。主要研究领域为盘算机视觉、模式识别、多媒体手艺以及多模式人机接口。先后主持多项自然科学基金重大、重点项目、973设计课题等项目的研究。

曾任IEEE Trans. on Image Processing和IEEE Trans. on Multimedia的Associate Editor,现在是Journal of Visual Communication and Image Representation的Associate Editor、盘算机学报副主编、人工智能与模式识别副主编,担任过FG2013 / FG 2018 General Chair以及CVPR 2017 / 2019 / 2020, ICCV 2019等的Area Chair。

陈熙霖博士先后获得国家自然科学二等奖1项,国家科技提高二等奖4项,省部级科技提高奖九项。互助出书专著1本,在海内外主要刊物和 *** 上揭晓论文200多篇。

PAMITC 奖(PAMITC AWARDS)

除了最佳(学生)论文奖外,另有以下几项大奖:

朗格-希金斯奖(Longuet-Higgins Prize)

该奖项以理论化学家和认知科学家H. Christopher Longuet-Higgins的名字命名,表彰十年前对盘算机视觉研究发生重大影响的CVPR 论文。

本届委员会成员:W. Freeman (主席), J. Barron, D. Damen, D. Hoiem, K. Saenko

获奖论文:

1 Real-time human pose recognition in parts from single depth image(从单一深度图像中实时识别人体姿势的部位)

作者来自微软:Jamie Shotton, Andrew Fitzgibbon, Mat Cook, Toby Sharp, Mark Finocchio, Richard Moore, Alex Kipman, Andrew Blake

2 Baby talk: Understanding and generating simple image descriptions(婴儿谈话:明白和天生简朴的图像形貌)

作者来自石溪大学:Girish Kulkarni, Visruth Premraj, Sagnik Dhar, Siming Li, Yejin Choi, Alexander C. Berg, Tamara L. Berg

青年研究者奖(Young Researcher Awards)

该年度奖项旨在表彰对盘算机视觉做出卓越研究孝顺的年轻研究职员。

本届委员会:R. Zabih (主席), S. Lazebnik, G. Medioni, N. Paragios, S. Seitz

获奖者:

1Georgia Gkioxari,Facebook AI Research (FAIR)

2Phillip Isola, MIT

首届黄煦涛纪念奖(Inaugural Thomas Huang Memorial Prize)

值得注重的是,本届黄煦涛纪念奖为首届,以华裔信息学家命名。这个新的年度奖项将表彰在研究、教育和为盘算机视觉界服务方面被以为是楷模的研究职员。

获奖者:Antonio Torralba, MIT

委员会:T. Tuytelaars (团结主席), R. Zabih (团结主席), M. Black, R. Chellappa, A. Fitzgibbon, D. Fleet, E. Grimson, R. Hartley, K.M. Lee, C. Schmid, H. Shi

CVPR2021日程

今年的 *** 从19-25日, *** 内容如下:

其中,陈天奇也将会做客panel session分享未来的盘算机视觉的机械学习基础设施。

参考资料:

添加回复:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。