他在同济学汽车,今年拿下CVPR最佳学生论文奖

[好文分享:www.ii77.com]

梦晨 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI [本文来自:www.ii77.com]

从汽车动力学“转行”智能视觉感知,3年斩获2篇CVPR论文。

其中一篇,还是今年CVPR论文的最佳学生论文奖。

奖项颁了二十多届,今年第一次颁给来自中国高校的学生一作,打败了哈佛大学博士生&谷歌的另一篇论文研究。

这是同济大学在读二年级硕士、阿里达摩院实习生陈涵晟的真实经历。

转方向前,他对汽车动力学同样兴趣十足,曾经加入过赛车队,主导空气动力学开发,最终团队在大学生国际赛事上获了奖;

读研第一年,论文就入选了CVPR,但却因为理论不够充分,转而继续深入研究,才有了今年这篇最佳学生论文奖。

在与陈涵晟同学的交流中,我们了解了更多关于他的故事。

本科第五年才转型自动驾驶

陈涵晟就读的同济汽车学院,本科是五年制。

一入学他就参加了同济翼驰车队。这是一个上百人组成的学生社团,在学校、学院和赞助商支持下,每年都会设计、制造赛车并参加国内和国际比赛。

在车队里陈涵晟负责的是空气动力学开发,主要涉及仿真计算、曲面建模等技术。

他渐渐成为车队的骨干,还助力团队在2018年的..大学生方程式赛车上拿了最佳空气动力学奖。

其实汽车和计算机都是陈涵晟从小开始就有的爱好,他表示自己也搞不清楚更喜欢哪个,另外数学也是他一直感兴趣的学科。

高考后他也曾考虑过计算机专业,不过最终还是选择了汽车。

到毕业那年,他看到一个把这些爱好更紧密结合起来的新道路。

智能汽车、自动驾驶的大潮来了。

当时,同济刚成立不久的智能汽车研究所也在招生,他的毕业设计就选择了自动驾驶方向。

有机遇,就想尝试一下新东西。

陈涵晟加入了熊璐教授的课题组开始学习新知识,熊璐老师也将成为他后来在研究生阶段的导师。

熊璐现任同济大学新能源汽车工程中心副主任,长期从事汽车底盘控制、分布式驱动电动汽车动力学控制相关科研工作,

在研究生阶段陈涵晟还有一位副指导老师,同济大学汽车学院助理教授田炜,他主要研究智能驾驶的环境目标感知技术和轨迹预测技术。

转方向、学习交叉学科压力会很大吗?陈涵晟认为对他来讲并不会很累,反而两个领域的碰撞总能让他产生更多灵感。

毕业那年是这些年来最舒服最轻松的那年,完全的去学习新知识,有很大的收获感。

不满足炼丹要搞懂理论,一连斩获2篇CVPR

到了研一,田炜老师给他布置的课题方向是在传统模型中中加入概率和不确定性。

陈涵晟将之与自己感兴趣的3D物体位姿问题结合起来,发表了他的第一篇CVPR。

虽然中了顶会,不过陈涵晟还是觉得差了些什么。

这篇文章是根据经验设计的,虽然模型效果好但我不明白他为什么效果好,也无法用数学理论去证明这个方法就是最优的。

这次获奖的第二篇论文与之前相比最大的突破点,陈涵晟认为在于“从理论出发去解决问题”。

我们把各种方法都统一起来,套在一个大框架里面。

然后又从这个框架里找到了一个更通用、效果更好的方法,第二篇论文就诞生了。

陈涵晟的这两篇CVPR论文,具体来说研究的都是通过单张2D图像估计3D物体位姿的问题。

对于人类来说,通过一张2D照片,判断里面各物体大致的位置很简单。

但对于计算机来说,这是个颇为复杂的问题,像下面这些车在它看来,并没有远/近的距离感:

因此,如何让计算机学会通过2D照片估计3D物体的位置和朝向,就变成了一个需要解决的问题,像自动驾驶(用摄像头估计车辆位置)、AR(判断虚拟物体距离)等领域都要用到:

然而,现有的两类解决方法几何推理深度学习,都有一定缺陷。

几何推理,最常见的就是PnP(Perspective-n-Point)算法,具体指通过已知的n个3D空间点(c1、c2、c3、c4)的坐标、对应2D平面上点的坐标,结合相机内参来反推相机的位姿。

本质上来说,就是找到3D空间点的坐标系w以及相机坐标系c的对应关系,来推导出相机和这些3D点的空间距离:

PnP图示,来源OpenCV文档

这个方法非常简洁,原理也好理解,然而必须得有一大堆参数(3D、2D坐标和对应的相机内参)才能计算出结果。现实是往往只能用一张2D照片做估计,没有对应的3D坐标。

深度学习方法倒是不需要这么多参数,直接用AI搞预测就行。

但这样问题又来了,不仅模型可解释性差,预测结果不一定准确,而且数据集样本量少的时候,还非常容易过拟合。

他的第一篇论文,便是在PnP算法中引入了不确定性,在此基础上提出MonoRUn检测算法。

相比用自监督方法直接学习位姿,这篇论文先用自监督方法学习2D和3D坐标之间的关系,再用PnP算法求解。

论文估计了坐标预测结果的不确定性,并用不确定性PnP算法,让模型学会关注不确定性较低的前景点(检测对象的点)

MonoRUn做出来后,效果很好,不需要提前知道物体的几何形状,就能预测3D位姿,直接登上CVPR 2021。

但这却让陈涵晟有点懵:为啥用不确定性PnP算法,效果就这么好?

这一方向上继续深入研究之后,他最终发现了“盲点”:PnP算法本质上在某些点是不可导的。

也就是说,上一篇论文把不确定性引入PnP算法,虽然效果很好,但本质上将PnP视为确定性这一操作并不可导。

这会导致PnP算法求解得到模糊的位姿解,从而导致反向传播(收敛过程)不稳定。

一番思索后,陈涵晟突然意识到,为什么不将这种确定性问题转化成概率密度的问题呢?

也就是说,将PnP的输出视为位姿的概率密度函数,这样问题就从不可导变成了可导,这便是End-to-end Probabilistic Perspective-n-Points(EPro-PnP)算法的由来。

这次的模型做出来后,灵活性和可解释性都得到了很大的提升,收敛也稳定多了,最终在CVPR 2022中获得最佳学生论文奖。

据陈涵晟介绍,第二篇论文是他在阿里达摩院做研究型实习生期间完成的。

达摩院的研究氛围很好,与他同期的一组实习生虽然做的都是不同方向,但经常和带他们的几位老师在一起讨论问题。

论文里面虽然没有挂上那么多人的名字,但很多细节都是在平时的讨论中获得灵感,再完善出来。

相比之下,今年疫情封校期间他一直待在宿舍,“缺少了和人的交流,研究灵感反而少了很多”。

陈涵晟还提到了实习期间“算力充足”的快乐——

搞这项研究期间,达摩院的导师王丕超还特意帮他多申请了一台服务器,才能顺利完成整个模型的研究训练。

还以为比较冷门,没想到能够获奖

这次成果能获奖,陈涵晟和导师、达摩院的几位合作者都没有预料到。

我原来以为这篇论文可能比较冷门,因为太偏数学,没想到能够获奖。

整个作者团队没有人在美国新奥尔良的CVPR现场,领奖还是远程接入的。

不过从这届CVPR整体风格来看,确实更倾向于基础理论而不是更热门的模型结构调整方向。

像最佳论文奖,也是颁给了一项用神经网络解决传统几何问题的研究。

就陈涵晟观察,CVPR的评委可能更多的是在鼓励理论上具有突破传统范式的贡献。

对于获奖时有什么想法,陈涵晟回答的很实在:

最大的感触就是以后的路更好走了。

如今面临研究生毕业,陈涵晟对未来的打算很明确,想继续做科研。

不过以后不一定是做自动驾驶领域的科研,可能还会尝试新东西,主要还是按自己的兴趣去做。

在交流中,我们观察到兴趣是陈涵晟做事最大的驱动力,一旦开始做事他就会非常投入。

有达摩院的同事爆料他推导公式时不时会拍自己大腿,甚至吓到周围的人。

陈涵晟觉得可能是因为自己太专注了,成功或者出错都会情不自禁表达一下激动或沮丧的心情。

除了专注,他还擅长把不同兴趣结合起来。

他在本科时参加了合唱团,那时他也会利用编程创作音乐作品、或者用计算机模拟管风琴。

标签:同济 他在

热门文章

  1. 银宝山新年报遭问询,被要求说明主业持续盈利能力是否存重大不确定性,并充分提示有关风险2024-05-20
  2. 嘉元科技短线跳水,现跌超11%2024-05-20
  3. A股午评:沪指涨0.38%,黄金、煤炭等概念大涨,家电、家用轻工等板块走弱2024-05-20
  4. 午间涨跌停股分析:49只涨停股,25只跌停股,南京化纤(风电)7连板,亚振家居(家具)5连板2024-05-20
  5. 天原股份:公司磷酸铁锂产品送检时间未远超行业平均周期2024-05-20
  6. 5月20日截至11时30分,亚太主要股指普涨2024-05-20
  7. 港股午评:指数震荡走高,恒生科技指数涨0.61%,黄金、汽车等板块活跃2024-05-20
  8. 晶科能源:与江苏新霖飞签订1GWh大型储能系统订单2024-05-20
  9. 康复医学的目的是(康复医学的目的是)2024-05-20
  10. 十二星座排名第一(十二星座排名第一的星座是谁)2024-05-20
  11. 【乡镇动态】加定镇 |依托“党建红” 打好“绿色牌”2024-05-20
  12. 电脑验光仪(电脑验光仪图片)2024-05-20
  13. 有色金属板块持续走高,北方铜业触及涨停2024-05-20
  14. 家居家具板块早盘走弱,中源家居、我乐家居跌超6%2024-05-20
  15. 盘中连板池:南京化纤(风电)7连板2024-05-20
  16. 黄金股持续走强,晓程科技20CM涨停2024-05-20
  17. 山河智能年报遭问询,被追问报告期存货跌价准备计提是否充分、合理,是否存在滞销风险2024-05-20
  18. 5月20日截至10时36分,沪深京三市成交额突破5000亿元2024-05-20
  19. 煤炭股集体走强,山西焦煤涨逾5%2024-05-20
  20. 港股有色金属板块大涨,中国白银集团大涨超54%2024-05-20
自媒体 微信号:ii77 扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. 1 《2022年全球科技社团发展指数报告》发布 IEEE再次荣登世界一流科技社团排行首位

    点击蓝字 关注我们SUBSCRIBE to US文章引自:中国科学学与科技政策研究会2022年6月25日,第五届世界科技社团发展与治理论坛在湖南省长沙市举办。论坛以“共同发展 共创未来”为主题,

  2. 2 大神解答,关于升级 Windows 11的那些事儿!

    你已选中了添加链接的内容(本文阅读时间:4分钟)小编语:越来越多的用户粉丝们完成了 Windows 11的系统升级,我们也收到了许多粉丝在升级中遇到的问题。今天我们邀请到了Windows

  3. 3 甲骨文耗时6个月修补Fusion Middleware的重大漏洞

    安全研究人员揭露甲骨文在今年1月及4月,所分别修补2项影响Fusion Middleware的重大漏洞细节,并指后者花了6个月才修复。 VNG公司的PeterJson和VNPT的Nguyen Jang

  4. 4 孤勇者蚂蚁链

    作者|钟文不知道什么时候开始,区块链变成了一系列庞大数字的集合体。动辄数万亿美元的资产,数以十亿计的节点和数亿的用户,让这个诞生十余年的新型技术,俨然成为了全球I

  5. 5 威斯坦3D打印“造车”了

    工业革命4.0背景下,越来越多汽车制造企业意识到研发速度与成本控制的重要性,纷纷开始走上3D打印快速成型探索之路。其中,宝马、保时捷、奔驰、福特、本田、丰田以及特斯拉等汽

  6. 6 缺芯潮正退,为什么大家还在投半导体

    房产企业都在做半导体,是个好现象。全文5287字,阅读约需11分钟文|陈俊一编辑 | 常亮题图|Pixabay2022年第二季度即将结束,众多企业都在盘点第二季度乃至上半年的业绩表现。对于手

  7. 7 东方晶源俞宗强:迎接时代挑战 抓住产业机遇

    迎接时代挑战 抓住产业机遇——第十届半导体设备年会会前访谈东方晶源微电子科技(北京)有限公司成立于2014年,总部位于北京经济技术开发区,是一家专注于集成电路领域良率管理

  8. 8 继欧洲后再度进军日韩,Pico消费级VR全球化加速

    Esther | 编辑随着纳入字节,Pico的全球化进程动作相当迅速。4月份我们报道了Pico消费级VR(海外发售为Pico Neo 3 Link,国内为Pico Neo 3 Pro)出海,首先进军欧

  9. 9 华为吴辉:未来5年,商业市场营收要占中国政企业务50%

    在近日华为伙伴暨开发者大会2022期间,商业市场被重点提及。华为轮值董事长胡厚崑在演讲中谈到,面向中小企业,要全面支持伙伴,共同发展商业市场。我们知道,华为是一家ICT产品

  10. 10 广电5G如何活下去?一个字:熬

    关于广电5G如何赢得用户,总结下来不外乎两点:一是低价,二是借助广电体系内容平台的优势吸引用户。广电5G宣布放号以来,广大用户还是很关注的。这不,6月17日早上中国广电一宣

本文内容来自网友供稿,如有信息侵犯了您的权益,请联系反馈核实

Copyright 2024.爱妻自媒体,让大家了解更多图文资讯!