学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲

学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲

[原创文章:www.ii77.com]

来源:机器之心

[原创文章:www.ii77.com]

摘要:人工智能顶会 IJCAI 2018 的主要议程于昨日在瑞典首都斯德哥尔摩开始。昨天上午,Facebook 首席人工智能科学家、纽约大学教授 Yann LeCun 在会上发表了近一个小时,以《Learning World Models: the Next Step towards AI》为主题的演讲,引起了人们的广泛关注。本文将对 LeCun 的演讲进行简要介绍。


完整演讲视频:




Yann LeCun 开场介绍说,当前几乎所有的机器学习从业者在实践中使用的都是监督式学习:向机器展示大量的样本,然后告诉机器正确的答案与内部参数,然后就能做图像识别之类的任务。而过去几年,监督式学习有了极大的成功,应用也非常广泛。下图对比了传统机器学习与深度学习各自的特点。


学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲


深度学习的演讲回溯到 20 世纪 50 年代,当时 AI 社区尝试构建神经网络。建立这样略为复杂的系统,你需要两个基础的运算:线性的加权和与非线性的激活函数。这里,Yann LeCun 回顾了他们在 80 年代末期提出的用来识别数字的卷积神经网络 LeNet5,从最初的识别单个目标发展到了识别多个目标。


学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲


很快,他们就建立了一个识别手写文件的系统。在 1995 年,他们在 AT&T 完成了一个商业系统来读取支票账号。经历了如下图展示的过程。Yann LeCun 介绍了,这是上一波人工智能浪潮下的极大成功示例。之后,人们就对神经网络的研究失去了兴趣。一方面是准确率的原因,还因为很多领域当时没有足够多的数据来训练学习系统。


接着,Yann LeCun 介绍说,实际上在 1996-2001 年这段时间内,他并没有研究机器学习,而是在研究其它东西,尤其是图像压缩。


学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲


下图是在 21 世纪初加入 NYU 之后用模仿学习做的研究。这个研究激发了 DARPA 的 LAGR 项目。


学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲


Yann LeCun 随后回顾了卷积神经网络在不同任务中的应用,包括用于自动驾驶汽车的目标检测与语义分割等。这些基于视觉的任务绝大部分都需要卷积神经网络的支持,当然也离不开并行计算设备的支持。


学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲


第一个得到广泛关注与应用的卷积神经网络是 2012 年提出来的 AlexNet,它相比于 LeNet-5 最大的特点是使用更深的卷积网络和 GPU 进行并行运算。AlexNet 还应用了非常多的方法来提升模型性能,包括第一次使用 ReLU 非线性激活函数、第一次使用 Dropout 以及大量数据增强而实现网络的正则化。除此之外,AlexNet 还使用了带动量的随机梯度下降、L2 权重衰减以及 CNN 的集成方法,这些方法现在都成为了卷积网络不可或缺的模块。


学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲


随后在 ImageNet 挑战赛中,卷积网络的深度与性能都逐年提升。从 12 年到 16 年,参赛者使用的卷积神经网络不断加深,错误率也逐年下降。


如下所示,牛津大学 2014 年提出了另一种深度卷积网络 VGG-Net,与 AlexNet 相比,它的卷积核更小,层级更深。谷歌同年提出了 GoogLeNet(或 Inception-v1),该网络共有 22 层,且包含了非常高效的 Inception 模块。后来到了 15 年,何恺明等人提出的深度残差网络骤然将网络深度由十几二十层提升到 152 层,且性能大幅提高。


此外,去年提出的 DenseNet 进一步解决了 ResNet 遗留下的梯度问题,并获得了 CVPR 2017 的最佳论文。DenseNet 的目标是提升网络层级间信息流与梯度流的效率,并提高参数效率。它也如同 ResNet 那样连接前层特征图与后层特征图,但 DenseNet 并不会像 ResNet 那样对两个特征图求和,而是直接将特征图按深度相互拼接在一起。


学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲


那么为什么卷积神经网络在计算机视觉任务上如此高效?Yann LeCun 随后就对深度卷积网络的表征方式做了介绍。他表明对于图像数据来说,数据的信息与结构在语义层面上都是组合性的,整体图像的语义是由局部抽象特征组合而成。因此深度网络这种层级表征结构能依次从简单特征组合成复杂的抽象特征,如下我们可以用线段等简单特征组合成简单形状,再进一步组合成图像各部位的特征。


学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲


卷积神经网络在目标识别、目标检测、语义分割和图像描述等领域都有非常多的应用,而这些实现很多都依赖于深度学习框架。LeCun 随后重点介绍了 PyTorch 与 Detectron,其中 PyTorch 因为采用了动态计算图而受到了广泛的关注,它也是当前发展最快的框架之一。


如下所示,Facebook AI 研究院开源的 Detectron 基本上是业内最佳水平的目标检测..。据 LeCun 介绍,该项目自 2016 年 7 月启动,构建于 Caffe2 之上,目前支持目标检测与语义分割算法,其中包括 Mask R-CNN(何恺明的研究,ICCV 2017 最佳论文)和 Focal Loss for Dense Object Detection(ICCV 2017 最佳学生论文)等优秀的模型。


学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲


最后,作为对卷积神经网络的总结,LeCun 带我们回顾了卷积神经网络的应用,包括医疗影像分析、自动驾驶、机器翻译、文本理解、视频游戏和其它学科研究。


学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲


Yann LeCun 谈到当前深度学习缺乏推理能力,因此未来的一个重点发展方向就是深度学习和推理的结合。


学习世界模型,通向AI的下一步:Yann LeCun在IJCAI 2018上的演讲


人们已经在多个方向上进行尝试。例如,在网络中增加记忆增强模块,典型的工作在下图中列出,这是实现推理的第一步。在对话模型中,由于对话的轮换和非连续的特点,通过增强记忆,有助于预测能力的提高,进而能实现长期而有效的对话。

热门文章

  1. 林冲棒打洪教头(林冲棒打洪教头中洪教头的性格特点)2024-04-29
  2. 虽千万人吾往矣(虽千万人吾往矣九死而不悔什么意思)2024-04-29
  3. 上海到厦门火车路线图(上海到厦门火车路线图高清)2024-04-29
  4. ppt超链接字体颜色怎么改(ppt更改超链接字体颜色)2024-04-29
  5. 淘宝天下小二老发信息(被淘宝天下小二骗的有多少)2024-04-29
  6. 福地(福地是什么意思)2024-04-29
  7. 项目落地见效(项目落地方案)2024-04-29
  8. 女主叫顾倾城的小说(女主叫顾倾城的小说古代)2024-04-29
  9. 你知道吗?这六个部位,越搓,离长寿越近~2024-04-29
  10. 欲音露子角色出处(欲音露子角色出处)2024-04-29
  11. 睡不着觉的解决方法(高中生晚上睡不着觉的解决方法)2024-04-29
  12. 厨房餐具大全(厨房设备厨具清单)2024-04-29
  13. 今天凌晨三点,长沙县路口镇的这一幕让人倍感暖心……2024-04-29
  14. 淘宝外包客服的费用是多少(淘宝外包客服怎么收费)2024-04-29
  15. 凉风有信秋月无边(凉风有信秋月无边的意思)2024-04-29
  16. 中国战机在日本被击落(日军战机来犯,这回见识到了中国飞机的厉害!)2024-04-29
  17. 最近我的妹妹有点怪漫画全集(最近我的妹妹有点怪漫画全集)2024-04-28
  18. 曝光!“以色列已决定打击”2024-04-28
  19. 牙齿根管治疗后一定要做牙套(牙齿根管治疗后一定要做牙套费用)2024-04-28
  20. 银行账户管理费计入什么科目(银行账户管理费属于什么费用)2024-04-28
自媒体 微信号:ii77 扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. 1 板卡评测 | LoRaWan开发套件Node开发浅尝——纸上得来终觉浅,绝知此事要躬行

    在之前的文章我们测试了学蠡科技的LoraWan工业级评估开发套件的硬件部分,这次我们要尝试LoraWan节点模块的软件开发。在开始软件部分之前先解决上一篇结尾中遗留的一个问题。 在

  2. 2 【今日头条】拒绝捧杀,认清自我,中国关键材料:32%一片空白,52%靠进口

    据报道,中国工业和信息化部副部长、国家制造强国建设领导小组办公室主任辛国斌13日在“2018国家制造强国建设专家论坛”上表示,一段时期以来,国内外评价中国制造业发展成就

  3. 3 Leap Motion最新概念视频:展示VR/AR融合空间

    Esther| 撰文 AR与VR技术需要的沉浸式计算在不断变化,只精通AR或VR一项技术现在看来还是不够的。 近日,Leap Motion公开展示了两段视频,展望了在不久的未来实现出AR与VR的无缝结合的

  4. 4 专访微软总裁:依赖广告盈利会给数据保护带来挑战

    微软公司总裁施博德表示,当下已是AI的“引爆点”,要关注AI对人类工作的影响;2018年的世界比七八年前更为复杂,新地缘政治是科技界挑战 记者/叶展旗 “如果一家公司几乎所有收

  5. 5 中国联通成电信大数据项目唯一采购来源 他俩啥时候好上了?

    7月11日,中国电信云公司发布了2018年联通大数据风险防控类产品采购项目单一来源公告。意想不到的是,中国联通却成为此次的唯一供货方,中国联通旗下的联通大数据提供项目所需

  6. 6 存储芯片为什么这么重要?大国崛起还得靠它

    存储芯片作为半导体元器件中不可或缺的组成部分,有着非常广泛的应用,在内存、消费电子、智能终端等领域均有运用。随着大数据、云计算、物联网等发展,其在整个产业链中扮

  7. 7 多种云服务模式下Kubernetes的最佳实践

    “ 本文讨论在多种云服务的模式下,成功部署和运行 Kubernetes 群集的关键操作难点与最佳实践。 ‍ 根据 2018 年云计算状况报告显示:如今 81% 的企业都使用了多种云服务的模式,他们

  8. 8 光谱扫描激光雷达为大规模部署自动驾驶铺路

    据外媒报道,Baraja公司近日公开发布了其光谱扫描激光雷达(Spectrum-Scan LiDAR)。光谱扫描采用类似棱镜的光学系统以及不同波长的光线,为自动驾驶车辆创造了“超强的眼睛”,为其

  9. 9 为什么定制SoC芯片越来越容易?

    近日,在一年一度的Arm TechCon大会上,Arm市场营销资深副总裁Ian Smythe宣布,截止2017年12月,基于Cortex-M3和Cortex-M0的SoC出货量达280亿。 System on Chip,简称Soc,也即片上系统。业内普遍将

  10. 10 安防大数据不只“数据大” 还有广阔应用市场

    日前,2018浙江省大数据产业峰会暨浙江省大数据科技协会一届二次会员大会上,工信部信息化和软件服务业司软件产业处处长傅永宝在致辞中表示“ 大数据是信息化发展新阶段的重要

本文内容来自网友供稿,如有信息侵犯了您的权益,请联系反馈核实

Copyright 2024.爱妻自媒体,让大家了解更多图文资讯!