Hinton组力作:ImageNet无监督学习最佳性能一次提升7%,媲美监督学习

机械之心报道

[原创文章:www.ii77.com]


[原文来自:www.ii77.com]

机械之心编纂部
现在,在 ImageNet 上的图像识别正确率的机能提拔每次平日只有零点几个百分点,而来自图灵奖获得者 Geoffrey Hinton 等谷歌研究者的最新研究一次就把无监视进修的指标提拔了 7-10%,甚至能够媲美有监视进修的结果。


现在,在 ImageNet 上的图像识别正确率的机能提拔每次平日只有零点几个百分点,而来自图灵奖获得者 Geoffrey Hinton 等谷歌研究者的最新研究一次就把无监视进修的指标提拔了 7-10%,甚至能够媲美有监视进修的结果

细心的同窗或者会注重到,许久不在社交收集上显现的深度进修前驱 Geoffrey Hinton 比来倏忽有了新动向。他向导的研究小组推出的 SimCLR 无监视方式瞬间吸引了人们的普遍存眷:


SimCLR 是一种简洁而清楚的方式,无需类标签即可让 AI 学会视觉透露,并且能够达到有监视进修的正确度。论文作者透露,经由 ImageNet 上 1% 图片标签的微调,SimCLR 即可达到 85.8%的 Top-5 精度——在只用 AlexNet 1% 的标签的情形下机能超越后者。


论文链接:https://arxiv.org/pdf/2002.05709.pdf

在这一工作中,研究者们构建了一种用于视觉透露的对比进修简洁框架 SimCLR,它不光优于此前的所有工作,也优于最新的对比自监视进修算法,并且构造加倍简洁:既不需要专门的架构,也不需要特别的存储库。

图 1. SimCLR 与此前各类自监视方式在 ImageNet 上的 Top-1 正确率对比(以 ImageNet 进行预练习),以及 ResNet-50 的有监视进修结果(灰色×)。

在这篇论文中,研究者发现:

  1. 多个数据增加方式组合对于对比展望义务发生有效透露非常主要。此外,与有监视进修比拟,数据增加对于无监视进修加倍有效;

  2. 在透露和对比损失之间引入一个可进修的非线性变换能够大幅提高模型学到的透露的质量;

  3. 与监视进修比拟,对比进修得益于更大的批量和更多的练习步伐。


基于这些发现,他们在 ImageNet ILSVRC-2012 数据集上实现了一种新的半监视、自监视进修 SOTA 方式——SimCLR。在线性评估方面,SimCLR 实现了 76.5% 的 top-1 正确率,比之前的 SOTA 提拔了 7%。在仅使用 1% 的 ImageNet 标签进行微调时,SimCLR 实现了 85.8% 的 top-5 正确率,比之前的 SOTA 方式提拔了 10%。在 12 个其他天然图像分类数据集长进行微调时,SimCLR 在 10 个数据集上示意出了与强监视进修基线相当或更好的机能。


无监视进修的快速成长让科学家们看到了新的进展,DeepMind 科学家 Oriol Vinyals 透露:感激对比损失函数,无监视进修正在切近监视进修!

简化方式,但结果更好

受到比来对比进修算法(contrastive learning algorithm)的开导,SimCLR 经由隐空间中的对比损失来最大化统一数据示例的分歧增加视图之间的一致性,从而进修透露形式。具体说来,这一框架包含四个首要部门:

  • 随机数据增加模块,可随机转换任何给定的数据示例,从而发生统一示例的两个相关视图,离别透露为 x˜i 和 x˜j,我们将其视为正对;

  • 一个根基的神经收集编码器 f(·),从增加数据中提取透露向量;

  • 一个小的神经收集投射头(projection head)g(·),将透露映射到对比损失的空间;

  • 为对比展望义务界说的对比损失函数。



在社交收集上,该论文的作者之一,谷歌资深研究科学家 Mohammad Norouzi 对这一进修算法进行了最简洁化的总结:

  • 随机抽取一个小批量

  • 给每个例子绘制两个自力的增加函数

  • 使用两种增加机制,为每个示例生成两个互相关系的视图

  • 让相关视图互相吸引,同时排斥其他示例



SimCLR 的首要进修算法如下:


用更大的批巨细进行练习

作者将练习批巨细 N 分为 256 到 8192 不等。批巨细为 8192 的情形下,增加视图中每个正对(positive pair)都有 16382 个反例。当使用尺度的 SGD/动量和线性进修率扩展时,多量量的练习或者不不乱。为了使得练习加倍不乱,研究者在所有的批巨细中都采用了 LARS 优化器。他们使用 Cloud TPU 来练习模型,凭据批巨细的分歧,使用的焦点数从 32 到 128 不等。

数据增加

固然数据增加已经普遍应用于监视和无监视透露进修,但它还没有被看做一种界说对比进修义务的系统性方式。很多现有的方式经由改变架构来界说对比展望义务。

本文的研究者证实,经由对方针图像执行简洁的随机裁剪(调整巨细),能够避免之前的复杂把持,从而建立包含上述两项义务的一系列展望义务,如图 3 所示。这种简洁的设计选择轻易得将展望义务与其他组件(如神经收集架构)解耦。


多种数据增加把持的组合是进修精巧透露的要害。图 4 显露了作者在这项工作中商量的数据增加。


为了进一步展示颜色增加的主要性,研究者调整了颜色增加的强度,究竟如下表 1 所示。


编码器和投射头架构

如图 7 所示,增加深度和宽度都能够提拔机能。监视进修也同样适用这一纪律。但我们发现,跟着模型规模的增大,监视模型和在无监视模型上练习的线性分类器之间的差距会缩小。这表明,与监视模型比拟,无监视进修能从更大规模的模型中获得更多收益。


非线性的投射头能够改善之前的层的透露质量,图 8 展示了使用三种分歧投射头架构的线性评估究竟。


损失函数和批巨细

可调节温度的归一化交叉熵损失比其他方式更佳。研究者对比了 NT-Xent 损失和其他常用的对比损失函数,好比 logistic 损失、margin 损失。表 2 展示了方针函数和损失函数输入的梯度。


对比进修(Contrastive learning)能从更大的批巨细和更长时间的练习中受益更多。图 9 展示了在模型在分歧 Epoch 下练习时,分歧批巨细所发生的影响。


与当前最佳模型的对比

线性估量

表 6 显露了 SimCLR 与之前方式在线性估量方面的对比。此外,上文中的表 1 展示了分歧方式之间更多的数值对照。从表中能够看出,用 SimCLR 方式使用 ResNet-50 (4×) 架构可以获得与监视预练习 ResNet-50 相媲美的究竟。


半监视进修

下表 7 显露了 SimCLR 与之前方式在半监视进修方面的对比。从表中能够看出,无论是使用 1% 照样 10% 的标签,本文提出的方式都显著优于之前的 SOTA 模型。


迁徙进修

研究者在 12 个天然图像数据集上评估了模型的迁徙进修机能。下表 8 显露了使用 ResNet-50 的究竟,与监视进修模型 ResNet-50 比拟,SimCLR 显露了精巧的迁徙机能——两者成就互有胜负。


华人一作

该论文的第一作者 Ting Chen 现就职于谷歌大脑,他 2013 年本科卒业于北京邮电大学,从 2013 年到 2019 年在美国东北大学和加州大学洛杉矶分校攻读较量机科学博士学位。2019 年 5 月,他正式入职谷歌大脑,成为研究科学家。此前他在谷歌有过两年的实习履历。


Ting Chen 的研究乐趣包罗自监视透露进修,用于离散构造的高效深度神经收集以及生成模型。


参考链接:http://web.cs.ucla.edu/~tingchen/



文为机械之心报道,转载请关联本公家号获得授权
✄------------------------------------------------
到场机械之心(全职记者 / 实习生):hr@jiqizhixin.com
投稿或追求报道:content@jiqizhixin.com
告白 & 商务合作:bd@jiqizhixin.com

热门文章

  1. 基金怎么买(基金怎么买入和卖出)2024-05-14
  2. 宏华数科:第二大股东新湖智脑拟减持不超1.9%公司股份2024-05-14
  3. 阿里巴巴:账上未来可用于股票回购的金额近300亿美元2024-05-14
  4. 道氏技术:公司在固态电池领域有较好布局,碳纳米管导电剂等已送样下游厂商2024-05-14
  5. 华伍股份:子公司长沙天映经营业绩持续亏损,公司拟转让其部分或全部股权2024-05-14
  6. 金富科技:终止向不特定对象发行可转债事项2024-05-14
  7. 上海机电收问询函:要求说明收购上海集优100%股权的必要性及合理性2024-05-14
  8. 美股开盘:基本平开,WSB热门概念股大涨,阿里巴巴跌近6%2024-05-14
  9. 游戏驿站、AMC院线双双停牌2024-05-14
  10. 东华科技与南非尼安扎公司签订磷酸铁锂基础工程设计综合服务及EPC框架合同2024-05-14
  11. 木工雕刻机哪个牌子好(木工雕刻机哪个牌子好一点)2024-05-14
  12. 名胜古迹的英文(参观名胜古迹的英文)2024-05-14
  13. 保利发展今日大宗交易成交375.91万股,成交额3601.22万元2024-05-14
  14. 贵州茅台今日大宗交易成交36.99万股,成交额6.29亿元2024-05-14
  15. 上海机场:浦东国际机场4月旅客吞吐量607.39万人次,同比增长72.7%2024-05-14
  16. 羚锐制药今日大宗交易折价成交1086.75万股,成交额2.67亿元2024-05-14
  17. 星湖科技:第二大股东伊品集团及一致行动人拟合计减持不超1%公司股份2024-05-14
  18. 3连板明星电力:公司主营业务、生产经营情况等没有发生重大变化2024-05-14
  19. 双塔食品:拟投资额约3亿元设立泰国公司、购买土地、工厂建设及设备采购等2024-05-14
  20. 威孚高科:拟出资2.15亿元设立智能感知业务合资公司,推进公司雷达产品技术研发和市场应用2024-05-14
自媒体 微信号:ii77 扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. 1 Markforged将纯铜引入METAL X 3D打印机

    美国的复合材料和金属3D打印机供应商Markforged已发布了与Metal X 3D打印机一路使用的纯铜材料选项。 经由在已经与多种金属材料兼容的Metal X系统上实现铜3D打印,Markforged旨在为客户提高

  2. 2 摩方发布微米级分辨率microArch 3D打印机

    2020年2月13日,南极熊从外媒获悉,微纳3D打印专家Boston Micro Fabrication(BMF 摩方材料)在全球发布了microArch 3D打印机。 microArch系统以前称为nanoArch,它行使公司专有的Projection Micro-Stereo

  3. 3 QQ 群文件紧急扩容;钟南山团队与阿里云联手推进新冠疫苗研发;PhpStorm 2019.3.3 发布| 极客头条

    整顿 | 屠敏 快来收听极客头条音频版吧,智能播报由标贝科技供应手艺支撑。 「极客头条」—— 手艺人员的新闻圈! CSDN 的读者同伙们早上好哇,「极客头条」来啦,快来看今天都有

  4. 4 美国Voatz选举投票应用发现漏洞 可能更改或暴露选民投票方式

    更多全球收集平安资讯尽在E平安官网 www.easyaq.com E平安2月15日讯,近日据外媒报道,美国麻省理工学院较量机科学实验室的学者近日发布了Voatz的平安审计而且流露了平安破绽,Voatz软件

  5. 5 钟南山指导研发快速检测试剂盒,15 分钟得结果;小米 10 系列国际版延期发布;美国政府指控华为敲诈和窃取商业机密|极客早知道

    钟南山指导研发快速检测试剂盒,1 滴血 15 分钟可获究竟 2 月 14 日,呼吸疾病国度重点实验室对外透露,近日,在钟南山院士的指导下,实验室结合多家研究机构,最新研发出新型冠状

  6. 6 416篇精选报告!2020汽车行业年度报告大全!!!全是干货!

    汽车行业416篇 顶级申报 大放送! 小编吐血整顿! 废话不多说,今天小编给人人分享416份汽车财富顶级申报,包含:智能网联、新能源、共享出行、区块链、后市场以及传统汽车财富…

  7. 7 并购 | 中际旭创拟收购储翰科技股份 初步估值5.7亿

    新 闻 导 读 光模块巨头中际旭创拟收购成都储翰科技的悉数或部门(最终不少于 51%)股份,收购订价初步估值人民币57,150万元。这将提拔中际旭创在全球数据中心与电信光模块市场的竞争

  8. 8 小米在技术研发上永远跟不上华为,因研发投入占比实在太低了

    小米预估2019年的营收冲破2000亿元,然而手艺研发投入仅有70亿元,研发投入占营收的比例只有3.5%,比拟之下华为的研发投入占比跨越10%,两者在研发投入方面的差距如斯大,也就难怪

  9. 9 想要证明自己最近14天没有到过疫情严重的地方?发个短信就能知道!你试过没有?

    2月14日,在工业和信息化部召开的媒体通气会上,工信部信息通信治理局局长韩夏称,今朝,三家根蒂电信企业凭据疫情防控的需要,在获得用户授权的情形下, 基于电信大数据剖析,

  10. 10 聚焦·要闻 | 开拓新市场——新大陆软件公司成功中标中国移动集团陕西分公司IDC支撑管理平台软件项目

    点击图片查察详情 开发新市场——新大陆软件公司成功中标中国移动集体陕西分公司IDC撑持治理平台软件项目 新大陆国通星驿获中国银联多项赞誉 新大陆北京亚大公司获中国银行软件

本文内容来自网友供稿,如有信息侵犯了您的权益,请联系反馈核实

Copyright 2024.爱妻自媒体,让大家了解更多图文资讯!