搜狗获Cityscapes评测世界冠军,多项指标刷新世界纪录

搜狗获Cityscapes评测世界冠军,多项指标刷新世界纪录 [原文来自:www.ii77.com]


[好文分享:www.ii77.com]

近日,来自搜狗公司的视觉研究团队,在国际自动驾驶领域权威评测集Cityscapes上获得实例分割评测的第⼀名,击败了Nvidia、Facebook、商汤等几十支强劲的国际科研机构,并一举刷新了世界记录,代表中国向全世界彰显了我们出色的技术实力。


这是今年搜狗继CVPR大会上夺得WAD自动驾驶识别挑战赛冠军之后,所摘得的又一桂冠。短期内连夺两项世界冠军,充分证明了搜狗在计算机视觉上已经位列行业领先地位。


搜狗获Cityscapes评测世界冠军,多项指标刷新世界纪录


Cityscapes评测数据集是什么?


众所周知,人工智能技术在自动驾驶领域有着非常广阔的市场空间,也是最被人们所看好的一大应用前景。而如何决定AI判断识别路况信息的理解能力,就取决于它的评测数据集水准。


Cityscapes评测数据集在2015年由奔驰公司推动发布,是目前公认的自动驾驶领域内最具权威性和专业性的图像语义分割评测集之一,其关注真实场景下的城区道路环境理解,任务难度更⾼,且更贴近于自动驾驶等热门需求。在Cityscapes评测数据集之中,共分为像素分割和实例分割两个子任务,其中相较于像素分割,实例分割的难度要更大,也是计算机视觉领域最重要、最具挑战的任务之一。


如何让机器变得更加“聪明”,具备足够的学习能力,是所有人工智能研发时的最大难题,更是国内外科技企业争相研究的自动驾驶技术。能够在Cityscapes评测数据集中脱颖而出,打破世界纪录,意味着搜狗已经具备了强大的AI技术硬实力。

 

实例分割,自动驾驶的曙光已现


实例分割是一个很综合的问题,融合了目标检测、图像分割、图像分类等多种AI技术。顾名思义,像素级别的语义分割,是对图像中的每个像素都划分出对应的类别,即实现像素级别的分类;⽽分类的具体对象,即为实例。那么实例分割不仅要进行像素级别的分类,还需要在具体的类别基础上区别开不同的实例。实例分割对自驾汽车、机器人、视频监控等领域,都有着举足轻重的重要价值,获得全世界科学研发界的密切关注。


Cityscapes评测集包含50个城市不同情况下的街景,以及30类物体标注。此次搜狗参加的实例场景图像语义分割评测,类别对象多、场景复杂,挑战难度非常大。面对复杂的实例环境,搜狗所展示的技术十分巧妙。


过去,我们常常会把AI的关注点放在单一的车道上,而实际的路况信息乃是十分复杂且多变的,必须要求驾驶员有足够的“眼观六路耳听八方”的能力,用纵览全局的目光来观察整个路况。基于这个原因,搜狗通过引⼊全局编码模块,来显著提升了全局信息在实例分割中的影响。全局编码模块可以很好地捕获图像中的语义信息,并选择性地突出显示与实例相关联的特征映射,从而提升准确率。


另一方面,在训练过程中如果只是简单地引⼊每个像素的分割损失,而不是着重使⽤场景的全局上下⽂信息,会导致严重的类间不平衡问题。针对这一现状,搜狗引入了一种全局实例例编码损失函数GIE-loss。这种损失函数会预测场景中出现的实例类别,来加强网络学习全局语义信息的能⼒。不像传统的针对每个像素的损失函数,GIE-loss对每个物体,不管⼤大⼩小都是同等对待的,在使用这个损失函数后,⼩物体的分割效果明显变好。


搜狗获Cityscapes评测世界冠军,多项指标刷新世界纪录

对比图一


搜狗获Cityscapes评测世界冠军,多项指标刷新世界纪录

对比图二


搜狗获Cityscapes评测世界冠军,多项指标刷新世界纪录

对比图三


通过上面的结果对比图,我们可以清晰的看出全局编码模块的引⼊,彻底改变了实例分割传统算法中远近物体不能兼顾的缺点,近处物体可以识别的很好,远处小物体的分割效果也提升了非常多,使得最终的AP100指标远超其他队伍。


截至目前,Cityscapes评测吸引了近百支队伍参赛,包括Facebook、香港中⽂大学、商汤和NVIDIA(英伟达)等众多国内外优秀创新企业和顶尖学术机构参加。值得一提的是,在过去的近两年时间里,商汤、港中文团队与NVIDIA(英伟达)几乎包揽了所有图像分割评测的冠军。而首次参赛的搜狗团队,各项评测指标均远超其他队伍,打破了世界纪录,以无可争议的成绩拿下了第一名。


搜狗视觉研究团队通过不断地算法积累和迭代, 建立了一套高效易用的通用检测分割框架,可以针对任务快速迁移算法模型,达到实际应用需求。 CVPR2018 WAD检测任务和本次实例分割任务所用模型基本一致,验证了模型的高效易用性。同时团队最近也做了一些简单的实验, 在少量代码改动的情况下,仅仅训练几个小时,便可以在一些著名的评测数据集上达到top的成绩。

 

聚焦“自然交互+知识计算”,将成就搜狗人工智能的未来之路


人工智能的命题范围很大,而搜狗选择的突破口很小。以点带面,正是王小川为搜狗所规划的未来道路。


一直以来,搜狗都在坚持着“自然交互+知识计算”的人工智能核心战略,专注于自然交互领域展开发力。在语音领域,拥有充足真实语料数据优势的搜狗,把语音识别与人机对话相结合,发布了知音引擎,并推出了全球首款商用AI同传。除了单独的语音识别“听的能力”之外,搜狗还向着合成方向的“说的能力”展开突破,能够自动学习的AI机器兼具了听、说、翻译等多种能力,位居业界领先地位。多模态输入,已成为了搜狗语音交互的研发重心。


而在视觉领域,搜狗也实现了AI技术的不断突破,让机器的自然交互变得更加全面。2017年乌镇互联网大会上,搜狗发布了行业首款唇语识别技术,实现了视觉与听觉的首次结合,帮助机器以更加多元化的维度来理解用户的诉求。在车载、智能家居等垂直场景下,准确率高达90%。本次在Cityscapes的实例场景图像语义分割评测中大获全胜,更是体现了搜狗对于视觉识别的技术积累,帮助机器进一步提升各项感知能力的交互水准。


连续获得多项国际比赛冠军的搜狗,已经证明了自己在人工智能领域的充足技术底蕴。我们有理由相信,在未来的AI赛道上,占据领先优势的搜狗一定能取得更加出色的成绩,用实际的AI产品来切身改善用户的交互体验。

热门文章

  1. 中曼石油:成功中标获得伊拉克两个油气区块的开发权2024-05-12
  2. 天娱数科:公司董事长、总经理徐德伟被立案调查并留置2024-05-12
  3. 中工国际:子公司签订1.08亿元采购项目合同2024-05-12
  4. 天津市劳动局咨询电话是多少(天津劳动局在线咨询电话)2024-05-12
  5. 全国巾帼文明岗中国信息通信研究院技术与标准研究所业务与网络研究部:信息通信行业的“铿锵玫瑰”2024-05-12
  6. 老婆出轨没证据怎么坑情夫(老婆出轨又没证据怎么办)2024-05-12
  7. 己亥杂诗古诗朗诵(《己亥杂诗》朗诵视频)2024-05-12
  8. 坚持喝“山楂干”泡水,一段时间后身体会咋样?看完涨知识2024-05-12
  9. 盛新锂能:萨比星矿山的锂矿石已陆续运达公司锂盐工厂进行生产2024-05-12
  10. 血脂高的人吃什么食物好(血脂高能吃什么食物比较好)2024-05-12
  11. 来了,漯河牡丹赏花地图→2024-05-12
  12. 物理性质的定义(物理性质的定义和化学性质的定义)2024-05-12
  13. 凤囚凰容止楚玉怀孕啦(凤囚凰容止和楚玉大结局)2024-05-12
  14. 五一劳动节放假通知及假期安全提醒2024-05-12
  15. 文科二本分数线2023(江西文科二本分数线2023)2024-05-12
  16. 软考哪个培训机构好(软考哪个培训机构较好)2024-05-12
  17. 清风拂墓情,花开寄哀思2024-05-12
  18. 简单的c语言程序代码(简单的c语言程序代码编写)2024-05-12
  19. 【美“食”每刻】4.15-4.192024-05-12
  20. 淘宝卖家中心在哪里进入(淘宝卖家最怕什么)2024-05-12
自媒体 微信号:ii77 扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. 1 装饰画,买得好不如挂得好!【艺术品029期】

    装饰挂画,卧室重要点缀元素之一。

  2. 2 装过三套房,这3个地方可别乱花钱,句句都是良心话!

    ☞关注后回复:“卧室、餐厅、客厅、卫生间、厨房、衣柜、阳台、玄关、背景墙、儿童房、装修风格...”等都会收到

  3. 3 26款最好用的榻榻米装修案例,节省空间收纳多功能超强大

    榻榻米在现代生活中占据极其重要的地位,它因为节省空间、环保经济、搬运方便等特点越来越受人们的追捧。现在很多人都比较喜欢小户型,要想满足收纳与多功能空间的各种需求,

  4. 4 刚刚!联通重磅发布“NEXT”计划,要弯道超车......

    首都正昂首迈进5G时代!8月13日,中国联通北京分公司正式发布“5G NEXT”计划,首批5G站点同步启动。

  5. 5 自己在家轻松做艾灸,气血足、容颜靓,女人30岁后再不做就晚了!

    近年来,很多女性不良的生活习惯越来越多,久坐,跷二郎腿,臀部经络不通,循环不畅,代谢不好;大量垃圾、寒毒囤积

  6. 6 厉害了!中山这款产品已遍布大街小巷,“芝麻开门”照进现实

    相信很多人都曾听过 “阿里巴巴和四十大盗”的故事 阿里巴巴对着山洞门大喊一声 “芝麻开门!” 门便会自动打开 听起来像是故事里 才会出现的场景吧? 如今“芝麻开门” 却成了

  7. 7 2021年机器人的工作量相当于全世界430万员工的工作

    来源:网易智能(ID:smartman163) 【网易智能讯 8月13日消息】据国外媒体报道,目前关于人工智能将如何重塑未来工作地点、工作方式的预测并不鲜见。但事实上,自动化软件已经进

  8. 8 爆料!比特大陆完成5.6亿美元 或9月向港交所递交招股书

    雷帝网 雷建平 8月13日报道 知情人士向雷帝网爆料,比特大陆已完成5.6亿美元融资,这一轮融资前估值为140亿美元,融资后,比特大陆估值为146亿美元。 比特大陆这一轮融资窗口很短

  9. 9 家居颜值不够?软装来凑!

    想要让家居风格充满质感,还得借助有颜值的单品提升家居品位。

  10. 10 理论达人解读十九大第35集:用信息数据打造平安中国(微视频)

    中国特色社会主义进入了新时代 理论宣讲不来点创新怎么行 由中央网信办移动局指导 半月谈新媒体中心打造的 50集 《理论达人解读十九大》 微视频 4月2日正式上线 《理论达人解读

本文内容来自网友供稿,如有信息侵犯了您的权益,请联系反馈核实

Copyright 2024.爱妻自媒体,让大家了解更多图文资讯!