机械之心报道
[原文来自:www.ii77.com]
介入:李泽南 [原创文章:www.ii77.com]
华为在 HC 大会上发布的「全球最快 AI 练习集群」Atlas 900 引起了人们普遍存眷。这仅仅是华为智能较量在全联接大会上新产物发布的起头,华为昨天推出的鲲鹏办事器主板、鲲鹏台式机主板,以及全球最强 AI 练习卡 Atlas 300、AI 练习办事器 Atlas 800 等产物,让我们再次见证了这家公司的研发实力。
为了促进较量财富的成长和生态扶植,华为公布了办事器把持系统开源规划 (openEuler),将自身在办事器范畴的手艺储蓄悉数开源。而在硬件方面,华为此次一并发布了 Atlas 800 AI 练习办事器、Atlas 300 AI 练习卡,以及办事器和 PC 主板等设备。今天,华为还公布推出鲲鹏斥地套件。
这一系列的产物,旨在践行华为方才发布的最新蓝图:9 月 18 日,华为首次发布了面向智能较量财富的系统计谋,个中包罗架构立异、成长面向全场景的处理器、有所为,有所不为的贸易策略、以及构建开放生态的结构。
华为又开源了一个把持系统:昨天首先推出的是开源办事器把持系统 openEuler,它包含了华为在办事器把持系管辖域的大量手艺储蓄。对此,华为 Cloud & AI 产物与办事总裁侯金龙在会上向我们进行了介绍。
华为透露,openEuler 基于此前华为内部使用的办事器把持系统,已有近 10 年的手艺储蓄,并普遍地被应用在华为内部的产物配套中。华为基于对鲲鹏处理器的懂得,在机能、靠得住性、平安性等方面临把持系统进行了深度优化。优化后时延、机能大幅提拔,例如:部门场景多历程并发时延缩短 60 %,Web 办事器机能提拔 137% 等。
华为开源办事器把持系统对鲲鹏的优化,筹建 openEuler 开源社区是进展使能合作伙伴成长自有品牌把持系统,促进鲲鹏生态扶植。侯金龙还透露,在 openEuler 开源社区,将来还会支撑更多架构处理器。
openEuler 内核源于 Linux,为了更好地施展鲲鹏的机能,华为办事器把持系统在编译系统、虚拟存储系统、CPU 调剂、IO 驱动、收集和文件系统等方面做了大量的优化。openEuler 将是一款开源的把持系统。华为透露,openEuler 将会成为一种由全球开源进献者构建的高效、不乱、平安的开源把持系统,普遍应用于数据库、大数据、云较量、人工智能等场景。
除了开源的把持系统,华为还有开放的硬件。在大会上,华为首次开放了鲲鹏系列主板,个中包罗办事器主板和台式机(PC)主板,它们已经向合作伙伴周全开放。
鲲鹏主板搭载两颗鲲鹏处理器,个中包罗 128 个物理焦点。此外,这块主板上包含 32 个内存插槽,内置 100GE RoCE,支撑今朝最快的 PCIe 4.0 接口。华为的合作伙伴可基于鲲鹏主板和整机参考设计,快速斥地出自有品牌的办事器和台式机产物。「鲲鹏处理器是业界首个推出内置直出 100GE 收集能力的通用处理器,我们进展在将来可以让 100GE 成为办事器的尺度设置。」华为智能较量买卖部总裁马海旭透露。在 HC 2019 大会上,华为智能较量买卖部总裁马海旭公布了鲲鹏主板周全开放。
鲲鹏主板的开放首要是为了鞭策鲲鹏较量财富生态。「鲲鹏主板搭载了较量财富所有同事们的妄想,」马海旭透露。「华为将鲲鹏主板周全开放,优先支撑合作伙伴基于鲲鹏主板斥地更多的最强算力产物,这会给客户带来更多、更好的选择。」
华为认为,经由自身 30 多年的研发,与各类硬件主板累计跨越 10 亿块的制造经验,鲲鹏主板能够 100% 地释放整机算力。
鲲鹏主板具备业界领先的 56G 高速 SerDes 能力,其旌旗误码率低于 10 的负 12 次方,故障率相较业界平均水平低 15%。另一方面,经由华为立异的 DEMT 动态节能手艺,鲲鹏能够实现能效比领先业界 15% 以上。
这一次,华为为鲲鹏主板内置了 BMC 芯片和 BIOS 软件,还将开放主板接口规范和设备治理规范。为了提拔整顿设计效率和质量,华为还会供应机箱,供电,散热,背板等参考设计。
在发布会上,清华同方也公布推出了基于鲲鹏主板的 PC 台式机。为了支撑斥地者在鲲鹏较量..上高效地进行软件斥地和迁徙,今天华为还发布了鲲鹏斥地套件,个中包含编译器、对象等四个组件,为斥地者供应云上软件斥地..。华为智能较量 TaiShan & Atlas 范畴总司理张熙伟透露:「鲲鹏生态成长进入快车道,在曩昔的 9 个月内,华为联袂合作伙伴配合完成了跨越 3000 个行业应用向鲲鹏生态的迁徙。鲲鹏使能斥地者,为每行代码注入改变世界的算力」。
华为透露,鲲鹏将持续供应进步算力支撑,其具有四大优势:
「端边云算力同构」优势,打破数据中心与边缘、终端的界线,为斥地者供应统一架构的较量..。
多核高并发的较量优势,知足大数据、分布式存储、数据库等场景的算力需求,引领 IT 架构分布式转型趋势。
经由鲲鹏+昇腾的协同优势,天真向 AI 算力扩展,知足 5G、AI、主动驾驶等新手艺对多样性算力需求。
鲲鹏五级算力加快手艺,经由迭代编译、NUMA-aware、新闻队列硬加快、函数加快库、内核调剂自优化,实现法式机能提拔 50%。
本次大会发布的华为鲲鹏斥地套件包含编译器和三个对象。业界首创的剖析扫描对象和代码移植对象实现跨较量..的主动化应用迁徙,闪开发者对指令集差别无感,加快应用迁徙的同时实现代码优化;机能优化对象面向斥地者机能调优实战设计,经由机能可视和一键式优化,匡助斥地者工作效率提拔 5 倍。如今,斥地者可以在鲲鹏斥地者社区一站式获取相关对象和常识库,同时华为云 DevCloud 云上软件斥地..也集成了鲲鹏斥地套件,为斥地者供应线上全流程软件研发对象。
昨天,华为还发布了两款基于昇腾 910 AI 芯片的 Atlas 新产物:全球算力最强的 AI 练习加快卡 Atlas 300,和练习办事器 Atlas 800。
从芯片、办事器到集群,华为两天来推出的新产物从新界说了智能世界的 AI 最强算力,它们也完成了 Atlas 全系列的练习和推理产物结构,可实现云边端全场景布置,加快全行业智能化。
首先是一款为 AI 练习义务预备的加快卡。Atlas 300 练习卡能够实现 256 TFLOPS(FP16)的算力,是当前业界主流练习卡的两倍,壮大的算力可令深度进修算法在练习时每秒处理的图片数据量从 965 张提拔到 1802 张。
这款练习卡为双槽位设计,采用 PCIE 接口,可普遍支撑今朝已有的常规办事器设备。
除了算力壮大之外,Atlas 300 练习卡还支撑 100GE RoGE 直出高速接口,可实现梯度参数和数据集并行传输,最高能够降低 70% 的梯度同步时延,可将集群练习时间缩短到秒级。
AI 练习办事器 Atlas 800 则是一种更为专用化的设备,其在 4U 的空间里集成了 8 块昇腾 910 AI 芯片,能够供应 2P FLOPS 的算力,其密度是业界同类产物的 2.5 倍。比拟于好多公司已经推出的 AI 推理芯片,练习芯片的能力更能施展 AI 的最强算力。华为在本年 8 月推出的昇腾 910 练习芯片基于达芬奇架构,内置了 32 个 3D Cube 较量引擎,单引擎可以在一个时钟周期内完成 4096 次乘加运算。算力高达 256T FLOPS。
「Atlas 800 的重量为 75 公斤,不到业界同类产物的一半,」马海旭介绍道。「它内置 32 个硬件解码器,每秒能够完成一万六千张 1080p 图片的解码,是业界主堕胎品处理能力的 25 倍,并且这些工作负载能够和练习并行,同时处理。」
为了实现更高的算力,Atlas 办事器支撑风冷和液冷两种散热体式。今朝在华为的松山湖数据中心里,这家公司已经布置了全液冷版本的 Atlas 800。
实际上,华为在周三推出的 Atlas 900 AI 练习集群就是由 Altlas 800 AI 练习办事器构成的。华为透露,此 AI 集群内含跨越 128 台 Atlas 800 办事器,用户可凭据需求布置分歧的数量。
经由高效率的整合,AI 练习集群 Atlas 900 成为了今朝全球较量机的巅峰,其总算力达到 256P~1024P FLOPS @FP16,相当于 50 万台 PC 的较量能力。开放生态,让智能无所不及
芯片和把持系统,一向是国内科技公司不擅长的范畴。华为经由近年来的络续投入,正一步步让自身财富链延伸到焦点手艺区域。华为副董事长胡厚崑透露,将来五年内基于统计的较量将成为主流,其算力将占社会算力的 80% 以上,智能较量财富将会显现万亿美元级蓝海市场。在出力研发最强算力产物之外,邀请更多合作伙伴到场智能较量财富,构建繁荣的生态是成长的主要行动。
华为进展经由硬件开放和软件开源,使能恢弘合作伙伴,从而形成开放繁荣的生态,匡助所有人都能够打造出最强算力产物。
架构只是根蒂,华为还将持续打造基于鲲鹏处理器的硬实力,同时成长面向合作伙伴开放的软实力。将来,华为还将与合作伙伴们通力合作,加快贸易立异与科学研究的智能化历程。✄------------------------------------------------到场机械之心(全职记者 / 实习生):hr@jiqizhixin.com投稿或追求报道:content@jiqizhixin.com告白 & 商务合作:bd@jiqizhixin.com