华为史上最强芯片昇腾910面世,算力超Tesla V100一倍,AI框架MindSpore明年开源

机械之心报道
机械之心编纂部
这是迄今为止华为推出的最强芯片。方才,华为在深圳公布其自研的 AI 练习芯片「昇腾 910」正式上线。与此同时,一同推出的还有华为全场景 AI 较量框架 MindSpore。

[原文来自:www.ii77.com]


[转载出处:www.ii77.com]

华为透露,全新的人工智能芯片「昇腾 910」首要面向 AI 数据科学家和工程师,其算力已达到全球领先水平,远超谷歌的 TPU v3 和英伟达最新的 GPU Tesla V100。合营 MindSpore 开源框架,华为一次知足了终端、边缘较量、云全场景需求,让芯片的壮大算力可以以最高效的体式被人们行使。


昇腾 910 也是华为「达芬奇架构」最大的一款芯片。客岁 10 月,华为在全联接大会(HC)上公布了达芬奇规划,个中用于人工智能练习的昇腾 910 芯片分外惹人饮茶注目。它被认为是全球单芯片较量密度最大的 AI 芯片。今天,华为在深圳的发布让我们终于可以和它晤面,人们能够在华为云办事中使用这些芯片了。


华为公司轮值董事长徐直军透露,「华为自 2018 年 10 月发布 AI 计谋以来,稳步而有序地推进计谋执行、产物研发及商用历程。昇腾 910、MindSpore 的推出,标记着华为已完成全栈全场景 AI 解决方案的构建,也标记着华为 AI 计谋的执行进入了新的阶段。


华为首款 AI 练习芯片昇腾 910



面向办事器的芯片昇腾(Ascend)910 采用 7nm 制程,而设计功耗为 310W,其算力比英伟达 Tesla V100 还要凌驾一倍,半精度(FP16)达到了 256 TeraFLOPS(英伟达 Tesla V100 为 125),整数精度算力(INT8)则为 512TeraOPS。在这块芯片上,华为还到场了 128 通道全高清视频解码器。此外,华为透露,昇腾 910 达到规格算力所需功耗仅 310W,显着低于设计规格的 350W。

图:昇腾910与谷歌TPU、英伟达v100对比


徐直军透露:「昇腾 910 完全达到了设计规格,在一致功耗下拥有的算力资源,达到了业内最佳水平的两倍。它已经应用在实际的办事中,好比在典型的 ResNet50 收集的练习中,昇腾 910 与 MindSpore 合营,与现有主流练习单卡合营 TensorFlow 比拟,显露出接近 2 倍的机能提拔,每秒处理的图片数量从 965 张提拔到了 1802 张。



在发布芯片的同时,华为还推出了大规模分布式练习系统 Ascend 集群,在设计中,该集群将包罗 1024 个 Asced 910 芯片,算力达到 256P,大幅跨越英伟达 DGX2 和谷歌 TPU 集群。


一次斥地,周全布置:MindSpore



壮大的硬件也需要 AI 斥地框架才能释放悉数潜能,MindSpore 是华为提出的全场景 AI 框架,与 TensorFlow、PyTorch、PaddlePaddle 等框架并列。


将来的 AI 应用由义务驱动,在分歧场景中机械进修模型的布置体式分歧;另一方面,跟着手艺的快速成长,新方式引出的平安问题和算力瓶颈成为了人们面临的主要挑战。


MindSpore 是一款支撑端、边、云自力的和协同的统一练习和推理框架。华为进展经由这款完整的软件客栈,实现一次性算子斥地、一致的斥地和调试体验,以此匡助斥地者实现一次性斥地,应用在所有设备端、边缘及云端腻滑迁徙的能力。



「MindSpore 框架支撑从大到小的所有设备,同时也支撑内陆的 AI 较量,从而实现隐私珍爱,」徐直军透露。「这种框架传递给云端的数据能够是处理后的、不带有隐私信息的梯度、模型信息,而非数据自己,以此实如今包管用户隐私数据珍爱的前提下跨场景协同。除了隐私珍爱,MindSpore 还将模型珍爱 Built-in 到 AI 框架中,实现模型的平安可托。



MindSpore 原生适应所有的 AI 应用场景,并可以按需协同的根蒂上,经由实现 AI 算法即代码,使斥地态变得加倍友好,显著削减模型斥地时间。以一个 NLP(天然说话处理)典型收集为例,比拟其他框架,用 MindSpore 可降低焦点代码量 20%,斥地门槛大大降低,效率整体提拔 50% 以上。


MindSpore 和昇腾处理器连系能够显著提高 AI 负载的处理效率,不外即使用户采用常规的 CPU、GPU,这一框架也能供应周全支撑。


在这一框架中,算子库 CANN 面向人工智能络续显现的多样性算子,兼顾了高机能和高斥地效率。TensorEngine 实现了统一的 DSL 接口、主动算子优化、主动算子生成,以及主动算子调优功能。值得一提的是,华为在 Tensor Engine 中采用了陈天奇等人提出的 TVM。华为称,CANN 能够实现 3 倍的斥地效率提拔。华为透露,MindSpore 同时也支撑今朝所有主流深度进修框架中的模型。




在框架之上,华为还为斥地者供应了更为高级的 ModelArts,这是一个机械进修 PaaS,供应全流程办事、分层分级 API 及预集成解决方案。客岁发布 ModelArts 后,今朝的日均练习功课义务跨越 4000 个,已经拥有了跨越 3 万名斥地者。


基于达芬奇架构的统一性,斥地者在面临云端、边缘侧、端侧等全场景应用斥地时,只需要进行一次算子斥地和调试,就能够应用于分歧..,大幅降低了迁徙成本。



在发布会上,徐直军还公布 MindSpore 将在 2020 年的第一季度开源,进展以此助力每一位斥地者,促进 AI 财富生态成长。「华为在生态扶植上有本身的优势,」徐直军透露。「我们在智能终端上的 HiAI 引擎,能够让所有斥地者基于异构较量的算力实现多种智能化办事。经由最强算力和进步框架的连系,我们能够打造好多其他框架做不到的事情。



跟着昇腾处理器和 MindSpore 等产物的推出,华为的全场景 AI 计谋已经向我们显现无余。



华为达芬奇规划


华为的达芬奇架构此前已经跟着昇腾 310 芯片,和 7 月份方才推出的麒麟 810 手机处理器为我们揭开了面纱。华为进展经由这一自研架构的多种处理器,接管将来人工智能场景中的所有较量义务。


在达芬奇架构的处理器中,Da Vinci Core 只是 NPU 的一个部门,Da Vinci Core 内部还细分成好多单元,包罗焦点的 3D Cube、Vector 向量较量单元、Scalar 标量较量单元等,它们各自尊责分歧的运算义务实现并行化较量模型,配合保障 AI 较量的高效处理。


其首要构造分为三个部门:


  • 3D Cube 矩阵乘法单元。矩阵乘是 AI 较量的焦点,这部门运算由 3D Cube 完成,Buffer L0A、L0B、L0C 则用于存储输入矩阵和输出矩阵数据,负责向 Cube 较量单元输送数据和存放较量究竟。

  • 向量较量单元固然 Cube 的算力很壮大,但只能完成矩阵乘运算,还有好多较量类型要依靠 Vector 向量较量单元来完成。Vector 的指令相对来说非常雄厚,能够笼盖各类根基的较量类型和很多定制的较量类型。

  • 标量较量单元,首要负责 AI Core 的标量运算,功能上能够看作一个小 CPU,完成整个法式的轮回掌握,分支判断,Cube、Vector 等指令的地址和参数较量以及根基的算术运算等。



华为称,达芬奇架构适用于从手机端到智能设备,再到办事器端的悉数人工智能模型练习场景。在首款采用自研 NPU 的麒麟 810 上,华为已经显现了本身的 AI 芯片研发实力(搭载的手机是华为 Nova5 系列)。今天推出的昇腾 910 芯片是今朝采用达芬奇架构最大、算力最强的一款芯片。


华为一向在增强投资根蒂手艺的研究,自 2018 年 10 月发布 AI 计谋以来,一向在稳步推进计谋执行、产物研发及商用历程。昇腾 910、MindSpore 的推出,标记着华为已完成全栈全场景 AI 解决方案的构建,也标记着华为 AI 计谋的执行进入了新的阶段。


昇腾 310 和昇腾 910 仅仅是一个起头,面向将来,华为还将推出更多的面向所有场景的产物。在 2021 年,华为还将推出下一代芯片昇腾 320,在 9 系列和 3 系列之间的昇腾 610 也将在来岁推出。


最后,徐直军透露:「在本年的华为全联接大会上,我们还会发布加倍震撼的 AI 产物。」此外,华为的下一代旗舰手机处理器麒麟 990 也将在 9 月 6 日与我们晤面。

WAIC 2019 斥地者日将于 8 月 31 日在上海世博中心举办,包含 1 个主单元、4 个分单元、黑客马拉松竞赛和斥地者诊所互动区。

届时,全球顶尖 AI 专家、手艺大牛、知名企业代表以及数千名斥地者将齐聚上海,环绕人工智能前沿理论手艺和斥地实践进行分享与解读。

点击阅读原文,立刻报名。


自媒体 微信号:ii77 扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. 1 撬动百亿台设备,让物联网“造”起来!

    无论是曾经「山重水复疑无路」、「众里寻他千百度」的千古绝唱,照样现在女同伙直击魂魄的「你究竟在哪?」的发问,事实上,剖开现象看素质,实则都是一则万变不离其宗的「

  2. 2 揭秘闪存技术新进展,东芝存储器CTO将亲临CFMS2019发表演说!

    2019上半年NAND Flash和DRAM芯片价钱跌跌不休,下半年固然行情逆转,但依然被需求疲软、 高 库存、减产络续、商业辩说等不安的气氛充溢着整个财富,同时也给企业带来了伟大的挑战。

  3. 3 周鸿祎挖掘安全“宝藏”

    一身红衣的周鸿祎,曾用免费杀毒的手段在互联网世界塑造了一个“推翻者”的形象。 这一次,他带着360,筹算再一次推翻传统收集平安行业。 4月份,完成从奇安信撤股之后,周鸿祎

  4. 4 监控数据保存遇难题 云存储能否成“治病良药”?

    大数据时代加快光降,世界上不可胜数的人制造出浩如烟海的数据,IDC和数据存储公司希捷发布的《数字化世界—从边缘到焦点》申报显露, 至2025年,全球估计新增数据总量将从2018年

  5. 5 重点考虑与联通共建共享5G网络!中国电信董事长柯瑞文详解为什么

    柯瑞文透露,已与联通在一些问题上杀青共识,好比在投资占比跨越80%的无线侧和传输侧,双方将共建共享;但在焦点网和买卖平台方面连结相对自力性 5G 时代到来,面临将来宏大的投

  6. 6 中国企业数字化联盟成立,联通沃云成首批会员企业

    点击上方“ 蓝色字体 ”,选择 “ 设为星标 ” 要害讯息,D1时间送达! 近期,中国企业数字化联盟成立大会暨2019北京部委央企及大型企业CIO大会在北京谨严举办。来自水利部、国度电

  7. 7 蔚来将裁员至 7500 人;高通否认「5G 芯片报废」消息;DeepMind 联合创始人或「被离职」| 极客早知道

    蔚来内部邮件:将裁员至 7500 人,提拔运营效率 8 月 22 日下昼新闻,蔚来创始人、董事长、CEO 李斌今日发出内部邮件,称将进一步掌握支出,提拔运营效率,把资源群集在焦点买卖上

  8. 8 无间道?研究人员发现“黑吃黑”僵尸网络

    更多全球收集平安资讯尽在E平安官网www.easyaq.com 小编来报: 这个僵尸收集专对“同业”下黑手,行使已经留有后门的办事器为其挖掘加密泉币 据外媒报道,近日, Positive Technologies 的

  9. 9 4G网速变慢?工信部给了一个数据!看完你想说啥?

    工信部22日就社会反映的4G网速变慢问题约谈三家根蒂运营商。工信部信息通信成长司司长闻库接管记者采访透露,工信部将指导运营商积极开展收集扩容升级,加大监管力度,持续做好

  10. 10 华为暂没有推出鸿蒙手机计划;苹果否认 iPhone 辐射超标;Kotlin 1.3.50 发布 | 极客头条

    快来收听极客头条音频版吧,智能播报由标贝科技供应手艺支撑。 「CSDN 极客头条」,是从 CSDN 网站延伸至官方微信公家号的稀奇栏目,专注于一天业界事报道。风里雨里,我们将天天

本文内容来自网友供稿,如有信息侵犯了您的权益,请联系反馈核实

Copyright 2024.爱妻自媒体,让大家了解更多图文资讯!