2019年AI芯片产业深度研究报告

自媒体 自媒体

[原创文章:www.ii77.com]

一、 人工智能芯片成长近况及趋势 [本文来自:www.ii77.com]


1、深度进修算法对芯片要求更为苛刻,通用 CPU 性价比相对较差


履历了 60 多年的起升沉伏之后,人工智能终于迎来了第三次爆发。第三次爆发的焦点引爆点是深度进修算法的显现,但其背后的撑持是数据和算力。对整个 AI 行业来讲,算法、数据和算力三大根基要素中,数据尤其是海量数据的获取和处理难度鄙人降,算法也在深度进修模型的根蒂上络续优化,而负责将数据和深度算法统一协调起来的芯片可否获得大的飞跃,成为市场存眷的核心。



深度进修算法对芯片机能需求首要示意在三个方面:一、海量数据在较量和存储单元之间的高速通信需求。这不只需要芯片具备壮大的缓存和片上存储能力,并且还需要较量和存储单元之间有较大的通信带宽。二、专用较量能力需求高。深度进修算法中有大量卷积、残差收集、全保持等特别较量需要处理,还需要提拔运算速度,降低功耗。三、海量数据自身处理同样也对芯片提出了新的要求,尤其是非构造化数据的增多,对传统芯片构造造成了较大的压力。


通用 CPU 在深度进修中可用但效率较低。好比在图像处理范畴,首要用到的是 CNN(卷积神经收集),在天然说话识别、语音处理等范畴,首要用到的是 RNN(轮回神经收集),固然这两种算法模型有着较大的区别,但素质上都是向量和矩阵运算,首要是加法和乘法,辅助一些除法和指数运算。传统 CPU 可用于做上述运算,然则 CPU 还有大量的较量逻辑掌握单元,这些单元在 AI 较量中是用不上的,造成了 CPU 在 AI 较量中的性价对照低。



2、GPU、FPGA 以及 ASIC 各有好坏,成为当前 AI 芯片行业的主流


正因为 CPU 在 AI 较量上的弱点,给了能够实现海量并行较量且可以对进行较量加快的 AI 芯片留下了市场空间。从广义上讲,面向 AI 较量的芯片都能够称为 AI 芯片,包罗基于传统架构的 GPU、FPGA以及 ASIC(专用芯片),也包罗正在研究但离商用还有较大差距的类脑芯片、可重构 AI 芯片等。


云端练习芯片市场较为集中,而推理市场云、边两头均有大量企业介入


按照布置位置划分,AI 芯片能够分为云端芯片和边缘端芯片。云端芯片布置位置包罗公有云、私有云或许夹杂云等根蒂举措,首要用于处理海量数据和大规模较量,并且还要可以支撑语音、图片、视频等非构造化应用的较量和传输,一样情形下都是用多个处理器并行完成相关义务;边缘端 AI 芯片首要应用于嵌入式、移动终端等范畴,如摄像头、智妙手机、边缘办事器、工控设备等,此类芯片一样体积小、耗电低,机能要求略低,一样只需具备一两种 AI 能力。


按照承担的义务分,AI 芯片能够划分为练习芯片和推理芯片。练习是指经由大量标记过的数据在平台长进行“进修”,并形成具备特定功能的神经收集模型;推理则是行使已经练习好的模型输入新数据经由较量获得各类结论。练习芯片对算力、精度要求非常之高,并且还需要具备必然的通用性,以适应多种算法的练习;推理芯片加倍留意综合能力,包罗算力能耗、时延、成本等身分。


综合来看,练习芯片因为对算力的特别要求,只适合在云端布置,并且多采用的是“CPU+加快芯片”雷同的异构模式,加快芯片能够是 GPU,也能够是 FPGA 或许是 ASIC 专用芯片。AI 练习芯片市场集中度高,英伟达和谷歌领先,英特尔和 AMD 正在积极切入。推理在云端和终端都可进行,市场门槛相对较低,市场介入者较多。云端推理芯片除了传统的英伟达、谷歌、赛灵思等芯片大厂外,Groq等国际新兴力量也在到场竞争,国内寒武纪、比特大陆也有不错示意;终端推理芯片市场较为涣散,场景各异,介入者除了英伟达、英特尔、ARM 和高通之外,国内企业如寒武纪、地平线、云知声、云天励飞等在各自细分范畴均有所建树。



GPU 擅长云端练习,但需与 CPU 异构、功耗高且推理效率一样


GPU(Graphics Processing Unit)是一种由大量焦点构成的大规模并行较量架构,专为同时处理多重义务而设计的芯片。恰是因为其具备精巧的矩阵较量能力和并行较量优势,最早被用于 AI 较量,并在云端获得大量应用。GPU 中跨越 80%部门为运算单元(ALU),而 CPU 仅有 20%,是以 GPU更擅长于大规模并交运算。以英伟达的 GPU TITAN X 为例,该产物在深度进修中所需练习时间只有CPU 的 1/10 不到。但 GPU 用于云端练习也有短板,GPU 需要同 CPU 进行异构,经由 CPU 挪用才能工作,并且自己功耗非常高。同时,GPU 在推理方面需要对单项输入进行处理时,并行较量的优势未必可以获得很好的施展,会显现较多的资源虚耗。


▲CPU与GPU架构对比



FPGA 芯片算力强、天真度高,但手艺难度大国内差距较为显着


FPGA(Field-Programmable Gate Array)即现场可编程门阵列,该芯片集成了大量的根基门电路以及存储器,其天真性介于 CPU、GPU 等通用处理器和专用集成电路 ASIC 之间,在硬件固定之前,许可使用者天真使用软件进行编程。FPGA 在出厂时是“全能芯片”,用户可凭据自身需求,用硬件描述说话对 FPGA 的硬件电路进行设计;每完成一次烧录,FPGA 内部的硬件电路就有了确定的保持体式,具有了必然的功能;输入的数据只需要依次经由各个门电路,就能够获得输出究竟。


FPGA 应用于 AI 有以下优势:


(1)算力强劲。因为 FPGA 能够同时进行数据并行和义务并行较量,在处理特定应用时结果加倍显着,对于某一个特定的运算,FPGA 能够经由编纂重组电路,生成专用电路,大幅压缩较量周期。从赛灵思推出的 FPGA 产物看,其吞吐量和时延指标都好于 CPU 和 GPU 产物。


(2)功耗优势显着。FPGA 能耗比是CPU的10倍以上、GPU的3倍。因为在 FPGA 中没有取指令与指令译码把持,没有这部门功耗;而在复杂指令集(X86)的 CPU 中仅仅译码就占整个芯片能耗的约 50%,在 GPU 里取指与译码也会消费 10%至 20%的能耗。


(3)天真性好。使用通用处理器或 ASIC 难以实现的基层硬件掌握把持手艺,行使 FPGA 能够很轻易的实现,从而为算法的功能实现和优化留出了更大空间。


(4)成原形对 ASIC 具备必然优势。FPGA 一次性成本(光刻掩模建造成本)远低于 ASIC,在芯片需求还未陋习模、深度进修算法暂未不乱需要络续迭代改善的情形下,行使具备可重构特征的FPGA 芯片来实现半定制的人工智能芯片是最佳选择。


正因为存在上述优势,FPGA 被普遍用于 AI 云端和终端的推理。国外包罗亚马逊、微软都推出了基于 FPGA 的云较量办事,而国内包罗腾讯云、阿里云均在 2017 年推出了基于 FPGA 的办事,百度大脑也使用了 FPGA 芯片。


从市场款式上看,全球 FPGA 历久被 Xilinx(赛灵思)、Intel(英特尔)、Lattice(莱迪思)、Microsemi(美高森美)四大巨头垄断。个中,赛灵思和英特尔合计占到市场的 90%摆布,赛灵思的市场份额跨越 50%,国内厂商方才起步,差距较大。



专用芯片(ASIC)深度进修算法加快应用增多,可供应更高能效示意和较量效率


ASIC(Application Specific Integrated Circuits),即专用芯片,是一种为特定目的、面向特定用户需求设计的定制芯片,具备机能更强、体积小、功耗低、靠得住性更高档长处。在大规模量产的情形下,还具备成本低的特点。


ASIC 与 GPU、FPGA 分歧,GPU、FPGA 除了是一种手艺路线之外,照样实实在在切实定产物,而 ASIC 只是一种手艺路线或许方案,其呈现出的最终形态与功能也是多种多样的。近年来,越来越多的公司起头采用 ASIC 芯片进行深度进修算法加快,个中示意最为凸起的 ASIC 就是 Google 的TPU(张量处理芯片)。


TPU 是谷歌为提拔 AI 较量能力同时大幅降低功耗而专门设计的芯片。该芯片正式发布于 2016 年 5月。TPU 之所以称为 AI 专用芯片,是因为它是专门针对 TensorFlow 等机械进修平台而打造,该芯片能够在沟通时间内处理更复杂、更壮大的机械进修模型。谷歌经由数据中心测试显露,TPU 平均比其时的 GPU 或 CPU 快 15-30 倍,机能功耗比(TFOPS/Watt)凌驾约 30-80 倍。


然则,ASIC 一旦制造完成今后就不克点窜了,且研发周期较长、贸易应用风险较大,今朝只有大企业或背靠大企业的团队甘愿投入到它的完整斥地中。国外首要是谷歌在主导,国内企业寒武纪斥地的 Cambricon 系列处理器也普遍受到存眷。个中,华为海思的麒麟 980 处理器所搭载的 NPU 就是寒武纪的处理器 IP。



3、短期内 GPU 仍将是 AI 芯片主导,历久看三大手艺路线将呈现并行态势


短期内 GPU 仍将主导 AI 芯片市场,FPGA 的使用将更为普遍


GPU 短期将陆续 AI 芯片的向导地位。GPU 作为市场上 AI 较量最成熟、应用最普遍的通用型芯片,应用潜力较大。凭借其壮大的较量能力、较高的通用性,GPU 将持续占领 AI 芯片的首要市场份额。


当前,两大 GPU 厂商都还在络续升级架构并推出新品,深度进修机能提拔显着,将来应用的场景将更为雄厚。英伟达凭借着其在矩阵运算上的优势,率先推出了专为深度进修优化的 Pascal GPU,并且针对 GPU 在深度进修上的短板,2018 年推出了 Volta 架构,正在完成加快-运算-AI 构建的闭环;AMD 针对深度进修,2018 年推出 Radeon Instinct 系列,将来将应用于数据中心、超算等 AI 根蒂举措上。我们估计,在效率和场景应用要求大幅提拔之前,作为数据中心和大型较量力撑持的主力军,GPU 仍具有很大的优势。



FPGA 是短期内 AI 芯片市场上的主要增进点,FPGA 的最大优势在于可编程带来的设置天真性,在当前手艺与运用都在快速更迭的时期,FPGA 具有显着的实用性。企业经由 FPGA 能够有效降低研发调试成本,提高市场响应能力,推出差别化产物。在专业芯片成长得充沛完美之前,FPGA 是最好的过渡产物,正因为如斯,科技巨头纷纷结构云较量+FPGA 的平台。跟着 FPGA 的斥地者生态逐渐雄厚,适用的编程说话增加,FPGA 运用会加倍普遍。是以短期内,FPGA 作为兼顾效率和天真性的硬件选择仍将是热点地点。


历久来看 GPU、FPGA 以及 ASIC 三大类手艺路线将并存


GPU 首要偏向是高级复杂算法和通用型人工智能平台。(1)高端复杂算法实现偏向。因为 GPU 自己就具备高机能较量优势,同时对于指令的逻辑掌握上能够做的更复杂,在面向复杂 AI 较量的应用方面具有较大优势。(2)通用型的人工智能平台偏向。GPU 因为通用性强,机能较高,能够应用于大型人工智能平台够高效地完成分歧种类的挪用需求。


FPGA 将来在垂直行业有着较大的空间。因为在天真性方面的优势,FPGA 对于部门市场转变敏捷的行业最为实用。同时,FPGA 的高端器件中也能够逐渐增加 DSP、ARM 核等高级模块,以实现较为复杂的算法。跟着 FPGA 应用生态的慢慢成熟,FPGA 的优势也会逐渐为更多用户所承认,并得以普遍应用。


ASIC 久远来看非常适用于人工智能,尤其是应对将来爆发的面向应用场景的定制化芯片需求。ASIC的潜力施展在,AI 算法厂商有望经由算法嵌入切入该范畴,以进入如安防、智能驾驶等场景。因为其具备高机能低消费的特点,能够基于多小我工智能算法进行定制,以应对分歧的场景,将来在练习和推理市场上都有较大空间。


4、国表里 AI 芯片市场需求将连结较快增进势头,云端、边缘均具备潜力


近年来,陪伴着全球 AI 财富的快速增进,AI 芯片需求大幅上升。按照 Gartner 最新数据,2018 年全球 AI 芯片市场规模达到 42.7 亿美元。将来几年,全球各大芯片企业、互联网巨头、初创企业都将在该市场长进行比赛,估计到 2023 年全球市场规模将达到 323 亿美元。将来五年(2019-2023年)平均增速约为 50%,个中数据中心、小我终端、物联网芯片均是增进的重点。



比拟之下中金公司研究部发布的一组数据则更为乐观,该数据显露,2017年,整体AI芯片市场规模达到62.7亿美元,个中云端练习AI芯片20.2亿美元,云端推理芯片3.4亿美元,边缘较量AI芯片39.1亿美元;到2022年,整体AI芯片市场规模将会达到596.2亿美元,CAGR57%,个中云端练习AI芯片172.1亿美元,CAGR 53.5%,云端揣摩芯片71.9亿美元,CAGR 84.1%,边缘较量AI芯片352.2亿美元,CAGR 55.2%。



国内子工智能芯片行业成长仍处在起步阶段。历久以来,我国在 CPU、GPU 和 DSP 设计上一向处于追赶状况,绝大多数芯片依靠国外的 IP 核进行设计,自立立异能力不足。但我们也看到,国内子工智能财富的快速成长,也为国内芯片财富实现换道超车缔造了机会。因为国表里在芯片生态上并未形成垄断,国内芯片设计厂商尤其是专用芯片设计厂商,同国外竞争敌手还处在统一起跑线上。


今朝国内子工智能芯片市场呈现出百花齐放的态势。AI 芯片的应用范畴普遍分布在金融证券、商品介绍、安防、消费机械人、智能驾驶、智能家居等浩瀚范畴,催生了大量的人工智能创业企业,如地平线、深鉴科技、寒武纪、云知声、云天励飞等。我们认为,将来跟着国内子工智能市场的快速成长,生态扶植的完美,国内 AI 芯片企业将有着更大的成长空间,将来 5 年的市场规模增速将跨越全球平均水平。


二、 AI 芯片首要应用场景


1、数据中心(云端)


数据中心是 AI 练习芯片应用的最首要场景,首要涉及芯片是 GPU 和专用芯片(ASIC)。如前所述,GPU 在云端练习过程中获得普遍应用。今朝,全球主流的硬件平台都在使用英伟达的 GPU 进行加快,AMD 也在积极介入。亚马逊收集办事 AWS EC2、Google Cloud Engine(GCE)、IBM Softlayer、Hetzner、Paperspace 、LeaderGPU、阿里云、安然云等较量平台都使用了英伟达的 GPU 产物供应深度进修算法练习办事。


在云端推理市场上,因为芯片加倍切近应用,市场更多存眷的是响应时间,需求也加倍的细分。除了主流的 CPU+GPU 异构之外,还可经由 CPU+FPGA/ASIC 进行异构。今朝英伟达在该市场依然连结着领军位置。首要原因是:GPU壮大的并行较量能力(比拟CPU)、通用性以及成熟的斥地情况。然则GPU也并非是十全十美的解决方案,显着的瑕玷如:高能耗以及奋发的价钱。


比拟之下,FPGA的低延迟、低功耗、可编程性优势(适用于传感器数据预处理工作以及小型斥地试错升级迭代阶段)和 ASIC 的特定优化和效能优势(适用于在确定性执行模型)也正在凸显,赛灵思、谷歌、Wave Computing、Groq、寒武纪、比特大陆等企业市场空间也在扩大。



来自IDC和Gartner的数据也显露,全球AI办事器及AI芯片市场规模自2016年到2020年都将连结持续的高速增进,而与此同时全球云端AI芯片傍边GPU的市场份额呈现出持续下滑的趋势,估计到2022年云端练习GPU占比将降至60%,云端推理GPU占比更是只有30%。


2、移动终端


智妙手机在履历了近10年的高速增进后,市场已趋于饱和,出货增速趋近于0,行业逐渐转为存量市场。近年来,一批国产厂商在产物质量上逐渐达到了第一梯队的水平,进一步加剧了头部市场的竞争。为实现差别化竞争,各厂商加大手机AI功能的斥地,经由在手机SoC芯片中到场AI引擎,调配现有较量单元来实现AI较量,或许直接到场AI协处理器,实如今低功耗情形下AI功能的高效运行。


跟着将来竞争进一步加剧,以及产量上升所带来的成本下降,估计AI芯片将会进一步渗透进入到中等机型市场,市场空间广宽。移动端AI芯片市场不止于智妙手机,潜在市场还包罗:智妙手环/手表、VR/AR眼镜等市场。AI芯片在图像及语音方面的能力或者会带来将来人机交互体式的改变并进一步提拔显露屏、摄像头的能力,有或者在将来改变移动端产物。


以往经由云数据中心做手机端AI推理义务面临收集带宽延迟瓶颈的问题,严重影响用户使用体验,而CPU适合逻辑运算,但并不适合AI并交运算义务,今朝市场上风行在SoC中增加协处理器或专用加快单元来执行AI义务。以智妙手机为代表的移动互联网终端是一个多传感器融合的综合数据处理平台,AI芯片需要具备通用性,可以处理多类型义务能力。因为移动终端依靠电池驱动,而受制于电池仓巨细和电池能量密度限制,芯片设计在追求算力的同时对功耗有着严厉的限制,能够斥地专用的ASIC芯片或许是使用功耗较低的DSP作为AI处理单元。



今朝手机芯片市场存在以下情形:1)、AI应用场景、功能有限;2)、AI芯片厂商一样向SoC厂供应IP并收取授权费,需要AI-IP与整块SoC进行精巧的成家,而创业公司贫乏与SoC厂商合作经验;3)、传统手机SoC厂商和IP厂商都在斥地本身的AI加快器,传统IP巨头能够接纳IP打包发卖的体式推广其AI-IP产物。比拟之下新进厂商在成本、功能、产物线、成家度等都不占优的情形下很难在该范畴存活。新进厂商应增强其软件方面优势,并加深与手机厂商合作配合进行手机AI功能斥地。


3、主动驾驶


主动驾驶汽车装备了大量的传感器、摄像头、雷达、激光雷达等车辆自立运行需要的部件,每秒都邑发生大量的数据,对芯片算力有很高的要求, 但受限于时延及靠得住性,有关车辆掌握的较量不克再依托云端进行,高算力、快速响应的车辆端人工智能推理芯片必弗成少。



今朝,主动驾驶所使用的芯片首要基于 GPU、FPGA 和 ASIC 三条手艺路线。但因为主动驾驶算法仍在快速更迭和进化,是以大多主动驾驶芯片使用 GPU+FPGA 的解决方案。将来算法不乱后,ASIC将成为主流。


凭据美国汽车工程师协会(SAE)将主动驾驶按照车辆行驶对于系统依靠水平分为L0~L5六个级别,L0为车辆行驶完全依靠驾驶员操作,L3级以上系统即可在特定情形下实现驾驶员出手把持,而L5级则是在全场景下车辆行驶完全实现对系统的依靠。今朝贸易化乘用车车型中仅有Audi A8、Tesla、凯迪拉克等部门车型可实现L2、3级ADAS。估计在2020年摆布,跟着传感器、车载处理器等产物的进一步完美,将会有更多的L3级车型显现。而L4、5级主动驾驶估计将会率先在关闭园区中的商用车平台上实现应用落地,更普遍的乘用车平台高级别主动驾驶,需要陪伴着手艺、政策、根蒂举措扶植的进一步完美,估计至少在2025年~2030年今后才会显现在一样道路上。

今朝汽车电子掌握系统是分布式ECU架构,分歧的信息娱乐、车身、车辆活动和动力总成系统及其细分功能离别由分歧自力的ECU单元进行自力掌握,部门高档车型上的ECU数量跨越100个。将来跟着汽车进入L3级以上的高级别主动驾驶时代,跟着车载传感器数量及其所发生的数据量剧增,分布式电子系统难以知足对大量、多元的传感器数据进行高效融合处理,并综合所有传感器数据做出车辆掌握决议等一系列把持需求。要知足以上功能需求,汽车电子系统由需要向着域掌握器(DCU)、多域掌握器(MDC)等集中化偏向成长,将来,汽车电子操控系统将会进一步向着集中化、软硬件解耦及平台化偏向成长,汽车将会由统一的超算平台对传感器数据进行处理、融合、决议最终实现高级其余主动驾驶功能。



陪伴人工智能手艺在视觉范畴的应用,基于视觉手艺的主动驾驶方案逐渐变为或者,这需要在传统行车电脑平台上添加用于视觉算法处理的AI芯片。主动驾驶汽车较量单元设计需要考虑算力、功耗体积等问题,出于硬件资源最优化应用,往往接纳异构较量平台设计方案,及“CPU+XPU”(XPU包罗:DSP/GPU/FPGA/ASIC),个中可接纳DSP用于图像特征提取义务、GPU/FPGA/ASIC等较量单元用于方针识别、追踪义务等,而CPU则会用于定位、决议等逻辑运算义务。


今朝最典型的产物如英伟达的DRIVE PX系列及后续的Xavier、Pegasus等。除硬件较量平台外,英伟达为客户供应配套的软件平台及开放的上层传感器结构和自界说模块使得客户可以凭据自身需要进行二次斥地,其还为客户供应感知、制图以及行驶策略等解决方案。今朝其产物已经被包罗ZF、Bosch、Audi、Benz以及Tesla等Tier1s、OEMs厂商及诸多主动驾驶创业公司采用作为其处理器方案所使用。


在悉数的边缘较量场景中,用于主动驾驶的较量芯片设计难度最大,这首要施展在:1)算力要求高, L3级以上主动驾驶需要复数种类的传感器实现传感器冗余,包罗:6~12颗单目摄像头、3~12台毫米波雷达、5台以内的激光雷达等(分歧方案设置偏重分歧),是以发生的数据量极大( 估量L5级一天可发生数据量4000GB),在车辆高速行驶的情形下系统需要可以快速对数据进行处理;2)汽车平台同样是由电池供电,是以对于较量单元功耗有较高的要求,早期较量平台功耗大、产热也较大,对于系统的续航及不乱性都有较大的印象;3)汽车电子需要知足ASIL-D车规级电子产物设计尺度,而使主动驾驶所需要的中央处理器达到ASIL-D级设计尺度难度更大。


今朝主动驾驶市场尚处于成长早期,市场情况不敷成熟,但以英伟达、Intel(Mobileye、Altera)等科技巨头为代表的厂商已经投入巨资在该范畴斥地出了相关的硬件产物及配套软件手艺。人工智能芯片创业公司应该增强与OEMs、Tier1或财富联盟合作为其供应AI芯片+软件对象链的全套解决方案。


AI 芯片用于主动驾驶之后,对传统的汽车电子市场冲击较大,传统的汽车电子巨头(恩智浦、英飞凌、意法半导体、瑞萨)固然在主动驾驶芯片市场有所斩获,但风头远不及英特尔、英伟达、高通甚至是特斯拉。国内初创企业如地平线、眼擎科技、寒武纪也都在积极介入。在主动驾驶芯片范畴进展最快以及竞争力最强的是英特尔和英伟达,英特尔强在能耗,英伟达则在算力和算法平台方面优势显着。


英特尔进入主动驾驶芯片市场固然较晚,但经由一系列大手笔收购确立了其在主动驾驶市场上的龙头地位。2016 年,公司出资 167 亿美元收购了 FPGA 龙头 Altera;2017 年 3 月以 153 亿美元天价收购以色列 ADAS 公司 Mobileye,该公司凭借着 EyeQ 系列芯片占有了全球 ADAS 70%摆布的市场,为英特尔切入主动驾驶市场缔造了前提。收购完成之后,英特尔形成了完整的主动驾驶云到端的算力方案——英特尔凌动/至强+Mobileye EyeQ+Altera FPGA。英特尔收购 Mobileye 之后,后者也直接推出了 EyeQ5,支撑 L4-L5 主动驾驶,估计在 2020 年量产。



英伟达在汽车AI芯片的竞争中不落下风。英伟达在2015年推出了世界首款车载超等较量机Drive PX,紧接着 2016 年推出 Drive PX2,2018 年推出新一代超等较量机 Drive Xavier,同年,基于双 Drive Xavier 芯片针对主动驾驶出租车买卖的 Drive PX Pegasu 较量平台面世。2019 CES 上,英伟达推出了全球首款商用 L2+主动驾驶系统 NVIDIA DRIVE AutoPilot。DRIVE AutoPilot 的焦点是 Xavier 系统级芯片。该芯片处理器算力高达每秒 30 万亿次,已经投产。



4、安防


安防市场是全球及国内 AI 最为确定以及最大的市场,尤其是 AI 中的图像识别和视频处理手艺正在周全影响安防财富。个中,在安防产物中,摄像头、交流机、IPC(收集摄像机)、硬盘刻录机、各类办事器等设备都需要芯片,这些芯片也决意了整个安防系统的整体功能、手艺指标、能耗以及成本。在安防芯片中,最为存眷的照样四类与监控相关的芯片(ISP 芯片、DVR SoC 芯片、IPC SoC芯片、NVR SoC 芯片)。


ISP 芯片(Image Signal Processing,图像旌旗处理)首要负责对前端摄像头所采集的原始图像旌旗进行处理;DVR(DigitalVideoRecorder,数字硬盘录像机)SoC 芯片首要用于模拟音视频的数字化、编码压缩与存储;IPC (IP Camera,IP 摄像机)SoC 芯片平日集成了嵌入式处理器(CPU)、图像旌旗处理(ISP)模块、视音频编码模块、收集接口模块等,具备入侵探测、人数统计、车辆逆行、丢包检测等一些简洁的视频剖析功能;NVR (Network Video Recorder,收集硬盘录像机) SoC 芯片首要用于视频数据的剖析与存储,功能相对单一,但因为多与 IPC 结合使用,市场增进也较快。


平日情形下,安防视频监控模拟摄像机的焦点部件包罗一颗图像传感器和一颗 ISP 芯片,安防视频监控收集摄像机的焦点部件包罗一颗图像传感器和一颗 IPC SoC 芯片。单从国内来看,将来国内视频监控行业增速仍将连结 12%-15%摆布的水平增进,个中收集监控设备增进更为敏捷,相关芯片产物需求十分兴旺。


安防 AI 芯片市场上,除了传统芯片以及安防厂商,还有大量的创业企业在涌入。国外芯片厂商首要有英伟达、英特尔、安霸、TI、索尼、特威、三星、谷歌等;国内厂商首要有海思(华为)、国科微、中星微、北京君正、富瀚微、景嘉微、寒武纪、深鉴科技、云天励飞、中科曙光等。英伟达、英特尔等企业凭借着通用处理器以及物联网解决方案的优势,历久与安防巨头如海康、大华、博世等连结慎密关联;国内寒武纪、地平线、云天励飞等企业,都有 AI 芯片产物面世,海思自己就有安防摄像机 SoC 芯片,在新到场 AI 模块之后,竞争力进一步提拔。



从安防行业成长的趋势来看,跟着 5G 和物联网的快速落地,“云边连系”将是行业最大的趋势,云端芯片国内企业估计很难有所冲破,然则边缘侧尤其是视频处理相关 AI 芯片照样有较大潜力,国产化替代将加快。但也看到,AI 芯片离在安防范畴实现大规模快速落地仍有距离。除了功耗和算力约束外,工程化难度大也是困扰行业的主要身分,尤其是在安防这种财富链长而高度碎片化的财富,新手艺落地需要长时间的储蓄与打磨,以及人力资源的络续投入。


5、智能家居


智能家居近年来也成为人工智能主要的落地场景。从手艺应用上讲,人类 90%的信息输出是经由语音,80%的是经由视觉,智能家居范畴应用最多的就是智能语音交互手艺。近年来,恰是看到语音交互手艺与智能家居深度融合的潜力,谷歌、苹果、微软均将其作为进入智能家居范畴的主要切进口,发布了多款软硬件平台,如亚马逊推出的智能音箱设备。国内智能语音龙头企业科大讯飞较早就切入了该范畴,结合地产商推出了硬件平台魔飞(MORFEI)平台,电视、咖啡机、电灯、空调、热水器等产物都能经由融入相关平台实现智能化。


当前,无论是智能音箱照样其他智能家居设备,智能功能都是在云端来实现,但云端存在着语音交互时延的问题,对收集的需求限制了设备的使用空间,并且由此还带来了数据与隐私危机。为了让设备使用场景不受局限,用户体验更好,端侧智能已成为一种趋势,语音 AI 芯片也随之切入端侧市场。国内首要语音手艺公司凭借自身在语音识别、天然说话处理、语音交互设计等手艺上的储蓄,起头转型做 AI 语音芯片集成及供应语音交互解决方案,包罗云知声、出门问问、思必驰以及 Rokid。


市场上主流的 AI 语音芯片,一样都内置了为语音识别而优化的深度神经收集加快方案,以实现语音离线识别。跟着算法的精进,部门企业的语音识别能力获得了较快提拔,尤其是在远场识别、语音剖析和语义懂得等方面都取得了主要进展。云知声在 2018 年 5 月,推出语音 AI 芯片雨燕,并在研发多模态芯片,以适应物联网场景,今朝公司芯片产物已经普遍用于智能家电如空调之中;出门问问也在 2018 年推出了 AI 语音芯片模组“问芯”MobvoiA1;Rokid 也发在 2018 年发布了 AI 语音芯片 KAMINO18;思必驰行使其声纹识别等手艺优势,2019 岁首推出基于双 DSP 架构的语音处理专用芯片 TH1520,具有完整语音交互功能,能实现语音处理、语音识别、语音播报等功能。



因为语音芯片市场过于细碎,需要企业凭据场景和贸易模式需要设计出芯片产物,这对传统的通用芯片企业的贸易模式是一种推翻,乃至于在 2018 年以前都很少有芯片巨头进入该范畴,这也给了国内语音芯片企业较大的施展空间。而对算法公司来说,经由进入芯片市场,进而经由解决方案直接面向客户和应用场景,经由实战数据来练习和优化算法。


6、机械人


机械人是人工智能行业最早的落地形态,也是如今和未来主要的应用偏向。机械人首要包罗两类——制造情况下的工业机械人和非制造情况下的办事机械人。工业机械人首要是面向工业范畴的多关节机械手或多自由度机械人。办事机械人则是除工业机械人之外的、用于非制造业并办事于人类的各类进步机械人。


跟着云物移大智等信息及智能化手艺的成长,机械人在某些范畴的工作效率高于人类,并在工业和办事场景中获得了大量应用。据国际机械人联盟统计,2017 年,全球工业机械人产量达到 38.1 万台,同比增进 30%,估计 2018-2021 年全球工业机械人产量将连结 10%以上增速增进,2021 年产量估计将达到 63.0 万台。中国是全球最大的工业机械人生产国,2017 年产量达到 13.79 万台,同比大幅增进 60%。办事机械人首要用于物流、防务、民众办事、医疗等范畴,固然规模不大,然则增进敏捷。2017 年全球产量为 10.95 万台,同比大幅增进 85%。估计 2018 年全球专业办事机械人产量将达到 16.53 万台,同比增进 32%,2019-2021 年平均增速将连结在 21%摆布。


机械人尤其是国内财富规模的快速扩大,将大幅带动国内机械人相关智能芯片财富的成长。机械人由掌握、传感、驱动和电源四大装配组成,个中掌握装配是机械人的“大脑”,焦点是 AI 芯片。机械人芯片需要具备壮大的数据较量、自立判断思虑和执行能力,国外厂商如高通、英特尔、英伟达都在积极布置该范畴,国内企业今朝处于追赶状况,相关企业包罗瑞芯微、珠海全志、炬力等。



三、AI芯片行业财富链及贸易模式


半导体行业财富链长,具有资源和手艺壁垒双高的行业特点


半导体行业财富链从上游到粗俗大体可分为:设计软件(EDA)、设备、材料(晶圆及耗材)、IC设计、代工、封装等。


Fabless与IDM厂商负责芯片设计工作,个中IDM厂商是指集成了设计、制造、封装、发卖等全流程的厂商,一样是一些科技巨头公司,Fabless厂商比拟IDM规模更小,一样只负责芯片设计工作。


分工模式(Fabless-Foundry)的显现首要是因为芯片制程工艺的络续成长,工艺研发费用及产线投资升级费用大幅上升导致一样芯片厂商难以笼盖成本,而 Foundry厂商则是统一对Fabless和IDM的委外订单进行流片,形陋习模化生产优势,包管盈利的同时络续投资研发新的制程工艺,是摩尔定律的首要鞭策者。当前在半导体财富链中,我国在上游软件、设备、高端原材料以及代工制造与全球一线厂商差距较大,而在封装环节拥有长电、华天、通富微等行业前十企业,本年来在IC设计范畴也逐渐涌现了以海思为代表的一批精良企业。



半导体行业贸易模式首要可分为:IP授权与流片生产模式


行业首要存在两种贸易模式IP授权和流片模式。个中在IP授权模式中,IP设计公司将本身设计的芯片功能单元,如:CPU、GPU、DSP、NPU等,授权给其他的IC设计公司,如华为海思麒麟970、980芯片获得了寒武纪NPU的IP授权。被授权方将会向授权方支出一笔授权费来获得IP,并在最终芯片产物发卖中,以芯片最终售价的1%~3%向授权方支出版税。授权费用实现IP斥地成本的笼盖,而版税作为IP设计公司的盈利。但正如手机芯片市场,优质的IP资源往往集中在科技巨头手中,拥有单一或少量IP的创业公司往往因为自身IP竞争力不足、或是难以供应具有综合竞争力的完整解决方案而最终落得被收购或退出市场的境地。


流片生产模式固然前期投入较大,但一款成功的产物将会使公司获得丰厚的利润,一样芯片产物订价接纳8:20原则,即硬件成本:最终产物售价=8:20。该比率或者会随厂商对市场话语权分歧而上下波动,是以一款成功的芯片发卖毛利应在60%以上。但公司是否可以最终实现盈利,还需要在毛利中进一步扣除前期研发费用。



芯片设计需要厂商承担昂贵的EDA费用及奋发的人力成本


芯片整体设计制造流程大体包罗:1)IC设计公司进行芯片架构设计,2)将设计完成的芯片“图纸”文件交由Foundry厂商进行流片,3)裸片将会交由OSAT厂商进行封装,4)产物发卖。研发费用首要包罗:研发团队人力成本、EDA软件及IP授权费用及其他场地房钱、水电费用等。


个中,人力成本占研发成本首要部门,项目斥地效率与资深工程师数量正相关,国内资深芯片设计工程师年薪一样在50~100万元之间。EDA对象是芯片设计对象,是成长超大型集成电路的基石,EDA对象可有效提拔产物良率。今朝,该范畴被国外厂商高度垄断,CR3大于70%。EDA厂商首要是经由向IC设计公司进行软件授权获取盈利,凭据调研,20人的研发团队设计一款芯片所需要的EDA对象采购费用在100万美元/年摆布(包罗EDA和LPDDR等IP购置成本)。英伟达斥地Xavier,动用了2000个工程师,斥地费用共计20以美金,Xlinix ACAP动用了1500个工程师,斥地费用总共10亿美金。



芯片设计手艺储蓄+市场洞察力=芯片产物市场推广成功与否


在IP授权和流片生产两大类贸易模式中,IP授权因为不涉及芯片制造,仅需要考虑研发费用,资金占用相对小、风险较低。流片除前期的研发投入以外,还需要向代工场支出巨额的代工费用,对资金占用极大,需要芯片发卖达到必然量级才能分摊掉前期巨额投入实现盈利,若时代显现流片失败(即流片未达设计盼望机能指标)或许市场推广失利等情形,芯片设计厂商需要承担前期巨额的研发和制造投入、费用损失。芯片单元单子硬件成本首要包含掩膜、封装、测试和晶圆成本,并受到制程工艺、产量、芯单方面积等多身分的影响。


我们简要测算16nm制程工艺下,分歧产量分歧面积的芯片单元单子成本,能够看出芯片单元单子硬件成本随芯单方面积、产量上升逐渐下降。是以,一款芯片可否获得恢弘的市场承认,并拥有较长的产物生命周期,实现芯片产物的规模发卖和生产显著决意了企业的盈亏情形。



四、国表里AI芯片企业融资概况


从2012年起头,英伟达将其GPU产物应用于AI并交运算应用中,人们意识到了AI芯片的伟大潜力,传统半导体行业巨头、科技巨头和浩瀚创业团队纷纷到场到该范畴的产物研发中来。国内创业公司多成立于15年今后,从2017年起头大量的AI较量芯片产物陆续发布,产物慢慢起头实现落地。


传统的半导体巨头和科技巨头也在结构AI芯片范畴,除自立研发以外,基于资金优势经由对外投资收购优质资产及创业团队等手段加快自身的AI芯片买卖成长,典型代表如Intel,大手笔收购了包罗Altera、Nervana、Movidius以及Mobileye在内的多家AI芯片企业,阿里巴巴也经由先后投资、收购结构AI芯片的斥地。



国内大量的AI芯片创业公司都是在2015-2017年成立,2018年新增企业数量削减。资源方面,受到宏观经济影响固然行业内投融资事件比拟2017年同比增进了32%,但行业整体投融资金额骤减,但头部企业在2018年依然持续获得投资人青睐,多家企业缔造了估值新高。



五、国表里 AI 芯片厂商概览


1、整体排名


近年来,各类势力均在发力 AI 芯片,介入者包罗传统芯片设计、IT 厂商、手艺公司、互联网以及初创企业等,产物笼盖了 CPU、GPU、FPGA 、ASIC 等。在市场调研机构 Compass Intelligence 2018年发布的 AI Chipset Index TOP24 榜单中,前十依然是欧美韩日企业,国内芯片企业如华为海思、联发科、Imagination(2017 年被中国资源收购)、寒武纪、地平线机械人等企业进入该榜单,个中华为海思排 12 位,寒武纪排 23 位,地平线机械人排 24 位。



2、芯片企业


芯片设计企业依然是当前 AI 芯片市场的首要力量,包罗英伟达、英特尔、AMD、高通、三星、恩智浦、博通、华为海思、联发科、Marvell(完善)、赛灵思等,此外,还包罗不直接介入芯片设计,只做芯片 IP 授权的 ARM 公司。个中,英伟达、英特尔竞争力最为强劲。


英伟达:AI 芯片市场的向导者,较量加快平台普遍用于数据中心、主动驾驶等场景


英伟达创立于 1993 年,最初的主业为显卡和主板芯片组。其主板芯片组首要客户以前是 AMD,然则在 AMD 收购 ATI 推出自研芯片组之后,英伟达在该范畴的优势就荡然无存。于是,公司周全转向到 GPU 手艺研发,同时进入人工智能范畴。2012 年,公司神经收集手艺在其 GPU 产物的支撑下取得重猛进展,并在较量机视觉、语音识别、天然说话处理等方面获得普遍应用。


2016 年,全球人工智能成长加快,英伟达敏捷推出了第一个专为深度进修优化的 Pascal GPU。2017年,英伟达又推出了机能比拟 Pascal 提拔 5 倍的新 GPU 架构 Volta,同时推出神经收集推理加快器TensorRT 3。至此,英伟达完成了算力、AI 构建平台的布置,也理所当然成为这一波人工智能高潮的最大受益者和向导者。公司的计谋偏向包罗人工智能和主动驾驶。


人工智能方面,英伟达面向人工智能的产物有两类,Tesla 系列 GPU 芯片以及 DGX 练习办事器。


Tesla 系列是专门针对 AI 深度进修算法加快设计 GPU 芯片,DGX 则首要是面向 AI 研究斥地人员设计的工作站或许超算系统。2018 年,公司包含这两款产物的数据中心买卖收入大幅增进 52%,个中Tesla V100 的强劲发卖是其收入的首要起原。


主动驾驶方面。英伟达针对主动驾驶等场景,推出了 Tegra 处理器,并供应了主动驾驶相关的对象包。2018 年,基于 Tegra 处理器,英伟达推出了 NVIDIA DRIVE AutoPilot Level 2+,并博得了丰田、戴姆勒等车企的主动驾驶订单。同时,2018 年,公司也正在积极鞭策 Xavier 主动驾驶芯片的量产。


值得存眷的是,英伟达还正在经由投资和并购体式持续增强在超算或许数据中心方面的买卖能力。


2019 年 3 月,英伟达传播将斥资 69 亿美元收购 Mellanox。Mellanox 是超算互联手艺的早期研发和介入者。经由与 Mellanox 的连系,英伟达将具备优化数据中心收集负载能力的能力,其 GPU 加快解决方案在超算或许数据中心范畴的竞争力也将获得显著提拔。


英特尔加快向数字公司转型,经由并购+生态优势发力人工智能


英特尔作为传统的 CPU 设计制造企业,在传统 PC、办事器市场有着绝对的统治力。跟着互联网时代的到来以及小我电脑市场的饱和,公司也在起头加速向数字公司转型。尤其在人工智能鼓起之后,英特尔凭借着手艺和生态优势,打造算力平台,形成全栈式解决方案。


英特尔首要产物为 CPU、FPGA 以及相关的芯片模组。固然 CPU 产物在练习端的应用效率不及英伟达,但推理端优势较为显着。英特尔认为,将来 AI 工作周期中,推理的时长将是练习时长的 5 倍甚至 10 倍,推理端的芯片需求也会放量。同时,即使是云端练习,GPU 也需要同 CPU 进行异构。


今朝,英特尔在人工智能芯片范畴首要经由三条路径:1)经由并购快速储蓄人工智能芯片相关的手艺和人才,并敏捷完成整合。英特尔在收购了 Altera 后,还先后收购了 Nervana、Movidius 与 Mobileye等初创企业。在完成上述一系列并购之后,英特尔设立了 AI 事业群,整合了 Xeon、Xeon Phi、Nervana、Altera、Movidius 等买卖和产物,同时将原有的主动驾驶买卖板块并入 Mobileye。2)竖立多元的产物线。今朝,英特尔正建构知足高机能、低功耗、低延迟等差别化芯片解决方案,除了 Xeon 外,包罗可支撑云端办事 Azure 的 Movidius VPU 与 FPGA。3)经由较量平台等产物,供应壮大的整合能力,优化 AI 较量系统的负载,供应整体解决方案。


在英特尔收购的这些企业中,除了前面已经提到的 Altera、Mobileye 之外,Nervana 也非常值得存眷。2016 年 8 月,英特尔斥资跨越 3.5 亿美元收购这家员工人数不跨越 50 人的创业公司,然则经由不到三年的成长,这家公司已经成为英特尔 AI 事业部的主体。依托 Nervana,英特尔成功在 2017年 10 月推出了专门针对机械进修的神经收集系列芯片,今朝该芯片已经升级至第二代,估计 2019年下半年将正式量产上市,该芯片在云端上估计能和英伟达的 GPU 产物一较高下。



3、IT 及互联网企业


AI 鼓起之后,互联网及 IT 企业凭借着在各大应用场景上手艺和生态储蓄,也在积极拓展 AI 相关市场,个中 AI 芯片是布置重点之一。相较而言,互联网企业凭借着数据和场景先天优势,在 AI 算法和芯片范畴优势更为显着,如美国谷歌、国内的 BAT。IT 企业如 IBM,在人工智能范畴较早起头研究,2018 年年中曾经推出专门针对深度进修算法的原型芯片。


谷歌:TPU 芯片已经实现从云到端,物联网 TPU Edge 是当前结构重点


谷歌可谓是 AI 芯片行业的一匹黑马,然则竞争力强劲。谷歌拥有大规模的数据中心,起先同其他厂商的数据中心一般,都采用 CPU+GPU 等异构架构进行较量加快,用来完成图像识别、语音搜刮等较量办事。然则,跟着买卖量的快速增进,传统的异构模式也很难撑持宏大的算力需求,需要索求新的高效较量架构。同时,谷歌也需要经由研发芯片来拓展 AI 平台 TensorFlow 的生态。是以,2016年,Google 正式发布了 TPU 芯片。


从谷歌 TPU 的素质来看,它是一款 ASIC(定制芯片),针对 TensorFlow 进行了特别优化,是以该产物在其他平台上无法使用。第一代 Cloud TPU 仅用于自家云端机房,且已对多种 Google 官方云端办事带来加快结果,例如 Google 街景图办事的文字处理、Google 相簿的照片剖析、甚至 Google搜寻引擎办事等。Cloud TPU 也在快速改版,2017 年推出第二代,2018 年推出第三代芯片 TPU 3.0。


同时,谷歌对 TPU 的立场也更为开放,之前首要是自用,今朝也在对用户开放租赁买卖,但没有供应给系统商。


除了云端,谷歌针对边缘端推理需求快速增进的趋势,也在斥地边缘 TPU 芯片。2017 年 11 月,Google 推出轻量版的 TensorFlow Lite(某种水平庖代此前的 TensorFlow Mobile),使得能耗有限的移动设备也能支撑TensorFlow,2018年推出的Edge TPU芯片便是以执行TensorFlow Lite为主,而非 TensorFlow。Edge TPU 机能固然远不如 TPU,但功耗及体积大幅缩小,适合物联网设备采用。


Edge TPU 能够本身运行较量,不需要与多台壮大较量机相连,可在传感器或网关设备中与尺度芯片或微掌握器配合处理 AI 工作。


按照谷歌的规划,Edge TPU 将供应给系统商,开放水平将进一步提拔。若是 Edge TPU 推广顺利,支撑的系统伙伴将进一步增多,谷歌将尽快推出下一代 Edge TPU 产物。即使推广不顺利,Google也或者自行推出 Edge 网关、Edge 设备等产物。



阿里巴巴:推出自研神经收集处理芯片,同时加快对 AI 企业投资结构


阿里巴巴作为国内 AI 范畴的领军企业,在底层算力、算法手艺以及应用平台方面都有较强储蓄。同Google 雷同原因,阿里巴巴也在近年来起头斥地 AI 芯片,同时加大对相关范畴的投资结构。


2017 年,阿里巴巴成立阿里达摩院,研究范畴之一就是 AI 芯片手艺。2018 年 4 月,阿里达摩院对外公布正研发一款 Ali-NPU 神经收集芯片,估计将在 2019 年下半年问世。这款芯片将首要应用于图像视频剖析、机械进修等 AI 推理较量。


阿里巴巴在自研 AI 芯片之前,首要在经由投资的体式结构 AI 芯片范畴。今朝,寒武纪、深鉴科技、杭州中天微等都有阿里巴巴的入股,个中 2016 年 1 月份还成为了 AI 芯片设计企业杭州中天微的第一大股东。



百度:经由自研、合作以及投资等多种体式结构 AI 芯片


百度作为搜刮企业,其对 AI 芯片的需求更为明确。早在 2011 年,百度就在 FPGA 和 GPU 进行了大规模布置,也起头在 FPGA 的根蒂上研发 AI 加快器来知足深度进修运算的需要。此后,百度就络续经由合作、投资和自研的体式来推进该买卖。


1)增强同芯片设计及 IP 企业合作。2017 年 3 月,百度发布了 DuerOS 聪明芯片,并与紫光展锐、ARM、上海汉枫杀青计谋合作。这款芯片搭载了对话式人工智能把持系统,能够付与设备可对话的能力,能普遍用于智能玩具、蓝牙音箱、智能家居等多种设备。2017 年 8 月,百度又与赛思灵(Xilinx)发布了 XPU,这是一款 256 核、基于 FPGA 的云较量加快芯片。同在 2017 年,百度同华为杀青合作,鞭策终端 AI 芯片的落地。


2)介入 AI 芯片企业投资。2018 年 2 月 5 日,美国初创公司 Lightelligence 公布获得了 1000 万美元种子轮融资,由百度风投和美国半导体高管财团领投。Lightelligence首要行使基于光学的新手艺,来加快人工智能的工作负载,经由光子电路的新兴手艺来加快信息处理。


3)自研芯片也正在加快布置。2018 年 7 月,百度正式发布了自研的 AI 芯片“昆仑”,这是其时国内第一款云端全功能 AI 芯片,个中包含练习芯片昆仑 818-300,推理芯片昆仑 818-100。昆仑 AI 芯片是基于百度 CPU、GPU、FPGA 的 AI 加快器研发,可以在 100W 摆布的功耗下,供应高达 260 万亿次/秒的运算速度,算力处于业界领先水平。



4、创业企业


寒武纪:同时发力终端和云端芯片,手艺综合实力较强


寒武纪发源于中科院,是今朝全球领先的智能芯片公司,由陈天石、陈云霁兄弟结合开办,团队成员首要人员组成也来自于中科院,个中还有部门介入龙芯项目的成员。2018 年 6 月公司,公司获得数亿美元投资,此轮融资之后,寒武纪科技估值从上年的 10 亿美金大幅上升至 25 亿美元。公司是今朝国内为数不多的同时具备云端和终端 AI 芯片设计能力的企业。


公司最早发力的是终端芯片,首要为 1A 系列,包罗 1A、1H8 和 1H16,公司经由 IP 授权的模式赋能终端或许芯片设计企业,今朝首要合作伙伴包罗华为,个中麒麟 970 就采用其 1A 处理器。此外,公司还推出了面向低功耗场景视觉应用的寒武纪 1H8,高机能且拥有普遍通用性的寒武纪 1H16,以及用于终端人工智能产物的寒武纪 1M。2018 年 9 月,华为发布的麒麟 980 依然集成了优化版的寒武纪 1H 新一代智能处理器。


公司云端芯片也取得较大冲破。云端芯片一向是英特尔、英伟达等公司的领地,国内企业很难进入。2018 年 5 月,寒武纪推出算力达到 128Tops 的 MLU 100 云端智能芯片,可用于练习和推理。MLU100比拟传统的 GPU 和 CPU 芯片,MLU 芯片拥有显著的机能功耗比和机能价钱比优势,适用局限笼盖了图像识别、安防监控、智能驾驶等多个重点应用范畴。


2019年6月20日,寒武纪正式推出了第二代云端AI芯片——思元270(MLU270)及板卡产物。思元270采用的是寒武纪自立研发的MLUv02指令集,可支撑视觉、语音、天然说话处理以及传统机械进修等高度多样化的人工智能应用,更为视觉应用集成了充实的视频和图像编解码硬件单元。具体机能指标方面,思元270芯片处理非稀少深度进修模型的理论峰值机能提拔至上一代MLU100的4倍,达到了128TOPS(INT8);同时在定点练习范畴取得要害性冲破,兼容INT4和INT16运算,理论峰值离别达到256TOPS和64TOPS;支撑浮点运算和夹杂精度运算。



综合来看,公司在 AI 芯片方面竞争力较强。公司拥有本身的处理器架构和指令集,并且经由硬件神经元虚拟化、斥地通用指令集、运用稀少化处理器架构解决了 ASIC 用于深度进修时存在的云端算力的挑战、能效瓶颈、手机端和云端超大规模较量场景应用问题。


地平线机械人:公司AI芯片和较量平台在嵌入式及智能驾驶范畴具备优势


地平线成立于 2015 年,首要从事边缘人工智能芯片和较量平台买卖,场景聚焦于智能驾驶和 AIoT边缘较量。2018 年起,公司逐渐实现产物化落地。2019 年 2 月,公司官方公布已获得 6 亿美元 B轮融资,SK 中国、SK Hynix 以及数家中国一线汽车集体(与旗下基金)结合领投。B 轮融资后,地平线估值达 30 亿美元。


2017 年 12 月,地平线发布中国首款全球领先的嵌入式人工智能视觉芯片征程(Journey)系列和向阳(Sunrise)系列。向阳 1.0 处理器面向智能摄像优等应用场景,具备在前端实现大规模人脸检测跟踪、视频构造化的处理能力,可普遍用于聪明城市、聪明零售等场景。征程 1.0 处理器面向智能驾驶,具备同时对行人、灵活车、非灵活车、车道线、交通标记牌、红绿灯等多类方针进行精准的实时检测与识其余处理能力,同时知足车载严苛的情况要求以及分歧情况下的视觉感知需求,可用于高机能 L2 级其余高级驾驶辅助系统 ADAS 。


2018 年 2 月,地平线自立研发的高清智强人脸识别收集摄像机,搭载地平线向阳人工智能芯片,供应基于深度进修算法的人脸抓拍、特征抽取、人脸特征值比对等功能。能够在摄像机端实现人脸库最大规模为 5 万的高机能人脸识别功能,适用于聪明城市、聪明零售等多种行业。


2018 年 4 月,公司发布地平线 Matrix1.0 主动驾驶较量平台。今朝已经更新到机能更强的升级版本,地平线 Matrix 主动驾驶较量平台连系深度进修感知手艺,具备壮大的感知较量能力,可以为 L3 和 L4 级别主动驾驶供应高机能的感知系统。地平线 Matrix 主动驾驶较量平台已向世界顶级Robotaxi 厂商大规模供货,成功开创了中国主动驾驶芯片产物出海和贸易化的先河。


比特大陆:区块链矿机霸主进军AI范畴


比特大陆是全球领先的算力芯片设计企业,其致力于斥地高机能、低功耗、全定制的算力芯片,是全球少数几家把握最进步7nm制程设计能力并可规模量产7nm芯片的公司之一。


今朝,比特大陆的产物首要应用于区块链和人工智能两个范畴,区块链矿机的市场份额高达74.5%。2017年,比特大陆正式发布了面向人工智能范畴的子品牌——“算丰”,并推出了针对深度进修推理的第一代云端AI芯片BM1680。2018年3月,比特大陆快速推出了第二代云端人工智能芯片BM1682,2018年9月份推出了面向终端的AI芯片产物BM1880,并规划于2019年推出其第三代云端AI芯片BM1684。


此外,比特大陆基于其芯片,在云端还研发了加快卡、办事器等产物,在终端推出了较量棒、模组、斥地板等产物,为分歧行业的客户供应适应多种应用场景的产物。


在项目落处所面,比特大陆基于云端AI芯片的人脸闸机助力福建618展会与厦门98投洽会成功举办,累计通行跨越30万人次,通道示意不乱靠得住,状况精巧。在第二届数字中国峰会安保系统中,搭载比特大陆自研芯片的算丰人工智能办事器与海康威视人脸识别算法相融合,全程应用于峰会平安保障工作,3D人脸轨迹系统为日均6万余人次、累计150余万张人脸图片的海量剖析供应算力支撑。


在合作方面,比特大陆与福建本地企业合资成立福建省算域大数据科技有限公司,负责福州城市大脑的投资、扶植与运营,为日后福州AI财富成长扶植好根蒂举措。比特大陆还作为首批企业到场海淀城市大脑科技财富联盟,助力海淀“城市大脑”扶植,后还与海淀区签署了环绕“智能处理芯片应用场景扶植”的重大项目合作意向书,鞭策算力芯片应用落地。此外,公司还与东亚最大的游戏云平台优必达( Ubitus )合作,配合扶植公司位于日本、台湾的机房,基于“算丰”芯片,公司协助Ubitus配合斥地较量机视觉相关的AI功能。


嘉楠科技:转型AI芯片厂商


作为仅次于比特大陆的全球第二大比特币矿机厂商,近几年以来,嘉楠科技也起头积极转型AI芯片厂商,今朝已把握集AI芯片研发、AI算法、构造、SoC集成及流程实现一体化等综合手艺,以AI芯片为焦点竖立AI生态链,以生态伙伴需求为依归,为生态伙伴供应一揽子AI办事方案。

 

嘉楠科技于2013年发布了全球首款基于ASIC芯片的区块链较量设备,引领行业进入ASIC时代。2015年,嘉楠科技获清华长三角研究院投资,并作为重点项目被引进至科技重镇杭州。同年,嘉楠科技成功实现28nm制程工艺芯片的量产,迈出了AI芯片量产的第一步。

 

嘉楠科技在2016年实现了16nm芯片量产,一举经由国度高新手艺企业认定。并于2017年被正式评定为杭州市高科技独角兽企业。2018年,嘉楠科技连获两项全球重大手艺冲破,实现量产全球首个基于自研的7nm芯片,以及量产全球首款基于RISC-V 自研商用边缘智能较量芯片。


2018年9月,嘉楠科技推出了第一代边缘侧AI芯片勘智K210,经由完全自立研发的神经收集加快器IP,同时具备机械视觉和语音识别能力,能够在超低功耗下进行高速卷积神经收集较量。随后勘智K210很快在无感门禁、智能门锁、病虫害防治等范畴获得应用。


在项目落处所面,嘉楠科技供应的无感门禁系统已经获得了软通动力总部大楼(共有集体员工5万人)的采用,今朝已实现每个监控点日均2000次的识别数量。嘉楠科技供应的智能电表解决方案也被亚洲最大的社区——贵阳南明花果园社区采用,实现了对社区10万多个传统电气表的智能化升级革新,解决传统人工入户抄表模式的“高成本、低效率、难入户”等问题。在治理林业病虫害的买卖场景中,嘉楠与百度、林业大学合作,将搭载8通道高机能麦克风阵列的音频处理硬件插入树中,以虫子嗑咬树植的声音为音源,判断害虫的位置。同时,还可行使K210芯片的视觉能力,将芯片置入40mm见方的智能盒子,经由图像分类和检测的方式判断视野内是否有害虫存在。这种视听综合判断的方式有效提拔了判断的效率与精度,在林业、农田都有普遍的应用场景。同时,该智能盒子不需要外接供电设备,只需要电池供电即可,比拟传统的设备更为轻量化,使用成本更低廉。


在生态合作方面,2019年5月29日,嘉楠结合百度大脑发布PaddlePi-K210。该产物作为一款AI斥地板,尺寸仅为3 X3cm,相当于一个火柴盒巨细,具有1Tops的彭湃算力,同时兼具300mw的极低功耗,即使加上摄像头和屏幕也只有1w的功耗,充裕适配边缘侧设备对于极低功耗的买卖场景需求。同时,该产物打通PaddlePaddle模型设备端布置解决方案。斥地者不需要硬件更改,使用公版模具就能够一向支撑用户做到产物小样阶段,对斥地者十分友好。2018年9月21日,嘉楠科技还与天津市西青区人工智能财富基地签约AI项目。此次人工智能财富集中签约重点项目有平台类、芯片设计、软件研发类、应用类。涉及智能网联车、聪明医疗、聪明城市、智能制造多小我工智能范畴。


编纂:芯智讯-浪客剑

综合自:安然证券、艾瑞咨询等机构研报及相关收集资料

自媒体微信号:ii77扫描二维码关注公众号
爱八卦,爱爆料。
小编推荐
  1. NO.1 关注双相障碍的诊断延迟现象 | 研究速递

    医脉通导读 双相障碍诊断延迟的现象 十分遍及。数据显露,约70%的双相障碍患者自首次就诊至获得准确诊断之间的延迟长达8年摆布。 本项研究显露

  2. NO.2 血液垃圾的天敌!中年以后还不吃,吃亏的就是你

    色斑,血脂高,都是血液垃圾造成的,消灭血液垃圾,才能让你的血液活起来。 下面每一种食物都是血液垃圾的天敌,记得要常吃! 青椒 防止血液

  3. NO.3 能够早期发现癌症的体检项目

    医学指导:中山一院胃肠外科 马晋平主任医师 医疗特长:擅长胃肠外科临床常见的胃癌尺度和扩大根治术、各部位结肠癌腹腔镜术、直肠癌TME根治术

  4. NO.4 深入解读:左氧氟沙星药品说明书

    作者:Gcplive 起原:药评中心 (转载不得点窜图片) 氟喹诺酮类抗菌药物首要经由按捺细菌的DNA扭转酶(细菌拓扑异构酶II)的活性,阻止细菌DNA的

  5. NO.5 化痰、止咳利器—化橘红,为何能从明清宫廷贡品受宠到今天?

    大河报《天天健康》官方微信 介绍指数 ★★★★★ 在方才曩昔的教师节,好多先生收到了康乃馨。 执教多年的冯先生,却收到了 10盒橘星化橘红。

  6. NO.6 木耳这样泡,让7岁女孩多器官衰竭!千万别大意,家里有的赶紧

    在浙大儿院湖滨院区综合ICU,7岁的雯雯躺在病床上,面庞苍白,身边机械发出滴滴的运出声。正本过了这个暑假,雯雯就要去读小学了。 “雯雯的病

  7. NO.7 5g时代,如何为健康“代盐”?

    全民健康生活体式嘉韶华 2019.07.01—10.08 长按识别二维码介入 比来,央视各频道在持续播放一支减盐控盐主题公益告白,向全社会宣传减盐控盐理念

  8. NO.8 周杰伦,男人四十

    本文字数:2591|估计4分钟读完 新歌爆红,与音乐和周董有关,更因为芳华情怀叠加了贸易策略与社交推手,适可而止,水到渠成。 记者丨 杨松 鄢

Copyright2018.爱妻自媒体资讯站,让大家及时掌握各行各业第一手资讯新闻!