>

从“AI芯片四杰”探寻我国人工智能芯片行业机遇

- 编辑:澳门金沙国际网站 -

从“AI芯片四杰”探寻我国人工智能芯片行业机遇

澳门金沙国际网站 1

前 言:

近日,关于人工智能的话题不断升温。

当前,在算力、算法和大数据三驾马车的支撑下,全球人工智能进入第三次爆发期。然而,作为引爆点的深度学习算法,对现有的算力尤其是芯片提出了更为苛刻的要求。

马化腾、董明珠等也屡屡提到人工智能与芯片产业的发展。其中马化腾也提到了腾讯未来将对AI芯片的投资。

在AI场景中,传统通用CPU由于计算效率低难以适应AI计算要求,GPU、FPGA以及ASIC等AI芯片凭借着自身特点,要么在云端,要么在边缘端,有着优异表现,应用更广。

中国工程院院士、中星微电子集团创建人兼首席科学家邓中翰也公开表示“人工智能是新一轮科技革命和产业变革的重要驱动力量。人工智能与航天、军工等重要领域一样,必须实现底层核心芯片的自主可控,才能确保国家安全、公共安全和信息安全。”

从技术趋势看,短期内GPU仍将是AI芯片的主导,长期看GPU、FPGA以及ASIC三大技术路线将呈现并行态势。

事实上,中国芯片产业长期落后于西方,而人工智能赛道方兴未艾,外界普遍认为是弯道超车的好机会。

从市场趋势看,全球AI芯片需求将保持较快增长势头,云端、边缘芯片均具备较大增长潜力,预计未来5年市场增速将接近50%;国内虽然芯片技术差距较大,但随着AI应用的快速落地,AI芯片需求增长可能更为迅速。

AI芯片方兴未艾

澳门金沙国际网站 2

近年来,人工智能备受关注。2016年7月,人工智能首次纳入《“十三五”国家科技创新规划》;2017年7月印发《新一代人工智能发展规划》。有关报告中亦提及:“促进新兴产业加快发展,深化大数据、人工智能等研发应用,培育新一代信息技术、高端装备、生物医药、新能源汽车、新材料等新兴产业集群,壮大数字经济。”由此可见,人工智能将为未来经济发展注入新动能。

分析师|闫磊

有关人士表示,将会把人工智能方面立法列入抓紧研究项目,围绕相关法律问题进行深入的调查论证,努力为人工智能的创新发展提供有力的法治保障。

点击小程序查看千份报告

大众所了解到的人工智能应用及产品包括各种智能音箱、智能汽车、无人机等,但人工智能之所以能够实现智能化,最基础的还是其芯片以及收集的大量数据,芯片提供强大的算力,从而使得机器能够运用大量数据进行“深度学习”以获得某种规律,从而最终根据规律来实现应用的智能化。

▌人工智能芯片发展现状及趋势

由此可见,AI芯片在整个人工智能产业链中占有较为重要的位置。AI芯片可分为通用性芯片、半定制化芯片、全定制化芯片、类脑芯片四种类型。

深度学习算法对芯片要求更为苛刻,通用CPU性价比相对较差

根据清华大学的AMiner团队所发表的2018人工智能芯片研究报告,AI芯片的主流架构经历了一系列的变化。从一个开始最为通用的CPU,到后来随着高清视频、VR、AR游戏等行业的发展,GPU产品取得快速的突破,同时人们发现GPU的并行计算特性恰好适应人工智能算法及大数据并行计算的需求,因此开始尝试使用GPU进行人工智能计算。

经历了60多年的起起伏伏之后,人工智能终于迎来了第三次爆发。

进入2015年后,GPU的性能功耗比不高的特点使其适用场合受到很多限制,业界开始研发针对人工智能的专用芯片,也就是全定制化的ASIC芯片,通过更好的硬件和芯片架构,在计算效率、能耗比上进一步提升。

第三次爆发的核心引爆点是深度学习算法的出现,但其背后的支撑是数据和算力。对整个AI行业来讲,算法、数据和算力三大基本要素中,数据尤其是海量数据的获取和处理难度在下降,算法也在深度学习模型的基础上不断优化,而负责将数据和深度算法统一协调起来的芯片能否获得大的飞跃,成为市场关注的焦点。

行业分析师王树一表示,对于大多数的人工智能芯片公司而言,最终还是要在市场上生存,找到合适的应用场景进行落地,成为大部分人工智能公司发展的必然选择。也因此AI行业的发展已经从以技术驱动逐步发展成为了一个以场景和运用驱动为主的产业,全定制化芯片也越来越受到青睐。

澳门金沙国际网站 3

比特大陆产品战略总监汤炜伟在2018年10月的AI新品发布会上曾分析道,在AI芯片架构变革的背后其实是各行各业对于日益高涨的AI算力需求的急剧提升。互联网的普及以及发展产生了海量的视频、语音、图像、文字等数据,这些数据在传输、储存以及检索等过程中都遇到了诸多难题,行业对于如何能够更好地利用这些数据以满足自身业务需要有着迫切的需求。

深度学习算法对芯片性能需求主要表现在三个方面:

“AI芯片四杰”成型

1.海量数据在计算和存储单元之间的高速通信需求。这不但需要芯片具备强大的缓存和片上存储能力,而且还需要计算和存储单元之间有较大的通信带宽。

王树一表示,当前AI芯片可分为三个梯队,第一梯队已经杀出重围,成为事实行业标配选择的公司;第二梯队仍在竞争,有机会在某些特定场景生存下来,比如国内外很多的公司,不排除有机会有的公司能杀到通用市场,成为巨头;第三梯队,找不到应用场景又没有融到足够过冬钱的公司,将在这次寒冬中逐渐失去活力。

2.专用计算能力需求高。深度学习算法中有大量卷积、残差网络、全连接等特殊计算需要处理,还需要提升运算速度,降低功耗。

据悉,目前在国内AI芯片领域,有四家各具特色的公司被称为“AI芯片四杰”,这四家分别为华为海思、比特大陆、寒武纪和地平线。

3.海量数据自身处理同样也对芯片提出了新的要求,尤其是非结构化数据的增多,对传统芯片结构造成了较大的压力。

比特大陆,这家成立5年多的厂商,一路将区块链芯片的工艺从55nm推进到7nm,全球市场份额占70%以上,其招股书显示,在2017年以及2018年上半年营收均超过25亿美金,成为仅次于海思的国内第二大IC设计厂商,估值达到150亿美金。

通用CPU在深度学习中可用但效率较低。比如在图像处理领域,主要用到的是CNN,在自然语言识别、语音处理等领域,主要用到的是RNN,虽然这两种算法模型有着较大的区别,但本质上都是向量和矩阵运算,主要是加法和乘法,辅助一些除法和指数运算。

区块链芯片只是比特大陆的广为人知的一面,相对低调的是其专注安防领域的AI芯片。比特大陆在2015年组建芯片研发团队,定下了研发面向深度学习的张量处理器的战略,此后,经过一年多的研发,分别在2017年和2018年推出两代云端AI芯片,对外发售基于芯片的深度学习板卡和高性能服务器,专注在安防场景。

传统CPU可用于做上述运算,但是CPU还有大量的计算逻辑控制单元,这些单元在AI计算中是用不上的,造成了CPU在AI计算中的性价比较低。

在安防这一应用场景下,比特大陆研发了用于视频结构化的算丰高密度智能服务器SA3,这一产品能够处理约90路1080P的视频数据,已被用于公安、交通等场景的视频智能分析、视频AI云的技术设施和算力服务,以及园区、广电等场景的视频智能分析。日前比特大陆已与福州市政府部门、中移杭研、联通网研院等达成战略合作,基于其AI芯片的算力云和服务器、边缘计算盒子等产品不断商用落地。

澳门金沙国际网站 4

寒武纪在过去一年,也做了不少事情。例如其云端智能芯片MLU100及板卡正式面世,完成新一轮融资估值达到25亿美金,再如参加民营企业座谈会、寒武纪1H加持华为麒麟980等。

GPU、FPGA以及ASIC各有优劣,成为当前AI芯片行业的主流

此前,寒武纪携八家合作伙伴和端云全线亮相2018安博会,也预示了对进军安防行业的决心。寒武纪联合星宸半导体/SigmaStar(原MStarSmartCamera事业部)和的卢深视(国内三维视觉领域新锐公司)推出了集成寒武纪终端智能处理器IP产品的系统解决方案,以芯片 场景展示实际应用。

正因为CPU在AI计算上的弱点,给了可以实现海量并行计算且能够对进行计算加速的AI芯片留下了市场空间。

地平线最近因为其6亿美金融资又上头条,估值也上涨至30亿美金,本轮融资的领头方来自SK海力士。根据官方消息,未来一年将在汽车级处理器架构以及第三代处理器架构方面取得突破。

从广义上讲,面向AI计算的芯片都可以称为AI芯片,包括基于传统架构的GPU、FPGA以及ASIC,也包括正在研究但离商用还有较大差距的类脑芯片、可重构AI芯片等。

地平线与其他三家芯片企业不同之处在于,创始团队大多算法行业出身,因此公司一直对外宣称要走“软硬件一体化”的路子,算法芯片两手抓。在过去几年中,地平线相继推出了征程、旭日两款芯片,以及一个自动驾驶计算平台Matrix,其他产品还未出现在公开信息中。

云端训练芯片市场较为集中,而推理市场云、边两端均有大量企业参与按照部署位置划分,AI芯片可以分为云端芯片和边缘端芯片。

2017年底发布的AI视觉芯片“旭日1.0”,标志着他们正式跻身智慧城市及智慧零售领域。地平线认为,他们的机会在于将他们在自动驾驶领域的芯片和算法能力,包括基于芯片对海量数据的实时处理,以及大规模强化训练和模型优化方面的能力,延伸到视频安防市场。

云端芯片部署位置包括公有云、私有云或者混合云等基础设施,主要用于处理海量数据和大规模计算,而且还要能够支持语音、图片、视频等非结构化应用的计算和传输,一般情况下都是用多个处理器并行完成相关任务;

最后压轴的是估值达到350亿美金的华为海思,除了一系列麒麟手机芯片外,海思在智慧城市领域也耕耘日久。2018年10月10日,在2018华为全联接大会上,海思官宣 All in AI,发布了面向全场景的技术解决方案,是包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案。

边缘端AI芯片主要应用于嵌入式、移动终端等领域,如摄像头、智能手机、边缘服务器、工控设备等,此类芯片一般体积小、耗电低,性能要求略低,一般只需具备一两种AI能力。

具体来说,基于海思的“达芬奇”架构,海思发布了服务器芯片昇腾910和终端芯片昇腾310,两款新品均不会对外单独销售,最终将以AI加速卡、加速模块、服务器和一体机等模式对外销售。

澳门金沙国际网站 5

作为资金和科研实力较为雄厚的厂商,华为的野心在于建立起自己的一整套从由底层芯片到上层应用的AI生态,而不仅仅是单纯的芯片厂商。

澳门金沙国际网站,按照承担的任务分,AI芯片可以划分为训练芯片和推理芯片。

以上四家AI芯片公司,其战略特色各有不同,其中有集中于具体场景的,也有要做AI生态的,王树一表示两种类型公司并不矛盾,一方面要商业化落地,必然要与具体应用场景结合,只有达到一定的规模,全定制的ASIC才有经济效益,所以也有可能是通用芯片用到专用场景。

训练是指通过大量标记过的数据在平台上进行“学习”,并形成具备特定功能的神经网络模型;推理则是利用已经训练好的模型输入新数据通过计算得到各种结论。

对于做生态的企业,除了“PPT”公司,大约还有两种,一种已经杀出重围的头部公司,比如国外的英伟达、英特尔以及赛灵思;另一种是将来的杀出重围者。

训练芯片对算力、精度要求非常之高,而且还需要具备一定的通用性,以适应多种算法的训练;推理芯片更加注重综合能力,包括算力能耗、时延、成本等因素。

未来“AI芯片四杰”如何能在占据先机的国外巨头的竞争下实现弯道超车,仍然需要时间和市场的考验。

综合来看,训练芯片由于对算力的特殊要求,只适合在云端部署,而且多采用的是“CPU 加速芯片”类似的异构模式,加速芯片可以是GPU,也可以是FPGA或者是ASIC专用芯片。

AI训练芯片市场集中度高,英伟达和谷歌领先,英特尔和AMD正在积极切入。推理在云端和终端都可进行,市场门槛相对较低,市场参与者较多。

云端推理芯片除了传统的英伟达、谷歌、赛灵思等芯片大厂外,Groq等国际新兴力量也在加入竞争,国内寒武纪、比特大陆也有不错表现;终端推理芯片市场较为分散,场景各异,参与者除了英伟达、英特尔、ARM和高通之外,国内企业如寒武纪、地平线、云知声、云天励飞等在各自细分领域均有所建树。

澳门金沙国际网站 6

澳门金沙国际网站 7

GPU擅长云端训练,但需与CPU异构、功耗高且推理效率一般

GPU(GraphicsProcessingUnit)是一种由大量核心组成的大规模并行计算架构,专为同时处理多重任务而设计的芯片。

正是由于其具备良好的矩阵计算能力和并行计算优势,最早被用于AI计算,并在云端获得大量应用。

GPU中超过80%部分为运算单元,而CPU仅有20%,因此GPU更擅长于大规模并行运算。以英伟达的GPUTITANX为例,该产品在深度学习中所需训练时间只有CPU的1/10不到。

但GPU用于云端训练也有短板,GPU需要同CPU进行异构,通过CPU调用才能工作,而且本身功耗非常高。

同时,GPU在推理方面需要对单项输入进行处理时,并行计算的优势未必能够得到很好的发挥,会出现较多的资源浪费。

澳门金沙国际网站 8

FPGA芯片算力强、灵活度高,但技术难度大国内差距较为明显

FPGA(Field-ProgrammableGateArray)即现场可编程门阵列,该芯片集成了大量的基本门电路以及存储器,其灵活性介于CPU、GPU等通用处理器和专用集成电路ASIC之间,在硬件固定之前,允许使用者灵活使用软件进行编程。

FPGA在出厂时是“万能芯片”,用户可根据自身需求,用硬件描述语言对FPGA的硬件电路进行设计;每完成一次烧录,FPGA内部的硬件电路就有了确定的连接方式,具有了一定的功能;输入的数据只需要依次经过各个门电路,就可以得到输出结果。

澳门金沙国际网站 9

FPGA应用于AI有以下优势:

算力强劲。

由于FPGA可以同时进行数据并行和任务并行计算,在处理特定应用时效果更加明显,对于某一个特定的运算,FPGA可以通过编辑重组电路,生成专用电路,大幅压缩计算周期。从赛灵思推出的FPGA产品看,其吞吐量和时延指标都好于CPU和GPU产品。

功耗优势明显。

FPGA能耗比是CPU的10倍以上、GPU的3倍。由于在FPGA中没有取指令与指令译码操作,没有这部分功耗;而在复杂指令集的CPU中仅仅译码就占整个芯片能耗的约50%,在GPU里取指与译码也会消耗10%至20%的能耗。

灵活性好。

使用通用处理器或ASIC难以实现的下层硬件控制操作技术,利用FPGA可以很方便的实现,从而为算法的功能实现和优化留出了更大空间。

澳门金沙国际网站 10

成本相对ASIC具备一定优势。

FPGA一次性成本远低于ASIC,在芯片需求还未成规模、深度学习算法暂未稳定需要不断迭代改进的情况下,利用具备可重构特性的FPGA芯片来实现半定制的人工智能芯片是最佳选择。

正因为存在上述优势,FPGA被广泛用于AI云端和终端的推理。国外包括亚马逊、微软都推出了基于FPGA的云计算服务,而国内包括腾讯云、阿里云均在2017年推出了基于FPGA的服务,百度大脑也使用了FPGA芯片。

从市场格局上看,全球FPGA长期被Xilinx、Intel、Lattice、Microsemi四大巨头垄断。其中,赛灵思和英特尔合计占到市场的90%左右,赛灵思的市场份额超过50%,国内厂商刚刚起步,差距较大。

澳门金沙国际网站 11

澳门金沙国际网站 12

专用芯片深度学习算法加速应用增多,可提供更高能效表现和计算效率ASIC(ApplicationSpecificIntegratedCircuits),即专用芯片,是一种为特定目的、面向特定用户需求设计的定制芯片,具备性能更强、体积小、功耗低、可靠性更高等优点。在大规模量产的情况下,还具备成本低的特点。

ASIC与GPU、FPGA不同,GPU、FPGA除了是一种技术路线之外,还是实实在在的确定产品,而ASIC只是一种技术路线或者方案,其呈现出的最终形态与功能也是多种多样的。

近年来,越来越多的公司开始采用ASIC芯片进行深度学习算法加速,其中表现最为突出的ASIC就是Google的TPU。

TPU是谷歌为提升AI计算能力同时大幅降低功耗而专门设计的芯片。该芯片正式发布于2016年5月。

TPU之所以称为AI专用芯片,是因为它是专门针对TensorFlow等机器学习平台而打造,该芯片可以在相同时间内处理更复杂、更强大的机器学习模型。

谷歌通过数据中心测试显示,TPU平均比当时的GPU或CPU快15-30倍,性能功耗比(TFOPS/Watt)高出约30-80倍。

但是,ASIC一旦制造完成以后就不能修改了,且研发周期较长、商业应用风险较大,目前只有大企业或背靠大企业的团队愿意投入到它的完整开发中。

国外主要是谷歌在主导,国内企业寒武纪开发的Cambricon系列处理器也广泛受到关注。其中,华为海思的麒麟980处理器所搭载的NPU就是寒武纪的处理器IP。

澳门金沙国际网站 13

澳门金沙国际网站 14

短期内GPU仍将是AI芯片主导,长期看三大技术路线将呈现并行态势

短期内GPU仍将主导AI芯片市场,FPGA的使用将更为广泛

GPU短期将延续AI芯片的领导地位。GPU作为市场上AI计算最成熟、应用最广泛的通用型芯片,应用潜力较大。凭借其强大的计算能力、较高的通用性,GPU将继续占领AI芯片的主要市场份额。

当前,两大GPU厂商都还在不断升级架构并推出新品,深度学习性能提升明显,未来应用的场景将更为丰富。

澳门金沙国际网站 15

英伟达凭借着其在矩阵运算上的优势,率先推出了专为深度学习优化的PascalGPU,而且针对GPU在深度学习上的短板,2018年推出了Volta架构,正在完成加速-运算-AI构建的闭环;AMD针对深度学习,2018年推出RadeonInstinct系列,未来将应用于数据中心、超算等AI基础设施上。

我们预计,在效率和场景应用要求大幅提升之前,作为数据中心和大型计算力支撑的主力军,GPU仍具有很大的优势。

澳门金沙国际网站 16

FPGA是短期内AI芯片市场上的重要增长点,FPGA的最大优势在于可编程带来的配置灵活性,在当前技术与运用都在快速更迭的时期,FPGA具有明显的实用性。

企业通过FPGA可以有效降低研发调试成本,提高市场响应能力,推出差异化产品。

在专业芯片发展得足够完善之前,FPGA是最好的过渡产品,正因为如此,科技巨头纷纷布局云计算 FPGA的平台。

随着FPGA的开发者生态逐渐丰富,适用的编程语言增加,FPGA运用会更加广泛。因此短期内,FPGA作为兼顾效率和灵活性的硬件选择仍将是热点所在。

澳门金沙国际网站 17

长期来看GPU、FPGA以及ASIC三大类技术路线将并存

GPU主要方向是高级复杂算法和通用型人工智能平台。

高端复杂算法实现方向。由于GPU本身就具备高性能计算优势,同时对于指令的逻辑控制上可以做的更复杂,在面向复杂AI计算的应用方面具有较大优势。

通用型的人工智能平台方向。GPU由于通用性强,性能较高,可以应用于大型人工智能平台够高效地完成不同种类的调用需求。

FPGA未来在垂直行业有着较大的空间。由于在灵活性方面的优势,FPGA对于部分市场变化迅速的行业最为实用。

同时,FPGA的高端器件中也可以逐渐增加DSP、ARM核等高级模块,以实现较为复杂的算法。

随着FPGA应用生态的逐步成熟,FPGA的优势也会逐渐为更多用户所认可,并得以广泛应用。

ASIC长远来看非常适用于人工智能,尤其是应对未来爆发的面向应用场景的定制化芯片需求。

ASIC的潜力体现在,AI算法厂商有望通过算法嵌入切入该领域,以进入如安防、智能驾驶等场景。

由于其具备高性能低消耗的特点,可以基于多个人工智能算法进行定制,以应对不同的场景,未来在训练和推理市场上都有较大空间。

澳门金沙国际网站 18

国内外AI芯片市场需求将保持较快增长势头,云端、边缘均具备潜力

近年来,伴随着全球AI产业的快速增长,AI芯片需求大幅上升。按照Gartner最新数据,2018年全球AI芯片市场规模达到42.7亿美元。

未来几年,全球各大芯片企业、互联网巨头、初创企业都将在该市场上进行角逐,预计到2023年全球市场规模将达到323亿美元。

未来五年(2019-2023年)平均增速约为50%,其中数据中心、个人终端、物联网芯片均是增长的重点。

澳门金沙国际网站 19

国内人工智能芯片行业发展仍处在起步阶段。

长期以来,我国在CPU、GPU和DSP设计上一直处于追赶状态,绝大多数芯片依靠国外的IP核进行设计,自主创新能力不足。

但我们也看到,国内人工智能产业的快速发展,也为国内芯片产业实现换道超车创造了机会。

由于国内外在芯片生态上并未形成垄断,国内芯片设计厂商尤其是专用芯片设计厂商,同国外竞争对手还处在同一起跑线上。

目前国内人工智能芯片市场呈现出百花齐放的态势。AI芯片的应用领域广泛分布在金融证券、商品推荐、安防、消费机器人、智能驾驶、智能家居等众多领域,催生了大量的人工智能创业企业,如地平线、深鉴科技、寒武纪、云知声、云天励飞等。

我们认为,未来随着国内人工智能市场的快速发展,生态建设的完善,国内AI芯片企业将有着更大的发展空间,未来5年的市场规模增速将超过全球平均水平。

澳门金沙国际网站 20

▌AI芯片主要应用场景

数据中心

本文由科技中心发布,转载请注明来源:从“AI芯片四杰”探寻我国人工智能芯片行业机遇