收藏:国产服务器和处理器架构

架构真经

共 7781字,需浏览 16分钟

 · 2020-08-12

服务器是一种为客户机提供服务的高性能计算机。关于服务器最全分析材料请参考文章“终极版:服务器基础知识全解”。


CPU作为服务器的运算和控制核心其指令集架构有CISC和RISC两种从性能角度来说CISC与RISC并无绝对的孰优孰劣之分目前看来CISC与RISC已逐步走向融合两方处理器互相借鉴互相优化目前X86架构CPU占整体服务器市场约 96%处于绝对领先的地位


以ARM为代表的国产架构服务器有望异军突起ARM早期专注低功耗领域在移动端处于领先位置生态体系十分完善但在服务器等计算市场多年来推进缓慢随着多核异构计算时代和场景多样化计算时代到来带来对计算架构多样性的需求考虑中国市场政府金融能源等行业端生态逐步完善以及华为鲲鹏的入局以ARM为代表的国产架构服务器有望获得一席之地而ARM公司本身也推出了Neoverse新架构以期大幅提升性能增强在服务器领域的竞争力


国产架构服务器群雄逐鹿目前国产CPU包括鲲鹏飞腾海光龙芯兆芯宏芯申威等在党政军领域龙芯飞腾兆芯等目前占据主流华为鲲鹏未来有望在商用市场占据主导海光凭借其出色的单核性能和X86完善生态也有望获得一定市场份额


华为鲲鹏壮志凌云打造计算产业生态2019年9月华为首次发布一云两翼双引擎的计算战略构筑开放的鲲鹏产业生态华为将聚焦芯片开源操作系统存储数据库云等底层产品其余上层产品和服务开放给鲲鹏凌云合作伙伴实现生态链互利共赢


神州数码华为长期战略伙伴深度参与鲲鹏生态建设神州数码与华为合作已久是华为的全面战略合作伙伴公司18年3月正式启动大华为战略成立华为业务群形成内部协作公司是首家宣布拟投资基于鲲鹏的国产自主品牌服务器PC产线的公司将深度参与鲲鹏生态建设


东华软件与华为共同发布鲲鹏服务器鹏霄20年1月公司与华为联合推出首批基于鲲鹏处理器的鹏霄服务器在宁波市政务云上首次应用并提出鹏霄服务器将在公司所覆盖的多个行业领域进行大规模商业推广及应用


中国长城兼具芯片及主机能力2019年8月中国长城与华大半导体中国振华签署协议拟定收购天津飞腾35%股权天津飞腾是国内领先的国产场景CPU包括长城在内的国内20多家OEMODM厂商已推出基于飞腾芯片的服务器整机产品


中科曙光制裁阴影逐渐消失拐点初现16年中科曙光子公司天津海光与AMD合作获得AMD Zen架构授权18年7月海光禅定国产芯片量产中科曙光也推出基于禅定的国产服务器产品19年6月公司进入美国实体名单目前各环节替代方案逐步完善制裁影响逐步消除



服务器行业发展简史


1.1 服务器一种为客户机提供服务的高性能计算机


服务器是指网络环境中的高性能计算机包括应用程序服务器文档服务器邮件服务器Web服务器及代理服务器等整个互联网的结构几乎都基于客户机-服务器模型客户机-服务器模型的本质是客户机请求服务器响应即服务器的功能是为客户机提供数据服务服务器由处理器CPU内存磁盘网卡监视器电源机箱等组成和通用的计算机架构类似但是由于需要提供高可靠的服务因此在处理能力稳定性可靠性安全性可扩展性可管理性等方面的要求比普通的个人电脑高

服务器的最大特点就是其强大的运算能力即使是一部简单的服务器系统通常也至少要有两颗处理器以构成对称多处理架构使其能在短时间内完成大量工作并为大量用户提供服务


服务器常见的外型有四种塔式服务器(Tower Server)机架服务器(Rack Server)刀片服务器Blade Server机柜式服务器其中机柜是指为服务器正常工作提供相适应的环境和安全防护的安装箱通过机柜可以保证服务器设备稳定可靠地工作



服务器行业已经发展了近60年服务器的发展最早可以追溯到1964年IBM引入System/360System/360是由5种功能越来越强大的计算机所组成的系列这些计算机运行同一操作系统并能够使用相同的44个外围设备



1.2 CPU服务器的运算和控制核心


中央处理器(Central Processing Unit简称CPU)是服务器的核心构成之一其功能主要是解释计算机指令以及处理服务器中的数据CPU的主要运作原理是执行储存程序里的一系列指令程序以一系列数字的形式存储在存储器中


指令集架构Instruction Set Architecture又称指令集或指令集体系是计算机体系结构中与程序设计有关的部分包含了基本数据类型指令集寄存器寻址模式存储体系中断异常处理以及外部I/O指令集架构包含一系列的opcode即操作码机器语言以及由特定处理器执行的基本命令简单地来说指令集一般被整合在操作系统内核最底层的硬件抽象层中属于计算机中硬件与软件的接口它向操作系统定义了CPU的基本功能


CPU按指令集的架构区分分为CISCComplex Instruction Set Computing复杂指令集型和RISCReduced Instruction Set Computing精简指令集型两类


CISC的设计者希望通过直接在硬件中构建复杂的指令从而使编程更方便程序运行速度更快其架构中每个指令可执行若干低端操作诸如从存储器读取存储和计算操作全部集于单一指令之中与之相反RISC架构中只包含使用频率高的少量简单指令并提供一些必要的指令以支持操作系统和高级语言


CISC阵营以IntelAMD的X86架构为代表而RISC阵营则包括ARMMIPSPower PC等架构;


从硬件角度来讲CISC处理的是不等长指令集而RISC执行的是等长精简指令集在并行处理方面RISC明显优于CISC由于RISC执行的是精简指令集相比CISC在硬件层面需要更少的晶体管所以它的硬件制造工艺更简单且成本更低廉RISC型CPU与CISC的CPU在软件和硬件上都不兼容这是由指令集的特性而决定的。


从性能角度来说CISC与RISC并无绝对的孰优孰劣之分但在发展过程中CISC阵营的Intel和AMD在提升芯片性能上做出了持续的努力芯片的功耗被放在了性能后的第二位而RISC本身出现时间较CISC晚十年左右ARM诞生于1985年X86诞生于1978年ARMMIPS在创始初期缺乏与Intel产品对抗的实力专注于以低功耗为前提的高性能芯片RISC阵营的Power PC架构最初是为个人计算机产品而设计但其出现时已是1992年此时Intel旗下的80386和80486占据了大部分PC市场


次年Intel赫赫有名的奔腾系列发布并助力Intel占领了绝大部分PC市场这是第五代基于CISC的X86架构微处理器Intel将其命名为Pentium在整个1990年代中期PowerPC处理器均达到或超过了最快的x86 CPU的基准测试成绩


但由于PowerPC面向WindowsOS / 2和Sun的客户都存在应用软件极度缺乏的问题所以最终并未在PC市场溅起水花但其后Apple因为PowerPC处理器的更高性能在Macintosh个人电脑系列使用了PowerPC处理器


2005年出于发热量和能源消耗有关的考虑Apple宣布不再在其Apple Macintosh计算机中使用PowerPC处理器转而支持Intel生产的处理器此后PowerPC开始往超高性能服务器方向发展


CISC与RISC已逐步走向融合两方处理器互相借鉴互相优化例如Intel公司的Pentium Pro种内含三个能够把x86指令转换成118位定长的RISC风格微操作的译码器



1.3 X86一统天下数十年


X86泛指一系列英特尔公司用于开发处理器的指令集架构该系列较早期的处理器名称是以数字来表示80X86包括Intel 8086801868028680386以及80486由于以86作为结尾因此其架构被称为X86



X86在计算市场取胜的原因主要有以下四点


Intel与AMD竞争不断造就高性能X86Intel具有很强的研发实力芯片性能一直处于行业领先在20世纪70年代至21世纪初,厂商最看重的因素之一即为处理器的性能而RISC本身出现时间较CISC晚十年左右ARMMIPS在创始初期缺乏与Intel产品对抗的实力改以专注于以低功耗为前提的高性能芯片


同时Intel X86也很早开始借鉴RISC架构优势不断技术革新比如Pentium奔腾处理器就采用了超标量架构即有一个处理简单和通用指令的管线Intel最新产品十代酷睿桌面版Comet Lake-S系列处理器及400系芯片组中最低配置的酷睿i3-10100四核处理器已经达到3.6GHz基础频率4.3GHz睿频全核4.1GHz从单机性能上来讲Intel目前依旧处于强势地位


Wintel联盟建立四十余年X86软件生态完善1981年由于个人计算机市场不受IBM看重IBM选取8088做个人计算机业务的CPU并将操作系统外包给微软Wintel联盟就此开始征程


在Wintel建立之初微软并没有打算唯一地只支持Intel早期微软操作系统有两条业务线一条专用支持X86架构另一条则支持考虑了操作系统的可移植性可支持RISC架构的计算机但由于RISC处理器在PC端的份额远不及X86微软又取消了对部分RISC架构的支持后来X86成为了个人电脑的标准平台也成为了历来市场上最成功的CPU架构


专注芯片架构研发不碰设备生态就Intel来讲不与设备生产商软件开发者或者系统开发者成为利益竞争关系是一个十分重要的致胜因素IBM和SUM大包大揽生产多种服务器设备但其它设备生产商可能会基于不支持竞争对手的角度不愿意选择PowerPC和SPARC架构而选择X86架构


从成本性能生态三方面来讲X86都是早期数据中心的最优选从成本和性能角度来讲X86相比大型机与小型机在RAS(Reliability, Availability, Serviceability)有所欠缺但具有生态系统开放兼容性高价格便宜的优势且由于分布式系统成熟X86服务器集群的性能并无较大差距大型机和小型机价格昂贵体系封闭一般只在部分要求零宕机的领域使用如银行业电信业等


从生态的角度来讲由于X86在市场上占有率高相比其它架构而言X86有着独一无二的软件和硬件生态优势故目前全球的数据中心大部分都是采用Intel的X86架构服务器芯片X86生态系统也愈发强大


根据DRAMeXchange调查显示服务器用CPU中X86架构CPU占整体服务器市场约 96%



以ARM为代表的CISC架构服务器有望异军突起


2.1 ARM公司全球领先的半导体设计与软件公司


ARM架构从1983年开始由艾康电脑公司设计开发最早为其命名为Acorn精简指令集机器(Acorn RISC Machine)1980年代晚期苹果电脑开始与艾康电脑合作开发新版的ARM核心为了更好地支持这一重要项目艾康电脑将设计团队组成了一间名为安谋国际科技(Advanced RISC Machines Ltd.)的新公司基于此原因人们也常常将ARM称作高级精简指令集机器(Advanced RISC Machine)但在2016年安谋国际科技被日本软银集团以3.3万亿日元约合311亿美元收购此后ARM公司退出股市



不同于Intel自主完成架构芯片设计和芯片制造也不同于无工厂模式(Fabless)的AMDNVIDIA自己完成架构和芯片设计而将芯片制造工作交给代工厂完成ARM公司本身并不靠自有的设计来制造或出售CPU而是通过提供各种授权条款来获得收益



ARM公司一般有三种授权方式指令集授权内核授权和使用权授权


指令集授权是ARM公司提供的最大限度的授权其产品形式为ARM v系列即ARM架构被授权方可以对ARM公司的指令集进行扩展或缩减从而得到其自己的指令集架构苹果公司就取得了这种授权例如iphone 11/ 11 pro/ 11 pro Max等机型上搭载的Apple A13芯片其微架构就是基于ARMv8.3-A指令集架构自主研发此外华为长城高通三星等公司也取得了ARM的指令集授权


内核授权的产品主要是指ARM公司提供的一系列微架构目前主要是ARM cortex系列被授权方可以在内核基础上对缓存I/O等设计进行修改这是ARM公司提供的最广泛的授权方式ARM是广为人知最昂贵的CPU内核之一取得这种授权的公司包括高通三星华为德州仪器(TI)博通飞思卡尔富士通以及Calxeda等等


使用权授权的产品则是指ARM已经设计好的CPU/GPU被授权人可以使用ARM设计好的CPU/GPU在这一种授权中被授权人可自由发挥的空间非常小



2.2 ARM架构已被广泛应用到各个领域


ARM公司的商业发展极其迅速主要有以下几点原因

发展早期避开Intel锋芒专注低功耗领域ARM公司发展之初也在个人计算机领域做出了努力但后来发现其产品与Intel的新品无法竞争之后迅速转换路径投入了以低功耗为前提的高性能芯片的研发早期清晰的发展路线也为ARM之后抓住智能手机爆发机遇做好了铺垫


授权策略正确内核授权价格低厂商间竞争激烈1991年ARM公司就开始了授权模式MIPS的定价策略是内核授权很贵而架构授权很便宜且对指令集扩展不受限制而ARM的定价策略是架构授权非常昂贵而内核授权很便宜且厂商需要修改设计需要继续付大量的费用


从实践结果来看ARM的授权策略优于MIPSMIPS便宜的架构授权吸引了一批有能力通过指令集开发CPU的厂商但由于允许厂商自行修改指令集导致生态碎片化且互相不兼容也极大影响了开发者和使用者的热情而ARM的授权模式对无能力通过指令集开发CPU的厂商十分友好这些厂商能通过购买内核授权来快速推出CPU产品甚至有研发能力的公司也愿意使用现成的ARM内核来集成CPU从而大幅度降低产品开发成本和缩短开发周期ARM的商业模式也使得进入厂商多激烈的竞争使得ARM产品价格不断下降生态日趋完善


完善的生态体系ARM完善的硬软件生态使得设备厂商开发者和使用者都充满信心


ARM架构的应用领域已十分广泛据2011年ARM的客户报告统计79亿ARM处理器出货量占有95%的智能手机90%的硬盘驱动器40%的数字电视和机上盒15%的微控制器和20%的移动电脑十年来ARM市场格局变化不大截止到2017年已经生产的ARM架构的处理器超过1000亿个是应用最广泛的指令集架构也是产量最大的指令集架构


由于ARM在成本功耗和散热上的优势它对于便携式电池供电的设备包括智能手机便携式计算机和平板电脑以及其他嵌入式系统来说十分理想同时对于消耗大量电力的超级计算机与云计算数据中心ARM也是一种节能的优秀解决方案目前ARM处理器可以在很多消费性电子产品上看到从便携式设备PDA移动电话多媒体播放器掌上型电子游戏和计算机到电脑外设硬盘桌面型路由器甚至在导弹的弹载计算机等军用设施中都有它的存在在此之外还有一些基于ARM设计的衍生产品包括Marvell的XScale架构和德州仪器的OMAP系列



2016年日本富士通宣布了研发接替Post-K超级计算机Post-K超级计算机采用富士通与ARM公司共同开发的ARM处理器A64FX富士通称他们目标是创造出世界上最高性能的超级计算机其应用执行性能是京超级计算机的100倍如果此应用执行速度实现那么Post-K超算将进入百亿亿次级别exascale1 exaflops表示每秒10^18次浮点运算



2.3 ARM在服务器领域的尝试


从2008年开始ARM公司开始酝酿进军ARM服务器芯片市场的计划此后AMD三星AWS高通Calxeda以及Marvell等多个公司相继开发了ARM架构服务器芯片但除AWS以外其余公司的ARM服务器芯片均未在市场上有持续表现


AWS推出基于ARM架构的云计算服务AWS在2018年正式对外发布了基于ARM架构的云服务器芯片Graviton及基于该芯片提供的EC2 A1虚拟服务器和云服务并表示此芯片对部分工作负载能耗可降低45%在2019年12月的AWS re:Invent 会议上亚马逊公布了新一代的ARM 服务器芯片 Graviton2据介绍AWS Graviton 2 处理器的速度比较前一代芯片提升了7倍浮点性能提升了2倍性能表现强悍


AMD三星高通Calxeda以及Marvell等公司在ARM服务器芯片上的尝试均未获得成功



从AWS和Marvell的实践观察在云计算领域ARM架构芯片低功耗低成本的优势不可小觑但AMD三星高通Calxeda以及Marvell五个公司在ARM服务器芯片领域均未获得成功我们认为主要有以下两方面原因


ARM在服务器领域的生态并不成熟Wintel联盟牢牢垄断计算产业生态各类厂商更倾向于X86架构故ARM服务器在市场推广方面存在较大阻力


ARM服务器芯片是一个需要持续投入的产业如高通三星可能出于对当时情况的判断认为ARM服务器暂时不具备良好的市场前景故放弃了此业务


X86服务器相较于ARM服务器而言具有性能强的优势但同时也具有功耗大成本高的劣势因此ARM已经明确了其针对数据中心的Neoverse架构迭代升级策略每一代性能提升都在30%以上远超X86 CPU每一代性能提升的幅度ARM与X86之间性能上的差距将不断缩小



近几年ARM性能提升的同时其生态也得到了较大的扩展2018年11月开始Windows已经开始支持64位ARM应用开发和提交这将十分有利于ARM生态的构建


2019年6月在德国法兰克福国际超算大会上NVIDIA宣布支持Arm CPU以构建具有极高能效水平的百万兆级AI超级计算机NVIDIA创始人兼首席执行官黄仁勋表示NVIDIA CUDA加速的计算和Arm的高能效CPU架构的相结合将助力HPC社区实现大幅提升以达到百万兆级

浏览 24
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报