信息时代的生产力——算力——都在算些啥?
共 3595字,需浏览 8分钟
·
2022-08-26 03:47
点击下方卡片,关注“新机器视觉”公众号
重磅干货,第一时间送达
信息时代,算力即是生产力。
但你有没有想过,算力每天都在算些啥?
图片 | giphy.com
万物皆数,万事皆算
曾经,人们对计算的理解,局限于数学计算。
直到克劳德·香农的出现。他敏锐地意识到,开关电路与逻辑运算之间具有相似性,并在论文中展现了如何利用电子电路来实现逻辑运算。
从此,计算的对象,不再只是纯粹的数字,它也可以计算逻辑。
等到图灵提出“图灵机”的构想,用机器进行计算的野心则更加宏大。
图灵机的艺术形式 | wikipedia
图灵将人类的计算过程抽象为一系列规则,希望用机器模拟人类的整个计算过程,即所谓的通用计算。在此基础上,人类造出了冯·诺依曼机。现代几乎所有电子计算机都是沿用这种架构。这种架构中,负责计算的核心部件,被我们称作CPU(Central Processing Unit,中央处理器)。
冯·诺伊曼结构的设计概念 | wikipedia
此后,随着信息技术的发展,图像、音频、视频等其他信息载体,借助传感器和信息编码技术,也开始数字化,也开始被计算。
于是, GPU(Graphics Processing Unit,图像处理器)出现了。GPU表示:CPU进行图形运算效率太低啦,今后这部分工作由我专门来做。从那以后,C+G也成为了计算机的基本配置。
仅仅过了十数年,由于人工智能技术的发展,其对算力的庞大需求让CPU和GPU都显得力不从心,于是,Google干脆在研发“阿尔法狗”的时候,顺便制造了专用的芯片:TPU(Tensor Processing Unit,张量处理器)。其后,一系列公司都开始针对人工智能开发专门优化的神经网络处理芯片(Neural-network Processing Unit,NPU)。
这背后的本质,事实上是计算的对象发生了变化,计算的场景更加细分,需要的算力更加庞大,原有的硬件架构不再高效。
而不知不觉中,计算早已变得无处不在,万物开始互联。
在5G+AI的技术加持下,许多前所未有的对象、场景和应用,开始被感知、被联接、被传输、被计算;进行计算的场所,不再局限于一个个“端”,也未必集中到一朵朵“云”,而是云边端的全场景协同;计算所借助的工具,不再是某一类通用CPU或者GPU,而是场景细分下的各种各样的芯片和硬件;而计算本身也早已不再是纯粹的加减乘除,生活中早已是“万物皆数、万事皆算”。
人类文明即将进入的,是一个异构计算、协同计算、高性能计算、泛在计算同时并存的多样性计算新时代。
爱因斯坦曾经感叹:“宇宙最不可理解之处,就是它居然是可以被理解的。”或许现在还要加上一条:它居然可以被计算。
从计算机到计算“基”
每一次计算的对象和场景发生变化,都伴随着硬件的变革。
但多样性计算的时代,需要的早已不止是某一种芯片或者某一台机器,而是从硬件到软件再到应用,从生态开放到人才培养的一整套基础设施。
在这场可能是未来十年人类社会最重要的基础建设活动里,华为计划2020年投入2亿美元、5年投入15亿美元,来促进整个计算产业的发展。
华为围绕“鲲鹏”+“昇腾”两大领域,以“硬件开放、软件开源,使能合作伙伴”为宗旨,构筑开放创新的全生态链,与开发者一起在多样性计算时代获得共赢。
多样性计算的一大挑战是:计算场景越来越多元化。
随着应用创新速度加快,应用种类和数量繁多,应用也越来越场景化和多样化,加上用户对应用体验的追求不断提高,需要的算力越来越庞大,这就对计算硬件提出了新的要求。
实践证明,单纯云、边、端的一个或两个维度的计算都无法更好地满足用户需求,只有云、边、端一体化的协同计算才能满足不同用户对时延、性能、功耗等的多样需求。
然而,不同侧的算力可能有不同的架构,如何让各种架构下的算力高效协同就成为了一个难题。
答案是鲲鹏。鲲鹏与广泛的边、端的算力架构原生兼容。有了鲲鹏,计算场景多元化的问题将迎刃而解。
华为提供的Kunpeng BoostKit应用使能套件,针对大数据、分布式存储等八大应用场景做了一系列深度优化,让应用开发者以“开箱即用”的方式,更加便捷的使用鲲鹏平台。Kunpeng DevKit开发套件也在持续增强,提供代码扫描、迁移、编译、调优等一系列功能,还新增了无源码迁移功能,使开发者不用再为各种不同的开发环境而困扰。
如果你是基础软件开发者,openEuler操作系统和openGauss数据库已开源。你不再是孤军奋战,你可以深度参与社区建设,与志同道合的全球开发者实现技术理念。
如果你是硬件开发者,华为开放鲲鹏主板,尤其是最新推出的2.0版本,采用了基础板+扩展板+BMC/BIOS的设计,硬件开发者可以根据自身的行业需求,对其进行自定义和拓展,极大地提高了灵活性。
多样性计算的另一大挑战是:人工智能计算,也就是通常说的AI计算。
目前,AI在特定领域已超越人类,成为推动社会发展关键引擎。但AI从算法走向应用仍旧面临一系列挑战。与AI展现的美好前景相比,目前开发、应用、部署一个AI实在太麻烦了。
针对这些挑战,华为昇腾提供了全栈式解决方案,让AI开发变得极简高效。
首先是在硬件层面,华为陆续发布了覆盖端边云的Atlas全场景系列硬件,为AI提供算力支撑,不管在哪用AI,都有充足算力做保证。
接着针对AI专业开发者,华为发布了异构计算架构CANN 3.0,支持10+端边云设备形态、14+操作系统和多种AI框架,使能全场景硬件;采用统一的API,四大开放性设计,提供两种算子开发方式,让AI的开发变得更加高效;还提供1000+高性能算子,使能澎湃算力。根据测试,基于Atlas 900、CANN3.0和ModelArts的联合调优,ResNet-50模型训练时间,从HC2019上的59.8秒减少到了28秒。
面向AI应用开发者,华为提供全场景AI计算框架MindSpore 1.0,提供全自动并行、全场景协同功能,并且全流程极简,让开发者只用关注算法本身。
面向最上层的业务应用开发者,采用MindX 1.0,即可把AI变成服务。开发者只需关注业务实现,无需担心AI的具体算法、框架。还提供各类行业应用套件,配合使用可极大地提升开发效率。以即将上线的视频分析SDK:mxVision为例,它可以让车辆识别/视频结构化这种典型的CV类应用快速上线,应用开发效率提升10倍以上。
整个流程借助MindStudio 2.0全流程开发工具链,可以加速开发过程,让AI变得更加容易,真正解放开发者的创造力,释放AI的巨大潜能。
多样性计算还有一个最大的挑战,即分布式+多样性计算。
高性能分布式应用给开发者带来了巨大的挑战:如何提供高密度的算力、如何让应用匹配不同的算力,并行性能如何保障、资源如何统一调度等等,都是令开发者头秃的问题。
但如果借助基于函数计算的分布式并行应用开发框架,开发者本已不多的头发将能得到保留。开发者能够像搭积木般构建分布式并行应用,在大规模分布式系统上享受单机编程体验;还提供高扩展低时延的数据缓存系统,缓存续写速度缩短10倍;支持函数高效直接通信,实现毫秒级函数启动;还特别通过AI提升用户对大规模分布式并行应用的性能调优和故障定位效率。
此外还有新一代加速库和调度器,这些都能帮助开发者,聚焦于核心业务逻辑,不必操心“日常琐事”。
所有屠龙的冒险者都需要装备,这一系列工具,就是华为给开发者铸造的神兵利器,让开发者不用踏破铁鞋去深山老林寻找银鳞胸甲,而是能够专心磨炼自己的武艺,去寻找真正的宝藏。
而比这些工具更重要的,是鲲鹏和昇腾越来越开放的生态。
在全产业的共同努力下,鲲鹏和昇腾的生态驶入快车道。当前开发者已超过30万,合作伙伴超过1000家,完成兼容性认证的解决方案超过3000+,服务于金融、运营商、政府、电力、交通等各行各业,真正做到了全生态开放创新,使能算力爆炸式增长,为数字经济提供了发展新动能。
除了在产业层面秉承“硬件开放、软件开源,使能合作伙伴”的原则,华为还格外注重产业人才的培养,坚持以产业集聚人才,以人才引领产业,构建良性人才生态,激发产业持续活力。
目前,华为联合首批72所高校建设了“智能基座”产教融合协同育人基地,针对高校研究性、应用型、技能型等不同人才类型,有的放矢、分门别类的进行人才培养,点亮未来“灯塔”;针对高校人才发展路径,构建闭环知识、实践、认证成长体系,还编写了“鲲鹏”+“昇腾”系列学习教材。未来“鲲鹏”、“昇腾”或将成为高校学生的必备技能。
结语
预计到2023年,整个计算产业生态体系在全球有近两万亿美元的市场空间,在中国则超过1.1万亿人民币。华为愿意使能每一位开发者,让每一行代码都能具备改变世界的算力,让整个产业一起:
“鲲鹏”展翅,“昇腾”万里。
来源:果壳
本文仅做学术分享,如有侵权,请联系删文。