老黄真成数字人,英伟达「元宇宙」格局打开
共 3816字,需浏览 8分钟
·
2021-11-13 08:18
作者 | 吴优
编辑 | 李帅飞
“什么是最伟大的?”
“最伟大的是那些善待他人的人。”
在英伟达 GTC 2021 大会上,黄仁勋的开幕演讲以一段极具哲学性和未来感的对话画上句号。
回答者不是黄仁勋本人,而是以黄仁勋为原型的对话式虚拟形象——Toy Jensen。黄仁勋在开幕演讲中介绍,这一虚拟形象是基于目前训练的最大自然语言处理模型和光线追踪的精美图像而合成实时形象。
“有了最近才实现的一些惊人技术,Toy-me 得以打造而成,而这些技术在以前看来几乎都是不可能实现的。”
Toy Jensen 的呈现,透露了英伟达的元宇宙愿景,此外,按照惯例,英伟达还在此次GTC上推出了一系列AI技术与产品:
目前为止最先进的端到端的网络平台 Quantum-2,多节点分布式推理功能的 NVIDIA Triton 推理服务器,NVIDIA A2 Tensor Core GPU加速器,全球最小、功能最强大、能效最高的下一代超级计算机NVIDIA Jetson AGX Orin 等系列产品等等。
1
Omniverse 更新升级,加速 2D
互联网向 3D 演变
在去年的 GTC 大会上,英伟达宣布推出 Omniverse,并介绍其为世界上第一个基于英伟达 RTX 的三维仿真和协作平台,融合了物理和虚拟世界,实时模拟现实并具有真实感的细节,无论是艺术家还是人工智能,都能够在不同世界使用不同的工具,共同创造一个全新的世界。
经历近一年的发展,已经有 70000 多名创作者下载,500 多家公司的专业人士使用 Omniverse 公测版,宝马集团、CannonDesign、Epigraph、Ericsson、建筑公司 HKS 和 KPF、Lockheed Martin 以及 Sony Pictures Animation 都包括在内。
其中,Ericsson 正在使用 Omniverse 平台创建数字孪生,模拟和可视化信号传播,以加速 5G 网络的功能开发和洞察。
与此同时,Omniverse 本身也随之更新升级。
Omniverse Avatar 是英伟达推出的一个能够用于生成交互式 AI 虚拟化身的技术平台,连接英伟达语音 AI、计算机视觉、自然语言理解、推荐引擎和模拟方面技术,即将 Metropolis 的感知能力、Riva 的语音识别能力、Merlin 的推荐能力、Omniverse 的动画渲染能力等交汇于一体。
其中,NVIDIA Riva 语音 AI 软件新增了一项 Riva 定制语音功能,只需要 30 分钟的音频数据,就能在一天之内打造类似真人的定制语音,几乎类似于科幻爱情电影《她》中的萨曼莎,拥有斯嘉丽的迷人声线,且拥有超强的学习能力。
落地到具体应用中,企业可以使用 Riva 定制语音打造专属语音的虚拟助理,开发具有辨识度的品牌语音,开发者也可以借助其创建各种各样的应用程序,为有语言障碍的人提供支持。
基于 Omniverse Avatar 这一平台,原本处于 2D 状态的虚拟助手就有能力变成一个拥有常识、推理能力和生动的 3D 视觉形象,理解多种语言,且在同人类的交流中给出更加智能的回答。正如在直播中看到的那样,当英伟达的 3 位工作人员分别向 Toy Jensen 提出有关气候变化、天文学以及生物蛋白质等棘手的问题时,这个小家伙都能对答如流。
再者,英伟达演示了基于对话操作台 Tokkio 基于 Omniverse Avatar 平台的应用程序,当餐厅有两位顾客同时点餐时,客户服务的虚拟化身能够同顾客进行眼神交流,并根据两位顾客的用餐需求给出推荐菜单。
而 Omniverse 本身,也更新了4大功能,包括 Showroom、Farm、AR和VR。
其中,Showroom 作为 Omniverse 公测版中的应用程序提供,允许非技术用户使用 Omniverse 技术演示,展示平台的实时物理和渲染技术;
Farm 允许团队同时使用多个工作站或服务器,为渲染、合成数据生成或文件转换等任务提供支持;
VR 推出领先的完全图像、光线追踪 VR,支持开发者在平台上构建自己的 VR 功能,最终用户可以直接享受 VR 功能;AR 同理。
另外,英伟达还宣布 Omniverse Enterprise 已进入正式发布阶段。它允许跨多个软件套件工作的全球 3D 设计团队在共享虚拟空间中通过任意设备实时协作。Omniverse 的生态系统正在不断扩展。
2
最新 Triton 推理服务器,助力实时
大型语言模型开发与部署
构建交流如此自如的 Toy Jensen,同样离不开强大的自然语言处理模型,其背后的技术逻辑也在此次大会上得以展现。
英伟达推出了为训练具有数万亿参数的语言模型而优化的 NVIDIA NeMo Megatron 框架,为新领域和语言进行训练的可定制大型语言模型(LLM)Megatron 530B 以及具有多 GPU、多节点分布式推理能力的 NVIDIA Triton 推理服务器。
而基于这些工具,不仅仅能构建 Toy Jensen,企业也可以建立自己的、特定领域的聊天机器人、个人助理以及其他 AI 应用程序,高水平理解语言中细微的差别。
NVIDIA NeMo Megatron 是在 Megatron 的基础上发展起来的开源项目,由 NVIDIA 研究人员主导,研究大型转换语言模型的高效训练。Megatron 530B 是世界上最大的可定制语言模型。
NeMo Megatron 框架经过优化,可以在 NVIDIA DGX SuperPOD 的大规模加速计算基础设施上进行扩展。
有了大型语音模型,如何存储和运行呢?尤其是这些模型对内存的需求极大,超过单个 GPU 甚至是多个GPU 服务器所能够提供给的内存,且在实际应用中对推理实时性要求较高。
NVIDIA Triton 推理服务器的出现解决这一问题,英伟达在此次大会上发布的最新 NVIDIA Triton 具有多 GPU、多节点特性,使大型语言模型推理工作负载能够实时在多个 GPU 和节点上扩展。
借助 Triton 推理服务器,Megatron 530B 能在两个 NVIDIA DGX 系统上运行,将处理时间从 CPU 服务器上的 1 分钟以上缩短到 0.5 秒,令实时部署部署大型语言模型成为可能。
事实上已经有不少企业在使用 NVIDIA DGX SuperPOD 构建大型复杂语言模型,SiDi、京东探索研究院和VinBrai都包括在内。
3
其他AI新进展:Quantum-2
和 Jentson AGX Orin
展望元宇宙的英伟达,在其他产品线方面也保持着持续更新。
首先是推出了可进行云原生超级计算的 Quantum-2 平台,即 400Gbps 的 InfiniBand 网络平台,包括 NVIDIA Quantum-2 交换机、ConnectX-7 网卡、BlueField-3 数据处理器 DPU(数据处理器)和所有支持这种新架构的软件。这也是迄今为止最先进的端到端网络平台。ConnectX-7 将于明年1月问世。
其中,Quantum-2 InfiniBand 交换机基于新的 Quantum-2 ASIC,采用台积电 7nm 节点,包含 570 亿个晶体管,超过有 540 亿晶体管的 A100 GPU。
Quantum-2 InfiniBand 拥有 400Gbps 的高吞吐量,将网络速度提高 1 倍,网络端口数量增加了 3 倍。它在性能提升 3 倍的同时,还将对数据中心网络所需的交换机数量减少了 6 倍,于此同时,数据中心的能耗和空间各减少了 7%。
另外,全球最小、功能强大、能效最高的新一代 AI 超级计算机 NVIDIA Jetson AGX Orin,算力高达 200TOPS ,用于机器人、自主机器、医疗器械和其他形式的边缘嵌入式计算。
Jetson AGX Orin 基于 NVIDIA Ampere 架构,与其前身 Jetson AGX Xavier 保持外形和引脚兼容性一直,不过处理能力扩大至 6 倍,每秒可提供 200 万亿次操作,它类似于支持 GPU 的服务器,但大小仅相当于人的手掌。
新的 Jetson 计算机可加速完整的 NVIDIA AI 软件栈,使开发人员能够部署最大、最复杂的模型,以解决自然语言理解、3D 感知、多传感器融合等边缘 AI 和机器人任务。
4
小结
上周,英伟达市值突破7000亿美元,不少分析师称其市值上涨的背后,是元宇宙在助力,此次GT C大会上表现也确实证明,英伟达以其Omniverse平台为基础,构建了一个元宇宙愿景。
不过,不要忘了,英伟达依然是一家在AI和高性能计算领域有深厚积累的科技公司,除了火热的元宇宙外,此次大会期间,也将有更多有关加速计算、深度学习领域的内容呈现。
互联网巨头的「云」动荡
逃离 AI 赛道的投资人:做局失利、破局无力
道的投资人:做局失利、破局无力