OrillusionWebGPU 轻量级 3D 渲染引擎

联合创作 · 2023-09-23 02:53

Orillusion 是一套基于 WebGPU 图形 API 的 Web3D 渲染引擎,能够媲美 PC 端图形 API 的渲染能力。Orillusion 引擎中使用了非常多的 GPU 开放能力,比如灵活操作的 GPU 缓存(GPU Buffer),强大的着色器(Webgpu Shader/WGSL),以及备受瞩目的 Compute Shader 计算内核,充分发挥 GPU 在非光栅化阶段的并行处理能力。

WebGPU 支持

引擎底层没有考虑到兼容现有的 WebGL 标准,而是完全向最新的 WebGPU 标准看齐。随着WebGPU API 和 WGSL 的持续发展,开发团队也将快速更新迭代引擎底层 WebGPU 的计算和渲染能力,提升引擎性能优势。

ECS 组件式系统

引擎框架发展至今,业内普遍开始采用 组合优于继承 的开发设计原则。因此,开发团队放弃继承式架构,而选择了最新的 ECS 组件式架构做为引擎的成体设计思路。消除了继承模式中的继承链复杂,功能交织的问题,通过解耦,封装和模块化重新的设计,开发者可以更灵活的进行功能组合及扩展。

面向数据(DO)设计

严格的 ECS 架构要求,要求 EntityComponent 和 System 要完全独立分隔。这种设计范式下对于数据优化和性能是可以得到更大的提升。但是同时也会带来很大的负面问题就是开发成本和难度非常大。因此考虑到开发者的使用难度,以及Web开发者的开发习惯。采用了 ECS 中核心 Data Oritented (面向数据开发) 理念,实现按需 DO 的结构。目前的使用方式为,在 GPU 中创建连续内存,同时在 CPU 和 GPU 之间通过内存映射的方式,实现数据的连续高效传递,减少 CPU 和 GPU 之间数据交换的等待时间和次数。既能提高缓存命中率,实现性能的提升,也同时可以保证整体引擎开发和使用的易用性。

集群光照剔除

这里也就是 Clustered Forward Rendering 中的光照剔除方案。在二维 (Tile) 和三维 (Cluster) 同时对于空间进行块状分割,最后只计算对这个块状空间有光照贡献的光源,完成无效光源的剔除过程,提高计算效率。基于 WebGL 的 Uniform Buffer 有很多限制,光源数量支持比较少,一般在10个以内。WebGPU 有了具备了 Storage Buffer,基本上就是直接对标 GPU 显存的限制。只要做好自身的内存管理和优化,就可以充分利用GPU的能力,实现多光源渲染的场景。

物理仿真系统

首先接入了 ammo.js,做为CPU端的基本物理仿真功能实现。同时正在搭建基于Compute Shader 的 GPU 端物理仿真引擎,包括粒子,流体,软体,刚体,布料等。在WebGL 时期,只能依靠顶点和纹理的数据结构进行相应的计算过程,实现复杂,效率不高。通过WebGPU 的 Compute Shader,内存和数据结构更加灵活,给了很大的想象空间。目前已经实现了很多优秀的物理仿真案例,更多更强的物理仿真的功能正在快速迭代过程中。

基于物理的材质渲染

实现了最基本的 Blinn-phong 模型材质渲染。为了增加更好的真实感渲染效果,依靠 HDR Light ,也实现了基于 PBR (Physically-based rendering) 的材质渲染。也是目前主流引擎的标配了,是一项比较普及的基本引擎要求。

丰富的后处理特效

后处理特效 是使得渲染内容氛围感提升的重要处理方式。基于 WebGPU 的 compute shader,目前实现了 HDR 泛光屏幕空间反射环境光屏蔽 等常用的后处理效果。依靠 WebGPU 的通用计算能力可以更高效的利用 GPU 计算优势,实现非常好的效果。

例如,屏幕空间反射 (SSR) 是基于屏幕空间大小来实现反射效果。相比平面反射,可以实现场景任意表面反射,而且不需要额外的 DrawCall,是非常流行的实时反射技术。首先,屏幕空间物体的每个像素需要计算其反射向量。然后,需要判断屏幕空间的 Ray Marching 坐标的深度和深度缓存中存储的物体深度是否相交。最后,适当的调节粗糙度,把交点的颜色做为反射颜色完成着色。这个过程中的计算过程,都通过 WebGPU 的 Compute Shader 来实现,避免了 CPU 的消耗。最终在浏览器中可以呈现出非常良好的反射效果。

更多扩展后处理特效参考 PostEffects

 

 

Orillusion引擎使用结构清晰且高效的ECS组件系统为基础,利用WebGPU开放能力,尤其是强大的GPU缓存与计算内核,对比传统的Web端引擎,在性能,效果和易用性上都有了飞跃式的提升:

  • 性能:得益于多种GPU缓存与全局连续内存机制的使用;

  • 效果:通过合理的光照系统、丰富的后处理特效、粒子系统等整体灵活的相互间配合,可以让三维场景更贴合实际,有效的满足繁杂业务的展示需求;

  • 易用性:不单单受ECS组件系统的提升,许多已封装的API同样带来了更加便捷的使用方式,可以降低开发者的学习难度和维护成本。

浏览 5
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报