“智感超清”之HDR技术落地实践
音视频开发进阶
共 6256字,需浏览 13分钟
·
2021-09-25 15:49
本文由百度智能云-视频云音视频处理技术架构师——邢怀飞,在百度开发者沙龙线上分享的演讲内容整理而成。 内容从百度智能视频云的核心竞争力:“智感超清”出发,梳理了智能视频云相关的产品概念和技术。在详细介绍了HDR技术的概念基础上,结合相关“智感超清”能力,重点分享了HDR技术的应用实践。
智能视频云3.0 & 智感超清介绍
HDR技术概念解析
“智感超清” HDR技术应用实践
01
百度智能视频云3.0&智感超清介绍
百度智能视频云3.0介绍
“智感超清”MCP视频处理产品
第一:智能画质提升 通过AI的手段或其他传统的手段对输入的视频进行预处理,然后再进行转码处理,会带来比远视频更好的视觉体验。其中,智能HDR转换,也是和今天分享强相关的技术。 第二: 智能老片修复 之所以把这个门类单独出来,是因为针对这些老片,我们需要有特定的技术进行修复,以达到升级的用户体验。具体功能包括:划痕去除,噪点去除和智能上色。 第三: 智能视频编辑 这部分是一些基本的视频编码能力。核心都是通过相应的AI技术去实现的。 以上三个功能模块构成了智能视频处理的核心能力。
02
HDR技术概念解析
什么是HDR
更高的亮度范围 相对于 SDR来说,HDR可以达到10000nits的最高亮度。这使得它能够更好地展示明暗对比,在亮度方面,更加贴近人眼的对物理世界的感官认知。(可以参考上图HDR和SDR的效果对比) 更广的色彩范围 上图左下角示例,是一个CIE 1931色彩空间的表达。传统的709领域(即:高清),能够覆盖35.9%的色彩范围,而到了2020领域(即:超高清),已经能够覆盖75.8%的色彩范围。 那么,如何去表达这种更宽的色彩范围呢?需要我们更高的比特也就是更高的位深去表示。 这也对应了HDR的第三个特性: 更深的色深(位深) 基本上hdr都是在10比特,更高的要达到12比特才能达到。以上是我们对HDR效果的一个简单介绍。
HDR端到端系统流程
HDR技术相关概念
Gamma曲线 是一种在传统的SDR显示设备上被广泛使用的转换曲线。 对应的标准是:BT.1886,峰值亮度仅为100nits。 随着显示设备亮度范围的提升、图像编码bit depth的提升,使得传统Gamma校正不再适用HDR的光电转换过程。 PQ曲线 由杜比实验室根据Barten的人眼模型提出的电光转换曲线。峰值亮度可以达到:10000nits。 优点:能够提供更高的亮度范围。 HLG曲线 由BBC和NHK联合提出的光电转换曲线。 优点:兼容SDR的显示和播放。在广电领域被广泛应用。
静态元数据:视频中采用单一的元数据去控制每一帧的色彩和细节,元数据并不会发生变化。易造成某些大动态场景的画面暗部或者高亮细节丢失。 动态元数据:视频中的采用变化的元数据去控制每一帧的色彩和细节。通过动态元数据,我们还可以根据用户的显示情况,利用tone-mapping (色调映射)的算法进行更多的适配。
HDR10:由美国CT组织牵头的一个开放标准。完全开源免费。 HLG:是由BBC和NHK联合开发的高动态范围HDR的一个标准。HLG不需要元数据,能后向兼容SDR。 HDR10+:为抗衡DolbyVision, 由三星推出的一个部分免费的标准。采用的是动态元数据。 DolbyVision:Dolby Vision使用基本层+增强层来实现向下的兼容性。并使用动态元数据来描述所有场景。但它是一个收费标准,授权体系较为复杂。 HDR Vivid:是国产的一个标准。在现有传输曲线和色彩空间标准的基础上,增加动态元数据的描述,开源免费且兼容性好。
03
“智感超清”HDR技术应用实践
典型超高清HDR应用需求
高分辨率 高帧率 色深解析 宽色域 高动态范围 全景声音频
HDR处理流程与需求分析
HDR视频云端编辑能力 SDR素材适配 HDR中间层(Mezz)文件的编码 元数据的生成 元数据的透传
HDR转SDR。 这涉及到重要的色调映射过程。 多种输入格式自动适配。 SDR转HDR。 可以通过AI的方式,将SDR转换为HDR。 HDR格式互转能力。HDR的格式多样,能够支持各种HDR格式互转十分重要,如HDR10转HLG。 HDR元数据的写入、透传。在原始HDR视频基础上,能否在码率压缩后写入,这也对云端能力提出了要求。
HDR终端视频播放 SDR终端视频播放 端上自动适配
HDR转SDR
SDR转HDR
基于AI的端到端SDR转HDR方案
采用全局/局部信息融合的方式。 采用Residual Connection残差学习。 Squeeze-Excitation,channer维度自注意力算法加持。 超高清预测分辨的速度快。
HDR格式之间的转换
HEVC HDR支持
VUI信息 描述编码信号的参数或属性、色彩空间、传输曲线等信息。 SEI信息 描述制作的描述性信息(或色彩容积转换)、Tone mapping信息、Color remapping信息、Knee function信息。 对HDR元数据的解析也是非常重要的能力。 只有将原视频的HDR元数据保存并解析下来,才能将处理完的元数据写入以保持HDR的效果。
“智感超清”HDR客户落地案例
在广电领域行业,能够满足用户标清、高清到4k转换的需求。 在电影行业,通过AI技术对老片进行修复,做超高清处理,提升整个在处理过程中的效率,降低成本消耗,同时让老旧片子真正重新焕发生命力。 在新媒体行业,依托百度智感超清的诸多能力优化视频体验,也增加了很多视频编辑能力,包括非线编能力,极大的提升编辑在创作内容过程中的效果。 在互联网领域,服务于互联网视频用户,一方面提升了视频质量,另一方面降低了带宽成本 解决UGC场景下视频质量较差的问题。 以上是老师的全部分享内容。
百度开发者沙龙全场景音视频技术解析第三期,将于9月23日19:00进行,届时邀请到百度智能云视频云技术架构师——柯于刚老师做客直播间,为大家揭秘音视频抗弱网技术。扫描下方二维码报名,锁定精彩!
评论