dToF与iToF技术解析-技术圈

点击下方卡片，关注“新机器视觉”公众号

重磅干货，第一时间送达

苹果公司近期正式推出了新款iPad Pro，吸引了不少人的关注。在官方的宣传标语中，有一句话尤其引人关注，“它的Pro级摄像头打通了真实和虚拟的交界”。

新款iPad Pro搭载的Pro级摄像头不仅包含了全新的超广角摄像头，还包含了一款激光雷达扫描仪。该扫描仪利用dToF技术，结合运动传感器和iPadOS内的架构，可以进行深度测量，为增强现实及更广泛的领域开启无尽可能。

那么dToF是什么呢，它和我们之前市面上已有的iToF又有什么不同呢？

本文将会介绍dToF和iToF的成像原理，对比分析dToF和iToF两者的差异性，带领大家了解一下ToF领域。

一．TOF

首先，让我们先来了解一下ToF的基本概念。

Time-of-Flight(ToF)，顾名思义，是一种利用光飞行时间的技术。接触过3D视觉的读者应该知道，ToF和结构光、双目立体视觉是近年来三种主流的3D成像方式。ToF向场景中发射近红外光，利用光的飞行时间信息，测量场景中物体的距离。ToF相比较另外两种3D成像方式，深度信息计算量小，抗干扰性强，测量范围远。种种优势推动了ToF在机器人、交互以及其他工业领域中的应用。尤其是在移动端，已有多品牌手机，比如华为、OPPO、苹果，将其用于手机后置摄像。

二．dTOF和iTOF

了解了ToF的概念之后，让我们再来深入了解一下两类ToF的基本成像原理，也就是文章标题中提到的iToF和dToF。

dToF，全称是direct Time-of-Flight。顾名思义，dToF直接测量飞行时间。dToF核心组件包含VCSEL、单光子雪崩二极管SPAD和时间数字转换器TDC。Single Photon Avalanche Diode(SPAD)是一种具有单光子探测能力的光电探测雪崩二极管，只要有微弱的光信号就能产生电流。dToF模组的VCSEL向场景中发射脉冲波，SPAD接收从目标物体反射回来的脉冲波。Time Digital Converter(TDC)能够记录每次接收到的光信号的飞行时间，也就是发射脉冲和接收脉冲之间的时间间隔。dToF会在单帧测量时间内发射和接收N次光信号，然后对记录的N次飞行时间做直方图统计，其中出现频率最高的飞行时间t用来计算待测物体的深度。

图1是dToF单个像素点记录的光飞行时间直方图，其中，高度最高的柱对应的时间就是该像素点的最终光飞行时间。

dToF的原理看起来虽然很简单，但是实际能达到较高的精度很困难。除了对时钟同步有非常高的精度要求以外，还对脉冲信号的精度有很高的要求。普通的光电二极管难以满足这样的需求。而dToF中的核心组件SPAD由于制作工艺复杂，能胜任生产任务的厂家并不多，并且集成困难。所以目前研究dToF的厂家并不多，更多的是在研究和推动iToF。

iToF的概念和dToF相对应，全称是indirect Time-of-Flight，直译就是间接光飞行时间。所谓间接，就是指iToF是通过测量相位偏移来间接测量光的飞行时间，而不是直接测量光飞行时间。

iToF向场景中发射调制后的红外光信号，再由传感器接收场景中待测物体反射回来的光信号，根据曝光（积分）时间内的累计电荷计算发射信号和接收信号之间的相位差，从而获取目标物体的深度。如图2所示。

图2. iToF成像原理示意图[1]

iToF模组的核心组件包含VCSEL和图像传感器。VCSEL发射特定频率的调制红外光。图像传感器在曝光（积分）时间内接收反射光并进行光电转换。曝光（积分）结束后将数据读出，经过一个模拟数字转换器再传给计算单元，最终由计算单元计算每个像素的相位偏移。iToF计算深度的方式通常是采用4-sampling-bucket算法，利用4个相位延迟为0°，90°，180°和270°的采样信号计算深度。如图3所示

图3. 连续波调制方式测相位偏移原理示意图[2]

三．性能对比

dToF和iToF虽然都是利用光飞行时间技术，但是两者在测距原理和硬件实现上都有差异。软硬件的差异会导致这两类ToF在各方面的性能表现上各有千秋。

衡量ToF的性能指标，需要考虑几个方面。因为ToF是一个可以测距的相机，作为一个测距设备，基本的评价指标有测距精度和有效探测距离。其次，作为相机而言，图像分辨率也是一个重要的评价指标。此外，由于ToF本身只能提供3D信息，它将来更多的发展是集成到3D相关的应用，比如3D建模、AR以及移动平台。在集成到其他3D相关的应用时，尤其是移动端和机器人平台，必须要考虑它的能耗和成本，以及在各种复杂场景下的抗干扰能力。以上的这些特性，决定了dToF和iToF有着各自适用的应用场景。

接下来，本文会从精度、有效探测距离、图像分辨率、能耗、成本、抗干扰等7个方面，对比iToF和dToF的优劣。

精度

总的来说，目前的iToF深度精度在 cm 级，并且随着测量距离的增大，反射光的强度减小，相位测量的信噪比减小，绝对误差也会随之增大。

有效探测距离

有效探测距离指相机能够输出可靠深度的距离范围，可靠深度意味着该深度值和真实值的误差小于一定阈值。举个简单的例子，假设测量误差在2cm以内时，我们视作该深度值是可靠的。如果一个ToF模组测量5米的物体时，测量值是5.02米，误差刚好达到了预先定义的极限。当物体位于5.01米时，测量值是5.22米，误差超出了2cm。我们就可以说该ToF模组的有效探测距离是5米。

当然，限制ToF的有效探测距离的主要因素之一是相位模糊现象。

对于dToF而言，当测量距离较远时，光飞行一个来回的时间超过了两次连续发射脉冲的间隔，传感器在发射第二个测量信号后，才接收到第一个测量信号的反射波，就会把该反射波错认为是第二个测量信号的近距离反射波，这时就会出现相位模糊现象。如图4所示。图4中case1表示的是近距离场景下dToF的测距原理图，case2表示的是远距离场景下，发生相位模糊现象的测距原理图。

§ dToF会受到测量频率（相邻两次测量的间隔时间）限制，iToF的有效探测距离会受到调制光的频率限制。dToF在测量远距离物体时，可以适当增加两次测量之间的间隔，减少测量次数。但是，减少测量次数会同时降低测量精度，相当于是用精度换取有效探测距离。而iToF也可以通过降低调制光的频率，从而牺牲一定的测量精度以获得更远的有效探测距离。
对于iToF而言，可以利用双频解决相位模糊现象。利用两个不同频率的测量数据去求解相位模糊度，从而恢复正确深度值。借助双频测量可以同时实现高精度测量和高有效探测距离。

能耗

从发射信号来看， dToF则采用级的脉冲激光，iToF目前大多采用连续波调制。相比较而言，脉冲波能够达到超低占空比，所以功耗也较低。

从光照模式来看，由于dToF的测量精度不会随着测量距离的增大而降低，所以功耗也会相对较低。反之，iToF目前采用的大多是面光发射方式。并且，随着测量距离的增大，iToF需要提高光照功率或者延长曝光时间来获取更高的精度，所需的功耗也会大幅增加。

成本

dToF采用的是数字电路架构，不需要模数转换。iToF采用的是模拟电路结构，需要模数转换芯片。

对于整体的硬件架构而言，dToF的核心组件SPAD的制作工艺复杂，现有的资源少。iToF没有这方面的顾虑。

在系统集成方面， dToF还需要额外的时间处理电路，系统集成难度较高。iToF的系统集成容易，不需要额外的测量电路。

抗环境干扰

环境干扰包括场景中环境光干扰、多路径反射光干扰以及不同表面灰度等影响。这一类环境干扰发生在外界，和ToF本身的关系不大，环境干扰的差异主要是由不同ToF的测距原理引起的。

dToF单帧深度图获取时，会经历多次重复测量，并且采用时间直方图统计的方式计算飞行时间，比较容易区分信号中的干扰成分。抗环境干扰能力更强。

iToF在曝光阶段，部分环境光混杂在调制光中被传感器接收，然后计算相位偏移。无法从单次测量的结果中区分出环境光引起的干扰。环境光越强，相应的，引起的深度误差也越大。

应用场景

dToF功耗低，并且体积小巧，更加适合工业机器人等需快速进行测距避障检测的应用，以及其他在空间受限的紧凑型设计中。

dToF抗环境干扰表现比较好，目前在户外场景下的测距精度比iToF更加高，在户外应用场景中也比较占优。

dToF的时间分辨率高，测量距离增大时精度不会大幅衰减，能耗也不会大幅提升，在AR应用中的优势也比较显著。

iToF的图像分辨率较高，在物体识别，3D重建以及行为分析等应用场景中能够重现场景中更多的细节信息，在机器人、新零售等应用领域占优。

dToF和iToF两者的目标都是输出一幅高质量的深度图像，所以两者都需要深度数据层面的滤波和噪声修正，比如空域滤波、点云域的噪声滤波以及非一致性像素校准等。此外，两者都拥有透镜成像系统，所以无论是dToF还是iToF，都需要透镜失真补偿。硬件的温度变化带来的噪声也同时存在于两种ToF中，所以温度补偿也是两者所必需的。

dToF是发射脉冲波，而不是特定频率的调制波，所以dToF不需要做和调制光的频率相关的处理，包括频率校准、自动频率选择、高动态范围（HDR）。但是dToF的发射脉冲也有一定的频率，即相邻两个发射脉冲之间的时间间隔，dToF的频率校准和发射脉冲的频率相关。dToF仅仅输出深度图，而iToF同时输出深度图和幅值图，所以dToF不需要做幅值校准。

此外，由场景干扰引起的多径、相位模糊、运动模糊、内反射等都是两者所共有的问题，虽然dToF因为成像原理的特性具有更好的抗环境干扰能力，但是还是会受到这一类场景干扰的影响。不过不同的是，因为dToF和iToF的成像原理不同，两者所需要的深度修正方式也会有所差异。

dToF和iToF两者因为测距原理和硬件架构的不同，各方面的性能互有优劣，适用场景也不尽相同。两者均面临场景的适应性，如何在任意场景下获取可靠和准确的深度数据是非常大的技术挑战，是ToF技术普及的关键。ToF应用技术的普及有赖于3D ISP增强引擎来消除干扰，降低功耗，提高实时性能；需要面向3D行业的ISP IP及中间件，有力支撑上层应用。所以说3D ISP是3D成像市场爆发的必要条件。数迹智能团队正在研发3D ToF ISP Smart3D-ISP，以ISP技术为核心系统性地提升无论是dToF还是iToF的性能并降低功耗和成本是多年来的研发目标，将我们的3D ToF技术植入每部手机、每辆汽车、每个机器人、每台家电，从而改变机器对世界的“看法”，实现深度的智能。

参考文献

[1] Foix S , Alenya G , Torras C . Lock-in Time-of-Flight (ToF) Cameras: A Survey[J]. IEEE Sensors Journal, 2011, 11(9):1917-1926.
[2] L. Li, Time-of-Flight Camera—An Introduction, Texas Instruments-Technical White Paper.
[3] John Kvam (2017), Time of Flight: Principles, Challenges, and Performance [pdf file].

来源：知乎，作者：吴建明wujianming

本文仅做学术分享，如有侵权，请联系删文。

—THE END—