英特尔开源计算机视觉标注工具CVAT-技术圈

CVAT 旨在为用户提供一套方便的工具来注释数字图像和视频。CVAT 支持与对象检测、图像分类和图像分割有关的监督机器学习任务。它使用户能够用四种类型的形状注释图像：框、多边形（一般和分割任务）、折线（可用于注释道路上的标记）和点（例如，用于注释面部标志或姿势估计） .

此外，CVAT 提供了有助于典型注释任务的功能，例如许多自动化工具（包括使用TensorFlow* 对象检测 API复制和传播对象、插值和自动注释的能力）、视觉设置、快捷方式、过滤器等.

CVAT 很容易通过基于浏览器的界面访问；通过Docker *进行简单部署后，无需进一步安装。CVAT 支持团队之间的协作以及个人的工作。用户可以创建公共任务并在其他用户之间分配工作。CVAT 也非常灵活，支持多种不同的标注场景，多种可选工具，以及嵌入到Onepanel等平台的能力*。CVAT 是为专业注释和算法团队开发的，并得到他们的支持，我们试图提供这些团队认为最有价值的功能。

像许多早期的开源项目一样，CVAT 也有一些已知的限制。其客户端仅在 Google Chrome* 中进行过测试，在其他浏览器中可能表现不佳。尽管 CVAT 支持一些自动测试，但所有检查都必须手动完成，这会减慢开发过程。CVAT 的文档目前有些有限，这可能会妨碍参与该工具的开发。最后，由于 Chrome 沙盒的限制，CVAT 在某些用例中可能会出现性能问题。尽管有这些缺点，但 CVAT 应该仍然是图像注释工作流程的有用工具。此外，我们希望通过未来的发展来解决其中的一些缺点。