推荐5最佳免费图像注释工具
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
图像标注是有监督机器学习中的数据标注技术之一,要做图像注释,必须需要一个专用的注释工具,现在有很多图像注释工具。
在本文中,我们将根据在项目中使用它们以及我们寻找最适合使用的工具时的个人经验,为你们推荐五个最好的免费图像注释工具。
imglab是我们尝试过的最新工具,此工具是基于web的工具,但你们也可以在本地安装。这本身就是一个优势,因为你们可以访问该网站并启动注释项目。此外,不需要任何登录。
这是imglab必须提供的功能列表,它做到了上面所说的。非常好的工具,易于访问的网站,非常简单,用户友好的界面。
VoTT是Microsoft的一个注释工具,它有几个与其他工具不同的有趣特性。此工具的安装非常简单,因为你们只需根据自己的操作系统从Github页面下载安装程序即可。
VoTT提供了主动学习,但我们很少使用它。你们可以在主动学习功能中选择预测标记和自动检测。除了图像注释外,该工具还可用于视频注释。VoTT还支持多种导出格式,如Azure自定义Vision服务、CSV、CNTK、Pascal VOC、Tensorflow记录和VoTT Json。为了方便你们注释图像,可以在VoTT中探索许多功能,缺点是VoTT中的注释类型仅限于矩形和多边形。
CVAT是Intel开发的计算机视觉注释工具,除了图像注释外,CVAT还像VoTT一样支持视频注释。这个工具背后的人还专门制作了一个关于CVAT的youtube视频,但是现在它已经过时了,因为CVAT已经有了很多改进,单从界面上就可以看到。CVAT最棒的地方是它的界面整洁,同时还加入了很多功能。你可以选择五种类型,其中包括一个长方体,这是很多工具都没有的,而这个叫做“AI工具”的功能也没有机会使用它。至于安装,它不是最容易安装的工具,因为你们首先需要docker。
labelimg是我在图像标记方面的第一个工具。这是我第一次接触到图像标签,因为我以前的项目或工作是为语音识别注释音频。
作为当时的第一个计时器,我惊讶于安装工具和启动程序是多么容易。由于用户界面友好,理解该工具也不难。此工具的缺点是,它只提供一个形状,即边界框或矩形形状。你们可以在GitHub页面上通过编程添加另一个形状,但我不是程序员,所以我不能这么做。
labelimg还提供了两种类型的文件,你们可以将文件保存到其中。第一个是PascalVOC,第二个是YOLO。尽管如此,对于初学者来说,它仍然是一个很棒的工具,如果你们的项目仅依赖于边界框,那么这个工具非常适合。
这是我目前用于图像注释项目的最佳工具。labelme在易于安装和界面方面与labelimg更为相似,它们之间的区别在于labelme具有一些特性,使我将其用作日常注释工具。
在我看来,最好的特性之一是右下角的“文件列表”。当你们有很多图像需要注释时,可能会忘记对其中一些图像进行注释。这就是为什么“文件列表”很方便,因为它不仅列出了你们的文件,而且还为已经注释的每个文件提供了一个复选标记。
在labelme中,可以自由选择它拥有的六种类型,从多边形、矩形、圆形、直线、点和线条开始。labelme提供了注释图像的灵活性,同时也易于使用。labelme对我来说唯一的缺点是它只能以JSON格式保存文件。但是,如果ml工程师对格式没有意见,这也不是问题。
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~