​十大计算机视觉工具

小白学视觉

共 3762字,需浏览 8分钟

 ·

2024-05-27 10:05

点击上方小白学视觉”,选择加"星标"或“置顶”

重磅干货,第一时间送达

       

在过去的几年中,计算机视觉工具已经出现了巨大的增长在过去的十年中,计算机视觉的采用一直在加速发展,由于其在物联网、制造业、医疗保健服务、安全性等领域的应用,近来出现了各种计算机视觉工具的使用激增的趋势。

计算机视觉已经发展到一定程度,在生产和生活中应用广泛。此外,GPU等硬件以及机器学习设备和结构的进步,使计算机视觉在当今时代更加引人关注。一些重要的云服务提供商,例如Google,Microsoft和AWS,都加入了成为开发者行列。但是,选择哪个工具,小编今天大概罗列了一些供大家参考!

OpenCV

OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉和机器学习软件库,可以运行在Linux、Windows、Android和Mac OS操作系统上。[1] 它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。

OpenCV用C++语言编写,它具有C ++,Python,Java和MATLAB接口,并支持Windows,Linux,Android和Mac OS,OpenCV主要倾向于实时视觉应用,并在可用时利用MMX和SSE指令, 如今也提供对于C#、Ch、Ruby,GO的支持

TensorFlow

TensorFlow是一个基于数据流编程(dataflow programming)的符号数学系统,被广泛应用于各类机器学习(machine learning)算法的编程实现,其前身是谷歌的神经网络算法库DistBelief [1] 。Tensorflow拥有多层级结构,可部署于各类服务器、PC终端和网页并支持GPU和TPU高性能数值计算,被广泛应用于谷歌内部的产品开发和各领域的科学研究

TensorFlow 2.0鼓励执行针对图片和语音识别,对象检测,推荐,强化学习等进行了调整的预先准备的模型。此类参考模型使您可以利用独特的最佳实践,并在开始时就建立自己的精英解决方案。

Matlab

MATLAB是美国MathWorks公司出品的商业数学软件,用于数据分析、无线通信、深度学习、图像处理与计算机视觉、信号处理、量化金融与风险管理、机器人,控制系统等领域。

MATLAB是matrix&laboratory两个词的组合,意为矩阵工厂(矩阵实验室),软件主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了传统非交互式程序设计语言(如C、Fortran)的编辑模式。

MATLAB和Mathematica、Maple并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等。MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完成相同的事情简捷得多,并且MATLAB也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也加入了对C,FORTRAN,C++,JAVA的支持。

CUDA

CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。

Theano

Theano是可以在CPU或GPU上运行的快速Python数字库。它是由加拿大蒙特利尔大学的LISA组(现为MILA)创建的。Theano是用于控制和评估数学表达式(尤其是矩阵值表达式)的增强编译器。

SimpleCV

SimpleCV是用于构建计算机视觉应用程序的系统。它使您可以使用各种类似OpenCV,pygame等的大量计算机视觉工具。如果您不希望深入了解图像处理,而只需要完成工作,则可以使用此工具。如果您需要快速进行原型制作,SimpleCV将为您提供最佳服务。

Keras

Keras是一个深度学习的Python库,它结合了不同库的元素,例如Tensorflow,Theano和CNTK。Keras在Tensorflow之上运行,在诸如Scikit-learn和PyTorch等竞争者中处于有利位置。

Keras可以在TensorFlow,Microsoft Cognitive Toolkit,Theano或PlaidML上运行。旨在用于深度神经网络的快速实验,它围绕便利性,测得的质量和可扩展性展开。Keras遵循降低认知负担的最佳实践:它提供稳定且基本的API,并限制了常规用例所需的用户操作数。

GPUImage

它是基于OpenGL ES 2.0的框架,该框架允许将GPU加速的效果和通道应用于实时运动视频、图片和电影。在GPU上运行自定义通道需要大量代码来进行设置和保持。

YOLO

YOLO是一个专门为实时处理而设计的对象检测系统。YOLO是一个先进的实时目标检测系统,由来自华盛顿大学的josephredmon和alifarhadi创建。他们的算法将一个神经网络应用于整个图片,神经网络将图片分割成一个网格,并用检测到的项目标记区域。

BoofCV

BoofCv是用于实时机器人技术和计算机视觉应用程序的开源Java库,该库已获得Apache 2.0许可,可用于学术用途和商业用途。

涵盖了从低层次的图像处理,包括低层次的图像识别和图像处理。


本文仅做学术分享,如有侵权,请联系删文。


         
下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲
小白学视觉公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲
小白学视觉公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群


欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~


浏览 36
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报