【深度学习】每个数据科学家都必须了解的 6 种神经网络类型

机器学习初学者

共 1942字,需浏览 4分钟

 ·

2021-03-25 11:54

神经网络是强大的深度学习模型,能够在几秒钟内合成大量数据。有许多不同类型的神经网络,它们帮助我们完成各种日常任务,从推荐电影或音乐到帮助我们在线购物。

与飞机受到鸟类启发的方式类似,神经网络(NNs)也受到生物神经网络的启发。虽然原理相同,但过程和结构可能大不相同。下面我来介绍一下每个数据科学家必须了解的 6 种神经网络类型。

神经网络的6种基本类型

现在,我们了解神经网络是如何工作的,让我们看看深度学习中使用的神经网络的各种类型和功能:

  • 感知器
  • 多层感知器
  • 卷积神经网络
  • 循环神经网络
  • 长期短期记忆网络
  • 生成对抗网络

1、感知器

感知器是最简单的神经网络结构。此模型也称为单层神经网络,仅包含两个层:

  • 输入层
  • 输出层

这里没有隐藏的图层。感知器采用输入并计算每个输入节点的加权输入。此加权输入通过激活函数生成输出。由于体系结构简单,它不能用于复杂的任务。

2、多层感知器

多层感知器(MLP)通常表示完全连接的网络。换句话说,一个层中的每个神经元都连接到相邻层中的所有神经元。因此,MLP 具有比感知器更高的处理能力。但是,这些网络的"完全连接性"使得它们容易出现数据过度拟合。减少过度拟合的典型方法包括提前停止、添加辍学层和添加正则化术语。

3、卷积神经网络

人类使用眼睛中的神经元来识别物体,这些神经元可以检测边缘、形状、深度和运动。卷积神经网络(CNN)是计算机视觉中最重要的神经网络类型之一,其灵感来自眼睛的视觉皮层,用于物体检测等视觉任务。CNN 的卷积层是它与其他神经网络区别开来的地方。此层执行点产品,即组件乘法,然后是加法。

在 CNN 的初始阶段,筛选器是随机的,不会提供任何有用的结果。使用损耗函数,调整筛选器,通过多次迭代,网络在实现其任务(例如检测对象边缘)方面更上一个。尽管 CNN 通常需要大量的训练数据,但它们广泛适用于各种图像甚至语言任务。CNN的灵感来自视觉皮层,因此它们广泛用于涉及计算机视觉应用的应用。这些应用包括面部识别、人脸检测、物体识别、手写信件识别和医疗诊断中肿瘤的检测。

4、循环神经网络

当我们阅读特定的章节时,我们并不试图孤立地理解它,而是与前几章有关。同样,就像自然神经网络一样,机器学习模型需要利用已经学习的文本来理解文本。

在传统的机器学习模型中,这是不可能的,因为我们不能存储模型的前几个阶段。但是,循环神经网络(通常称为 RNN )是一种神经网络类型,可以为我们做到这一点,这使得它们对于需要使用过去数据的应用程序非常有用。让我们仔细看看下面的 RNN。

循环神经网络是旨在解释时态或顺序信息的网络。RNN 使用序列中的其他数据点进行更好的预测。他们通过输入和重用序列中以前节点或以后节点的激活来影响输出来达到此目的。

RNN 通常用于连接序列应用,如时间序列预测、信号处理和手写字符识别。此外,RNN广泛应用于音乐生成、图像字幕和预测股市波动

5、长期短期记忆网络

在 RNN 中,我们只能保留最近阶段的信息。但对于像语言翻译这样的问题,我们需要更多的保留。这就是 LSTM 网络擅长的地方。

为了学习长期依赖性,我们的神经网络需要记忆能力。LSTM 是 RNN 的一个特例,可以做到这一点。它们具有与 RNN 相同的链式结构,但具有不同的重复模块结构。这种重复模块结构允许网络保留大量上一阶段值。我已经提到LSTM网络对于语言翻译系统的强大功能,但它们有广泛的应用。其中一些应用程序包括序列到序列建模任务,如异常检测、语音识别、文本总结和视频分类。

6、生成对抗网络

给定训练数据,生成对抗网络(或简单地说,GAN)会学习使用与训练数据相同的统计信息生成新数据。例如,如果我们在照片上训练一个 GAN 模型,那么训练有素的模型将能够生成类似于输入照片的新照片。

GAN 包含两个部分:一个生成器和一个鉴别器。生成器模型创建新数据,而鉴别器尝试从生成的数据中确定真实数据。随着生成器和鉴别器在各自的工作上做得更好,生成的数据因此得到改善,直到(理想情况下)质量与训练数据几乎相同。GAN 通常用于为游戏和动画电影创建卡通图像或面孔。此外,GAN 可以帮助从少量数据生成合成数据,以帮助改进机器学习模型。

往期精彩回顾





本站qq群851320808,加入微信群请扫码:

浏览 87
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报