JavaScript 深度学习 - 2.基础概念-技术圈

为了更好的阅读体验，欢迎语雀搜索【JavaScript 深度学习】关注

NO.1

Tensor - 张量

从名字也可以看出，Tensor 是 TensorFlow 中最基础的数据结构，Tensor 和一维或多维数组非常相似，在 TensorFlow.js 中，我们也可以直接将数组转换为Tensor。一个 Tensor 包含三个部分

values: 具体的值数字或者数组
shape: 数值的维度，如果不配置，会基于 values 初始化
dtype: 数值的数据类型，如 'float32'|'int32'|'bool' 等类型

Scalar - 标量 ( 0D 张量)

仅包含一个数字的张量叫做标量(Scalar)

scalar = tf.tensor(3.14);
// scalar 推荐使用更有语义化的 tf.scalar 来定义
tf.scalar(3.14).print() //

Vector - 向量 ( 1D 张量)

一维数组的数值成为向量(Vector)

vector = tf.tensor(<a href="https://www.kaggle.com/c/titanic">1, 2, 3], [3])
// vector 推荐使用更有语义化的 tf.tensor1d 来定义
vector = tf.tensor1d([1, 2, 3]).print();

Tensor 的常用操作

类似的，TensorFlow.js 还提供了 tf.tensor2d、tf.tensor3d、tf.tensor4d、tf.tensor5d、tf.tensor6d 等语义化的方法，也推荐大家直接使用。

const a = tf.tensor([[1, 2], [3, 4]], [2, 2], 'int32');
// 获取 shape
console.log('shape:', a.shape); // shape: 2,2
// 获取 dtype
console.log('dtype', a.dtype); // dtype int32
// 修改 shape
a.reshape([4]).print() // Tensor  [1, 2, 3, 4]

NO.2

现实数据的Tensor 转换 - 数据预处理

Tensor 2d的示例

我们以 Kaggle 经典入门数据 - [泰坦尼克号生存预测(https://www.kaggle.com/c/titanic) 为例来介绍一下常见数据表达方式，数据示例

Variable	Definition	Key
survival	是否存活	0 = No, 1 = Yes
pclass	船票等级	1 = 1st, 2 = 2nd, 3 = 3rd
sex	性别	male / female
Age	年龄
sibsp	船上兄弟姐妹/配偶的个数
parch	船上父母/孩子的个数
ticket	船票号码
fare	船票加个
cabin	舱位号码
embarked	启航港的编号	C= Cherbourg, Q = Queenstown, S = Southampton

特征二元化

比如上面的性别，原始数据使用 male 或者 female 来表示，我们可以将其转换成 0 和 1 来表示。

整数编码

比如启航港的编号，我们可以使用1、2、3 分别表示 C、Q、S。

数据补齐

如上图数据，我们可以看到 Age 字段是存在缺失的，常见有以下几种方式来补齐数据

平均值：这个很好理解，如果数值分布没有明显规律，可以使用平均值来补齐数据
分类平均值：如果数据不同分类下的平均值有较大差异，可以使用同类的平均值来进行补齐，比如上述数据通过 parch、slibsp 可以做一些分类，来进行补齐
模型预测: 可以基于已有数据，通过模型求出更准确的补齐

特征离散化

将连续性的值，比如年龄进行离散，更有利于计算和特征的提取，比如我们可以将年龄通过 5 来进行划分，0-5 使用 1 来表达，依次类推表达其他数值。

其他 Tensor 的数据示例

Tensor 3D 常见于时间序列的数据，比如某个时间段的股票价格数据，需要展示时间间隔、价格、样本
Tensor 4D 常见于图片数据，需要展示图片宽度、高度、颜色通道(RGB)、样本
Tensor 5D 常见于视频数据，需要展示视频宽度、高度、颜色通道、时间帧、样本

NO.3

神经网络模型

一个数据模型可以分为 Input(输入数据）、Layer(模型层)、loss（损失函数）、optimizer（优化器）、Output（预测输出值）组成。

Layer - 模型层

你可以通过 TensorFlow Playground(https://playground.tensorflow.org/) 可视化的搭建自己的神经网络以及训练过程

大多数的数据，我们可以使用全连接层来进行处理，对应 TensorFlow 中的 Dense Layer
上一章我们使用的图片数据，可以使用卷积层来优化处理，对应 TensorFlow 中的 Convolution Layer
有顺序的数据，比如文本类，可以使用循环层，对应 TensorFlow 中的 LSTM Layer

损失函数

损失函数用来计算预测值与真实值的差异，模型训练的目的也就是将 loss(损失）最小化的过程。不同的数据类型，需要选择恰当的损失函数，比如对应回归问题，我们可以选择使用均方误差(mean-squared error)，对于二分类问题，可以使用二元交叉熵(binary crossentropy)来计算

优化器

优化器主要基于损失函数的计算对神经网络进行调整，常见的有梯度下降法

实例

const model = tf.sequential();
model.add(tf.layers.dense({units: 250, inputShape: [8]}));
model.add(tf.layers.dense({units: 175}));
model.add(tf.layers.dense({units: 150}));
model.add(tf.layers.dense({units: 10, activation: 'softmax'}));

model.compile({
  optimizer: tf.train.adam(),
  loss: 'sparseCategoricalCrossentropy',
  metrics: ['accuracy']
});

关注数：10亿+ 文章数：10亿+
粉丝量：10亿+ 点击量：10亿+

悬赏博主专区请扫描这里

喜爱数： 1亿+ 发帖数： 1亿+
回帖数： 1亿+ 结贴率： 99.9%

—————END—————

喜欢本文的朋友，欢迎关注公众号 程序员哆啦A梦，收看更多精彩内容

点个[在看]，是对小达最大的支持！

如果觉得这篇文章还不错，来个【分享、点赞、在看】三连吧，让更多的人也看到~