这3个函数，是你学习Numpy的基础！-技术圈

1. 本文介绍

今天为大家介绍以下内容：

Ⅰ ndarray数组与列表的相互转化；
Ⅱ ndarray数组的数据类型转化；
Ⅲ 改变ndarray数组的形状；

说白了，就是讲述3个函数。当然，这只是numpy函数中的冰山一角。这里只是介绍在学习numpy过程中，最先遇到的几个函数。

2. ndarray数组与列表的相互转化

当你学习numpy的时候，我就默认你肯定已经学过Python基础了。对于list列表这个基本数据类型，你肯定不会感到陌生。

那么我们如何实现 “列表” 与 “数组” 之间的相互转化呢？

① 列表转数组：直接将一个列表传入array()函数中

list1 = list(range(10))
print(list1)

array1 = np.array(list1)
print(array1)

结果如下：

② 数组转列表：调用数组的tolist()方法

array2 = np.arange(10)
print(array2)

list2 = array2.tolist()
print(list2)

结果如下：

3. ndarray数组的数据类型转化

记住一句话：numpy中的数据类型转换，不要使用x.dtype修改元素的数据类型，最好用x.astype()这种方式。

① numpy中常用的的数据类型

这里只说明一下numpy中常用的数据类型，int类型和float类型，但是一般都不是直接写int和float的，而是像int32、float64这样的写法，因此我们就简单说一下这个32或64的含义。

在计算机中，最底层执行的是0和1组成的二进制指令，一个0或者1就代表着一个二进制位，又叫"比特位(bit)"，这里的32或64就是代表二进制位。

根据计算机的换算单位，1字节=8二进制位，即"1bytes=8bit"，因此，根据这种换算："32bit-4bytes"、"64bit=8bytes"。

由上述分析，我们现在对int32做一个总结，int32说明了该数组中每个元素的数据类型是int32，同时通过32我们又可以知道，该数组中每一个元素的存储空间是4字节，那么这个范围大致是[-2147483648,2147483647]。

② 使用dtype原地修改数组的数据类型，会出现什么问题？

x = np.array([1.2,3.4,5.6],dtype=np.float64)
print(x)
print(x.dtype)
print(x.nbytes)
# --------------------------------------------
x.dtype="float32"
print(x)
print(x.nbytes)
# --------------------------------------------
x.dtype="float16"
print(x)
print(x.nbytes)

结果如下：

为什么会出现上述现象？

通过上面的测试发现，当我们使用"dtype"修改数组的数据类型的时候，比特位(也就是一个"二进制位”)每压缩为原来的二分之一，数组中的元素个数就会变为原来的两倍。

这是为什么呢?

数组一旦创建，它的数据类型也就定了，也就相当于开辟了一块内存，用于存储这个数组了，下面用一个公式形象说明上述现象的原因。

假设某个数组有x个元素，采用的数据类型是int64，这个数据类型占用的内存大小为8字节，因而整个数组占用的内存大小为8*x。

当数据类型变为int32的时候，数组中数据类型就变成了4字节，通过上面的计10算我们已经知道这个数组开辟的内存为8x，因此元素个数就变成了8x/4-2*x，11 就是说，数组元素变为了原来的2倍。

③ 使用astype()函数修改数组的数据类型：相当于新创建了一个数组

z = np.array([1.5,3.7,4.8])
print(z)
print(z.dtype)

zz = z.astype(np.float32)
print(zz)
print(zz.dtype)

结果如下：

4. 改变ndarray数组的形状

① 使用numpy中的reshape()函数修改数组对象

xx = np.arange(10).reshape(2,5)
xxx = np.reshape(xx,(5,2))
print(xxx)

结果如下：

② 使用数组对象的reshape()方法修改数组对象

yy = np.arange(10).reshape(2,5)
print(yy)

结果如下：

③ 改变数组形状时，如果维度大于1，可以将“最后一个维度”设置为-1

p = np.arange(6).reshape(2,3)
print(p)

q = np.arange(6).reshape(2,-1)
print(q)

结果如下：

注意：可以这样做的原因在于，当你指明了前面的维度，最后一个维度会根据数组元素个数和前面的维度数，自动计算出最后一个维度的维度数，也就是说【维度一 * 维度二 * … * 维度N = 元素个数】。

更多阅读

用 Python 进行 OCR 图像识别

用 XGBoost 进行时间序列预测

5 分钟快速上手 pytest 测试框架

特别推荐

点击下方阅读原文加入社区会员