NumPy 获取唯一元素、出现次数、展平数组

Python与算法社区

共 4060字,需浏览 9分钟

 ·

2021-06-13 21:07

你好 ,我是 zhenguo


本篇文章介绍2个 NumPy 高频使用场景,以及对应的API及用法,欢迎学习。


1 如何获得唯一元素和出现次数

使用np.unique可以很容易地找到数组中唯一的元素。

例如,如果从这个数组开始:

>>> a = np.array([111112131415161712131114181920])

可以使用np.unique打印数组中的唯一值:

>>> unique_values = np.unique(a)
>>> print(unique_values)
[11 12 13 14 15 16 17 18 19 20]

要获取NumPy数组中唯一值的索引(数组中唯一值的第一个索引位置的数组),只需在np.unique()中传递return_index参数:

>>> unique_values, indices_list = np.unique(a, return_index=True)
>>> print(indices_list)
0  2  3  4  5  6  7 12 13 14]

可以将np.unique()中的return_counts参数与数组一起传递,以获取NumPy数组中唯一值的频率计数。

>>> unique_values, occurrence_count = np.unique(a, return_counts=True)
>>> print(occurrence_count)
[3 2 2 2 1 1 1 1 1 1]

这也适用于二维数组!如果从这个数组开始:

>>> a_2d = np.array([[1234], [5678], [9101112], [1234]])

可以通过以下方式找到唯一的值:

>>> unique_values = np.unique(a_2d)
>>> print(unique_values)
1  2  3  4  5  6  7  8  9 10 11 12]

如果未传递axis参数,则二维数组将被展平。

如果要获取唯一的行或列,请确保传递axis参数。若要查找唯一的行,请指定axis=0,对于列,请指定axis=1

>>> unique_rows = np.unique(a_2d, axis=0)
>>> print(unique_rows)
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]

要获取唯一行、索引位置和出现次数,可以使用:

>>> unique_rows, indices, occurrence_count = np.unique(
...      a_2d, axis=0, return_counts=True, return_index=True)
>>> print(unique_rows)
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
>>> print(indices)
[0 1 2]
>>> print(occurrence_count)
[2 1 1]

2 重塑和展平多维数组

有两种常用的展平数组的方法:.flatten().ravel()

两者之间的主要区别在于,使用ravel()创建的新数组实际上是对父数组的引用(即“视图”)。这意味着对新数组的任何更改也将影响父数组。因为ravel不创建拷贝,所以它的内存效率很高。

如果从这个数组开始:

>>> x = np.array([[1 , 234], [5678], [9101112]])

可以使用“flatten”将数组展平为1D阵列

>>> x.flatten()
array([ 1,  2,  3,  4,  5,  6,  7,  8,  9101112])

使用“flatten”时,对新数组的更改不会更改父数组。

>>> a1 = x.flatten()
>>> a1[0] = 99
>>> print(x)  # Original array
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
>>> print(a1)  # New array
[99  2  3  4  5  6  7  8  9 10 11 12]

但是使用ravel时,对新数组所做的更改将影响父数组。例如:

>>> a2 = x.ravel()
>>> a2[0] = 98
>>> print(x)  # Original array
[[98  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
>>> print(a2)  # New array
[98  2  3  4  5  6  7  8  9 10 11 12]


若有帮助,可否点赞支持。另外,你还可以通过点击 阅读原文 学习更多NumPy入门系列文章。
浏览 5
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报