NumPy 的 nan 如何理解？-技术圈

Python与算法社区

第439篇原创，干货满满

值得星标

三步加星标

你好，我是 zhenguo

Python 中表示空数据使用 None，它是 NoneType 类型，如下所示：

In [59]: type(None)            
Out[59]: NoneType

NoneType 类型没有对外公开属性和方法：

因此，None 比较容易理解，就是一种空类型。

但是使用过 NumPy 的肯定都会接触到 nan 这种类型，它的其他写法：NaN或 NAN，查看其类型却发现是 float 类型：

In [63]: type(np.nan)                    
Out[63]: float

这不免让人心生疑惑，nan 不是空数据，而是浮点数，那么到底等于多少？

原来这并不是NumPy特有的数值，而是IEEE754规定的特殊浮点数之一。

特殊在哪里？

这就要知道计算机是如何表示浮点数的，IEEE754 标准中规定 float 单精度浮点数，在机器中表示用 1 位表示数字的符号，用 8 位表示指数，用 23 位表示尾数，即小数部分，如下图所示：

关于浮点数表示更加详细的解释可参考下面链接，在此不详细展开：

https://blog.csdn.net/k346k346/article/details/50487127

对于单浮点数，指数部分由8位组成，所以取值范围：0到255，而指数等于0，255 这两个值，IEEE754 标准有特别的规定：

1. 当指数等于0，并且小数点后所有位全为 0，则这个数为 0

2. 当指数等于255，并且小数点后所有位全为 0，则这个数为无穷，当符号位为0时正无穷 float('inf')，当符号位为1时负无穷 float('-inf')

3. 当指数等于255，并且小数点后至少一位不为 0，规定此浮点数为 nan，表达的含义：not a number ，不是一个数

以上就是 NumPy 中 nan 的解释，弄清楚本质后，再来看几个关于它的运算。

既然 nan 不是一个数，所以拿它与任何浮点数比较，返回结果都是 False：

In [64]: np.nan < 0                    
Out[64]: False

In [65]: np.nan == np.nan                     
Out[65]: False

In [66]: np.nan < np.inf                     
Out[66]: False

找出 np.nan 出现的索引位置，可以使用 isnan 方法：

In [67]: a = np.array([-9,np.nan,10,np.nan])
# 找出np.nan出现的索引
In [68]: a.where(np.isnan(a)) 
# 返回结果
# (array([1, 3]),)

更多关于NumPy的用法，可参考我之前推过的一个100 页 NumPy 精华PDF，很不错，还没看到的可以微信我，备注：精华

不必打赏

给我点个赞

就心满意足了