如何将月度数据转换成日度数据?
Rex不辣不辣
共 953字,需浏览 2分钟
·
2022-02-20 10:11
当我准备用LSTM神经网络模型去预测商品的价格的时候,其中考虑到了与商品有关的如销量,价格,人均可支配收入,cpi等维度。问题是这些维度有一些是以天为单位的,有些是以月为单位的,只有统一了单位才可以进行模型训练。我看到有很多类似价格预测的文献里,作者有提到用插值法将月度数据转换为日度数据,但是没有提到具体怎么操作。我在百度上搜,大多数是将日度数据转换成月度数据,很少看见有用的方法。今天这里就想教大家怎么将月度数据合理的转换成日度数据。假如我们有以下月度数据:
该如何将他们转成日度数据呢?
方法一:
当月的每一天都按照月度数据填补,如:
这样操作起来最简单,但是失去了一些数据的规律性和连贯性。
方法二:
插值法(interpolation),如:
这样是不是就看起来合理了许多,但是可能离真实情况可能还是有很大差别,但是比方法一更容易接受和理解。
俗话说,巧妇难为无米之炊。当我们缺少需要的日度数据的时候,用插值法就是一个很好的办法。
下面是具体的例子:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df=pd.read_excel('cpi 月.xlsx')
y1=df['fruit_cpi']
x1=df['Date']
plt.plot(x1,y1)
df.shape
df1=df.set_index('Date').resample('D').interpolate()
date = pd.date_range(start='04/01/2018', periods=len(df1.index))
df1.insert(0,'Date',date,True)
y_afterIp=df1['fruit_cpi']
x_afterIp=df1['Date']
plt.plot(x_afterIp,y_afterIp)
df1.shape
数据的行数就从36变到了1066,意味着我们把三年的月度数据转换成了三年的日度数据。而plot出来的图与之前并没有什么大的改变,意味着我们保留了数据的规律性。
如果有不足之处,欢迎评论区里指出来,十分感谢🙏。
评论