【数据竞赛】时间序列竞赛炸榜技巧
时间序列元特征
在时间序列等相关的问题中,除了许多传统的时间序列相关的统计特征之外,还有一类非常重要的特征,这类特征并不是基于手工挖掘的,而是由机器学习模型产出的,但更为重要的是,它往往能为模型带来巨大的提升。
在实际的竞赛中也是百试不爽,基本每次使用都可以带来一定的提升,屡试不爽。
对时间序列抽取元特征,一共需要进行两个步骤,第一步抽取元特征,第二步则是将元特征拼接到一起重新训练预测得到最终的预测结果。
元特征抽取
元特征抽取部分,我们先把数据按时间序列分为两块,
使用时间序列的第二块数据训练模型得到模型2; 使用模型1对第二块的数据进行预测得到第二块数据的元特征,使用模型2对第测试集的预测得到测试集元特征;
最终预测
接着元特征抽取部分得到的元特征,将元特征做为新的特征加入重新得到新的模型并重新进行预测得到最终的结果。
# train_data1,train_data2,test_data
## step1
model_meta1 = train_model(train_data1)
model_meta2 = train_model(train_data2)
meta_feature1 = model_meta1.predict(train_data2)
meta_feature2 = model_meta2.predict(test_data)
## step2
model = train_model([train_data2,meta_feature1])
pred = model.predict([test_data,meta_feature2])
适用于所有的时间序列预测问题。
往期精彩回顾 本站qq群955171419,加入微信群请扫码:
评论