【读书报告】金融数据挖掘

志扬工作室

共 1054字,需浏览 3分钟

 · 2021-03-01

Start:关注本公众号后,可直接联系后台获取排版美化的详细文档!

Hints:本篇文章所编纂的资料均来自网络,特此感谢参与奉献的有关人员。


  • 序言

 好记性不如烂笔头。读过的书,不管好与坏,做个笔记,方便日后回顾。


  • 章节

数据挖掘的定义:

数据挖掘是从大量的,不完全的,有噪声的,模糊的,随机的实际应用数据中,提取隐含其中的,人们事先不知道的,但又潜在有用的信息和知识的过程。


数据挖掘的方面:

-数据

数值数据、文本数据、图形数据、音频数据、视频数据

-方法

过程:数据准备、数据处理、解释或预测

-目的

数据挖掘的主要目的是解释或预测。解释指解释现象,找出现象背后的原因;预测利用规律对事物未来的发展进行预测

 

  • 第一章 有监督的金融数据分类分析-Logit、LDA、QDA与KNN

第一节 Logistic分类法

第二节 LDAQDAKNN分类法


  • 第二章 无监督的金融数据分类分析-聚类分析

第一节 系统聚类法和K-means聚类法

 

  • 第三章 金融数据抽样

第一节 交叉验证方法(Cross Validation

- 基础交叉验证法 Basic cross validation

- 除一交叉验证法 Leave one out cross validation

- K组交叉验证法 K-Fold cross validation

第二节 拔靴法 Bootstrap

 

  • 第四章线性模型筛选

第一节 子集筛选法(subset selection methods

最优子集筛选法(Best Subset Selection

逐步选择法(Stepwise Selection)

1 向前筛选Forward Stepwise Selection

2 向后筛选 Backward Stepwise Selection

3 混合筛选法

选择最优模型的标准

1 Cp

2 AIC

3 BIC

4 adjusted R2

第二节 收缩筛选法

岭回归 Ridge Regression

Lasso方法

 

  • 第五章 克服维数灾难

第一节 主成分分析法

第二节 部分最小二乘法

 

  • 第六章 决策树

第一节 决策树的分类和基本知识

回归树

分类树

第二节 三种提高树状模型预测精度的方法

Bagging

Random Forest

Boosting

 

  • 第七章 支持向量机

第一节 最大边际分类器

第二节 支持向量机

 

公众号二维码

End:如果有兴趣了解金融量化交易和其他数据分析的实用技术,欢迎关注本公众号

浏览 13
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报