神州信息金融科技校园极客大赛TOP baseline
老肥码码码
共 486字,需浏览 1分钟
·
2022-07-09 13:49
* 神州的一个比赛,主办方非要抓着我看训练集的分数,并以我训练集得分过高并且测试集得分也过高判过拟合,不予我正常的排行榜的分数显示。
* 关于过拟合,我倒是也看到过一些讨论,比如这个链接里所讨论的https://www.kaggle.com/competitions/amex-default-prediction/discussion/335689,在我过去的数据挖掘经历中在保证数据划分正确不产生leak的情况下(这很重要)充分拟合训练集并且使用验证集表现最佳的模型往往会得到更高的测试集分数,即使训练集和验证集之间的分数gap很大。
* 去年答辩降了N个名次,最后甚至不如一个不加特征就能达到基础分的选手排名高,这是在我几十次的竞赛答辩中唯一一次被干掉排名的比赛。哈哈哈哈哈哈,今年只想恰个低保,结果就发生了这种事
* 连霸占排行榜的资格都不给我,恰不到烂钱,遂开源,有需要自取
* 代码和方案都很简单,纯纯baseline
* 祝大家比赛顺利~
* 代码链接:https://github.com/librauee/yjcomp
评论