Datawhale厦门大学分享记录!

Datawhale

共 1614字,需浏览 4分钟

 ·

2021-05-24 15:44

 Datawhale线下 
作者:李明夷,厦门大学 WISER CLUB

2021 年 5 月 16 日下午,Datawhale 团队受邀来到厦门大学,同 WISER CLUB 在经济楼 N402 共同举办学习、竞赛及工作经验分享会,吸引了校内各学院的同学参加。

本次活动由 Club 成员冉斓主持,Datawhale 成员王茂霖、聂雄伟、鱼佬与范晶晶依次为同学们带来了干货满满的经验分享。

下面,让我们一起回顾一下现场的精彩过程吧!

嘉宾分享环节

首先,华中科技大学硕士王茂霖初步介绍了统计学习与机器学习的学习体系,具体分析了统计与机器学习的关联与区别,指出机器学习是套用来学习规则或映射关系的固定方法,同时介绍了传统的机器学习与深度学习的不同之处,并总结了机器学习的学习路径与知识体系。最后他建议,如果有意愿从事机器学习行业:第一,放弃从网上寻找的海量资料;第二,放弃从零起步;第三,边实践边学习。

随后,Datawhale 开源内容贡献者聂雄伟分享了数据竞赛入门的方法与项目实践经验,将自己的数据科学学历经历总结为:从学习到入门,改进、提高方法,扩展解题思路以及分享解题方法。并根据亲身经历建议:第一,加入有志同道合伙伴的组织(例如 Datawhale 团队)可以促进自身学习;第二,要敢于挑战,尝试实现完整的项目;第三,我们在学习的过程中给自己灌输正反馈的激励,向优秀的人学习,并最终将所学知识整理成体系。

 紧接着,腾讯广告算法大赛冠军鱼佬(王贺)向同学们分享了数据科学竞赛在工作中的应用。一方面,他介绍了数据科学可应用的地方,包括用户画像、建模算法类以及偏业务应用类等领域。另一方面,他仔细分析了竞赛和工作的区别,包括时间安排与具体内容,比如在竞赛中,几乎所有时间都花费在几个比较固定的过程:问题建模-数据分析-数据清洗-特征工程-模型训练-模型验证-结果预测,而工作中往往在问题建模之前还需要明确业务目标,从业务问题抽离出数据科学问题并选择合适的方法,此外收集合适的数据集并清洗数据也会占用较多的时间(比赛一般由比赛方直接提供数据集),建模结束后还需要与组外人员协同做A/B测试,最后给出分析结果和方案建议。

最后分享的嘉宾是 Datawhale 发起人范晶晶,他从团队的理念出发,分享了自己对开源文化的理解,以及在学习与创业中收获的经验。他指出,Datawhale 作为开源学习组织,汇聚了众多具有开源精神的成员,一起创造价值。同时,他建议同学们在进行职业选择的时候,不要将功利作为唯一准则,去尝试聆听内心的声音。

交流互动环节

在经验分享环节结束后,Datawhale 成员谢文昕司玉鑫也上台和同学们做了自我介绍,并同其他成员一起参与了互动交流环节,大家就竞赛、职业选择等问题踊跃提问。有同学提到在比赛中与队员交流过少造成双方对题目理解出现明显偏差,难以对解决方案达成一致;嘉宾建议,可以从另一个角度来看待这一问题,组内成员交流少可以保证自己的解题思路不受影响,而各成员不同的解决方案完全可以同时包括在最终模型或者报告书中,提高模型准确度以及丰富问题解法。

最后,为了留住这宝贵一刻,双方团队互赠了礼物,WISER CLUB 赠送了 Club 前辈任坤著,王婷、赵孟韬、王泽贤译的《R语言编程指南》;Datawhale赠送了谢文睿、秦州所著的《机器学习公式详解》(“南瓜书”)。

到此,本次分享会划上了圆满的句号,也期待双方之后能有更多的交流与合作机会!

文字:李明夷

图片:伍舒妮,郑喆晟

排版:蔺煜斐


WISER CLUB

一个有趣的数据科学社群

长按二维码关注我们

浏览 59
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报