优秀毕业生专访 | 清华大学赵瀚森:我在数据科学世界里成长的“三重身份”

数据派THU

共 4070字,需浏览 9分钟

 · 2023-09-20


导语 ] 清华大学化学系的赵瀚森同学,在报名学习了大数据能力提升项目之后,完成了自身从学生到职场达人再到《大数据实践课》导师三重身份角色的转变。在清华园的九年时光里,他都有哪些成长、与数据科学如何结缘、大数据技术在传统行业的应用前景如何,让我们一起了解他“三重身份”的故事。

谈谈你的学生经历

清华校庆110周年与导师张新荣教授合影

从一名本科生到博士研究生,从青涩内敛到成熟坚定,清华园陪伴我度过了人生最难忘的九年时光。我本科在化学系化学生物基础科学班学习,研究生则是在化学系分析化学方向课题组,师从张新荣教授,主要开展质谱及光谱的新型检测方法及应用研究。

谈谈你与大数据能力提升项目的渊源

谈起我与大数据能力提升项目的渊源,大致经过了三个阶段:

兴趣驱动,实践出真知

我从本科开始就对计算机和大数据相关的知识非常感兴趣。我在化学系参加了学堂班培养计划,在其中的暑期访学交流项目中前往普渡大学程继新课题组开展拉曼光谱相关的学习和研究。在项目中,我和一个博士后师兄共同开展了受激拉曼原位检测细菌的课题研究。在研究中,遇到了背景信号淹没样本信号的问题。当时课题组有一位精通数据处理的师兄,他通过编写“相位检索”算法成功扣除了背景信号的影响,实现了复杂环境的单个细菌的检测。在那次实践中我感受到了数据分析算法对分析化学专业研究的重要作用,也对数据分析处理产生了更加浓厚的兴趣。

推开数据科学世界的大门

研究生期间,在导师的支持下,我报名参加了大数据能力提升项目,并开展大数据与分析化学的交叉领域研究。我非常喜欢大数据课程中的分析算法学习以及文献阅读分享环节,给我的学术研究带来了很多启发。通过项目学习,我逐渐了解并认识了数据科学的思想,并尝试带入自己的研究工作中,很多课堂上学习到的算法思想被我应用到了课题研究中并成功发表论文。

立足现实,多方共赢

毕业后,我继续从事大数据与环境检测分析交叉方向的工作。在工作中,我发现生态环境与大数据交叉领域人才缺乏以及生态环境领域大数据分析技术发展程度较为落后等问题。借助大数据能力提升项目暑期实践课程的平台,我积极促成公司与大数据研究中心的合作,截止目前已经成功参与了两届暑期实践活动,开展研发项目共6项,累计参与学生34名。合作对企业的技术提升、人才引进以及学校的人才培养都起到了积极作用。

在大数据能力提升项目的学习中,你有哪些收获呢?

我认为项目学习对我的帮助主要体现在三个层面:一是教授了实用的大数据分析技术;二是培养了数据思维和数据视角;三是为我的学术研究提供了新的想法和灵感。

在整个实践过程中,暑期实践课程对我的影响很大。我在2017年夏季参与了《基站蓄电池充放电曲线分析》项目,项目企业为北京创智信科有限公司,是一家为中国铁塔集团服务的技术公司。项目目标为

根据蓄电池的充放电曲线来实现远程在线判定蓄电池状态,识别异常的充放电曲线,从而提高运维效率。我们当时通过挑选特征,标注数据,训练机器学习模型等方法,实现了95%以上的异常识别率,大大提高了蓄电池异常识别的效率,使得原来几个人几天的工作量可以缩短至几秒钟内完成。

这次实践让我第一次认识到大数据分析技术为传统行业应用带来的巨大价值,也进一步坚定了我继续在大数据分析与传统行业交叉方向发展的决心。

从校园走进职场,有什么不一样的感受呢?

上图:公司荣誉墙及环境监测设备展示;

下图左一:企业人才公寓;左二:办公环境


我目前就职于江苏省生态环境监测监控有限公司,是江苏省环保集团的全资子公司。公司主要涉及生态环境监测监控设备的安装、运维以及实验室检测、辐射检测以及大数据系统集成等业务。近年来,公司作为全省重点环境基础设施投资建设的主体,建成并联网的大量空气监测、水质监测以及企业用电、污染排放监控系统。通过建成智慧环保大数据中台,实现了大规模生态环境数据的归集和管理。

我的工作主要是针对生态环境数据进行深度的分析和总结,将数据信息转变成为可以支撑管理决策的环境信息,提供环境质量预测预警、污染精准溯源、管控成效评估等服务。入职至今2年多的时间,我已经主导研发了近20个大数据分析产品,并在实际项目中得到了应用。

从校园到职场,我体验到了工作内容和工作目标的“相同”与“不同”。“相同”之处在于我依然从事自己感兴趣的大数据分析与传统行业的交叉领域技术研发工作,看到自己研发的技术能够得到实际的应用,产生价值是一件非常令人满足的事。“不同”之处在于企业和学校在技术研发的侧重点有所不同。企业的研发更加注重与市场需求的切合,以及技术的成熟度和可靠性;而学校的研究则更侧重技术的创新性和突破性。在工作中,我不断学习生态环境领域及大数据技术领域的知识和技能,同时也培养了自身的表达能力、协调能力、管理能力和市场能力,更加综合的提升了自身的能力水平。

谈谈成为了《大数据实践课》的企业导师后,有什么切身的体会和感受呢?

成为企业导师是多方面因素促成的结果。我在自己参加大数据能力提升项目的暑期实践课程时,就受到了很大的震动,可以说直接影响了我后续的职业选择,因此我也认为大数据暑期实践课程是非常有意义的,也许在那个时候心中就种下了一粒种子。

企业导师赵瀚森与2023大数据实践课小组同学的合影

在进入企业以后,我了解到了生态环境领域同样经历着从“人海战术、粗放管理”到信息化,再到数字化、智慧化的发展历程。从目前环保行业的整体发展情况看,信息化进程已经基本完成,但对数据的深度分析层面还处于初步的探索和尝试阶段。从公司的角度看,大数据分析方法在业务中的需求快速增加,但相关的研发力量相对薄弱。同时,企业也制定了科技创新与人才发展的“十四五”规划,提出科技创新、人才强企战略,大数据能力提升项目的形式和目标与公司加快企业技术研发和技术创新,拓宽企业人才识别和人才引进通道的实际需求高度契合。

从另一方面,作为在清华园度过九年时光的毕业生,我对母校也有非常深厚的感情,即使已经迈入职场两年,也非常希望借大数据暑期实践项目合作的机会,与母校的老师以及师弟师妹们进一步交流联系,这对我来说也是一件非常幸福的事。

企业导师与实践学生的线下交流

截止到今年,我们已经连续开展了两届大数据暑期实践项目,我也两度担任企业导师和同学们一同开展大数据分析技术的研发实践。在今年的实践项目中,我们基于大语言模型研发生态环境领域的智能问答助手。由于大语言模型领域技术相对较新,我和同学们在此之前都缺乏相关的技术积累,项目在中期左右的时候一直被一个技术瓶颈难题卡住,进展缓慢。

企业导师与学生线下讨论项目系统

有一次我和组内的几个同学一起对着计算机屏幕,一起看代码,de-bug,展开激烈的讨论,把我们使用的框架源码真正的搞清楚,弄明白,在这样的基础上提出了合理的技术方案,终于实现了自然语言文本的嵌入、向量存储和检索对话的分离,达成了项目中的关键子目标。我也非常享受这种和同学们一起并肩战斗、攻克技术难关的过程。我也非常荣幸的获得了优秀实践导师的荣誉。我想,这主要归功于项目小组同学的出色表现,也是我饱含热情地参与这项工作的最好回报。

谈谈对大数据能力提升项目和《大数据实践课》未来的展望吧

大数据研究中心老师来公司考察

从实践项目的层面,我观察到近两年来大数据暑期实践项目的完成度和成果质量得到了显著的提升,同学们的参与度和投入程度也显著增加。去年比较特色亮点的成果展现形式,今年已经成为“标配”,这表明大数据能力提升项目同学参与的积极性和人才培养成效正在不断提升。在未来,我们还将继续积极参与大数据暑期实践项目,期待涌现出更多更好的研发成果。

我认为未来深化校企合作的空间还很大。一方面,很多行业已经度过了粗放式的规模增长时期,高质量创新发展将成为未来企业发展的主题。企业的社会创新主体作用将更加突出,企业的创新能力和创新意愿将不断增强,高校无疑为企业创新提供了重要的智力资源和人才资源;另一方面,企业对市场需求和市场变化具有更加敏锐的洞察,可以为高校的科技成果提供转化的平台和应用的场景,校企合作对于提升整个社会的自主创新能力,实现高质量发展具有重要意义。


编辑:文婧

校对:刘光栋


浏览 2175
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报