清华大学《大数据实践课》宣讲会成功举行数据派THU共 1470字,需浏览 3分钟 ·2022-06-12 02:24 5月31日,清华大学大数据能力提升项目——《大数据实践课》宣讲会在线上成功召开。课程指导老师——软件学院副教授闻立杰、副教授宋韶旭、副研究员刘英博、大数据能力提升项目负责人金涛,各实践合作单位项目负责人及200余名意向报名2022年夏季学期大数据能力提升项目实践课的学生参会。往届大数据能力提升项目RONG奖学金获得者、本届实践课助教王可汗同学主持会议。 大数据实践课项目宣讲在线召开王可汗同学首先对清华大学大数据研究中心、大数据能力提升项目及大数据实践课进行了具体介绍,清华大学大数据研究中心于2018年9月成立,是校级虚体跨学科交叉科研机构,是清华大学建设世界一流大学、鼓励大数据领域的学科交叉的重要举措,是深入推进科研体制机制改革的重要里程碑。清华大学大数据研究中心旨在成为在大数据领域具有国际影响力的世界一流科研机构,力争为跨学科尖端人才的培养及数据科学技术的进步做出贡献。“大数据能力提升项目”由研究生院发起,联合7个学院协同共建。依托软件学院,面向全校在学研究生开放选课,截至目前,3055名同学及北京市属高校的10名同学报名参与项目学习,生源几乎涵盖全校所有院系,其中已有566人完成学分要求,获得项目证书。“大数据能力提升项目”的实践教学目前包括《大数据系统基础》和《大数据实践课》,课程融合全校不同学科专业背景的学生进行实践教学,在数据驱动的“真问题,真数据”、校内外双导师制的共同指导下完成大数据实践项目任务。此外王可汗同学还对大数据实践课的报名流程及常见问题进行了解答,包括项目报名情况、学生组队原则、教学内容、结课要求等;介绍了实践合作单位及组织的基本情况,包括各单位接纳学生数量、实践时长、实践地点和校内指导教师等。 企业导师宣讲接下来,各实践合作单位及组织的项目负责人:中国高校计算机大赛 ——微信大数据挑战赛负责人汪海建,北京志翔科技股份有限公司负责人、研究院副院长张家民,杭州新中大科技股份有限公司研发总监肖华,江苏省生态环境监测监控有限公司负责人、科技研发负责人赵瀚森,北京同仁医院北京市耳鼻咽喉科研究所课题组长王硕,云智慧(北京)科技有限公司负责人程相孟,中国石化工程建设有限公司高级工程师刘洋,中国广核新能源控股有限公司集控中心副主任苏宝定,首都医科大学附属北京妇产医院副主任医师孙成娟,全一医疗AI经理何文淦,智锂物联技术总监寿学琦,大数据系统软件国家工程研究中心项目联系人卢北辰分别就本单位基本情况、实践课题内容及预期目标、已有研究基础及专业背景要求、学生实践预期收获等方面进行了详细介绍。在线答疑环节中,各实践单位项目负责人实时回应了同学们在腾讯会议中留言的问题,帮助大家更好、更全面地了解实践课题的相关情况;授课教师、大数据能力提升项目负责人、大数据实践课负责人对同学们提出的问题一一进行了解答,同时各位老师热烈欢迎同学们选修大数据实践课程,期望同学们在项目实践过程中结合在学校学习的理论知识为国家数据科学技术的进步做出贡献。此次大数据能力提升项目大数据实践课选课说明会得到了各实践合作单位及组织的大力支持,会议现场反响热烈,为同学们即将开始的项目报名和课题选择提供了丰富信息和重要参考。大数据实践课作为大数据能力提升项目的重要组成部分,为鼓励各位同学的积极参与,大数据研究中心将为表现突出团队颁发”大数据实践课优秀团队”证书,此证书可作为同学们评选“RONG奖学金”的加分项目,希望各位同学踊跃参与,并在项目中有所收获!编辑:文婧校对:杨学俊 浏览 29点赞 评论 收藏 分享 手机扫一扫分享分享 举报 评论图片表情视频评价全部评论推荐 大数据实践:数据指标中心的建设思路浪尖聊大数据0PiFlow大数据流水线系统PiFlow是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件,以所见即所得方式进行流水线配置。简单易用,功能强大。它具有如下特性:简单PiFlow大数据流水线系统0PrestoDB大数据查询引擎Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。PrestoDB大数据查询引擎0PiFlow大数据流水线系统PiFlow 是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计PiFlow大数据流水线系统0PrestoDB大数据查询引擎Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。据称该引擎的性能是Hive的10倍以上。PrestoDB是Facebook推出的一个大数据的分布式SPrestoDB大数据查询引擎0TrafficTeach大数据项目:车流量监控车流量监控前言目的1.对业务场景抽象,熟练Spark编码2.增加自定义累加器,自定义UDF3.SpaTrafficTeach大数据项目:车流量监控02024五一旅游大数据报告产品刘0TrafficTeach大数据项目:车流量监控车流量监控前言目的1.对业务场景抽象,熟练Spark编码2.增加自定义累加器,自定义UDF3.Spark优化方式项目数据处理架构模块介绍卡扣流量分析SparkCore卡扣车流量转化率SparkCoreTrafficTeach大数据项目:车流量监控0PySpark——开启大数据分析师之路小数志0《交通大数据理论与方法》机器学习AI算法工程0点赞 评论 收藏 分享 手机扫一扫分享分享 举报