公示 | 清华大学大数据研究中心《大数据实践课》合作单位评审结果数据派THU2022-05-26 21:05 根据清华大学大数据研究中心实践项目评定相关文件要求与规定,经各申报单位申请、答辩,以及大数据研究中心实践项目评审小组评定,现将2022年度大数据研究中心合作单位及项目公示如下(注:排名按照项目类别划分,不分先后):2022年度《大数据实践课》项目评审结果公示时间:2022年5月24日-2022年5月27日,如有异议,请在公示期内(节假日除外)向清华大学大数据研究中心提出,联系电话:62772709,地点:伟清楼201。 清华大学大数据研究中心2022年5月24日 浏览 17点赞 评论 收藏 分享 手机扫一扫分享分享 举报 评论图片表情视频评价全部评论推荐 大数据实践:数据指标中心的建设思路浪尖聊大数据0PiFlow大数据流水线系统PiFlow是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件,以所见即所得方式进行流水线配置。简单易用,功能强大。它具有如下特性:简单PiFlow大数据流水线系统0PrestoDB大数据查询引擎Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。PrestoDB大数据查询引擎0PrestoDB大数据查询引擎Presto是Facebook最新研发的数据查询引擎,可对250PB以上的数据进行快速地交互式分析。据称该引擎的性能是Hive的10倍以上。PrestoDB是Facebook推出的一个大数据的分布式SPrestoDB大数据查询引擎0PiFlow大数据流水线系统PiFlow 是一个基于分布式计算框架Spark开发的大数据流水线系统。该系统将数据的采集、清洗、计PiFlow大数据流水线系统0大数据实战:如何实时采集上亿级别数据?程序源代码0TrafficTeach大数据项目:车流量监控车流量监控前言目的1.对业务场景抽象,熟练Spark编码2.增加自定义累加器,自定义UDF3.Spark优化方式项目数据处理架构模块介绍卡扣流量分析SparkCore卡扣车流量转化率SparkCoreTrafficTeach大数据项目:车流量监控0PySpark——开启大数据分析师之路小数志0《交通大数据理论与方法》机器学习AI算法工程0TrafficTeach大数据项目:车流量监控车流量监控前言目的1.对业务场景抽象,熟练Spark编码2.增加自定义累加器,自定义UDF3.SpaTrafficTeach大数据项目:车流量监控0点赞 评论 收藏 分享 手机扫一扫分享分享 举报