今日头条技术架构分析
- 背景 -
5亿注册用户;
2014年5月1.5亿,2015年5月3亿,2016年5月份为5亿。几乎为成倍增长。
日活4800万用户;
2014年为1000万日活,2015年为3000万日活。
日均5亿PV;
5亿文章浏览,视频为1亿。页面请求量超过30亿次。
用户停留时长超过65分钟以上。
- 文章抓取与分析 -
- 用户建模 -
- 新用户的冷启动 -
- 推荐系统 -
- 数据存储 -
- 消息推送 -
- 今日头条系统架构 -
- 头条微服务架构 -
- 头条的虚拟化 PaaS 平台规划 -
- 总结 -
数据生成与采集; 数据传输:Kafka做消息总线连接在线和离线系统; 数据入库:数据仓库、ETL(抽取转换加载); 数据计算:数据仓库中的数据表如何能被高效的查询很关键,因为这会直接关系到数据分析的效率。常见的查询引擎可以归到三个模式中,Batch 类、MPP 类、Cube 类,头条在 3 种模式上都有所应用。
参考资料: 今日头条的核心架构解析 Go – 今日头条架构 从无到有、从小到大,今日头条大数据平台实践经历的那些坑 今日头条推荐系统架构设计实践
作者:钟镇刚
来源:blog.csdn.net/mucaoyx/article/details/84498468
评论