搭建一套深度学习推荐系统!
共 2257字,需浏览 5分钟
·
2021-09-07 13:47
而驱动这些巨头进行推荐服务的,都是基于深度学习的推荐模型。阿里的千人千面系统促成了当年天猫“双 11” 2684 亿成交额。如果通过改进商品推荐功能,使平台整体的转化率提升 1%,就能在 2684 亿成交额的基础上,再增加 26.84 亿。这也是大厂对推荐工程师倍加青睐的原因。
但在学习推荐系统时,找到提升的突破点并不容易——目前各大厂使用的都是成熟的推荐系统,实现整体效果优化,需要建立起完整的知识体系,加深对深度学习模型的理解,以及大数据平台的熟悉程度。
《深度学习推荐系统》一书的作者王喆, 推出实践专栏,跟大家一起来一步一步地讲透深度学习推荐系统的原理,并且能亲手搭建起来一整套深度学习推荐系统。
他的同名书籍在豆瓣评分9.3,好评极高,这个专栏更注重实践,并加入了更多技术细节的实现和讨论。下面王喆总结的 「核心知识图谱」 ,建议收藏。
最重要的是,实操性特别强。王喆特地为了这个专栏,开发了一个开源项目 「 SparrowRecsys」,能让我们亲手搭建一套完整的深度学习推荐系统(下面有详细介绍,贼有意思)。
扫码免费试读👇
限时秒杀+口令「happy2021」到手仅 ¥89 ,原价 ¥129,新用户到手仅 ¥59.9
王喆这门课的价值
先来说说这个 SparrowRecsys 推荐系统。名字取“麻雀虽小、五脏俱全”之意,它利用了开源的 movielens 数据集,搭建起了包括:
Spark、Flink特征工程
TensorFlow深度学习模型训练
TensorFlow Serving模型服务
Redis在线特征数据库
Jetty Server推荐服务器
JS前端实现
在内的一整套深度学习推荐系统。不说它能支撑起一个中大型公司的推荐系统,但是毫无疑问,它可以成为一个工业级推荐系统的种子项目。而这一切,都能在课程里,一步步尝试搭建起来。
最后我们实现的推荐系统会是这个样子👇
在这些前端页面的背后,是我们能实现的一个又一个深度学习模型:
对于电影的相似推荐功能,王喆会使用各种 Embedding based 的方法,比如 item2vec,graph embedding 等等。
对于推荐功能,会基于 TensorFlow 实现Embedding MLP,Wide&Deep,NerualCF,Two Towers,DeepFM,DIN 等等深度学习模型,然后使用 TensorFlow serving 去进行模型服务。
对于召回层、排序层这些推荐逻辑,也会全盘在基于 Jetty 的推荐服务器中实现。
整个项目整体的技术架构是下面这个样子的:
是不是感觉很牛。其次,专栏本计划是 30 讲,生生写到 43 讲,补充讨论了很多热门的问题。课程的留言区也藏龙卧虎,在这里贴 15 个专栏里讨论的问题,足见大家收获。
他是怎样讲解这门课程的?
整体遵循了经典推荐系统的框架,分为 6 部分,学懂了,实现一个工业级的深度学习推荐系统,简单介绍下:
基础架构篇:讲要从 0 开始实现的推荐系统, Sparrow RecSys 的主要功能和技术架构,也会用到 Spark、Flink、TensorFlow 等业界最流行的机器学习和大数据框架。
特征工程篇:讨论推荐系统会用到的特征,以及主要的特征处理方式,并将其实践在 Spark 上。此外,还有深度学习中非常流行的 Embedding、Graph Embedding 技术,并带你实现 Sparrow Recsys 中的相似电影推荐功能。
线上服务篇:带你搭建一个推荐服务器,包括服务器、存储、缓存、模型服务等模块和相关知识,涉及 Jetty Server, Spark、Redis 的使用。
推荐模型篇:深度学习推荐模型的原理和实现方法,包括 Embedding+MLP ,Wide&Deep,PNN 等深度学习模型的架构和 TensorFlow 实现,以及注意力机制、序列模型、增强学习等相关领域的前沿进展。
效果评估篇:效果评估的主要方法和指标,建立起包括线下评估、线上 AB 测试、评估反馈闭环等整套的评估体系,真正能够用业界的方法,而不是实验室的指标来评价一个推荐系统。
前沿拓展篇:讲 YouTube、阿里巴巴、微软、Pinterest 等一线公司的深度学习应用,帮你追踪业界发展的最新趋势。
目录也放这儿了👇
可以说,王喆老师的书也好,课也好,从未叫人失望过,而且他人也特别 nice,经常在课程留言区和大家讨论问题,如果对推荐系统感兴趣,这是一门值得用心学习的课程。
👆扫码免费试读+口令「happy2021」到手仅 ¥89
没计划的学习,都只是作秀。与其花时间找一堆资料,还不如有计划的消化一个系统的课。
👇点击「阅读原文」,新用户 ¥59.9 可得