好吃的饭菜调料食材怎么搭配?关联分析来看看看
前言
在前段时间,小编推出了一篇菜谱生成小工具,是通过爬取下厨房的菜谱数据,制作一个 ui 界面,随机生成三菜一汤的菜谱,原文:
这次呢,小编还是使用下厨房的菜谱,重写了一个爬虫爬取 5000 多条菜谱数据,使用此数据调用关联分析模型 Apriori 找出目前大家做菜时的食材及调料是怎么搭配的,以此参考一下,说不定一摇变身成为顶级大厨~
数据获取
打开下厨房:
https://www.xiachufang.com/
爬取上图中,家常菜,快手菜,下饭菜,早餐,鱼,鸡蛋,汤羹,烘焙,主食,面,素食,以上种类的菜谱。
以家常菜为例,爬取每一页每一张菜谱的菜名,食材,评分,种类,并保存为 csv:
复制第一页的第一个菜谱名,右键【查看网页源代码】搜索菜谱名,可以搜索:
说明网页是静态的网页,直接爬取即可,不复杂,具体实现获取源代码查看。
Apriori 模型
关联分析是数据挖掘中一种简单而实用的技术,通过深入分析数据集,寻找事物之间的关联性,挖掘频繁出现的组合,并描述组合内对象同时出现的模式和规律。
例如,对超市购物的数据进行关联分析,通过发现顾客所购买的不同商品之间的关系,分析顾客的购买习惯,设计商品的组合摆放位置,制定相应的营销策略,从而制造需求,提高销售额,创造额外收入。
在此项目中挖掘菜谱的食材调料之间的搭配是怎么样的,参考大众的搭配,做出更好吃的饭菜~
Apriori 算法是最著名的关联规则挖掘算法之一,我们使用其进行关联规则。
Apriori 算法主要由以下函数实现计算出强关联规则:
详细实现获取源代码参考,实现后数据集需要处理一下为所需要的格式,再调用函数:
输出格式如下图:
以一条结果为例进行解读:
frozenset({'细砂糖', '鸡蛋'}) --> frozenset({'牛奶'}) 支持度 0.021773 置信度:0.620879
表示食材中同时有细砂糖/鸡蛋,牛奶的概率为62%,而这种按情况发生的概率为2.1%
由此我们可以把细砂糖,鸡蛋,牛奶搭配在一起,做出一道美味的佳肴~
其他结果也是一样的解读,当然了,还是要实际动手做菜落地后才能有体会,说不定下一个诞生的大厨就是你~~
源码获取
关注微信公众号 “木下学Python”,回复 “关联食材” 即可获取
END
读者交流群已建立,找到我备注 “交流”,即可获得加入我们~
听说点 “在看” 的都变得更好看呐~
关注关注小编呗~小编给你分享爬虫,数据分析,可视化的内容噢~
扫一扫下方二维码即可关注我噢~
-END-