长文分享!数据分析师 VS 算法
01
目的:为了解决某个/某类问题,需要在这之前了解到背后的业务背景、关联场景;
方法:通过计算来实现,也就意味着需要具备具体的、可量化的信息输入,且可计算,而非不可执行的概念体;
步骤:有先后顺序,先做什么然后做什么最后做什么,每个过程之间还必须具备可行性,执行次数也一定是有限的;
结论:是否能够解决这个问题,效果如何,最终必须得有一个产出物。在算法之外,还有几层扩展;
决策:根据一个或者多个结论进行判断,这个过程是不是符合预期的,如何调整优化,是否可直接应用于业务;
应用拓展:除了解决最初的那个问题外,还有哪些同质类型的问题也可以得到解决,也就是场景的拓展;
02
信用卡交易反欺诈:分类任务,GBDT算法 / XGBT算法+LR逻辑回归;
信用卡申请反欺诈:分类任务,GBDT算法 / XGBT算法+LR逻辑回归
贷款申请反欺诈:分类任务,GBDT算法 / XGBT算法+LR逻辑回归;
反洗钱:分类任务,GBDT算法 / XGBT算法+LR逻辑回归;
信息检索/搜索:搜索引擎中对实体信息的精准聚合和匹配、对关键词的理解以及对搜索意图的语义分析等;
自然语言理解:知识图谱中的知识作为理解自然语言中实体和关系的背景信息;
问答系统:匹配问答模式和知识图谱中知识子图之间的映射;
推荐系统:将知识图谱作为一种辅助信息集成到推荐系统中以提供更加精准的推荐选项,知识图谱+推荐系统;
电子商务:构建商品的知识图谱用于精准匹配用户的购买意愿和商品候选集,知识图谱+推荐系统;
金融风控:利用实体之间的关系分析金融活动的风险以提供在风险触发后的补救措施(如反欺诈等);
公安刑侦:分析实体和实体之间的关系获取案件线索等;
司法辅助:法律条文的结构化表示和查询用于辅助案件的判决等;
教育医疗:提供可视化的知识表示,用于药物分析、疾病诊断等;
社交类业务:社交类业务具备高度连接的特点,比如好友关系等,<用户1,关注,用户2>。
03
04
05
06
07
推荐阅读
欢迎长按扫码关注「数据管道」