经过27次面试后,我写了这份机器学习面试重点指南!

共 3330字,需浏览 7分钟

 ·

2020-10-28 09:25

点击上方“CVer”,选择加"星标"置顶

重磅干货,第一时间送达

来源:机器之心  |  编辑:小舟

机器学习面试宝典,有这一本就够了。
在机器学习和数据科学岗位的面试中,机器学习领域的概念是经常考察的内容。一位近期经过 27 次 AI 领域面试(包括 Google 等大型公司和一些初创公司)的开发者根据自己的面试实战经验撰写了一份机器学习资料。

这份资料适用于机器学习初学者,包含机器学习中经典常用的基础概念。值得一提的是,每个章节的末尾还附带教程和练习题,帮助读者进一步掌握书中讲解的概念知识。


下载地址:https://www.confetti.ai/assets/ml-primer/ml_primer.pdf

这本书包括监督学习、机器学习实践、无监督学习和深度学习四章。

第一章:监督学习

该章节介绍了线性回归、logistic 回归、朴素贝叶斯、支持向量机、决策树和 K - 近邻算法。

线性回归

线性回归是最常见且使用范围最广的一种机器学习技术。它是一种非常直观的监督学习算法。顾名思义,线性回归是一种回归方法,这意味着它适用于标签是连续值(如室温)的情况。此外,线性回归试图寻求与线性数据的拟合。

logistic 回归

现实世界中绝大多数问题都涉及到分类,比如图像标注、垃圾邮件检测、预测明天是否为晴天等。这里介绍的第一个分类算法是 logistic 回归。

朴素贝叶斯

朴素贝叶斯是一种优秀的机器学习模型。它之所以优秀,是因为它的核心假设可以用一句话来描述,但它在许多问题中都很有效。在深入了解朴素贝叶斯之前,这里首先探讨了判别模型和生成模型这两种机器学习模型的区别。

支持向量机

这部分探讨了支持向量机这种分类算法。21 世纪初深度学习兴起之前,支持向量机是人工智能领域的主流技术。即使在今天,支持向量机依然是用于新分类任务的最佳算法之一。这是因为它具有表示数据中多种类型统计关系的能力,并且易于训练。

决策树

决策树是一种出色的模型,它不仅功能强大,而且易于解释。实际上,该模型的基础结构与人类做出决策的方式非常相似。一些机器学习开发者认为决策树在新的问题域上提供了最佳的开箱即用性能。

K - 近邻算法

K - 近邻算法是一种监督学习模型。它没有正式的训练程序,因此它在模型中显得有些异常。正因如此,K - 近邻算法是一个解释和实现都相对简单的模型。

第二章:机器学习实践

控制模型偏见

构建监督学习模型背后有哪些理论支撑呢?这里探讨了偏差 - 方差权衡,这是机器学习中最重要的原则之一。

如何选择模型

模型选择过程中有哪些细节?这通常需要评估多个模型的泛化误差。这里主要关注的是,如何使用现有数据和建立的模型来选择最佳模型,而不考虑模型的具体细节如何。

你需要什么特征

特征选择与模型选择紧密相关。

模型正则化

模型正则化在机器学习中极为重要,也是 AI 从业者最强大的工具之一。

模型集成

顾名思义,集成的核心思想是将一组模型组合在一起,以获得性能更高的模型,就像在管弦乐队中组合乐器一样。这一部分就讲述了如何在机器学习中获得和谐的「声音」。

模型评估

模型评估对于训练和交叉验证尤其重要。

无监督学习

购物篮分析

购物篮分析是无监督学习算法的一个示例,它要解决的问题是分析不同物品组合之间的关系及其在特定篮子中出现的频率。

K-Means 聚类算法

这一部分从数据聚类的角度进一步介绍了无监督学习。这里介绍了 K-means 聚类算法,这是 AI 从业者最常用的聚类算法之一。

主成分分析

主成分分析是这本资料介绍的首个数据降维技术。听起来有点复杂,但其核心降维技术是一个相当直观的想法。

深度学习

前馈神经网络

从前馈神经网络开始,作者开始深入探讨深度学习。由于深度学习主要是对神经网络的研究,因此在资料中作者也详细介绍了神经网络模型,首先就从前馈神经网络展开。

神经网络实践

上一节介绍了前馈神经网络的示例,但漏掉了一些细节,如激活函数、权重设置以及神经网络理论的其他方面。本节将对这些问题进行总结。

卷积神经网络

2012 年,来自多伦多大学的研究团队提出世界上第一个完全使用神经网络构建的图像识别系统 AlexNet,并在 ImageNet 竞赛中脱颖而出。这一里程碑事件对今天的人工智能浪潮起到推动作用,卷积神经网络架构是这一转折点的核心。

循环神经网络

卷积神经网络与视觉任务相关,而循环神经网络曾经是语言相关问题的标准模型。实际上,很长一段时间以来,自然语言研究者认为,循环网络能够在任何自然语言问题上取得 SOTA 结果。对于单个模型来说,这是很高的要求。但时至今日,循环神经网络仍然在自然语言任务上表现出色。

作者介绍


这本资料的作者是亚马逊 Alexa AI 的机器学习科学家 Mihail Eric,其主要研究方向是对话式人工智能。Mihail Eric 此前在斯坦福大学获得了计算机科学硕士学位。Mihail Eric 花了数年的时间建立面向目标的对话机器人,并从事计算语义和文本推断方面的研究。

推荐阅读:


中国人民大学高瓴人工智能学院 2021年博士研究生招生简章

招生啦!清华大学SIGS人工智能硕士项目2021年硕士研究生普通招考说明

李飞飞的实验室招人了!不限专业,薪资丰厚,科研经费管够!

深圳大学黄继武(杰青、IEEE Fellow)课题组招聘博士后、研究员/副研究员、研究助理

年薪最高200万!招聘CV算法Leader

新加坡科技设计大学CV方向招收博士生若干名

新加坡南洋理工大学Prof. Chau Lappui (IEEE Fellow)现招聘博士后(RF)和助理研究员(RA)

北京大学孙俊教授课题组2021级申请考核博士招生启事

一文看尽60道AI算法高频面试题


更多内推招聘:


滴滴出行招聘算法工程师实习生

快手招聘算法实习生

网易互娱AI Lab招聘CV算法实习生

阿里达摩院招收研究型实习生

华为2012实验室招聘算法实习生

腾讯优图实验室(深圳)招聘实习生

百度招聘机器人与自动驾驶、三维感知算法研究员和实习生

快手AI实验室Y-Tech招聘计算机视觉算法实习生

腾讯AI Lab招聘日常算法实习生

内推 | 云从科技2021届校园招聘正式启动

内推 | 字节跳动实验室招聘三维视觉算法实习生

内推 | 华为云Cloud&AI-2021届校园招聘算法工程师

阿里巴巴高德招聘计算机视觉研发!社招/校招/实习全都要

滴滴出行视觉计算组招聘CV算法实习生/社招

内推 | 阿里云人工智能实验室2021届校园招聘算法工程师

阿里达摩院-视觉理解&互动视觉团队招聘(校招/社招/RI实习)

商汤科技3DAR-智能视频团队招聘2021届校招/社招/实习

内推 | 海康威视2021届校园招聘正式启动!

内推 | 字节跳动2021校园招聘正式启动!

内推 | 爱奇艺2021校园招聘正式启动!

腾讯2021校园招聘全球启动(含内推)

阿里达摩院招聘Research Intern

小米集团2021全球校园招聘全面开启!(含内推)

阿里巴巴达摩院机器智能技术人脸识别招聘实习生/2021届校招/社招

华为中央软件院2021届博士招聘

大华股份2021届校园招聘正式启动!(含内推)

vivo2021全球校园招聘正式启动!(含内推)

内推 | 之江实验室2021届校园招聘正式启动!

内推 | 快手2021校园招聘启动

内推 | 第四范式2021校招正式启动!

华为中央软件院2021届博士招聘


2020年AI算法岗求职群(知识星球)


本星球不仅面向今年(2021届)找工作和找实习的学生(研一/研二/大三等),还面向刚入学或已工作的人群。目前已有超过2500+位同学加入星球旨在分享AI算法岗的秋招准备攻略(含刷题)、面试经验和校招/社招/实习的内推机会(含提前批)、学习路线、知识题库和Offer如何选择等


    希望这个星球可以让你少走一些弯路

    扫码进星球



    如果喜欢招聘/面经/内推,请给个在看

整理不易,请给CVer点赞和在看

浏览 54
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐