CV岗位面试题：K-means选择初始点的方法有哪些,优缺点是什么?

七月在线实验室

共 761字，需浏览 2分钟

·

2021-01-29 20:19

文 | 七月在线
编 | 小七

解析：

                                                        

KMeans是数据挖掘十大算法之一，在数据挖掘实践中，我们也常常将KMeans运用于各种场景，因为它原理简单、易于实现、适合多种数据挖掘情景。


如上图所示，数据样本用圆点表示，每个簇的中心点用叉叉表示：


(a)刚开始时是原始数据，杂乱无章，没有label，看起来都一样，都是绿色的。


(b)假设数据集可以分为两类，令K=2，随机在坐标上选两个点，作为两个类的中心点。


(c-f)演示了聚类的两种迭代。先划分，把每个数据样本划分到最近的中心点那一簇；划分完后，更新每个簇的中心，即把该簇的所有数据点的坐标加起来去平均值。这样不断进行”划分—更新—划分—更新”，直到每个簇的中心不在移动为止。(图文来自Andrew ng的机器学习公开课)。

初始中心点的选择：


初始中心点的选择最简单的做法是随机从样本中选K个作为中心点，但由于中心点的选择会影响KMeans的聚类效果，因此我们可以采取以下三种方式优化中心点的选取：


1.多次选取中心点进行多次试验，并用损失函数来评估效果，选择最优的一组；


2.选取距离尽量远的K个样本点作为中心点：随机选取第一个样本C1作为第一个中心点，遍历所有样本选取离C1最远的样本C2为第二个中心点，以此类推，选出K个初始中心点


3.特别地，对于像文本这样的高维稀疏向量，我们可以选取K个两两正交的特征向量作为初始化中心点。

浏览 25

点赞

收藏

分享

举报

评论

图片

表情

面试题｜Docker的优缺点

想进高校工作，硕士学历所能选择的岗位有哪些？

机器学习初学者

最新的主流人力资源管理管理系统有哪些？优缺点各是什么？

如果仅仅只是针对问题的字面来问题，那么答案都是大同小异的。但我个人感觉，提出这个问题，其实是要为企业选一款合适的软件。那么就先要在“合适”的基础上，去谈主流。那么，问题来了，什么才叫“合适”呢？不是普遍意义上贵的、好的、名气响的，而是在企业选择人力资源管理软件时，能在各种考量因素中都取得最优水平的那一个，但这是理想状态；比较符合现实的思路是：综合各项因素，均值最高的就是最适合企业的。根据调研，企业在选择软件时普遍考量的因素为：1、价格；2、背景；3、功能与服务。综合这三个因素均值水平最高的即是合适的软件。以下这10款软件都是本人在从业过程中了解过的人力资源管理系统，我截取当时做的部分笔记，来作为对这道题目的回答，以供参考。

最新的主流人力资源管理管理系统有哪些？优缺点各是什么？

先给大家科普一下什么是人力资源管理系统：人力资源管理系统，通过提高内部员工的满意度、忠诚度，从而提高员工贡献度，即绩效，帮助管理者通过有效组织管理降低成本和加速增长来创造价值链利润。人力资源综合管理解决方案从人力资源管理的角度出发，用集中的数据将几乎所有与人力资源相关的信息（包括：组织规划、招聘管理、人事在职离职档案、员工履历、劳动合同、奖惩管理、办公用品、医院保险、调动管理、培训管理、绩效管理、考勤管理、计时工资、计件工资、宿舍管理、员工自助、领导审批等）统一管理起来。目前市场上主流的人力资源管理系统有：瑞人云等，不过每个软件针对的行业和功能问题不一样。如果你是人力资源外包公司，是劳务派遣，外包，社保代缴等人力资源服

Python的发展前景怎么样？有哪些高薪岗位？

面试官：请说说 Docker 有哪些优缺点？

嵌入式处理器有哪些？各有什么优缺点？

大家好，我是贤弟！嵌入式处理器是一种专门设计用于嵌入式系统的微处理器。它们通常被用于控制、通信和数据处理等应用，如智能家居、汽车电子、医疗设备、航空航天等。嵌入式处理器的优点包括高性能、低功耗、易于集成、可靠性高等，但也存在一些缺点，如成本高、开发难度大等。下面将详细介绍几种常见的嵌入式处理器及其优

图像降噪有哪些方法？

小白学视觉

网络广告投放的优缺点都有哪些？

网络广告的投放优势　　随着互联网在我国的发展和普及，网络广告的市场也在迅速增长，网络发展对于广告来说作用越来越重，网络广告投放的效果也越累越明显。网络广告与以前的传统广告相比具有很多的优势。首先网络广告投放不受时间和空间的限制，利用互联网可以把广告发送到各个角落，只要有网络也都可以随时浏览广告信息。　　以前的传统广告表现形式单一，对传播的内容和形式有着严格的要求和约束性，网络广告表现形式多样化，广告可以以多种形式出现用户比仅仅可以看到广告还可以玩广告来产生互动，让用户看到更多的宣传信息体会到更多的产品服务。　　网络广告的互动性是互联网媒体的最大优势。在互联网上用户可以自由的选择他们认为对他们有用的信息，同时他们也可以根据

面试题，产品经理岗位的哪些特点最吸引你？

点赞

收藏

分享

举报