ElasticSearch 面试 4 连问,你顶得住吗?

- 面试题 -

- 面试官心理分析 -

- 面试题剖析 -
- 客户端选择一个 node 发送请求过去,这个 node 就是 coordinating node (协调节点)。 
- coordinating node 对 document 进行路由,将请求转发给对应的 node(有 primary shard)。 
- 实际的 node 上的 primary shard 处理请求,然后将数据同步到 replica node 。 
- coordinating node 如果发现 primary node 和所有 replica node 都搞定之后,就返回响应结果给客户端。 

es 读数据过程
- 客户端发送请求到任意一个 node,成为 coordinate node 。 
- coordinate node 对 doc id 进行哈希路由,将请求转发到对应的 node,此时会使用 round-robin 随机轮询算法,在 primary shard 以及其所有 replica 中随机选择一个,让读请求负载均衡。 
- 接收请求的 node 返回 document 给 coordinate node 。 
- coordinate node 返回 document 给客户端。 
es 搜索数据过程
java真好玩儿啊
java好难学啊
j2ee特别牛
- 客户端发送请求到一个 coordinate node 。 
- 协调节点将搜索请求转发到所有的 shard 对应的 primary shard 或 replica shard ,都可以。 
- query phase:每个 shard 将自己的搜索结果(其实就是一些 doc id )返回给协调节点,由协调节点进行数据的合并、排序、分页等操作,产出最终结果。 
- fetch phase:接着由协调节点根据 doc id 去各个节点上拉取实际的 document 数据,最终返回给客户端。 
写请求是写入 primary shard,然后同步给所有的 replica shard;读请求可以从 primary shard 或 replica shard 读取,采用的是随机轮询算法。 

- 写数据底层原理 -

数据写入 segment file 之后,同时就建立好了倒排索引。 

- 删除/更新数据底层原理 -
底层 lucene
倒排索引

| DocId | Doc | 
|---|---|
| 1 | 谷歌地图之父跳槽 Facebook | 
| 2 | 谷歌地图之父加盟 Facebook | 
| 3 | 谷歌地图创始人拉斯离开谷歌加盟 Facebook | 
| 4 | 谷歌地图之父跳槽 Facebook 与 Wave 项目取消有关 | 
| 5 | 谷歌地图之父拉斯加盟社交网站 Facebook | 
| WordId | Word | DocIds | 
|---|---|---|
| 1 | 谷歌 | 1, 2, 3, 4, 5 | 
| 2 | 地图 | 1, 2, 3, 4, 5 | 
| 3 | 之父 | 1, 2, 4, 5 | 
| 4 | 跳槽 | 1, 4 | 
| 5 | 1, 2, 3, 4, 5 | |
| 6 | 加盟 | 2, 3, 5 | 
| 7 | 创始人 | 3 | 
| 8 | 拉斯 | 3, 5 | 
| 9 | 离开 | 3 | 
| 10 | 与 | 4 | 
| .. | .. | .. | 
- 倒排索引中的所有词项对应一个或多个文档; 
- 倒排索引中的词项根据字典顺序升序排列。 
来源:https://github.com/doocs/advanced-java

评论
