以下文章来源于武培轩，回复资源获取资料

从一个问题说起

五年前在tx的时候，发现分页场景下，mysql请求速度非常慢。数据量只有10w的情况下，select xx from 单机大概2，3秒。

我就问我导师为什么，他反问“索引场景，MySQL中获得第n大的数，时间复杂度是多少？”

答案的追寻

确认场景

假设status上面有索引，select * from table where status = xx limit 10 offset 10000。会非常慢。数据量不大的情况就有几秒延迟。

小白作答

瞎猜了个log(N)，心想找一个节点不就是log(N)。自然而然，导师让我自己去研究。

这一阶段，用了10分钟。

继续解答

仔细分析一下，会发现通过索引去找很别扭。因为你不知道前100个数在左子树和右子数的分布情况，所以其实无法利用二叉树的查找特性。通过学习，了解到MySQL的索引是b+树。

看了这个图，就豁然开朗了。可以直接通过叶子节点组成的链表，以o(n)的复杂度找到第100大的树。但是即使是o(n)，也不至于慢得令人发指，是否还有原因。

这一阶段，主要是通过网上查资料，断断续续用了10天。

系统学习

这里推荐两本书，一本《MySQL技术内幕 InnoDB存储引擎》，通过他可以对InnoDB的实现机制，如MVCC，索引实现，文件存储会有更深理解。

第二本是《高性能MySQL》，这本书从着手使用层面，但讲得比较深入，而且提到了很多设计的思路。

两本书相结合，反复领会，MySQL就勉强能登堂入室了。

这里有两个关键概念：

聚簇索引：包含主键索引和对应的实际数据，索引的叶子节点就是数据节点
辅助索引：可以理解为二级节点，其叶子节点还是索引节点，包含了主键id。

即使前10000个会扔掉，mysql也会通过二级索引上的主键id,去聚簇索引上查一遍数据，这可是10000次随机io，自然慢成哈士奇。这里可能会提出疑问，为什么会有这种行为，这是MySQL优化器的坑，至今也没解决。

直到此时，大概明白了慢的原因。

怎么解决

《高性能MySQL》提到了两种方案

方案一

根据业务实际需求，看能否替换为下一页，上一页的功能，特别在ios, android端，以前那种完全的分页是不常见的。这里是说，把limit, offset，替换为>辅助索引（即搜索条件）id的方式。该id再调用时，需要返回给前端。

方案二

正面刚。这里介绍一个概念：索引覆盖：当辅助索引查询的数据，只有id和辅助索引本身，那么就不必再去查聚簇索引。

思路如下：select xxx,xxx from in (select id from table where second_index = xxx limit 10 offset 10000)
这句话是说，先从条件查询中，查找数据对应的数据库唯一id值，因为主键在辅助索引上就有，所以不用回归到聚簇索引的磁盘去拉取。再通过这些已经被limit出来的10个主键id，去查询聚簇索引。这样只会十次随机io。在业务确实需要用分页的情况下，使用该方案可以大幅度提高性能。通常能满足性能要求。

写在最后

从一个小问题，往下深究，是技术的一个提升捷径。

来源：juejin.cn/post/6844903939247177741

觉得不错，请点个在看呀

腾讯面试官：分页场景（limit, offset）为什么会慢？