一文搞懂戴克斯特拉算法-dijkstra
大学学习数据结构那会,当时记得终于把 dijkstra 算法搞明白了,但是今天碰到的时候,大脑又是一片空白,于是我就又学习了下,把自己的理解写下来,希望你也可以通过本文搞懂 dijkstra 算法。
dijkstra 的起源
dijkstra 已经 62 岁了,是由荷兰计算机科学家艾兹赫尔·戴克斯特拉在 1956 年制造,并于 3 年后在期刊上发表,在 2001 年的采访中[1]他说到:从鹿特丹到格罗宁根的最短路径是什么?实际上,这就是对于任意两座城市之间的最短路问题。解决这个问题实际上大概只花了我 20 分钟:一天早上,我和我的未婚妻在阿姆斯特丹购物,累了,我们便坐在咖啡馆的露台上喝咖啡,然后我就试了一下能否用一个算法解决最短路问题。正如我所说,这是一个 20 分钟的发现。不过实际上,我在 3 年后的 1959 年才把这个算法发表在论文上。即使现在来看这篇论文的可读性也非常高,这个算法之所以如此优雅,其中一个原因就是我没用笔纸就设计了它。后来我才知道,没用笔纸设计的优点之一是你不得不避免所有可避免的复杂问题。令我惊讶的是,这个算法最终成为我成名的基石之一。"
dijkstra 解决什么问题
主要解决带权图的最短路径问题,如果图中的顶点表示城市,而边上的权重表示城市间开车行经的距离,该算法可以用来找到两个城市之间的最短路径。dijkstra 算法使用类似广度优先搜索的方法解决赋权图的单源最短路径问题。
广度优先搜索,这个应该很形象,记得在算法实现的时候使用队列就可以了。赋权图也好理解,就是边上有权重值,可以理解为两点之间的距离,单源最短路径,就是一个已知的点到其他所有点的最短路径。
当然了,单源最短路径算法也不是只有 dijkstra,还有 Bellman-ford 算法或者 SPFA 算法,在边权非负时适合使用 Dijkstra 算法,若边权为负时则适合使用 Bellman-ford 算法或者 SPFA 算法。今天只聊 dijkstra。
dijkstra 算法思路
咱直接说优化后的思路,其实就是用到了小顶堆(优先级队列)来比较哪一个点的距离最近,关于堆排序,可以参考堆的实现及工程应用。
从起点 s 开始,将与起点 s 直接相连的点,根据它与起点 s 的距离,加入到小顶堆中,堆顶那个点 s1 与起点 s 的距离 d1 一定是最近的,取出堆顶的点 s1 ,然后把与 s1 直接相连的点,根据它与 s 的距离(d1 + s1到这个点的距离),加入到小顶堆中,堆顶那个点 s2 与起点的距离就是最小的。
每次取出堆顶元素的时候,这个堆顶就是已确认的最近距离的点,把它加入已访问的集合中,防止无向图的重复计算,这样直到遍历完所有顶点,就找出了起点到所有点的最小距离。
是不是很简单,就是广度搜索,加上贪心的思想,先找出起点 s 开始直接相连的点(广度搜索),然后找出与 s 第一个最近的点(贪心),从最近的点出发,再次广度,再次贪心,就可以找出距离起点 s 第二个最近的点,直到全部搜索完毕。
算法时间复杂度 O(E+Vlog(v))
,E 是边的数量,V 是定点的数量,Vlog(v) 其实就是堆排序的时间复杂度。
算法时间复杂度 O(E+V)
邻接矩阵的空间复杂度。
如果还不理解的话,多看几遍下这个动图:
dijkstra 代码实现(Python)
为了简化说明,我们使用邻接矩阵来表示一个图,图中有 n 个顶点,标记为 1,2,...n,现在要求解起点 1 到所有其他点的最小距离。
以终为始,先定义一个保存结果的最小距离的数组,cost[n]
cost[i] 就是表示起点 1 到点 i+1 的最小距离,cost[0] = 0,起点 1 到它本身的距离是 0。这里 i+1 是因为数组下标从 0 开始。
假如有 6 个顶点,使用邻接矩阵来表示:
adjacency_matrix = [
[0, 7, 9, -1, -1, 14],
[7, 0, 10, 15, -1, -1],
[9, 10, 0, 11, -1, 2],
[-1, 15, 11, 0, 6, -1],
[-1, -1, -1, 6, 0, 9],
[14, -1, 2, -1, 9, 0]
]
adjacency_matrix[i][j] = c
意思就是点 i+1 到 j+1 的成本是 c,加一的原因是数组的下标从 0 开始。
下面是我根据上述思路,实现的 dijkstra 算法,里面有注释,不难看懂:
import sys
import heapq
max = sys.maxsize
vertices_number = 6
adjacency_matrix = [
[0, 7, 9, -1, -1, 14],
[7, 0, 10, 15, -1, -1],
[9, 10, 0, 11, -1, 2],
[-1, 15, 11, 0, 6, -1],
[-1, -1, -1, 6, 0, 9],
[14, -1, 2, -1, 9, 0],
]
cost = [max] * vertices_number
pq = [] # 优先级队列,最小堆
class Node(object):
def __init__(self, vertex, distance):
self.vertex = vertex
self.distance = distance
def __lt__(self, other):
"""
为了进堆时比较大小,重写 __lt__ 方法
"""
return self.distance < other.distance
def printpq(pq):
## debug 用,查看堆里面的数据
for item in pq:
print(item.vertex, item.distance, end="|")
print("")
def dijkstra(from_vertex, dest_vertex):
from_vertex = from_vertex - 1 # 转换为列表的下标,因此减 1
dest_vertex = dest_vertex - 1
visited = set() # 定义已经确定最小距离的点,防止重复计算。
# 起点入队
heapq.heappush(pq, Node(from_vertex, 0)) # 按照距离比较大小进堆
while pq and len(visited) < vertices_number:
# printpq(pq)
# 出队
node = heapq.heappop(pq)
from_vertex1 = node.vertex
distance1 = node.distance
if from_vertex1 in visited:
# 如果改点已经确认了最小距离,直接抛弃。
continue
# 更新距离,已经确定时最小距离的点加入已访问集合。
print(from_vertex1)
cost[from_vertex1] = distance1
visited.add(from_vertex1)
# 取出 from_vertex1 的邻居节点,
for index, distance in enumerate(adjacency_matrix[from_vertex1]):
# 只选择与 from_vertex1 连通的点,也就是邻居,排除已经确定了最小值的点。
if distance > 0 and index not in visited:
heapq.heappush(pq, Node(index, distance + distance1))
return -1 if cost[dest_vertex] == max else cost[dest_vertex]
if __name__ == "__main__":
print(dijkstra(1, 5))
#其他点的最小距离均已经计算得出:
print(cost)
# assert 20 == dijkstra(1, 5)
最后的话
纯粹的记忆算法的实现其实没有太大用处,算法最重要的是理解它的思路,以及学会灵活的运用,比如说从 A 到 B 中间最多经过 k 个节点的最小距离,你可以试着用 dijkstra 算法的思路来求解么?假如有负数的权值,怎么用 dijkstra 算法求解?
如果有问题,请留言赐教。
都看到这里了,你不确定不关注一下吗?😄
参考资料
在 2001 年的采访中: https://zh.wikipedia.org/wiki/%E6%88%B4%E5%85%8B%E6%96%AF%E7%89%B9%E6%8B%89%E7%AE%97%E6%B3%95