小言_互联网的博客

heapq堆排序

434人阅读  评论(0)

时间复杂度:O(nlogn)

堆:一种特殊的完全二叉树

  • 满二叉树:一个二叉树,如果每一个层的节点数都达到最大值,并且所有叶子节点都在同一层,则这个二叉树就是满二叉树

  • 完全二叉树:叶结点只能出现在最下层和次下层,并且最下面一层的节点都集中在该层最左边的若干位置的二叉树

1)大根堆:一棵完全二叉树,满足任一节点都比其孩子节点大
2)小根堆:一棵完全二叉树,满足任一节点都比其孩子节点小

大根堆:

小根堆:

堆的向下调整性质:
当根节点的左右子树都是堆时,但根本身不满足堆的性质,可以通过一次向下调整来将其变换成一个堆。

堆排序的过程:
1:建立一个堆
2:得到堆顶元素,为最大元素
3:去掉堆顶,将堆最后一个元素放到堆顶,此时可以通过一次调整重新使堆有序
4:堆顶元素为第二大元素
5:重复步骤3,直到堆变空

python实现


   
  1. import random
  2. def sift(li, low, high):
  3. """这个是堆的调整函数——保证得到的是大根堆
  4. :param li: 列表
  5. :param low: 堆的根节点位置
  6. :param high: 堆的最后一个元素的位置
  7. """
  8. i = low # i开始指的是根节点所在的位置index
  9. j = i * 2 + 1 # j开始指的是i的左孩子
  10. tmp = li[low] # 把堆顶存起来
  11. while j <= high: # 只要j的位置有数据,就要进入循环进行对比
  12. if j + 1 <= high and li[j+ 1] > li[j]: # 如果右孩子有且比较大
  13. j += 1 # j指向右孩子
  14. if li[j] > tmp: # 孩子的值是否比堆顶的值大
  15. li[i] = li[j]
  16. i = j # 往下看一层
  17. j = i * 2 + 1
  18. else: # tmp的数值更大,把tmp放到i的位置上
  19. li[i] = tmp # 把tmp放到某一级领导位置上
  20. break
  21. else:
  22.         li[i] = tmp   # 把tmp放到叶子节点上
  23. def heap_sort(li):
  24. """
  25. (n-2)//2来源:n是堆的长度,n-1就是最后一个节点的下标,
  26. 从下标找父节点的公式:(i-1)//2 ,此处的i=n-1
  27. :param li: 待排序列表
  28. :return:
  29. """
  30. n = len(li)
  31. for i in range((n -2)// 2, -1, -1):
  32. # 从最后一个节点开始倒着遍历,range是前包后不包,
  33. # 所以第一个-1代表可以遍历到第0个位置,倒着遍历,所以步长是-1
  34. # i代表建堆时需要调整的部分的根节点的下标
  35. sift(li, i, n -1)
  36. # 建堆完成了
  37. # print("*", li)
  38. for i in range(n -1, -1, -1):
  39. # i指向当前堆的最后一个元素
  40. li[ 0], li[i] = li[i], li[ 0]
  41.         sift(li,  0, i -  1)   # i-1是新的high
  42. li = [i for i in range( 10)]
  43. random.shuffle(li)
  44. print(li, "\n**")
  45. heap_sort(li)
  46. print(li)

python内置模块实现了heapq 是小根堆

有两种方式创建堆:

1. 使用一个空列表,用 heapq.heappush()函数把值加入堆中。

2. 使用 heap.heapify(list) 把列表转换成堆结构。

堆的应用

比如求最大/小的元素,top K 之类的问题,这时候堆排序的优势就出来了。用堆排序在 N 个元素中找到 top K,时间复杂度是 O(N log K),空间复杂度是 O(K)。冒泡插入等排序算法是按线性顺序排列的,是 O(n)的复杂度(需要对 n 个数据进行移位处理),堆排序利用的是完全二叉树,所以更高效。

heapq 的一些常用方法:

1. heapify(list),将列表转换为小根堆的数据结构。

2. heappush(heap, x),将 x 加入堆中。

3. heappop(heap),从堆中弹出最小的元素。

4. heapreplace(heap, x),弹出最小的元素,并将 x 加入堆中。

5. heappushpop(heap, x),先把 x 加入堆中,再弹出最小的元素。

6. heapq.nlargest(n, heap),返回 heap 中前 n 个最大的元素。

7. heapq.nsmallest(n, heap),返回 heap 中前 n 个最小的元素。


   
  1. import heapq
  2. """方法一"""
  3. nums = [ 2, 3, 5, 1, 54, 23, 132]
  4. heap = []
  5. for num in nums:
  6. heapq.heappush(heap, num) # 加入堆
  7. print(heap) # [1, 2, 5, 3, 54, 23, 132]
  8. """方法二"""
  9. nums = [ 2, 3, 5, 1, 54, 23, 132]
  10. heapq.heapify(nums)
  11. print(nums) # [1, 2, 5, 3, 54, 23, 132]
  12. """用 heappop 实现堆排序"""
  13. print([heapq.heappop(nums) for _ in range(len(nums))])
  14. # out: [1, 2, 3, 5, 23, 54, 132]

转载:https://blog.csdn.net/FRBeVrQbN4L/article/details/109663988
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场