飞道的博客

【数据结构】堆(二)——堆排序、TOP-K问题

272人阅读  评论(0)

作者:一个喜欢猫咪的的程序员 

专栏:《数据结构》

喜欢的话:世间因为少年的挺身而出,而更加瑰丽。                                  ——《人民日报》


目录

堆排序:(以小堆为例)

 Heapsort函数(堆排序):

向下调整具体的时间复杂度:

向上调整具体的时间复杂度:

如何实现堆排序

TOP-K问题:


堆排序:(以小堆为例)

堆的分类:

  • 升序or降序
  • 大堆or小堆

  
  1. void test2()
  2. { //堆排序
  3. int array[] = { 27, 15, 19, 18, 28, 34, 65, 49, 25, 37 };
  4. Heapsort( array, sizeof( array) / sizeof( array[ 0]));
  5. for ( int i = 0; i < sizeof( array) / sizeof( array[ 0]); i++)
  6. {
  7. printf( "%d ", array[i]);
  8. }
  9. printf( "\n");
  10. }

 Heapsort函数(堆排序):

int array[] = { 27,15,19,18,28,34,65,49,25,37 };

需将这个数组进行大堆排列,分为两种调整形式:向上调整和向下调整

向上调整和向下调整的思想可以参考我的例外一篇博客:http://t.csdn.cn/YFSpd


  
  1. void Ajustup (HPDataType*a, int child)
  2. { //N*logN
  3. assert(a);
  4. //int child = n - 1;
  5. while (child > 0)
  6. {
  7. int parent = (child - 1) / 2;
  8. if (a[child] > a[parent])
  9. {
  10. Swap(&a[child], &a[parent]);
  11. child = parent;
  12. }
  13. else
  14. {
  15. break;
  16. }
  17. }
  18. }
  19. void Ajustdown (HPDataType* a, int n,int parent)
  20. { //O(N)
  21. assert(a);
  22. int child = 2 * parent+ 1;
  23. while (child<n)
  24. {
  25. if (child + 1 < n && a[child] < a[child + 1]) // <假设左子树大
  26. {
  27. child++;
  28. }
  29. if (a[child] > a[parent]) //>大堆,<为小堆
  30. {
  31. Swap(&a[child], &a[parent]);
  32. parent = child;
  33. child = child * 2 + 1;
  34. }
  35. else
  36. {
  37. break;
  38. }
  39. }
  40. }

 向上调整和向下调整具体的时间复杂度是多少呢?

向下调整具体的时间复杂度:

假设树高为h

第h层,有2^(h-1)个节点,需要向下调整0次(直接不算,从第h-1层开始算)。

第h-1层,有2^(h-2)个节点,需要向下调整1层。

第h-2层,有2^(h-3)个节点,需要向下调整2层。

......

第4层,有2^3个节点,需要向下调整h-4层。

第3层,有2^2个节点,需要向下调整h-3层。

第2层,有2^1个节点,需要向下调整h-2层。

第1层,有2^0个节点,需要向下调整h-1层。

当h高的次数,最多调整层数为:

F(h)=2^0*(h-1)+2^1*(h-2)+2^2*(h-3)+...+2^(h-3)*2+2^(h-2)*1+2^(h-1)*0       ——①

2*F(h)=2^1*(h-1)+2^2*(h-2)+2^3*(h-3)+...+2^(h-2)*2+2^(h-1)*1+2^(h)*0       ——②

有错位相减②-①可得:

F(h)=-2^0*(h-1)+2^1+2^2+....+2^(h-2)+2^(h-1)

F(h)=2^h-1-h                                                                                                           ——③

 当树高为h时,节点总个数N为:

N=2^0+2^1+...+2^(h-2)+2^(h-1)

N=2^h-1                                                                                                                        ——④

有④可得:h=log(N+1)                                                                                            ——⑤

综合③④⑤可得:

F(N)=N-log(N+1)

  •  因此时间复杂度为O(N)

向上调整具体的时间复杂度:

在一层,需要向上调整0次

第二层,向上调整1次

第三层,向上调整2次

...

第h-1层,向上调整h-2次

第h层,向上调整h-1次

F(h)=2^1*1+2^2*2+....+2^(h-1)*(h-1)。

由错位相减可得:

F(N)=2N(1-log(N+1))。

  • 时间复杂度为O(N*logN)

如何实现堆排序

显然向下调整优于向上调整。

 先利用Ajustdown排序好数组,然后再用交换Ajustdown实现小堆。


  
  1. void Heapsort( int*a, int n) //堆排序
  2. { //向上调整
  3. for ( int i = 1; i <n; i++)
  4. {
  5. Ajustup(a, i);
  6. }
  7. //向下调整
  8. for ( int i = (n - 1 - 1) / 2; i >= 0; i--)
  9. {
  10. Ajustdown(a, n, i);
  11. }
  12. int end = n - 1;
  13. while (end> 0)
  14. {
  15. Swap(&a[ 0], &a[end]);
  16. Ajustdown(a, end, 0);
  17. end--;
  18. }
  19. //N*logN
  20. }
  21. void test2()
  22. { //堆排序
  23. int array[] = { 27, 15, 19, 18, 28, 34, 65, 49, 25, 37 };
  24. Heapsort( array, sizeof( array) / sizeof( array[ 0]));
  25. for ( int i = 0; i < sizeof( array) / sizeof( array[ 0]); i++)
  26. {
  27. printf( "%d ", array[i]);
  28. }
  29. printf( "\n");
  30. }

TOP-K问题:

TOP-K问题:即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
比如:专业前10名、世界500强、富豪榜、游戏中前100的活跃玩家等。

当数据量特别大时,我们造一个数组来存储他们依次存储时,就不大现实。

可以先开一个K个空间的数组,将这个数据量的前K个放进去,将他们小堆排列,并将这个数据量每个数与堆顶的元素相比较,比它大就替代它进入数组,在向下排列,以此循环。


  
  1. void test3()
  2. {
  3. int minHeap[ 5];
  4. FILE* fout = fopen( "data.txt", "r");
  5. if (fout == NULL)
  6. {
  7. perror( "fopen fail");
  8. exit( -1);
  9. }
  10. int k = sizeof(minHeap) / sizeof(minHeap[ 0]);
  11. for ( int i = 0; i < k; i++)
  12. {
  13. fscanf(fout, "%d",&minHeap[i]);
  14. }
  15. for ( int i = 0; i < sizeof(minHeap) / sizeof(minHeap[ 0]); i++)
  16. { //检查是否录入数据
  17. printf( "%d ", minHeap[i]);
  18. }
  19. printf( "\n");
  20. for ( int i = (k - 1 - 1) / 2; i >= 0; i--)
  21. {
  22. Ajustdown(minHeap, k, i);
  23. }
  24. for ( int i = 0; i < sizeof(minHeap) / sizeof(minHeap[ 0]); i++)
  25. { //检查是否为大小堆
  26. printf( "%d ", minHeap[i]);
  27. }
  28. printf( "\n");
  29. int data = 0;
  30. while ( fscanf(fout, "%d", &data) != EOF)
  31. {
  32. if (data > minHeap[ 0])
  33. {
  34. minHeap[ 0] = data;
  35. Ajustdown(minHeap, k, 0);
  36. }
  37. }
  38. int end = k - 1;
  39. while (end > 0)
  40. {
  41. Swap(&minHeap[ 0], &minHeap[end]);
  42. Ajustdown(minHeap, end, 0);
  43. end--;
  44. } //完成升序或者降序
  45. for ( int i = 0; i < sizeof(minHeap) / sizeof(minHeap[ 0]); i++)
  46. { //检查是否为大小堆
  47. printf( "%d ", minHeap[i]);
  48. }
  49. printf( "\n");
  50. fclose(fout);
  51. }
  52. void test4()
  53. {
  54. int n, k;
  55. scanf( "%d %d", &n, &k);
  56. FILE* fint = fopen( "data1.txt", "w");
  57. if (fint == NULL)
  58. {
  59. perror( "fopen fail");
  60. exit( -1);
  61. }
  62. srand( time( 0));
  63. int randK = k;
  64. for ( size_t i = 0; i < n; ++i)
  65. {
  66. int data = rand() % 100000;
  67. fprintf(fint, "%d\n", data);
  68. }
  69. fclose(fint);
  70. int* minHeap = ( int*) malloc( sizeof( int) * k);
  71. FILE* fout = fopen( "data1.txt", "r");
  72. if (fout == NULL)
  73. {
  74. perror( "fopen fail");
  75. exit( -1);
  76. }
  77. for ( int i = 0; i < k; i++)
  78. {
  79. fscanf(fout, "%d", &minHeap[i]);
  80. }
  81. for ( int i = 0; i < k; i++)
  82. { //检查是否录入数据
  83. printf( "%d ", minHeap[i]);
  84. }
  85. printf( "\n");
  86. for ( int i = (k - 1 - 1) / 2; i >= 0; i--)
  87. {
  88. Ajustdown(minHeap, k, i);
  89. }
  90. for ( int i = 0; i < k; i++)
  91. { //检查是否为大小堆
  92. printf( "%d ", minHeap[i]);
  93. }
  94. printf( "\n");
  95. int data = 0;
  96. while ( fscanf(fout, "%d", &data) != EOF)
  97. {
  98. if (data > minHeap[ 0])
  99. {
  100. minHeap[ 0] = data;
  101. Ajustdown(minHeap, k, 0);
  102. }
  103. }
  104. int end = k - 1;
  105. while (end > 0)
  106. {
  107. Swap(&minHeap[ 0], &minHeap[end]);
  108. Ajustdown(minHeap, end, 0);
  109. end--;
  110. } //完成升序或者降序
  111. for ( int i = 0; i < k; i++)
  112. { //检查是否为大小堆,升序或者降序
  113. printf( "%d ", minHeap[i]);
  114. }
  115. printf( "\n");
  116. fclose(fout);
  117. }
  118. int main()
  119. {
  120. //test1();
  121. test2();
  122. //test3();
  123. //test4();
  124. return 0;
  125. }


转载:https://blog.csdn.net/m0_69061857/article/details/128359186
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场