小言_互联网的博客

超详细总结基于比较的七大经典 排序 -- 不会的童鞋快进来补习

373人阅读  评论(0)

排序

排序概念

  • 排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。
  • 平时的上下文中,如果提到排序,通常指的是排升序(非降序)。
  • 通常意义上的排序,都是指的原地排序(in place sort)。

稳定性

如果当前这个排序,在排序过程中,没有发生跳跃式的交换,那么我们就认为这个排序是稳定的

注意:
一个排序如果是稳定的排序,那么它也可以被时限为一个不稳定的排序
但是如果一个排序本身就是不稳定的排序,那么不可能实现为一个稳定的排序

总览图

(一) 冒泡排序

实现原理

在无序区间,通过相邻数的比较,将最大的数冒泡到无序区间的最后,持续这个过程,直到数组整体有序

代码实现

    public static void bubbleSort(int[] array) {
   
        for (int i = 0; i < array.length-1; i++) {
   
            boolean isSort = true;
            for (int j = 0; j < array.length-1-i; j++) {
   
                if(array[j] > array[j+1]) {
   
                    int tmp = array[j];
                    array[j] = array[j+1];
                    array[j+1] = tmp;
                    isSort = false;
                }
            }
            if(isSort) break;
        }
    }

性能分析

时间复杂度

  • 最好:数组有序:O(n)
  • 最坏:数组逆序:O(n^2)
  • 平均:O(n^2)

空间复杂度:O(1)

稳定性:稳定

(二) 选择排序

实现原理

每一次从无序区间选出最大(或最小)的一个元素,存放在无序区间的最后(或最前),直到全部待排序的数据元素排完 。

代码实现

    public static void selectSort(int[] array) {
   
        for(int i = 0; i < array.length; i++) {
   
            for (int j = i+1; j < array.length; j++) {
   
                if(array[j] < array[i]) {
   
                    int tmp = array[j];
                    array[j] = array[i];
                    array[i] = tmp;
                }
            }
        }
    }

分析与总结

时间复杂度:O(n^2)

空间复杂度:O(1)

稳定性:不稳定

补充:双向选择排序

和选择排序的思路一致,只不过两个变量分别从首尾向中间出发,每次找到左半边最小的交换 和 右半边最大的交换,这样可以减少一些时间复杂度

    public static void selectSortOP(int[] array) {
   
        int low = 0;
        int high = array.length - 1;
        // [low, high] 表示整个无序区间
        // 无序区间内只有一个数也可以停止排序了
        while (low <= high) {
   
            int min = low;
            int max = high;
            for (int i = low + 1; i <= max; i++) {
   
                if (array[i] < array[min]) {
   
                    min = i;
                }
                if (array[i] > array[max]) {
   
                    max = i;
                }
            }
            swap(array, min, low);
            if (max == low) {
   
                max = min;
            }
            swap(array, max, high);
            low++;
            high--;
        }
    }

(三) 插入排序

实现原理

整个区间被分为

  1. 有序区间
  2. 无序区间

每次选择无序区间的第一个元素,在有序区间内选择合适的位置插入

代码实现

    public static void insertSort(int[] array) {
   
        int tmp = 0;
        for(int i = 1; i < array.length; i++) {
   
            tmp = array[i];
            int j;
            for (j = i-1; j >= 0; j--) {
   
                if(array[j] > tmp) {
   
                    array[j+1] = array[j];
                }else {
   
                    break;
                }
            }
            array[j+1] = tmp;
        }
    }

优化代码

我们不难发现,在有序区间选择数据应该插入的位置时,因为区间的有序性,所以可以利用折半查找的思想

在这里插入代码片

性能分析

时间复杂度:

  • 最好情况下:当数据是无序的情况下:O(n^2)
  • 最坏情况下:当数据有序的时候,可以达到O(n^2)

结论:越有序,越快

另外:直接插入排序一般也会用到一些排序的优化上

空间复杂度: O(1)

稳定性: 稳定的排序

(四) 希尔排序

实现原理

希尔排序法又称缩小增量法。

希尔排序法的基本思想是:
先选定一个整数,把待排序文件中所有记录分成个组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后,取,重复上述分组和排序的工作。当到达=1时,所有记录在统一组内排好序。

  1. 希尔排序是对直接插入排序的优化。
  2. 当gap > 1时都是预排序,目的是让数组更接近于有序。当gap == 1时,数组已经接近有序的了,这样就会很
    快。这样整体而言,可以达到优化的效果。我们实现后可以进行性能测试的对比

注意:
此增量序列是一个比较复杂的数学问题,没有固定的答案,
但是必须使增量序列中的值没有除 1 以外的公因子,把那个且最后一个增量值必须等于 1

代码实现

    public static void shellSort(int[] array) {
   
        int[] drr = {
   5,3,1};

        for (int i = 0; i < drr.length; i++) {
   
            shell(array,drr[i]);
        }
    }

    public static void shell(int[] array, int gap) {
   
        for (int i = gap; i < array.length; i++) {
   
            int tmp = array[i];
            int j;
            for (j = i-gap; j >= 0; j -= gap) {
   
                if(array[j] > tmp) {
   
                    array[j+gap] = array[j];
                }else {
   
                    break;
                }
            }
            array[j+gap] = tmp;
        }
    }

性能分析

时间复杂度

  • 最好情况:O(n)
  • 平均情况:O(1.3n) - O(1.5n)
  • 最坏情况:O(n^2)

空间复杂度:O(1)

稳定性:不稳定

(五) 堆排序

实现原理

思路:

  • 我们如果想要从小往大排序,则建立大根堆
  • 我们如果想要从大往小排序,则建立小根堆

逻辑:

  1. 我们交换首位的位置
  2. 然后向下调整尾位置以前的堆
  3. 循环到尾指针 == 0 时,排序结束

这样我们就保证了每次最大的元素放到了最后的位置,全部循环完毕后,则时从小到大排序的

代码实现

    public static void creatBigHeap(int[] array) {
   
        int len = array.length-1;
        int parent = (len-1)/2;
        for (int i = parent; i >= 0; i--) {
   
            adjustDown(i,array,len);
        }
    }

    public static void adjustDown(int parent, int[] array,int end) {
   
        int child = 2*parent+1;
        while (child < end+1) {
   
            if(child+1 <= end && array[child] < array[child+1]) {
   
                child = child+1;
            }
            if(array[child] > array[parent]) {
   
                int tmp = array[child];
                array[child] = array[parent];
                array[parent] = tmp;
                parent = child;
                child = parent*2+1;
            }else {
   
                break;
            }
        }
    }

    public static void heapSort(int[] array) {
   
        creatBigHeap(array);
        int end = array.length-1;
        while (end >= 0) {
   
            int tmp = array[0];
            array[0] = array[end];
            array[end] = tmp;
            end--;
            adjustDown(0,array,end);
        }
    }

性能分析

时间复杂度:O(n * logn)

空间复杂度:O(1)

稳定性:不稳定

(六) 快速排序

实现原理

分治思想

  1. 从待排序区间选择一个数,作为基准值(pivot);
  2. Partition: 遍历整个待排序区间,将比基准值小的(可以包含相等的)放到基准值的左边,将比基准值大的(可
    以包含相等的)放到基准值的右边;
  3. 采用分治思想,对左右两个小区间按照同样的方式处理,直到小区间的长度 == 1,代表已经有序,或者小区间的长度 == 0,代表没有数据

代码实现–递归

    public static void quickSort(int[] array) {
   
        quick(array,0,array.length-1);
    }

    public static void quick(int[] array, int low, int high) {
   
        if(low >= high) return;

        int index = pivot(array,low,high);
        quick(array,low,index-1);
        quick(array,index+1,high);
    }

    public static int pivot(int[] array, int left, int right) {
   
        int piv = array[left];
        while (left < right) {
   
            while (left < right && array[right] >= piv) {
   
                right--;
            }
            array[left] = array[right];

            while (left < right && array[left] <= piv) {
   
                left++;
            }
            array[right] = array[left];
        }
        array[left] = piv;
        return left;
    }

代码实现–非递归

    //相遇点
    public static int pivot(int[] array, int left, int right) {
   
        int piv = array[left];
        while (left < right) {
   
            while (left < right && array[right] >= piv) {
   
                right--;
            }
            array[left] = array[right];

            while (left < right && array[left] <= piv) {
   
                left++;
            }
            array[right] = array[left];
        }
        array[left] = piv;
        return left;
    }

    //快速排序---非递归
    public static void quickSort(int[] array) {
   
        Stack<Integer> stack = new Stack<>();
        int low = 0;
        int high = array.length-1;
        stack.push(low);
        stack.push(high);
        while (!stack.isEmpty()) {
   
            high = stack.pop();
            low = stack.pop();
            int index = pivot(array,low,high);
            if(low+1 < index) {
   
                stack.push(low);
                stack.push(index-1);
            }
            if(high-1 > index) {
   
                stack.push(index+1);
                stack.push(high);
            }
        }
    }

性能分析

分治思想 什么时候效率最高:当每次把待排序的序列 均匀划分的时候

时间复杂度

  • 最好情况:O(n * log(n))
  • 最坏情况:O(n^2)
  • 平均情况:O(n * log(n))

空间复杂度

  • 最好情况:O(n^2)
  • 最坏情况:O(n)
  • 平均情况:O(n^2)

稳定性:不稳定

优化

随机选取基准法

做法:随机找到后面的一个下标,然后和 low 下标的数据进行交换,最后以 low 下标交换后的值作为基准

三数取中法

做法:我们分别取到 首下标 low,尾下标 high,中间下标为 mid = (low+high)/2,最终将 mid 作为基准来选取

范围缩小插入法
当范围越来越小,则越来越趋于有序,越有序,插入排序的时间复杂度越低,所以可以定义,区间数据量低于某个值时,使用插入排序进行优化

详细的优化方法可以看这位博主的文章:
https://blog.csdn.net/insistgogo/article/details/7785038

(七) 归并排序

实现原理

归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide andConquer)的一个非常典型的应用。

将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并

代码实现–递归

    public static void merge(int[] array,int low,int mid,int high) {
   
        int s1 = low;
        int s2 = mid+1;
        int[] tmp = new int[high-low+1];
        int i = 0;
        while (s1 <= mid && s2 <= high) {
   
            if(array[s1] <= array[s2]) {
   
                tmp[i++] = array[s1++];
            }else {
   
                tmp[i++] = array[s2++];
            }
        }
        //可能s1没走完,也可能s2没走完
        while (s1 <= mid) {
   
            tmp[i++] = array[s1++];
        }
        while (s2 <= high) {
   
            tmp[i++] = array[s2++];
        }
        for (int j = 0; j < tmp.length; j++) {
   
            array[j+low] = tmp[j];
        }
    }

    public static void mergeSortInternal(int[] array,int low,int high) {
   
        if(low >= high) return;
        int mid = (low+high)/2;
        mergeSortInternal(array,low,mid);
        mergeSortInternal(array,mid+1,high);
        //合并
        merge(array,low,mid,high);
    }

    public static void mergeSort(int[] array) {
   
        int low = 0;
        int high = array.length-1;
        mergeSortInternal(array,low,high);
    }

代码实现–非递归

    public static void merge(int[] array,int gap) {
   
        int s1 = 0;
        int e1 = s1 + gap - 1;
        int s2 = e1 + 1;
        int e2 = s2 + gap - 1 < array.length ? s2 + gap - 1 : array.length - 1;
        int[] tmp = new int[array.length];
        int i = 0;

        while (s2 < array.length) {
   
             while (s1 <= e1 && s2 <= e2) {
   
                 if (array[s1] <= array[s2]) {
   
                     tmp[i++] = array[s1++];
                 }else {
   
                     tmp[i++] = array[s2++];
                 }
             }
             while (s1 <= e1) {
   
                 tmp[i++] = array[s1++];
             }
             while (s2 <= e2) {
   
                 tmp[i++] = array[s2++];
             }
             s1 = e2 + 1;
             e1 = s1 + gap - 1;
             s2 = e1 + 1;
             e2 = s2 + gap - 1 < array.length ? s2 + gap - 1 : array.length - 1;
        }

        while (s1 < array.length) {
   
            tmp[i++] = array[s1++];
        }

        for (int j = 0; j < tmp.length; j++) {
   
            array[j] = tmp[j];
        }
    }

    public static void mergeSort(int[] array) {
   
        for (int i = 1; i < array.length; i*=2) {
   
            merge(array,i);
        }
    }

海量数据排序

外部排序:排序过程需要在磁盘等外部存储进行的排序

前提:内存只有 1G,需要排序的数据有 100G

因为内存中因为无法把所有数据全部放下,所以需要外部排序,而归并排序是最常用的外部排序

  1. 先把文件切分成 200 份,每个 512 M
  2. 分别对 512 M 排序,因为内存已经可以放的下,所以任意排序方式都可以
  3. 进行 200 路归并,同时对 200 份有序文件做归并过程,最终结果就有序了

性能分析

时间复杂度:O(n * log(n))

空间复杂度:O(n)

稳定性:稳定

七大排序性能对比

排序方法 最好 平均 最坏 空间复杂度 稳定性
冒泡排序 O(n) O(n^2) O(n^2) O(1) 稳定
选择排序 O(n^2) O(n^2) O(n^2) O(1) 不稳定
插入排序 O(n) O(n^2) O(n^2) O(1) 稳定
希尔排序 O(n) O(n^1.3) O(n^2) O(1) 不稳定
堆排序 O(n * log(n)) O(n * log(n)) O(n * log(n)) O(1) 不稳定
快速排序 O(n * log(n)) O(n * log(n)) O(n^2) O(log(n)) ~ O(n) 不稳定
归并排序 O(n * log(n)) O(n * log(n)) O(n * log(n)) O(n) 稳定


小伙伴们学会了 一键三连 支持一下博主呀


转载:https://blog.csdn.net/starry1441/article/details/116349522
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场