排序算法-堆排序(java实现)

it2022-05-05  242

堆排序(heapsort)是指利用堆这种数据结构所设计的一种排序算法,它是选择排序的一种。可以利用数组的特点快速定位指定索引的元素。堆分为大根堆与小根堆。是完全二叉树。

满二叉树与完全二叉树

满二叉树:除了叶子节点之外的每一个节点都有两个孩子,并且所有的叶子都在同一层上,这样的二叉树称为满二叉树。

1.叶子节点只能出现在最下一层,出现在其他层就不可能达成平衡。2.非叶子节点的度一定是2(度指拥有的子树数目)3.在同样深度的二叉树中,满二叉树的节点个数最多,叶子数最多。

完全二叉树:除了最后一层之外的其他每一层节点个数都达到最大个数,并且一层节点都保持向左对齐,这就是完全二叉树。

1.叶子节点只能出现在最下层和次下层2.最下层的叶子节点集中在树的左部3.如果节点的度为1,则该节点只有左孩子,即没有右子树。

满二叉树一定是完全二叉树,反过来不成立。

简单来说,堆排序就是将数据看成完全二叉树、根据完全二叉树的特性来进行排序的一种算法。

最大堆要求节点的元素都要不小于其孩子,最小堆要求节点的元素都不大于其孩子。那么处于最大堆的根节点的元素一定是这个堆中的最大值。

那么,完全二叉树与堆有什么关系呢?

我们假设有一棵完全二叉树,在满足作为完全二叉树的基础上,对于任意一个拥有父节点的子节点,其数值均不小于父节点的值;这样层层递推,就是根节点的值最小,这样的树,称为小根堆。

同理,又有一棵完全二叉树,对于任意一个子节点来说,均不大于其父节点的值,如此递推,就是根节点的值是最大的,这样的数,称为大根堆。

如上图,左边就是大根堆;右边则是小根堆,这里必须要注意一点,只要求子节点与父节点的关系,两个节点的大小关系与其左右位置没有任何关系。

明确下大根堆,小根堆的概念,继续说堆排序。

现在对于堆排序来说,我们先要做的是,把待排序的一堆无序的数,整理成一个大根堆,或者小根堆,下面讨论以大根堆为例子。

给定一个列表array=[16,7,3,20,17,8],对其进行堆排序(使用大根堆)。

接下来内容是转载部分,自己绘图功底太差:其中绿色部分为自己的注解。

步骤一 构造初始堆。将给定无序序列构造成一个大顶堆(一般升序采用大顶堆,降序采用小顶堆)。

  a.假设给定无序序列结构如下

2.此时我们从最后一个非叶子结点开始(叶结点自然不用调整,第一个非叶子结点 arr.length/2-1=5/2-1=1,也就是下面的6结点),从左至右,从下至上进行调整。

此处必须注意,我们把6和9比较交换之后,必须考量9这个节点对于其子节点会不会产生任何影响?因为其是叶子节点,所以不加考虑;但是,一定要熟练这种思维,写代码的时候就比较容易理解为什么会出现一次非常重要的交换了。

4.找到第二个非叶节点4,由于[4,9,8]中9元素最大,4和9交换。

在真正代码的实现中,这时候4和9交换过后,必须考虑9所在的这个节点位置,因为其上的值变了,必须判断对其的两个子节点是否造成了影响,这么说不合适,实际上就是判断其作为根节点的那棵子树,是否还满足大根堆的原则,每一次交换,都必须要循环把子树部分判别清楚。

这时,交换导致了子根[4,5,6]结构混乱,继续调整,[4,5,6]中6最大,交换4和6。

牢记上面说的规则,每次交换都要把改变了的那个节点所在的树重新判定一下,这里就用上了,4和9交换了,变动了的那棵子树就必须重新调整,一直调整到符合大根堆的规则为截。

此时,我们就将一个无序序列构造成了一个大顶堆。

步骤二 将堆顶元素与末尾元素进行交换,使末尾元素最大。然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换。

a.将堆顶元素9和末尾元素4进行交换

这里,必须说明一下,所谓的交换,实际上就是把最大值从树里面拿掉了,剩下参与到排序的树,其实只有总结点的个数减去拿掉的节点个数了。所以图中用的是虚线。

b.重新调整结构,使其继续满足堆定义

c.再将堆顶元素8与末尾元素5进行交换,得到第二大元素8.

后续过程,继续进行调整,交换,如此反复进行,最终使得整个序列有序

下面,附上我的代码。

堆排序代码

public static void sort(int array[]){ /** * 从最后一个非叶子节点开始建堆,对整棵树进行大根堆的调整,最后将最大的数调整到了根节点 */ for (int i=array.length/2-1;i>=0;i--){ adjustHeap(array,i,array.length); } /** * 上面建堆结束,下面开始排序逻辑 * 这里为什么array.length - 1?因为最大下标为len-1 */ for (int j=array.length-1;j>0;j--){ swap(array,0,j); adjustHeap(array,0,j); } } public static void adjustHeap(int[] array,int i,int length){ int temp = array[i]; //i为子树的根节点,k初始值为子树根节点的左孩子节点 for (int k=2*i+1;k<length;k=2*k+1){ //如果还有右节点并且右节点比左节点更大,则k++,即k++后k为右节点的索引 //k+1<length 保障了换到最后面的数不会再被访问到了 if(k+1<length && array[k]<array[k+1]){ k++; } //如果右节点大于子树根节点,则右节点交换至根节点 if (array[k] > temp){ swap(array,i,k); //如果子节点更换了,那么以子节点为根的子树会不会受到影响呢? //所以循环对以子节点为根的树进行判断 i=k; }else { break; } } } /** * 交换! * @param arr * @param a * @param b */ public static void swap(int[] arr, int a, int b) { int temp = arr[a]; arr[a] = arr[b]; arr[b] = temp; }

堆排序的最好、最坏、平均时间复杂度都是O(nlogn),空间复杂度为O(1),是不稳定的排序算法

运行时间主要消耗在构造堆和重建堆时的反复筛选上。

构造堆的时间复杂度为O(n) 重建堆时时间复杂度为O(logn)。

所以总体就是O(nlogn)。 不适合排序序列个数较少的情况。


最新回复(0)