Java树结构高性能堆排序:2秒完成近千万条数据

堆排序

1 堆排序基本介绍

1) 堆排序是利用堆这种数据结构而设计的一种排序算法,堆排序是一种选择排序,它的最坏,最好,平均时间复

杂度均为 O(nlogn),它也是不稳定排序。

2) 堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆, 注意 : 没有

要求结点的左孩子的值和右孩子的值的大小关系。

3) 每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆

4) 大顶堆举例说明

Java 树结构实际应用 一(堆排序2秒排完800w数据)

5) 小顶堆举例说明

Java 树结构实际应用 一(堆排序2秒排完800w数据)

6) 一般升序采用大顶堆,降序采用小顶堆

2 堆排序基本思想

堆排序的基本思想是:

1) 将待排序序列构造成一个大顶堆

2) 此时,整个序列的最大值就是堆顶的根节点。

3) 将其与末尾元素进行交换,此时末尾就为最大值。

4) 然后将剩余 n-1 个元素重新构造成一个堆,这样会得到 n 个元素的次小值。如此反复执行,便能得到一个有序

序列了。

可以看到在构建大顶堆的过程中,元素的个数逐渐减少,最后就得到一个有序序列了

3 堆排序步骤图解说明

要求:给你一个数组 {4,6,8,5,9} , 要求使用堆排序法,将数组升序排序。

步骤一 构造初始堆。将给定无序序列构造成一个大顶堆(一般升序采用大顶堆,降序采用小顶堆)。

原始的数组 [4, 6, 8, 5, 9]

1) .假设给定无序序列结构如下

Java 树结构实际应用 一(堆排序2秒排完800w数据)

2) .此时我们从最后一个非叶子结点开始(叶结点自然不用调整,第一个非叶子结点arr.length/2-1=5/2-1=1,也就是下面的 6 结点),从左至右,从下至上进行调整

Java 树结构实际应用 一(堆排序2秒排完800w数据)

3) .找到第二个非叶节点 4,由于[4,9,8]中 9 元素最大,4 和 9 交换。

Java 树结构实际应用 一(堆排序2秒排完800w数据)

4) 这时,交换导致了子根[4,5,6]结构混乱,继续调整,[4,5,6]中 6 最大,交换 4 和 6。

Java 树结构实际应用 一(堆排序2秒排完800w数据)

此时,我们就将一个无序序列构造成了一个大顶堆。

步骤二 将堆顶元素与末尾元素进行交换,使末尾元素最大。然后继续调整堆,再将堆顶元素与末尾元素交换,得到第二大元素。如此反复进行交换、重建、交换.

1) .将堆顶元素 9 和末尾元素 4 进行交换

Java 树结构实际应用 一(堆排序2秒排完800w数据)

2) .重新调整结构,使其继续满足堆定义

Java 树结构实际应用 一(堆排序2秒排完800w数据)

3) .再将堆顶元素 8 与末尾元素 5 进行交换,得到第二大元素 8

Java 树结构实际应用 一(堆排序2秒排完800w数据)

4) 后续过程,继续进行调整,交换,如此反复进行,最终使得整个序列有序

Java 树结构实际应用 一(堆排序2秒排完800w数据)

再简单总结下堆排序的基本思路:

1).将无序序列构建成一个堆,根据升序降序需求选择大顶堆或小顶堆;

2).将堆顶元素与末尾元素交换,将最大元素"沉"到数组末端;

3).重新调整结构,使其满足堆定义,然后继续交换堆顶元素与当前末尾元素,反复执行调整+交换步骤,

直到整个序列有序。

4 堆排序代码实现

要求:给你一个数组 {4,6,8,5,9} , 要求使用堆排序法,将数组升序排序。

说明:

1) 堆排序的速度非常快,在我的机器上 8 百万数据 2 秒左右。O(nlogn)

2) 代码实现

package com.lin.tree_0308;

import java.text.SimpleDateFormat;

import java.util.Arrays;

import java.util.Date;

public class HeapSort {

public static void main(String[] args) {

// int[] arr = {4, 6, 8, 5, 9};

// 随机生成

int[] arr = new int[80000000];

for(int i = 0; i < 80000000; i++) {

arr[i] =(int)(Math.random()*8000000);

}

Date date1 = new Date();

SimpleDateFormat simpleDateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

String format1 = simpleDateFormat.format(date1);

System.out.println("排序前时间为:" + format1);

heapSort(arr);

Date date2 = new Date();

String format2= simpleDateFormat.format(date2);

System.out.println("排序后时间为:" + format2);

}

// heapSort

public static void heapSort(int[] arr) {

int temp = 0;

// adjustHeap(arr, 1, arr.length);

// System.out.println("第一次:" + Arrays.toString(arr));

//

// adjustHeap(arr, 0, arr.length);

// System.out.println("第二次:" + Arrays.toString(arr));

// 将无序序列建成一个堆,根据升序需求选择大顶堆或小顶堆

for(int j = arr.length/2 -1; j >= 0; j--) {

adjustHeap(arr, j, arr.length);

}

// 将堆顶元素与尾元素交换,将最大元素沉到数组尾端

// 重新调整至堆,继续交换,反复操作直至整个序列有序

for(int j = arr.length-1; j > 0; j--) {

temp = arr[j];

arr[j] = arr[0];

arr[0] = temp;

adjustHeap(arr, 0, j);

}

}

// heap

/**

*

* @Description:

* @author LinZM

* @date 2021-3-11 10:14:16

* @version V1.8

* @param arr 待调整数组

* @param i 表示非叶子节点在数组中的索引

* @param lenght 表示对多少个元素继续调整,逐渐变小

*/

public static void adjustHeap(int[] arr, int i, int length) {

// 先取出当前元素的值

int temp = arr[i];

// j = 2 * i + 1 j是i节点的左节点

for(int j = i * 2 + 1; j < length; j = j * 2 + 1) {

if(j+1 < length && arr[j] < arr[j+1]) {//右子节点大于左子节点

j++;// j指向有子节点

}

if(arr[j] > temp) {// 子节点大于父节点

arr[i] = arr[j];

i = j;

} else {

break;

}

}

arr[i] = temp;

}

}

Java 树结构实际应用 一(堆排序2秒排完800w数据)

仅供参考,有错误还请指出!

有什么想法,评论区留言,互相指教指教。

觉得不错的可以点一下右边的推荐哟

以上是 Java树结构高性能堆排序:2秒完成近千万条数据 的全部内容, 来源链接: utcz.com/a/122458.html

回到顶部