前言
在性能测试中,我们经常会选择 TP90、TP95 或者 TP99 等水位线作为性能指标。在本文中,我们就给出一种计算 TP90、TP95 和 TP99 等水位线的方法。首先,我们先解释一下 TP90、TP95 和 TP99 的含义:
- TP90,
top percent 90
,即 90% 的数据都满足某一条件; - TP95,
top percent 95
,即 95% 的数据都满足某一条件; - TP99,
top percent 99
,即 99% 的数据都满足某一条件;
在这里,我们之所以说其“满足某一条件”,是因为在计算的时候,我们既可以向前计算也可以向后计算,例如:
1, 2, 3, ..., 98, 99, 100
如上所示,这是一个从 1 至 100 的数列,如果我们想计算其 TP99 的值,其方法为用数列中数值的总个数乘以 99%,即100 * 99% = 99
,显然在这个数列中有两个数值满足这个 99 的概念,分别为:
2
,即数列中 99% 的数值都大于等于2
99
,即数列中 99% 的数值都小于等于99
因此,TP90、TP95 或者 TP99 等水位线是有两种含义的,具体选择哪一种,我们可以按需求自己选择。
计算方法
如果我们要计算 TP90、TP95 或者 TP99 等水位线的值,其前提就是需要我们将所有的待计算值保存起来。那么我们应该用什么数据结构来存储这一系列的值呢?数组?或者列表?实际上,无论我们选择哪一种数据结构,我们都不能假设其长度无限大,因为内存空间是有限的,而且数据结构也有理论上的最大值,但是我们要存储的值的个数却可能是无限的。因此,我们就需要利用有限长度的数据结构存储更多的数值。在这里,数据结构我们选择数组,以计算耗时的 TP90、TP95 或者 TP99 等水位线为例:
double[] SCALE = new double[2400]
int[] countContainer = new int[2400]
如上所示,我们创建了两个长度相同数组,其中
SCALE
数组,用来存储耗时的占位符,表示对应的耗时值;countContainer
数组,用来存储某个耗时值的出现次数,与SCALE
数组一一对应
例如,SCALE[1024]
的值为 1025,而countContainer[1024]
的值为 2050,则表示耗时为 1025 的值出现了 2050 次。
又因为耗时的值可以无限大,而我们却不能穷尽其所有值,更切合实际的情况是:大部分的耗时值都集中在某一个区域。因此,我们只需要列出常见的数值,并利用步长来控制即可,具体方法为:
SCALE
数组索引0 ~ 999
,存储1 ~ 1000
,步长为 1SCALE
数组索引1000 ~ 1899
,存储1010 ~ 10000
,步长为 10SCALE
数组索引1900 ~ 2399
,存储10100 ~ 60000
,步长为 100countContainer
数组索引0 ~ 2399
,均初始化为 0
其中,存储的最大耗时值为 60000,表示 60000 毫秒,也就是 1 分钟。
当记录耗时t
的时候,假设t = 1000
,
- 拿着
t
到SCALE
数组中匹配对应的槽位,计算得知SCALE[999] = 1000
,则其对应槽位的索引值为999
; - 到
countContainer
数组中, 将countContainer[999]
得值累计 1 - 循环步骤 1 和步骤 2
当我们想要计算 TP99 的值,则停止步骤 3,获取耗时的总记录个数sum
,即countContainer
数组中所有值的累加和,然后:
- 计算 TP99 的水位线,假设
sum * 99% = waterline99
- 从
countContainer[0]
开始,从前往后累加数组的值(或者从countContainer[2399]
开始,从后往前累加数组的值) - 当
countContainer[0] + countContainer[1] + ... + countContainer[target] >= waterline99
的时候,记录target
索引 - 拿着
target
到SCALE
数组中匹配对应的槽位,SCALE[target]
即为 TP99 的值
至此,TP99 计算完毕。其它,诸如 TP90 或者 TP95,甚至 TP50 等,可类似计算。
代码
public class MonitorWaterLineCalculator {
// 占位数组
private final double[] SCALE;
// 统计数组
private int[] countContainer;
// 水位线
private double percentXx;
/**
* 构造方法
*
* @param waterLine 水位线
*/
public MonitorWaterLineCalculator(double waterLine) {
if (waterLine < 0.0 || waterLine > 100.0) {
throw new IllegalArgumentException("waterLine must be less than 100.0 and more than 0.0");
} else {
percentXx = (100.0 - waterLine) / 100;
}
SCALE = new double[2400];
countContainer = new int[2400];
// 初始化 SCALE 数组,1 ~ 1000 步长为 1
for (int i = 0; i < 1000; i++) {
SCALE[i] = i + 1;
}
// 初始化 SCALE 数组,1001 ~ 10000 步长为 10
for (int i = 1000, j = 10; i < 1900; i++, j += 10) {
SCALE[i] = 1000 + j;
}
// 初始化 SCALE 数组,10001 ~ 60000 步长为 100
for (int i = 1900, j = 100; i < 2400; i++, j += 100) {
SCALE[i] = 10000 + j;
}
}
/**
* 计算方法
*
* @param value 待计算值
*/
public void accumulate(double value) {
// 找到下标
int index = positionInValueArray(value);
countContainer[index]++;
}
// 容错,确保通过水位线处理后的数值在 [1, MAX] 范围内
private int adjust(int input, int max) {
if (input <= 1) {
return 1;
} else if (input >= max) {
return max;
} else {
return input;
}
}
public double getResult() {
// 已存入数的总个数
int total = 0;
for (int num : countContainer) {
total += num;
}
// 为位置进行容错,该值应该属于 [1,total] 范围
int percentXxPos = adjust((int) (total * percentXx), total);
double percentXxValue = Double.MAX_VALUE;
// 开始遍历每一个元素,从后往前算
int scanned = 0;
int length = countContainer.length;
// 计算结果,或者符合水位线的值,为在步长误差范围内的模糊值
for (int index = length - 1; index >= 0; index--) {
// 当前没有值,无论如何也不会成为备选
if (0.0 == countContainer[index]) {
continue;
}
// 当前有值
scanned += countContainer[index];
if (scanned >= percentXxPos) {
percentXxValue = SCALE[index];
break;
}
}
return percentXxValue;
}
/**
* 寻找待处理数值在数组中的位置
*
* @param val 待处理值
* @return 数组中的位置
*/
private int positionInValueArray(double val) {
int length = SCALE.length;
// 如果大于最大值或者小于等于最小值
if (val >= SCALE[length - 1]) {
return length - 1;
} else if (val <= SCALE[0]) {
return 0;
}
// 采用二分法计算
return binarySearch(SCALE, 0, length - 1, val);
}
/**
* 二分查询
*
* @param array 待处理数组
* @param begin 查询数组起始索引
* @param end 查询数组结束索引
* @param value 待查询值
* @return 数组中的位置
*/
private int binarySearch(double[] array, int begin, int end, double value) {
int mid = (begin + end) >> 1;
double midValue = array[mid];
double halfMidValue = midValue / 2;
// 判断是否可以命中
if (value > halfMidValue && value <= midValue) {
return mid;
}
// 没法命中,则根据大小来定
if (value <= halfMidValue) {
// 处理边界条件
if (mid - 1 < 0) {
return 0;
}
return binarySearch(array, begin, mid - 1, value);
} else {
return binarySearch(array, mid + 1, end, value);
}
}
}
如上述代码所示,记录数值的时候,调用accumulate
方法;获取结果的时候,调用getResult
方法。
特别地,MonitorWaterLineCalculator
构造器支持自定义的参数,灵活性更高。
转载:https://blog.csdn.net/qq_35246620/article/details/101284451