四分位差(quartile deviation)上四分和下四分位数算,它是上四分位数(Q3,即位于75%)与下四分位数(Q1,即位于25%)的差。
公式为:Q = Q3-Q1
四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。四分位差不受极值的影响。此外,由于中位数处于数据的中间位置,因此,四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。四分位差主要用于测度顺序数据的离散程度。对于数值型数据也可以计算四分位差,但不适合分类数据。
四分位数是将一组数据由小到大(或由大到小)排序后,用3个点将全部数据分为4等份,与这3个点位置上相对应的数值称为四分位数,分别记为Q1(第一四分位数),说明数据中有25%的数据小于或等于Q1,Q2(第二四分位数,即中位数)说明数据中有50%的数据小于或等于Q2、Q3(第三四分位数)说明数据中有75%的数据小于或等于Q3。其中,Q3到Q1之间的距离的差的一半又称为分半四分位差,记为(Q3-Q1)/2。
把一个数组从小到大排序,
中位数是中间那个数
上四分位数是排在1/4的那个数
下四分位数是排在3/4的那个数
如果用EXCEL计算($A$1:$A$9为数列)
最小值=QUARTILE($A$1:$A$9,0)
上四分位数=QUARTILE($A$1:$A$9,1)
中位数=QUARTILE($A$1:$A$9,2)
下四分位数=QUARTILE($A$1:$A$9,3)
最大值=QUARTILE($A$1:$A$9,4)
四分位数:将所有数值按大小顺序排列并分成四等份,处于三个分割点位置即为四分位数。Q1=下四分位数,即第25百分位数;Q2=中位数,即第50百分位数;Q3=上四分位数,即第75百分位数。通过Q1,Q2,Q3比较,分析其数据变量的趋势。可四分位数绘制成箱线图,所谓箱线图就是由数据的最大值、最小值、中位数和两个四分位数绘制的一个箱子和两条线段的图形,箱线图直观地反映出一组数据的分布特征,并进行多组数据的分析比较。四分位数还可用于四分位数间距Q = Q3-Q1的计算,四分位数间距常用于描述偏态频数分布以及分布的一端或两端无确切数值资料的离散程度,其数值越大,变异度越大,反之,变异度越小。由于四分位数间距不受两端个别极大值或极小值的影响,因而四分位数间距较全距稳定,但仍未考虑全部观察值的变异度。
四分位数(Quartiles),四分位数是将样本分成四个相等部分的值。包括:第1四分位数(也称下四分位数,P25)、第2四分位数(即中位数,P50)与第3四分位数(也称上四分位数,P75)。利用四分位数,可以快速评估数据集的展开和集中趋势。
四分位数间距(Q)为P75与P25之差,同类资料比较,Q越大意味着数据间变异越大。Q可用于各种分布的资料,特别是服从偏斜分布的资料。
常把中位数和Q结合起来描述变量的平均水平和变异程度。与极差相比,Q较稳定,受两端极大或极小数据的影响小,但仍未考虑数据中每个观测值的离散程度。
中位数(Median),即P50,是指将原始观测值按大小排列后,位次居中的数值。理论上,大于和小于该值的个案数各占一半。
由于中位数不是利用全部观测值计算出来的,它只与位次居中的观测值大小有关,因此不受分布两端特大或特小值的影响。对于分布末端无确定值的资料,不能直接计算平均值和几何平均数时,亦可计算中位数。
四分位数是指数据集中第3个四分位点的数据与第1个四分位点的数据之间差额的一半,这个指标与一般极差的区别在于计算范围较窄,排除了部分极值对变异指标的影响。在Excel中可以通过QUARTILE函数来实现。下面先介绍一下QUARTILE函数。
QUARTILE函数:返回数据集的四分位数。四分位数通常用于在销售额和测量数据中对总体进行分组。例如,可以使用函数QUARTILE求得总体中前25%的收入值。
语法:QUARTILE(array,quart)
array:为需要求得四分位数值的数组或数字型单元格区域。
quart:决定返回哪一个四分位值。它的取值一共有五种情况,如表21.1所示。
表21.1QUART取值及QUARTILE返回值
QUART函数QUARTILE返回值
0最小值
1第一个四分位数(第25个百分点值)
2中分位数(第50个百分点值)
3第三个四分位数(第75个百分点值)
4最大值
如果数组为空,函数QUARTILE返回错误值“#NUM!”。
如果quart不为整数,将被截尾取整。
如果quart4,函数QUARTILE返回错误值“#NUM!”。
当quart分别等于0、2和4时,函数MIN、MEDIAN和MAX返回的值与函数QUARTILE返回的值相同。