箱子和晶须图
要了解盒子和晶须图,你必须了解中位数和四分位数数据集。
中位数是一组数据的中间数量,或两个中间数字的平均值(如果有偶数数据点)。
中位数()将数据分为两部分,上部集和下集。这下四分位数()是下半部分的中位数,而且上四分位数()是上半部分的中位数。
例子:
寻找那, 和对于以下数据集,并绘制框和晶须绘图。
有数据点。中间两个是和。所以中位数,, 是。
数据集的“下半部分”是集合。这里的中位数是。所以。
数据集的“上半部”是集合。这里的中位数是。所以。
一个盒子和晶须绘图显示值那, 和以及数据集的极端值(和, 在这种情况下):
一个盒子和晶须绘图显示一个带左边缘的“框”,右边,盒子的“中间”(中位数)和最大值和最小值为“晶须”。
请注意,绘图将数据划分为相同的部分。左晶须代表底部数据,框的左半部分代表第二个,盒子的右半部分代表第三个,右晶须代表顶部。
异常值
如果数据值远离四分位数(远低于或者大于),有时被指定了一个异常值。代替使用盒子和晶须图的晶须显示的异常值通常显示为单独绘制的点。
异常值的标准定义是一个小于的数字或者大于超过一点倍狭窄的范围()。也就是说,异常值是少于的任何数字或者大于。
例子:
寻找那, 和对于以下数据集。识别任何异常值,并绘制一个盒子和晶须图。
有以越来越顺序排列的值。所以,是个数据点,。
是个数据点,, 和是个数据点,。
狭隘的范围是要么。
现在我们需要找到比的价值低于或者大于。
自从小于和和大于, 有异常值。
盒子和晶须图如图所示。注意和显示为晶须的末端,异物分别绘制。