数学作业。更快,学习更好。
数据的变异
测量数据集的变化的一种简单方法是其范围。
例子 :
考虑一组值:。
数据集的最高值是最低的是。因此,数据集的范围是
但这并没有讲述整个故事。有时,我们也有兴趣如何聚集或分布数据。
考虑另一组数据。
这两组具有几乎相同的范围,但分布具有不同的形状。
如果您绘制了两种线图,它将如下所示:
在第一个数据集中,数据围绕中位数群集,。
在第二个数据集中,数据更频繁地扩展,在范围内的顶部附近的小集群。
在一组数据中,四分位数是将数据划分为四个相等部分的值。这中位数一组数据将集合分成两半。
一组数据下半部分的中位数是低四分位数(LQ)或。
一组数据的上半部分的中位数是上四分位数(UQ)或。
这里,和
上部和下四分位数可用于找到另一种变化的衡量标准调用的间形范围。
这畴范围是范围一组数据的中半部分。它是上四分位数和低四分位数之间的差异。
四分位数范围=
在上面的例子中,侧链范围是。
数据点超过倍增在四分位数之外的间形范围的价值称为异常值。