数学作业。做得更快,学得更好。
数据变化
测量数据集变化的一个简单方法是它的范围。
例子:
考虑一组值:。
数据集的最大值为最低的是。所以数据集的值域是
但这并不能说明全部情况。有时,我们还对数据的集群或分布方式感兴趣。
考虑另一组数据。
这两组的范围几乎相同,但分布的形状不同。
如果你画出两者的直线图,它会是这样的:
在第一个数据集中,数据聚集在中位数周围,。
在第二个数据集中,数据更加分散,在范围的顶部附近有一个小集群。
在一组数据中四分位数是将数据分成四个相等部分的值。的中位数将一组数据分成两半。
一组数据的下半部分的中位数是下四分位数(LQ)或。
一组数据的上半部分的中位数是上四分位数(UQ)或。
在这里,和
上下四分位数可以用来找到另一种变化度量,称为四分位数范围。
的四分位范围是范围一组数据的中间部分。它是上四分位数和下四分位数之差。
四分位间距=
在上面的例子中,四分位数范围为。
数据点大于乘以超出四分位数的四分位数范围的值称为离群值。