Hotmath
数学作业。做得更快,学得更好。

离群值

离群值是数据集中与其他值非常不同的值。也就是说,异常值是离中间很远的值。

在大多数情况下,异常值对意思,但不在中位数,或模式.因此,离群值对均值的影响是重要的。

没有规则来识别异常值。但有些书将一个值称为异常值,如果它大于 1.5 倍的价值四分位范围超越四分位数

还绘制了数据数轴作为点图将有助于识别异常值。

例子:

找出数据集的异常值。同时找出包括异常值和排除异常值的数据集的均值。

15 75 20. 35 25 85 30. 30. 15 25 30.

首先按顺序排列数据集。

15 15 20. 25 25 30. 30. 30. 35 75 85

用点图在数轴上绘制数据。

的值 75 85 离中间很远。这两个值是给定数据集的异常值。

找出包括异常值在内的数据的平均数、中位数和众数:

的意思是 总和 数据 数量 数据

15 + 15 + 20. + 25 + 25 + 30. + 30. + 30. + 35 + 75 + 85 11

35

求出剔除异常值的数据的均值:

的意思是 总和 数据 数量 数据

15 + 15 + 20. + 25 + 25 + 30. + 30. + 30. + 35 9

25

给定数据集的均值为 35 当包括异常值时,但它确实是 25 当异常值被排除在外时。