Hotmath
数学作业。做得更快,学得更好。

数据的正态分布

一个正态分布是很常见的概率分布。它的形状通常被称为“钟形曲线”。

许多日常数据集通常遵循正态分布:例如,成年人的身高,给一大群人的测试分数,测量误差。

正态分布总是与均值对称。

标准偏差是一组正态分布的数据分布的度量。它是一种统计量,告诉你数据集中所有样本与平均值的接近程度。正态分布的形状由平均值和标准差决定。钟形曲线越陡,标准差越小。如果样本分布得很远,钟形曲线就会平坦得多,这意味着标准差很大。

一般来说,大约 68 正态分布曲线下的面积有一半位于离平均值一个标准差的范围内。

也就是说,如果 x ¯ 是均值和 σ 是分布的标准差吗 68 的值落在两者之间的范围 x ¯ σ x ¯ + σ 。在下面的图中,这对应于粉红色阴影区域。

关于 95 其中的值位于平均值的两个标准差以内,即在 x ¯ 2 σ x ¯ + 2 σ

(图中,这是粉色和蓝色区域的总和: 34 + 34 + 13.5 + 13.5 = 95 。)

关于 99.7 其中一个值位于平均值的三个标准差以内,即在 x ¯ 3. σ x ¯ + 3. σ

(图中粉色、蓝色和绿色区域)

(请注意,这些值是近似值。)

示例1:

一组数据正态分布,均值为 5 。小于百分之几的数据 5

正态分布是关于均值对称的。一半的数据小于均值,一半的数据大于均值。

因此, 50 数据的百分比小于 5

示例2:

充满电的手机电池的寿命呈正态分布,平均值为 14 小时,标准差为 1 小时。一个电池至少能持续使用的概率是多少 13 小时?

平均值是 14 标准差是 1

50 正态分布的右侧,所以 50 的时间,电池将持续比 14 个小时。

13 14 小时代表均值左边的一个标准差。所以,关于 34 时间的推移,电池将持续之间 13 14 个小时。

因此,电池续航时间至少为 13 Hours是关于 34 + 50 0.84

示例3:

树莓的平均重量是 4.4 Gm,标准差为 1.3 随机选择的树莓重量至少为 3.1 一般但不超过 7.0 通用汽车吗?

平均值是 4.4 标准差是 1.3

请注意,

4.4 1.3 = 3.1

4.4 + 2 1.3 = 7.0

那么,区间 3.1 x 7.0 在均值下一个标准差和 2 高于平均值的标准差。

在正态分布数据中,约 34 在平均值和低于平均值一个标准差之间的值,和 34 在平均值和平均值上一个标准差之间。

此外, 13.5 其中一个值位于平均值以上的第一个和第二个标准差之间。

面积相加,得到 34 + 34 + 13.5 = 81.5

因此,随机选择的树莓的重量至少为 3.1 一般但不超过 7.0 通用汽车 81.5 0.815

示例4:

一个城镇有 330000年 成年人。它们的高度呈正态分布,平均值为 175 和的方差 One hundred. 厘米 2 你认为自己比多少人高 205 厘米吗?

方差给定数据集的 One hundred. 厘米 2 。所以标准差是 One hundred. 10 厘米。

现在, 175 + 3. 10 = 205 ,所以身高比的人的数量 205 Cm对应于大于的数据子集 3. 高于平均值的标准差。

上图显示,这代表了大约 0.15 数据。然而,这个百分比是近似值,在这种情况下,我们需要更高的精度。实际百分比,正确到 4 小数点,是 0.1318

330 000 × 0.001318 435

所以,会有大约 435 镇上的人比 205 厘米。