统计学:描述性统计

学习统计学的概念,示例问题和解释

大学导师应用商店 大学导师安卓商店

例子问题

问题1:正态分布

一个学生得A在学术评估测试(SAT)。大学招生委员会不知道考试的分数;但是,他们知道考试的分数是正态分布的。他们还知道参加测试的学生总体的平均分和标准差。

利用这些信息,判断学生在SAT考试中是否取得好成绩。

可能的答案:

这个学生的成绩非常好:超过了平均值的两个标准差。

这个学生的分数很低:低于平均值的两个标准差。

这个学生的分数很低:低于平均值的一个标准差。

这个学生的成绩很好:高于平均值的一个标准差。

这个学生的分数是平均分,和平均分差不多。

正确答案:

这个学生的成绩非常好:超过了平均值的两个标准差。

解释

为了解决这个问题,让我们考虑概率和正态钟形曲线分布。假设所有事件的概率都是相等的,那么概率的计算公式如下:

当计算特定事件的给定总体概率时,它们可以用频率图或直方图表示。如果它们形成标准分布,则图形将形成如下形状:

Normaldistribution

这种形状被称为钟形曲线。在这条曲线中,平均值被称为算术平均值,并被表示为峰值。平均值改变了图形的位置。如果平均值增加或减少,则图形分别向右或向左移动。均值表示如下:

另一方面,标准偏差是一种计算,表明每个值偏离平均值的平均量。当标准偏差改变时,图形的形状也会改变。当标准差减小时,图形就会变高变细。同样,当标准差增加时,图形变得更短更宽。值得注意的是,正常总体中99.7%的值存在于高于平均值和低于平均值的三个标准差之间。用以下注释表示:

现在我们已经讨论了钟形曲线的组成部分,让我们考虑问题中呈现的场景。

我们知道考试成绩的分布遵循正态曲线。我们还知道以下值:

首先,我们应该将数据绘制成具有三个标准差的钟形曲线形状的图形。

Satnorm

我们知道这个学生的分数如下:

我们计算均值以上两个标准差。

这个学生的成绩非常好:比平均值高出两个标准差。注意,在图形的这一点上,曲线的尾部更接近水平轴或x轴。这意味着很少有学生在考试中得到这么高的分数。换句话说,这个学生表现得很好。

问题1:倾斜分布

一位社会科学家进行了一项实验,测试几种人口统计数据的频率和相关性。她绘制了一张直方图来衡量收入与教育水平的关系。她制作了下面的图表:

Skewedright

下面哪个选项最能描述这个模型?

可能的答案:

统一的

左倾斜

双峰

这些都不是

右偏态

正确答案:

右偏态

解释

为了解决这个问题,让我们回顾一下以下分布:正态分布、正/右偏分布、负/左偏分布、双峰分布和均匀分布。

正态分布:

正常的

正态分布也被称为钟形曲线。形成钟形曲线的数据有三个主要特征:数据是单峰的,这意味着它有一个模式,它是对称的,并且不包含异常值。

正/右偏斜分布

Skewedright

由于异常值的存在,正偏或右偏分布的右侧尾部较长,而大多数点集中在图的左侧。换句话说,这个集合倾向于模型左边的概率。

负/左偏分布

Skewedleft

由于异常值的存在,负或左偏态分布的左侧尾部较长,而大多数点集中在图的右侧。换句话说,该集合倾向于模型右侧的概率。

双峰分布

双峰

在双峰分布中,由于数据集中的几个模态,存在两个峰值。这些多重集中趋势是集合中两个或两个以上有利概率的结果。

均匀分布

统一的

在均匀分布中,数据点形成一个矩形。当数据点具有恒定的概率时,这些模型就形成了。

问题中的模型符合正或右偏态分布;因此,正确的答案是“右偏斜”。

大学导师提供的学习工具