汽车制造商想生产一种跑车,它的平均行驶时间为:
研究人员决定从库存生产线上随机抽样200辆汽车。他们发现,这些汽车的平均四分之一英里运行时间如下:
说这辆车符合制造商的规格是否合理?
解释:
为了解决这个问题,我们需要学习如何从样本统计中推断总体参数。我们将通过回顾参数和统计的定义,回忆与科学方法相关的过程,以及询问问题中的信息来做到这一点。
首先让我们讨论一下人口这个术语的含义。在统计学中,“人口”被描述为被研究的整个群体.在自然科学中,种群的一个例子是每一只大熊猫Ailuropoda melanoleuca在野外(根据世界野生动物基金会,1864只),而不是圈养的。现在,让我们来确定术语总体参数的含义。一个“总体参数”是通过对整个人口进行抽样而得出的统计数据.例如,世界上整个野生大熊猫种群的平均体重就是种群参数的一个例子(即所有1864只大熊猫的平均体重)。接下来,我们将讨论样本总体和统计。
一个“样本”被研究人口的一个子集.例如,一所大学的研究人员想要研究野生大熊猫,但只能接触到中国四川的100只大熊猫样本。从这项特别的研究中收集的数据将被称为样本统计(例如四川地区大熊猫的平均体重)。值得注意的是,一些样本统计的外部有效性受到了阻碍。统计数据的外部效度是指它适用于其他样本并保持有效的能力。如果当地人在四川地区喂养熊猫,那么它们的平均体重可能比南部或北部地区的要大。在这种情况下,平均值将不能代表其他种群的大熊猫。
最后,我们应该注意到,某些样本总体在预测总体参数方面优于其他样本。总体参数可以被认为是给定总体的真实统计量,而样本统计量只是对总体的一部分或子集的估计。简单随机样本是种群参数的良好预测因子,可用于估计种群参数。当种群中的每个成员都有均等的机会被选中时(例如,从世界上1864只熊猫中随机选择100只),它们就会被收集起来。
接下来,我们将观察与科学方法有关的步骤。
在这种方法中,研究人员观察一种现象,并对其进行试探性的解释。之后,他们进行了一个实验,将实验对象或变量分配给对照组和治疗组。实验测量一个自变量(即处理)对一个因变量(即被调查的主体或现象)的变化。为了收集数据进行统计分析,科学家们多次重复或复制这些实验。科学家分析数据,然后使用这些证据来支持或反驳一个假设。假设只能被支持或反驳:永远无法被证明。这是因为科学调查只能收集支持或反对某一特定现象的证据。甚至像引力和自然选择这样的理论也没有得到证实——它们只是得到了几乎无穷无尽的科学证据的支持。
最后,让我们利用这些信息来解决以下问题:
一家汽车制造商想生产一款跑车,它的平均行驶时间为:
研究人员决定从库存生产线上随机抽样200辆汽车。他们发现这些车的四分之一英里平均跑时间如下:
说这辆车符合制造商的规格是否合理?
研究人员发现,200辆汽车行驶的平均时间是:
根据这个抽样统计数据,可以合理地假设汽车能够并将执行制造商的规格。这是因为计算出的平均运行时间仅略高于期望的平均1 / 4英里运行时间。实验中计算出的时间代表测试统计量,而制造商期望的四分之一英里运行时间代表总体参数。这个统计数字代表一个单一的实验,用来检验一个假设:新车的平均行驶时间为
这一假设通过一个单一的实验得到了验证,该实验测量了200辆普通汽车的四分之一英里行驶时间。复制这个实验将收集多个样本的均值。如果研究人员能够收集到人口的四分之一英里跑步时间的普查数据,那么他们就可以创建一个标准曲线:
标准分布表示均值的分布;此外,它的均值(即均值的均值)假设等于总体参数的均值。
研究人员要想对一种特定现象的所有实例进行普查,成本很高,而且不太可能。因此,许多研究人员将取一个有限的样本,并拟合一个标准曲线,以收集总体均值的代表性估计——在这种情况下是四分之一英里跑步时间。在这个例子中,研究人员可以收集100个实验的平均值,并创建以下图表:
我们可以从这个图中看到样本统计量--徘徊在图中均值的中心;因此,有理由假设这个统计数据支持假设,即汽车可以满足设计师的规格。