例子问题
问题7:如何找到数据集的Z分数
娜塔莉参加了西班牙语和数学的大学入学考试。西班牙语,她得了82分;数学,她得了86分。西班牙语考试成绩的平均值为72,标准差为8。数学考试的结果平均为68,标准差为12。与参加分班考试的其他同学相比,娜塔莉哪门考试做得更好?
西班牙语考试
其他答案都没有,因为这个问题的z分数无法计算
她两次考试成绩都一样好
数学考试
数学考试
我们需要计算娜塔莉西班牙语和数学考试的z分数。z-scores的计算方法如下:
她西班牙语考试的z分数是,等于1.25,而她的数学考试z分数是,等于1.50。由于两个z分数都是正的,娜塔莉在两个测试中的成绩都高于平均水平,但由于她的数学考试的z分数高于她的西班牙语考试的z分数,所以娜塔莉在数学考试中的表现比其他参加考试的同龄人要好。
问题1:Z分布
今年收获的苹果平均质量为标准差为.你从收获的果实中摘一个苹果,发现它的质量是.
你摘的苹果的z分数是多少?
要找到z分数,我们需要遵循下面的公式
在哪里是给定的值,是均值,和是标准差。
对于这个问题,我们看到
和
代入我们看到的这些值
问题1:Z分布
面包机的平均寿命为9年,方差为4年。z分数与面包机寿命小于13年的概率的关系是什么?
是面包机的平均寿命,在这道题中是9年。
是打破制造者生命的标准偏差。标准差是方差的平方根。
X是我们要找的检验统计量。在这个问题中,它是面包机使用时间少于13年的概率。
如果你想在z表中找到与z分数2相关的值,你会看到
问题1:如何找到T分布
t检验的目的是做以下哪项?
比较多个变量的显著性。
测试五个或更多变量之间的关系。
描述总体内的方差。
比较不同总体的均值。
确定一个变量预测另一个变量的能力。
比较不同总体的均值。
t检验用于比较不同组的均值。t检验分数描述了两组之间的均值差异是偶然造成的可能性。原假设假设两个集合相等,但是,可以在特定置信水平内用p值拒绝原假设。
问题1:卡方分布
服从卡方分布自由度和通过是独立的标准正态变量。
如果,是什么??
利用和这个事实标准变量和独立正态变量的平方服从卡方分布自由度。
问题4:如何找到均值的置信区间
的例子0的观测值2成年西栅栏蜥蜴的消耗量统计如下:
找到平均值的置信限为02成年西部栅栏蜥蜴的食性。
因为我们只给出了样本标准差,所以我们将使用t分布来计算置信区间。
适当的公式:
现在我们必须确定变量:
我们必须在给定的基础上找到合适的t值
90%置信度的t值:
查找t值为0.05,55,所以t值= ~ 1.6735
90% CI变为:
问题5:如何找到均值的置信区间
主题 |
角长(in) |
主题 |
角长(in) |
1 |
19.1 |
11 |
11.6 |
2 |
14.7 |
12 |
18.5 |
3. |
10.2 |
13 |
28.7 |
4 |
16.1 |
14 |
15.3 |
5 |
13.9 |
15 |
13.5 |
6 |
12.0 |
16 |
7.7 |
7 |
20.7 |
17 |
17.2 |
8 |
8.6 |
18 |
19.0 |
9 |
24.2 |
19 |
20.9 |
10 |
17.3 |
20. |
21.3 |
上面的数据代表了在补充钙的情况下饲养的非洲水牛的角长。为补充后的角长总体平均值构建95%置信区间。
首先,你必须计算样本的样本均值和样本标准差。
因为我们不知道总体标准差我们将使用t分布来计算置信区间。我们必须在公式中使用标准误差因为我们使用的是抽样分布的标准差。
公式:
为求95%置信区间的合适t值:
查找在t表中,对应的t值= 2.093。
因此95%置信区间为:
问题51:据美联社统计
的为大学中长跑运动员两种训练方案的均值差异所建立的置信区间为.测量的变量是在一个赛季中以秒数或英里数计算的进步。一个项目有更多的速度训练和间歇训练,而另一个项目更侧重于长距离训练。
置信区间告诉我们两个程序之间的差异是什么?
0在区间内,所以不要拒绝null。没有证据表明一个程序比另一个程序好。
置信区间很大,因此一个程序明显比另一个程序更擅长减少英里时间。
的平均改进第二个太小而无关紧要,所以拒绝null。没有证据表明某一项目在减少飞行里程方面做得更好。
0不在区间内,所以拒绝null。这是一个程序在减少英里时间方面明显更好的证据。
大于,因此拒绝null。这是一个程序在减少英里时间方面比另一个程序更好的证据。
0在区间内,所以不要拒绝null。没有证据表明一个程序比另一个程序好。
要使训练方案之间的差异具有统计学意义,95%置信区间不能为零。包括零,所以我们不能说一个程序明显比另一个好。