例子问题
问题1:如何解读点图
一位篮球教练想要确定球员的身高是否可以用来预测球员在一个赛季中的得分。在使用统计测试来确定变量之间的精确关系之前,教练想要直观地看到数据,看看是否可能存在关系。教练应该创造以下哪一个?
z分数
钟形曲线
柱状图
条形图
散点图
散点图
散点图是一种图表,它显示两个变量的值,并提供它们之间关系的一般说明。
问题2:图形数据
是的,负指数关系
没有;没有相关性
是的,负线性关系
是的,正线性关系
是的,负线性关系
数据点遵循整体线性趋势,而不是随机分布。尽管存在一些异常值,但这两个变量之间存在一般关系。
一条线可以准确地预测数据点的趋势,表明存在线性相关。由于y值随着x值的增加而减少,因此相关性必须为负。我们可以看到,连接最上点和最下点的直线斜率为负。
指数关系是弯曲的,而不是直的。
问题2:如何解读点图
将相关系数排序以适应以下图的顺序(不使用两个系数)
,,,,,
,,,
,,,
,,,
,,,
,,,
,,,
第一张图是随机散点,没有相关性,第二张是完美线性,有相关性,后两者有很强的正相关和负相关,学生应该知道一个相关比他们弱得多
问题1:如何解释停顿
求茎叶图中数据的取值范围。
要找到范围,请从最大值中减去最小值
最低:
最大:
所以,
最大值-最小值=
问题2:如何解释停顿
求茎叶图的中位数。
中位数是按递增顺序排列的集合的中间值。
在这个包含11个条目的集合中,中位数是这个集合中按递增顺序排列的第6个条目,即26。
问题1:如何解释停顿
这个茎叶图中有多少项?
条目数是列右侧的位数。
因为总共有21个数字,所以总共有21个条目组成了茎叶图。
问题1:如何解释停顿
以下数据集的四分位数范围是多少?
该停止的读取方式如下:茎是十位,“叶”部分的每个数字都是个位数。把它们放在一起得到一个数据点。
53、65、68、69、70、72、72、79、83、84、85、87、89、90、94
在特殊情况下,有15个数据点,因此中位数是79。因此第一个四分位数是69,第三个四分位数是87。
求四分位数范围就是用第三个四分位数减去第一个四分位数。
问题2:图形数据
根据直方图,以下哪组值在样本中最常见?
58 - 64
64 - 70
62 - 68
54-60
66 - 72
62 - 68
从直方图中可以看到,两个最常见的值范围是62-64和64-66,每组有5个值。从答案选项中,你应该看到只有一个选项,62-68,包含了两个高频柱。它还包含下一个最高的条(66-68,总共4个),所以在14个值中,62-68的范围是所有这些6英寸范围集合中频率最高的。
问题3:图形数据
用直方图表示的下列数据集的中心和扩散的最佳度量是什么?
均值和标准差
中位数和四分位数范围
中位数和标准差
平均值和四分位数范围
均值和极差
中位数和四分位数范围
对于偏态分布,异常值可以极大地影响均值和标准差的值。因此,中位数和IQR会更好地衡量中心和扩散,因为它们不受离群值的很大影响。
问题3:如何解读直方图
路易收集他班上学生睡眠时间的数据。
下面是数据的图形表示
关于Louie班级的数据,以下哪些是错误的?
2小时睡眠的学生是一个异常值
Ii:不包括2小时睡眠的学生,数据大致为正态分布
Iii:没有2小时睡眠的学生数据稍微偏斜
Iv:睡眠2小时的学生在均值的2个标准差范围内
I & ii
Iii & iv
Ii & iv
I, ii & iii
二、三、四
Ii & iv
将数据输入计算器,您可以很快发现平均值为6.5,sd为1.6 6.5-3.2=3.3 3.3>2,因此iv为假,因此2为离群值,因此i为真。
在ii和iii之间,数据不是钟形的,并且在没有上述pt的情况下确实表现出轻微的右偏,这是由于第5和6小时的密度比第8和9小时高