一家汽车公司的研究人员想观察汽车重量和行驶里程之间的关系。他决定调查40辆车,并将以下数据制成表格。
之后,他将数据绘制成散点图,并将趋势线贴合到图中。
关于数据的线性,下列哪项是最好的结论?
你的答案:
图不是线性的,因为残差的曲线具有随机分布。
你的答案:
这个图不是线性的,因为残差的曲线呈u型分布。
你的答案:
这个图是线性的,因为残差的曲线呈u型分布。
正确答案:
这个图是线性的,因为残差的曲线具有随机分布。
解释:
在线性回归模型中绘制点时,使用趋势线或最佳拟合线对数据进行推断和预测。有几种常见的趋势线类型:对数型、多项式型、指数型、幂型和线性型。与普遍的看法相反,线性趋势线并不总是最适合每一个数据集。换句话说,我们需要测试趋势线,以确定它是否具有点之间的强线性关联。我们可以通过绘制图的残差来验证这一点。
“剩余”是什么意思?图上一个点的残差是用它的实际值减去预测的y值来计算的。它是用下面的等式写的:
在这个方程:
实际值用图表上的点表示,而预测值用趋势线表示。每个实际值与预测值之间的差值就是点的残差。
这个问题提供了散点图的x和y值的表格。并给出了线性趋势线的方程。根据这些信息,我们可以计算预测的y值和散点图的残差。
让我们从使用趋势线方程和x值计算预测的y值开始。
我们从第一个x值开始:
现在,计算散点图中每个x坐标的预测值。然后,计算每个点的残差。例如,
计算图中每个点的残差。
现在,我们已经计算了预测的y值和残差;因此,我们可以创建一个序列残差的图。该图形将包含y轴上的残值和x轴上的原始x值。
现在,我们可以用数据拟合趋势线。注意,在本例中趋势线几乎是水平的。这说明残差数据存在随机扩散,说明点之间存在线性相关关系。正确答案是“这个图是线性的,因为残差的曲线具有随机分布。”现在,我们可以使用散点图的残差图来确定散点图的线性度。