迴歸分析基本觀念

最早的回归形式是最小二乘法（Legendre）和1809年发表的高斯法（Gauss）。勒兰德和高斯都将该方法应用于从天文观测中确定物体（主要是彗星，但后来新发现的小行星）围绕太阳的轨道的问题。“回归”一词首先由弗朗西斯·高尔（Francis Gower）由弗朗西斯·高尔顿（Francis Galton）创造。他曾对父母和孩子的身高进行过研究，发现虽然父母的身高会遗传给孩子，但孩子的身高却逐渐“回归到中间（即人的平均身高）”。）。）”。他把这种“极端”之后“平均”运动的现象称为。利用数学方法探索变量之间的关系；一旦关系被确认，还可以用预测变量和数据来填补。

也称为解释变量，通常指用来解释效应的变量。以“因果”概念为例，他指的是“因”的作用；这种因果关系通常是通过逻辑思维来建立的。统计是帮助验证的工具，因此建立关系的因果关系并不是用统计方法反演的结果，而是研究者首先建立的“假设”，并通过统计结果得到论证。在简单线性回归分析中，变量Independent 必须是连续变量。

又称响应变量，是指随着自变量变化而变化的数字。从“因果”的概念来看，它指的是“结果”的作用。有时需要根据研究的相关信息来定义研究主题，什么是自变量，什么是因变量，例如商业统计分数与上课出勤率之间的关系。分数影响出勤率吗？或者存在会影响数字吗？有时需要从既定的研究主题来确定两者的角色定位。

滿足母體線性迴歸基本假設

真實〕樣本迴歸線(方程式)

殘差：樣本值與迴歸線上的差距

推導樣本迴歸線～最小平方法

用最小平方法求得迴歸係數

最小平方法求得迴歸係數的特質

迴歸模型之配適度檢定1

衡量迴歸方程式的解釋能力(判定係數) 也客觀檢定其適合度(F檢定)

判定係數(Coefficient of Determination)

衡量迴歸方程式的解釋能力

判定係數的推導

拟合优度：期望观测值全部落在回归线上。因此，SSE越小越好； R2越大，回归模型的解释力越强，拟合度越好。 Y 的变化 100% 由 X 的变化来解释。教科书中的决定系数是以“r”表示的。有一些，但不是全部。 Y 的变化由 X 的变化来解释。教科书中的决定系数用“r”表示。

檢定迴歸模型的適合度

迴歸模型的 F 檢定

與F檢定

MSR越大（SSR越大），越容易拒绝原假设H0，也就是说R2也会越大，并且从两者的关系来看，两者有一定的关系：虽然R2越大，越容易拒绝虚无。假设H0，但从公式中我们可以看出。

如果样本数较少或抽样方差会导致R2较大，但F检验没有解释力（接受H0）；或者R2很小，但F检验有解释力。

檢定斜率與截距的適合度

斜率項與截距項的檢定

已知，由于母亲的方差 σ2 未知，根据假设检验方法，可以采用 t 分布进行检验：又由于母亲的方差 σ2 未知，因此可以采用 t 分布进行区间估计（置信水平 1- α )：t分布进行区间估计，使置信区间为1-α：。

已知，但父方差 σ2 未知。根据假设检验方法，可以采用t分布进行检验：决策规则：当t*＞tα,n-2时，拒绝原假设H0；表示回归方程有一定的拟合度，或者变量X可以解释变量Y。已知，父方差σ2未知。根据假设检验方法，可以用t分布来检验：。

又因为，母体方差 σ2 未知，可以使用 t 分布进行区间估计（置信水平 1-α）：。

迴歸模型之信賴區間

迴歸方程式的信賴區間與預測區間

信賴區間與預測區間示意圖

全體依變數平均數的信賴區間

個別依變數的信賴區間（預測區間）

影響信賴區間長度的因素

衡量兩隨機變數相關程度與變化的方向趨勢

相關分析(Correlation Analysis)

母體相關係數(correlation coefficient)性質

樣本相關係數的估計

相關係數與判定係數間的關係

迴歸分析基本觀念

判定係數的推導

迴歸模型的 F 檢定

與F檢定

斜率項與截距項的檢定

相關係數與對應的圖示關係