最早的回归形式是最小二乘法(Legendre)和1809年发表的高斯法(Gauss)。勒兰德和高斯都将该方法应用于从天文观测中确定物体(主要是彗星,但后来新发现的小行星)围绕太阳的轨道的问题。“回归”一词首先由弗朗西斯·高尔(Francis Gower)由弗朗西斯·高尔顿(Francis Galton)创造。他曾对父母和孩子的身高进行过研究,发现虽然父母的身高会遗传给孩子,但孩子的身高却逐渐“回归到中间(即人的平均身高)”。 )。)”。他把这种“极端”之后“平均”运动的现象称为。利用数学方法探索变量之间的关系;一旦关系被确认,还可以用预测变量和数据来填补。
也称为解释变量,通常指用来解释效应的变量。以“因果”概念为例,他指的是“因”的作用;这种因果关系通常是通过逻辑思维来建立的。统计是帮助验证的工具,因此建立关系的因果关系并不是用统计方法反演的结果,而是研究者首先建立的“假设”,并通过统计结果得到论证。在简单线性回归分析中,变量Independent 必须是连续变量。
又称响应变量,是指随着自变量变化而变化的数字。从“因果”的概念来看,它指的是“结果”的作用。有时需要根据研究的相关信息来定义研究主题,什么是自变量,什么是因变量,例如商业统计分数与上课出勤率之间的关系。分数影响出勤率吗?或者存在会影响数字吗?有时需要从既定的研究主题来确定两者的角色定位。
滿足母體線性迴歸基本假設
真實〕樣本迴歸線(方程式)
殘差:樣本值與迴歸線上的差距
推導樣本迴歸線~最小平方法
用最小平方法求得迴歸係數
最小平方法求得迴歸係數的特質
迴歸模型之 配適度檢定1
衡量迴歸方程式的解釋能力(判定係數) 也客觀檢定其適合度(F檢定)
判定係數(Coefficient of Determination)
衡量迴歸方程式的解釋能力
判定係數的推導
拟合优度:期望观测值全部落在回归线上。因此,SSE越小越好; R2越大,回归模型的解释力越强,拟合度越好。 Y 的变化 100% 由 X 的变化来解释。教科书中的决定系数是以“r”表示的。有一些,但不是全部。 Y 的变化由 X 的变化来解释。教科书中的决定系数用“r”表示。
檢定迴歸模型的適合度
迴歸模型的 F 檢定
與F檢定
MSR越大(SSR越大),越容易拒绝原假设H0,也就是说R2也会越大,并且从两者的关系来看,两者有一定的关系:虽然R2越大,越容易拒绝虚无。假设H0,但从公式中我们可以看出。
如果样本数较少或抽样方差会导致R2较大,但F检验没有解释力(接受H0);或者R2很小,但F检验有解释力。
迴歸模型之 配適度檢定2
檢定斜率與截距的適合度
斜率項與截距項的檢定
已知,由于母亲的方差 σ2 未知,根据假设检验方法,可以采用 t 分布进行检验: 又由于母亲的方差 σ2 未知,因此可以采用 t 分布进行区间估计(置信水平 1- α ):t分布进行区间估计,使置信区间为1-α:。
已知,但父方差 σ2 未知。根据假设检验方法,可以采用t分布进行检验: 决策规则:当t*>tα,n-2时,拒绝原假设H0;表示回归方程有一定的拟合度,或者变量X可以解释变量Y。已知,父方差σ2未知。根据假设检验方法,可以用t分布来检验: 。
又因为 ,母体方差 σ2 未知,可以使用 t 分布进行区间估计(置信水平 1-α): 。
迴歸模型之 信賴區間
迴歸方程式的信賴區間與預測區間
信賴區間與預測區間示意圖
全體依變數平均數的信賴區間
個別依變數的信賴區間(預測區間)
影響信賴區間長度的因素
迴歸模型之配適度檢定3
衡量兩隨機變數相關程度與 變化的方向趨勢
相關分析(Correlation Analysis)
母體相關係數(correlation coefficient)性質
樣本相關係數的估計
相關係數與判定係數間的關係
相關係數與對應的圖示關係
同样,我们使用样本统计量𝑟𝑥𝑦来估计相关系数𝜌𝑥𝑦,这也可以用来检验两个变量之间是否存在显着的样本生成。相同的概念也可用于“右尾测试”或“左尾测试”。
The End