• Tidak ada hasil yang ditemukan

迴歸分析基本觀念

N/A
N/A
Protected

Academic year: 2023

Membagikan "迴歸分析基本觀念"

Copied!
48
0
0

Teks penuh

最早的回归形式是最小二乘法(Legendre)和1809年发表的高斯法(Gauss)。勒兰德和高斯都将该方法应用于从天文观测中确定物体(主要是彗星,但后来新发现的小行星)围绕太阳的轨道的问题。“回归”一词首先由弗朗西斯·高尔(Francis Gower)由弗朗西斯·高尔顿(Francis Galton)创造。他曾对父母和孩子的身高进行过研究,发现虽然父母的身高会遗传给孩子,但孩子的身高却逐渐“回归到中间(即人的平均身高)”。 )。)”。他把这种“极端”之后“平均”运动的现象称为。利用数学方法探索变量之间的关系;一旦关系被确认,还可以用预测变量和数据来填补。

也称为解释变量,通常指用来解释效应的变量。以“因果”概念为例,他指的是“因”的作用;这种因果关系通常是通过逻辑思维来建立的。统计是帮助验证的工具,因此建立关系的因果关系并不是用统计方法反演的结果,而是研究者首先建立的“假设”,并通过统计结果得到论证。在简单线性回归分析中,变量Independent 必须是连续变量。

又称响应变量,是指随着自变量变化而变化的数字。从“因果”的概念来看,它指的是“结果”的作用。有时需要根据研究的相关信息来定义研究主题,什么是自变量,什么是因变量,例如商业统计分数与上课出勤率之间的关系。分数影响出勤率吗?或者存在会影响数字吗?有时需要从既定的研究主题来确定两者的角色定位。

滿足母體線性迴歸基本假設

真實〕樣本迴歸線(方程式)

殘差:樣本值與迴歸線上的差距

推導樣本迴歸線~最小平方法

用最小平方法求得迴歸係數

最小平方法求得迴歸係數的特質

迴歸模型之 配適度檢定1

衡量迴歸方程式的解釋能力(判定係數) 也客觀檢定其適合度(F檢定)

判定係數(Coefficient of Determination)

衡量迴歸方程式的解釋能力

判定係數的推導

拟合优度:期望观测值全部落在回归线上。因此,SSE越小越好; R2越大,回归模型的解释力越强,拟合度越好。 Y 的变化 100% 由 X 的变化来解释。教科书中的决定系数是以“r”表示的。有一些,但不是全部。 Y 的变化由 X 的变化来解释。教科书中的决定系数用“r”表示。

檢定迴歸模型的適合度

迴歸模型的 F 檢定

與F檢定

MSR越大(SSR越大),越容易拒绝原假设H0,也就是说R2也会越大,并且从两者的关系来看,两者有一定的关系:虽然R2越大,越容易拒绝虚无。假设H0,但从公式中我们可以看出。

如果样本数较少或抽样方差会导致R2较大,但F检验没有解释力(接受H0);或者R2很小,但F检验有解释力。

迴歸模型之 配適度檢定2

檢定斜率與截距的適合度

斜率項與截距項的檢定

已知,由于母亲的方差 σ2 未知,根据假设检验方法,可以采用 t 分布进行检验: 又由于母亲的方差 σ2 未知,因此可以采用 t 分布进行区间估计(置信水平 1- α ):t分布进行区间估计,使置信区间为1-α:。

已知,但父方差 σ2 未知。根据假设检验方法,可以采用t分布进行检验: 决策规则:当t*>tα,n-2时,拒绝原假设H0;表示回归方程有一定的拟合度,或者变量X可以解释变量Y。已知,父方差σ2未知。根据假设检验方法,可以用t分布来检验: 。

又因为 ,母体方差 σ2 未知,可以使用 t 分布进行区间估计(置信水平 1-α): 。

迴歸模型之 信賴區間

迴歸方程式的信賴區間與預測區間

信賴區間與預測區間示意圖

全體依變數平均數的信賴區間

個別依變數的信賴區間(預測區間)

影響信賴區間長度的因素

迴歸模型之配適度檢定3

衡量兩隨機變數相關程度與 變化的方向趨勢

相關分析(Correlation Analysis)

母體相關係數(correlation coefficient)性質

樣本相關係數的估計

相關係數與判定係數間的關係

相關係數與對應的圖示關係

同样,我们使用样本统计量𝑟𝑥𝑦来估计相关系数𝜌𝑥𝑦,这也可以用来检验两个变量之间是否存在显着的样本生成。相同的概念也可用于“右尾测试”或“左尾测试”。

The End

Referensi

Dokumen terkait

区域最新的登革热疫情形势。本报告是WPRO的第一 份通报,目标是要将此类信息交流变为一项常规性工 作,并鼓励西太平洋区域内各个国家和地区继续做好 监测和报告工作。 方法 本报告数据来源于区域内以指标为基础的监测系统, 用描述性分析方法对所报告的2010年登革热流行情 况进行总结。分析重点是那些建立了登革热监测系统 的有登革热地方性流行的国家(即柬埔寨、老挝、马

107年學測國寫題首次將作文從國文考科獨立施測,第一題的知性題,是所謂非連續文本的 圖表分析題,第二題的情意題,須掌握楊牧詩〈夭〉的多重詮釋可能,往詩歌意象探源闡發,以 說出個人的感受和體悟。我們先從目前這唯一一份公開施測的題目,一窺108學測國寫題的因應 之道、以及可能方向。 前者圖表題的閱讀和解釋,是當前跨領域素養學習方向之下應運而生的新型考題,跨領域的