資源描述:
《簡單線性回歸模型分析.ppt》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在PPT專區(qū)-天天文庫。
1、第十講簡單線性回歸模型1建立兩個變量X和Y間的關系模型,推斷變量Y如何依賴于變量X,從而可以用X預測Y.例:廣告費用和銷售量公司的市值與CEO的年薪原始股的銷售數(shù)量和期望價格證券市場收益率與某只股票的收益率商品價格和銷售量裝配線的速度和次品數(shù)量年收入與信用卡消費金額年齡與手機話費連鎖店附近的人流與店的利潤氣溫與滑雪場門票銷量………2阿姆德比薩餅連鎖店的問題阿姆得(Armand)比薩餅連鎖店坐落在美國的5個州內(nèi),它們通常的位置是在大學旁邊,而且管理人員相信附近大學的人數(shù)與這些連鎖店的季度銷售額是有關系的。下面是10家連鎖店附近大學的學生人數(shù)和季度銷售收入的數(shù)據(jù):根據(jù)以上數(shù)據(jù),你
2、能否判斷學生人數(shù)(x)如何影響到銷售收入(y)?根據(jù)一家連鎖店附近大學的人數(shù),你能夠預測該家連鎖店的季度銷售收入嗎?3描述學生人數(shù)和銷售收入之間的關系協(xié)方差(315.56)和相關系數(shù)(0.95),散點圖;根據(jù)這些你可以得到什么結論?4TypesofRegressionModelsPositiveLinearRelationshipNegativeLinearRelationshipRelationshipNOTLinearNoRelationship5模型的引入對于給定的學生人數(shù),銷售收入是唯一確定的一個數(shù),還是一個隨機變量?學生人數(shù)的變化如何影響到銷售收入?使用的模型6簡單
3、線性回歸模型Y的截距斜率隨機誤差因變量(響應變量,被預測變量)自變量(解釋變量,預測變量)7?i=隨機誤差YX觀測值觀測值??YX??01YXiii??????018模型的假定1)E(?)=0;(E(y)=?????x)2)對于所有的x,Var(?)=??.3)?是服從正態(tài)分布N(0,??)的.4)對于不同的x,?是相互獨立的.這些假定意味著什么?9X1X2XYfy服從在回歸直線附近的正態(tài)分布對每個x值,y分布的方差相同.回歸直線10估計的回歸方程如何估計參數(shù)??和???最小二乘準則11阿姆德連鎖店的回歸直線估計參數(shù)b1=5b0=60回歸直線你對系數(shù)的含義怎么理解?12回歸方
4、程的判定系數(shù)y的總變差的分解定義判定系數(shù)R2=SSR/SST.判定系數(shù)的含義是什么?阿姆德比薩餅連鎖店的例子:R2=0.9027.判定系數(shù)和相關系數(shù)的關系。13CoefficientsofDetermination(r2)andCorrelation(r)r2=1,r2=1,r2=.8,r2=0,YXYXYYXr=+1r=-1r=+0.9r=0X14??的估計理解誤差平方和??的一個無偏估計s2=MSE=SSE/(n-2)15關于回歸系數(shù)的假設檢驗檢驗統(tǒng)計量給定顯著水平?時,選擇拒絕域16關于回歸方程整體的檢驗變量x的確對y有解釋作用嗎?(H0:??=0)檢驗統(tǒng)計量F=MSR
5、/MSE其中MSR=SSR/自變量的個數(shù)拒絕域F>F?(1,n-2)17回歸方程的方差分析表18阿姆德連鎖店的情形使用EXCEL對阿姆德連鎖店的數(shù)據(jù)建立模型,并進行分析,基于EXCEL的輸出結果,你對該模型有些什么認識?19使用你建立的模型(一)問題一:對于那些附近學校人數(shù)是1萬的連鎖店,他們的季度銷售收入一定是一樣嗎?這種連鎖店平均的季度銷售收入是多少?你能夠給出一個估計嗎?問題二:某家連鎖店附近學生總數(shù)約1萬人,你能夠給出它的季度銷售收入的一個估計值嗎?點估計:11020使用你建立的模型(二)對于問題一,如何得到這種連鎖店平均銷售收入的一個95%的置信區(qū)間?(98.58,
6、121.42)21使用你建立的模型(三)對于問題二,如何給出一個預測區(qū)間,使得這家連鎖店的季度銷售收入落在該區(qū)間里面的概率是1-??(76.13,143.87)22兩種區(qū)間的關系xp預測區(qū)間邊界均值的置信區(qū)間23對模型作進一步的探討回憶我們使用的模型;對模型作了什么假定?邏輯問題:如何判斷我們的問題符合這些假定?分析的方案:殘差分析24通過殘差你能夠了解什么?對誤差項作的假定適合嗎?1)等方差;2)相互獨立;3)正態(tài)分布;哪些數(shù)據(jù)屬于異常值?哪些觀測屬于對回歸模型有很大影響的?25殘差圖關于自變量的殘差圖;關于因變量的預測值的殘差圖;學生化的標準殘差圖:26如何分析殘差圖如果
7、模型是符合的,那么殘差圖上的散點應該落在一條水平帶中間,除此之外,殘差圖上的點不應呈現(xiàn)出什么規(guī)律性。使用EXCEL對阿姆德連鎖店的數(shù)據(jù)產(chǎn)生殘差圖。你能得到什么結論?27非線性線性?XX28方差不等?方差相等XX29不獨立獨立?XX30一個殘差不獨立的例子31異常值的檢測異常值是與其它點顯示的趨勢不合的點。檢查它是否可能是被錯誤輸入的數(shù)據(jù)。檢測異常值的方法:散點圖;利用學生化標準殘差基本服從標準正態(tài)分布來檢測(落在2個標準差之外時)。32帶有異常值的散點圖示例33檢測有影響的觀測值什么是有影響的觀測?觀測