資源描述:
《基于logistic回歸模型的人口預(yù)測分析》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、基于Logistic回歸模型的人口預(yù)測分析尹東旭,李陽,馬雨晨指導(dǎo)老師:徐慧(空軍工程大學(xué),西安XXXXXX)摘要:本文在數(shù)值微分法和最小二乘法曲線擬合的基礎(chǔ)上對Logistic回歸模型進(jìn)行參數(shù)估計,預(yù)測了人口城鎮(zhèn)化和老齡化兩個影響因素以及2016-2030年我國的人口總數(shù)以及人口所能達(dá)到的最大值并對其加以檢驗。關(guān)鍵詞:Logistic回歸模型;數(shù)值微分;參數(shù)估計;曲線擬合;人口預(yù)測1問題重述與社會背景對于中國這樣一個人口大國,人口問題始終是制約我們經(jīng)濟(jì)、文化等各方面發(fā)展的關(guān)鍵因素之一。如何使用數(shù)學(xué)模型來對我國的人口增長進(jìn)行準(zhǔn)確而有效的預(yù)測,關(guān)乎我國的人民幸福
2、,更關(guān)乎國家的發(fā)展大事。近年來中國的人口發(fā)展呈現(xiàn)了一些新的特點,比如老齡化進(jìn)程加速,男女比例失調(diào),以及農(nóng)村人口城鎮(zhèn)化,特別是計劃生育政策的施行,這些都不同水平的影響著人口的增長,而這些因素影響著人口增長趨勢預(yù)測的準(zhǔn)確性。為此,如何綜合考量各方面的因素,較為精確的刻畫出人口增長趨勢,是本文的主要目標(biāo)。經(jīng)過分析與討論后,我們著重探討了以下問題:1.如何從中國的實際情況和人口增長的特點出發(fā),參考表1中的相關(guān)數(shù)據(jù)及其他材料,建立中國人口增長的數(shù)學(xué)模型;-21-2如何利用建立的數(shù)學(xué)模型對中國人口增長做出預(yù)測并加以檢驗。1基本假設(shè)1.預(yù)測時間內(nèi)沒有重大瘟疫、戰(zhàn)爭、自然災(zāi)害
3、等非正常因素影響人口發(fā)展。從圖1中可以看出2003年60歲以上老人的死亡率因為SARS流行達(dá)到五年年來最大值,其余年份假設(shè)基本保持平穩(wěn)。(見圖1)圖1(數(shù)據(jù)來源于中國統(tǒng)計年鑒)2.不考慮多胞胎情況。3.忽略人口統(tǒng)計時漏報誤報現(xiàn)象。4.假設(shè)人口只受我國國內(nèi)的出生率、死亡率和遷移因素影響,不考慮國家之間的移民。-21-1模型的分析與建立1.1logistic模型的介紹Logistic模型是1938年Verhulst—Pearl在修正非密度方程時提出來的,他認(rèn)為在一定的環(huán)境中種群的增長總存在一個上限,當(dāng)種群的數(shù)量逐漸向著上限上升時實際增長率就要逐漸地縮小,所以也被稱
4、為Verhulst—Pearl方程。廣義Logistic曲線可以模仿一些情況的人口增長(P)的S形曲線。起初階段大致是指數(shù)增長;然后隨著人口開始變得飽和,增加變慢;最后,達(dá)到成熟時增加停止,所以又叫sigmoid曲線(S型曲線)。(摘自百度文庫)logistic方程即微分方程:(摘自百度百科)眾所周知,人口增長呈現(xiàn)指數(shù)型增長,但人口是會受到環(huán)境最大容納量、政策變化、經(jīng)濟(jì)發(fā)展、科技進(jìn)步等的影響,因此這些影響因素都成為一種阻滯作用,而人口越接近最大值,這種阻滯作用就越大,所以,我們在數(shù)值微分和最小二乘法曲線擬合的基礎(chǔ)上對Logistic數(shù)學(xué)模型進(jìn)行了參數(shù)估計,此方
5、法對許多事物如經(jīng)濟(jì)、生物種群、醫(yī)療衛(wèi)生的發(fā)展和預(yù)測具有很大的應(yīng)用價值。只要滿足指數(shù)增長的事物(S型曲線),就可以使用這種預(yù)測方法。1.2logistic模型建立首先,我們不妨設(shè)時刻t的人口總量為x(t),并將x(t)看作連續(xù)、可微的函數(shù)。記初始時刻(t=0)的人口為x0。規(guī)定人口的增長率為常數(shù)r,即單位時間內(nèi)x(t)的增量等于r乘以x(t)。我們考慮t到t+?t時間內(nèi)人口的增量,則有xt+?t-xt=rxt?t(1)-21-令?t→0,則得到x(t)滿足如下的微分方程dxdt=rx,x0=x0(2)對人口的阻滯體現(xiàn)在對r的影響上,表現(xiàn)為r隨著人口數(shù)量x的增加而
6、下降.我們不妨把人口的增長率r表示為關(guān)于人口數(shù)量x的函數(shù)r(x),顯而易見r(x)為減函數(shù),于是(2)式可寫為dxdt=r(x)x,x0=x0(3)設(shè)r(x)是x的線性函數(shù),即rx=r-sx(r>0,s>0)(4)此時r表示當(dāng)人口數(shù)目比較少時(理論上設(shè)x=0)的增長率,就是假設(shè)此時的人口是不受自然資源等限制的固有增長率。我們要明確參數(shù)s的含義,可以引入最大人口環(huán)境容納量xm,即我國在現(xiàn)在及未來國情下所能容納的最大人口數(shù)量。則當(dāng)x=xm時,人口達(dá)到最大,此時人口增長率為0,即增長率rxm=r-sxm=0從而得到s=rxm,于是(4)式可改寫為rx=r(1-xxm
7、)(5)將(5)代入(3)得如下的Logistic模型dxdt=rx1-xxm,x0=x0(6)由分離變量法得方程(6)的通解xxm-x=c?rt。利用初始條件得c=x0xm-x0。把c代入通解并簡化得-21-xt=xm1+xmx0-1e-rt。(7)(7)式可簡寫為x=xm1+ae-bt,(8)其中a=xmx0-1,b=r。從(8)式可以看出要想預(yù)測出人口數(shù)量,需求出參數(shù)xm,r或a、b的值。我們采用最小二乘法求Exm,r=i=1nxm1+xmx0-1?-rt-yi2的最小值,通過求?E?xm,?E?r并令它們等于零,利用Matlab軟件進(jìn)行處理可以估算xm
8、,r的值,并對解取倒數(shù),得到1x=1x