資源描述:
《協(xié)方差和相關(guān)系數(shù)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、如何通俗易懂地解釋「協(xié)方差」與「相關(guān)系數(shù)」的概念?其背后的原理為何可以達(dá)到衡量「相關(guān)性」的效果?1條評(píng)論?分享5個(gè)回答傅渥成?,統(tǒng)計(jì)物理/復(fù)雜系統(tǒng)/生物物理184?人贊同看到這個(gè)問(wèn)題,馬上想到我那天回答的另一個(gè)問(wèn)題了。我們?cè)诳坍?huà)這個(gè)世界之間的各種關(guān)系的時(shí)候,常常會(huì)希望度量“距離”:1.對(duì)于空間中的兩個(gè)點(diǎn),我們可以用勾股定理定義平方和作為距離;2.對(duì)于兩個(gè)二進(jìn)制序列,或者兩段基因序列,我們可以用漢明距離來(lái)度量二者之間的差異,作為“距離”;3.那么假如對(duì)于兩個(gè)復(fù)雜的量(描述這兩個(gè)量可能用很多很多的參數(shù)),那
2、么這時(shí)候怎樣度量二者之間的“相關(guān)性”呢?按照真正的邏輯順序來(lái)講,應(yīng)該是這樣講的:?把所有的這些復(fù)雜的參數(shù)排成一列,就拍成了一個(gè)向量,很多很多的這樣的向量構(gòu)成了一個(gè)向量空間。向量空間里面的東西沒(méi)有“距離”這樣的概念,對(duì)于一個(gè)向量空間里面的向量,甚至沒(méi)有“長(zhǎng)度”這樣的概念,因?yàn)橄蛄靠臻g只是一個(gè)代數(shù)結(jié)構(gòu),沒(méi)有度量或者拓?fù)涞母拍钤谄渲?,那這時(shí)候怎樣度量向量的長(zhǎng)度來(lái)呢?接下來(lái),又怎樣來(lái)確定兩個(gè)向量之間的“距離”呢?對(duì)于一個(gè)可以定義距離的結(jié)構(gòu)(度量空間),我們需要有一些要求,認(rèn)為滿(mǎn)足這些要求的一個(gè)函數(shù)就可以認(rèn)為是距
3、離,例如我們要求:A到B的距離等于B到A的距離,A到A的距離等于0,兩個(gè)點(diǎn)之間的距離非負(fù),三角不等式。那么對(duì)于一個(gè)向量空間,怎樣可以最自然地給它一個(gè)“范數(shù)”,使得它有可能推廣到一個(gè)距離空間(度量空間)呢?最自然的方法就是引入“內(nèi)積”的概念了,通過(guò)內(nèi)積的運(yùn)算,得到內(nèi)積空間,再用內(nèi)積來(lái)定義距離(范數(shù)),于是也就有可能得到距離空間。?為什么內(nèi)積空間可以變成一個(gè)度量空間呢?這就是我在“學(xué)一門(mén)課的時(shí)候,要注意理解和思考,不要一味的背公式,背習(xí)題是什么意思?”這個(gè)問(wèn)題里面,我反復(fù)用到了Cauchy不等式,目的也正在
4、此。Cauchy不等式為我們提供了判斷兩個(gè)向量是否相關(guān)的方案:(a?b)/
5、a
6、
7、b
8、可以作為度量相關(guān)性的一個(gè)函數(shù),而它的直觀意義是什么,請(qǐng)看下面?!@是一條分割線——————————————好了,截止到目前,都是我認(rèn)為一個(gè)比較正常,且不算太難的一種解釋的方法,如果覺(jué)得這樣理解起來(lái)還有困難,那么接下來(lái)就只能用能讓中學(xué)生聽(tīng)懂的,最直觀的方法了,但是我并不喜歡這樣直觀的講法,因?yàn)檫@個(gè)講法的邏輯是很混亂的,事先就引入了很多不應(yīng)該過(guò)早引入的概念,不過(guò)為了幫助理解,也就這樣吧:·有兩個(gè)向量
9、,我們希望定義它們是不是相關(guān)。一個(gè)很自然的想法,用向量與向量的夾角來(lái)作為距離的定義,夾角小,就距離小,夾角大,就距離大?!さ窃鯓觼?lái)計(jì)算夾角呢?為了讓這種計(jì)算可行,我們要選一種恰當(dāng)?shù)娜呛瘮?shù)來(lái)算。·正弦函數(shù)的不太好的一個(gè)原因是因?yàn)榧由蟼€(gè)90°,正弦算出來(lái)得到的結(jié)果一樣,而兩個(gè)向量的夾角是30°還是120°這是完全的兩碼事,此外,正弦函數(shù)也不適合推廣到高維度向量的計(jì)算中的“兩兩比較”。·那么考慮用余弦吧,這個(gè)可以很方便地區(qū)分30°和120°,而且還有一個(gè)好處——余弦的計(jì)算非常簡(jiǎn)單,用內(nèi)積就可以計(jì)算了,中學(xué)
10、數(shù)學(xué)中就學(xué)過(guò):(x1,y1)?(x2,y2)=x1x2+y1y2,這就是內(nèi)積,你要是喜歡,也可以把這個(gè)叫做“協(xié)方差”?!さ沁@個(gè)內(nèi)積的定義很奇怪哎?要是兩個(gè)向量本身就長(zhǎng),那這個(gè)也算不出夾角來(lái),所以再要除以?xún)蓚€(gè)向量本身的長(zhǎng)度,即,夾角:cos=(a?b)/
11、a
12、
13、b
14、;·這樣,那么兩個(gè)量是不是相關(guān),怎么來(lái)判斷?就用余弦的大小就可以了,我們把兩個(gè)向量的夾角的余弦,就叫做“相關(guān)系數(shù)”,正如上面的式子所指出的,寫(xiě)開(kāi)了就是:分子上面的就是一個(gè)內(nèi)積的計(jì)算,也就是前面我說(shuō)的“協(xié)方差”,分子下面是兩個(gè)勾股定
15、理乘起來(lái),是兩個(gè)向量的長(zhǎng)度。如果兩個(gè)向量平行,則它們夾角的余弦(也就是“相關(guān)系數(shù)”)就等于1或者-1,同向的時(shí)候是1,反向的時(shí)候就是-1。如果兩個(gè)向量垂直,則夾角的余弦就等于0,說(shuō)明二者不相關(guān)?!ぴ賹?xiě)我都不好意思了,我覺(jué)得這樣應(yīng)該很容易就可以懂了……184?編輯于2013-03-15?37條評(píng)論?感謝?更多???作者保留權(quán)利GerYoung?,EE2CS攝影/籃球/音樂(lè)愛(ài)好者65?人贊同協(xié)方差、相關(guān)系數(shù)是緊密相關(guān)的,二者都是用來(lái)描述兩個(gè)連續(xù)變量的線性相關(guān)關(guān)系。本答案先簡(jiǎn)要闡述相關(guān)概念,再具體闡述幾何上的
16、理解,最后提出一點(diǎn)個(gè)人看法。簡(jiǎn)要闡述如下:一.協(xié)方差只表示線性相關(guān)的方向,取值正無(wú)窮到負(fù)無(wú)窮。也就是說(shuō),協(xié)方差為正值,說(shuō)明一個(gè)變量變大另一個(gè)變量也變大;取負(fù)值說(shuō)明一個(gè)變量變大另一個(gè)變量變小,取0說(shuō)明兩個(gè)變量沒(méi)有相關(guān)關(guān)系。注意:協(xié)方差的絕對(duì)值不反映線性相關(guān)的程度(其絕對(duì)值與變量的取值范圍有關(guān)系)。二.相關(guān)系數(shù)不僅表示線性相關(guān)的方向,還表示線性相關(guān)的程度,取值[-1,1]。也就是說(shuō),相關(guān)系數(shù)為正值,說(shuō)明一個(gè)變量變大另一個(gè)變量也變大;取負(fù)值說(shuō)明一