資源描述:
《協(xié)方差和相關(guān)系數(shù)》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、如何通俗易懂地解釋「協(xié)方差」與「相關(guān)系數(shù)」的概念?其背后的原理為何可以達(dá)到衡量「相關(guān)性」的效果?1條評論?分享5個回答傅渥成?,統(tǒng)計物理/復(fù)雜系統(tǒng)/生物物理184?人贊同看到這個問題,馬上想到我那天回答的另一個問題了。我們在刻畫這個世界之間的各種關(guān)系的時候,常常會希望度量“距離”:1.對于空間中的兩個點,我們可以用勾股定理定義平方和作為距離;2.對于兩個二進(jìn)制序列,或者兩段基因序列,我們可以用漢明距離來度量二者之間的差異,作為“距離”;3.那么假如對于兩個復(fù)雜的量(描述這兩個量可能用很多很多的參數(shù)),那
2、么這時候怎樣度量二者之間的“相關(guān)性”呢?按照真正的邏輯順序來講,應(yīng)該是這樣講的:?把所有的這些復(fù)雜的參數(shù)排成一列,就拍成了一個向量,很多很多的這樣的向量構(gòu)成了一個向量空間。向量空間里面的東西沒有“距離”這樣的概念,對于一個向量空間里面的向量,甚至沒有“長度”這樣的概念,因為向量空間只是一個代數(shù)結(jié)構(gòu),沒有度量或者拓?fù)涞母拍钤谄渲?,那這時候怎樣度量向量的長度來呢?接下來,又怎樣來確定兩個向量之間的“距離”呢?對于一個可以定義距離的結(jié)構(gòu)(度量空間),我們需要有一些要求,認(rèn)為滿足這些要求的一個函數(shù)就可以認(rèn)為是距
3、離,例如我們要求:A到B的距離等于B到A的距離,A到A的距離等于0,兩個點之間的距離非負(fù),三角不等式。那么對于一個向量空間,怎樣可以最自然地給它一個“范數(shù)”,使得它有可能推廣到一個距離空間(度量空間)呢?最自然的方法就是引入“內(nèi)積”的概念了,通過內(nèi)積的運算,得到內(nèi)積空間,再用內(nèi)積來定義距離(范數(shù)),于是也就有可能得到距離空間。?為什么內(nèi)積空間可以變成一個度量空間呢?這就是我在“學(xué)一門課的時候,要注意理解和思考,不要一味的背公式,背習(xí)題是什么意思?”這個問題里面,我反復(fù)用到了Cauchy不等式,目的也正在
4、此。Cauchy不等式為我們提供了判斷兩個向量是否相關(guān)的方案:(a?b)/
5、a
6、
7、b
8、可以作為度量相關(guān)性的一個函數(shù),而它的直觀意義是什么,請看下面。—————————————這是一條分割線——————————————好了,截止到目前,都是我認(rèn)為一個比較正常,且不算太難的一種解釋的方法,如果覺得這樣理解起來還有困難,那么接下來就只能用能讓中學(xué)生聽懂的,最直觀的方法了,但是我并不喜歡這樣直觀的講法,因為這個講法的邏輯是很混亂的,事先就引入了很多不應(yīng)該過早引入的概念,不過為了幫助理解,也就這樣吧:·有兩個向量
9、,我們希望定義它們是不是相關(guān)。一個很自然的想法,用向量與向量的夾角來作為距離的定義,夾角小,就距離小,夾角大,就距離大?!さ窃鯓觼碛嬎銑A角呢?為了讓這種計算可行,我們要選一種恰當(dāng)?shù)娜呛瘮?shù)來算?!ふ液瘮?shù)的不太好的一個原因是因為加上個90°,正弦算出來得到的結(jié)果一樣,而兩個向量的夾角是30°還是120°這是完全的兩碼事,此外,正弦函數(shù)也不適合推廣到高維度向量的計算中的“兩兩比較”?!つ敲纯紤]用余弦吧,這個可以很方便地區(qū)分30°和120°,而且還有一個好處——余弦的計算非常簡單,用內(nèi)積就可以計算了,中學(xué)
10、數(shù)學(xué)中就學(xué)過:(x1,y1)?(x2,y2)=x1x2+y1y2,這就是內(nèi)積,你要是喜歡,也可以把這個叫做“協(xié)方差”。·但是這個內(nèi)積的定義很奇怪哎?要是兩個向量本身就長,那這個也算不出夾角來,所以再要除以兩個向量本身的長度,即,夾角:cos=(a?b)/
11、a
12、
13、b
14、;·這樣,那么兩個量是不是相關(guān),怎么來判斷?就用余弦的大小就可以了,我們把兩個向量的夾角的余弦,就叫做“相關(guān)系數(shù)”,正如上面的式子所指出的,寫開了就是:分子上面的就是一個內(nèi)積的計算,也就是前面我說的“協(xié)方差”,分子下面是兩個勾股定
15、理乘起來,是兩個向量的長度。如果兩個向量平行,則它們夾角的余弦(也就是“相關(guān)系數(shù)”)就等于1或者-1,同向的時候是1,反向的時候就是-1。如果兩個向量垂直,則夾角的余弦就等于0,說明二者不相關(guān)?!ぴ賹懳叶疾缓靡馑剂耍矣X得這樣應(yīng)該很容易就可以懂了……184?編輯于2013-03-15?37條評論?感謝?更多???作者保留權(quán)利GerYoung?,EE2CS攝影/籃球/音樂愛好者65?人贊同協(xié)方差、相關(guān)系數(shù)是緊密相關(guān)的,二者都是用來描述兩個連續(xù)變量的線性相關(guān)關(guān)系。本答案先簡要闡述相關(guān)概念,再具體闡述幾何上的
16、理解,最后提出一點個人看法。簡要闡述如下:一.協(xié)方差只表示線性相關(guān)的方向,取值正無窮到負(fù)無窮。也就是說,協(xié)方差為正值,說明一個變量變大另一個變量也變大;取負(fù)值說明一個變量變大另一個變量變小,取0說明兩個變量沒有相關(guān)關(guān)系。注意:協(xié)方差的絕對值不反映線性相關(guān)的程度(其絕對值與變量的取值范圍有關(guān)系)。二.相關(guān)系數(shù)不僅表示線性相關(guān)的方向,還表示線性相關(guān)的程度,取值[-1,1]。也就是說,相關(guān)系數(shù)為正值,說明一個變量變大另一個變量也變大;取負(fù)值說明一