官方給的解釋是
創(chuàng)新互聯(lián)長期為上千家客戶提供的網(wǎng)站建設(shè)服務(wù),團隊從業(yè)經(jīng)驗10年,關(guān)注不同地域、不同群體,并針對不同對象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為瑞安企業(yè)提供專業(yè)的成都做網(wǎng)站、成都網(wǎng)站建設(shè),瑞安網(wǎng)站改版等技術(shù)服務(wù)。擁有10多年豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。
其實這幾個參數(shù)是用于控制 NA 值的,那具體在實際運用中都有哪些效果呢?
就是說矩陣中如果某一列向量有NA值,那么該參數(shù)的作用是凡是同具有NA值的那一列向量計算相關(guān)性,得到的相關(guān)性都是NA
那么凡是與a計算的相關(guān)性都為NA
這一個參數(shù)要求數(shù)據(jù)中不能含有NA,否則報錯,只有不含有NA才能正常計算
這個參數(shù)的作用是將具有NA值的那一行數(shù)據(jù)刪除,用剩下的數(shù)據(jù)計算兩兩間相關(guān)性;如果每一行數(shù)據(jù)都有NA則會報錯
如果每一行數(shù)據(jù)都有NA,則會報錯:
這個參數(shù)的作用和complete.obs類似,只不過如果每一列向量都有NA,則計算相關(guān)性的矩陣并不會報錯,而會給出NA
而如果每一行數(shù)據(jù)都有NA,則會相關(guān)性會給出NA:
這個參數(shù)有些復(fù)雜,要配合 Pearson 相關(guān)系數(shù)來計算。它的作用是如果某一列向量中有NA,那么計算該向量與其他向量相關(guān)性時,去除具有NA的那一行:
我們看到,由于a向量具有NA,b和c沒有NA,所以在計算a,b之間相關(guān)性和a,c之間相關(guān)性的時候,采取的是去除有NA的那一行,用剩下的數(shù)據(jù)計算(如dm和dn);而在計算b,c相關(guān)性的時候則是采用用全部數(shù)據(jù)進行計算的方式(如dr)
在datacamp網(wǎng)站上學(xué)習(xí)“ Time Series with R ”track
“Introduction to Time Series Analysis”課程 做的對應(yīng)筆記。
學(xué)識有限,錯誤難免,還請不吝賜教。
如無特殊說明,筆記中所使用數(shù)據(jù)均來自datacamp課程
自相關(guān)(autocorrelation or lagged correlation)用于評估時間序列數(shù)據(jù)是否依賴于其過去的數(shù)據(jù)。
假設(shè)時間序列是弱平穩(wěn)的: 之間的相關(guān)系數(shù)記為 ,函數(shù)ρ稱為自相關(guān)函數(shù)(autocorrelation function, ACF)
與之類似,自協(xié)方差函數(shù)用 表示
設(shè) 滿足弱平穩(wěn)過程。
設(shè)有例數(shù)為n的時間序列數(shù)據(jù)x,按照自相關(guān)函數(shù)的定義,以計算 為例,我們可以手動構(gòu)造計算自相關(guān)系數(shù)的成對數(shù)據(jù),x_t0 x_t1對應(yīng)x[t],x[t-1],然后用cor()函數(shù)計算 ,本例中n=150:
cor(x_t0, x_t1)輸出為:0.7630314
acf(..., lag.max =1, plot = FALSE)函數(shù)可以用來計算lag為1的自相關(guān)系數(shù):
acf()函數(shù)輸出中l(wèi)ag為1的自相關(guān)系數(shù)為0.758
可以看出我們手動計算的結(jié)果和acf()函數(shù)計算的結(jié)果略有不同。這是因為acf()使用的是用n作為分母的計算版本而手動計算利用cov()函數(shù)使用的是用n-h(這里h=1)作為分母的計算版本。
acf()函數(shù)以n作為分母的計算方法算出的自相關(guān)系數(shù)是有偏的,但是在時間序列分析中更常用(preferred)。
驗證兩種計算方法相差一個因子:(n-h)/n
cor(x_t1, x_t0) * (n-1)/n輸出結(jié)果為0.7579445.
acf(x, lag.max = 1, plot = F)[1][[1]]輸出結(jié)果為0.7579761
看來除了課程中提到的計算版本分母不同以外這兩種計算方法還有其他的差異導(dǎo)致計算結(jié)果在考慮到分母問題以后仍然有一點點微小的不同。
acf(..., lag.max = ..., plot = FALSE)函數(shù)會計算h=0,1,2...直到lag.max參數(shù)指定值對應(yīng)的自相關(guān)系數(shù)。
此外,acf()函數(shù)的plot選項默認為TRUE,可以生成自相關(guān)圖,自相關(guān)圖會顯示各lag值對應(yīng)的自相關(guān)系數(shù),并用藍色水平虛線表示自相關(guān)系數(shù)為0的95%置信區(qū)間邊界線,如果自相關(guān)系數(shù)在兩條虛線以內(nèi)則表明自相關(guān)系數(shù)沒有統(tǒng)計學(xué)意義。
例子數(shù)據(jù):x顯示出強持續(xù)性(persistence),即時間序列的值與前一測量值呈現(xiàn)出強相關(guān)性;y具有周期性,周期大約為4;z則沒有明確的模式。
對上面三個時間序列使用acf()函數(shù):
R語?中的cor和cov
?學(xué)時候的知識忘的還真差不多了。。。
R語?:
cor函數(shù)計算的是列與列間的相關(guān)系數(shù),得到的舉證C(i,j)是第i列與第j列相關(guān)系數(shù)。
相關(guān)系數(shù)的計算公式參考:
cov函數(shù)計算的是列與列的協(xié)?差,計算公式參考:
個?理解:
?差:體現(xiàn)的是?組數(shù)據(jù)的波動情況,值越?波動越?。
協(xié)?差:兩種不同數(shù)據(jù)的?差,體現(xiàn)兩組數(shù)據(jù)的變化趨勢如何,正值變化趨勢?致,負值變化趨勢相反,0不相關(guān)。
相關(guān)系數(shù):兩組不同數(shù)據(jù)的相關(guān)程度,取值范圍[-1,1],越接近與0越不相關(guān),0時卻不意味著兩組數(shù)據(jù)獨?,相關(guān)系數(shù)是兩個變量之間的線性關(guān)聯(lián)的?個度量,不?定有因果關(guān)系的含義。
¥
5.9
百度文庫VIP限時優(yōu)惠現(xiàn)在開通,立享6億+VIP內(nèi)容
立即獲取
R語言中的cor和cov
R語?中的cor和cov
?學(xué)時候的知識忘的還真差不多了。。。
R語?:
cor函數(shù)計算的是列與列間的相關(guān)系數(shù),得到的舉證C(i,j)是第i列與第j列相關(guān)系數(shù)。
相關(guān)系數(shù)的計算公式參考:
cov函數(shù)計算的是列與列的協(xié)?差,計算公式參考:
個?理解:
?差:體現(xiàn)的是?組數(shù)據(jù)的波動情況,值越?波動越?。
第 1 頁
協(xié)?差:兩種不同數(shù)據(jù)的?差,體現(xiàn)兩組數(shù)據(jù)的變化趨勢如何,正值變化趨勢?致,負值變化趨勢相反,0不相關(guān)。
相關(guān)系數(shù):兩組不同數(shù)據(jù)的相關(guān)程度,取值范圍[-1,1],越接近與0越不相關(guān),0時卻不意味著兩組數(shù)據(jù)獨?,相關(guān)系數(shù)是兩個變量之間的線性關(guān)聯(lián)的?個度量,不?定有因果關(guān)系的含義。
分享名稱:python中cor函數(shù) python cov函數(shù)
分享鏈接:http://jinyejixie.com/article40/hpdgeo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供微信小程序、面包屑導(dǎo)航、服務(wù)器托管、定制開發(fā)、靜態(tài)網(wǎng)站、品牌網(wǎng)站設(shè)計
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)