我們將著眼于類別型變量的頻數(shù)表和列聯(lián)表,以及相應(yīng)的獨(dú)立性檢驗(yàn)、相關(guān)性的
度量、圖形化展示結(jié)果的方法還將連帶使用vcd包和gmodels包中的函數(shù)。
數(shù)據(jù)來自vcd包中的Arthritis數(shù)據(jù)集
library(vcd)
一維列聯(lián)表
可以使用table()函數(shù)生成簡單的頻數(shù)統(tǒng)計(jì)表
> mytables<-with(Arthritis,table(Improved))
> mytables
Improved
None Some Marked
42 14 28
可以用prop.table()將這些頻數(shù)轉(zhuǎn)化為比例值
> prop.table(mytables)
Improved
None Some Marked
0.5000000 0.1666667 0.3333333
或使用prop.table()*100轉(zhuǎn)化為百分比:
> prop.table(mytables)*100
Improved
None Some Marked
50.00000 16.66667 33.33333
---
二維列聯(lián)表
對(duì)于二維列聯(lián)表,table()函數(shù)的使用格式為:
其中的A是行變量,B是列變量
table(A,B)
其中的mydata是一個(gè)矩陣或數(shù)據(jù)框
xtabs(~A+B,data=mydata)
> mytable <- xtabs(~ Treatment+Improved,data=Arthritis)
> mytables
Improved
None Some Marked
42 14 28
你可以使用margin.table()和prop.table()函數(shù)分別生成邊際頻數(shù)和比例。行和與行比
例可以這樣計(jì)算:
> margin.table(mytable,1)
Treatment
Placebo Treated
43 41
> margin.table(mytable,2)
Improved
None Some Marked
42 14 28
下標(biāo)1指代table()語句中的第一個(gè)變量,行變量
下標(biāo)2指代table()語句中的第二個(gè)變量,列變量
---
各單元格所占比例可用如下語句獲取
> prop.table(mytable)
Improved
Treatment None Some Marked
Placebo 0.34523810 0.08333333 0.08333333
Treated 0.15476190 0.08333333 0.25000000
每個(gè)單元格比例加起來為1
> prop.table(mytable,1)
Improved
Treatment None Some Marked
Placebo 0.6744186 0.1627907 0.1627907
Treated 0.3170732 0.1707317 0.5121951
> prop.table(mytable,2)
Improved
Treatment None Some Marked
Placebo 0.6904762 0.5000000 0.2500000
Treated 0.3095238 0.5000000 0.7500000
計(jì)算每個(gè)行或者列占比,1為計(jì)算列,2為計(jì)算行
---
你可以使用addmargins()函數(shù)為這些表格添加邊際和
> addmargins(prop.table(mytable,2))
Improved
Treatment None Some Marked Sum
Placebo 0.6904762 0.5000000 0.2500000 1.4404762
Treated 0.3095238 0.5000000 0.7500000 1.5595238
Sum 1.0000000 1.0000000 1.0000000 3.0000000
> addmargins(prop.table(mytable,1))
Improved
Treatment None Some Marked Sum
Placebo 0.6744186 0.1627907 0.1627907 1.0000000
Treated 0.3170732 0.1707317 0.5121951 1.0000000
Sum 0.9914918 0.3335224 0.6749858 2.0000000
計(jì)算每個(gè)行或者列和
> addmargins(mytable)
Improved
Treatment None Some Marked Sum
Placebo 29 7 7 43
Treated 13 7 21 41
Sum 42 14 28 84
> addmargins(prop.table(mytable))
Improved
Treatment None Some Marked Sum
Placebo 0.34523810 0.08333333 0.08333333 0.51190476
Treated 0.15476190 0.08333333 0.25000000 0.48809524
Sum 0.50000000 0.16666667 0.33333333 1.00000000
table()函數(shù)默認(rèn)忽略缺失值(NA)。要在頻數(shù)統(tǒng)計(jì)中將NA視為一個(gè)有效的類別,請(qǐng)?jiān)O(shè)
定參數(shù)useNA="ifany"。
-------
使用gmodels包中的CrossTable()函數(shù)是創(chuàng)建二維列聯(lián)表的第三種方法
。CrossTable()
函數(shù)仿照SAS中PROC FREQ或SPSS中CROSSTABS的形式生成二維列聯(lián)表
用CrossTable生成二維列聯(lián)表
> library(gmodels)
> CrossTable(Arthritis$Treatment,Arthritis$Improved)
Cell Contents
|-------------------------|
| N |
| Chi-square contribution |
| N / Row Total |
| N / Col Total |
| N / Table Total |
|-------------------------|
Total Observations in Table: 84
| Arthritis$Improved
Arthritis$Treatment | None | Some | Marked | Row Total |
--------------------|-----------|-----------|-----------|-----------|
Placebo | 29 | 7 | 7 | 43 |
| 2.616 | 0.004 | 3.752 | |
| 0.674 | 0.163 | 0.163 | 0.512 |
| 0.690 | 0.500 | 0.250 | |
| 0.345 | 0.083 | 0.083 | |
--------------------|-----------|-----------|-----------|-----------|
Treated | 13 | 7 | 21 | 41 |
| 2.744 | 0.004 | 3.935 | |
| 0.317 | 0.171 | 0.512 | 0.488 |
| 0.310 | 0.500 | 0.750 | |
| 0.155 | 0.083 | 0.250 | |
--------------------|-----------|-----------|-----------|-----------|
Column Total | 42 | 14 | 28 | 84 |
| 0.500 | 0.167 | 0.333 | |
--------------------|-----------|-----------|-----------|-----------|
CrossTable()函數(shù)有很多選項(xiàng),可以做許多事情:計(jì)算(行、列、單元格)的百分比;指
定小數(shù)位數(shù);進(jìn)行卡方、Fisher和McNemar獨(dú)立性檢驗(yàn);計(jì)算期望和(皮爾遜、標(biāo)準(zhǔn)化、調(diào)整的
標(biāo)準(zhǔn)化)殘差;將缺失值作為一種有效值;進(jìn)行行和列標(biāo)題的標(biāo)注;生成SAS或SPSS風(fēng)格的輸出。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
文章標(biāo)題:R語言筆記頻數(shù)表和列聯(lián)表-創(chuàng)新互聯(lián)
轉(zhuǎn)載源于:http://jinyejixie.com/article30/cecppo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站營銷、面包屑導(dǎo)航、服務(wù)器托管、網(wǎng)站內(nèi)鏈、建站公司、自適應(yīng)網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容