Các mô hình tiên lượng tử vong Hà Tấn Đức Bệnh viện đa khoa trung ương Cần Thơ Đại học Tôn Đức Thắng Thực hành R Ngày 3 1 Câu hỏi 10 File ‘test excel file 1 xls’, đặt tên data Vẽ histogram cho x1 Dùng.
Thực hành R Ngày Hà Tấn Đức Bệnh viện đa khoa trung ương Cần Thơ Đại học Tôn Đức Thắng Phân tích mơ tả biểu đồ Câu hỏi 10 File ‘test excel file 1.xls’, đặt tên data Vẽ histogram cho x1 Dùng hàm hist() Package: ‘graphics’ Các argument hàm bao gồm: − − − − x: tên biến liên tục breaks: số cột yêu cầu xlab: nhãn trục hồnh ylab: nhãn trục tung Phân tích mô tả biểu đồ Câu hỏi 10 Vẽ boxplot cho x1 disease, gender Hàm boxplot, packages: ‘graphics’ Các argument hàm: − − formula: y ~ group data: báo R biết làm việc dataset boxplot(x1~disease) boxplot(x1~disease + gender) Phân tích mơ tả biểu đồ Câu hỏi 10 boxplot(x1~disease) boxplot(x1~disease + gender) Cách khác: − − − − − − gr= gender + disease gr[gender=='Female' & disease==0]= 'Nu lanh' gr[gender=='Female' & disease==1]= 'Nu benh' gr[gender=='Male' & disease==0]= 'Nam lanh' gr[gender=='Male' & disease==1]= 'Nam benh' boxplot(x1~gr) Câu hỏi 10 Soạn biểu đồ barplot số người bị obesity, overweight, normal cho giới tính dat$w.group=bmi dat$w.group[bmi24 & bmi30]='Obesity' attach(dat) Câu hỏi 10 Soạn biểu đồ barplot số người bị obesity, overweight, normal cho giới tính Hàm barplot Packages: graphics Các argument cần thiết: − − − − height: vector matrix beside: xếp nhiều bar bar legend.text: đặt tên legend col: pha màu cho bar Câu hỏi 10 Soạn biểu đồ barplot số người bị obesity, overweight, normal cho giới tính barplot(table(w.group,gender)) barplot(table(w.group,gender),beside=T) barplot(table(w.group,gender), beside=T, legend.text= c('Normal','Overweight','Obesity')) barplot(table(w.group,gender),beside=T,legend.text=c('Normal','Overweight','Obesity'), col=c('red','blue','green')) Câu hỏi 10 Soạn biểu đồ barplot số người bị obesity, overweight, normal cho giới tính barplot(table(w.group,gender),beside=T,col=c('red','blue','green')) legend('topright', legend=c('Normal','Overweight','Obesity'), fill=c('red','blue','green'),bty='n') Phân tích mơ tả biểu đồ Câu hỏi 10 Soạn biểu đồ barplot giá trị trung bình x1 cho ba nhóm cân nặng (obesity, overweight, normal) pbc$wgroup=bmi pbc$wgroup[bmi=25 & bmi=30]='obesity' attach(pbc) bar=data.frame(wgroup=levels(as.factor(wgroup)), meanx=tapply(x1,wgroup,mean,na.rm=T), sdx=tapply(x1, wgroup,sd,na.rm=T)) barplot(bar$meanx) Câu hỏi 10 Vẽ barplot giá trị trung bình x1 cho nhóm cân nặng Hàm tapply Packages: base Các argument hàm: − − − − X: biến liên tục INDEX: biến phân nhóm FUN: tính mean, var, sd na.rm: loại bỏ giá trị NA Hàm barplot 10 Câu hỏi 10 Vẽ barplot giá trị trung bình x1 cho nhóm cân nặng meanx=tapply(x1, w.group, mean,na.rm=T) barplot (meanx, ylim=c(0, 6)) 11 Phân tích mơ tả biểu đồ Câu hỏi 10 Vẽ biểu đồ tương quan weight, x1 đường biểu diễn tuyến tính Hàm plot Package: graphics Các argument hàm: − − − x: vector x y: vector y type: loại plot vẽ Hàm lm Package: stat Các argument hàm: − − formula: y ~ x data: dataset 12 Phân tích mơ tả biểu đồ Câu hỏi 10 Vẽ biểu đồ tương quan weight, x1 đường biểu diễn tuyến tính Hàm abline Package: graphics Các argument hàm: − − − − reg: đối tượng hồi quy a, b: intercept slope (hệ số góc) h: giá trị y đường ngang v: giá trị x đường thẳng đứng 13 Phân tích mơ tả biểu đồ Câu hỏi 10 Vẽ biểu đồ tương quan weight, x1 đường biểu diễn tuyến tính plot(weight~x1) abline(lm(weight~x1)) 14 Câu hỏi 10 Vẽ biểu đồ tương quan weight x1, đường biểu diễn tuyến tính cho giới tính Các hàm sử dụng: plot, abline, par Hàm par Packages: graphics Dùng cho nhiều chức − par (new=T): print đè lên biểu đồ trước 15 Câu hỏi 10 Vẽ biểu đồ tương quan weight x1, đường biểu diễn tuyến tính cho giới tính plot(weight[gender=='Female'] ~ x1[gender=='Female'], xlim=c(0,15),ylim=c(0,130),xlab='X1',ylab='Weight') abline(lm(weight[gender=='Female'] ~ x1[gender=='Female'])) par(new=T) plot(weight[gender=='Male'] ~ x1[gender=='Male'], pch=16, col='red',xlim=c(0,15),ylim=c(0,130), xlab=‘ ', ylab=‘ ') abline(lm(weight[gender=='Male'] ~ x1[gender=='Male'])) 16 Câu hỏi 10 Vẽ biểu đồ tương quan đa biến x1, x2, x3, weight, height, độ tuổi Các hàm sử dụng: pairs.panels (package: ‘psych’) − − x: data.frame matrix method: pearson, spearman, kendall 17 Câu hỏi 10 Vẽ biểu đồ tương quan đa biến x1, x2, x3, weight, height, độ tuổi dat$age= (as.numeric(as.Date(visitdate,'%Y/%m/%d')) - as.numeric(as.Date(dob, '%Y/%m/%d')))/365 attach(dat) library(psych) d1=data.frame(x1, x2, x3, weight, height, age) pairs.panels(d1,method='spearman') 18 Phân tích mơ tả biểu đồ Câu hỏi 11 File ‘Presidents achievement.csv’ Đọc liệu, đặt tên liệu us Tính trung bình chiều cao cho loại thành tựu Hàm describeBy Package: psych Các argument: − − x: data.frame matrix biến liên tục group: biến không liên tục library(psych) describeBy (us$height, us$achievement) 19 Phân tích mơ tả biểu đồ Câu hỏi 11 File ‘Presidents achievement.csv’ Thể kết chiều cao thành tựu biểu đồ thích hợp Hàm boxplot, mtext Các argument mtext: − − − − text: Điền vào đoạn text dự kiến side: 1=bottom, 2=left, 3=top, 4=right line: vị trí hàng điền vào at: vị trí cột điền vào boxplot(height~achievement) mtext('Not yet',side=1,line=1,at=1) 20 Phân tích mơ tả biểu đồ Câu hỏi 12 File genetic effect.csv Báo cáo ảnh hưởng hút thuốc đến thay đổi biểu gene Đọc liệu vào R gọi đối tượng “gen” Dùng R để vẽ biểu đồ effect (trục hoành) log10(pvalue) (trục tung), điều kiện abs(effect)>70 pvalue70 pvalue70 & pvalue