dùng phần mềm R phân tích số liệu bằng biểu đồ
8 Phân tích s li u b ng bi u đ Y u t th giác r t quan tr ng Ng i Trung Qu c có câu “m t bi u đ có giá tr b ng c v n ch vi t” Qu th t, bi u đ t t có kh n ng gây n t ng cho ng i đ c báo khoa h c r t l n, th ng có giá tr đ i di n cho c cơng trình nghiên c u Vì th bi u đ m t ph ng ti n h u hi u nh t đ nh n m nh thông p c a báo Bi u đ th ng đ c s d ng đ th hi n xu h ng k t qu cho t ng nhóm, nh ng c ng có th dùng đ trình bày d ki n m t cách g n gàng Các bi u đ d hi u, n i dung phong phú nh ng ph ng ti n vơ giá Do đó, nhà nghiên c u c n ph i suy ngh m t cách sáng t o cách th hi n s li u quan tr ng b ng bi u đ Vì th , phân tích bi u đ đóng m t vai trị c c kì quan tr ng phân tích th ng kê Có th nói, khơng có đ th phân tích th ng kê khơng có ngh a Trong ngơn ng R có r t nhi u cách đ thi t k m t bi u đ g n đ p Ph n l n nh ng hàm đ thi t k bi u đ có s n R, nh ng m t s lo i bi u đ tinh vi ph c t p khác có th thi t k b ng package chuyên d ng nh lattice hay trellis có th t i t website c a R Trong ch ng s ch cách v bi u đ thông d ng b ng cách s d ng hàm ph bi n R 8.1 Môi tr ng thi t k bi u đ 8.1.1 Nhi u bi u đ cho m t c a s (windows) Thông th ng, R v m t bi u đ cho m t c a s Nh ng có th v nhi u bi u đ m t c a s b ng cách s d ng hàm par Ch ng h n nh par(mfrow=c(1,2))có hi u n ng chia c a s thành dòng hai c t, t c có th trình bày hai bi u đ k c nh bên Còn par(mfrow=c(2,3)) chia c a s thành dòng c t, t c có th trình bày bi u đ m c a s Sau v xong, có th quay v v i “ch đ ” c a s b ng l nh par(mfrow=c(1,1) Ví d sau t o m t d li u g m hai bi n x y b ng ph ng pháp mô ph ng (t c s li u hoàn toàn đ c t o b ng R) Sau đó, chia c a s thành dịng c t, trình bày b n lo i bi u đ t d li u đ c mô ph ng: > > > > > > > par(mfrow=c(2,2)) N > > > > > par(mfrow=c(1,2)) N title(main=“Plot of production and x factor”, sub=”Figure 1”) -1 -2 Production Plot of production and x factor -4 -2 X factor Figure 8.1.3 Cho gi i h n c a tr c tung tr c hồnh N u khơng cung c p gi i h n c a tr c tung tr c hồnh, R s t đ ng tìm u ch nh cho s li u Tuy nhiên, c ng có th ki m sốt bi u đ b ng cách s d ng xlim ylim đ cho R bi t c th gi i h n c a hai tr c này: > plot(x, y, xlab=”X factor”, ylab=”Production”, main=”Plot of production and x factor”, xlim=c(-5, 5), ylim=c(-3, 3)) 8.1.4 Th lo i đ ng bi u di n Trong m t dãy bi u đ , có th yêu c u R v nhi u ki u đ di n khác > > > > > par(mfrow=c(2,2)) plot(y, type="l"); plot(y, type="b"); plot(y, type="o"); plot(y, type="h"); title("lines") title("both") title("overstruck") title("high density") 100 150 200 50 100 Index Index overstruck high density 150 200 150 200 -1 -2 -2 -1 y 50 y -2 -1 y -2 -1 y both lines 50 100 150 200 Index Bi u đ Ki u bi u đ đ 50 100 Index ng bi u di n Ngồi ra, c ng có th nhi u đ ng bi u di n b ng lty nh sau: ng bi u > > > > > par(mfrow=c(2,2)) plot(y, type="l", plot(y, type="l", plot(y, type="l", plot(y, type="l", lty=1); lty=2); lty=3); lty=4); title(main="Production title(main="Production title(main="Production title(main="Production y -2 -1 100 150 200 50 100 150 Index lty=2 Production data Production data 200 -1 -2 -2 -1 y Index lty=1 y -1 -2 50 y sub="lty=1") sub="lty=2") sub="lty=3") sub="lty=4") Production data Production data data", data", data", data", 50 100 150 200 Index lty=3 Bi u đ nh h 50 100 150 200 Index lty=4 ng c a lty 8.1.5 Màu s c, khung, kí hi u Chúng ta có th ki m sốt màu s c c a m t bi u đ b ng l nh col Giá tr m c đ nh c a col Tuy nhiên, có th thay đ i màu theo ý mu n h oc b ng cách cho s ho c b ng cách vi t tên màu nh “red”, “blue”, “green”, “orange”, “yellow”, “cyan”, v.v… Ví d sau dùng m t hàm đ v ba đ xanh cây: ng bi u di n v i ba màu đ , xanh n > plot(runif (10), ylim=c(0,1), type='l') > for (i in c('red', 'blue', 'green')) { lines(runif (10), col=i ) } > title(main="Lines in various colours") c bi n, 0.0 0.2 0.4 runif(10) 0.6 0.8 1.0 Lines in various colours 10 Index Ngoài ra, cịn có th v đ ng bi u di n b ng cách t ng b dày c a m i đ > plot(runif(5), ylim=c(0,1), type='n') > for (i in 5:1) { lines( runif(5), col=i, lwd=i ) } > title(main="Varying the line thickness") 0.0 0.2 0.4 runif(5) 0.6 0.8 1.0 Varying the line thickness Index Hình d ng c a bi u đ c ng có th thay đ i b ng type nh sau: > op plot(runif(5), type = 'p', main = "plot type 'p' > plot(runif(5), type = 'l', main = "plot type 'l' > plot(runif(5), type = 'b', main = "plot type 'b' > plot(runif(5), type = 's', main = "plot type 's' > plot(runif(5), type = 'h', main = "plot type 'h' > plot(runif(5), type = 'n', main = "plot type 'n' > par(op) (stair steps)") (histogram)") (no plot)") 0.7 runif(5) 0.3 0.5 0.9 0.7 0.5 Index plot type 'b' (both points a nd line s) plot type 's' (sta ir steps) 0.2 0.4 0.4 0.6 runif(5) 0.8 0.8 Index 0.6 runif(5) (both points and lines)") plot type 'l' (lines) 0.3 runif(5) (lines)") 0.9 plot type 'p' (points) (points)") Index plot type 'h' (histogra m) plot type 'n' (no plot) 0.6 runif(5) 0.4 0.3 0.2 0.2 0.1 runif(5) 0.4 Index Index 5 Index Khung bi u đ có th ki m sốt b ng l nh bty v i thông s nh sau: bty=”n” bty=”o” bty=”c” bty=”l” bty=”7” Khơng có vịng khung chung quanh bi u đ Có khung chung quanh bi u đ V m t h p g m c nh chung quanh bi u đ theo hình ch C V h p c nh chung quanh bi u đ theo hình ch L V h p c nh chung quanh bi u đ theo hình s Cách hay nh t đ b n đ c làm quen v i cách v bi u đ b ng cách th R đ bi t rõ h n Kí hi u c a m t bi u đ c ng có th thay th b ng cách cung c p s cho pch (plotting character) R Các kí hi u thơng d ng là: Available symbols 21 22 23 24 25 16 17 18 19 20 11 12 13 14 15 10 -2 -1 y > plot(x, y, col=”red”, pch=16, bty=”l”) -4 -2 x Bi u đ bty=”l” nh h ng c a pch=16 col=”red”, 8.1.6 Ghi (legend) Hàm legend r t có ích cho vi c ghi m t bi u đ giúp ng i đ c hi u đ c ý ngh a c a bi u đ t t h n Cách s d ng legend có th minh jo b ng ví d sau đây: > > > > > > > N > > > > plot(y, xlab=" ", ylab=" ", type="n") mtext("Text on side 1, cex=1", side=1,cex=1) mtext("Text on side 2, cex=1.2", side=2,cex=1.2) mtext("Text on side 3, cex=1.5", side=3,cex=1.5) mtext("Text on side 4, cex=2", side=4,cex=2) text(15, 4.3, "text(15, 4.3)") text(35, 3.5, adj=0, "text(35, 3.5), left aligned") text(40, 5, adj=1, "text(40, 5), right aligned") Text on side 3, cex=1.5 40, 5), right aligned text(15, 4.3) Text on side 4, cex=2 -4 -2 Text on side 2, cex=1.2 text(35, 3.5), left aligned 50 Text on side 1, cex=1 100 150 200 8.1.8 t kí hi u vào bi u đ abline() có th s d ng đ v m t đ v i nh ng thông s nh sau: ng th ng, abline(a,b): đ ng h i qui n tính a=intercept b=slope abline(h=30) v m t đ ng ngang t i y=30 abline(v=12) v m t đ ng th ng đ ng t i m x=12 Ngoài ra, cịn có th cho vào bi u đ m t m i tên đ ghi m t m s li u > N n plot(sort(age), (1:n)/n, type="s", ylim=c(0,1)) K t qu đ c trình bày ph n trái c... c(5.000,4.380,3.360,5.920,6.250,4.150,0.737,7.170,6.942,5.000, 4.217,4.823,3.750,1.904,6.900,0.633,5.530,6.625,5.960,3.800, 5.375,3.360,5.000,2. 608, 4.130,5.000,6.235,3.600,5.625,5.360, 6.580,7.545,6.440,6.170,5.270,3.220,5.400,6.300,9.110,7.750,... gi i h n c a tr c tung tr c hoành, R s t đ ng tìm u ch nh cho s li u Tuy nhiên, c ng có th ki m so? ?t bi u đ b ng cách s d ng xlim ylim đ cho R bi t c th gi i h n c a hai tr c này: > plot(x, y,