Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 64 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
64
Dung lượng
0,94 MB
Nội dung
ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ NỘI DUNG: CHƯƠNG I GIỚI THIỆU VỀPHẦNMỀMR 1.1 Giới thiệu ngôn ngữ R : Phân tích xử lý sốliệu thao tác cần thiết quan trọng nhà nghiên cứu nhiều ngành, sinh học, địa lý, toán học,Trước đây, công ty phầnmềm phát triển phầnmềm chuyên nghiệp SPSS, Excel, Stata, cho việc phân tích sốliệu Tuy nhiên, phầnmềmphầnmềm thương mại, có giá từ vài trăm đến vài nghìn USD, trường đại học hay trung tâm nghiên cứu mua Do đó, khoảng mười năm lại đây, nhà nghiên cứu thống kê giới tập hợp lại phát triển công cụ theo hướng mã nguồn mở cho tất người sử dụng hoàn toàn miễn phí Công cụ có tên ngôn ngữ R, ngôn ngữ giới nghiên cứu sử dụng nhiều Ở Việt Nam, việc sử dụng ngôn ngữ R mẻ, nhiều lý Trong tài liệu này, muốn cung cấp cách nhìn tổng quan ngôn ngữ R Các nội dung chuyên sâu cung cấp thời gian tới 1.2 Sơ lược công dụng R : Nói cách ngắn gọn, Rphầnmềm sử dụng cho phân tích thống kê đồ thị Thật chất, R ngôn ngữ máy tính đa năng, sử dụng cho nhiều mục tiêu khác nhau, từ tính toán đơn giản, toán học giả trí, tính toán ma trận, đến phân tích thống kê phức tạp Vì ngôn ngữ người ta sử dụng R để phát triển thành phầnmềm chuyên môn cho đề tính toán cá biệt 1.3 Các dòng lệnh hàm bản: 1.3.1 Tính toán dòng lệnh R: R thường sử dụng dạng "command line" có nghĩa phải gõ trực tiếp lệnh vào prompt mầu đỏ hình Các lệnh phải tuân thử nghiêm ngặt luật ngôn ngữ R BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ Một câu lệnh thực thi sau nhấn phím Enter ,R phân biệt chữ hoa chữ thường Ví dụ: library khác với Library Một văn phạm khác có hai chữ nhau, R thường dùng dấu chấm để thay khoảng trống, chẳng hạn data.frame, t.test, read.table Điều quan trọng không để ý làm ngườ sử dụng Nếu lệnh gõ "Văn phạm" R cho prompt khác hay cho kết (tùy theo lệnh); lệnh không "Văn Phạm" R đưa thông báo ngắn không hay không hiểu 1.3.2 "Văn phạm" ngôn ngữ R : Văn phạm chung R lệnh (command) hay function Mà hàm phải có tham số , theo sau hàm tham số mà phải cung cấp Để biết hàm có tham số nào, dùng lệnh args(x), mà x hàm mà cần biết R ngôn ngữ "đối tượng " Điều có nghĩa liệuR chứa object Định hướng có vài ảnh hưởng đến cách viết cảu R Chẳng hạn thay viết x = thông thường viết, R yêu cầu viết x == Một số kí hiệu hay dùng R : x==y x!=y x y x không y yy x lớn y x=y x lớn y is.na(x) có phải x biến số missing A&B A B VớiR tất câu chữ hay lệnh sau kí hiệu # hiệu ứng, # kí hiệu dành cho người sử dụng thêm vào ghi BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ 1.3.3 Làm việc vớiliệuR : 1.3.3.1 Nhập liệu trực tiếp : Muốn làm phân tích liệu R, phải có sẵn liệu dạng mà R hiểu để xửlí Dữ liệu mà R hiểu phải liệu data.frame Có nhiều cách để nhập sốliệu vào data.frame R, từ nhập trực tiếp đến nhập từ nguồn khác Sau cách thông dụng nhất: Nhập sốliệu dòng lệnh : Để nhập sốliệu trực tiếp sử dụng function c( ) Lệnh cho phép tạo cột liệu Cú pháp hàm : >Tên_biến_lưu_dữ_liệu ins chol attach(chol) 1.3.3.4 C ệnh h n n : Để cài thêm Packages cần thiết cho R: install.packages( boot ) # cài packages boot cho R VD: s rt( ) # tìm bậc (s rt( )) # tìm bậc Mean() # trung bình Median() # trung vị Var() # phương sai Sd() # độ lệch chu n Hist() # biểu đồ dạng cột Plot() # biểu đồ tán xạ BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ 1.3.3.5 Nhập sốliệu từ text file: read.table : Chúng ta thu thập sốliệu độ tuổi cholesterol từ nghiên cứu 50 bệnh nhân mắc bệnh cao huyết áp Các sốliệu lưu text file có tên chol.txt directory c:\works\insulin Sốliệu sau: cột mã số bệnh nhân, cột giới tính, cột bodymassindex (bmi), cột HDL cholesterol (viết tắt hdl), LDL cholesterol, totalcholesterol (tc) triglycerides (tg) Chúng ta muốn nhập liệu vào R để tiện việc phân tích sau Chúng ta sử dụng lệnh read.table sau: > setwd("c:/works/insulin") > chol chol Hay > names(chol) R cho biết có cột sau liệu (names lệnh hỏi liệu có cột tên gì): [1] "id" "sex" "age" "bmi" "hdl" "ldl" "tc" "tg" Bây lưu liệu dạng R để xửlí sau cách lệnh: > save(chol, file="chol.rda") 1.3.3.6 Nhập sốliệu từ SPSS: read.spss : Phầnmềm thống kê SPSS lưu liệu dạng "sav" Chẳng hạn có liệu có tên testo.sav directory c:\works\insulin, muốn chuyển liệu sang dạng R hiểu được, cần sử dụng lệnh read.spss package có tên foreign Các lệnh sau hoàn tất dễ dàng việc này: Việc cho truy nhập foreign lệnh library: > library(foreign) Việc thứ hai lệnh read.spss: > setwd("c:/works/insulin") > testo save(testo, file="testo.rda") 1.3.4 Tạo dãy số hàm seq, rep gl : R có công dụng tạo dãy số tiện cho việc mô thiết kế thí nghiệm Những hàm thông thường cho dãy số seq (sequence), rep (repetition) gl (generating levels): Áp dụng seq : • Tạo vector số từ đến 12: > x x [1] 10 11 12 > seq(12) [1] 10 11 12 • Tạo vector số từ đến 5: > x x [1] 12 11 10 > seq(12,7) [1] 12 11 10 Công thức chung hàm seq seq(from, to, by= ) hay seq(from, to, length.out= ) Cách sử dụng minh hoạ vài ví dụ sau đây: • Tạo vector số từ đến với khoảng cách 0.25: > seq(4, 6, 0.25) [1] 4.00 4.25 4.50 4.75 5.00 5.25 5.50 5.75 6.00 • Tạo vector 10 số, vớisố nhỏ số lớn 15 > seq(length=10, from=2, to=15) [1] 2.000000 3.444444 4.888889 6.333333 13.555556 15.000000 7.777778 9.222222 10.666667 12.111111 Áp dụng rep : Công thức hàm rep rep(x, times, ), đó, x biến số times số lần lặp lại Ví dụ: • Tạo số 10, lần: > rep(10, 3) [1] 10 10 10 • Tạo số đến 4, lần: BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ > rep(c(1:4), 3) [1] 4 • Tạo số 1.2, 2.7, 4.8, lần: > rep(c(1.2, 2.7, 4.8), 5) [1] 1.2 2.7 4.8 1.2 2.7 4.8 1.2 2.7 4.8 1.2 2.7 4.8 1.2 2.7 4.8 • Tạo số 1.2, 2.7, 4.8, lần: > rep(c(1.2, 2.7, 4.8), 5) [1] 1.2 2.7 4.8 1.2 2.7 4.8 1.2 2.7 4.8 1.2 2.7 4.8 1.2 2.7 4.8 Áp dụng gl : gl áp dụng để tạo biến thứ bậc (categorical variable), tức biến không để tính toán, mà đếm Công thức chung hàm gl gl(n, k, length = n*k, labels = 1:n, ordered = FALSE) cách sử dụng minh hoạ vài ví dụ sau đây: • Tạo biến gồm bậc 2; bậc lặp lại lần: > gl(1,2, 8) [1] 1 1 1 1 2 2 2 2 Levels: Hay biến gồm bậc 1, 3; bậc lặp lại lần: > gl(1,2,3, 5) [1] 1 1 2 2 3 3 Levels: • Tạo biến gồm bậc 2; bậc lặp lại 10 lần (do length= 0): > gl(1,2, 10, length=20) [1] 1 1 1 1 1 2 2 2 2 2 Levels: Hay: > gl(2, 2, length=20) [1] 1 2 1 2 1 2 1 2 1 2 Levels: 1.3.5 Biên tập sốliệu : 1.3.5.1 Tách rời liệu: subset Chúng ta quay lại vớiliệu chol ví dụ Để tiện việc theo dõi hiểu "câu chuyện", xin nhắc lại chứng ta nhập sốliệu vào liệuR có tên chol từ text file có tên chol.txt: > setwd("c:/works/insulin") > chol attach(chol) Nếu chúng ta, lí đó, muốn phân tích riêng cho nam giới, tách chol thành hai data.frame, tạm gọi nam nu Để làm chuyện này, dùng lệnh subset(data, cond), data data.frame mà muốn tách rời, cond điều BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ kiện Ví dụ: > nam nu old =60) > dim(old) [1] 25 Hay data.frame với bệnh nhân 60 tuổi nam giới: > n60 =60 & sex=="Nam") > dim(n60) [1] 1.3.5.2 Chiết sốliệu từ data frame : Trong chol có biến số Chúng ta chiết liệu chol giữ lại biến số cần thiết mã số (id), độ tuổi (age) total cholestrol (tc) Để ý từ lệnh names(chol) biến số id cột số 1, age cột số 3, biến số tc cột số Chúng ta dùng lệnh sau đây: > data2 > > > diagnosis diagnosis diagnosis diagnosis t.test(age, mu=30) One Sample t-test data: age t = -27.6563, df = 99, p-value < 2.2e-16 alternative hypothesis: true mean is not equal to 30 95 percent confidence interval: 18.39300 19.94700 sample estimates: mean of x 19.17 Trong lệnh age biến số cần kiểm định, mu=30 giá trị giả thiết R trình bày trị số t = -27.66, với 99 bậc tự do, trị số p < 2.2e-16 (tức thấp) R cho biết độ tin cậy 95% age từ 18.4 tuổi đến 19.9 tuổi (30 tuổi nằm khoảng tin cậy này) Nói cách khác, có lí để phát biểu độ tuổi trung bình mẫu thật thấp độ tuổi trung bình quần thể Kiểm định t hai mẫu: Ví dụ : Qua phân tích mô tả (phầm summary) thấy phụ nữ có độ hormone igfi cao nam giới (167.97 160.29) Câu hỏi đặt có phải thật khác biệt có hệ thống hay yếu tố ngẫu nhiên gây nên Trả lời câu hỏi này, cần xem xét mức độ khác biệt trung bình hai nhóm độ lệch chu n độ khác biệt Trong x1 x2 số trung bình hai nhóm nam nữ, SED độ lệch chu n ( x1 - x2 ) Trong SE1 SE2 sai số chu n (standard error) hai nhóm nam nữ Theo lí thuyết xác suất, t tuân theo luật phân phối t với bậc tự n1, n2 , n1 n2 số mẫu hai nhóm Chúng ta dùng R để trả lời câu hỏi hàm t.test sau: > t.test(igfi~ sex) Welch Two Sample t-test data: igfi by sex t = 0.8412, df = 88.329, p-value = 0.4025 alternative hypothesis: true difference in means is not equal to 95 percent confidence interval: -10.46855 25.83627 sample estimates: mean in group Female mean in group Male 167.9741 160.2903 R trình bày giá trị quan trọng trước hết: t = 0.8412, df = 88.329, p-value = 0.4025 BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 10 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ CHƯƠNG V NG NG PH N H C NGHI V NH GI S I N I 5.1 Nhập liệu vào R: a c bảng th ng ố t lệ g ữa độ mở bướm ga đ ện áp tín h ệu au : STT 10 11 12 13 14 15 16 17 18 19 20 21 22 23 ĐỘ MỞ BƯỚM GA (%) 10 12 15 17 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 ĐIỆN ÁP TÍN HIỆU (v) 0.2 0.3 0.5 0.7 0.9 1.1 1.4 1.6 1.9 2.2 2.5 2.8 3.1 3.4 3.6 3.9 4.0 4.1 4.15 4.25 4.35 4.4 4.5 BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 50 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ Bước ta cần nhập thông số vào R : >dmbuomga =c(2,5,10,12,15,17,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100) >datinhieu=c(0.2,0.3,0.5,0.7,0.9,1.1,1.4,1.6,1.9,2.2,2.5,2.8,3.1,3.4,3.6,3.9,4.0,4.1,4.15,4.25 ,4.35,4.4,4.5) > save.image("C:\\Users\\admin\\Desktop\\thongsobuomga") # lưu vào ổ C - Desktop > thongso = data.frame(dmbuomga,datinhieu) # gộp biến dmbuomga datinhieu vào thongso > thongso dmbuomga datinhieu 0.20 0.30 10 0.50 12 0.70 15 0.90 17 1.10 20 1.40 25 1.60 30 1.90 10 35 2.20 BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 51 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ 11 40 2.50 12 45 2.80 13 50 3.10 14 55 3.40 15 60 3.60 16 65 3.90 17 70 4.00 18 75 4.10 19 80 4.15 20 85 4.25 21 90 4.35 22 95 4.40 23 100 4.50 BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 52 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ R liệt kê hai cột thông số trên: Hình 5.1: Nhập liệu trực tiếp vào R 5.2 Tính toán thông số R: Để biết giá trị ta dùng lệnh : Hình 5.2 : hàm tính toán thông số BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 53 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ mean(dmbuomga) # giá trị trung bình [1] 47 median(dmbuomga) # trung vị [1] 45 var(dmbuomga) # phương sai [1] 971.8182 > mean(datinhieu ) [1] 2.602174 > median(datinhieu ) [1] 2.8 > var(datinhieu ) [1] 2.280791 > sd(datinhieu ) [1] 1.510229 > se(datinhieu ) Để biết tổng quan thông số ta cần cài thêm packages : psych > install.packages("psych") > library(psych) > describe(thongso, range=F) var n mean sd se dmbuomga 23 47.0 31.17 6.50 datinhieu 23 2.6 1.51 0.31 BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 54 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ var : phương sai n :tổng số cột mean : trung bình sd : độ lệch chu n se : sai số chu n 5.3 Cách lập bi u đ tán xạ : Hình 5.3 : Biểu đồ tán xạ tỷ lệ độ mở b ớm ga điện áp tín hiệu > require(beeswarm) > beeswarm(dmbuomga ~ datinhieu, data=thongso, color=16, pch=16) > boxplot(dmbuomga ~ datinhieu, add=T, data=thongso) 5.4 ùng t.te t đ tìm giá trị : Các số tương uan bướm ga điện áp tín hiệu : > t.test(dmbuomga, datinhieu) Welch Two Sample t-test BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 55 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ data: dmbuomga and datinhieu t = 6.8222 (giá trị), df = 22.103 (bậc tự do), p-value = 7.275e-07 (chỉ số p) alternative hypothesis: true difference in means is not equal to 95 percent confidence interval: (khoảng tin cậy 95%) 30.90502 57.89063 (sự khác biệt hiệu số) sample estimates: mean of x mean of y 47.000000 2.602174 (số trung bình nhóm) 5.5 Bi u đ tán xạ góc mở bướm ga đ ện áp tín hiệu : 5.5.1 iểu đồ mở b ớm a: BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 56 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ Hình 5.5.1 Tỷ lệ sai lệch góc mở b ớm ga > plot(density(dmbuomga)) > qqnorm(dmbuomga) > qqline(dmbuomga, col=3) > qqnorm(dmbuomga, col=3,ylab="goc mo buom ga", xlab=" thoi gian mo", main="BIEU DO GOC MO BUOM GA") > qqline(dmbuomga, col=3,ylab="goc mo buom ga", xlab=" thoi gian mo", main="BIEU DO GOC MO BUOM GA") 5.5 iểu đồ điện p ín hiệu : Hình 5.5.2 Tỷ lệ sai lệch điện áp tín hiệu BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 57 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ > plot(density(datinhieu)) > qqnorm(datinhieu) > qqline(datinhieu, col=3) > qqnorm(datinhieu, col=3,ylab="dien ap tin hieu", xlab="sai so chuan", main="BIEU DO DIEN AP TIN HIEU") > qqline(datinhieu, col=3,ylab="dien ap tin hieu", xlab="sai so chuan", main="BIEU DO DIEN AP TIN HIEU") 5.5.3 Bi u đ đơn giản : Biểu đồ đơn giản so sánh tỷ lệ mở bướm ga sovới mức độ tăng điện áp tín hiệu : > scatterplot(dmbuomga ~ datinhieu) BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 58 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ 5.5.4 u đ hộp t ục tung t ung hoành ch g t ị t ung b nh tín h ệu đ ện áp thay đổi kh tăng ga : > bargraph.CI(dmbuomga, datinhieu, ylim=c(0,5), xlim=c(0,100)) Biểu đồ cột : điện áp tín hiệu tăng cánh bướm ga mở từ -> max BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 59 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ 5.6 Bi u đ phân tích tương quan : Biểu đồ mối tương uan độ mở bướm ga điện áp tín hiệu : > names(thongso) [1] "dmbuomga" "datinhieu" > solieu=cbind(dmbuomga,datinhieu) > library(psych) > pairs.panels(solieu) 0.98 # hệ số tương uan hai biến Dùng lệnh cor cor.test để biết hệ số tương uan độ mở bướm ga điện áp tín hiệu BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 60 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ > cor(dmbuomga,datinhieu) [1] 0.9792837 > cor.test(dmbuomga,datinhieu) Pearson's product-moment correlation data: dmbuomga and datinhieu t = 22.162, df = 21, p-value = 4.441e-16 alternative hypothesis: true correlation is not equal to 95 percent confidence interval: giao động hệ số tương uan từ : 0.9509412 0.9913249 sample estimates: cor 0.9792837 5.7 ánh g bảng thông số : 5.7.1 ộ mở bướm ga : Có giá trị trung bình 47 Trung vị 45 Phương sai 971.818 Độ lệch chu n 31.17 Sai số chu n 6.50 BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 61 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ 5.7.2 ện áp tín hiệu : Có giá trị trung bình 2.602174 Trung vị 2.8 Phương sai 81791 Độ lệch chu n 1.501229 Sai số chu n 0.31 5.7.3 ộ mở bướm ga đ ện áp tín hiệu : Có giá trị t = 6.8222 Bậc tự df = 22.103 Chỉ số p-value = 7.275 e- o7 Khoảng tin cậy 95 % , khác biệt hiệu số 30.90502 57.89063 Trị số trung bình hai nhóm 47.000000 2.602174 Hệ số tương uan hai biến 0.98 BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 62 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ KẾT LUẬN Là sinh viên khí động lực cần trang bị cho nhiều chuyên ngành động cơ, điện, điện tử Trong có góp phần không nhỏ tin học Nhưng ngày tin học thứ thiếu sống công nghệ đai Ngôn Ngữ R đóng vai trò quan trọng tính toán xửlísố liệu, thống kê, góp phần giúp báo cáo, soạn thảo, đồ án… Sau tuần tìm hiểu xử lý sốliệuthựcnghiệmđiệnôtô vớ phầnmềm R, Em hiểu thêm cách xử lý số liệu, tính phương sai, lập biểu đồ… Khi hoàn thành Tiểu Luận em củng cố nhiều kiến thức bổ ích từ Ngôn Ngữ R Tuy làm thật hạn hẹp đáp ứng phần yêu cầu Do em sinh viên hệ vừa làm vừa học nên thời gian học hạn hẹp, thường sinh viên chúng em công nhân khí nên tin học tiếp xúc nhiều Nên Tiểu Luận khó tránh khỏi sai sót , Em mong nhận ý kiến từ Thầy Cô để viết hoàn thiện BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 63 ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HỒ CHÍ MINH – KHOA CKĐ TÀI LIỆU THAM KHẢO BÀI VIẾT ĐƯỢC THAM KHẢO TỪ : Các giảng hướng dẫn R (GS NGUYỄN VĂN TUẤN) Tài liệu GVHD Th.S PHAN NGUYỄN QUÍ TÂM cung cấp Xử lý sốliệuthựcnghiệm http//:doc.edu.vn Tài liệu tham khảo từ Internet BÁO CÁO TIỂU LUẬN TỐT NGHIỆP Trang 64 ... header=TRUE) Lệnh thứ muốn đảm bảo R truy nhập directory mà số liệu lưu giữ Lệnh thứ hai yêu cầu R nhập số liệu từ file có tên "chol.txt" (trong directory c:worksinsulin) cho vào đối tượng chol Trong... liệu chứa directory directory c:worksinsulin tên car.txt Trước vẽ đồ thị, bắt đầu cách nhập liệu vào R > setwd("c:/works/stats") > oto ... mà R hiểu phải liệu data.frame Có nhiều cách để nhập số liệu vào data.frame R, từ nhập trực tiếp đến nhập từ nguồn khác Sau cách thông dụng nhất: Nhập số liệu dòng lệnh : Để nhập số liệu trực