Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 25 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
25
Dung lượng
158,58 KB
Nội dung
Phân tích xử lý liệu với R Phần Nhập liệu với R Nhập liệu với R Giao diện tương tác với R Nhập Dữ liệu cho R từ file excel Nhập liệu cho R từ file sav (trong spss) Biên tập liệu Giao diện tương tác với R 1.1 Giao diện R 1.2 R calculator 1.3 Đối tượng (object) 1.4 Vector Dataset 1.1 Giao diện R Trình thực qua tương tác 1.2 R canculator Các hàm phổ biến: sqrt, log, lũy thừa Thực qua tương tác 1.3 Object Mỗi đối tượng phải có tên Tên viết chữ thường, số ký hiệu Tên đối tượng phân biệt chữ hoa chữ thường Tương tác 1.4 Vector Dataset Vector tập hợp nhiều số liệu Vector coi cột liệu hay biến số (variable) Khai báo vector Tên đối tượng = c(danh sách số liệu) VD: x = c(1,5, 80,90,91) Tương tác Dataset Nhiều vector hợp thành Dataset Dataset = matrix(dòng cột) data.frame(danh sách vector) tạo dataset VD: id= c(“1”,”2”,”3”,”4”,”5”,”6”) Y = c(10, 16, 34,40, 50,26) Data = data.frame(id,Y) Tính toán thống kê Những hàm phổ biến mean, median, var, sd, leghth, min, max, rangeme Biểu đồ hist,plot Nhập liệu với R Giao diện tương tác với R Nhập Dữ liệu cho R từ file excel Nhập liệu cho R từ file sav (trong spss) Biên tập liệu Nhập liệu liệu từ Excel vào R B1: Dùng lệnh “save as” Excel lưu số liệu dạng file “.csv” B2: dùng lệnh Data = read.csv (đường dẫn file, header = TRUE) Để lưu liệu vào đối tượng data B3: Báo cho R biết: lấy Data phân tích attach(Data) Nhập liệu liệu từ file sav (SPSS) B1: gọi thư viện: library(foreign) B2: dùng lệnh Data = read.spss( đường dẫn file, to.data.frame = TRUE) Để lưu liệu vào đối tượng data B3: Báo cho R biết: lấy đối tượng Data phân tích attach(Data) Nhập liệu với R Giao diện tương tác với R Nhập Dữ liệu cho R từ file excel Nhập liệu cho R từ file sav (trong spss) Biên tập liệu Biên tập liệu (phần 1) Toán tử (Operators) Tạo biến Hàm có sẵn Sắp xếp liệu Hoán chuyển liệu Toán tử số học Toán tử Mô tả + Addition - Cộng - Subtraction – Trừ * Multiplication – Nhân / Division – Chia ^ ** Exponentiation – lũy thữa X%%Y chia x cho y lấy phần dư( a = 5%%2 a =1) X%/%Y Chia lấy phần nguyên ( a = 5%/%2 a=2) Toán tử logic Toán tử Mô tả < Nhỏ Lớn >= Lớn == Bằng != Không !x Không x X|Y X Y X&Y X Y isTRUE Kiểm tra xem Hàm số Hàm Mô tả Abs(x) Gía trị tuyệt đối Sqrt (x) Căn bậc Cos( x), sin (x) Tan(x) Log10(x) Logarithm Exp(x) e^x Tạo biến DataFrame có tên: Data Nếu DataFrame có cột (biến) x1 x2 // Khởi tạo biến x1,x2 x1 = c(1,3,4,7) x2 = c(4,6,8,3) // Gán liệu vào biến Data Data = data.frame(x1,x2) Tạo biến x1 = c(1,3,4,7) x2 = c(4,6,8,3) Data = data.frame(x1,x2) Chúng ta tạo biến tổng số cột sum = x1+x2 Nhưng biến sum không nằm Data giải pháp Giới thiệu dấu $ Dùng dấu $ để tạo biến kết nối với dataframe Data$sum = Data$x1+Data$x2 // Kiểm tra giá trị Data Data Bây dataframe Data có biến x1,x2 sum Tạo biến qua coding (mã hóa) id = c(1,2,3,4,5) gender = c(“male”,”female”,”male”,”male”,”male”) Mục tiêu: Tạo biến sex với 1= male, 2= female Tạo biến qua coding id = c(1,2,3,4,5) gender = c(“male”,”female”,”male”,”male”,”male”) dat = data.frame (id,gender) // giải vấn đề dat$sex[gender == “male”] = dat$sex[gender ==“female”]=2 // kiểm tra giá trị dat dat Tạo biến qua coding id = c(1,2,3,4,5) gender = c(“male”,”female”,”male”,”male”,”male”) Mục tiêu: Tạo biến group id = 1,2,3 group = “A” id = 4,5 group =“B” Tạo biến qua coding > id = c(1,2,3,4,5) > dat$group[id>=1 & id gender = c("male","female","male","male","male") > dat$group[id>=4 & id dat = data.frame(id,gender) > dat$sex[gender=="male"]=1 > dat id gender sex group > dat id gender sex 1 male 2 female 3 male 4 male 5 male 1 A 2 female A 3 male > dat$sex[gender=="female"]=2 1 male A 4 male B 5 male B Hoán chuyển liệu Chuyển từ numeric sang text/character As.numeric(), as.character() Ví dụ id1 = as.character(id)