Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 62 trang
THÔNG TIN TÀI LIỆU
Nội dung
THỐNG KÊ MÁY TÍNH ỨNG DỤNG NGƠN NGỮ TRONG PHÂN TÍCH DỮ LIỆU Biên soạn: Phạm Thị Thu Thúy thuthuy@ntu.edu.vn QUY ĐỊNH MƠN HỌC • Lý thuyết: 30 tiết • Thực hành: 15 tiết • Đánh giá: 50% kiểm tra + 50% thi kết thúc môn (trên máy) – 50% kiểm tra: Chuyên cần Bài tập lớp (điểm cộng, trừ) Điểm tập nhóm Điểm kiểm tra thực hành Tài liệu tham khảo Nguyễn Văn Tuấn, Phân tích số liệu biểu đồ R Peter Dalgaard, Statistics and Computing Nội dung Hướng dẫn cài đặt vận hành R Xử lý số liệu R Phân tích thống kê mơ tả R Phân tích hồi quy R Phân tích dãy số thời gian R Nội dung GIỚI THIỆU R Tại sử dụng R Tổng quan R Workspace Đọc lưu liệu R Tại R Mã nguồn mở Hồn tồn miễn phí Chạy Windows, MacOS Nhiều phương pháp phân tích khơng có phần mền khác Vẽ biểu đồ tuyệt vời Lưu ý! Thuật ngữ/ngơn ngữ khó hiểu Dùng câu lệnh tương tác Nhiêu ký hiệu Cần quen với ngơn ngữ lập trình R làm gì? R cơng cụ phân tích thống kê Cho phép thực tất mơ hình phân tích Mô Vẽ đồ thị biểu đồ đẹp Lập trình cho phương pháp Tải phần mềm R • Truy cập http://cran.r-project/ • R for Windows screen, chọn “base” • Download R • Run, chọn OK sau chọn FINISH • Biểu tượng R xuất desktop • Bắt đầu sử dụng R Làm việc với R Object: Đối tượng - tên cho đối tượng (case sensitive) - gán giá trị cho đối tượng sử dụng assignment operator (tuoi=25 >Tuoidat[,1] liệt kê cột >dat[,1:2] liệt kê cột >dat[2,] liệt kê dòng >dat[3:8,1] liệt kê >dat[1:5,2:3] liệt kê Biên tập số liệu Biên tập số liệu Làm việc với phần liệu # làm việc nhóm iddat1=subset(dat, iddat=merge(dat1, dat2, by=“id”, all.x=T, all.y=T) >dat Biên tập số liệu Biên tập số liệu Biên tập số liệu Chuyển liệu từ dạng cột sang dòng # dụng lệnh metl package reshape >id=c(1:4) >sex=c(“M” “F” “F” “M”) >group=c(1,1,2,2) >income1=c(15,16,21,31) >income2=c(17,15,23,35) >income3=c(19,20,19,33) >dat=data.frame(id,sex,group,income1,income2,income3) >dat Biên tập số liệu Chuyển liệu từ dạng cột sang dòng # dụng lệnh metl package reshape >require(reshape2) >dat1=melt(dat, id=c(“id”, “sex”, “group”), income.vars=c(“income1”, “income2”, “income3”)) >dat1 Biên tập số liệu Biên tập số liệu Biên tập số liệu Chuyển liệu từ dạng dòng sang cột # dụng lệnh cast package reshape >dat2=cast(dat1, id=c(id, sex, group ~ variable) >dat2 Biên tập số liệu Tóm lược Đối tượng/Object Mơi trường làm việc/Workspace Gói cơng cụ/Packages Đọc lưu liệu Đọc từ text file Đọc từ excel file Đọc từ spss file Đọc từ stata file Đọc từ web ... biểu đồ R Peter Dalgaard, Statistics and Computing Nội dung Hướng dẫn cài đặt vận hành R Xử lý số liệu R Phân tích thống kê mơ tả R Phân tích hồi quy R Phân tích dãy số thời gian R Nội dung... >mydat=data.frame(x,y) Đọc lưu liệu R Đọc lưu liệu R Ghi xuất liệu dạng file.rda # lưu mydat dạng R file với tên mydatfile.rda >save(mydat,file=“mydatfile.rda") Đọc lưu liệu R Nhập số liệu trực tiếp R. .. gồm 10 giá trị normal >y = rnorm(10) # tạo myobject bao gồm 20 giá trị nornal >myobjectmy.objectmy object