Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 62 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
62
Dung lượng
1,3 MB
Nội dung
THỐNG KÊ MÁY TÍNH ỨNG DỤNG NGƠN NGỮ TRONG PHÂN TÍCH DỮ LIỆU Biên soạn: Phạm Thị Thu Thúy thuthuy@ntu.edu.vn QUY ĐỊNH MƠN HỌC • Lý thuyết: 30 tiết • Thực hành: 15 tiết • Đánh giá: 50% kiểm tra + 50% thi kết thúc môn (trên máy) – 50% kiểm tra: Chuyên cần Bài tập lớp (điểm cộng, trừ) Điểm tập nhóm Điểm kiểm tra thực hành Tài liệu tham khảo Nguyễn Văn Tuấn, Phân tích số liệu biểu đồ R Peter Dalgaard, Statistics and Computing Nội dung Hướng dẫn cài đặt vận hành R Xử lý số liệu R Phân tích thống kê mơ tả R Phân tích hồi quy R Phân tích dãy số thời gian R Nội dung GIỚI THIỆU R Tại sử dụng R Tổng quan R Workspace Đọc lưu liệu R Tại R Mã nguồn mở Hồn tồn miễn phí Chạy Windows, MacOS Nhiều phương pháp phân tích khơng có phần mền khác Vẽ biểu đồ tuyệt vời Lưu ý! Thuật ngữ/ngơn ngữ khó hiểu Dùng câu lệnh tương tác Nhiêu ký hiệu Cần quen với ngơn ngữ lập trình R làm gì? R cơng cụ phân tích thống kê Cho phép thực tất mơ hình phân tích Mô Vẽ đồ thị biểu đồ đẹp Lập trình cho phương pháp Tải phần mềm R • Truy cập http://cran.r-project/ • R for Windows screen, chọn “base” • Download R • Run, chọn OK sau chọn FINISH • Biểu tượng R xuất desktop • Bắt đầu sử dụng R Làm việc với R Object: Đối tượng - tên cho đối tượng (case sensitive) - gán giá trị cho đối tượng sử dụng assignment operator (tuoi=25 >Tuoidat[,1] liệt kê cột >dat[,1:2] liệt kê cột >dat[2,] liệt kê dòng >dat[3:8,1] liệt kê >dat[1:5,2:3] liệt kê Biên tập số liệu Biên tập số liệu Làm việc với phần liệu # làm việc nhóm iddat1=subset(dat, iddat=merge(dat1, dat2, by=“id”, all.x=T, all.y=T) >dat Biên tập số liệu Biên tập số liệu Biên tập số liệu Chuyển liệu từ dạng cột sang dòng # dụng lệnh metl package reshape >id=c(1:4) >sex=c(“M” “F” “F” “M”) >group=c(1,1,2,2) >income1=c(15,16,21,31) >income2=c(17,15,23,35) >income3=c(19,20,19,33) >dat=data.frame(id,sex,group,income1,income2,income3) >dat Biên tập số liệu Chuyển liệu từ dạng cột sang dòng # dụng lệnh metl package reshape >require(reshape2) >dat1=melt(dat, id=c(“id”, “sex”, “group”), income.vars=c(“income1”, “income2”, “income3”)) >dat1 Biên tập số liệu Biên tập số liệu Biên tập số liệu Chuyển liệu từ dạng dòng sang cột # dụng lệnh cast package reshape >dat2=cast(dat1, id=c(id, sex, group ~ variable) >dat2 Biên tập số liệu Tóm lược Đối tượng/Object Mơi trường làm việc/Workspace Gói cơng cụ/Packages Đọc lưu liệu Đọc từ text file Đọc từ excel file Đọc từ spss file Đọc từ stata file Đọc từ web ... biểu đồ R Peter Dalgaard, Statistics and Computing Nội dung Hướng dẫn cài đặt vận hành R Xử lý số liệu R Phân tích thống kê mơ tả R Phân tích hồi quy R Phân tích dãy số thời gian R Nội dung... >mydat=data.frame(x,y) Đọc lưu liệu R Đọc lưu liệu R Ghi xuất liệu dạng file.rda # lưu mydat dạng R file với tên mydatfile.rda >save(mydat,file=“mydatfile.rda") Đọc lưu liệu R Nhập số liệu trực tiếp R. .. gồm 10 giá trị normal >y = rnorm(10) # tạo myobject bao gồm 20 giá trị nornal >myobjectmy.objectmy object