Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 12 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
12
Dung lượng
141,01 KB
Nội dung
Phân tích liệu với R Phần Phân tích mô tả liệu Nội dung Quy trình phân tích Dữ liệu thực tế Phân tích mô tả biến liên tục Phân tích mô tả biến phân nhóm (categorical) Quy trình phân tích Kiểm tra số liệu “bất thường” Xác định mục tiêu phân tích, thông điệp muốn chuyển tải Xác định biến số cần thiết (trong dataframe) Xác định Phương pháo thống kê Xác định lệnh/hàm R Kiểm tra số liệu “bất thường” Xem xét số tối đa tối thiểu Tính hợp lý (validity)- Không có nhân viên có mức lượng 100.000$ tháng Tính quán (consistency) – giáo viên có trình độ trung cấp Coi chừng lẫn lộn biến Mục tiêu phân tích Mô tả hay kiểm định giả thuyết Muốn người đọc nhận thông điệp Phác họa bảng số liệu biểu đồ muốn có Đòi hỏi thời gian suy nghĩ Xác định biến số Biến số có liên quan đến mục tiêu (trong dataframe) Biến liên tục (continous) hay phân nhóm (categorical) Xác định phương pháp thống kê Phương pháp tùy thuộc vào mục tiêu biến số Mô tả: mean, standard deviation, median, proportion,… Tương quan: Regression models So sánh hai nhóm Xác định hàm/lệnh R Chỉ cần số hàm/lệnh Hàm tìm package Mỗi phương phấp phân tích thực nhiều hàm Có cần lệnh từ package Ví dụ nghiên cứu Nghiên cứu thu nhập trình độ nhân viên công ty A dựa file số liệu “salary.csv” chứa thông tin sau: id salbeg sex time age salnow edlevel work jobcat EMPLOYEE CODE BEGINNING SALARY SEX OF EMPLOYEE JOB SENIORITY AGE OF EMPLOYEE CURRENT SALARY EDUCATIONAL LEVEL WORK EXPERIENCE mã nhân viên Lương khởi điểm giới tính nhân viên (0 - nam, 1- Nữ) Thâm niên làm việc (tháng) tuổi nhân viên (năm) lương trình độ học vấn kinh nghiệm làm việc (năm) EMPLOYMENT CATEGORY loại công việc (1: văn thư, tạp vụ ; 2: Tập văn phòng ; 3: nhân viên bảo vệ ; 4: nhân viên có trình ĐH ; 5: lao động phổ thông ; 6: nhân viên có trình độ từ ths ; 7.nhân viên kỹ thuật) Package “psych” “Hmisc” Package “psych” “Hmisc” có ích cho phân tích mô tả Hmisc có hàm describe “psych” có hàm ● describe ● describe.by (tên dataframe, tên biến chia nhóm, tùy biến khác)// dùng lệnh? Describe.by() để tìm hiểu hàm Phân tích mô tả R >data= read.csv(“D:/salary.csv”,header = T) >Attach(data) // lấy dataframe data phân tích >library(psych) // chưa có gõ lệnh instal.library(psych) >describe(data) >mean(age) // tính tuổi trung bình >median (age)// tính median tuổi >describe(data)// biểu tất giá trị mô tả biến có data Sử dụng R cho phân tổ liệu Library (gmodels) CrossTable (sex, digits =3) // phân tích số lượng, tỉ lệ nhân viên theo giới tính CrossTable (sex,jobcat, digits =3)//phân tích số lượng, tỉ lệ nhân viên theo giới tính