1. Trang chủ
  2. » Tất cả

Phân tích dữ liệu với r phần 3 phân tích mô tả dữ liệu

12 2,3K 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 12
Dung lượng 141,01 KB

Nội dung

Phân tích liệu với R Phần Phân tích mô tả liệu Nội dung  Quy trình phân tích  Dữ liệu thực tế  Phân tích mô tả biến liên tục  Phân tích mô tả biến phân nhóm (categorical) Quy trình phân tích  Kiểm tra số liệu “bất thường”  Xác định mục tiêu phân tích, thông điệp muốn chuyển tải  Xác định biến số cần thiết (trong dataframe)  Xác định Phương pháo thống kê  Xác định lệnh/hàm R Kiểm tra số liệu “bất thường”  Xem xét số tối đa tối thiểu  Tính hợp lý (validity)- Không có nhân viên có mức lượng 100.000$ tháng  Tính quán (consistency) – giáo viên có trình độ trung cấp  Coi chừng lẫn lộn biến Mục tiêu phân tích  Mô tả hay kiểm định giả thuyết  Muốn người đọc nhận thông điệp  Phác họa bảng số liệu biểu đồ muốn có  Đòi hỏi thời gian suy nghĩ Xác định biến số  Biến số có liên quan đến mục tiêu (trong dataframe)  Biến liên tục (continous) hay phân nhóm (categorical) Xác định phương pháp thống kê  Phương pháp tùy thuộc vào mục tiêu biến số  Mô tả: mean, standard deviation, median, proportion,…  Tương quan: Regression models  So sánh hai nhóm Xác định hàm/lệnh R  Chỉ cần số hàm/lệnh  Hàm tìm package  Mỗi phương phấp phân tích thực nhiều hàm  Có cần lệnh từ package Ví dụ nghiên cứu  Nghiên cứu thu nhập trình độ nhân viên công ty A dựa file số liệu “salary.csv” chứa thông tin sau: id salbeg sex time age salnow edlevel work jobcat EMPLOYEE CODE BEGINNING SALARY SEX OF EMPLOYEE JOB SENIORITY AGE OF EMPLOYEE CURRENT SALARY EDUCATIONAL LEVEL WORK EXPERIENCE mã nhân viên Lương khởi điểm giới tính nhân viên (0 - nam, 1- Nữ) Thâm niên làm việc (tháng) tuổi nhân viên (năm) lương trình độ học vấn kinh nghiệm làm việc (năm) EMPLOYMENT CATEGORY loại công việc (1: văn thư, tạp vụ ; 2: Tập văn phòng ; 3: nhân viên bảo vệ ; 4: nhân viên có trình ĐH ; 5: lao động phổ thông ; 6: nhân viên có trình độ từ ths ; 7.nhân viên kỹ thuật) Package “psych” “Hmisc”  Package “psych” “Hmisc” có ích cho phân tích mô tả  Hmisc có hàm describe  “psych” có hàm ● describe ● describe.by (tên dataframe, tên biến chia nhóm, tùy biến khác)// dùng lệnh? Describe.by() để tìm hiểu hàm Phân tích mô tả R >data= read.csv(“D:/salary.csv”,header = T) >Attach(data) // lấy dataframe data phân tích >library(psych) // chưa có gõ lệnh instal.library(psych) >describe(data) >mean(age) // tính tuổi trung bình >median (age)// tính median tuổi >describe(data)// biểu tất giá trị mô tả biến có data Sử dụng R cho phân tổ liệu  Library (gmodels)  CrossTable (sex, digits =3) // phân tích số lượng, tỉ lệ nhân viên theo giới tính  CrossTable (sex,jobcat, digits =3)//phân tích số lượng, tỉ lệ nhân viên theo giới tính

Ngày đăng: 18/11/2020, 14:00

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w