Chương TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ Ths Nguyễn Tiến Dũng Viện Kinh tế Quản lý, Trường ĐH Bách khoa Hà Nội Email: dung.nguyentien3@hust.edu.vn MỤC TIÊU CỦA CHƯƠNG ● Sau kết thúc chương này, người học có thể: ● Kể tên biết cách tính đại lượng đặc trưng cho độ ● ● ● ● ● tập trung: trung bình, trung vị, mốt, tứ phân vị, phân vị Nói tên biết cách tính đại lượng đặc trung cho độ phân tán tập DL: khoảng biến thiên, độ trải giữa, phương sai độ lệch chuẩn Nắm ý nghĩa hệ số biến thiên Phát biểu quy tắc thực nghiệm quy tắc Chebysev quy luật phân phối tập DL Biết cách vẽ khám phá đặc điểm tập DL qua biểu đồ hộp râu Phân biệt tham số tổng thể tham số mẫu © 2013 Nguyễn Tiến Dũng CÁC NỘI DUNG CHÍNH 4.1 Các đại lượng đo lường độ tập trung phương pháp mơ tả hình dáng tập DL 4.2 Các đại lượng đo lường độ phân tán 4.3 Các đại lượng TK mô tả cho bảng tần số 4.4 Các đại lượng TK mô tả cho tổng thể 4.5 Khám phá DL qua biểu đồ hộp râu (box plot) 4.6 Sử dụng kết hợp TB độ lệch chuẩn 4.7 Phân biệt số cặp khái niệm © 2013 Nguyễn Tiến Dũng 4.1 CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ TẬP TRUNG VÀ PHƯƠNG PHÁP MÔ TẢ HÌNH DÁNG TẬP DỮ LIỆU ● 4.1.1 Các ĐL đo lường độ tập trung phổ biến ● 4.1.2 Sử dụng Excel để tính ĐL TK mơ tả độ tập trung ● 4.1.3 Nhóm ĐL khác mơ tả phân bố tập DL ● 4.1.4 Hình dáng phân phối © 2013 Nguyễn Tiến Dũng 4.1.1 Các ĐL đo lường độ tập trung phổ biến ● 4.1.1.1 Trung bình cộng (arithmetic mean) ● 4.1.1.2 Trung vị (Median) ● 4.1.1.3 Mốt (Mode) ● 4.1.1.4 Trung bình nhân (geometric mean) © 2013 Nguyễn Tiến Dũng 4.1.2 Sử dụng Excel để tính đại lượng TK mơ tả độ tập trung Mean Standard Error 26,933 0,927 Median 27 Mode 21 Standard Deviation 5,078 Sample Variance 25,789 Kurtosis -0,127 Skewness 0,533 Range 20 Minimum 19 Maximum 39 Sum Count Confidence Level(95,0%) © 2013 Nguyễn Tiến Dũng 808 30 1,896 4.1.3 Nhóm ĐL khác mơ tả phân bố tập liệu ● 4.1.3.1 Tứ phân vị (quartiles) ● 4.1.3.2 Phân vị (percentiles) © 2013 Nguyễn Tiến Dũng 4.2 Các đại lượng đo lường độ phân tán ● 4.2.1 Khoảng biến thiên R ● 4.2.2 Độ trải IQR = Q3 – Q1 ● 4.2.3 Phương sai độ lệch chuẩn mẫu © 2013 Nguyễn Tiến Dũng 4.3 Các đại lượng TK mô tả cho bảng tần số ● 4.3.1 Trung bình cộng ● 4.3.2 Trung vị ● 4.3.3 Mốt ● 4.3.4 Phương sai độ lệch chuẩn © 2013 Nguyễn Tiến Dũng 4.4 Các đại lượng TK mô tả cho tổng thể ● 4.4.1 TB cộng tổng thể ● 4.4.2 Phương sai độ lệch chuẩn tổng thể © 2013 Nguyễn Tiến Dũng 10 4.5 Khám phá DL qua biểu đồ hộp râu ● Bước 1: Vẽ hộp ● Xác định Q1, Q2, Q3 ● Vẽ hình hộp xung quanh ● Vẽ đường qua trung vị ● Bước 2: Vẽ râu ● Nếu xmax ≤ Q3 + 1,5.IQR, râu = xmax ● Nếu khơng phải, râu = Q3+1,5IQR vẽ dấu chấm vị trí xmax ● Bước 3: Vẽ râu ● Nếu xmin ≥ Q1 – 1,5.IQR, râu = xmin ● Nếu khơng phải, râu = Q1 – 1,5.IQR vẽ thêm dấu chấm vị trí xmin © 2013 Nguyễn Tiến Dũng 11 © 2013 Nguyễn Tiến Dũng 12 4.6 Sử dụng kết hợp TB độ lệch chuẩn ● 4.6.1 Hệ số biến thiên CV ● 4.6.2 Quy tắc thực nghiệm ● 4.6.3 Quy tắc Chebysev ● 4.6.4 Chuẩn hố liệu © 2013 Nguyễn Tiến Dũng 13 4.6.2 Quy tắc thực nghiệm ● Với phân phối cân đối, có khoảng ● 68% rơi vào µ± ● 95% rơi vào µ± 2 ● 99,7% rơi vo â 2013 Nguyn Tin Dng 14 4.6.3 Quy tắc Chebysev ● Với phân phối bất kỳ, ln có ● (1-1/k2).100% quan sát rơi vào khong k. â 2013 Nguyn Tin Dng 15 4.6.4 Chuẩn hố liệu ● Biến X ~ N(µ; 2) Z ~ N(0; 12) ● ● Biến X ~ N(𝑥; 𝑠2) Z ~ N(0; 12) © 2013 Nguyễn Tiến Dũng z x xx z s 16 4.7 Phân biệt số cặp khái niệm ● Tham số tổng thể tham số mẫu ● Tham số tổng thể: µ, 2, , p ● Tham số mẫu: 𝑥, s2, s, ps ● Biến thiên độ lệch chuẩn ● Biến thiên: sai lệch giá trị quan sát với TB ● ĐLC: thước đo tổng hợp biến thiên © 2013 Nguyễn Tiến Dũng 17