Bài giảng Thống kê ứng dụng trong kinh doanh Chương 4: Tóm tắt và trình bày dữ liệu bằng đại lượng số cung cấp cho người học các kiến thức: Các đại lượng đo lường độ tập trung và phương pháp mô tả hình dáng tập DL, các đại lượng đo lường độ phân tán, các đại lượng TK mô tả cho bảng tần số,... Mời các bạn cùng tham khảo.
Trang 1CHƯƠNG 4 TÓM TẮT VÀ TRÌNH BÀY DỮ LIỆU
BẰNG ĐẠI LƯỢNG SỐ
ThS Nguyễn Tiến Dũng
Bộ môn Quản trị Kinh doanh, Viện Kinh tế và Quản lý
Email: dung.nguyentien3@hust.edu.vn
Trang 2MỤC TIÊU CỦA CHƯƠNG
● Sau khi kết thúc chương này, người học có thể:
● Kể tên và biết cách tính các đại lượng đặc trưng cho độ tập trung: trung bình, trung vị, mốt, tứ phân vị, phân vị
● Nói tên và biết cách tính các đại lượng đặc trưng cho độ
phân tán của tập DL: khoảng biến thiên, độ trải giữa,
phương sai và độ lệch chuẩn
● Nắm được ý nghĩa của hệ số biến thiên
● Phát biểu được quy tắc thực nghiệm và quy tắc Chebysev
về quy luật phân phối của tập DL
● Biết cách vẽ và khám phá đặc điểm của tập DL qua biểu đồ hộp và râu
● Phân biệt được các tham số tổng thể và tham số mẫu
Trang 3CÁC NỘI DUNG CHÍNH
4.1 Các đại lượng đo lường độ tập trung và
phương pháp mô tả hình dáng tập DL
4.2 Các đại lượng đo lường độ phân tán
4.3 Các đại lượng TK mô tả cho bảng tần số
4.4 Các đại lượng TK mô tả cho tổng thể
4.5 Khám phá DL qua biểu đồ hộp và râu (box
plot)
4.6 Sử dụng kết hợp TB và độ lệch chuẩn
4.7 Phân biệt một số cặp khái niệm
Trang 44.1 CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ TẬP TRUNG VÀ PHƯƠNG PHÁP MÔ TẢ HÌNH DÁNG TẬP DỮ LIỆU
● 4.1.1 Các ĐL đo lường độ tập trung phổ biến
Trang 54.1.1 Các ĐL đo lường độ tập trung phổ biến
● 4.1.1.1 Trung bình cộng (arithmetic mean)
● 4.1.1.2 Trung vị (Median)
● 4.1.1.3 Mốt (Mode)
● 4.1.1.4 Trung bình nhân (geometric mean)
Trang 7i i
w x x
Trang 102 (2013)
3 (2014)
3 3
1 2 3 1,100 1, 273 1, 036 1,132
Trang 114.1.2 Sử dụng Excel để tính các đại lượng TK mô tả độ tập trung
● Data Analysis Descriptive Statistics
● Dùng MegaStat
Trang 12Độ lệch (Skewness) và Độ nhọn (Kurtosis) của phân
phối
Trang 134.1.3 Nhóm các đại lượng khác mô tả sự phân bố của tập dữ liệu
● 4.1.3.1 Tứ phân vị (quartiles)
● Dãy DL đã sắp xếp tăng dần: x1 < x2 < … < xn
Trang 154.1.3.2 Phân vị / Bách phân vị (percentiles)
● Dãy DL đã sắp xếp tăng dần: x1 ≤ x2 ≤ … ≤ xn
● Phân vị thứ K (PK): giá trị của quan sát thứ k, mà chia dãy DL làm
2 phần, trong đó có K% quan sát đứng phía dưới của phân vị này
K
k n
Trang 164.2 CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ PHÂN TÁN
● 4.2.1 Khoảng biến thiên (Range): R = xmax - xmin
● 4.2.2 Độ trải giữa (InterQuartile Range) IQR = Q3 –
Trang 174.3 CÁC ĐẠI LƯỢNG TK MÔ TẢ CHO BẢNG TẦN SỐ
(DỮ LIỆU ĐÃ PHÂN TỔ)
phân tổ
theo 2 cách: Cách 1 là tính từ tập DL gốc Cách 2 là tính dựa trên DL đã phân thành 4 tổ So sánh kết
Trang 184.4 CÁC ĐẠI LƯỢNG TK MÔ TẢ CHO TỔNG THỂ
x N
x N
x N
Trang 194.5 KHÁM PHÁ DL QUA BIỂU ĐỒ HỘP VÀ RÂU
(BOX-AND-WHISKER PLOT)
● Bước 1: Vẽ hộp
● Xác định Q1, Q2, Q3
● Vẽ hình hộp xung quanh
● Vẽ đường qua trung vị
● Bước 2: Vẽ râu trên
● Nếu xmax – Q3 ≤ 1,5.IQR, thì râu trên = xmax
● Nếu xmax – Q3 > 1,5.IQR, thì râu trên = Q3+1,5.IQR và
vẽ 1 dấu chấm/sao ở vị trí xmax
● Bước 3: Vẽ râu dưới
● Nếu Q1 - xmin ≤ 1,5.IQR, thì râu dưới = xmin
● Nếu Q1 - xmin > 1,5.IQR, thì râu dưới = Q1 – 1,5.IQR và
vẽ thêm 1 dấu chấm/sao ở vị trí xmin
● Giá trị ngoại lệ: cách mép trên (Q3) hoặc mép dưới
(Q1) hộp hơn 1,5 IQR
● Giá trị cực đoan: cách mép trên (Q3) hoặc mép dưới
(Q1) hộp hơn 3.IQR
Trang 20Biểu đồ hộp và râu: So sánh lương khởi điểm của
những người mới ra trường
Trang 234.6.2 Quy tắc thực nghiệm
● 68% quan sát (điểm dữ liệu) rơi vào µ±
● 95% quan sát (điểm dữ liệu) rơi vào µ± 2
● 99,7% quan sát (điểm dữ liệu) rơi vào µ± 3
Trang 244.6.3 Quy tắc Chebysev
● Với một phân phối bất kỳ, luôn có ít nhất
(1-1/k 2 ).100% quan sát rơi vào khoảng µ± k (k>1)
1821 - 1894
Trang 254.6.4 Chuẩn hoá dữ liệu
Trang 264.7 PHÂN BIỆT MỘT SỐ CẶP KHÁI NIỆM
● Tham số tổng thể và tham số mẫu
● Tham số tổng thể: µ, 2 , , p
● Tham số mẫu: 𝑥, s 2 , s, ps
● Biến thiên và độ lệch chuẩn