BÀI GIẢNG đo lường vị trí trung tâm và độ biến thiên môn THỐNG KÊ NỘI DUNG: 1. Trình bày được định nghĩa, tính chất và thực hiện tính toán và phiên giải các đại lượng đo lường vị trí trung tâm của bộ số liệu 2. Trình bày được định nghĩa, tính chất và thực hiện tính toán và phiên giải các đại lượng đo lường sự phân tán của bộ số liệu.
Đo lường vị trí trung tâm độ biến thiên Mục tiêu Trình bày định nghĩa, tính chất thực tính tốn phiên giải đại lượng đo lường vị trí trung tâm số liệu Trình bày định nghĩa, tính chất thực tính tốn phiên giải đại lượng đo lường phân tán số liệu Ví dụ 3/18/21 • Số liệu Hemoglobin 70 phụ nữ • Làm để tóm tắt số liệu này? xi Đặc trưng chung số liệu gì? 3/18/21 Tóm tắt số liệu • Thông qua số thống kê bản: • Mức độ tập trung • Trung bình • Trung vị • Mode 3/18/21 Tóm tắt số liệu • Mức độ phân tán • Khoảng • Phương sai – Độ lệch chuẩn • Khoảng phân vị • Trung bình • Trung vị • Mode 3/18/21 Đo lường độ tập trung Trung bình • Giá trị trung bình : • Trung bình 2, 5, 5, 15/3 = • Trung bình 1, 3, 2, 3.5, 14/4 = 3.5 • Trung bình theo nhóm: = • Trong đó: fi tần số nhóm i, i trung bình nhóm i 3/18/21 Trung bình (tt) Trung bình (tt) • Điểm mạnh • Giá trị trung bình • Điểm yếu 3/18/21 • Tính tốn đơn giản • Dễ bị ảnh hưởng giá trị cực trị số liệu • Ví dụ • Trung bình 1, 2, 1.000.000 333.334,33, Khơng thể nói đại diện cho số liệu • Hoặc giá trị trung bình 1; 2; 9500; 9600; 9700 9900 6450.5 ! • Trung vị số liệu giá trị đứng quan sát xếp quan sát theo thứ tự • Có khác biệt giá trị trung vị số liệu có số quan sát chẵn lẻ • Ví dụ: 3/18/21 Trung vị • Trung vị 1, 3, 15, 16, 17 (5 số liệu): 15 • Trung vị 1, 2, 3, 5, 8, (6 số liệu): giá trị trung bình hai giá trị đứng quan sát 10 • Giá trị mode tập hợp quan sát giá trị có tần số xuất nhiều tập hợp • Ví dụ • Mode 1, 2, 2, 3, 4, • Tập hợp 1, 2, 3, 4, khơng có mode • Tập hợp 1, 2, 3, 3, 4, 5, có mode: Tìm mode ví dụ 3/18/21 Mode 12 • Phương sai – Độ lệch chuẩn • Khoảng • Phân vị - Khoảng phân vị 3/18/21 Đo lường độ phân tán 13 xi 3/18/21 Phân tán Trung bình So với trung bình, mức độ phân tán số liệu đánh nào? 14 • Nếu cộng tất chênh lệch, vấn đề xảy ra? • Giải pháp (xi - )² 3/18/21 Vấn đề • Khi đó, phương sai tính n S i 1 n (xi x) n i 1 x i nx n x n x n 15 • • • • • Tính trung bình Tính hiệu số (xi - ) Bình phương hiệu số Cộng tất bình phương Chia cho (n-1) 3/18/21 Các bước 16 • Điểm yếu phương sai: đơn vị đo lường bình phương • Độ lệch chuẩn (standard deviation – SD, S): lấy phương sai 3/18/21 Độ lệch chuẩn 17 Hệ số biến thiên (C.V) • Sự biến thiên tương đối phân bố thường dùng để đo mức độ phân bố • Giá trị C.V nhỏ mức độ lớn • Ví dụ: =56,2 kg sd =10,385 kg • C.V = 10,385/56,2 x 100% = 18,48% • Ví dụ: So sánh biến thiên nhóm số liệu Khoảng • Khoảng cách/ chênh lệch giá trị lớn giá trị nhỏ tập hợp số liệu • Khoảng (range) = Giá trị lớn (maximum) – Giá trị nhỏ (minimum) • Nhược điểm: • Chỉ dựa giá trị hai quan sát (lớn nhỏ nhất), không đề cập đến dao động, biến thiên quan sát khác nằm hai quan sát • Cỡ mẫu lớn giá trị khoảng thường lớn • Phân vị thứ p (pth) số liệu giá trị mà p% quan sát nhỏ giá trị (1-p)% quan sát lớn giá trị • Phiên giải: • • • • 3/18/21 Phân vị Phân vị 25% số liệu 3? Phân vị 50% số liệu 8? Phân vị 75% số liệu 11? Phân vị 100%? • Tứ phân vị: • Q1 • Q2 – trung vị • Q3 20 Ví dụ 0.5 1.2 2.1 2.5 2.5 3.0 3.8 4.0 4.2 4.5 5.0 5.0 5.0 5.0 6.0 6.5 7.0 8.0 9.5 13.0 3/18/21 Đường kính (tính cm) khối u Sarcomas lấy từ ngực 20 phụ nữ Tính phân vị 25%, 50%, 75% 21 Phân vị (tt) • Q1= giá trị quan sát thứ (n+1)/4 • Q2= giá tr quan sỏt th (n+1)/2 3/18/21 ã Phõn v ẳ • Q3= giá trị quan sát thứ 3(n+1)/4 22 1.2 5.0 Q1: 2.1 5.0 2.5 5.0 2.5 6.0 Q 3.0 6.5 3.8 7.0 4.0 8.0 4.2 9.5 4.5 13.0 20 5 t h m e a s u r e Với giá trị: 2.5 + (.25)(3.0-2.5)=2.625 Q Q2: 3/18/21 0.5 5.0 (2 1) t h m e a s u r e Với giá trị: 4.5 + (.50)(5.0-4.5) = 4.75 3(2 1) Q3 t h m e a s u r e Q3: Với giá trị: 6.0 + (.75)(6.5-6.0) = 6.375 23 • Sắp xếp số liệu từ nhỏ đến lớn • Tìm vị trí phân vị • Tính phân vị 3/18/21 Các bước tính phân vị 24 Khoảng phân vị - IQR • Là khoảng chứa 50% quan sát có tập hợp/ số liệu • IQR = Q3 – Q1 • Ví dụ: IQR = 6,375 – 2,625 = 3,75 Đường cong phân bố chuẩn • Các giá trị trung bình, trung vị mà mode • Phân tán: • Khoảng 68% quan sát nằm khoảng độ lệch chuẩn (sd) quanh giá trị trung bình; • 95% quan sát nằm khoảng 2sd; • Có 99,7% quan sát nằm khoảng 3sd ... qua số thống kê bản: • Mức độ tập trung • Trung bình • Trung vị • Mode 3/18/21 Tóm tắt số liệu • Mức độ phân tán • Khoảng • Phương sai – Độ lệch chuẩn • Khoảng phân vị • Trung bình • Trung vị •... 3/18/21 Đo lường độ tập trung Trung bình • Giá trị trung bình : • Trung bình 2, 5, 5, 15/3 = • Trung bình 1, 3, 2, 3.5, 14/4 = 3.5 • Trung bình theo nhóm: = • Trong đó: fi tần số nhóm i, i trung. .. Trung vị • Trung vị 1, 3, 15, 16, 17 (5 số liệu): 15 • Trung vị 1, 2, 3, 5, 8, (6 số liệu): giá trị trung bình hai giá trị đứng quan sát 10 Trung vị (tt) • Ưu điểm: • Mỗi số liệu có giá trị trung