Bài 3 Các số đặc trưng đo mức độ phân tán cho mẫu số liệu không ghép nhóm A Lý thuyết I Khoảng biến thiên Khoảng tứ phân vị 1 Định nghĩa Trong một mẫu số liệu, khoảng biến thiên là hiệu số giữa giá tr[.]
Bài Các số đặc trưng đo mức độ phân tán cho mẫu số liệu khơng ghép nhóm A Lý thuyết I Khoảng biến thiên Khoảng tứ phân vị Định nghĩa - Trong mẫu số liệu, khoảng biến thiên hiệu số giá trị lớn giá trị nhỏ mẫu số liệu Ta tính khoảng biến thiên R mẫu số liệu theo công thức sau: R = xmax – xmin, xmax giá trị lớn nhất, xmin giá trị nhỏ mẫu số liệu - Giả sử Q1, Q2, Q3 tứ phân vị mẫu số liệu Ta gọi hiệu ∆Q = Q3 – Q1 khoảng tứ phân vị mẫu số liệu Chú ý: Khoảng tứ phân vị mẫu số liệu gọi khoảng trải (tiếng Anh InterQuartile Range – IQR) mẫu số liệu Ví dụ: Mẫu số liệu thống kê cân nặng (đơn vị: kg) học sinh tổ sau: 45 52 41 37 50 52 66 49 a) Tìm khoảng biến thiên mẫu số liệu b) Tìm khoảng tứ phân vị mẫu số liệu Hướng dẫn giải a) Trong mẫu có số liệu lớn 66, số liệu nhỏ 37 Khi đó, khoảng biến thiên mẫu R = xmax – xmin = 66 – 37 = 29 (kg) Vậy khoảng biến thiên mẫu R = 29 kg b) Sắp xếp mẫu theo thứ tự tăng dần, ta được: 37 41 45 Khi đó, trung vị mẫu là: Q2 = 49 50 52 52 66 49 50 49,5 Q1 trung vị mẫu 37, 41, 45, 49 nên Q1 = 41 45 43 Q3 trung vị mẫu 50, 52, 52, 66 nên Q3 = 52 52 52 Khi đó, ta có khoảng tứ phân vị là: ∆Q = Q3 – Q1 = 52 – 43 = (kg) Vậy khoảng tứ phân vị mẫu ∆Q = kg Ý nghĩa a) Ý nghĩa khoảng biến thiên: Khoảng biến thiên mẫu số liệu phản ánh “dao động”, “sự dàn trải” số liệu mẫu Khoảng biến thiên sử dụng nhiều tình thực tiễn, chẳng hạn: tìm phân tán điểm kiểm tra lớp học hay xác định phạm vi giá dịch vụ … Theo cách nhìn vật lí, biên độ dao động phản ánh khoảng cách từ điểm cân đến điểm xa dao động, coi số trung bình cộng “điểm cân bằng” mẫu số liệu khoảng biến thiên mẫu số liệu xem hai lần biên độ dao động số liệu mẫu quanh điểm cân Trong đại lượng đo mức độ phân tán mẫu số liệu, khoảng biến thiên đại lượng dễ hiểu, dễ tính tốn tương đối tốt mẫu số liệu nhỏ Tuy nhiên, khoảng biến thiên sử dụng hai giá trị xmax xmin mẫu số liệu nên đại lượng chưa diễn giải đầy đủ phân tán số liệu mẫu Ngoài ra, giá trị khoảng biến thiên bị ảnh hưởng giá trị bất thường mẫu số liệu Trong trường hợp vậy, khoảng biến thiên mẫu số liệu khơng phản ánh xác độ dàn trải mẫu số liệu b) Ý nghĩa khoảng tứ phân vị: Khoảng tứ phân vị đại lượng cho biết mức độ phân tán 50% số liệu mẫu số liệu xếp giúp xác định giá trị bất thường mẫu số liệu Khoảng tứ phân vị thường sử dụng thay cho khoảng biến thiên loại trừ hầu hết giá trị bất thường mấu số liệu II Phương sai Định nghĩa - Mỗi hiệu số số liệu số trung bình cộng gọi độ lệch số liệu số trung bình cộng - Cho mẫu số liệu thống kê có n giá trị x1, x2, …, xn số trung bình cộng x Ta gọi số s x 1x x 2 x n x n x phương sai mẫu số liệu Nhận xét: - Khi có số liệu nhau, ta tính phương sai theo công thức sau: + Đối với bảng tần số: Phương sai mẫu số liệu thống kê bảng phân bố tần số là: s2 n1 x1 x n2 x2 x n k x k x n , n = n1 + n2 + …+ nk ; x số trung bình cộng số liệu cho + Đối với bảng phân bố tần số tương đối: Phương sai mẫu số liệu thống kê bảng phân bố tần số tương đối là: s f1 x1 x f x x f k x k x , x số trung bình cộng số liệu cho - Trong thực tế, người ta dùng cơng thức sau để tính phương sai mẫu số liệu: s x x x 2 x x n x n 1 , đó: xi giá trị quan sát thứ i; x giá trị trung bình n số quan sát mẫu số liệu Ví dụ: Hai lớp 10A 10B trường THPT đồng thời làm thi mơn Tốn theo đề thi Kết ghi lại bảng tần số sau: Điểm thi lớp 10A: Điểm thi 10 Số học sinh 12 14 Điểm thi Số học sinh 18 10 Điểm thi lớp 10B: a) Tính phương sai mẫu số liệu hai bảng b) Xét xem kết thi lớp đồng Hướng dẫn giải Ta có điểm thi trung bình lớp 10A là: x10A 3.5 7.6 12.7 14.8 3.9 1.10 7,25 12 14 Điểm thi trung bình lớp 10A là: x10B 8.6 18.7 10.8 4.9 7,25 18 10 Ta có phương sai mẫu số liệu lớp 10A là: 3 7,25 7,25 1.10 7,25 1,2875 12 14 2 10A s 2 ⇒ s10A = 1,2875 Ta có phương sai mẫu số liệu lớp 10B là: 7,25 18 7,25 10.8 7,25 7,25 0,7875 18 10 2 10B s ⇒ s10B = 0,7875 2 Ta thấy điểm thi trung bình lớp 10A 10B 7,25 Nhưng phương sai bảng điểm lớp 10A lại lớn phương sai bảng điểm lớp 10B nên kết làm thi lớp 10B đồng lớp 10A Ý nghĩa Phương sai số đặc trưng đo mức độ phân tán mẫu số liệu Mẫu số liệu có phương sai nhỏ mức độ phân tán (so với số trung bình cộng) số liệu mẫu thấp III Độ lệch chuẩn Định nghĩa Căn bậc hai (số học) phương sai gọi độ lệch chuẩn mẫu số liệu thống kê Nhận xét: Vì độ lệch chuẩn có đơn vị đo với số liệu thống kê nên cần ý đến đơn vị đo ta sử dụng độ lệch chuẩn mà khơng sử dụng phương sai Ví dụ: Cho mẫu số liệu: 23 22 20 12 35 Tính độ lệch chuẩn mẫu Hướng dẫn giải Mẫu có số liệu Số trung bình mẫu là: x 23 22 20 12 35 22,4 Phương sai mẫu số liệu là: 23 22,4 22 22,4 20 22,4 12 22,4 s ⇒s= 2 s2 = 54,64 ≈ 7,39 Vậy độ lệch chuẩn mẫu 7,39 Ý nghĩa (35 22,4) 54,64 Cũng phương sai, hai mấu số liệu thống kê có đơn vị đo có số trung bình cộng (hoặc xấp xỉ nhau), mẫu số liệu có độ lệch chuẩn nhỏ mức độ phân tán (so với số trung bình cộng) số liệu mẫu thấp Độ lệch chuẩn số đặc trưng đo mức độ phân tán mẫu số liệu thống kê có đơn vị đo IV Tính hợp lí số liệu thống kê Ta sử dụng số đặc trưng đo mức độ phân tán cho mẫu số liệu khơng ghép nhóm để số liệu bất thường mẫu số liệu Ta thường sử dụng khoảng tứ phân vị để xác định số liệu bất thường mẫu số liệu Cụ thể sau: Giả sử Q1, Q2, Q3 tứ phân vị mẫu số liệu hiệu ∆Q = Q3 – Q1 khoảng tứ phân vị mẫu số liệu Một giá trị mẫu số liệu coi giá trị bất 3 thường nhỏ Q1 Q lớn Q3 Q Như vậy, khoảng tứ phân 2 vị cho ta cách nhận biết giá trị bất thường mẫu số liệu Chú ý: Ta xác định số liệu bất thường mẫu số liệu số trung bình cộng độ lệch chuẩn Cụ thể sau: Giả sử x , s số trung bình cộng độ lệch chuẩn mẫu số liệu Một giá trị mẫu số liệu coi giá trị bất thường nhỏ x – 3s lớn x + 3s Như vậy, số trung bình cộng độ lệch chuẩn cho ta cách nhận giá trị bất thường mẫu số liệu Ví dụ: Hãy tìm giá trị bất thường mẫu số liệu sau: 12 10 –5 30 10 12 30 Hướng dẫn giải Mẫu xếp theo thứ tự tăng dần là: –5 Mẫu có số liệu Trung vị mẫu là: 79 = Suy Q2 = Trung vị nửa –5, 4, 6, 46 = Suy Q1 = Trung vị nửa 9, 10, 12, 30 10 12 = 11 Suy Q3 = 11 Khoảng tứ phân vị ∆Q = Q3 – Q1 = 11 – = 3 3 Ta có: Q1 Q 4 ; Q3 Q 11 20 2 2 Ta thấy –5 < –4 30 > 20 nên giá trị –5 30 giá trị bất thường mẫu Vậy mẫu có hai giá trị bất thường –5 30 B Bài tập tự luyện B.1 Bài tập tự luận Bài Cho mẫu số liệu thống kê chiều cao 13 xoan đào (đơn vị: mét) sau: 2,4 2,5 0,9 4,3 3,7 3,9 4,4 7,3 1,7 4,3 4,4 7,3 a) Tìm khoảng biến thiên mẫu số liệu b) Tìm khoảng tứ phân vị mẫu số liệu c) Tìm giá trị bất thường mẫu Hướng dẫn giải a) Sắp xếp mẫu theo thứ tự tăng dần: 0,9 1,7 2,4 2,5 3,7 3,9 Mẫu có 13 số liệu, số liệu nhỏ 0,9; số liệu lớn Khi khoảng biến thiên mẫu R = – 0,9 = 7,1 (m) Vậy khoảng biến thiên mẫu 7,1 mét b) Trung vị mẫu 3,9; tức Q2 = 3,9 Trung vị nửa mẫu 0,9; 1,7; 2,4; 2,5; 3; 3,7 2,4 2,5 = 2,45 Suy Q1 = 2,45 (m) Trung vị nửa mẫu 4; 4; 4,3; 4,4; 5; 4,3 4,4 = 4,35 Suy Q3 = 4,35(m) Khi khoảng tứ phân vị mẫu là: ∆Q = Q3 – Q1 = 4,35 – 2,45 = 1,9 (m) Vậy khoảng tứ phân vị 1,9 m 3 3 c) Ta có: Q1 Q 2,45 1,9 0,4 ; Q3 Q 4,35 1,9 7,2 2 2 Ta thấy 7,3 > 7,2 nên giá trị 7,3 giá trị bất thường mẫu Vậy mẫu có giá trị bất thường 7,3 Bài Thời gian lần chạy cự li 100 m (đơn vị: giây) hai bạn Long Nam ghi lại bảng sau: Long 20 23 19 21 22 Nam 18 21 20 22 22 a) Tính thời gian chạy trung bình bạn Long Nam Bạn có kết chạy tốt b) Tính phương sai, độ lệch chuẩn mẫu số liệu thống kê kết lần chạy bạn Từ cho biết bạn có kết chạy ổn định Hướng dẫn giải a) Thời gian chạy trung bình Long là: x L Thời gian chạy trung bình Nam là: x N 20 23 19 21 22 21 (s) 18 21 20 22 22 20,6 (s) Do x L x N (21 > 20,6) nên kết chạy Nam tốt Long Vậy thời gian chạy trung bình Long 21 giây, Nam 20,6 giây kết chạy Nam tốt Long b) Ta có phương sai mẫu số liệu thống kê kết lần chạy Long là: 20 21 23 21 19 21 21 21 s L 2 (22 21) ⇒ sL = s 2L = 2 ≈ 1,41 Phương sau mẫu số liệu thống kê kết lần chạy Nam là: 18 20,6 21 20,6 20 20,6 22 20,6 s N 2 (22 20,6) ⇒ sN = s 2N = 2,24 2, 24 ≈ 1,5 Ta thấy s 2L s 2N (2 < 2,24) nên bạn Long có kết chạy ổn định bạn Nam Vậy phương sai mẫu số liệu thống kê kết lần chạy Long Nam 2,24 Độ lệch chuẩn mẫu số liệu thống kê kết lần chạy Long Nam 1,41 1,5 Bạn Long có kết chạy ổn định bạn Nam B.2 Bài tập trắc nghiệm Câu Năng suất lúa hè thu (tạ/ha) năm 1998 31 tỉnh thành Việt Nam thống kê bảng sau: Năng suất lúa 25 30 35 40 45 (tạ/ha) Tần số Hãy tính khoảng biến thiên mẫu số liệu A 40; B 20; C 61; D Hướng dẫn giải Đáp án là: B Theo bảng số liệu ta có: Giá trị lớn số liệu 45; giá trị nhỏ số liệu 25 Khoảng biến thiên : R = 45 – 25 = 20 Câu Tiến hành đo huyết áp người ta thu kết sau: 77 105 117 84 96 72 105 124 Hãy tìm khoảng tứ phân vị mẫu số liệu A 10; B 20; C 10,5; D 30,5 Hướng dẫn giải Đáp án là: D Mẫu số liệu xếp theo thứ tự tăng dần sau: 72 77 84 96 105 105 117 124 Trung vị mẫu số liệu là: 96 105 = 100,5 ⇒ Q2 = 100,5 Nửa dãy phía số 100,5 (nghĩa số nhỏ 100,5) gồm: 72 77 84 96 có trung vị 77 84 = 80,5 ⇒ Q1 = 80,5 Nửa dãy phía số 100,5 (nghĩa số lớn 100,5) gồm: 105 105 117 124 có trung vị 105 117 = 111 ⇒ Q3 = 111 Do đó, tứ phân vị mẫu số liệu: Q1 = 80,5; Q2 = 100,5; Q3 = 111 Vậy khoảng tứ phân vị mẫu số liệu là: ∆Q = Q3 – Q1 = 111 – 80,5 = 30,5 Câu Thời gian chạy 50 m 20 học sinh ghi lại bảng sau đây: Thời gian 8,3 8,4 8,5 8,7 8,8 (giây) Tần số Hãy tìm độ lệch chuẩn mẫu số liệu cho A 0,14; B 0,0191; C 8,53; D 8,5 Hướng dẫn giải Đáp án là: A Ta có: x = 2.8,3 3.8,4 9.8,5 5.8,7 1.8,8 = 8, 53 20 Phương sai là: s2 = 2.(8,3 8,53) 3.(8,4 8,53) 9.(8,5 8,53) 5.(8,7 8,53)2 (8,8 8,53) 20 = 0,0191 ⇒ Độ lệch chuẩn: s = 0,0191 0,14 ... 10A là: x10A 3.5 7.6 12.7 14.8 3.9 1 .10 7,25 12 14 Điểm thi trung bình lớp 10A là: x10B 8.6 18.7 10. 8 4.9 7,25 18 10 Ta có phương sai mẫu số liệu lớp 10A... 96 105 105 117 124 Trung vị mẫu số liệu là: 96 105 = 100 ,5 ⇒ Q2 = 100 ,5 Nửa dãy phía số 100 ,5 (nghĩa số nhỏ 100 ,5) gồm: 72 77 84 96 có trung vị 77 84 = 80,5 ⇒ Q1 = 80,5 Nửa dãy phía số 100 ,5... 2 10B s ⇒ s10B = 0,7875 2 Ta thấy điểm thi trung bình lớp 10A 10B 7,25 Nhưng phương sai bảng điểm lớp 10A lại lớn phương sai bảng điểm lớp 10B nên kết làm thi lớp 10B đồng lớp 10A Ý nghĩa Phương