q Khi hai dãy số liệu thống kê có cùng đơn vị đo và có số trung bình cộng bằng nhau hoặc xấp xỉ nhau thì việc đánh giá hai nhóm được dựa vào phương sai và độ lệch chuẩn. q Nếu phương sa[r]
(1)(2)Ví dụ mở đầu: Khi điều tra “Năng suất lúa hè thu năm 1998” 31 tỉnh, người ta thu thập số liệu ghi bảng
Bảng 1: Năng suất lúa hè thu (tạ/ha) năm 1998 31 tỉnh
ØDấu hiệu điều tra: năng suất lúa hè thu năm 1998 31 tỉnh.
ØSố thiệu thống kê: số liệu số liệu, gọi giá trị dấu hiệu Có giá trị khác nhau: 25, 30, 35, 40, 45 Kí hiệu: xi ! = #, %, &, ',
Ta có:
ØSố số liệu thống kê: 31 (bằng số tỉnh) Kí hiệu: n
30 30 25 25 35 45 40 40 35 45
25 45 30 45 30 30 40 30 25 45
(3)Bảng 1: Năng suất lúa hè thu (tạ/ha) năm 1998 31 tỉnh
1 Tần số: của giá trị số lần xuất giá trị bảng số liệu Kí hiệu: ni ! = #, %, &, ',
Ví dụ:
+ Giá trị x1=25 có số lần xuất nên ta nói giá trị x1=25 có tần số hay n1=4. + Tương tự: n2=7; n3=9; n4=6; n5=5 lần lượt tần số giá trị )* = 25; ). = 30; )1 = 35;
)2 = 40; )4 = 45
Lưu ý: Tổng tần số số số liệu thống kê
5* + 5. + 51 + 52 + 54 = + + + = 31
30 30 25 25 35 45 40 40 35 45
25 45 30 45 30 30 40 30 25 45
(4)+ Giá trị x1=25 có số lần xuất nên ta nói giá trị x1=25 có tần số hay n1=4. + Tương tự: n2=7; n3=9; n4=6; n5=5 lần lượt tần số giá trị !" = 25; !' = 30; !* = 35;
!+ = 40; !- = 45
2 Tần suất: của giá trị tỉ số tần số giá trị số số liệu thống kê
./ = 0/
Ví dụ:
+ Tần suất giá trị x1=25 là: " = *"+ ≈ 12,9%
+ Tương tự: ' ≈ 22,6%; * ≈ 29%; + ≈ 19,4%; - ≈ 16,1% tần suất giá trị
!" = 25; !' = 30; !* = 35; !+ = 40; !- = 45
(5)3 Bảng phân bố tần số tần suất
Bảng 1: Năng suất lúa hè thu (tạ/ha) năm 1998 31 tỉnh
30 30 25 25 35 45 40 40 35 45
25 45 30 45 30 30 40 30 25 45
35 35 30 40 40 40 35 35 35 35 35
Năng suất lúa (tạ/ha) Tần số Tần suất (%)
25 12,9%
30 22,6%
35 29,0%
40 19,4%
45 16,1%
Cộng 31 100 (%)
(6)Năng suất lúa
(tạ/ha) Tần số Tần suất (%)
25 12,9%
30 22,6%
35 29,0%
40 19,4%
45 16,1%
Cộng 31 100 (%)
Bảng 2 Năng suất lúa (tạ/ha) Tần số
25 30 35 40 45 Cộng 31
Năng suất lúa (tạ/ha) Tần suất (%)
25 12,9%
30 22,6%
35 29,0%
40 19,4%
45 16,1%
Cộng 100 (%)
+ Nếu bảng bỏ cột tần suất ta bảng phân bố tần số
(7)4 Bảng phân bố tần số tần suất ghép lớp
158 152 156 158 168 160 170 166 161 160 172 173
150 167 165 163 158 162 169 159 163 164 161 160
164 159 163 155 163 165 154 161 164 151 164 152
Để may đồng phục học sinh người ta đo chiều cao 36 học sinh lớp 10A1 thu số liệu thống kê ghi bảng sau:
Lớp số đo chiều cao (cm) Tần số Tần suất (%)
[150;156) 16,7
[156;162) 12 33,3
[162;168) 13 36,1
[168;174) 13,9
Cộng 36 100 (%)
Bảng 3
(8)Lớp số đo chiều cao
(cm) Tần số Tần suất (%)
[150;156) 16,7
[156;162) 12 33,3
[162;168) 13 36,1
[168;174) 13,9
Cộng 36 100 (%)
Lớp số đo chiều cao (cm) Tần số
[150;156)
[156;162) 12
[162;168) 13
[168;174)
Cộng 36
Lớp số đo chiều cao (cm) Tần suất (%)
[150;156) 16,7
[156;162) 33,3
[162;168) 36,1
[168;174) 13,9
Cộng 100 (%)
Bảng 4
+ Nếu bảng bỏ cột tần suất ta bảng phân bố tần số ghép lớp
(9)5 Số trung bình cộng
a) Sử dụng số liệu từ bảng phân bố tần số, tần suất:
̅" = $%"% + $'"'+ +$)")
$ = *%"% + *'"'+ +*)")
Trong $+; *+ tần số, tần suất giá trị "+; $ số số liệu thống kê ($ = $%+$' + ⋯ + $))
Ví dụ 1: Tính số trung bình cộng từ bảng Năng suất lúa
(tạ/ha) Tần số Tần suất (%)
25 12,9%
30 22,6%
35 29,0%
40 19,4%
45 16,1%
Cộng 31 100 (%)
Bảng 2
̅" = 4.25 + 7.30 + 9.35 + 6.40 + 5.45
31 ≈ 35,2
̅" = 12,9.25 + 22,6.30 + 29.35 + 19,4.40 + 16,1.45
(10)b) Sử dụng số liệu từ bảng phân bố tần số tần suất ghép lớp ̅" = $%&% + $(&(+ +$*&*
$ = +%&% + +(&(+ ++*&*
Trong &,; $,; +, giá trị đại diện, tần số, tần suất lớp thứ ; $ số số liệu thống kê ($ = $%+$( + ⋯ + $*)
Ví dụ 2: Tính chiều cao trung bình 36 học sinh Lớp số đo chiều cao
(cm) Tần số Tần suất (%)
[150;156) 16,7
[156;162) 12 33,3
[162;168) 13 36,1
[168;174) 13,9
Cộng 36 100 (%)
Bảng 4
̅" = 6.153 + 12.159 + 13.165 + 5.171
36 ≈ 162
̅" = 16,7.153 + 33,3.159 + 36,1.165 + 13,9.171
(11)6 Số trung vị: xem sách giáo khoa trang 120-121
7 Mốt: của bảng phân bố tần số giá trị có tần số lớn Kí hiệu: !"
Năng suất lúa
(tạ/ha) Tần số Tần suất (%)
25 12,9%
30 22,6%
35 29,0%
40 19,4%
45 16,1%
Cộng 31 100 (%)
Bảng 2
Ví dụ: Trong bảng số 35 có tần số lớn Suy ra: !" = 35
Lưu ý: Nếu bảng số liệu có hai giá trị có tần số lớn số
(12)1 Ví dụ mở đầu: Giá trị thành phẩm quy tiền (nghìn đồng) tuần lao động của công nhân tổ là: 180, 190, 190, 200, 210, 210, 220 (1)
7 công nhân tổ là: 150, 170, 170, 200, 230, 230, 250 (2) - Số trung bình cộng dãy (1) dãy (2) là: ̅" = $% = 200
- Các độ lệch số liệu thống kê dãy (1) số trung bình cộng là: (180-200) ; (190-200) ; (190-200) ; (200-200) ; (210-200); (210-200) ; (220-200)
- Bình phương độ lệch dãy (1) là:
(180 − 200)-;(190 − 200)-;(190 − 200)-;(200 − 200)-;(210 − 200)-;(210 − 200)-; (220 − 200) Trung bình cộng bình phương độ lệch dãy (1)
Tính số trung bình cộng ̅" dãy (1) số trung bình cộng $% dãy (2)
/0-=(0123-22)45-(0623-22)45(-223-22)45-(-023-22)45( 23-22)4
(13)a) Định nghĩa: Phương sai !" độ lệch chuẩn s dùng để đánh giá mức độ phân tán
của số liệu thống kê (so với số trung bình cộng) Nhưng cần ý đến đơn vị đo ta dùng s, s có đơn vị đo với dấu hiệu nghiên cứu.
2 Phương sai độ lệch chuẩn
b) Cơng thức tính phương sai
*Trường hợp bảng phân bố tần số, tần suất
!" = %$ ['$ ($ − ̅( " + '" (" − ̅( "+…+', (, − ̅( "]
=.$ ($ − ̅( " + " (" − ̅( "+…+., (, − ̅( " Trong đó: '/, / tần số, tần suất giá trị (/
(14)*Trường hợp bảng phân bố tần số, tần suất ghép lớp
!" = $
% ['$ ($ − ̅+
" + '
" (" − ̅+ "+…+'- (- − ̅+ "]
=/$ ($ − ̅+ " + /" (" − ̅+ "+…+/- (- − ̅+ "
Trong đó: (0 '0, /0 giá trị đại diện, tần số, tần suất lớp thứ i, n là số liệu thống kê (n = '$ + '"+ …+'-) ̅+ số TBC số liệu cho
c) Cơng thức tính độ lệch chuẩn
(15)Năng suất lúa (tạ/ha) Tần số Tần suất (%)
25 12,9%
30 22,6%
35 29,0%
40 19,4%
45 16,1%
Cộng 31 100 (%)
Ví dụ 1: Tính phương sai !" độ lệch chuẩn ! số liệu thống kê bảng SGK T111
!"= #("%&'%,")*+,('-&'%,")*+.('%&'%,")*+/(#-&'%,")*+%(#%&'%,")*
'0 ≈ 39,5
!"= 0", ("%&'%,")*+"",/.('-&'%,")*+" ('%&'%,")*+0.,#.(#-&'%,")*+0/,0(#%&'%,")*
0 ≈ 39,5
Bảng 2
d) Bài tập áp dụng
!" =
7[90 :0 − ̅: " + 9" :" − ̅: " +…+ 9> :> − ̅: "] =@0 :0 − ̅: " + @" :" − ̅: " +…+
(16)5 Số trung bình cộng
a) Sử dụng số liệu từ bảng phân bố tần số, tần suất: ̅" = $%"% + $'"'+ +$)")
$ = *%"% + *'"'+ +*)")
Trong $+; *+ tần số, tần suất giá trị "+; $ số số liệu thống kê
($ = $%+$' + ⋯ + $))
Ví dụ 1: Tính số trung bình cộng từ bảng Năng suất lúa
(tạ/ha) Tần số Tần suất (%)
25 12,9%
30 22,6%
35 29,0%
40 19,4%
45 16,1%
Cộng 31 100 (%)
Bảng 2
̅" = 4.25 + 7.30 + 9.35 + 6.40 + 5.45
31 ≈ 35,2
̅" = 12,9.25 + 22,6.30 + 29.35 + 19,4.40 + 16,1.45
(17)Ví dụ 2: Tính phương sai !" độ lệch chuẩn ! số liệu thống kê bảng SGK T112 Lớp số đo chiều cao (cm) Tần số Tần suất (%)
[150;156) 16,7 [156;162) 12 33,3 [162;168) 13 36,1 [168;174) 13,9
Cộng 36 100 (%) Bảng 4
!"= #(%&'(%#")*+%"(%&,(%#")*+%'(%#&(%#")*+&(%-%(%#")*
'# ≈ 31
!"= %#,-.(%&'(%#")*+'','.(%&,(%#")*+'#,%.(%#&(%#")*+%',,.(%-%(%#")*
%33 ≈ 31
!" = %
5[7% 8% − ̅; " + 7" 8" − ̅; " +…+ 7= 8= − ̅; "] = ?% 8% − ̅; " + ?" 8" − ̅; " +…+
(18)b) Sử dụng số liệu từ bảng phân bố tần số tần suất ghép lớp ̅" = $%&% + $(&(+ +$*&*
$ = +%&% + +(&(+ ++*&*
Trong &,; $,; +, giá trị đại diện, tần số, tần suất lớp thứ ; $ số số liệu thống kê ($ = $%+$( + ⋯ + $*)
Ví dụ 2: Tính chiều cao trung bình 36 học sinh Lớp số đo chiều cao
(cm) Tần số Tần suất (%)
[150;156) 16,7
[156;162) 12 33,3
[162;168) 13 36,1
[168;174) 13,9
Cộng 36 100 (%)
Bảng 4
̅" = 6.153 + 12.159 + 13.165 + 5.171
36 ≈ 162
̅" = 16,7.153 + 33,3.159 + 36,1.165 + 13,9.171
(19)3 Ý nghĩa
q Khi hai dãy số liệu thống kê có đơn vị đo có số trung bình cộng xấp xỉ việc đánh giá hai nhóm dựa vào phương sai độ lệch chuẩn
(20)(21)