Bài giảng Lý thuyết Xác suất - Thống kê
PHAN II THONG KÊ TỐN CHUONG III
LY THUYET MAU
§1 CAC KHAI NIEM CO BAN
I Khái niêm về phương pháp mẫu
Trong thực tế ta cần nghiên cứu một dấu hiệu X nào đó trên một tập hợp © có số
lượng lớn các phân tử |
Đề nghiên cứu tập hợp các phân tử này đôi khi người ta sử dụng phương pháp nghiên cứu toàn bộ, tức là thống kê toàn bộ tập hợp đó và phân tích từng phản tử theo
dấu hiệu nghiên cứu
Ví du dé nghiên cứu dân số của một nước theo các dấu hiệu như tuổi tác, trình độ văn hóa, cơ cầu nghề nghiệp ta có thể tiến hành tông điều tra dân số và phân tích từng người theo các dấu hiệu trên, từ đó tổng hợp thành dấu hiệu chung cho toàn bộ
dân số nước đó
Tuy nhiên trong thực tế chúng ta không thể quan sát tất cả các phân tử của tập hợp
vì nhiêu lí do như: |
- Tén kém vé kinh phí, mất nhiều thời gian và công sức
-_ Khi quy mô của tập hợp nghiên cứu lớn có thể xảy ra các trường hợp tính trùng hoặc bỏ sót dẫn đến hạn chế về độ chính xác của kết quả phân tích
-_ lrong các trường hợp kích thước của tập hợp nghiên cứu là vô hạn hoặc không năm bắt được thì không thê nghiên cứu toàn bộ được
- Một hạn chế lớn của phương pháp này là rất nhiều trường hợp khi ta nghiên
cứu một phân tử sẽ phá huỷ luôn phần tử đó
Ví dụ khi nghiên cứu chất lượng một loại sữa hộp, ta phải phá toàn bộ các hộp đó
để nghiên cứu thì nghiên cứu xong tất cả bị phá huỷ hoàn toan
Vì vậy phương pháp nghiên cứu toàn bộ thường chỉ áp dụng đối với các tập hợp có quy mô nhỏ, còn chủ yếu người ta áp dụng phương pháp nghiên cứu khơng tồn bộ,
đặc biệt là phương pháp nghiên cứu chọn mẫu
Phương pháp này chủ trương từ tập hợp cân nghiên cứu chọn ra một số phần tử (gọi là mẫu), phân tích các phân tử nảy và dựa vào đó mà suy ra các kết luận về tập
Trang 4Bài giảng Lý thuyết Xác suất - Thống kê
hợp cân nghiên cứu Nêu mẫu được chọn ra một cách ngâu nhiên và xử lí băng các
phương pháp xác suât thì vừa suy được các kết luận một cách nhanh chóng, đỡ tốn kém
mà vân đảm bảo độ chính xác cân thiết
Trong thống kê toán ta sẽ sử dụng phương pháp này đề nghiên cứu tông thê
II Tổng thể
l1 Định nghĩa
Tổng thể (hay đám đông hay tập hợp chính) là tập hợp tất cả các phần tử (đối
tượng) mà ta nghiên cứu > X: dau đu tcuất
Mỗi đối tượng của tong thé duoc gọi là một phần tử của tổng thể và số lượng các phân tử của tông thê được gọi là kích thước của tông thể, kí hiệu là N
Ví dụ khi nghiên cứu chiều cao trung bình của thanh niên Việt Nam Ứng với mỗi người fa ghi lại chiêu cao của họ Tập hop tat ca cdc thanh niên Việt Nam là tông thê Mỗi thanh niên đó được gọi là một phân tử
2 Các tham số của tổng thể
Khi nghiên cứu tổng thể (đám đông) ta không nghiên cứu trực tiếp tổng thể đó mà
thông qua một hay nhiêu dấu hiệu đặc trưng của tông thể, ta thường quan tâm hai mặt:
lượng và chất
+ Vệ lượng, ta thường đánh giá về trung bình và phương sai Chăng hạn như điểm trung bình, thời gian trung bình đi đến trường và độ ổn định
+ Về chất, thường ta quan tâm đến tỉ lệ (hay xác suất) các phân tử có tính chất A nào đó Ví dụ như tỉ lệ học sinh giỏi, tỉ lệ phế phẩm
Giả sử tông thể có kích thước N và dấu hiệu nghiên cứu X nhận các giá trị khác nhau: XỊ, Xạ, , Xạ a Trung bình tổng thể N Trung bình tông thê kí hiệu là m được tính bởi: m = xÀ* i=]
Nêu trong tông thể dâu hiệu nghiên cứu X nhận các giá trị khác nhau: x¡, xX, ., X; có các tân sô tương ứng Nụ, No, ., N, voi Nj+ No + +N, =N thi
l k
m = nz xN,
Trang 5
Bài giảng Lý thuyết Xác suất - Thống kê
b Phương sai của tông thé
N
Phương sai tông thê kí hiệ(ơ Mược tính bởi: ø” = Nà, —m) i=] |
Nêu trong tông thé dâu hiệu nghiên cứu X nhận các giá trị khác nhau: XỊ, Xạ, , XE có các tân sô tương ứng Nị,N¿, , Nụ với N+ N;+ +N,=N thì k k ơ "NỀN (nN? af i=l c Tan suất cha tong thé Xét một dấu hiệu A của tông thể, tần suất xuất hiện dấu hiệu A của tong thé, ki hiệu p được tính bởi: _M PON
với M là sô các phân tử có dâu hiệu A
§2 MÂU NGẤU NHIÊN
Vì phải căn cứ vào mẫu để nghiên cứu tông thể nên mẫu phải được lây hoàn toàn
ngau nhiên đề có thé dai điện cho tổng thé Dé dam bảo tính đại diện của mẫu và tiện
cho việc mô hình hóa, mẫu được tạo lập với các giả thiết sau
- _ Lấy lần lượt từng phần tử vào mẫu
- - Mỗi phân tử được lấy vào mẫu một cách hoàn toàn ngẫu nhiên
- _ Các nhân tử được lấy vào mẫu-theo:phương thức :hoàn lại, nghĩa là lay ngẫu nhiên l phần tử từ tổng thể và khảo sát nó Sau khi quan sát trả phần tử đó lại tông thê trước khi lấy phần tử khác
Khi số phân tử N của tổng thể khá lớn, kích thước mẫu n không đáng kể so với N thì có
thể coi hai loại mẫu có hoàn lại và khơng hồn lại là không khác nhau I Định nghĩa
1 Mẫu ngẫu nhiên
Một mẫu ngẫu nhiên cỡ n cho dấu hiệu X của tong thé, ki hiéu (XI, X¿, , Xa) là
một nhóm n biến ngẫu nhiên X:, Xạ, , Xạ độc lập và có cùng phân phối với X
Trang 6
Bài giảng Lý thuyết Xác suất - Thống kê
Suy ra: E(X:) = E(X,) = = E(X,) = E(X) = m
D (X,) = D(X,) = = D(X,) = D(X) = o’ 2 Mau cu the
Gia sir X, nhan giá trị xạ, X; nhận gia tri xo, ., X, nhan gia tri x, thi (x), xX), ., X,) gọi là một mâu cụ thê
Như vậy mẫu ngẫu nhiên là tập hợp của n biến ngẫu nhiên còn mẫu cụ thể là tập hợp
của n giá trị cụ thê quan sát được khi thực hiện một phép thử đôi với mẫu ngẫu nhiên
II.Các phương pháp chọn mẫu 1 Chọn ngẫu nhiên
Từ tông thê ta đánh số các phân tử từ 1 đến N Nếu muốn có một mẫu n thì sẽ rút thăm lấy cho đủ n phần tử Với cách chọn này các phân tử trong tổng thể đều có khả
năng rơi vào mẫu như nhau
2 Chọn hệ thông
Các phan tử của tong thé được đưa vào mẫu theo một khoảng cách nhất định Cách chọn này hay mắc phải sai số hệ thống khi các phần tử đã được sắp xếp theo một
hệ thống nào đó |
3 Chon phân tô
Chia tông thể thành từng tổ theo một chỉ tiêu phụ nào đó rôi từ mỗi tổ chọn ngẫu
nhiên một số phần tử vào mẫu
Ví dụ: Một lớp học có 60 sinh viên, cần chọn ngau nhiên 10 sinh viên, sau đầy là các cách chọn khác nhau:
- _ Đánh số thứ tự 60 sinh viên của lớp, rồi rút thăm cho đủ 10 sinh viên Đáy Ia
cách chọn ngẫu nhiên
- Căn cứ vào danh sách của lớp học, chọn sinh viên đứng đầu danh sách, tiếp
theo chọn các sinh viên còn lại theo khoảng cách 6 sinh viên chọn một, như vậy ta cũng có 10 sinh viên Đây là cách chọn hệ thống
- _ Chia 60 sinh viên thành hai nhóm theo giới tính: nam và nữ Từ mỗi nhóm này
chọn ra 5 sinh viên Đáy là cách chọn phân tổ
Trang 7
Bài giảng Lý thuyết Xác suất - Thống kê III Các phương pháp mô tả số liệu mẫu 1 Bảng phân phối tần số thực nghiệm Là bảng có dạng: X; | XỊ Xạ X¡ Xị Dị | N)n2 n; ny với n; là tân số xuât hiện của giá trị x;, X;,<X,j< <X < X Và >, =n 1=] 2
Vi du: Diéu tra nang suat lao động của 30 công nhân sản xuất một loại sản phẩm của nha máy A thu được sô liệu vê số sản phẩm trong một ca làm việc như sau: 10121215131414121213 121013159 1314139 15 13149 13141513121013 Ta có bảng phân phối thực nghiệm sau: x: | 9 10 12 13 14 15 nị | 3 3 69 5 4
2 Bang phân phối ghép lớp
Trong thực tế, đôi khi ta gặp số liệu cho bởi các lớp h¡ = (a; ; b;) (tức là những giá trị
gần nhau ta nhóm vào một lớp) Khi đó ta bảng phân phối ghép lớp:
(ay, bị) (ao, bạ) ý (a,, bx) Dị | Dị Dạ wee Dự Xj Khi đó ta đưa về bảng phân phôi thực nghiệm bằng cách thay mỗi khoảng băng các ¬ ¬ a.+b,
gia tri dai dién, nghia la x; = —_—1
Chú ý: Độ rộng h, của các khoảng không nhất thiết phải bằng nhau, nhưng thông thường người ta lấy các khoảng có độ rộng (h) băng nhau dé dé so sánh
Trang 8Bai gidng Ly thuyét Xac suat — Théng kê
Chiéu cao (m) | 1,525 1,575 1,625 1,675
Sô họcsinh | 4 27 23 12
IV Các tham số đặc trưng của mẫu ngẫu nhiên
Giả sử từ biến ngẫu nhiên gốc X trong tông thể lập mẫu ngẫu nhiên kích thước n:
(X: Xa, .9 An)
1 Trung bình mẫu (X)
=> Ie l
=—}È» EX, = ld aX, X =— 1=] >S
Néu mau ngau nhiên (%;, X¿, , Xa) nhận các gia tri cu thể (X, Xa, ., Xạ) thì trung bình mâu cũng nhận giá trị cụ thê x: _ 12 l k x= 2K = ng TẾ Tính chất Néu X c6 E(X) = m va D(X) = o° thi E(X) =m, D(X) == H
Trang 9Bài giảng Lý thuyết Xác suất - Thống kê Ta có: XÃ n—|
Néu mau ngau nhién (X,, Xo, , X,) nhận các giá tn cụ thê (Xi, Xa, , Xạ) thi
phương sai mẫu nhận giá trị cụ thể s”:
Trang 10Bài giảng Lý thuyết Xác suất - Thống kê
b Giả sử heo có trọng lượng >3§kg là heo đạt tiêu chuẩn Hãy tính tỉ lệ heo đạt tiêu
At | 1a ¿
chuẩn của mẫu trén (ds: [~82,22%) ˆ Te
Ví dụ: Nghiên cứu trọng lượng của một giống vịt mới ta có kết qua:
Cân nặng x, (kg) | 1,25 1,5 1,75 2 2,25 2,5 2,75 3
Sôconn | 2 6 24 35 39 24 =~ 14
Tinh x, s° (ds:x = 2,185; s° =0,151)
V Luat phan phoi xác suất của các đặc trưng của mẫu
Cho (X:,X; ,Xạ) là một mẫu ngẫu nhiên cỡ n của dâu hiệu X Ta chấp nhận các kết quả sau:
1 Phân phối của tỉ lệ mẫu
Khi n kha Ion, ta co f, IG H) Do đó biến ngẫu nhiên uy = azn _ N(0,1) J P(- p) 2 Phân phối của trung bình mẫu _— 2 a.Nếu X ~ Nứn,ơˆ) thì X ~ {m= nén H (X —m)Vn _(n- =) Oo U =~ (0,1) 5 7 ~ y*(n-I) T= = Khi n khá lớn thì phân phối Student hội tụ khá nhanh về phân phối chuẩn, do đó với n > 30 ta có thể xem 7 ~ f(w—]) b Nếu X có phân phối xác suất nào đó, không phải phân phối chuẩn thì (X-m)jn _(X-m)n a sé phan phéi xap xi chuan tắc khi n khá lớn U=
_ Như vậy khi n > 30 thì có thể bỏ qua giả thiết X tuân theo luật chuẩn
3 Phân phối của phương sai mẫu
Giả sử dấu hiệu X có luật phân phối là X ~ Nữn,ơ”) và (X¡,X;, ,X,) là một
mâu ngâu nhiên cỡ n
Trang 11Bài giảng Lý thuyết Xác suất — Thống kê -Œ—® ~zœw-D BÀI TẠP 1 Điêu tra doanh số hàng tháng của 100 hộ kinh doanh một ngành hàng ta thu được số liệu sau: Doanh số (triệu đồng) | 10, 10,2 10,4 10,5 10,7 10,8 109 110 113 11,4 Số hộ 2 3 8 13 25 20 2 18 6 2 ~ `) 6 “2 ’ 7 y 3 A A 4A A ~ | el CF A 6 <
Tính các đặc trưng của bộ sô liệu trên x X›.‡22 ; Oo: Ô,0đJ/9, she Ord 2 Đo chiều cao của 100 thanh niên từ 18 đến 22 tuôi ở tỉnh A thu được bảng số liệu
Tie Bang bink at sau: ee Chiéu cao (cm) | 154-158 158-162 162 _166 166-170 170-174 174- 178 178-182 Số người | 10 4 26 28 12 8 2 Tính trung bình, phương sai, phương sai mẫu hiệu chỉnh của bộ số liệu trên n=400, 7 %>=O GPS AX ot 54,9
3 Trong mot ki thi trac nghiém Tiéng Anh với thang điểm là 100, người ta tính điểm của 60 thí sinh và thu được bảng sau:
Điểm hos 235 29,5-39,5 39,5-49,5 49,-59,5 59,5-69,5 69,5-79,5 79,5-89.5
Số thí sinh | § 16 8 13 1] 5 2
Trang 12Bài giảng Lý thuyết Xác suất - Thống kê
5 Tai một trại nuôi lợn, người ta áp dụng thử một loại thuốc tăng trọng bô sung vào khâu phan thức ăn của lợn Sau 3 tháng thu được kết qua sau: 65 67 68 69 70 7] 73 Trọng lượng (kg) Số lợn | 3 4 7 6 2 2 x - WAG on oe
Tỉnh trọng lượng trung bình của mẫu lợn trên và mức độ phân tán của trọng lượng
so với trọng lượng trung bình của mẫu lợn trên
6 Điêu tra năng suât lúa của một vùng thu được số liệu sau: Nang suat (ta/ha) 10-15 15-20 20 — 25 25 — 30 30-35 Số thửa ruộng 2 4 8 4 2 ~~ — 1 tr \
Tính trung binh, phuong sai ¥ = <2) Cz of
7 Số liệu thong kê về doanh số bán hàng của một siêu thị trong một ngày được cho bởi bảng sau:
2oanhsỐ | có ngày Doanh so Số ngày
(triệu đồng/ngày) (triệu đông/ngày) 30 — 35 13 MH 55 — 60 32 35 — 40 15 60 - 65 28 40 - 45 25 65 — 70 12 45 — 50 28 70 — 75 4 50 — 55 35 75 — 80 8
Những ngày có doanh số bán từ 65 triệu đông trở lên là những ngày “bán đắt”
a Tính x, s” của bộ số liệu trên x - S6 9Š; Tội 125/1 b Tính tỉ lệ của những ngày bán đắt 4, : Ó^ c Tính doanh số trung bình của những ngày bán đắt và phương sai mẫu hiệu chỉnh ¬1 ’ + £ Tr “ { 4 ` ỹ của nó * : + ¬ s12A CHƯƠNG IV
ƯỚC LƯỢNG THAM SỐ
- _ Ước lượng là phỏng đoán giá trị chưa biết dựa vào quan sát
- _ Có hai hình thức ước lượng đó là:
Trang 13
Bài giảng Lý thuyết Xác suất — Thống kê
+ Ước lượng điểm: giá trị ước lượng cho bởi một số cụ thể Chăng hạn, người đó
cao khoảng l,65m
+ Ước lượng khoảng: giá trị ước lượng cho bởi một khoảng (a; b)
Định nghĩa
Đại lượng ngẫu nhiên X của tông thể có quy luật phân phối xác suất đã biết nhưng chưa biệt một tham sơƠ nào đó của nó Bài toán xác định giá trị gần dung cua® duoc gọi là bài toán ước lượng tham số 0
Lây mẫu ngẫu nhiên kích thước n: (X¡, X¿, , Xạ) Đề tìm ước lượng của tham số
0, ta xây dựng hàm 6” = f(X), Xp, ., Xq)
Hàm 6` gọi là một thống kê Vì Xị, Xạ, ., Xạ là những đại lượng ngẫu nhiên nên
0ˆ là một đại lượng ngẫu nhiên có quy luật phân phối xác suất nào đó
Khi mẫu ngẫu nhiên X;, X;, , X; nhận một giá trị cụ thể (XI, X;, , Xạ) thì 0” nhận một giá trị cu thé 9" = (XI, Xạ, , Xa)
Nếu dùng giá trị cụ thể này làm ước lượng cho tham số 6 cần tìm thì 6” được gọi là ước lượng điểm của 6 và bài toán này gọi là bài toán tìm ước lượng điểm
Nếu từ quy luật phân phối xác suất của 6” tìm được các số 0, và 0; sao cho voi xac suất y cho trước, ta có: P( 0, <8< 0.) = y thì khoảng (6); 6)) chứa 8 được gọi là khoảng ước lượng của tham số 6 với độ tin cậy y và bài toán này gọi là bài toán fìm ước lượng khoảng
§1 UOC LUONG DIEM
â gọi là ước lượng điểm của tham số a chưa biết nếu ta coi nhu a = 4
I Uớc lượng không chệch
1 Định nghĩa
6” được gọi là ước lượng không chéch của tham số 9 nếu E(6”) = 9 Ngược lại gol là ước lượng chệch
Ví dụ: Cho dẫu hiệu X ~ N(m, ø'), giả sử (X\, ., Xạ) là một mẫu ngẫu nhiên cho dấu hiệu X Ta sẽ chứng minh răng 2 thống kê T; và T; đều là các ước lượng không chệch
Trang 14Bài giảng Lý thuyết Xác suất — Thống kê
Thật vậy, do định nghĩa mẫu ta có: Xị, Xạ, Xạ độc lập và có phân phối là N(m,o’) Tir dé c6 E(X,) = = E(X,) =m va D(X))= = (X,) = 0" Nén E(T;) = e(~ : 2 | =F EK )+ E(X ))=+(m+m)=m 2 2212 | Tương tự, E(T;) = m
Ca T, va T; đều là ước lượng không chệch cho m, muốn biết dùng thống kê nào tốt hơn, ta xét tiếp đến phương sai của chúng: Thống kê nào có phương sai nhỏ hơn là thống kê tốt hơn
X,+X 1 Al 4 2
D(T,) = p{ 2X2 = OX, +DX;)=~(øỶ +ơ?)= >
Tuong ty D(T,) = =
Vậy nêu dùng thống kê T; thì tốt hơn Tị
Điêu này cũng có nghĩa là nếu quan sát càng nhiêu thì ước lượng càng tốt
2 Định lí
a Trung bình mâu X là ước lượng không chệch cho trung binh m của đảm đông — 'bÐb, Phương sai mâu hiệu chỉnh S“ là ước lượng không chệch cho phương sai ơˆ của
dam dong
c Tỉ lệ mâu ƒ, là ước lượng không chệch cho tỉ lệ p cua dam dong Điêu này có nghĩa: |
- Nếu chưa biết trung bình m thì có thể dùng X đề ước lượng cho nó
- Nếu chưa biết phương sai ø” của đám đông ta có thể dùng S?(hay ơ?.,) để ước
lượng cho nó
- Nếu chưa biết tỉ lệ p của đám đông ta dùng f, (hay f) đề ước lượng cho nó
Trang 15Bài giảng Lý thuyết Xác suất - Thống kê
b Phương sai mẫu hiệu chỉnh S°” là ước lượng hiệu quả cho phương sai ơˆ của đảm đông c Tỉ lệ mẫu f, la ước lượng hiệu quả cho tỉ lệ p các phân tử có tính chất A4 của dam dong Nghĩa là trong thực hành, người ta thường dùng: e X dé du doan m e S’dé du doan o” e f, dé du doan p |
Ví du: Với bộ số liệu trong ví dụ 5 của chương III, nếu yêu cầu đự đoán trọng lượng trung bình của heo 3 tháng tuổi cùng với phương sai của nó và dự đoán tỉ lệ heo đạt tiêu chuẩn thì ta trả lời như sau:
Dự đoán trọng lượng trung bình của heo 3 tháng tuôi là 40,96kg với phương sai
dự đoán là 9,73 (kg')
Dự đoán tỉ lệ heo đạt tiêu chuẩn là §2 22%
Ví du: Nghiên cứu trọng lượng của một giống vịt mới ta có kết quả:
Cân nặng (kg) | 1,25 1,5 1,75 2 2,25 2,5 2,75 3
Sscon | 2 6 24 35 39 24 14 6
a Hãy ước lượng không chệch trọng lượng trung bình của giống vịt mới và
phương sai của trọng lượng đó (ấšs: 2,/85;0,/57) x- 4,42tŠ
b Giả sử vịt có trọng lượng dưới 1,6 kg là loại II Hãy ước lượng hiệu quả tỉ lệ vịt loại II (&s: 5,33%.)
II Uớc lượng vững
I Đỉnh nghĩa
Ta nói thống kê T là một ước lượng vững của tham số 6 nếu như T “hầu chắc
chăn” hội tụ về 9, theo nghĩa xác suất đẻ T lệch khỏi 0 bằng 0 Người ta gọi sự hội tụ
này là hội tụ theo nghĩa xác suất
2 Tính chất
a Trung bình mẫu X là ước lượng vững cho trung bình m của đám đông
b Phương sai mẫu hiệu chỉnh S” là ước lượng vững cho phương sai ở) của đám
dong
Trang 16
Bài giảng Lý thuyết Xác suất - Thống kê
c Tỉ lệ mẫu ƒ, là ước lượng vững cho tỉ lệ p các phần tử có tính chất A của đám dong
Trang 17
Bai giang Ly thuyét Xac suat — Théng kê
§2 UOC LUOQNG KHOANG
I Cac khai niém Dinh nghia
Khoảng (Ø;; 62) gọi là khoảng ước lượng của tham số 6 ở độ tin cậy y= 1 - œ nêu như P(Đ› <8<6Ø;)=+y
Bài toán ước lượng khoảng cho tham số Ô chưa biết với độ tin cậy l —œ là bài toán tìm khoảng ngẫu nhiên (Ô;; Ð;) sao cho xác suất đề tham số thuộc khoảng đó băng độ tin cậy
Nếu khoảng tin cậy có dạng (—œ, 6, ) gọi là khoảng tin cậy tối đa Nếu khoảng tin cậy có dạng (Ø,,œ©) gọi là khoảng tin cậy tối thiếu
Nếu khoảng tin cậy co dang (Ôi; 0,) với 6), 9; hữu hạn gọi là khoảng tin cậy hai phía 9;— Ð; gọi là độ dài của khoảng tin cậy
E 2 thường được coi như là sai số (hay độ chính xác) của khoảng ước lượng Thường ta xét độ tin cậy y khá lớn: 90%, 95%, 99%, .: và thường dùng khoảng tin cậy đối xứng, nghĩa là 0—-e<0<06+e Khi đó sai số (hay độ chính xác) của khoảng
ước lượng là e = `
H Bài toán ước lượng khoảng tin cây của các tham số thường cặp
1 Bài toán ước lượng tỉ lệ p của đám đông
Giả sử trong tổng thể có kích thước N, trong đó có M phân tử mang dau hiéu A Ti
A A ^ A tA A A 1 M tA A ’ ` ’ A A
lệ phân tử mang dâu hiệu A trong tông thê là p = N chưa biệt (đây chính là xác suat dé lây ngẫu nhiên từ tông thể một phần tử thì phân tử đó mang dấu hiệu 2 )
Bài toán đặt ra là phải ước lượng tham số p này căn cứ trên một mẫu điều tra
Trang 18Bài giảng Lý thuyết Xác suất — Théng ké oe Khi đó ta có: P(|f, evn Dat: 1= ——, 2.¿(u) =Y vPq
Trong đó $(u) là hàm tích phan Laplace: o(u) =
p|<e)=2 (Sê)- 2o(u)=y Khi n khá lớn thì pq ~ f,(1—f, ) và từ đây ta có : ta có | P(|f, e Khoang tin cay hai phia la: (f, — ¢; f, + €) f (-f,) trong do: e=U, J?0=) n với u,„ tìm trong bảng phân phối N(0,1) sao cho: Hu.) _l-a 5 = 5
n là cỡ mẫu, f, là tỉ lệ các phần tử có tính chất A của mẫu
© Khoảng tin cậy tối đa là (—œ; f, + e), trong đó: s= tac _ DJ) , VỚI U„„
tìm trong bảng phân phối N(0,1) sao cho $(0;„ ,n là cỡ mẫu,
> at f, la ti 1€ các phân tử có tính chất A của mẫu
e Khoảng tin cậy tối thiểu là (f, - €; 00), trong do: e=u,, lf,d- £,) f _ fi) „ tìm trong bảng phân phối N(0,1) sao cho $(u,„)= ,n là cỡ
mẫu, f là tỉ lệ các phân tử có tính chât.A của mẫu n
e Kich thước mẫu tối thiểu n đảm bảo độ tin cậy (1— ø ) cho trước và độ chính
xác không vượt quá giá trị £ cho trước là
Trang 19
Bài giảng Lý thuyết Xác suát - Thống kê , ra wy + : ee 1 = " 1 ~ “ > tì c { ve _ - “~ ⁄ / “ “ 3 € f 7 + } ~ ‡
Ví dụ: Phỏng vân 400 người ở một khu vực thấy có 240 người ủng hộ dự luật A Với độ tin cậy 95%, hãy ước lượng tỉ lệ người ủng hộ dự luật A trong khu vực
(Đs: 55,2% đến 64,8%)
Ví dụ: Dé có thể ước lượng được số chim cánh cụt ở một vùng A, người ta làm như sau: Bắt 1000 con chim cánh cụt, đeo vòng vào chân và thả trở lại vùng đó Sau một thời gian, người ta bắt ngẫu nhiên lại 200 con và thay có 78 con có đeo vòng chân Dự đoán tỉ lệ chim có đeo vòng ở vùng A rồi suy ra số chim cánh cut cua vung do với độ
tn cậy 90% (Bs: (0,333; 0,447); (2238 con: 3004con) Jịn Ti Ỷ re a)
Ví dụ: Người ta muốn ước lượng VỚI độ tin cậy 95% cho ti lệ những gia đình CÓ máy giặt trên địa bàn Hà Nội với độ chính xác của ước lượng là 0, 04 Một mẫu điền tra so bé cho thay f, = 0,72 Hay xac dinh kich thuéc cua mau n (ds: n = 485) oy „4 ae cà Ví dụ: Kiểm tra ngẫu nhiên 130 sản phẩm của một kho hàng thấy có 23 phế phẩm Hãy ước lượng tỉ lệ phế phẩm của kho hàng trên với độ tin cậy 95% Nếu muốn độ chính xác đạt 3 VỚI 71 độ tin vây trên thì phải quan sát them it nhat B90 nhieu san pham 4 - H t1 ~ +
ĐÓ }9 wt
nita?(ds: 492) © Dag TENTS yg ST 1 TGP slate
Ví dụ: Tại một địa phương, kiểm tra 100 em bé thay có 60c em đã chích ngừa bại liệt a Với độ tin cậy 99%, hãy ước tức lượng tỉ ti lệ tre em trong do, tudi đã được MONI ngừa
- € 4 -
bai liét tai dia phuong (ds -(47,4%, 72 6%)” ¬ 51 J6 để fe tu c ¬ ^ ` 4 ĐA, Ai) ï j LỆ Lo 1é Di 6 b Với độ chính xác là 10%, hay xac dinh độ tin cay.(ds cs n4 Mà 0u) 0o ETS cố Ly 9126 95 6%
Trang 20Bài giảng Lý thuyét Xac sudt— Théng ké Ta co: H 2 2 (X,-m) =1,75; # + = # si =37,6525; y9) = y6 =14,6114 do đó i=] 1,75 , 1,75 ———<ơ < hay 0,0465 < øˆ < 0,1198 37,6526 14,6114 BAI TAP 1 Do luong huyét tuong cua 7 người mạnh khoẻ ta có: 2,86 3,37 276 2,62 3,49 305 3,12 Hãy xác định các đặc trưng mẫu xz 3,63 ; - A1 2 Đo độ dài của một loại trục xe, ta có kết quả:
Nhóm | 18,4-18,6 18,6-18,8 18,8-19 19-192 192-194 194-196 196-198
mn | | vy = {7,446 6 ( yo OG SN 22 4d 19 7 4
Hãy ước lượng độ dài trung bình và phương sai
3 Đo sức bên chịu lực của một loại ống công nghiệp người ta thu được bộ số liệu sau:
4500 6500 5200 4800 4900 5125 6200 5375
Từ kinh nghiệm nghề nghiệp người ta cũng biết rằng sức bền đó có phân phối chuẩn với độ lệch chuân o = 300 Hãy xây dựng khoảng tin cậy 95% cho sức bên trung bình
của loại Ống trên
4 Trước bầu cử Tổng Thông người ta phỏng vấn ngẫu nhiên 1800 cử tri thi thay 1180
người ủng hộ một ứng cử viên A vor a9 tin cay 95%, hoi cw tri do thu được tối thiểu
Ơi :Ì c2,
bao nhiêu phân trăm số phiếu bầu ? Qs 4d 0) a) 1 ` vi " nà 5 ead “4
5 Giả sử quan sát 200 người thấy có 24 người bị bệnh sốt rét Hãy ước lượng tỉ lệ bị bệnh sốt rét ở vùng A ở độ tin cậy y = 97% Nếu muốn sai số ước lượng không quá 3%
f ~ Ge ( & I,
ở độ tin | cay, Y, cư nh thì phải 1 quận sát ít nhất bao nhiêu người ?'; 5," 2h, ` mm ANH “| € 6 Biết tỉ lệ nảy tiềm của một loại hạt giống là 0,9 Với độ tin cậy 0,95 nếu ta muốn độ dài
khoảng tin cay | cua tỉ lệ „Bây T mâm không vượt quá 0,02 thì cần phải gieo ít nhất bao nhiêu hạt ? 1" 7 Ti Đi pe es ¬ = XS
“ T)Muốn biết trong một hô nước có bao nhiêu cá, người ta bắt lên 1000 con, đánh dấu xong lại thả xuống hồ Sau một thời gian, người ta bắt lên 200 con và thầy có 30 con cá có
Trang 21
Bài giảng Lý thuyết Xác suát - Thống kê
đánh dâu của lần bắt trước Dựa vào kết quả đó, hãy ước lượng sô cá trong hô với độ tin cay 95%
7 ˆg)pả có thể dự đoán được số lượng cò thường nghỉ tại vườn nhà mình, người chủ bắt 80 đem đeo khoen cho chúng rồi thả đi Sau một thời gian, ông bắt ngẫu nhiên được 120 con và thấy có 7 con có đeo vòng khoen Hãy dự đốn số cị g1úp ơng chủ vườn ở độ tin cậy 99%,
9 Sản lượng ngày của một phân xưởng là biến ngẫu nhiên tuân theo luật chuẩn Kết quả thống kê của 9 ngày cho ta 27 26 21 28 25 30 26 23 26 | Hãy xác định các khoảng tin cậy 90% cho sản lượng trung bình và cho phương sai tương ứng ? 10 Cân thử 100 quả trứng ta có bộ số liệu sau: Khối hrong(g) |32 33 34 35 36 37 38 39 40 Số quả | 2 " 15 30 8 =
~ ) CAY Pow Lind 4 we (2 ca ẫ ae
a Hãy ước lượng trọng My muh _ của các quả trứng ở độ tin cậy 90% -(át #5, %, b Trứng có khối lượng dưới 34g được coi là trứng loại II Tìm ƯỚC lượng khôn ne n3:
S, Le its
chệch cho tỉ lệ trứng loại II và khoả ng tin cay 95% của tỉ lệ đó Ke OA, 1 lồ: © 0
ok Ue ' 53 59//£3) ST o's
11 Mức hao phí nguyên liệu trung bì ch mot đơn vi san pham là biến ngau nhiên X phân phối theo quy luật chuẩn Để ước lượng mức độ phân tán của mức hao phí này người ta cân thử 28 sản phẩm và thu được kết qua sau:
Trang 22Bài giảng Lý thuyết Xác suất - Thống kê
CHUONG V
KIEM DINH GIA THUYET THONG KE §1 CAC KHAI NIEM
Trong thực tiên cuộc sông và xã hội, có nhiêu vân đê cân được nghiên cứu nhưng chưa biêt rõ, chăng hạn:
©
?
Đánh giá các sản phẩm của nhà máy sản xuất ra có đảm bảo kĩ thuật không? Năng suất trung bình của cây trông theo hai phương pháp có khác nhau không?
Kết quả điều trị lần trước có ảnh hưởng đến kết kết quả điều trị lần sau không?
Bằng cách quan sát thực tế từ các hiện tượng có thê nêu lên các giả thuyết về vấn đề cần quan tâm, nhưng bằng cách nào để biết giả thuyết đó đúng hay sai Vận dụng li
thuyết xác suất người ta đưa ra một số quy tắc để đánh giá giữa các kết quả kiểm tra
được qua thực nghiệm và mô hình lí thuyết mà chúng ta đã đặt giả định Đó chính là các quy tắc kiểm định thông kê Để thấy rõ nội dung của phương pháp này, ta xét một
số khái niệm sau 1 Giả thuyết thông kê
Giả thuyết thông kê là giả thuyết về dạng phân phối của ĐLNN, nếu phân phối này
được đặc trưng bởi các tham số u, ơ”, p, thì giả thuyết thống kê chính là giả thuyết về các tham số đó
Ví du Kiểm tra chất lượng sản phẩm của một xí nghiệp, Ban Giám đốc báo cáo tỉ lệ
sản phẩm xâu của xí nghiệp là 1% Bài toán đặt ra là ta bác bỏ hay chấp nhận báo cáo đó, nghĩa là chấp nhận hay bác bỏ giả thuyết:
Ho: p= 1%
P: tỉ lệ sản phẩm xấu của tổng thẻ
Hạ: được gọi là giả thuyết thông kê
Ví dụ Một địa phương báo cáo năng suất lúa tại địa phương là 3 tấn/mẫu Chấp nhận hay bác bỏ giả thuyết:
Ho: a = 3 tan/mau
a: nang suat lua
Họ: được gọi là giả thuyết thống kê
Trang 23Bài giảng Lý thuyét Xac sudt — Théng kê
Vi du So sánh chiêu cao trung bình của hai thế hệ cha-con (ở tuôi trưởng thành) Chấp nhận hay bác bỏ giả thuyết Hạ: chiều cao trung bình của hai thế hệ cha-con không thay đối
Ho: a; =a
a;: Chiéu cao trung bình của thế hệ cha a;: Chiều cao trung bình của thế hệ con
Giả thuyết thống kê đưa ra thường kí hiệu là Hạ (hoặc H) Khi đưa ra một giả thuyết thống kê, người ta còn nghiên cứu kèm theo nó một giả thuyết đối lập với nó, gọi là giả thuyết đối, kí hiệu là Họ (hoặc H) để khi giả thuyết H bị bác bỏ thì thừa nhận Ho: Khi đó Hạ và Họ tạo nên một cặp giả thuyết thông kê
Ví dụ Khi nghiên cứu kết quả thi một môn hoc nao đó (coi như một ĐLNN X) của SV trường Đại học Lao động - Xã hội ta có thể đưa ra các cặp giả thuyết thông kê sau:
a Hạ: Kết quả thi X tuân theo quy luật phân phối chuẩn Ho: Kết quả thi X không tuân theo quy luật phân phối chuẩn
b H: tỉ lệ sinh viên đạt điểm trên trung bình là p = 70%
H: p> 70: ; hoặc p < 70% ; hoặc p # 70%
Các giả thuyết thông kê có thê đúng hoặc sai, kiểm định thống kê là phải căn cứ vào mẫu để kết luận về một giả thuyết thống kê nào đó, xác định xem giả thuyết " là đúng
Gọ! là kiểm định thống kê vì chủng ta dựa trên thông tin thực nghiệm của mẫu để đưa ra kết luận và cũng chính vì vậy khi chấp nhận một giả thuyết nào đó có nghĩa là đối với mẫu thực nghiệm mà chúng ta có chưa có cơ sở để bác bỏ giả thuyết đó chứ không có nghìa là giả thuyết đó đúng và khi ta bác bỏ một giả thuyết nghĩa là ta chấp nhận một giả thuyết khác chứ không có nghĩa là giả thuyết bị bác bỏ là sai
2 Phương pháp kiểm định
- Trước hết ta đửa ra cặ b - Giả sử Họ đúng và từ đó xây đựng một tiêu chuẩn kiểm dink
- Dua vao cac sé liéu thu được, ta phai ra quyét dinh xem giả thuyết Hạ đúng hay
sai Tất nhiên, khi chấp nhận Hạ thì cũng có nghĩa là bác bỏ Họ và ngược lại 3 Các loại sai lâm có thể gặp khi kiểm đỉnh
Khi làm kiểm định, ta có thể mắc các sai lầm sau đây:
* Sai lâm loại I: Bác bỏ một giả thuyết đúng (Bác Họ khi Hạ đúng nghĩa là chấp nhận
H;) Sai lầm này được đặt trưng bởi xác suất: P(Bác bỏ Hạ/Hạ đúng)
Trang 24
Bài giảng Lý thuyết Xác suất - Thống kê
* Sai lam loại II: Chap nhận một giả thuyết sai (Nhận Hạ khi Hạ sai) Sai lâm này
được đặc trưng bởi xác suất: P(Chấp nhận Hạ/ Hạ sai) Kết luậ ene Chấp nhận H, Bác bỏ Hụ Thực tê
Họ đúng Kết luận đúng Sai lâm loại I Họ sai Sai lâm loại II Kết luận đúng
Ví dụ Ta có giả thuyết:
Hạ: “Ông A bị bệnh” (H¡: “Ơng A khơng bị bệnh”)
Khi đó, sai lâm loại 1 là kết luận của bác sĩ rằng: Ông A không bị bệnh trong khi
thực sự là ông A bị bệnh Còn sai lầm loại II đà kết luận: Ông A bị bệnh trong khi thực sự là ông A không bị bệnh
Trong ví dụ trên, ta thấy răng nếu Hạ: “ Ông A bị bệnh tiêu chảy cấp” thì sai lầm I
là rất tai hại vì khi đó do không phòng bị nên bệnh sẽ lây nhiễm ra cộng đồng (vì bệnh
này có khả năng lây nhiễm cao)
Ví du Ta có giả thuyết H: "Bệnh nhân A uống được thuốc B",
Sai lầm loại I: Đi tìm thuốc khác trong khi thực chất A uống được thuốc B
Sai lầm loại II: Cho bệnh nhân A uống thuốc B khi thực chất A không uống được thuốc B
Trong trường hợp này thì sai lầm loại II nghiêm trọng hơn vì có thê dẫn tới tử vong Ta thấy rằng sai lầm loại I và sai lầm loại II mâu thuẫn nhau, tức là với một mẫu kích thước n xác định thì không thể cùng một lúc giảm xác suất mắc sai lầm loại I và
sai lam loai II
Ví dụ Với giả thuyết Hạ: “Bệnh nhân A bị bệnh tiêu chảy cấp” Vì tính chất đặc biệt
nghiêm trọng của bệnh này nên ta có xu hướng sợ phạm phải sai lam I (tức muốn xác suất phạm sai lam I là bé nhất), từ đó sẽ xuất hiện xu hướng dễ đãi kết luận rằng trường
hợp này bị bệnh tiêu chảy cấp, nghĩa là dễ phạm phải sai lầm II (tức xác suất phạm sa!
lam II tăng lên)
4 Tiêu chuẩn kiểm đỉnh
Do khi kiểm định một gia thuyết, ta cần giảm thiểu tối đa xác suất phạm cả hai sai
lâm - đây là điều mà trong thực tế ta không thể làm được: khi xác suất phạm sai lầm loại I giảm thì xác suất phạm sai lâm loại II sẽ tăng và ngược lại
Trang 25
Bai giang Ly thuyét Xac suat — Théng ké
Vì thế người ta tìm các tiêu chuẩn kiểm định sao cho cực tiểu cả hai khả năng phạm sai lầm
Thường thì người ta áp dụng tiêu chuẩn:
Cho xác suất mặc sai lầm loại I nhỏ hơn một mức quy định œ cho trước và tìm miễn bác bỏ W„ sao cho khi mẫu (X), Xo, ., Xa) thuộc W thì xác suất mắc sai lầm loại H
nhỏ nhất
a: goi la mức ý nghĩa, được ân định khá nhỏ, thường là œ = 5%
Điều này có nghĩa là nguy cơ để bác bỏ Hạ khi Hạ đúng có xác suất nhỏ hơn hoặc bằng 5% Trong thực tế tuỳ theo từng trường hợp ta có thể lẫy œ ở mức 5%, 1%
Nguyên tắc chung của kiểm định giả thuyết thống kê là đựa trên nguyên lý xác suất nhỏ: Một sự kiện có xác suất khá bé thì có thể coi như nó không xảy ra khi thực hiện một phép thử tương ứng
Đề kiêm định giả thuyết Hạ, ta giả sử Họ đúng và xây dựng một thông kê T gs (gs = = quan sát) dùng để đo sự khác biệt giữa lý thuyết và thực tế Một cách hợp lý, nếu Tụ; càng lớn thì ta càng nghiêng về phía bác giả thuyết Hạ Tạ; lớn như thế nào là đủ sẽ dựa vào mức œ, còn khi Tạ; nhỏ thì ta chỉ kết luận răng chưa đủ điêu kiện để bác giả thuyết
Họ, đây sẽ là trường hợp mà ta cần quan sát thêm (trường hợp nghi ngờ)
§2 KIEM ĐỊNH THAM SỐ
I Kiểm định øiả thuyết về tỉ lệ của tông thể
1 Kiểm định giả thuyết về tỉ lệ p của tổng thé
Tổng thê có tỉ lệ p các phân tử có tính chất A chưa biết, dựa vào quan sát ta cần kiểm
định giả thuyết Hạ: p = pọ với đối thuyết Họ: p#pọ hoặc đối thuyết Họ: PPo (p>Po) ở mức ý nghĩa œ = l- y với số pọ đã cho
Ta đã biết U = J2—P)Ý”
pũÄ-p)
Ho, người ta xây dựng các miên bác bỏ như sau:
Trang 26Bài giảng Lý thuyết Xác suất — Thống kê NĐ;q~ pạ) e Ho: p> po thi miền bác bỏ là W, =JU = UV, EU», J Py (1— Py) © Ho: p< po thi mién bác bỏ là W -{u- Yaar y <-v,,|
Từ đó ta có các bài toán kiểm định sau: |_|
a Bài toán 1 (Kiểm định hai phía) “6 oo t
be Giả thuyết Hạ: p = po Đối thuyết Ho: P # po
by © O mic ý nghĩa œ, ta tìm được số tự, bang= t(1- a2 = Ua trong bang ham Laplace sao
cho @(u,)= oti 1- ay2) — y/2 =(1- ay 2 _¬ gee
Ðb œ Tính kiểm định: |t =—#^°9 os Py —P,) la,
n
b„ se Kết luận:
Nếu |kg|>-trs wạog thì ta báo @tá thuyết Hạ Khi đó, để kết luận tiếp ta dựa vào ước
lượng điểm như sau:
Nếu f;®g.thì kết ludn psi Nếu fx< pạ thì kết luận p< pp -
Nếu lui Sila bing thi ta chua du co so để bác giả thuyết Họ nên ta tạm chấp nhận Hạ trong trường hợp này
Vi du Một tòa báo thanh niên thông báo có 25% học sinh phô thông trung học là độc giả thường xuyên Một mẫu ngẫu nhiên gồm 200 học sinh được chọn cho thấy có 45 em đọc báo thường xuyên Kiểm định tính chính xác của thông báo trên ở mức ý nghĩa 0,05
(Ds: thông báo trên có thể đúng ở mức ý nghĩa 0,05)
b Bài toán 2 (Kiểm định 1 phía) “lo lade HE
e Gia thuyét Ho: p = po
Đối thuyết Ho: p > pọ (p < po)
Ta làm tương tự bài toán 1 với lưu ý là ở mức ý nghĩa a, ta tim: tra bang f1- 202 = U2a ba) = $ (Wyre ): Ss = A Ak
trong bang ham Laplace sao cho ° +
Trang 27
Bài giảng Lý thuyết Xác suát - Thống kê
1-2a 7
Và nếu t,.>trating (d6i với giả thuyết P > Po ;thì ta bác giả thuyết Hạ
$(u›„) = $(tc 2ay2) — y/2 =
Va néu tog <- tra bang (đối với gia thuyét p < Po thi ta bác giả thuyết Hạ
Ví du Tỉ lệ khách hàng sử dụng một loại sản phẩm A ở địa phương B là 60% Sau một chiến dịch quảng cáo người ta cho rằng tỉ lệ này đã tăng lên.{Phỏng van ngẫu nhiên 400 người thây có 250 người sử dụng loại sản phẩm đó Với mức y nghĩa 0,9“ hãy kết luận về ý kiến trên )5 wae Giai e Giả thuyết Hạ: p = 0,6 Đối thuyết Họ: p> 0,6 với p là tỉ lệ khách hàng sử dụng loại sản phâm A ở địa phương B ® Với œ= 0,05 ta có $(u;„) = = ¬ — = 0,45 - = tha bang = 1,64 (hoac chon tira bang = 1,65) 250 a 2 ` , f — p 400 ~0,6 e Tieu chuan kiém dinh: t,,= ——2—=0_ = = 1,021 P,(1—p,) — n 400 e© Kết luận:
VÌ tạ; < tựa bang nên ta chưa đủ cơ sở dé bac bỏ giả thuyết Hạ, nghĩa là ta chưa thể nó: _ tỉ lệ khách hàng mua sản phẩm A nói trên tại địa phương B đã thực sự tăng lên
2 Kiếm định giá thuyết về 2 tí lệ Dị; D; của tổng thể
Giả sử 2 tông thể có tỉ lệ các phân tử có tính chất A nào đó là pị, pạ chưa biết, dựa vào quan sát ta cần kiểm định giả thuyết Hạ: Pi= p2 voi déi thuyét Ho: DP: # p> hoặc đối thuyét Ho: Pi<Pp2 (Pi>p2 ) 6 mitc y nghia œ = ]— Y f —f Ta có U= -—2 ~> N(0,1) khi nị> 30 và n;>30 ro -fÍm*z] H, n, c— n,.f tnt m.+m „ —
với f=——] H, + Nn, °®“=——— n, + n, “nên với mức ý nghĩa œ tùy thuộc vào giả thuyết Họ,
người ta xây dựng các miễn bác bỏ như sau:
_——————
Trang 28Bai giảng Lý thuyết Xác suất - Thống kê e Họ:p¡;zp; thì miền bác bỏ là e Ho: Pp; >p thì miễn bác bỏ là W, =.U= Jn = Sn, U>u,,} miện e Ho: Dị <p; thì miền bác bỏ là W=\U=-—h=h ——_ 0< | —~, (1 ] L HH J
Do đó ta có các bài toán kiểm định sau:
a Bài toán 1 (Kiểm định 2 phía)
Trang 29Bài giảng Lý thuyết Xác suất - Thống kê
Néu |t,,| > tira bing thi ta bac gia thuyét Hy Khi do:
Néu tn, > tn, thi két ludn DI Pa Nếu th < tn thì kết luận Di< po
Néu ti ve S tra bang thi ta tam chap nhan gia thuyét Hạ '
Ví du Nghiên cứu về dự định đăng ký thi đại học về khối ngành kỹ thuật của học sinh
phô thông ở thành thị và nông thôn với câu hỏi: "Em có dự định thi vào đại học khối ngành kỹ thuật hay không ?", ta cé !:Ấ+ q›ả- Nơi điêu tra Số HS trả lời có | Số HS trả lời không Thành thị 240 346 300 Nông thôn 185 200
a Hãy so sánh tỉ lệ học sinh dự định thi đại học về khối ngành kỹ thuật ở thành thị và nông thôn với mức ý nghĩa 0,05
(Ds: tis =—1,1; ti lé hoc sinh dự định thi vào khối ngành kỹ thuật ở thành thị và nông thôn là như nhau)
b Có kết luận cho rằng tỉ lệ học sinh phỏ thông có dự định thi đại học khối ngành kỹ thuật là 50% Điều đó đúng không ? (cho kết luận với mức ý nghĩa 0,05)
(Ds: ts =-2,46, tỉ lệ học sinh phổ thông có dự định thi dai học khối ngành kỹ
thuật thấp hơn 50%)
b Bài toán 2 (Kiểm định 1 phía)
e Gia thuyét Ho: Pi = P2
Đối thuyết Ho: Pi > p2 (hoac p; < py)
Ta làm tương tự như bài toán 1 với lưu y la ta tim: trong bang ham Laplace sao cho
(2a) = O(ty-2eyn) = 2 = 1220
VA néu t,,>trabing (d6i voi gia thuyét p, > p, thì ta bác giả thuyết Hạ
Và nêu t,,<-thabing (d6i voi giả thuyết pị < p; thì ta bác giả thuyết Hạ
Vi du Công ty nước giải khát Côca —~ Côla đang nghiên cứu việc đưa vào một công
thức mới để cải tiến sản phẩm của mình Công thức cũ khi cho 500 người dùng thử thì
Trang 30
Bài giảng Lý thuyết Xác suất - Thống kê
có 120 người ưa thích nó, công thức mới khi cho 1000 người dùng thử thì có 300 người
ưa thích |
Hãy kiêm định xem công thức mới khi đưa vào có làm tăng tï lệ người ưa thích Côca - Côla không với mức ý nghĩa 2%?
Giải
Goi p, la ti 1é người ưa thích Côca — Côla theo công thức mới p› là tỉ lệ người ưa thích Côca — Côla theo công thức cũ Ta có: mì In f = 1= =043;f - 2= 2” - 0/24; " n, 1000 "2 n, 500 - m,+m ¬- 2 _ 300+120 - 28 n.+n, _1000+500 ` Ta có bài toán kiểm định giả thuyết: e Ho: pi = p2
Đối thuyết Ho: pị > p;
e Voi a = 2% = 0,02 tra bang ham Laplace ta dugc: , 1-2a 1-2.0,02 $(U2„) = — 2 2 =0,48 => tira bảng — 2q — 2,06 e Tiêu chuân kiểm định: f -f t = ny h2 — 0,3 —0, 24 ~ 2.44 qs F(1-F)} 241) [0,280 -0,28) jot n on 1 ˆ2 1000 500 e Kết luận:
Vì tạ; > tha bing nên ta bác giả thuyết Hạ, nghĩa là tỉ lệ người ưa thích Côca — Côla
theo công thức mới cao hơn công thức cũ
II Kiếm định giả thuyết về kì vọng toán của tông thể
1 Kiếm định giả thuyết về kì vọng toán m của tong thé
Giả sử nghiên cứu ĐLNN X của tổng thể, X ~ N(m, ø?) trong đó kì vọng toán E(X) = m chưa biệt nhưng có cơ sở đê so sánh nó với một con sô mạ cho trước ở mức ý nghĩa œ
Trang 31Bài giảng Lý thuyết Xác suát - Thống kê
Ta đã biết U - Ä =mn ~ N(0,1) va T - X-=m)jn ~ f(n —])nên với mức ý nghĩa Ø § œ tùy thuộc vào giả thuyết Họ và tùy thuộc vào phương sai ơ” đã biết hay chưa mà người ta xây dựng các miễn bác bỏ như sau:
¢ Ho: m+ mp thi miễn bác bỏ là
X- | og W, = lu = (X—m)h tị > | o° da biét va Oo
S
W, = 7 = (Xo mn 7 > 1" khi ø” khơng biết S
¢ Ho:m< my thi miên bác bỏ là
W, -{v= ams U< gh o° da biét va Ø W = i = (X=m)n < “2 o° khơng biết § e Ho:m >mạ thì miễn bác bỏ là lu _ (X —m, Vn Oo W - 6 ,Ù > o* da biét và
We = 7 = (X =m)jn „ > a ơˆ không biết S
Do đó ta có các bài toán kiểm định sau: 1 Bài toán 1 (Kiếm định hai phía) |
Dy eo Dat gia thuyét Hy: m = Mp Đối thuyết Ho :m z m,
Ta chia trường hợp tương tự như các trường hợp đã xét trong ước lượng khoảng cho trung bình Ở mức ý nghĩa œ, ta xác định tụ, bang Và tính tiêu chuẩn kiểm định tạ; như
Sau:
Trường hợp 1: n > 30, ơˆ đã biết
trong bang N(0,1) sao cho (t a * Chon tra bang =t )=(1-œ)/2 (l—a)/2 —œ)/2 Thạc sĩ VÕ HOÀNG + Thạc sĩ THANH HÀ ’ 82
bạ : Âụ MW oes a + bog `
(Qh uso, & chug bal !
Trang 32b; - đu “— (Ø2 +: Ø ) Ố Bài giảng Lý thuyết Xác suất - Thống kê X-m * Ít = qs S 0n Trường hợp 2: n > 30, øˆ chưa biết * tra bảng — DI —a)/2 qs S
Trường hợp 3: n < 30, øˆ đã biết: Ta làm như trường hợp 1
Trường hợp 4: n < 30, co’ chưa biết | trong bảng phân phối Student ở n -1 bac tur do — n * Chọn tira bang — Ly X-m * Ít = qs S 0 vn e Kết luận: Nếu |/„| > tra uang thì ta bác bỏ giả thuyết Họ Khi đó: Nếu X> mạ thì kết luận m > mạ Nếu X< mạ thì kết luận m< mạ
Nếu tae S tra bang thi ta tam chap nhan gia thuyét Ho
Ví dụ Quan sát thông số X của 36 phan tt, ta tinh duoc X ~ 2,576: s“~ 0,348 Hãy
so sánh thông số trung bình với 2,4 ở mức ý nghĩa 0,05
(Đs: ti * 1,79; tạm coi như thông số trung bình bằng 2,4)
Ví dụ Quan sát mức xăng hao phí (X) của 25 xe máy thuộc cùng một loại xe, chạy
Trang 33Bài giảng Lý thuyết Xác suất - Thống kê
Bài toá tam di í b, - tm Lp bs
2 Bài toán 2 (kiểm định 1 phía) ộ i | be Wh Q0, Ochi
e Gia thuyét Ho: m = mp Tay = Unda pn |
;— Amd 1g t
Đôi thuyét Ho :m > m, (hoặc m <m, ) ó tụ Ì: 7 hag F (c TH ˆ Làm tương tự như bài toán 1 với lưu ý là tìm:
tra bing “ Í 2/2 = Wo
trong bang ham Laplace sao cho:
(2a) = (1-2ay/2
trong các trường hợp 1, 2, 3 va tra bang = tr trong bang phan phối Student ở n -l bậc tự đo, mức 2œ cho trường hợp 4
Ngoài ra chú ý:
Nếu Ho:m >m, thì t,, > trabing thi ta bác bỏ giả thuyết Hụ,
Nếu Ho:m<m, thì t., <= trauing thì ta bác bỏ giả thuyết Hạ,
Ví du Tuôi thọ của một loại bóng đèn (X) là đại lượng ngẫu nhiên phân phối chuẩn với các tham số theo quy định là m = 2000 giờ và ơ = 36 giờ Nghi ngờ chất lượng của lô bóng mới bị giảm sút, người ta lây ngẫu nhiên 16 bóng đèn đề kiểm tra và tính úược tuổi thọ trung bình của chúng là 1975 giờ Với mức ý nghĩa œ = 0,01 hãy kiêm định điêu nghỉ ngờ trên
Giải Ta co bài toán kiếm định giả thuyết thống kê: e Giả thuyết Hạ: m = 2000
Đối thuyết Ho: m< m,
Trang 34Bai giang Ly thuyét Xac suat — Théng ké
Tu (1) va (2) ta cO tgs <- tra pang nên bác bỏ gia thuyết Hạ nghĩa là qua mẫu cụ thể này ta thây chất lượng của lô bóng mới bị giảm sút
2 Kiểm định giả thuyết về 2 kì vọng toán m¡, m; của tông thể
Trong thực tế ta thường gặp bài toán so sánh hai trung bình như: so sánh sự tăng trọng của hai loại gà, so sánh năng suất lao động do hai phương pháp kĩ thuật đưa lại
Khi đó để kiểm định người ta tiến hành lấy mẫu và so sánh 2 giá trị trung bình mẫu,
từ đó dựa vào tiêu chuẩn kiểm định kết luận thực chất 2 trung bình khác nhau hoặc giống nhau
Hai đám đông có trung bình mị và m; đối với dấu hiệu nào đó có 6 phân phối chuẩn và có cùng phương sai Lẫy hai mẫu ứng với hai đám đông, ta có X35 X12 5-005 X;,, ~N(m,, o) 2 2 va tinh duoc X s.X,, S5 X -X.)-(m -m Taco v=! 2) ( 2») N(0,) 2 1+ ny 2 X.-X.)-(m -m và T= (4) = %) 7 tm, =m) ~ t(n, +n, =2) (, - 1); +(, ~1) 2 _ 2 + NI +n, — 1 h, a PLA
nên tùy theo đối thuyết Ho: m,#m,(m, >m,,m, <m,) va tuy theo da biét Si và or
hay chưa mà ta có miễn bác bỏ tương ứng
Trang 35Bài giảng Lý thuyết Xác suát - Thống kê
,U <-u,, khi Ho:o <6, > 2 2 ` x, 2 0; _L+ A, — X, Ø n : U>u,, 2 2 > khi Ho : 0" > 0% b Nếu không biết of và ơ? thì (X, ~X,)-(m —”m.) (n —1) 3Ÿ +(n, —1).s; mạ +n, —2 | ] Nn, (X, -#,)- (m —?n, ) ] ny ») l |Z] > /(®+a~2) a (1, +n —-2) <1 = 2 2 pt Ho:ơ # Oy phi Ho:0°<o f —1).s? +(n, -1).s? n+n,-2 , W a (4 n, (X, - *,)~(m —,; ) i n, iT > pon tne -2) a = 2 2 +khi Ho:o > 0, (1, ~1).s? +(n, -1).s? i) | n+n, —2 n,
và từ đó ta có các bài toán sau:
1 Bài toán 1 (Kiểm định hai phía)
e Giả thuyết Hạ: mị = mạ Đối thuyết Ho : m, #m,
Trang 36bị : Wn dey
day : tae Cnet my 2) + L004 H Bi miy M2
diy) = AGA: bog F Co TH y |
2 (
x 50 J % Oy ù c6
Bài giảng Lý thuyết Xác suất - Thống kê
tra bang t(1-a)2 , bang ham Laplace qs oO Oo” wi 4 72 b ny A,
Trường hợp 2: n¡, n > 30; o va G; chưa biết
tira bang = t(1-cy2, bang ham Laplace c T E-) x pc hết
Trường hợp 3: n, n; < 30; Oo, va G; đã biết: Làm như trường hợp 1
Trường hợp 4: nị, n; < 30; ơ/ và ơ; chưa biết * Itra bang = intra?) tra bảng phân phối Student 6 n,+ n, -2 bac tu do mg <3) *ịt = h5 fy, 2 7 qs 2 \ 2 6' ch ) (n, -1).s; +(n, ~1).s, wi 6 2 n,+n, —2 n n, Wer * Kết luận: Nếu |t„| > trưng thì ta bác bỏ giả thuyết Họ Khi đó: Nêu X >X, thì kết luận my >mạ Nếu X, <X, thì kết luận mị < mạ
Néu |f,,| Stra bing thi ta tam chap nhận giả thuyết Họ, 2 Bài toán 2 ( kiểm định 1 phía)
Khi đối thuyết Họ : m,>m, (hay m,< m, ) thi chu y thay ta bang=ty)-20/2 trong
trong hop 1, 2, 3 và tira bang = n *":~2) trong trường hợp 4 với lưu ý là t, > tra bang thi
bác bỏ giả thuyết Hạ khi Họ : m, >m, va f,,<- tira bing thi bac bo gia thuyét Hy khi
Ho: m, <m,
Trang 37
Bài giảng Lý thuyết Xác sudt — Thống kê
Xí du Nghiên cứu trọng lượng trẻ sơ sinh của 2 nhóm với mẹ không nghiện thuốc lá và
nghiện thuốc lá, ta tính được:
n=Í5; X 3333; sị = 03707 và nạ =]14; X, =3,2029; s.,= 0.4927
Giả sử rằng trọng lượng trẻ của từng nhóm đều có phan phối chuẩn Với mức œ=0,05 hãy kiêm định gia thuyét trọng lượng trẻ sơ sinh của 2 nhóm như nhau?
Giải
Gọ: mị và m; lân lượt là trọng lượng trung bình của hai nhóm trẻ thu ›e nhóm mẹ nghiện hút và không nghiện hút
e T: cân kiểm định giả thuyết Hạ: m,= mạ
Vị n¡,n; < 30 và nh sai chưa biết nên trường hợp ta xét rol vao trường hợp 4 ° Cra bảng — hôm = =2 ,052 (1) ( 3/5933 — 3,2029 qs” —— Ha 1 1 = 2,42 (2) — + — 15+14-2 IS 14 e Tu (1) va (2) suy ra tos > tha bang -
Vậy ta bác giả thuyết Hạ Mà X,>X, nên ta kết luận trọng lượng trung bình trẻ sơ sinh của nhóm me không nghiên thuốc nặng hơn
III _Kiểm định giả thuyết về phương sai của tong thé Giả sử X ~ Nứn,ơ?) mà ơ? chưa biết
Ta cân kiểm định giả thuyết: Zf, :ơ? = ơ với ơa đã Piet
2_ (n- Hà
ọ
Lập mẫu ngẫu nhiên (X\, X¿, , X,) ta có % ~ #ˆ(n —]) nên tùy theo đối thuyết Ho như thế nào mà ta có miễn bác bỏ tương ứng
Khi Ho :ơ” z ơ2 thì miền bác bỏ W, = lz Pit <OL> z1
Khi Ho :ø” < on thi mién bac bé W, = ie = = (n=Ds" _ one)
Ơa °
2 |~2ø
0
-Ty , 2 2 any eck Le Le _ 2_ (n—1)s* 2 2(n-1)
Khi Ho:ơ > 6, thì miễn bác bỏ W =4 yÌ =—— + >y
Từ đó ta có các bài toán kiềm định sau:
Trang 38Bài giang Ly thuyét Xac suat — Théng kê
1 Bai toan 1(kiém dinh hai phia)
e Gia thuyét H,:0° =o
Đối thuyết Họ :ơ z o-
© ty=t, te=t, vVOity= ye), t= ye") tra & bang phan phéi y’ & n—1 bac ty do 2 (n -1).S’ + 7 =y7 ¬ 0 qs * Kết luận:
Nếu tạ; < t¡ hoặc tạ > t; thì ta bác bỏ giả thuyết Hạ
2 Bài toán 2 (kiểm định một phía) Tương tự như trên với lưu ý:
Khi Ho:ơø <ơ thìnếu tạ < 72" ta bac bỏ giả thuyết Ho
Khi Ho : 0° > To thì nếu tos > yin” ta bac bod gia thuyết Ho
Ví dụ Nếu máy móc hoạt động bình thường thì trọng lượng sản phẩm là đại lượng ngẫu nhiên X phân phối theo quy luật chuẩn với o? = 12 Nghi ngờ máy hoạt động không bình thường người ta cân thử 13 sản phẩm và tính được s” = 14,6 Với mức ý nghĩa a = 0,05
hãy kết luận điều nghi ngờ trên có đúng không?
Giải
Ta có bài toán cân kiểm định:
e« Giả thuyết H, :ơ? =12, (ơ¿ =12)
Đối thuyết Họ :ø” #12
Ot M0” = Looe = 4.4038, b= 27") == 7? = 23,3367 tra ở bảng phân phối
vy’ 612 bac tu do »_ (n-1).S* _12.14,6 * T — x Ơa 12 gs =14,6 * Két luan:
Vì tị =4,4038< Tụ; = 14,6 < tạ= 23,3367 nên chấp nhận giả thuyết Hạ, nghĩa là điêu nghi ngờ trên là không đúng
Trang 39
Bài giảng Lý thuyết Xác suất — Thống kê
BÀI TẬP
1 Tỉ lệ người mắc bệnh A ở một địa phương là 5%, Trong một lần kiểm tra sức khỏe
ngẫu nhiên 300 người thấy có 24 người mắc bệnh A Với mức ý nghĩa 0,05 có thể
cho rang tỉ lệ người bị bệnh A có xu hướng tăng lên hay không ?
2 Phương pháp sản xuất cũ có tỉ lệ phế phâm là 7% Sau khi áp dụng kĩ thuật mới,
người ta chọn ngẫu nhiên ra 200 sản phẩm để kiểm tra thì thấy có 9 phế phẩm Với
mức ý nghĩa 0,05 có thể kết luận rằng việc áp dụng kĩ thuật mới có hiệu quả hơn hay không ?
3 Một hiệu làm đầu cho rằng 90% khách hàng của họ hài lòng với chất lượng phục vụ
Nghi ngờ chủ hiệu nói quá lên, một nhà điều tra xã hội học phỏng vẫn 150 khách
hàng của hiệu thì thấy 132 người nói là hài lòng Với mức œ = 0,05; có thể kết luận
gì về nghi ngờ trên ?
4 Một hãng điều tra dư luận cho biết có 68% cử tri sẽ bỏ phiếu cho ứng cử viên A Chọn ngẫu nhiên 36 cử tri thì thấy có 26 người bỏ phiếu cho ứng cử viên A Với œ =
0,05 bạn có kết luận gì về kết quả điều tra của hãng trên ?
3 Trong một nước, tỉ lệ tử vong của bệnh A là 1,5% Theo dõi 1000 trường hợp mặc _ bệnh A trong một ngành sản xuất, người ta thầy có 20 trường hợp tử vong Với mức ÿ nghĩa œ = 0,05, hãy kiểm định xem đặc điểm nghề nghiệp của ngành sản xuất này
có ảnh hưởng đến tỉ lệ tử vong của bệnh A hay không ? :
6 Một máy sản xuất tự động có tỉ lệ sản phẩm loại A lúc đầu là 48% Người ta cải tiễn máy và sau một thời gian áp dụng, người ta kiểm tra 40 lân, mỗi lần 10 sản phẩm và
ghi được kết quả sau:
Số §p loại A
trong một lần
kiểm tra
Số lần đạt được
số Sp loại A a) Hãy ước lượng tỉ lệ Sp loại A sau khi cải tiến máy với độ tin cậy 99%,
Cbỳ Hãy cho kết luận về hiệu quả của việc cải tiến máy với mức œ= 0,05
7 Theo dõi trọng lượng của một số trẻ sơ sinh tại một số nhà hộ sinh ở thành phố và ở
Trang 40Bai giang Ly thuyét Xac suat — Théng kê
quả đó, hãy so sánh tỉ lệ trẻ sơ sinh có trọng lượng trên 3000 gam ở thành phố và ở nông thôn, với mức ý nghĩa 0,05
8 Một vận động viên nói rằng trung bình một lần đầy tạ anh ta đầy được 43 mét Huấn luyện viên kiểm tra anh ta đây tạ 10 lần thì thấy khoảng cách trung bình đầy được là 40,6 mét với độ lệch tiêu chuẩn là 3,8 mét Dựa trên kết quả này, ở mức 5% có thé coi răng anh ta nói cường điệu khả năng của mình hay không ?
9, Quan sát số gạo bán ra trong một ngày của một cửa hàng bán gạo sau một thời gian, người ta ghi được số liệu sau: S6gao(ta) | 12 13 15 16 17 I8 19 Soéngay |3 2 #7 7 3 2 1
a) Tim ước lượng không chệch cho số gạo trung bình bán được trong một ngày?
b) Sau khi tính tốn, ơng chủ cửa hàng nói rằng nếu trung bình một ngày bán không được 15 tạ gạo thi chăng thà đóng cửa còn hơn Dựa vào số liệu trên, anh (chị) hãy kết luận giúp ông chủ cửa hàng xem có nên tiếp tục bán hay không ở mức ý nghĩa œ =
0,05? Sóc
c) Giả sử những ngày bán được từ 13 tạ đến 17 tạ là những ngày “bình thường” Hãy ước lượng tỉ lệ ngày bình thường của cửa hàng ở độ tin cậy 99%
(Giả thuyết rằng số gạo bán ra trong ngày có phân phối chuẩn)
10 Một xí nghiệp đúc một số rất lớn các sản phẩm bằng gang với số khuyết tật trung
bình ở mỗi sản phẩm là 3 Người ta cải tiến cách sản xuất và kiểm tra 36 sản phẩm,
kết quả như sau:
7 sản phẩm không có khuyết tật nào 4 sản phẩm có 1 khuyết tật 4 sản phẩm có 2 khuyết tật „./„ € ` 6 sản phâm có 3 khuyết tật 8 sản phẩm có 4 khuyết tật 6 sản phẩm có 5 khuyết tật 1 sản phẩm có 6 khuyết tật
Giả thuyết rằng số khuyết tật của các sản phẩm có phân phối chuẩn
a Hãy ước lượng số khuyết tật trung bình ở mỗi sản phẩm sau cải tiến, với độ tin
cậy 95% |
b Hãy cho kêt luận về hiệu quả của việc cải tiền sản xuât ở mức ý nghĩa 0,05