Giáo trình xác suất thống kê phần 2 pgs ts nguyễn thị dung

0 2 0
Giáo trình xác suất thống kê phần 2   pgs ts nguyễn thị dung

Đang tải... (xem toàn văn)

Thông tin tài liệu

Chương Ước lượng tham số Ước lượng tham số toán thống kê toán học Khi nghiên cứu dấu hiệu đặc trưng dạng đặc tính định lượng (chẳng hạn chiều cao, cân nặng, độ dài, ) tổng thể thông qua biến ngẫu nhiên X, xác định quy luật phân phối xác suất X việc đưa đánh dự báo biến động tổng thể liên quan đến đặc tính xác khách quan Tuy nhiên lúc xác định quy luật phân phối xác suất X Trong số trường hợp, phương pháp phân tích lý thuyết ta biết dạng toán học hàm phân phối hàm mật độ X Tuy nhiên, tham số đặc trưng kỳ vọng, phương sai, tỷ lệ (gọi chung tham số θ) lại chưa biết nên ta cần phải xác định θ Việc tính xác θ khó thực mà ta tính gần Việc tính gần tham số đặc trưng θ thơng qua mẫu cụ thể có gọi ước lượng tham số (estimate for parameters) Chương trình bày toán ước lượng tham số cho kỳ vọng toán tỷ lệ Mục 4.1 giới thiệu phương pháp ước lượng điểm làm sở quan trọng cho việc giải toán ước lượng khoảng tin cậy trình bày Mục 4.2 Nội dung chương tham khảo chủ yếu từ tài liệu [2], [6]-[8], [10] [12] 4.1 Phương pháp ước lượng điểm Bài toán Xét biến ngẫu nhiên X tổng thể mà ta biết quy luật phân phối xác suất chưa biết tham số đặc trưng θ X Hãy ước lượng θ với độ tin cậy cho trước − α Phương pháp chung Từ tổng thể cần nghiên cứu rút mẫu ngẫu nhiên kích thước n dựa vào mẫu mà xây dựng thống kê G dùng để ước lượng θ Phương pháp ước lượng điểm (point estimation) chủ trương dùng giá trị để thay cho tham số θ chưa biết tổng thể, thân θ số xác định Thông thường giá trị chọn thống kê G mẫu ngẫu nhiên Có nhiều cách chọn thống kê G khác tạo nên phương pháp ước lượng điểm khác 97 98 Chương 4: Ước lượng tham số Giả sử cần ước lượng tham số θ biến ngẫu nhiên X Đối với phương pháp ước lượng điểm ta tiến hành theo bước sau: • Bước Từ tổng thể lập mẫu ngẫu nhiên kích thước n: W = (X1 ,X2 , ,Xn ) • Bước Lập thống kê G = f (X1 ,X2 , ,Xn ) gọi hàm ước lượng θ Thông thường chọn thống kê mẫu tương ứng với tham số θ cần ước lượng, chẳng hạn, để ước lượng kì vọng tốn E(X) biến ngẫu nhiên X người ta thường chọn thống kê trung bình mẫu X, để ước lượng phương sai V (X), chọn thống kê phương sai điều chỉnh mẫu S ′2 • Bước Xác định mẫu cụ thể tính giá trị g = f (x1 ,x2 , , xn ) thống kê G mẫu cụ thể Từ suy ước lượng θ giá trị g vừa tính Chất lượng ước lượng khơng thể đánh giá qua giá trị cụ thể G có cách so sánh trực tiếp g θ mà θ lại chưa biết Do đánh giá chất lượng ước lượng thông qua thân thống kê G = f (X1 ,X2 , ,Xn ) Rõ ràng có vơ số cách chọn hàm f , tức có vơ số thống kê G dùng làm ước lượng θ nên cần đưa tiêu chuẩn để đánh giá chất lượng thống kê G, từ lựa chọn thống kê “xấp xỉ cách tốt nhất” tham số ước lượng Có tiêu chuẩn để chọn thống kê sau Định nghĩa 4.1.1 Thống kê G mẫu gọi (i) ước lượng không chệch tham số θ biến ngẫu nhiên X E(G) = θ Ngược lại, E(G) ̸= θ G gọi ước lượng chệch θ (ii) ước lượng hiệu tham số θ biến ngẫu nhiên X ước lượng khơng chệch có phương sai nhỏ so với ước lượng không chệch khác xây dựng mẫu (iii) ước lượng vững tham số θ biến ngẫu nhiên X G hội tụ theo xác suất đến θ n → ∞, tức với ε dương bé tùy ý ta ln có lim P (|G − x→∞ θ| < ε) = Chú ý 4.1.2 (i) G ước lượng khơng chệch tham số θ khơng có nghĩa giá trị G trùng khít với θ mà có nghĩa trung bình giá trị thống kê G θ Từng giá trị G sai lệch lớn so với θ (ii) Trung bình mẫu X ước lượng khơng chệch kỳ vọng biến ngẫu nhiên X, nghĩa E(X) = E(X) Trung bình mẫu X ước lượng hiệu (vững) E(X) (iii) Tần suất mẫu f ước lượng không chệch xác suất P biến ngẫu nhiên X, nghĩa E(f ) = P Tần suất mẫu f ước lượng hiệu (vững) xác suất P (iv) Phương sai điều chỉnh mẫu S ′2 ước lượng không chệch phương sai V (X) biến ngẫu nhiên X, tức E(S ′2 ) = V (X) Phương sai điều chỉnh mẫu S ′2 ước lượng hiệu (vững) phương sai V (X)  Ví dụ 4.1.3 Giả sử lô hàng nhà máy đóng thùng, thùng 50 sản phẩm Kiểm tra ngẫu nhiên số phế phẩm 50 thùng hàng ta thu kết sau: 4.1 Phương pháp ước lượng điểm Số phế phẩm X Số thùng (ni ) 0 99 2 3 20 6 7 10 (i) Hãy ước lượng cho số phế phẩm trung bình thùng (ii) Hãy ước lượng cho tỷ lệ phế phẩm lô hàng (iii) Tìm ước lượng khơng chệch cho phương sai số phế phẩm thùng Giải (i) Gọi X biến ngẫu nhiên số phế phẩm thùng Đây toán ước lượng điểm cho kỳ vọng tổng thể Ta dùng trung bình mẫu để ước lượng số phế phẩm trung bình thùng ni 20 ∑1 50 xi 10 n i xi 21 80 30 24 49 16 10 247 ni x2i 12 63 320 150 144 343 128 81 100 1343 Nhìn vào bảng ta thấy: x= 247 = 4,94 50 Vậy số phế phẩm trung bình thùng hàng khoảng sản phẩm (ii) Đây toán ước lượng tỷ lệ tổng thể Ta dùng tần suất mẫu (tỷ lệ phế phẩm 50 thùng hàng) để ước lượng tỷ lệ phế phẩm lơ hàng Tổng số sản phẩm điều tra n = (50)(50) = 2500 Số phế phẩm phát 247 Do đó, tỷ lệ phế phẩm mẫu gồm 50 thùng hàng 247 = 0,0908 f= 2500 Vậy tỷ lệ phế phẩm lô hàng vào khoảng (0,0908)(100%) = 9,88% (iii) Ước lượng không chệch cho phương sai số phế phẩm thùng phương sai điều chỉnh mẫu S ′2 Ta có: s2 = 1343 50 ′ − (4,94)2 = 2,4564 ⇒ s = (2,4564) = 2,507 50 49 Vậy phương sai số phế phẩm thùng vào khoảng 2,507 100 Chương 4: Ước lượng tham số 4.2 Phương pháp ước lượng khoảng tin cậy 4.2.1 Khái niệm Các phương pháp ước lượng điểm nói có nhược điểm kích thước mẫu nhỏ ước lượng điểm tìm sai lệch nhiều so với giá trị tham số cần ước lượng, tức sai số ước lượng lớn Mặt khác dùng phương pháp đánh giá khả mắc sai lầm ước lượng Do kích thước mẫu nhỏ người ta thường sử dụng phương pháp ước lượng khoảng tin cậy Định nghĩa 4.2.1 Khoảng (θ1 ,θ2 ) thống kê G gọi khoảng tin cậy (interval confidence) tham số θ với độ tin cậy 1−α P (θ1 < θ < θ2 ) = 1−α Tham số − α = γ gọi độ tin cậy ước lượng, α gọi mức ý nghĩa, θ1 cận trái (giá trị tối thiểu), θ2 cận phải (giá trị tối đa), I = |θ1 − θ2 | độ dài khoảng tin cậy, I/2 bán kính khoảng Để giải toán ước lượng tham số khoảng tin cậy, ta tiến hành bước sau: • Bước Từ tổng thể lập mẫu ngẫu nhiên W = (X1 ,X2 , ,Xn ) • Bước Chọn thống kê G = f (X1 ,X2 , ,Xn ,θ) cho quy luật phân phối xác suất G hoàn toàn xác định • Bước Với độ tin cậy − α cho trước tìm cặp giá trị α1 α2 cho α1 + α2 = α tương đương với chúng tìm cặp phân vị θ1 = θα1 θ2 = θα2 thỏa mãn điều kiện P (G < θ1 ) = α1 ; P (G > θ2 ) = α2 ⇒ P (θ1 < G < θ2 ) = − (α1 + α2 ) = − α Như vậy, với độ tin cậy (1 − α) ta xây dựng khoảng tin cậy (θ1 , θ2 ) cho G Bằng phép biến đổi tương đương, công thức đưa dạng P (G1 < θ < G2 ) = 1−α, với G1 = f (X1 ,X2 , ,Xn ,θ1 ) G2 = f (X1 ,X2 , ,Xn ,θ2 ) Đó khoảng tin cậy cần tìm Chú ý 4.2.2 (i) Khi tiến hành phép thử với mẫu ngẫu nhiên W = (X1 ,X2 , ,Xn ) ta thu mẫu cụ thể w = (x1 ,x2 , ,xn ), tính giá trị θ1 θ2 ứng với mẫu cụ thể Khi có kết luận qua mẫu cụ thể w, với độ tin cậy − α, tham số θ biến ngẫu nhiên gốc X nằm khoảng (θ1 ,θ2 ) (ii) Với độ tin cậy − α cho trước ta tìm vơ số cặp (θ1 ,θ2 ) thỏa mãn điều kiện α1 + α2 = α Vì có vô số khoảng tin cậy tương ứng với độ tin cậy cho 4.2.2 Ước lượng kỳ vọng toán Trong mục ta xét toán ước lượng kỳ vọng toán biến ngẫu nhiên X xét hai trường hợp X có phân phối chuẩn X khơng có phân phối chuẩn 4.2 Phương pháp ước lượng khoảng tin cậy 101 Khi biến ngẫu nhiên X có phân phối chuẩn N (a,σ ) Bài tốn Cho biến ngẫu nhiên X có phân phối chuẩn N (a,σ ) với kỳ vọng a chưa biết phương sai σ biết (chưa biết) Hãy ước lượng tham số kỳ vọng a với độ tin cậy − α Giải Bước Từ tổng thể lập mẫu ngẫu nhiên W = (X1 ,X2 , ,Xn ) kích thước n Các bước việc giải toán phụ thuộc vào việc chọn thống kê G cho phù hợp với điều kiện toán Ta xét hai trường hợp tùy thuộc vào phương sai σ biến ngẫu nhiên X biết chưa biết a Đã biết phương sai σ biến ngẫu nhiên X Bước Chọn thống kê √ (X − a) n G=U = , σ X trung bình mẫu Khi đó, theo Định lý giới hạn trung tâm, ta có thống kê U xấp xỉ phân phối chuẩn hóa N (0,1) Với độ tin cậy − α cho trước tìm cặp giá trị α1 α2 cho α1 + α2 = α Từ tìm hai phân vị chuẩn uα1 u1−α2 thỏa mãn điều kiện P (U < uα1 ) = α1 ; P (U > u1−α2 ) = α2 Suy P (uα1 < U < u1−α2 ) = − (α1 + α2 ) = − α Vì uα1 = −u1−α1 nên thay thống kê U vào biểu thức trên, ta thu ) ( √ (X − a) n < u1−α2 = − α, hay P −u1−α1 < σ ) ( σ σ P X − √ u1−α2 < a < X + √ u1−α1 = − α n n Bước Kết luận: với độ tin cậy (1 − α), tham số a biến ngẫu nhiên X nằm khoảng ) ( σ σ (4.1) X − √ u1−α2 ; X + √ u1−α1 n n Từ công thức (4.1) , để xác định khoảng tin cậy a, người ta thường xét trường hợp đặc biệt khoảng tin cậy theo cách chọn α1 α2 sau α Khoảng tin cậy đối xứng: Nếu α1 = α2 = khoảng tin cậy a là: ( ) σ σ X − √ u1− α2 ; X + √ u1− α2 (4.2) n n σ Trong (4.2), đặt ε = √ u1− α2 biểu thức có dạng (X − ε; X + ε), ε gọi n độ xác ước lượng, phản ánh mức độ sai lệch trung bình mẫu so với trung bình tổng thể với độ tin cậy (1 − α) cho trước 102 Chương 4: Ước lượng tham số Khoảng tin cậy bên phải (dùng để ước lượng giá trị tối thiểu a): Nếu α1 = 0, α2 = α u1−α1 = +∞ Do khoảng tin cậy bên phải a là: ( ) σ X − √ u1−α ; +∞ (4.3) n Khoảng tin cậy bên trái (dùng để ước lượng giá trị tối đa a): Nếu α2 = 0, α1 = α u1−α2 = +∞ Do khoảng tin cậy bên trái a là: ) ( σ −∞; X + √ u1−α (4.4) n Chú ý 4.2.3 (i) Từ mẫu cụ thể, ta xác định giá trị cụ thể x, ε (ii) Với độ tin cậy − α cho trước độ dài khoảng tin cậy đối xứng (x − ε, x + ε) ngắn với I = 2ε α (iii) Các giá trị u1− α2 u1−α giá trị tới hạn mức − − α tra bảng Phụ lục (iv) Nếu tăng cỡ mẫu n, giữ ngun − α ε giảm đi, độ xác cao lên Cịn tăng − α, giữ nguyên cỡ mẫu n ε tăng lên, độ xác giảm Bài tốn Xác định cỡ mẫu tối thiểu n cho thỏa mãn yêu cầu cho trước độ tin cậy − α độ xác ε σ Giải Từ cơng thức ta có ε = √ u1− α2 Do với ε0 cho trước ta n xác định cỡ mẫu n công thức sau: [ ] σ n ≥ u1− α +1 ε0  Ví dụ 4.2.4 Trọng lượng loại sản phẩm biến ngẫu nhiên có phân phối chuẩn, với độ lệch chuẩn Cần phải điều tra mẫu có kích thước tối thiểu để với độ tin cậy ước lượng 0,95 sai số cho phép khơng vượt q 0,1 Giải Theo giả thiết ta có ε0 = 0,1; σ = với − α = 0,95, tra bảng Phụ lục ta có u1− α2 = 1,96 Khi đó, ta có [ ] [ ] σ2 2 n ≥ u1− α +1 = (1,96) +1 = [384,16] + = 385 ε0 (0,1)2 Vậy để đáp ứng yêu cầu ta phải điều tra mẫu có kích thước tối thiểu n = 385 b Chưa biết phương sai biến ngẫu nhiên X Bước Tương tự trường hợp biết phương sai 4.2 Phương pháp ước lượng khoảng tin cậy 103 Bước Dùng độ lệch chuẩn điều chỉnh mẫu S ′ thay cho σ chưa biết chọn thống kê sau: X − a√ G=T = n S′ Khi thống kê T tuân theo quy luật phân phối Student với (n − 1) bậc tự kích thước mẫu n ≤ 30 T xấp xỉ phân phối chuẩn hóa N (0,1) n ≥ 30 Do đó, ta cần xét hai trường hợp sau Trường hợp Kích thước mẫu nhỏ, n ≤ 30 Bước Với độ tin cậy (1 − α) cho trước tìm cặp giá trị α1 α2 (n−1) (n−1) cho α1 + α2 = α, từ tìm hai phân vị Student tương ứng tα1 tα2 thỏa mãn điều kiện ( ) ) ( (n−1) = α ; P T > t = α2 P T < t(n−1) 1−α2 α1 ( Suy P (n−1) Vì tα1 (n−1) tα1 (n−1) ) = − (α1 + α2 ) = − α ) (n−1) (n−1) nên P −t1−α1 < T < t1−α2 = − α Thay thống kê T vào 30) f không bé không lớn U xấp xỉ phân phối chuẩn hóa N (0,1) 108 Chương 4: Ước lượng tham số Bước Với độ tin cậy − α cho trước tìm cặp giá trị α1 α2 cho α1 + α2 = α Từ tìm hai phân vị chuẩn uα1 u1−α2 thỏa mãn điều kiện P (U < uα1 ) = α1 ; P (U > u1−α2 ) = α2 Suy P (uα1 < U < u1−α2 ) = − (α1 + α2 ) = − α Vì uα1 = −u1−α1 nên thay thống kê U vào biểu thức giải ẩn p ta thu ( ) √ √ f (1 − f ) f (1 − f ) √ √ P f− u1−α2 < p < f + u1−α1 = − α n n Từ suy với độ tin cậy − α, tham số p biến ngẫu nhiên X nằm khoảng ( ) √ √ f (1 − f ) f (1 − f ) √ √ u1−α2 ; f + u1−α1 f− (4.14) n n Từ công thức (4.14), ta có loại khoảng tin cậy thường dùng sau: Khoảng tin cậy đối xứng p (khi α1 = α2 = ( α ) là: ) √ √ f (1 − f ) f (1 − f ) √ √ f− u1− α2 ; f + u1− α2 n n Khoảng tin cậy bên phải p (khi α1 = 0, α2 = α) là: ) ( √ f (1 − f ) √ f− u1−α ; +∞ n Khoảng tin cậy bên trái p (khi α1 = α, α2 = 0) là: ( ) √ f (1 − f ) √ −∞; f + u1−α n (4.15) (4.16) (4.17) Chú ý 4.2.9 (i) Khoảng tin cậy đối xứng có độ dài ngắn I = 2ε với √ f (1 − f ) √ ε= u1− α2 n độ xác ước lượng (ii) Kích thước mẫu n cần phải điều tra đảm bảo cho việc ước lượng tham số p có độ tin cậy − α sai số cho phép không vượt ε0 cho trước ] [ f (1 − f ) u1− α +1 (4.18) n≥ ε20 4.2 Phương pháp ước lượng khoảng tin cậy 109  Ví dụ 4.2.10 Để xác định tỷ lệ nảy mầm hạt giống ngô, người ta gieo thử 400 hạt thấy có 350 hạt nảy mầm (i) Tỷ lệ nảy mầm tối đa đạt bao nhiêu, với độ tin cậy 95%? (ii) Để đảm bảo độ xác 0,01 cần phải gieo hạt với độ tin cậy trên? Giải (i) Gọi p tỷ lệ hạt nảy mầm Đây toán ước lượng tỷ lệ khoảng tin cậy bên trái Khi khoảng tin cậy bên trái p tính theo cơng thức (4.17) 350 Từ mẫu cụ thể, ta có n = 100, m = 350 f = = 0,875 Với độ tin cậy 400 95%, tức − α = 0,95 tra bảng Phụ lục ta u1−α = u0,95 = 1,645, suy √ √ f (1 − f ) (0,875)(0,125) √ √ ε= u1−α = (1,645) = 0,0272 n 400 Do đó, khoảng tin cậy bên trái p (−∞; f + ε) = (−∞; 0,875 + 0,0272) = (−∞; 0,902) Kết luận: Với độ tin cậy 95%, tỷ lệ nảy mầm tối đa 90,2% (ii) Đây toán xác định cỡ mẫu tối thiểu biết trước độ xác ε độ tin cậy − α ước lượng Sử dụng cơng thức (4.18), ta có [ ] [ ] f (1 − f ) (0,875)(0,125) u1− α +1 = n≥ (1,96) +1 = [4201,75] + = 4202 ε20 0,012 Do đó, để đảm bảo độ xác 0,01 cần gieo tối thiểu 4202 hạt Tiếp theo ta xét số toán thường gặp thực tế liên quan đến toán ước lượng tỷ lệ, chẳng hạn cần đưa ước lượng số người mắc loại bệnh khu vực dân cư có N người cần ước lượng số phế phẩm kho hàng gồm N sản phẩm, Bài toán Ước lượng số cá thể có đặc tính A tổng thể gồm N cá thể Giải Gọi M số cá thể mang đặc tính A tổng thể gồm N cá thể Lấy từ tổng thể mẫu ngẫu nhiên (khơng hồn lại) gồm n cá thể Gọi X số cá thể M phần tử mang đặc tính A có đặc tính A n cá thể Khi đó, tỷ lệ p = N tổng thể xác định phương pháp ước lượng khoảng tin cậy cho tỷ lệ Với N biết ta ước lượng M từ khoảng tin cậy p Tức √ √ f (1 − f ) f (1 − f ) M √ √ f− a0 ; H1 : a < a0 ) Với mức ý nghĩa α cho trước, bước toán sau Trường hợp 1: Đã biết phương sai Giả sử biến ngẫu nhiên gốc X phân phối theo quy luật chuẩn N (a, σ ) với phương sai σ biết chưa biết a X − a√ Bước Chọn tiêu chuẩn kiểm định thống kê G = U = n σ X − a0 √ Bước Nếu H0 ta có U = n thống kê U có phân phối σ chuẩn hóa N (0,1) Từ mẫu cụ thể ta tìm trung bình mẫu x tính giá trị quan sát tiêu chuẩn kiểm định Uqs Bước Với mức ý nghĩa cho α trước, tra bảng Phụ lục ta tìm giá trị u1− α2 u1−α tìm miền bác bỏ Wα tùy thuộc vào đối thuyết H1 sau: - Nếu H1 : a ̸= a0 ta tìm miền bác bỏ hai phía: Wα = (−∞; −u1− α2 ) ∪ (u1− α2 ; +∞) - Nếu H1 : a > a0 ta tìm miền bác bỏ bên phải: Wα = (u1−α ; +∞) - Nếu H1 : a < a0 ta tìm miền bác bỏ bên trái: Wα = (−∞; −u1−α ) Bước So sánh Uqs với Wα kết luận (Xem Hình 5.1, 5.2 5.3) - Nếu Uqs ∈ Wα bác bỏ H0 , chấp nhận H1 - Nếu Uqs ∈ / Wα chưa có sở để bác bỏ H0 , tức chấp nhận H0 Thừa nhận Thừa nhận Bác bỏ Bác bỏ α α u1−α u Hình 5.1: Miền bác bỏ bên phải u1−α u Hình 5.2: Miền bác bỏ bên trái 5.2 Kiểm định giả thuyết thống kê kỳ vọng toán Bác bỏ α 119 Bác bỏ Thừa nhận u1− α2 u −u1− α2 Hình 5.3: Miền bác bỏ hai phía Ví dụ 5.2.1 Một vườn giống có chiều cao trung bình chưa xác định Theo hợp đồng ký người sản xuất nông trường trồng thi chiều cao đạt 1m đem trồng Người ta điều tra ngẫu nhiên 50 tính chiều cao trung bình x = 1,1m Với mức ý nghĩa α = 0,05, hỏi vườn nói đủ tiêu chuẩn mang trồng chưa? Biết chiều cao trung bình biến ngẫu nhiên có phân phối chuẩn N (a,σ ) với σ = 0,1  Giải Đây toán kiểm định giả thuyết thống kê kỳ vọng toán a phân phối N (a,σ ) biết phương sai Gọi a chiều cao trung bình giống Bước Chọn giả thuyết: H0 : a = đối thuyết: H1 : a > X − a√ X − a√ Bước Chọn tiêu chuẩn kiểm định U = n= 50, X σ 0,1 trung bình mẫu ngẫu nhiên với kích thước mẫu n = 50 Khi đó, tiêu chuẩn kiểm định U có quy luật phân phối chuẩn hóa N (0,1) X − 1√ Bước Giả sử H0 đúng, ta có tiêu chuẩn kiểm định U = 50 0,1 Từ mẫu cụ thể ta có x = 1,1, thay vào tiêu chuẩn kiểm định ta giá trị quan sát Uqs = 1,1 − √ 50 = 7,1 0,1 Bước Với mức ý nghĩa α = 0,05 u1−α = 1,645 Vì đối thuyết có dạng H1 : a > nên ta tìm miền bác bỏ bên phải Wα = (1,645; +∞) Bước Ta thấy Uqs = 7,1 ∈ Wα mệnh đề H1 Kết luận: Với mức ý nghĩa 5%, vườn đạt tiêu chuẩn mang trồng Trường hợp 2: Chưa biết phương sai Khi chưa biết phương sai, bước chọn tiêu chuẩn kiểm định thực sau X − a√ Bước Chọn tiêu chuẩn kiểm định thống kê G = T = n S′ X − a0 √ Bước Nếu H0 ta có T = n Từ mẫu cụ thể ta tìm Tqs S′ Bước Với mức ý nghĩa α cho trước ta tìm miền bác bỏ Ta xét trường hợp theo kích thước mẫu sau: • Kích thước mẫu nhỏ n ≤ 30: Thống kê T tuân theo quy luật phân phối Student với n − bậc tự Vì tra bảng Phụ lục 3, ta tìm giá trị phân (n−1) (n−1) vị t1− α t1−α 120 Chương 5: Kiểm định giả thuyết thống kê • Kích thước mẫu lớn n ≥ 30: Thống kê T có phân phối Student tiến tới quy luật phân phối chuẩn hóa N (0,1) nên ta xấp xỉ phân phối Student phân phối chuẩn Vì tra bảng Phụ lục ta tìm giá trị phân vị u1− α2 u1−α Từ tìm miền bác bỏ Wα tùy thuộc vào đối thuyết H1 (tương tự trường hợp biết phương sai) Bước So sánh rút kết luận (tương tự trường hợp biết phương sai)  Ví dụ 5.2.2 Mức tiêu thụ nhiên liệu (X) thiết bị máy móc khoảng thời gian làm việc định xưởng sản xuất biến ngẫu nhiên có phân phối chuẩn với kỳ vọng tốn 50 lít Do thiết bị bảo dưỡng, người ta cho mức tiêu thụ nhiên liệu trung bình giảm xuống Quan sát 30 thiết bị loại xưởng ta thu số liệu sau: Mức tiêu thụ nhiên liệu X (lít) Số thiết bị ni 48,5 49,0 49,0 49,5 10 49,5 50,0 10 50,0 50,5 50,5 51,0 Với mức ý nghĩa α = 0,05, kết luận ý kiến nêu trên? Giải Đây toán kiểm định giả thuyết thống kê kỳ vọng toán biến ngẫu nhiên có phân phối chuẩn chưa biết phương sai với mẫu nhỏ Gọi a mức tiêu thụ nhiên liệu trung bình loại thiết bị Bước Chọn giả thuyết: H0 : a = 50 đối thuyết: H1 : a < 50 X − a√ X − a√ Bước Chọn tiêu chuẩn kiểm định T = n = 30, X S′ S′ trung bình mẫu ngẫu nhiên với kích thước mẫu n = 30 Khi đó, tiêu chuẩn kiểm định T có quy luật phân phối Student X − 50 √ Bước Giả sử H0 đúng, ta có tiêu chuẩn kiểm định 30 S′ Từ mẫu cụ thể ta tính x s′ Ta có xi cách khoảng h = 0,5, chọn xi − x xi − 49,75 x0 = 49,75, đổi biến ui = = Lập bảng để tính tốn x s′ h 0,5 sau: xi ni ui ni ui ni u2i 48,75 −2 −10 20 49,25 10 −1 −10 10 49,75 10 0 50,25 3 50,75 2 30 −13 41 5.2 Kiểm định giả thuyết thống kê kỳ vọng tốn 121 Từ bảng ta có kết sau: −13 = −0,433; 30 41 u2 = = 1,367; 30 u= x = x0 + hu = 49,75 + (0,5)(−0,433) = 49,534; s2u = u2 − (u)2 = 1,367 − (−0,433)2 = 1,179; s2x = h2 s2u = (0,5)2 (1,179) = 0,295; √ √ s′ = s′2 = 0,305 = 0,552 s′2 = n 30 s = (0,295) = 0,305; n−1 29 Thay giá trị vừa tìm vào tiêu chuẩn kiểm định ta Tqs = −4,68 (n−1) Bước Với mức ý nghĩa α = 0,05, tra Phụ lục ta có phân vị Student t1−α = (29) t0,95 = 1,699 Vì đối thuyết có dạng H1 : a < 50 nên ta tìm miền bác bỏ bên trái Wα = (−∞; −1,699) Bước Ta thấy Tqs = −4,68 ∈ Wα nên bác bỏ H0 , nghĩa điều nghi ngờ Kết luận: Với mức ý nghĩa 5%, kết luận mức tiêu thụ nhiên liệu loại thiết bị giảm xuống  Ví dụ 5.2.3 Để khảo sát suất giống lúa A nhập từ Nhật Bản, người ta trồng thử 100 ruộng thu kết sau: Năng suất (X) (tạ/ha) Số ni 41 43 13 45 25 47 35 49 15 51 Biết Nhật Bản giống lúa có suất 46,2 tạ/ha Có chun gia nói khí hậu Việt Nam thay đổi, suất trung bình giống lúa bị thay đổi Với mức ý nghĩa α = 0,05, xác định xem kết luận hay sai Giải Đây toán kiểm định giả thuyết thống kê kỳ vọng toán a phân phối N (a,σ ) chưa biết phương sai với mẫu lớn Gọi a suất lúa trung bình giống lúa A Bước Chọn giả thuyết: H0 : a = 46,2 đối thuyết: H1 : a ̸= 46,2 X − a√ X − a√ Bước Chọn tiêu chuẩn kiểm định T = n = 100 Vì kích ′ S S′ thước mẫu lớn n = 100 nên tiêu chuẩn kiểm định T có quy luật phân phối chuẩn hóa N (0,1) X − 46,2 √ Bước Giả sử H0 đúng, ta có tiêu chuẩn kiểm định T = 100 S′ ′ Từ mẫu cụ thể ta tính x s Ta có xi cách khoảng h = 2, ta chọn xi − x xi − 47 x0 = 47, đổi biến ui = = Lập bảng để tính tốn x s′ h sau: 122 Chương 5: Kiểm định giả thuyết thống kê xi 41 43 45 47 49 51 ni 13 25 35 15 100 Từ bảng ta có: −47 u= = −0,47; 100 175 u2 = = 1,75; 100 s2x = h2 s2u = (2)2 (1,5291) = 6,1164; √ √ s′ = s′2 = 6,1782 = 2,4856 ui −3 −2 −1 ni ui −21 −26 −25 15 10 −47 ni u2i 63 52 25 15 20 175 x = x0 + hu = 47 + (2)(−0,47) = 46,06; s2u = u2 − (u)2 = 1,75 − (−0,47)2 = 1,5291; s′2 = 100 (6,1164) = 6,1782; 99 Thay giá trị vừa tìm vào thống kê T ta giá trị quan sát 46,06 − 46,2 √ Tqs = 100 = −5,632 2,4856 Bước Với mức ý nghĩa α = 0,05 u1−α/2 = 1,96 Vì đối thuyết H1 : a ̸= 46,2 nên ta tìm miền bác bỏ hai phía Wα = (−∞; −1,96) ∪ (1,96; +∞) Bước Ta thấy Tqs = −5,632 ∈ Wα nên bác bỏ H0 Kết luận: Với mức ý nghĩa 5%, kết luận chuyên gia thay đổi suất giống lúa Nhật Bản Chú ý 5.2.4 Nếu biến ngẫu nhiên X không tuân theo quy luật phân phối chuẩn, ta chọn thống kê G hai trường hợp biết phương sai chưa biết phương sai Theo Định lý giới hạn trung tâm Chương 2, kích thước mẫu đủ lớn thống kê G xấp xỉ phân phối chuẩn hóa N (0,1) Do vậy, ta cần phải chọn mẫu có kích thước đủ lớn (thông thường n ≥ 30) tiến hành toán kiểm định a tương tự toán kiểm định a biến ngẫu nhiên X có phân phối chuẩn 5.2.2 Trường hợp hai tổng thể Bài toán Giả sử có hai tổng thể nghiên cứu, tổng thể thứ biến ngẫu nhiên gốc X1 có phân phối chuẩn N (a1 , σ12 ), tổng thể thứ hai biến ngẫu nhiên gốc X2 có phân phối chuẩn N (a2 , σ22 ) Các tham số a1 a2 chưa biết song có sở để giả thuyết giá trị chúng Hãy kiểm định giả thuyết Giải Từ hai tổng thể rút hai mẫu ngẫu nhiên độc lập kích thước tương ứng n1 n2 : W1 = (X11 , X12 , , X1n1 ); W2 = (X21 , X22 , , X2n2 ) Để kiểm định giả thuyết trên, ta thực bước tương tự kiểm định kỳ vọng 5.2 Kiểm định giả thuyết thống kê kỳ vọng toán 123 Bước Phát biểu cặp giả thuyết đối thuyết sau: H0 : a1 = a2 ; H1 : a1 ̸= a2 (hoặc H1 : a1 > a2 , H1 : a1 < a2 ) Bước Chọn tiêu chuẩn kiểm định Ta xét hai trường hợp sau: - Trường hợp 1: Nếu biết phương sai σ12 σ22 biến ngẫu nhiên gốc tổng thể chọn tiêu chuẩn kiểm định U= (X − X ) − (a1 − a2 ) √ σ1 σ22 + n1 n2 (5.4) Theo Định lý giới hạn trung tâm Chương 2, ta có thống kê U phân phối chuẩn hóa N (0,1) Nếu giả thuyết H0 thống kê U có dạng: (X − X ) U=√ σ1 σ22 + n1 n2 (5.5) có phân phối chuẩn hóa N (0,1) - Trường hợp 2: Nếu chưa biết phương sai σ12 σ22 biến ngẫu nhiên gốc tổng thể chọn tiêu chuẩn kiểm định U= (X − X ) − (a1 − a2 ) √ ′2 S1 S2′2 + n1 n2 (5.6) Nếu giả thuyết H0 thống kê T có dạng: (X − X ) U = √ ′2 S ′2 S1 + n1 n2 (5.7) có phân phối chuẩn hóa N (0,1) với n đủ lớn (n ≥ 30) Bước Từ mẫu cụ thể ta tìm giá trị x1 , s′1 , x2 , s′2 cụ thể thay vào (5.5) (5.7), ta tìm giá trị quan sát (x1 − x2 ) Uqs = √ σ1 σ22 + n1 n2 biết σ1 , σ2 , (5.8) chưa biết σ1 , σ2 (5.9) (x1 − x2 ) Uqs = √ ′2 s1 s′2 + n1 n2 Bước Với mức ý nghĩa cho trước tra Bảng Phụ lục ta tìm giá trị u1− α2 u1−α từ ta tìm miền bác bỏ Wα tùy thuộc vào cách đặt đối thuyết H1 Cụ thể, 124 Chương 5: Kiểm định giả thuyết thống kê - Miền bác bỏ hai phía (nếu H1 : a1 ̸= a2 ): Wα = (−∞; −u1− α2 ) ∪ (u1− α2 ; +∞), - Miền bác bỏ bên phải (nếu H1 : a1 > a2 ): Wα = (u1−α ; +∞), - Miền bác bỏ bên trái (nếu H1 : a1 < a2 ): Wα = (−∞; −u1−α ) Bước So sánh Uqs với miền bác bỏ Wα rút kết luận  Ví dụ 5.2.5 Người ta thí nghiệm hai phương pháp chăn nuôi gà khác Sau tháng người ta kiểm tra mức độ tăng trọng lơ Kết sau: • Lơ dùng phương pháp 1: Kiểm tra 100 con, x1 = 1,1kg; σ12 = 0,04 • Lơ dùng phương pháp 2: Kiểm tra 150 con, x2 = 1,2kg; σ22 = 0,09 Biết trọng lượng gà biến ngẫu nhiên có phân phối chuẩn Với mức ý nghĩa α = 0,05 kết luận phương pháp hiệu phương pháp khơng? Giải Đây tốn kiểm định kỳ vọng toán biến ngẫu nhiên có phân phối chuẩn biết phương sai Bước Đặt giả thuyết H0 : a1 = a2 (Nghĩa hai phương pháp hiệu tương đương) đối thuyết H1 : a2 > a1 (phương pháp hiệu phương pháp 1) Bước Chọn tiêu chuẩn kiểm định U= (X − X ) − (a1 − a2 ) √ σ1 σ22 + n1 n2 Bước Giả sử H0 thay giá trị có từ mẫu cụ thể ta có (X − X ) −0,1 (1,1 − 1,2) U=√ = =√ = −3,1646 0,0316 σ1 σ2 0,04 0,09 + + n1 n2 100 150 Bước Từ α = 0,05, tra bảng phân vị ta có u1−α = 1,645 Ta tìm miền bác bỏ bên trái Wα = (−∞; −u1−α ) = (−∞; −1,645) Bước Ta thấy Uqs ∈ Wα nên suy bác bỏ H0 , tức ta kết luận phương pháp hiệu phương pháp  Ví dụ 5.2.6 Tại vùng sản xuất lúa, áp dụng biện pháp kỹ thuật thứ điều tra ngẫu nhiên n1 = 100 ruộng trồng giống lúa A thu suất trung bình x1 = 100 tạ/ha s′1 = tạ/ha Còn áp dụng biện pháp kĩ thuật thứ điều tra ngẫu nhiên n2 = 50 ruộng với giống lúa A thu suất trung bình x2 = 95 tạ/ha s′2 = 11 tạ/ha Hãy kiểm định với mức ý nghĩa α = 0,05 cho khẳng định sau: Nếu áp dụng biện pháp kĩ thuật thứ suất giống lúa A cao thực so với kết áp dụng biện pháp kỹ thuật thứ hai Giả thiết suất lúa tuân theo quy luật phân phối chuẩn Giải Gọi X1 ,X2 tương ứng suất giống lúa A áp dụng biện pháp kỹ thuật thứ thứ hai a1 ,a2 suất trung bình tương ứng áp dụng biện pháp Đây tốn kiểm định hai kì vọng hai biến ngẫu nhiên có phân phối chuẩn chưa biết phương sai với mẫu lớn Bước Chọn giả thuyết H0 : a1 = a2 đối thuyết H1 : a1 > a2 5.3 Kiểm định giả thuyết thống kê tỷ lệ 125 Bước Chọn tiêu chuẩn kiểm định U= (X − X ) − (a1 − a2 ) √ ′2 S1 S2′2 + n1 n2 Bước Giả sử H0 thay giá trị cụ thể vào ta có (X − X ) (100 − 95) U = √ ′2 = 1,542 =√ ′2 s1 s2 92 112 + + n1 n2 100 50 Bước Với α = 0,05 tra bảng ta u0,95 = 1,645 Do miền bác bỏ bên phải Wα = (1,645; +∞) Bước Ta có Uqs ∈ / Wα chưa có sở để bác bỏ H0 Kết luận: Với mức ý nghĩa 5%, chưa có sở để khẳng định áp dụng biện pháp kỹ thuật thứ suất giống lúa A cao thực so với suất đạt áp dụng biện pháp kỹ thuật thứ hai 5.3 Kiểm định giả thuyết thống kê tỷ lệ 5.3.1 Trường hợp tổng thể Bài toán Cho X biến ngẫu nhiên có quy luật phân phối xác suất khơng – A(p) Hãy kiểm định tham số tỷ lệ θ = p với mức ý nghĩa α cho trước Giải Đây toán so sánh tỷ lệ lý thuyết với tỷ lệ quan sát Giả sử tham số p chưa biết ta có sở p = p0 , p0 tỷ lệ biết Bước Chọn giả thuyết H0 : p = p0 đối thuyết H1 : p ̸= p0 (hoặc p > p0 , p < p0 ) Bước Từ tổng thể lập mẫu ngẫu nhiên kích thước n, với n đủ lớn ta chọn tiêu chuẩn kiểm định thống kê f −p √ U=√ n, p(1 − p) (5.10) f tần suất mẫu Nếu H0 f − p0 √ U=√ n, p0 (1 − p0 ) (5.11) U xấp xỉ phân phối chuẩn hóa N (0,1) Bước Từ mẫu cụ thể ta tính giá trị quan sát Uqs tiêu chuẩn kiểm định (5.11) Bước Với mức ý nghĩa cho trước tra Bảng Phụ lục ta tìm giá trị u1− α2 u1−α từ ta tìm miền bác bỏ Wα vào cách phát biểu đối thuyết H1 126 Chương 5: Kiểm định giả thuyết thống kê - Miền bác bỏ hai phía (nếu H1 : p1 ̸= p2 ): Wα = (−∞; −u1− α2 ) ∪ (u1− α2 ; +∞) - Miền bác bỏ bên phải (nếu H1 : p1 > p2 ): Wα = (u1−α ; +∞) - Miền bác bỏ bên trái (nếu H1 : p1 < p2 ): Wα = (−∞; −u1−α ) Bước So sánh Uqs với miền bác bỏ Wα rút kết luận Ví dụ 5.3.1 Một kho hạt giống có tỷ lệ nảy mầm xác định 0,9 Ngẫu nhiên có thiết bị bị hỏng làm thay đổi điều kiện bên kho làm cho tỷ lệ nảy mầm thay đổi Người ta làm thí nghiệm 200 hạt giống thấy có 140 hạt nảy mầm Với độ tin cậy 95%, cho biết tỷ lệ nảy mầm có thay đổi khơng?  Giải Đây toán kiểm định giả thuyết thống kê tỷ lệ Bước Đặt giả thuyết thống kê H0 : p = 0,9 (tỷ lệ hạt nảy mầm kho không bị thay đổi) đối thuyết H1 : p ̸= 0,9 (tỷ lệ nảy mầm hạt kho bị thay đổi) Bước Chọn thống kê f − 0,9 √ U=√ 200 (0,9)(0,1) f tần suất mẫu với kích thước mẫu n = 200 Khi T có phân phối chuẩn hóa N (0,1) Bước Từ mẫu cụ thể ta tìm f = 0,7 giá trị quan sát 0,7 − 0,9 √ Uqs = √ 200 = −9,428 (0,9)(0,1) Bước Với mức ý nghĩa α = 0,05, tra Bảng Phụ lục ta u1−α/2 = u0,975 = 1,96 Vậy miền bác bỏ hai phía Wα = (−∞, −1,96) ∪ (1,96, +∞) Bước Ta thấy Uqs ∈ Wα nên bác bỏ H0 , chấp nhận H1 , nghĩa tỷ lệ nảy mầm hạt kho bị thay đổi 5.3.2 Trường hợp hai tổng thể Bài toán Giả sử tổng thể thứ nhất, biến ngẫu nhiên gốc X1 có phân phối A(p1 ), tổng thể thứ hai, biến ngẫu nhiên gốc X2 phân phối A(p2 ) Các tham số p1 p2 chưa biết song có sở để giả thuyết giá trị chúng Hãy kiểm định tham số p1 p2 với mức ý nghĩa α cho trước Giải Đây toán so sánh hai tỷ lệ số phần tử mang dấu hiệu đặc trưng hai tổng thể Lập mẫu ngẫu nhiên kích thước n1 n2 tương ứng với tổng thể W1 = (X1 , X2 , ,Xn1 ); W2 = (Y1 , Y2 , ,Yn2 ) Bước Xây dựng cặp giả thuyết thống kê H0 : p1 = p2 ; H1 : p1 ̸= p2 (hoặc H1 : p1 > p2 ; H1 : p1 < p2 ) 5.3 Kiểm định giả thuyết thống kê tỷ lệ 127 Bước Chọn tiêu chuẩn kiểm định (f1 − f2 ) − (p1 − p2 ) U=√ ( ), 1 f (1 − f ) + n1 n2 (5.12) n1 f + n2 f Với n1 n2 n1 + n2 đủ lớn thống kê U nói phân phối xấp xỉ N (0,1) Nếu giả thuyết H0 tiêu chuẩn kiểm định có dạng f1 f2 tần suất mẫu tương ứng f = f1 − f2 ( ), 1 f (1 − f ) + n1 n2 U=√ (5.13) T có phân phối chuẩn hóa N (0,1) Bước Từ mẫu cụ thể ta tính giá trị cụ thể f1 ,f2 , f thay vào (5.13) ta giá trị quan sát Tqs tiêu chuẩn kiểm định T Bước Với mức ý nghĩa cho trước tra Bảng Phụ lục ta tìm giá trị u1− α2 u1−α từ ta tìm miền bác bỏ Wα vào cách phát biểu đối thuyết H1 - Miền bác bỏ hai phía (nếu H1 : p1 ̸= p2 ): Wα = (−∞; −u1− α2 ) ∪ (u1− α2 ; +∞) - Miền bác bỏ bên phải (nếu H1 : p1 > p2 ): Wα = (u1−α ; +∞) - Miền bác bỏ bên trái (nếu H1 : p1 < p2 ): Wα = (−∞; −u1−α ) Bước So sánh Tqs với miền bác bỏ Wα rút kết luận  Ví dụ 5.3.2 Có hai loại thuốc A B điều trị loại bệnh lợn Qua theo dõi, người ta thấy 160 lợn dùng thuốc A có 120 khỏi bệnh cịn số 56 lợn dùng thuốc B có 40 khỏi bệnh Với mức ý nghĩa α = 0,05, kiểm định ý kiến cho thuốc A hiệu thuốc B điều trị bệnh cho lợn? Giải Đây toán kiểm định giả thuyết thống kê hai tỷ lệ Bước Chọn giả thuyết H0 : p1 = p2 (Hai loại thuốc tác dụng tương đương nhau) đối thuyết H1 : p1 > p2 (Thuốc A hiệu thuốc B) Bước Giả sử H0 đúng, tức ta có p1 = p2 Khi đó, ta chọn tiêu chuẩn kiểm định sau: f1 − f2 U=√ ( ) 1 f (1 − f ) + n1 n1 Bước Từ mẫu cụ thể, với loại thuốc A ta có: n1 = 160, m1 = 120 nên f1 = 0,75; với thuốc B: n2 = 56, m2 = 40 nên f2 = 0,71 Suy ra, f= 120 + 40 m1 + m2 = = 0,74 n1 + n2 160 + 56 128 Chương 5: Kiểm định giả thuyết thống kê Từ suy giá trị quan sát tiêu chuẩn kiểm định Uqs = √ 0,75 − 0,714 0,04 ) = 0,068 = 0,529 ( 1 (0,74)(0,26) + 160 56 Bước Với mức ý nghĩa α = 0,05, tra Bảng Phụ lục ta u1−α = u0,95 = 1,645 Vậy miền bác bỏ hai phía Wα = (1,645; +∞) Bước Ta thấy Uqs = 0,529 ∈ / Wα nên chưa có sở để bác bỏ H0 Kết luận: Với mức ý nghĩa 5%, chưa có sở để khẳng định thuốc A hiệu thuốc B điều trị bệnh Bài tập Chương Định mức thời gian hoàn thành sản phẩm nhà máy 14 phút Có cần thay đổi định mức khơng, theo dõi thời gian hồn thành sản phẩm 25 công nhân, ta thu bảng số liệu sau: Thời gian để sản xuất sản phẩm X (phút) Số công nhân ni 10 12 12 14 14 16 10 16 18 20 22 Yêu cầu kết luận với mức ý nghĩa α = 0,05, biết thời gian hoàn thành sản phẩm đại lượng ngẫu nhiên có phân phối chuẩn N (a, σ ) Chỉ số mỡ sữa giống bò chủng 4,95 Đo số mỡ sữa 130 bò lai Hà - Ấn F1 ta thu bảng số liệu sau: Chỉ số mỡ sữa X (g/ml) Số bò ni 3,0 3,6 3,6 4,2 4,2 4,8 35 4,8 5,4 43 5,4 6,0 22 6,0 6,6 15 6,6 7,2 Với mức ý nghĩa 0,01, khẳng định số mỡ sữa giống bò lai F1 cao số mỡ sữa giống bị chủng hay khơng? Giả thiết số mỡ sữa bò biến ngẫu nhiên có phân phối chuẩn N (a, σ ) Hàm lượng đường lúc đầu loại trái 5% Một kết nghiên cứu khẳng định chăm bón cho loại phân N hàm lượng đường trái tăng lên Người ta chăm bón cho loại phân N sau thời gian kiểm tra hàm lượng đường số trái thu kết sau: Hàm lượng đường X (% ) Số trái ni 51 47 13 39 13 17 36 17 21 32 21 25 25 29 29 33 37 41 Hãy cho kết luận hiệu loại phân N hàm lượng đường trái với mức ý nghĩa 10% Giả thiết hàm lượng đường biến ngẫu nhiên có phân phối chuẩn N (a, σ ) 5.3 Kiểm định giả thuyết thống kê tỷ lệ 129 Sản phẩm xí nghiệp đúc cho phép số khuyết tật trung bình sản phẩm Xí ngiệp định đổi thiết bị với mong muốn giảm số khuyết tật sản phẩm đúc Sau đổi thiết bị, kiểm tra ngẫu nhiên 36 sản phẩm thu kết sau: Số khuyết tật X Số sản phẩm ni 4 6 Hãy cho kết luận hiệu việc đổi thiết bị với mức ý nghĩa 4% Giả thiết số khuyết tật sản phẩm biến ngẫu nhiên có phân phối chuẩn N (a, σ ) Biết độ chịu lực trung bình mẫu bê tơng 230kg/cm2 Đo độ chịu lực X 210 mẫu bê tông ta có kết sau: Độ chịu lực X (kg/cm2 ) ni 180 180 12 190 190 15 200 200 30 210 210 58 220 220 65 230 230 35 240 240 20 250 250 15 Với mức ý nghĩa 0,08 cho kết luận độ chịu lực mẫu bê tông Giả thiết độ chịu lực bê tơng biến ngẫu nhiên có phân phối chuẩn N (a, σ ) Mức hao phí xăng loại xe ô tô chạy đoạn đường từ A đến B biến ngẫu nhiên có phân phối chuẩn N (a, σ ) với kì vọng 50 lít Do đoạn đường AB bị xuống cấp, người ta nghi ngờ mức hao phí xăng trung bình tăng lên Quan sát 28 ô tô loại ta được: Lượng xăng hao phí X (lít) Số tơ ni 48,5 49,0 49 49,5 10 49,5 50,0 50,0 50,5 50,5 51,0 Hãy cho kết luận điều nghi ngờ với mức ý nghĩa 5% Trọng lượng đóng bao loại sản phẩm biến ngẫu nhiên có phân phối chuẩn N (a, σ ) với trọng lượng trung bình theo qui định 100 kg Nghi ngờ sản phẩm bị đóng thiếu, người ta cân thử 29 bao loại thu kết quả: Trọng lượng X (kg) Số bao tương ứng ni 98,0 98,5 98,5 99,0 99,0 99,5 10 99,5 100,0 100,0 100,5 100,5 101,0 Với mức ý nghĩa 2,5%, cho kết luận điều nghi ngờ Giám đốc xí ngiệp cho biết lương trung bình cơng nhân thuộc xí nghiệp 380 USD tháng Chọn ngẫu nhiên 36 cơng nhân thấy lương trung bình 350 USD tháng, với độ lệch chuẩn 40 USD Lời báo cáo giám đốc có tin cậy không Hãy kết luận với mức ý nghĩa 5% Một cửa hàng thực phẩm nhận thấy thời gian vừa qua trung bình khách hàng mua 25 ngàn đồng thực phẩm ngày Nay cửa hàng theo dõi ngẫu nhiên 25 khách hàng thấy trung bình khách hàng mua 24 ngàn đồng thực phẩm ngày độ lệch tiêu chuẩn điều chỉnh mẫu ngàn đồng Với mức ý nghĩa 3%, có phải sức mua khách hàng thực giảm sút? 130 Chương 5: Kiểm định giả thuyết thống kê 10 Để so sánh suất hai giống lúa A (năng suất X) giống lúa B (năng suất Y ), người ta trồng cặp loại đất khác sau thu hoạch ta kết sau: Năng suất giống A (X) Năng suất giống B (Y ) 6,5 7,5 5,5 5,5 4,3 5,5 6,6 5,6 5,8 6,8 4,9 4,2 5,3 6,3 6,5 4,5 Biết X Y biến ngẫu nhiên có phân phối chuẩn N (a, σ ) Với mức ý nghĩa 0,05 coi suất hai giống lúa khác không? 11 Để xét ảnh hưởng hai loại phân bón A, B giống lúa người ta dùng phân bón A bón cho lúa ruộng Dùng phân bón B bón cho lúa ruộng Sau thu hoạch ta có kết (đơn vị tạ/ha): Năng suất sử dụng phân A (X) Năng suất sử dụng phân B (Y ) 45 46 47 49 43 43 44 46 46 50 47 44 Với mứa ý nghĩa 0,05 coi ảnh hưởng hai loại phân suất lúa hay không? 12 Theo dõi doanh thu X, Y hàng tháng cửa hàng bán giống trồng tỉnh A 10 cửa hàng bán giống trồng tỉnh B ta thu kết sau X (triệu đồng/tháng) Y (triệu đồng/tháng) 13 14 15 16 32 31 36 35 28 27 24 36 30 31 25 26 32 28 33 34 28 32 29 30 Với mức ý nghĩa 0,05 coi doanh thu cửa hàng bán giống trồng hai địa phương khác hay không? Giả thiết doanh thu bán giống trồng biến ngẫu nhiên có phân phối chuẩn N (a, σ ) Một công ty có hệ thống máy tính xử lí 1300 hóa đơn Cơng ty nhập hệ thống máy tính mới, hệ thống chạy kiểm tra 40 cho thấy số hóa đơn xử lý trung bình 1378 với độ lệch chuẩn 215 Với mức ý nghĩa 3%, nhận định xem hệ thống máy tính có tốt hệ thống máy tính cũ khơng? Theo nguồn tỉ lệ hộ dân thích xem dân ca ti vi 80% Thăm dò 36 hộ dân thấy có 25 hộ dân thích xem dân ca Với mức ý nghĩa 5%, xác định xem nguồn tin có đáng tin cậy khơng? Tỷ lệ bệnh nhân khỏi bệnh T điều trị thuốc loại A 85% Thí nghiệm dùng thuốc loại B số 900 người mắc bệnh T có 810 người chữa khỏi Như kết luận thuốc loại B hiệu thuốc loại A điều trị bệnh T hay không? Yêu cầu kết luận với mức ý nghĩa 0,01 Trong vườn ươm, nghiên cứu tỷ lệ nảy mầm Keo tai tượng với hai phương pháp xử lý hạt khác (ở hai mức nhiệt độ khác nhau), kết cho thấy 500 hạt đem xử lý mức nhiệt độ thứ thấy có 325 hạt nảy mầm; mức nhiệt độ thứ hai 500 hạt có 100 hạt khơng nảy mầm Có thể khẳng định hai mức nhiệt độ khác nhau, tỷ lệ nảy mầm Keo tai tượng khác không? Mức nhiệt độ tỷ lệ nảy mầm cao hơn? Kết luận với mức ý nghĩa 7% 5.3 Kiểm định giả thuyết thống kê tỷ lệ 131 17 Trong vườn ươm mỡ lơ che bóng 50%, kiểm tra ngẫu nhiên 430 thấy có 350 đạt tiêu chuẩn xuất vườn; lơ che bóng 75%, kiểm tra ngẫu nhiên 450 thấy có 150 khơng đạt tiêu chuẩn xuất vườn Có thể khẳng định mức che bóng ảnh hưởng đến tỷ lệ đạt tiêu chuẩn xuất vườn hay không? Cho kết luận với mức ý nghĩa 6% 18 Khảo sát hai khu rừng với diện tích lớn bị nhiễm bệnh rơm thông Từ khu rừng, lập ô tiêu chuẩn ngẫu nhiên điển hình 2000m2 thơng kê số bị bệnh sau: Khu rừng 1: Số đếm 70 cây, có 24 nhiễm bệnh Khu rừng 2: Số đếm 75 cây, có 36 nhiễm bệnh Có thể khẳng định tỷ lệ bị nhiễm bệnh rơm thông hai khu rừng với mức ý nghĩa 2% hay không? 19 Rừng trồng Keo lai hai vị trí có độ dày tầng đất khác (< 30 cm 30 − 50 cm) Theo anh (chị), nhân tố độ dày tầng đất có ảnh hưởng đến sinh trưởng đường kính Keo lai hay khơng? Cho giá trị đường kính Keo lai với chiều cao 1,3 m sau: Tầng đất < 30cm Tầng đất > 30cm 12,4 11,5 12,9 12,3 12,4 11,5 12,3 12,8 12,6 12,8 12,7 11,6 13,3 12,2 11,2 12,4 12,2 19,5 12,2 13,8 19,8 20,5 20,7 19,3 Yêu cầu cho kết luận với mức ý nghĩa 5%, biết đường kính Keo lai biến ngẫu nhiên có phân phối chuẩn N (a, σ ) Chương Tương quan hồi quy Trong chương thảo luận phương pháp cho việc phân tích mối quan hệ hai biến ngẫu nhiên định lượng X Y Phân tích tương quan hồi quy kỹ thuật cho phân tích mối quan hệ hai biến ngẫu nhiên định lượng Dữ liệu cho phân tích tương quan hồi quy cặp giá trị (xi , yj ) quan sát từ mẫu ngẫu nhiên W = (Xi , Yj ), i,j = 1, , n hai biến ngẫu nhiên (X, Y ) mà nghiên cứu Trong giới hạn chương nghiên cứu tương quan hồi quy đơn biến tuyến tính, nghĩa mơ hình tốn học biểu thị mối quan hệ X Y phương trình có dạng bậc y = ax + b đồ thị biểu thị mối quan hệ X Y có dạng đường thẳng Nội dung chương chia làm mục Mục 6.1 trình bày cách xếp số liệu thực nghiệm, Mục 6.2 giới thiệu đồ thị phân tán dãy số liệu thực nghiệm thu hai biến ngẫu nhiên X Y , Mục 6.3 giới thiệu hệ số tương quan Mục 6.4 trình bày tốn hồi quy tuyến tính đơn giản Kiến thức chương tham khảo tài liệu [2], [8], [9], [12] số nguồn khác 6.1 Sắp xếp số liệu thực nghiệm Cho mẫu ngẫu nhiên có kích thước n W = (X1 , Y1 ), (X2 , Y2 ), (Xn , Yn ) có mẫu cụ thể (xi , yj ) Khi tùy theo mẫu cụ thể (số liệu thực nghiệm) ta xếp thành ba bảng sau: Dạng 1: Giả sử số liệu thực nghiệm thu n cặp giá trị (x1 , y1 ), (x2 , y2 ), (xn , yn ) ta xếp thành dạng bảng sau: X Y x1 y1 x2 y2 x3 y3 xn yn Ví dụ 6.1.1 Để thực cơng trình nghiên cứu mối quan hệ chiều cao Y (m) đường kính X(cm) loại cây, người ta quan sát chiều cao đường kính thu kết sau: thứ có chiều cao 1m đường kính cm, kí hiệu (1, 1) Đo tương tự ta có số liệu  133 134 Chương 6: Tương quan hồi quy sau: (1, 1), (3, 2), (4, 4), (6, 4), (8, 5), (9, 7), (11, 8), (14, 9) Khi ta xếp số liệu dạng bảng sau: xi yi 1 4 11 14 Dạng 2: Giả sử số liệu thực nghiệm thu sau: có n1 lần xuất cặp giá trị (x1 , y1 ), n2 lần xuất cặp giá trị (x2 , y2 ), , nk lần xuất cặp giá trị (xk , yk ), n1 + n2 + n3 + + nk = n ta xếp thành dạng bảng sau: X Y ni x1 y1 n1 x2 y2 n2 xk yk nk Ví dụ 6.1.2 Nghiên cứu lượng phân bón X (kg) dùng để bón cho ruộng vụ, suất lúa Y (kg /1000m2 ) Thống kê 30 hộ gia đình, kết sau: Nếu bón 40 (kg) có hộ đạt suất 270 hộ đạt suất 280 Nếu bón 50 (kg) có hộ đạt suất 280, hộ đạt suất 290 hộ đạt suất 300 Nếu bón 60 (kg) có hộ đạt suất 300, hộ đạt suất 310 hộ đạt suất 320 Khi ta xếp số liệu thực nghiệm dạng bảng sau:  xi yi Số hộ ni 40 270 40 280 50 280 50 290 50 300 60 300 60 310 60 320 Dạng 3: Giả sử số liệu thực nghiệm thu sau: có n11 lần xuất cặp giá trị (x1 , y1 ), n12 lần xuất cặp giá trị (x2 , y1 ), , nkm lần xuất cặp giá trị (xm , yk ), n11 + n12 + + n1m + + nk1 + + nkm = n Khi ta xếp thành dạng bảng sau: X Y y1 y2 ··· ··· yk x1 x2 ··· xm n11 n21 ··· ··· nk1 n12 n22 ··· ··· nk2 ··· ··· ··· ··· ··· n1m n2m ··· ··· nkm  Ví dụ 6.1.3 Để nghiên cứu tác dụng phân vi sinh X (tạ/ha) tới suất cà chua Y (tấn/ha), người ta thí nghiệm 20 ruộng Sau thu hoạch ta có kết sau: Nếu bón 0,15 (tạ/ha) có đạt suất 20 (tấn/ha); bón 0,17 (tạ/ha) có đạt suất 20 (tấn/ha) đạt suất 22 6.2 Đồ thị phân tán 135 (tấn/ha); bón 0,19 (tạ/ha) có đạt suất 20 (tấn/ha), đạt suất 22 (tấn/ha) đạt suất 24 (tấn/ha); bón 0,21 (tạ/ha) có đạt suất 22 (tấn/ha), đạt suất 24 (tấn/ha); bón 0,23 (tạ/ha) có đạt suất 24 (tấn/ha) Khi ta xếp số liệu dạng bảng sau đây: X Y 20 22 24 0,15 0,17 0,19 0,21 0,23 2 6.2 Đồ thị phân tán Định nghĩa 6.2.1 Đồ thị phân tán (scatter diagram) biến Y biến X tập hợp điểm M (xi , yi ) hệ tọa độ vng góc Dựa vào đồ thị phân tán ta xác định dạng quan hệ hai biến X Y Trong đồ thị phân tán, điểm M (xi , yi ) quy tụ xung quanh đường thẳng d ta nói hai biến ngẫu nhiên X Y có tương quan tuyến tính (linear correlation) Đường thẳng d gọi đường hồi quy tuyến tính (linear regression line) Y Y X X Hình 6.1: Quan hệ tuyến tính Ví dụ 6.2.2 Quay trở lại Ví dụ 6.1.1, nhìn vào đồ thị phân tán Hình 6.4, ta dễ dàng thấy điểm quy tụ xung quanh đường thẳng nên dự đốn chiều cao đường kính có mối quan hệ tương quan tuyến tính  6.3 Hệ số tương quan 6.3.1 Hệ số tương quan lý thuyết Khi đồ thị phân tán số liệu thực nghiệm hai biến (X, Y ) xu hướng đường thẳng tự nhiên mơ tả mức độ phụ thuộc tuyến 136 Chương 6: Tương quan hồi quy Y Y X X Hình 6.2: Quan hệ phi tuyến tính Hình 6.3: Khơng có quan hệ y 1 11 14 x Hình 6.4: Đồ thị phân tán tính chúng Cách để đo mức độ phụ thuộc tuyến tính hai biến ngẫu nhiên X Y dùng hệ số tương quan Định nghĩa 6.3.1 Giả sử X Y hai biến ngẫu nhiên có V (X) > V (Y ) > Hệ số tương quan (correlation coefficient) hai biến ngẫu nhiên X Y , kí hiệu ρ(X,Y ), xác định sau: ρ(X,Y ) = E(XY ) − E(X)E(Y ) E[X − E(X)][Y − E(Y )] √ √ √ √ = V (X) V (Y ) V (X) V (Y ) (6.1) Tính chất 6.3.2 (i) ρ(X,Y ) = ρ(Y,X); (ii) Nếu ρ(X,Y ) = X Y khơng có mối quan hệ tương quan tuyến tính; (iii) |ρ(X,Y )| Chú ý 6.3.3 i) Ta dùng ρ(X,Y ) để đo mức độ phụ thuộc tuyến tính hai biến ngẫu nhiên Nếu |ρ| lớn mức độ phụ thuộc tuyến tính chặt chẽ Đặc biệt ρ = ±1 phụ thuộc tuyến tính xảy với xác suất Nếu |ρ| nhỏ mức độ phụ thuộc tuyến tính X Y Đặc biệt ρ = X Y không tương quan với ii) Hai biến ngẫu nhiên độc lập với khơng tương quan, điều ngược lại chưa Riêng biến ngẫu nhiên phân phối chuẩn tính khơng tương quan tính độc lập tương đương 6.3 Hệ số tương quan 137 6.3.2 Hệ số tương quan mẫu Hệ số tương quan lý thuyết ρ số đo mức độ phụ thuộc tuyến tính hai biến ngẫu nhiên X Y Tuy nhiên chưa biết phân phối (X, Y ) việc tính hệ số tương quan lý thuyết ρ khó khăn Giả sử tiến hành n bước quan sát độc lập cặp biến ngẫu nhiên (X, Y ) ta có mẫu ngẫu nhiên kích thước n : (X1 , Y1 ), (X2 , Y2 ), , (Xn , Yn ) Định nghĩa 6.3.4 Hệ số tương quan mẫu (sample correlation coefficient) X Y , kí hiệu r(X, Y ) hay r xác định công thức: 1∑ (Xi − X)(Yi − Y ) XY − X Y n i √ r=√ = 1∑ 1∑ SX SY 2 (Xi − X) (Yi − Y ) n i n i (6.2) Hệ số tương quan mẫu r xem ước lượng hệ số tương quan lý thuyết ρ Tính chất 6.3.5 (i) Ta có |r| (ii) Nếu r > X Y tương quan thuận, r < X Y tương quan nghịch; (iii) Nếu 0,7 |r| X Y tương quan mạnh; (iv) Nếu |r| 0,3 X Y tương quan yếu Cách tính hệ số tương quan mẫu: Giả sử cho mẫu ngẫu nhiên kích thước n, có mẫu cụ thể w = (xi , yj ), i = 1, h; j = 1, , k Ta xét trường hợp sau: (i) Trong trường hợp, hệ số tương quan mẫu xác định công thức: r= xy − x y sx sy (6.3) (ii) Nếu mẫu cụ thể xi yj tương ứng cách khoảng hx xi − x0 hy để làm giảm số liệu tính tốn ta dùng phép biến đổi, đặt ui = hx yi − y0 vi = , với x0 y0 chọn thích hợp theo bảng số liệu, hy ∑ ui vi − nu v uv − u v i √ r = √∑ = (6.4) ∑ su sv u2i − n(u)2 vi2 − n(v)2 i i Từ cách đổi biến ta có: x = x0 + hx u; y = y0 + hy v; sx = hx su ; sy = hy sv (6.5) (6.6) 138 Chương 6: Tương quan hồi quy Ví dụ 6.3.6 Theo dõi kết thi hai mơn Tốn kí hiệu (X) vật lý kí hiệu (Y ) 10 em học sinh lớp ta thu bảng số liệu sau:  Xi Yi ni 2 5 Hãy tính hệ số tương quan mẫu Giải Dựa vào công thức (6.3) để tránh nhầm lẫn ta lập bảng tính sau: xi 2 3 yi 5 ni 2 ∑ n = 10 n i xi ∑ x = 22 ni x2i 18 16 ∑ x2 = 58 ni yi 10 ∑ y = 45 ni yi2 27 32 25 50 36 ∑ 49 y = 219 n i xi y i 16 10 30 18 ∑ 28 xy = 111 Nhìn vào bảng số liệu ta có: 22 = 2,2; 10 58 = 5,8; x2 = 10 s2x = 5,8 − (2,2)2 = 0,96; 45 = 4,5; 10 219 = 21,9; y2 = 10 s2y = 21,9 − (4,5)2 = 1,645; xy = 11,1; sx sy = 1,26 x= y= Vậy hệ số tương quan mẫu là: r = 11,1 − (2,2)(4,5) = 0,52 1,26  Ví dụ 6.3.7 Theo dõi vi lượng A đất trồng Y (mg/kg đất) suất loại rau X (tấn/ha) ta có kết sau: X Y 20 30 40 50 60 10 15 20 25 3 Hãy tìm hệ số tương quan r cho nhận xét? Giải Vì xi cách khoảng hx = 5, chọn x0 = 20; Các yi cách xi − 20 yi − 40 khoảng hy = 10, chọn y0 = 40 Đặt u = ;v = Ta lập 10 lại bảng số liệu mới: 6.3 Hệ số tương quan u -2 v −2 −1 -1 4 139 -2 mj mj uj mj u2j -10 20 15 -15 15 20 0 10 10 10 ni ni vi ni vi2 −6 12 11 −11 11 18 0 13 13 13 10 20 Σn = 50 Σu = −15 Σu2 = 45 Σv = Σv2 = 56 Σuv = 26 Nhìn vào bảng số liệu ta có: u= −15 = −0,3; v = = 0,12; 50 50 u v = −0,036; √ 45 su = − (−0,3)2 = 0,9; 50 45 56 = 0,9; v = = 1,12; 50 50 26 uv = = 0,52; 50 √ 56 sv = − (0,12)2 = 1,051 50 u2 = Hệ số tương quan mẫu r= 0,556 uv − u v = = 0,588 su sv 0,946 Vậy X Y có mối tương quan thuận, tức lượng vi lượng A cung cấp đầy đủ suất rau cao Chú ý 6.3.8 Hệ số tương quan mẫu r chứng minh ước lượng vững ước −ρ(1 − ρ2 ) lượng chệch hệ số tương quan lý thuyết ρ với độ chệch Do 2n r = khơng có nghĩa ρ = 0, ngược lại r ̸= chưa ρ ̸= 0, chí có X, Y lại độc lập với Vì cần phải kiểm định giả thuyết giá trị ρ để có kết luận thống kê đắn tồn hay khơng tồn mối quan hệ tuyến tính hai biến ngẫu nhiên xét 140 Chương 6: Tương quan hồi quy 6.3.3 Kiểm định giả thuyết giá trị ρ Có nhiều tốn kiểm định giả thuyết giá trị ρ, nhiên khn khổ giáo trình ta xét toán kiểm định giả thuyết H0 : ρ = 0, tức toán sau: Bài toán Kiểm định giả thuyết tương quan tuyến tính hai biến ngẫu nhiên X Y Giải Để giải toán này, trước hết ta xây dựng mẫu ngẫu nhiên, tính hệ số tương quan mẫu r, sau tiến hành thủ tục tốn kiểm định giả thuyết Bước Chọn giả thuyết: H0 : ρ = 0, đối thuyết: H1 : ρ ̸= √ n−2 Bước Chọn tiêu chuẩn kiểm định: T = r √ − r2 Bước Từ mẫu cụ thể ta tính Tqs (n−2) (n−2) Bước Tìm miền bác bỏ Wα : (−∞; −t1− α ) ∪ (t1− α ; +∞) 2 Bước So sánh Tqs với miền bác bỏ: Tqs ∈ Wα bác bỏ H0 , tức X Y có quan hệ tuyến tính Nếu Tqs ̸∈ Wα chưa có sở bác bỏ H0 , tức X Y khơng có quan hệ tuyến tính  Ví dụ 6.3.9 Quay trở lại ví dụ (6.3.7), kiểm tra xem hai tổng thể hai biến ngẫu nhiên X, Y có quan hệ tuyến tính khơng với mức ý nghĩa α = 0,05 Giải Chọn giả thuyết H0 : ρ = 0, đối thuyết H1 : ρ ̸= Ta có √ √ n−2 48 Tqs = r √ = 0,588 √ = 5,0264; − r2 − 0,5882 α (48) Vì α = 0,05 nên − = 0,975, tra Phụ lục ta có t0,975 ≈ 2,02, miền bác bỏ hai phía (−∞; −2,02) ∪ (2,02; +∞) Dễ thấy Tqs ∈ Wα nên bác bỏ H0 , tức hai biến X, Y có quan hệ tuyến tính 6.4 Hồi quy tuyến tính 6.4.1 Mơ hình hồi quy tuyến tính Để mơ hình hóa quan hệ tuyến tính tương đối chặt chẽ hai biến ngẫu nhiên X, Y người ta sử dụng loại mơ hình sau Định nghĩa 6.4.1 Mơ hình hồi quy tuyến tính đơn giản (Simple linear regression model) mơ hình có dạng sau Yi = A + BXi + ei , (6.7) Yi giá trị biến phụ thuộc Y , Xi giá trị biến độc lập X ei sai số lần quan sát thứ i Hệ số A (điểm cắt đường thẳng hồi quy 6.4 Hồi quy tuyến tính 141 tổng thể trục Oy) giá trị trung bình Y X thay đổi đơn vị Hệ số B (độ dốc đường hồi quy tổng thể) mơ tả thay đổi giá trị trung bình Y X thay đổi đơn vị Phương trình (6.7) cho phép ta tiên đốn giá trị Y biết giá trị cụ thể X, phương trình cho thấy phương trình khơng thể giúp tiên đốn Y xác tuyệt đối Như vậy, với giá trị cụ thể X cho trước có nhiều giá trị cụ thể Y Chẳng hạn, ta quan sát bảng số liệu sau đây: X Y 6 8 10 10 11 12 Với giá trị X có giá trị khác Y Như vậy, đường hồi quy khơng thể qua tất điểm có tọa độ (x, y) y 12 10 x Hình 6.5: Đường hồi quy tuyến tính Biểu diễn số liệu biểu đồ phân tán đường thẳng hồi quy đồ thị phân tán đường “vừa khít nhất” cho tất điểm theo nghĩa tổng bình phương khoảng cách điểm đường “vừa khít nhất” nhỏ 6.4.2 Phương trình hồi quy tuyến tính đơn giản tổng thể Định nghĩa 6.4.2 Phương trình hồi quy tuyến tính tổng thể (Population simple linear regression equation) phương trình diễn tả giá trị trung bình biến phụ thuộc Y theo biến độc lập X biết Y = A + BX (6.8) Nếu biểu diễn biểu đồ phân tán đường hồi quy đường qua giá trị trung bình giá trị y có thực tương ứng với x cho trước Vấn đề đặt ta cần xác định hai tham số A, B phương trình (6.8) Phương pháp bình phương tối thiểu (least squared method) phương pháp tốt 142 Chương 6: Tương quan hồi quy Y Yi = A + BXi + ei ei β A B = tan β Giá trị quan sát Y = A + BX X Hình 6.6: Mơ hình hồi quy tuyến tính tổng thể để ước tính tham số Theo phương pháp này, xây dựng cơng thức tính A, B cho cực tiểu sai số bình phương trung bình E(Y − A − BX)2 Sử dụng tính chất kỳ vọng, ta có đánh giá sau √ √ E(Y − BX − A)2 = B V (X) − 2Bρ V (X) V (Y ) + V (Y ) + (E(Y ) − BE(X) − A)2 Vế phải đạt cực tiểu tam thức bậc hai theo B √ √ B V (X) − 2Bρ V (X) V (Y ) + V (Y ) (6.9) đạt cực tiểu số hạng (E(Y ) − BE(X) − A)2 = (6.10) Đạo hàm tam thức bậc hai (6.9) theo B ta có (6.9) đạt cực tiểu √ √ √ −2ρ V (X) V (Y ) V (Y ) =ρ (6.11) B= 2V (X) V (X) Ta chọn √ A = E(Y ) − BE(X) = E(Y ) − ρ Khi √ E(Y − BX − A)2 = ρ2 V (Y ) V (X) − 2ρ V (X) V (Y ) E(X) V (X) (6.12) √ V (Y ) √ ρ V (Y ) V (X) + V (Y ) V (X) = V (Y )(1 − ρ2 ) Vậy tham số A, B chọn (6.11) (6.12) Khi phương trình đường hồi quy bình phương trung bình tuyến tính tổng thể Y theo X (tương ứng X theo Y ) √ √ √ V (Y ) V (Y ) V (Y ) X + E(Y ) − ρ E(X) = ρ (X − E(X)) + E(Y ) Y =ρ V (X) V (X) V (X) (6.13) 6.4 Hồi quy tuyến tính 143 √ √ √ V (X) V (X) V (X) X=ρ Y + E(X) − ρ E(Y ) = ρ (Y − E(Y )) + E(X) V (Y ) V (Y ) V (Y ) (6.14) Sai số bình phương trung bình (sai số dự báo) dùng đường hồi quy trung bình tuyến tính để xấp xỉ Y (tương ứng xấp xỉ X) 2 σy/x = V (Y )(1 − ρ2 ); σx/y = V (X)(1 − ρ2 ) (6.15) σx/y = V (X)(1 − ρ2 ) (6.16) Chú ý 6.4.3 (i) Mơ hình hồi quy tuyến tính (6.13) hay (6.14) cịn gọi phương trình đường hồi quy lý thuyết (ii) Người ta chứng minh hai biến ngẫu nhiên X, Y tuân theo phân phối chuẩn hai chiều, với kỳ vọng E(X), E(Y ), phương sai dương V (X), V (Y ) hệ số tương quan lý thuyết ρ hàm hồi quy Y theo X hàm hồi quy X theo Y hàm tuyến tính (iii) Khi dùng hàm hồi quy tuyến tính (6.13) để xấp xỉ Y sai số dự báo σy/x = V (Y )(1 − ρ2 ) Nhìn vào cơng thức 6.15 ta thấy sai số nhỏ |ρ| gần Do nên dùng hàm hồi quy (6.13) để xấp xỉ Y sở biết X |ρ| gần (tương tự cho trường hợp xấp xỉ X) 6.4.3 Phương trình đường hồi quy tuyến tính mẫu Trong thực tế, khảo sát hết tổng thể, nên chưa biết quy luật phân phối xác suất (X, Y ), chưa biết đặc trưng kì vọng, phương sai biến ngẫu nhiên nên khó xác định dạng toán học hàm hồi quy tổng thể Chúng ta phải dựa mẫu để xây dựng hàm hồi quy tuyến tính mẫu (sample linear regression equation) hay cịn gọi hàm hồi quy bình phương trung bình tuyến tính thực nghiệm Giả sử (x1 , y1 ), (x2 , y2 ), , (xn , yn ) n cặp quan sát mẫu thành lập từ hệ hai biến ngẫu nhiên (X, Y ) Từ mẫu cụ thể trên, ta xây dựng đường hồi quy bình phương trung bình tuyến tính thực nghiệm cách phương trình (6.13) (6.14) thay tham số đặc trưng tổng thể tham số mẫu tương ứng, tức thay E(Y ) y, E(X) x, V (Y ) sy , V (X) sx ρ r Khi ta có: - Phương trình đường hồi quy bình phương trung bình tuyến tính thực nghiệm y theo x (tương ứng x theo y) sy sx y = r (x − x) + y; x = r (y − y) + x, (6.17) sx sy với sai số dự báo mẫu tương ứng s2y/x = s2y (1 − r2 ); s2x/y = s2x (1 − r2 ) (6.18) 144 Chương 6: Tương quan hồi quy Ví dụ 6.4.4 Để thực cơng trình nghiên cứu mối quan hệ chiều cao Y (m) đường kính X (cm) loại cây, người ta quan sát mẫu ngẫu nhiên có kết  xi yi 1 4 11 14 (i) Hãy vẽ biểu đồ phân tán cho liệu bảng (ii) Hãy tính hệ số tương quan mẫu cho nhận xét mối quan hệ chiều cao đường kính (iii) Viết phương trình đường hồi quy bình phương trung bình tuyến tính thực nghiệm chiều cao theo đường kính Hãy dự báo chiều cao có đường kính 12 (cm) Giải (i) Biểu đồ phân tán mơ tả Hình 6.7 (ii) Để tính hệ số tương quan mẫu, ta lập bảng tính sau: xi 11 ∑ 14 = 56 yi 4 ∑ = 40 x2i 16 36 64 81 121 ∑ 196 = 524 yi2 16 16 25 49 64 ∑ 81 = 256 xi y i 16 24 40 63 88 ∑ 126 = 364 Từ bảng ta tính x = 7; sx = 4,342; y = 5; sy = 2,828, xy = 45,5 Hệ số tương quan mẫu r= 45,5 − 7,5 = 0,977 (4,342)(2,828) Như vậy, chiều cao đường kính có mối quan hệ tương quan thuận mạnh, tức đường kính lớn cao (iii) Phương trình đường hồi quy bình phương trung bình tuyến tính thực nghiệm chiều cao đường kính sy y = r (x − x) + y = 0,6364x + 0,5455 sx Phương trình hồi quy tuyến tính thực nghiệm có độ dốc 0,6364, nghĩa tăng đường kính lên (cm) chiều cao trung bình tăng lên khoảng 0,6364 (m) (xem Hình 6.8) Khi đường kính 12 (cm) dự báo chiều cao y0 = 0,6364.12 + 0,5455 = 8,1823(m) 6.4 Hồi quy tuyến tính 145 y y 5 2 14 x 11 y= 55 ,6 11 Hình 6.7: Biểu đồ phân tán  + 3x 4 ,5 14 x Hình 6.8: Đồ thị hàm hồi quy tuyến tính Ví dụ 6.4.5 Để nghiên cứu tác dụng phân vi sinh X (tạ/ha) tới suất cà chua Y (tấn/ha), người ta thí nghiệm 20 ruộng Sau thu hoạch ta có kết sau: X Y 20 22 24 0,15 0,17 0,19 0,21 0,23 2 (i) Tìm hệ số tương quan mẫu cho nhận xét (ii) Viết phương trình hồi quy tuyến tính thực nghiệm Y theo X (iii) Hãy tính sai số dự báo mẫu cho phương trình đường hồi quy bình phương trung bình tuyến tính thực nghiệm xi − 0,19 yj − 22 Giải (i) Đặt u = ;v = lập lại bảng số liệu 0,02 u -2 v −1 -1 2 nj vj −8 0 5 Σn = 20 Σu = −6 Σu2 = 26 Σv = −3 Σv2 = 13 2 -6 6 0 4 Nhìn vào bảng số liệu ta có: −6 −3 u= = −0,3; v = = −0,15; 20 20 u v = 0,045; √ su = 1,3 − (−0,3)2 = 1,1; 2 nj vj2 nj 0 -6 12 mi mi ui mi u2i Σuv = 12 26 13 = 1,3; v = = 0,65.; 20 20 12 uv = = 0,6; √20 sv = 0,65 − (−0,15)2 = 0,79215 u2 = 146 Chương 6: Tương quan hồi quy Vậy hệ số tương quan mẫu r= uv − u v 0,555 = = 0,637 su sv 0,871365 (ii) Dùng công thức đổi biến để đổi lại biến u biến x, ta có x = x0 + hx u = 0,19 + (0,02)(−0,3) = 0,184; y = y0 + hy v = 22 + (2)(−0,15) = 21,7; sx = hx su = (0,02)(1,1) = 0,022; sy = hy sv = (2)(0,79215) = 1,5843 Phương trình đường hồi quy bình phương trung bình tuyến tính thực nghiệm y theo x sy y = r (x − x) + y = 45,873x + 13,2594 sx (iii) Sai số dự báo mẫu s2y/x = s2y (1 − r2 ) = (1,5843)2 (1 − 0,6372 ) = 1,492 Bài tập Chương Theo dõi doanh thu X (triệu đồng/tháng) tiền lãi Y (triệu đồng/tháng) 10 đại lý thức ăn chăn nuôi tháng tỉnh A ta có kết sau: X Y ni 32 4,2 34 4,4 36 4,6 38 (a) Tìm hệ số tương quan mẫu cho nhận xét (b) Viết phương trình hồi quy tuyến tính thực nghiệm Y theo X Để nghiên cứu ảnh hưởng lượng phân bón X (tạ/ha) suất lúa Y (tấn/ha), người ta thí nghiệm 10 ruộng Sau thu hoạch ta có kết sau: X Y 3,9 4,1 4,3 1,2 1,4 2 1,5 1,6 2 (a) Tìm hệ số tương quan mẫu cho nhận xét (b) Viết phương trình hồi quy tuyến tính thực nghiệm Y theo X Theo dõi doanh thu X (triệu đồng/tháng) tiền lãi Y (triệu đồng/tháng) cửa hàng bán giống trồng 12 tháng ta kết sau: X Y ni 14 2,8 16 3,2 18 20 3,4 6.4 Hồi quy tuyến tính 147 (a) Tìm hệ số tương quan mẫu cho nhận xét (b) Viết phương trình hồi quy tuyến tính thực nghiệm Y theo X Điều tra tổng sản phẩm nông nghiệp X (triệu đồng) tổng tài sản cố định Y (triệu đồng) 10 nông trại ta thu số liệu sau: X Y 11,3 13,2 12,9 15,6 13,6 17,2 16,8 18,8 18,8 20,2 22,0 21,9 22,2 22,4 23,7 23,0 26,6 24,4 27,5 24,6 (a) Tìm hệ số tương quan mẫu cho nhận xét (b) Viết phương trình hồi quy tuyến tính thực nghiệm Y theo X X theo Y Người ta xét 10 mảnh ruộng kết sau tỷ lệ phần trăm hạt X suất lúa Y (tấn/ha): X Y 83 80 90 7,5 83 5,5 85 5,3 95 5,6 90 6,8 85 6,9 93 7,3 88 6,5 (a) Tìm hệ số tương quan mẫu cho nhận xét (b) Viết phương trình hồi quy tuyến tính thực nghiệm Y theo X Theo dõi vi lượng A đất trồng X (mg/kg đất) suất loại rau Y (tấn/ha) ta có kết sau: X Y 16 10 17 9,3 18 8,7 19 9,7 20 21 8,1 22 23 8,2 24 7,7 25 7,6 26 7,9 27 7,8 (a) Tìm hệ số tương quan mẫu cho nhận xét (b) Viết phương trình hồi quy tuyến tính thực nghiệm Y theo X Số vi khuẩn Y (triệu con) sinh sản sau X (giờ) ghi lại bảng sau qua thí nghiệm: X Y 30 32 35 40 48 52 (a) Tìm hệ số tương quan mẫu cho nhận xét (b) Viết phương trình đường hồi quy tuyến tính thực nghiệm Y theo X Dự báo số vi khuẩn sau 10 Để nghiên cứu tác dụng phân vi sinh X (tạ/ha) tới suất cà chua Y (tấn/ha), người ta thí nghiệm 20 ruộng Sau thu hoạch ta có kết sau: X Y 20 22 24 0,15 0,17 0,19 0,21 0,23 2 (a) Tìm hệ số tương quan mẫu cho nhận xét (b) Viết phương trình hồi quy tuyến tính thực nghiệm Y theo X 148 Chương 6: Tương quan hồi quy Để thực cơng trình nghiên cứu mối quan hệ chiều cao Y (m) đường kính X (cm) loại cây, người ta quan sát mẫu ngẫu nhiên có kết quả: xi yi 28 28 24 30 60 10 30 32 42 43 49 10 (a) Tìm hệ số tương quan mẫu cho nhận xét (b) Viết phương trình hồi quy tuyến tính thực nghiệm Y theo X Hãy dự báo chiều cao có đường kính 45 (cm) 10 Chiều dài xương đùi X (cm) chiều cao Y (cm) người đàn ông độ tuổi 20 − 30 biến ngẫu nhiên tuân theo quy luật phân phối chuẩn Đo chiều dài xương đùi chiều cao 10 người đàn ông chọn ngẫu nhiên độ tuổi Kết cho bảng sau: xi yi 44 155 46 159 47 163 47 166 48 169 49 172 50 174 50 176 51 176 52 179 (a) Tính hệ số tương quan mẫu cho nhận xét mức độ tương quan X Y (b) Viết phương trình hồi quy tuyến tính mẫu Y theo X Hãy dự báo xem giá trị X giảm bớt (cm) giá trị tương ứng Y biến thiên nào? Tại sao? 11 Dựa vào mẫu ngẫu nhiên cỡ 18 chọn từ tổng thể (X, Y ) có phân phối chuẩn hai chiều, người ta tính giá trị hệ số tương quan mẫu r = 0,32 Với mức ý nghĩa 5%, có tương quan tuyến tính X Y khơng? 12 Nghiên cứu lượng phân bón X (kg) dùng để bón cho ruộng vụ, suất lúa Y (kg / 1000 m2 ), người ta thống kê 30 hộ gia đình, kết sau: xi yi Số hộ 40 270 40 280 50 280 50 290 50 300 60 300 60 310 60 320 (a) Tính hệ số tương quan mẫu X Y (b) Viết phương trình hồi quy tuyến tính thực nghiệm Y theo X 13 Nghiên cứu cho thấy lượng đạm (N ) cácbon (C) mùn có liên hệ với theo dạng tuyến tính Hãy xác nhận lại nhận định qua ví dụ đất Lâm nghiệp Quảng Ninh sau (số liệu trích từ môn Đất trường Đại học Lâm nghiệp): C N 1,79 0,06 4,39 0,42 3,07 0,18 4,40 0,30 3,10 0,22 5,60 0,38 7,81 0,46 3,95 0,23 4,71 0,42 (a) Tìm hệ số tương quan mẫu (b) Xây dựng đường hồi quy tuyến tính thực nghiệm N theo C (c) Kiểm tra lại nhận định N C có quan hệ tuyến tính 6.4 Hồi quy tuyến tính 149 14 Nghiên cứu mối liên hệ X (VNĐ) số tiền đầu tư cho việc phịng bệnh tính đầu người Y tỷ lệ người mắc bệnh 50 địa phương thu bảng tương quan thực nghiệm sau: Y% X 100 200 300 400 500 2,0 2,5 3,0 3,5 4,0 6 3 (a) Tìm hệ số tương quan mẫu (b) Xây dựng đường hồi quy tuyến tính thực nghiệm Y theo X (c) Nếu năm sau đầu tư cho phịng bệnh 600đ/người tỷ lệ mắc bệnh khoảng %? 15 X% Y (kg/mm2 ) hai tiêu chất lượng loại sản phẩm Điều tra số sản phẩm, người ta giá trị (xi , yi ) biến ngẫu nhiên X, Y sau: (2,5); (2,5); (6,10); (6,20); (6,15); (8,15); (6,10); (6,15); (6,10); (6,20); (4,15); (4,10); (4,15); (6,20) (8,15) (4,10); (8,20); (6,15); (6,15); (6,15); (2,10); (6,10); (6,15); (6,25); (8,25); (8,25); (8,15); (8,20); (8,20); (8,15); (a) Tính hệ số tương quan mẫu X Y (b) X Y có thực tương quan tuyến tính khơng mức ý nghĩa 3%? (c) Viết phương trình hồi quy tuyến tính thực nghiệm Y theo X 16 Nghiên cứu số lượng protein chứa hạt lúa mì suất lúa 10 ruộng kích thước, kết đo đạc sau: Năng suất xi Tỷ lệ protein yi 9,9 10,2 11 11,6 10,7 10,8 12,1 12,5 11,8 12,2 Năng suất xi Tỷ lệ protein yi 12,5 12,8 13,5 14,3 14,4 12,8 12,4 11,8 11,8 12,6 (a) Tính hệ số tương quan mẫu cho nhận xét (b) Xác định đường hồi quy tuyến tính thực nghiệm Y theo X 17 Hãy tìm hệ số tương quan mẫu, cho nhận xét viết phương trình hồi quy tuyến tính thực nghiệm Y theo X với số liệu cho bảng tương quan thực nghiệm chiều sau: 150 Chương 6: Tương quan hồi quy (a) Y X 25 28 1 50 55 60 65 70 75 80 (b) 31 6 34 37 X Y 100 200 10 26 30 34 38 42 2 1 (c) Y X 100 200 300 400 500 2,5 X 15 25 35 45 55 10 20 20 26 400 500 10 (d) 3,5 6 3 X Y 2 2 2 1 (e) Y 300 (f) 30 23 30 10 40 47 11 50 20 60 Y X 10 30 1 35 40 45 1 2 50 Phụ lục 1 ∫u −t2 /2 Bảng 1: Bảng giá trị hàm Laplace Φ0 (u) = √ e dt 2π u 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30 0,31 0,32 0,33 0,34 0,35 Φ0 (u) 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,0793 0,0832 0,0871 0,0910 0,0948 0,0984 0,1026 0,1064 0,1103 0,1141 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 u 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63 0,64 0,65 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74 0,75 0,76 Φ0 (u) u Φ0 (u) 0,1591 0,82 0,2939 0,1628 0,83 0,2967 0,1664 0,84 0,3995 0,1700 0,85 0,3023 0,1736 0,86 0,3051 0,1772 0,87 0,3078 0,1808 0,88 0,3106 0,1844 0,89 0,3133 0,1879 0,90 0,3159 0,1915 0,91 0,3186 0,1950 0,92 0,3412 0,1985 0,93 0,3238 0,2019 0,94 0,3264 0,2054 0,95 0,3289 0,2088 0,96 0,3315 0,2123 0,97 0,3340 0,2157 0,98 0,3365 0,2190 0,99 0,3389 0,2224 1,00 0,3413 0,2257 1,01 0,3438 0,2291 1,02 0,3461 0,2324 1,03 0,3485 0,2357 1,04 0,3508 0,2389 1,05 0,3531 0,2422 1,06 0,3554 0,2454 1,07 0,3577 0,2486 1,08 0,3599 0,2517 1,09 0,3621 0,2549 1,10 0,3643 0,2580 1,11 0,3665 0,2611 1,12 0,3686 0,2612 1,13 0,3708 0,2673 1,14 0,3729 0,2703 1,15 0,3749 0,2734 1,16 0,3770 0,2764 1,17 0,3790 (Xem tiếp trang sau) 151 Bảng u 0,36 0,37 0,38 0,39 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 1,31 1,32 1,33 1,34 1,35 1,36 1,37 1,38 1,39 1,40 1,41 1,42 1,43 1,44 1,45 1,46 1,47 1,48 1,49 1,50 1,51 1,52 1,53 1,54 1,55 1,56 1,57 1,58 – (Tiếp theo) Φ0 (u) u Φ0 (u) u Φ0 (u) 0,1406 0,77 0,2794 1,18 0,3810 0,1443 0,78 0,2823 1,19 0,3830 0,1480 0,79 0,2852 1,20 0,3849 0,1517 0,80 0,2881 1,21 0,3869 0,3907 1,68 0,4535 2,26 0,4881 0,3925 1,69 0,4545 2,28 0,4887 0,3944 1,70 0,4554 2,30 0,4893 0,3962 1,71 0,4564 2,32 0,4898 0,3980 1,72 0,4573 2,34 0,4904 0,3997 1,73 0,4582 2,36 0,4909 0,4015 1,74 0,4591 2,38 0,4913 0,4032 1,75 0,4599 2,40 0,4918 0,4049 1,76 0,4608 2,42 0,4922 0,4066 1,77 0,4616 2,44 0,4927 0,4082 1,78 0,4625 2,46 0,4931 0,4099 1,79 0,4633 2,48 0,4934 0,4115 1,80 0,4641 2,50 0,4938 0,4131 1,81 0,4649 2,52 0,4941 0,4147 1,82 0,4656 2,54 0,4945 0,4162 1,83 0,4664 2,56 0,4948 0,4177 1,84 0,4671 2,58 0,4951 0,4192 1,85 0,4678 2,60 0,4953 0,4207 1,86 0,4686 2,62 0,4956 0,4222 1,87 0,4693 2,64 0,4959 0,4236 1,88 0,4699 2,66 0,4961 0,4251 1,89 0,4706 2,68 0,4963 0,4265 1,90 0,4713 2,70 0,4965 0,4279 1,91 0,4719 2,72 0,4967 0,4292 1,92 0,4726 2,74 0,4969 0,4306 1,93 0,4732 2,76 0,4971 0,4319 1,94 0,4738 2,78 0,4973 0,4332 1,95 0,4744 2,80 0,4974 0,4345 1,96 0,4750 2,82 0,4976 0,4357 1,97 0,4756 2,84 0,4977 0,4370 1,98 0,4761 2,86 0,4979 0,4382 1,99 0,4767 2,88 0,4980 0,4394 2,00 0,4772 2,90 0,4981 0,4406 2,02 0,4783 2,92 0,4982 0,4418 2,04 0,4793 2,94 0,4984 0,4429 2,06 0,4803 2,96 0,4985 (Xem tiếp trang sau) 152 Bảng u 1,59 1,60 1,61 1,62 1,63 1,64 1,65 1,66 1,67 – (Tiếp theo) Φ0 (u) u Φ0 (u) 0,4441 2,08 0,4812 0,4452 2,10 0,4921 0,4463 2,12 0,4830 0,4474 2,14 0,4838 0,4484 2,16 0,4846 0,4495 2,18 0,4854 0,4505 2,20 0,4861 0,4515 2,22 0,4868 0,4525 2,24 0,4875 153 u 2,98 3,00 3,20 3,40 3,60 3,80 4,00 4,50 5,00 Φ0 (u) 0,4986 0,49865 0,49931 0,49966 0,499841 0,499928 0,499968 0,499997 0,499997 Phụ lục Bảng 2: Bảng giá trị phân vị uα thỏa mãn P (U < uα ) = α α 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63 0,64 0,65 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74 uα 0,00 0,025 0,030 0,075 0,100 0,126 0,151 0,176 0,202 0,228 0,253 0,279 0,305 0,332 0,358 0,385 0,412 0,440 0,468 0,496 0,524 0,553 0,583 0,613 0,643 α 0,75 0,76 0,77 0,78 0,79 0,80 0,81 0,82 0,83 0,84 0,85 0,86 0,87 0,88 0,89 0,90 0,905 0,910 0,915 0,920 0,925 0,930 0,931 0,932 0,933 uα 0,674 0,706 0,739 0,772 0,806 0,842 0,878 0,915 0,954 0,994 1,036 1,080 1,126 1,175 1,227 1,282 1,311 1,341 1,372 1,405 1,440 1,476 1,514 1,555 1,598 α 0,95 0,951 0,952 0,953 0,954 0,955 0,956 0,957 0,958 0,959 0,960 0,961 0,962 0,963 0,964 0,965 0,966 0,967 0,968 0,969 0,970 0,971 0,972 0,973 0,974 uα = −u1−α 154 uα 1,645 1,655 1,665 1,675 1,685 1,695 1,706 1,717 1,728 1,739 1,751 1,762 1,774 1,787 1,799 1,812 1,825 1,837 1,852 1,866 1,881 1,896 1,911 1,927 1,943 α 0,975 0,976 0,977 0,978 0,979 0,980 0,981 0,982 0,983 0,984 0,985 0,986 0,987 0,988 0,989 0,990 0,991 0,992 0,993 0,994 0,995 0,996 0,997 0,998 0,999 uα 1,96 1,977 1,995 2,014 2,034 2,054 2,075 2,097 2,120 2,144 2,170 2,197 2,226 2,257 2,290 2,326 2,366 2,409 2,457 2,512 2,576 2,652 2,748 2,878 3,090 Phụ lục (n) (n) Bảng 3: Bảng giá trị phân vị Student tα thỏa mãn P (T < tα ) = α α n 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0,90 0,95 0,975 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 12,706 31,821 63,657 4,303 6,965 9,925 3,183 4,541 4,541 2,776 3,767 4,601 2,571 3,365 4,032 2,447 3,143 3,707 2,365 2,998 3,499 2,306 2,896 3,335 2,262 2,821 3,325 2,228 2,764 3,169 2,201 2,718 3,106 2,179 2,681 3,055 2,160 2,650 3,012 2,145 2,624 2,977 2,131 2,602 2,974 2,120 2,583 2,921 2,110 2,567 2,898 2,101 2,552 2,878 2,093 2,539 2,861 2,086 2,528 2,845 2,080 2,518 2,831 2,074 2,508 2,819 2,069 2,500 2,807 2,064 2,492 2,797 2,060 2,485 2,787 2,056 2,479 2,779 2,052 2,473 2,771 2,048 2,467 2,763 2,045 2,462 2,756 2,042 2,457 2,750 155 0,99 0,995 156 Phụ lục u −3,4 −3,3 −3,2 −3,1 −3,0 −2,9 −2,8 −2,7 −2,6 −2,5 −2,4 −2,3 −2,2 −2,1 −2,0 −1,9 −1,8 −1,7 −1,6 −1,5 −1,4 −1,3 ,00 0,0003 0,0005 0,0007 0,0010 0,0013 0,0019 0,0026 0,0035 0,0047 0,0062 0,0082 0,0107 0,0139 0,0179 0,0228 0,0287 0,0359 0,0446 0,0548 0,0668 0,0808 0,0968 ,01 0,0003 0,0005 0,0007 0,0009 0,0013 0,0018 0,0025 0,0034 0,0045 0,0060 0,0080 0,0104 0,0136 0,0174 0,0222 0,0281 0,0351 0,0436 0,0537 0,0655 0,0793 0,0951 ,02 0,0003 0,0005 0,0006 0,0009 0,0013 0,0017 0,0024 0,0033 0,0044 0,0059 0,0078 0,0102 0,0132 0,0170 0,0217 0,0274 0,0344 0,0427 0,0526 0,0643 0,0778 0,0934 ,03 0,0003 0,0004 0,0006 0,0009 0,0012 0,0017 0,0023 0,0032 0,0043 0,0057 0,0075 0,0099 0,0129 0,0166 0,0212 0,0268 0,0336 0,0418 0,0516 0,0630 0,0764 0,0918 ,04 0,0003 0,0004 0,0006 0,0008 0,0012 0,0016 0,0023 0,0031 0,0041 0,0055 0,0073 0,0096 0,0125 0,0162 0,0207 0,0262 0,0329 0,0409 0,0505 0,0618 0,0749 0,0901 ,05 0,0003 0,0004 0,0006 0,0008 0,0011 0,0016 0,0022 0,0030 0,0040 0,0054 0,0071 0,0094 0,0122 0,0158 0,0202 0,0256 0,0322 0,0401 0,0495 0,0606 0,0735 0,0885 ,06 0,0003 0,0004 0,0006 0,0008 0,0011 0,0015 0,0021 0,0029 0,0039 0,0052 0,0069 0,0091 0,0119 0,0154 0,0197 0,0250 0,0314 0,0392 0,0485 0,0594 0,0722 0,0869 ,07 ,08 ,09 0,0003 0,0003 0,0002 0,0004 0,0004 0,0003 0,0005 0,0005 0,0005 0,0008 0,0007 0,0007 0,0011 0,0010 0,0010 0,0015 0,0014 0,0014 0,0021 0,0020 0,0019 0,0028 0,0027 0,0026 0,0038 0,0037 0,0036 0,0051 0,0049 0,0048 0,0068 0,0066 0,0064 0,0089 0,0087 0,0084 0,0116 0,0113 0,0110 0,0150 0,0146 0,0143 0,0192 0,0188 0,0183 0,0244 0,0239 0,0233 0,0307 0,0301 0,0294 0,0384 0,0375 0,0367 0,0475 0,0465 0,0455 0,0582 0,0571 0,0559 0,0708 0,0694 0,0681 0,0853 0,0838 0,0823 (Xem tiếp trang sau) ∫u −t2 /2 e dt Bảng 4: Bảng giá trị hàm Φ(u) = √ 2π −∞ 157 u −1,2 −1,1 −1,0 −0,9 −0,8 −0,7 −0,6 −0,5 −0,4 −0,3 −0,2 −0,1 −0,0 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 ,00 0,1151 0,1357 0,1587 0,1841 0,2119 0,2420 0,2743 0,3085 0,3446 0,3821 0,4207 0,4062 0,5000 0,5000 0,5398 0,5793 0,6179 0,6554 0,6915 0,7257 0,7580 0,7881 0,8159 0,8413 0,8643 0,8849 ,01 0,1131 0,1335 0,1562 0,1814 0,2090 0,2389 0,2709 0,3050 0,3409 0,3783 0,4168 0,4562 0,4960 0,5040 0,5438 0,5832 0,6217 0,6591 0,6950 0,7291 0,7611 0,7910 0,8186 0,8438 0,8665 0,8869 ,02 0,1112 0,1314 0,1539 0,1788 0,2061 0,2358 0,2676 0,3015 0,3372 0,3745 0,4129 0,4522 0,4920 0,5080 0,5478 0,5871 0,6255 0,6628 0,6985 0,7324 0,7642 0,7939 0,8212 0,8461 0,8686 0,8888 Bảng ,03 0,1093 0,1292 0,1515 0,1762 0,2033 0,2327 0,2643 0,2981 0,3336 0,3707 0,4090 0,4483 0,4880 0,5120 0,5517 0,5910 0,6293 0,6664 0,7019 0,7357 0,7673 0,7967 0,8238 0,8485 0,8708 0,8907 – (Tiếp theo) ,04 ,05 0,1075 0,1056 0,1271 0,1251 0,1492 0,1469 0,1736 0,1711 0,2005 0,1977 0,2296 0,2266 0,2611 0,2578 0,2946 0,2912 0,3300 0,3264 0,3669 0,3632 0,4052 0,4013 0,4443 0,4404 0,4840 0,4801 0,5160 0,5199 0,5557 0,5596 0,5948 0,5987 0,6331 0,6368 0,6700 0,6736 0,7054 0,7088 0,7389 0,7422 0,7704 0,7734 0,7995 0,8023 0,8264 0,8289 0,8508 0,8531 0,8729 0,8749 0,8925 0,8944 ,06 0,1038 0,1230 0,1446 0,1685 0,1949 0,2236 0,2546 0,2877 0,3228 0,3594 0,3974 0,4364 0,4761 0,5239 0,5636 0,6026 0,6406 0,6772 0,7123 0,7454 0,7764 0,8051 0,8315 0,8554 0,8770 0,8962 ,07 ,08 ,09 0,1020 0,1003 0,0985 0,1210 0,1190 0,1170 0,1423 0,1401 0,1379 0,1660 0,1635 0,1611 0,1922 0,1894 0,1867 0,2206 0,2177 0,2148 0,2514 0,24843 0,2451 0,2843 0,2810 0,2776 0,3192 0,3156 0,3121 0,3557 0,3520 0,3483 0,3936 0,3897 0,3859 0,4325 0,4286 0,4247 0,4721 0,4681 0,4641 0,5279 0,5319 0,5359 0,5675 0,5714 0,5753 0,6064 0,6103 0,6141 0,6443 0,6480 0,6517 0,6808 0,6844 0,6879 0,7157 0,7190 0,7224 0,7486 0,7517 0,7549 0,7794 0,7823 0,7852 0,8078 0,8106 0,8133 0,8340 0,8365 0,8389 0,8577 0,8599 0,8621 0,8790 0,8810 0,8830 0,8980 0,8997 0,9015 (Xem tiếp trang sau) 158 u 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 ,00 0,9032 0,9192 0,9332 0,9452 0,9554 0,9641 0,9713 0,9772 0,9821 0,9861 0,9893 0,9918 0,9938 0,9953 0,9965 0,9974 0,9981 0,9987 0,9990 0,9993 0,9995 0,9997 ,01 0,9049 0,9207 0,9345 0,9463 0,9564 0,9649 0,9719 0,9778 0,9826 0,9864 0,9896 0,9920 0,9940 0,9955 0,9966 0,9975 0,9982 0,9987 0,9991 0,9993 0,9995 0,9997 ,02 0,9066 0,9222 0,9357 0,9474 0,9573 0,9656 0,9726 0,9783 0,9830 0,9868 0,9898 0,9922 0,9941 0,9956 0,9967 0,9976 0,9982 0,9987 0,9991 0,9994 0,9995 0,9997 Bảng ,03 0,9082 0,9236 0,9370 0,9484 0,9582 0,9664 0,9732 0,9788 0,9834 0,9871 0,9901 0,9925 0,9943 0,9957 0,9968 0,9977 0,9983 0,9988 0,9991 0,9994 0,9995 0,9997 – (Tiếp theo) ,04 ,05 0,9099 0,9115 0,9251 0,9265 0,9382 0,9394 0,9495 0,9505 0,9591 0,9599 0,9671 0,9678 0,9738 0,9744 0,9793 0,9798 0,9838 0,9842 0,9875 0,9878 0,9904 0,9906 0,9927 0,9929 0,9945 0,9946 0,9959 0,9960 0,9969 0,9970 0,9977 0,9978 0,9984 0,9984 0,9988 0,9989 0,9992 0,9992 0,9994 0,9994 0,9996 0,9996 0,9997 0,9997 ,06 0,9131 0,9279 0,9406 0,9515 0,9608 0,9686 0,9750 0,9803 0,9846 0,9881 0,9909 0,9931 0,9948 0,9961 0,9971 0,9979 0,9985 0,9989 0,9992 0,9994 0,9996 0,9997 ,07 0,9147 0,9292 0,9418 0,9525 0,9616 0,9693 0,9756 0,9808 0,9850 0,9884 0,9911 0,9932 0,9949 0,9962 0,9972 0,9979 0,9985 0,9989 0,9992 0,9995 0,9996 0,9997 ,08 0,9162 0,9306 0,9429 0,9535 0,9625 0,9699 0,9761 0,9812 0,9854 0,9887 0,9913 0,9934 0,9951 0,9963 0,9973 0,9980 0,9986 0,9990 0,9993 0,9995 0,9996 0,9997 ,09 0,9177 0,9319 0,9441 0,9545 0,9633 0,9706 0,9767 0,9817 0,9857 0,9890 0,9916 0.9936 0,9952 0,9964 0,9974 0,9981 0,9986 0,9990 0,9993 0,9995 0,9997 0,9998 Tài liệu tham khảo [1] Dương Công Chủ, Nguyễn Thái Hịa, Phương pháp giải tốn tốn trọng điểm Giải tích tổ hợp xác suất, Nhà xuất Đà Nẵng, 1998 [2] Đào Hữu Hồ, Xác suất thống kê, Nhà xuất Đại học quốc gia Hà Nội, 2001 [3] Nguyễn Văn Nhân, Bài tập câu hỏi trắc nghiệm đại số tổ hợp, Nhà xuất Đại học Quốc gia Hà Nội, 2007 [4] Nguyễn Thái Ninh, Hướng dẫn giải tập xác suất thống kê toán, Nhà xuất Thống kê, Hà Nội, 2002 [5] Tống Đình Quỳ, Giáo trình xác suất thống kê, Nhà xuất Giáo dục, 1999 [6] Đặng Hùng Thắng, Mở đầu lý thuyết xác suất ứng dụng, Nhà xuất Giáo dục, 2009 [7] Lê Văn Thành, Bài giảng xác suất thống kê toán học, Available at GIANG DAY - Le Van Thanh, Vinh University [8] Nguyễn Cao Văn (chủ biên), Trần Thái Ninh, Giáo trình lý thuyết xác suất thống kê Toán, Nhà xuất Thống kê, 2004 [9] Lê Đức Vĩnh, Giáo trình Xác suất thống kê, Nhà xuất Nông nghiệp, 2014 [10] A R Hoshmand, Statistical Methods for Environmental and Agricultural Sciences, Second Edition, CRC Press, Boca Raton New York, 1998 [11] Gerald Keller, Statistics for Management and Economics: Custom Edition for Information Systems and Dicision Sciences 361 A/B, Ninth Edition, Cengage Learning, 5191 Natorp Boulevard, Mason, Ohio 45040, USA, 2012 [12] W Mendenhall, R J Beaver, B M Beaver, Introduction to Probability and Statistics, Brooks/ Cole Cengage Learning, 10 Davis Drive, Belmont, CA 940002-3098, USA, 2009 [13] A B Michael, Probability: The Science of Uncertainty with application to Investments, Insurance, and Engineering, American Mathematical Society, 2009 [14] C G Narayan, Introduction to Probability and Statistics, New York, USA, 1993 [15] M L Samuels, J A.Witmer and A A Schaffner, Statistics for the life sciences, Prentice Hall, 2012 159

Ngày đăng: 03/08/2023, 10:36

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan