Định lý Bayes là định lý có vai trò rất quan trọng trong xác suất và thống kê bởi ý tưởng của định lý Bayes trong xác suất là việc tính xác suất hậu nghiệm của một biến cố dựa trên việc
Trang 1TRƯỜNG ĐẠI HỌC CẦN THƠ KHOA KHOA HỌC TỰ NHIÊN
Trang 2LỜI CẢM ƠN - -
Trong suốt quá trình học tập và thực hiện luận văn tôi đã nhận được sự giúp
đỡ, động viên và sự hướng dẫn tận tình của quý Thầy, quý Cô, Cha, Mẹ, bạn bè cũng như sự nổ lực, cố gắng của bản thân để hoàn thành luận văn này
Tôi xin chân thành gửi lời cảm ơn đến:
Cô Dương Thị Bé Ba người đã tận tình hướng dẫn và dành nhiều thời gian quý báu của mình để truyền đạt kiến thức, giúp đỡ tôi hoàn thành luận văn này
Toàn thể quý thầy cô bộ môn Toán – Khoa Khoa học Tự nhiên của trường Đại học Cần thơ đã trang bị cho tôi những kiến thức cơ bản, những kỹ năng cần thiết trong suốt quá trình học tập tại trường, đó là hành trang quý báu không chỉ giúp tôi hoàn thành tốt luận văn mà còn giúp tôi tự tin hơn trên con đường sự nghiệp phía trước
Quý Thầy, quý Cô trong Hội đồng bảo vệ luận văn đã dành nhiều thời gian
để xem xét và đóng góp những ý kiến quý báu để bài luận văn được hoàn thiện hơn
Toàn thể các bạn sinh viên chuyên ngành Toán Ứng Dụng khóa 36, những người bạn luôn sát cánh và tận tình giúp đỡ tôi trong suốt quá trình vừa qua
Cuối cùng, tôi xin bày tỏ lòng kính trọng và sự biết ơn sâu sắc nhất đến Cha,
Mẹ và các anh, chị em trong gia đình đã luôn ủng hộ tôi về mọi phương diện, đây là nguồn sức mạnh tinh thần lớn nhất giúp tôi vươn lên trong cuộc sống
Tôi xin chân thành cám ơn!
Cần Thơ, tháng 5 năm 2014
Danh Đảnh
Trang 3xã hội và đáp ứng nhu cầu thông tin thống kê của các tổ chức, cá nhân,… Do đó, thống kê có tính ứng dụng rất cao trong thực tế trong đó có hai bài toán cơ bản là ước lượng và kiểm định giả thiết thống kê
Trong khoa học có hai trường phái thống kê: Trường phái thống kê cổ điển
và trường phái thống kê Bayes Hai trường phái thống kê này khác nhau về triết lý khoa học và nhất là cách hiểu về khái niệm xác suất Thống kê cổ điển dựa vào những kết quả quan sát mẫu của hiện tại mà không quan tâm đến những thông tin liên quan về số liệu đã biết trước Các kết luận trong thống kê cổ điển đều dựa trên
dữ liệu mẫu Trong khi đó, thống kê Bayes dựa trên những thông tin dữ liệu đã biết trước về vấn đề đã quan sát để suy luận cho thống kê hiện tại Trong thống kê Bayes, thông tin tiền nghiệm cấu thành nên cơ sở lý thuyết, các kết luận dựa trên cơ
sở đã biết kết hợp với dữ liệu quan sát Do đó, các kết luận trong thống kê Bayes có
độ chính xác cao hơn Đặc biệt, trước sự phát triển mạnh mẽ của công nghệ thông tin cũng những phần mềm toán học, việc lưu trữ thông tin rất thuận lợi Do đó, thống kê Bayes ngày càng có điều kiện phát triển hơn
Với các lý do nêu trên em chọn đề tài “Ước lượng và kiểm định tham số
thống kê bằng phương pháp Bayes” để làm luận văn tốt nghiệp cuối khóa
II Mục đích nghiên cứu
Luận văn được nghiên cứu với mục đích
Tổng kết một cách có hệ thống các vấn đề có liên quan đến thống kê Bayes
Trang 4 Nghiên cứu một số ứng dụng của thống kê Bayes trong kinh tế và xã hội
III Phương pháp nghiên cứu
Sưu tầm, tham khảo các tài liệu có liên quan đến đề tài
Tổng hợp, hệ thống hóa kiến thức được trình bày trong tài liệu để từ đó trình bài lại các vấn đề có liên quan một cách logic, có hệ thống
IV Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: Các vấn đề lý thuyết có liên quan đến thống kê
Bayes
Phạm vi nghiên cứu: Vì thời gian và kiến thức có hạn nên đề tài của em chỉ
nghiên cứu hai bài toán cơ bản là ước lượng và kiểm định tham số thống kê bằng phương pháp Bayes
V Bố cục luận văn
Cấu trúc luận văn bao gồm phần mở đầu, phần nội dung và phần kết luận Trong đó, phần nội dung gồm 4 chương:
Chương 1: Kiến thức chuẩn bị
Trong chương này trình bày một số vấn đề cơ bản về thống kê Bayes như: thông tin tiền nghiệm, thông tin hậu nghiệm và một số hàm mật độ xác suất thông dụng Đây là cơ sở lý thuyết cho việc xây dựng bài toán ước lượng và kiểm định được trình bày trong chương 2 và chương 3
Chương 2: Ước lượng tham số bằng phương pháp Bayes
Trong chương này trình bày bài toán ước lượng tham số thống kê bằng phương pháp Bayes
Chương 3: Kiểm định tham số bằng phương pháp Bayes
Trong chương này trình bày bài toán kiểm định tham số thống kê bằng
phương pháp Bayes
Chương 4: Bài tập áp dụng
Trình bày hệ thống bài tập ứng dụng một số vấn đề đã thực hiện trong lý thuyết
Trang 5MỤC LỤC
LỜI CẢM ƠN i
PHẦN MỞ ĐẦU ii
I Lý do chọn đề tài ii
II Mục đích nghiên cứu ii
III Phương pháp nghiên cứu iii
IV Đối tượng và phạm vi nghiên cứu iii
V Bố cục luận văn iii
MỤC LỤC iv
CHƯƠNG 1: KIẾN THỨC CHUẨN BỊ 1
1.1 ĐỊNH LÝ BAYES 1
1.1.1 Định lý Bayes cho đại lượng ngẫu nhiên rời rạc 1
1.1.2 Định lý Bayes cho đại lượng ngẫu nhiên liên tục 4
1.2 PHÂN PHỐI TIỀN NGHIỆM VÀ PHÂN PHỐI HẬU NGHIỆM 5
1.2.1 Phân phối tiền nghiệm 5
1.2.2 Phân phối hậu nghiệm 5
1.2.3 Hàm mật độ xác suất hậu nghiệm cho tham số 10
CHƯƠNG 2: ƯỚC LƯỢNG THAM SỐ THỐNG KÊ BẰNG PHƯƠNG PHÁP BAYES .16
2.1 ƯỚC LƯỢNG ĐIỂM THAM SỐ THỐNG KÊ 16
2.2 ƯỚC LƯỢNG KHOẢNG THAM SỐ THỐNG KÊ 16
2.2.1 Một số bài toán ước lượng liên quan đến trung bình 17
2.2.2 Một số bài toán ước lượng liên quan đến tỷ lệ 21
CHƯƠNG 3: KIỂM ĐỊNH THAM SỐ THỐNG KÊ BẰNG PHƯƠNG PHÁP BAYES 24
3.1 TỔNG QUAN VỀ BÀI TOÁN KIỂM ĐỊNH THỐNG KÊ 24
3.2 MỘT SỐ BÀI TOÁN KIỂM ĐỊNH LIÊN QUAN ĐẾN TRUNG BÌNH 25
3.2.1 Kiểm định trung bình 25
3.2.2 So sánh hai trung bình 26
3.3 MỘT SỐ BÀI TOÁN KIỂM ĐỊNH LIÊN QUAN ĐẾN TỶ LỆ 31
3.3.1 Kiểm định một tỷ lệ 31
3.3.2 So sánh hai tỷ lệ 33
CHƯƠNG 4: BÀI TẬP ÁP DỤNG 36
PHẦN KẾT LUẬN 52
TÀI LIỆU THAM KHẢO 53
PHỤ LỤC 54
Trang 6Phụ lục 1 Bảng phân vị chuẩn tắc z 54 Phụ lục 2 Bảng phân vị Student 55 Phụ lục 3 Bảng giá trị tích phân Laplace 56
Trang 7CHƯƠNG 1: KIẾN THỨC CHUẨN BỊ
Như ta đã biết, xác suất và thống kê có mối liên hệ rất mật thiết với nhau Xác suất như là công cụ để các nhà thống kê sử dụng thông tin trên một mẫu để đưa
ra những suy luận hay mô tả tổng thể từ mẫu được lấy ra Định lý Bayes là định lý
có vai trò rất quan trọng trong xác suất và thống kê bởi ý tưởng của định lý Bayes trong xác suất là việc tính xác suất hậu nghiệm của một biến cố dựa trên việc biết được xác suất của biến cố tiền nghiệm, hầu như trong thực tế đa số các biến cố luôn chịu tác động của nhiều biến cố khác nhau Chính vì vậy nên định lý Bayes có tính ứng dụng rất cao Nền tảng của thống kê Bayes là việc mở rộng định lý Bayes đối với đại lượng ngẫu nhiên rời rạc cho đại lượng ngẫu nhiên liên tục Trong xác suất,
sử dụng định lý Bayes để thiết lập hàm mật độ xác suất hậu nghiệm cho một giai đoạn và mở rộng cho nhiều giai đoạn nhằm để xem xét cho các tham số cụ thể của phân phối nhị thức và phân phối chuẩn Trong thống kê, định lý Bayes được sử dụng để giải quyết các bài toán ước lượng, kiểm định tham số Trong chương này sẽ trình bày kiến thức nền tảng của thống kê Bayes
1.1 ĐỊNH LÝ BAYES
1.1.1 Định lý Bayes cho đại lượng ngẫu nhiên rời rạc
a Định nghĩa hệ biến cố đầy đủ
Gọi 𝛺 là không gian mẫu của một phép thử Một hệ các biến cố
𝐴1, 𝐴2, … , 𝐴𝑛 được gọi là một hệ biến cố đầy đủ hay là một hình thức chia của Ω nếu thỏa mãn hai tính chất sau
Trang 8Nhận xét: Gọi B là một biến cố bất kỳ của 𝛺 Nếu 𝐴1, 𝐴2, … , 𝐴𝑛 là hình thức chia của 𝛺 thì 𝐴1𝐵, 𝐴2𝐵, … , 𝐴𝑛𝐵 sẽ là một hình thức chia của B
b Công thức xác suất toàn phần
Vì 𝐴𝑖 , 𝑖 = 1, 𝑛 là hệ các biến cố xung khắc từng đôi nên hệ 𝐴𝑖𝐴 , 𝑖 = 1, 𝑛 cũng là
hệ các biến cố xung khắc từng đôi
c Định lý Bayes ( công thức xác suất Bayes)
Trang 9đ𝑝𝑐𝑚
Ví dụ 1.1: Có 2 lô sản phẩm Lô 1 có 20 sản phẩm trong đó có 15 sản phẩm
tốt Lô 2 có 20 sản phẩm trong đó có 10 sản phẩm tốt Lấy ngẫu nhiên một lô và trong lô đó lấy ra ngẫu nhiên một sản phẩm Giả sử sản phẩm lấy ra là sản phẩm tốt,
tính xác suất sản phẩm đó thuộc lô thứ nhất?
Giải
Gọi A là biến cố lấy ra 1 sản phẩm tốt và 𝐿1, 𝐿2 lần lƣợt là biến cố chọn đƣợc sản phẩm thuộc lô 1 và lô 2
⇒ 𝐿1, 𝐿2 là hệ biến cố đầy đủ
Xác suất đƣợc chọn của hai lô là: 𝑃 𝐿1 = 1 2 = 𝑃(𝐿2)
Theo công thức xác suất toàn phần, xác suất lấy đƣợc sản phẩm tốt là
=35
Ví dụ 1.2: Một hộp đựng 2 đồng xu, trong đó có 1 đồng xu cân đối, đồng
chất và 1 đồng xu luôn xuất hiện mặt sấp khi tung Chọn ngẫu nhiên một đồng xu từ hộp và khi tung đồng xu này lên 2 lần điều thấy nó xuất hiện mặt sấp Tính xác xuất đồng xu đã chọn là đồng xu cân đối, đồng chất
Trang 10Nếu trong 2 lần đều xuất hiện mặt sấp Khi đó, theo công thức Bayes ta được xác suất đồng xu đã chọn là đồng xu cân đối và đồng chất là
Ví dụ 1.3: Cho hai hộp đựng bi, hộp một có 6 bi vàng và 4 bi đỏ, hộp hai có
7 bi vàng và 3 bi đỏ Lấy ngẫu nhiên từ hộp một 1 viên bi và bỏ vào hộp hai, sau đó lấy từ hộp hai ra 2 viên bi Tính xác suất 2 viên bi lấy ra có màu đỏ?
1.1.2 Định lý Bayes cho đại lượng ngẫu nhiên liên tục
Cho 𝑋 là đại lượng ngẫu nhiên liên tục Khi đó, hàm phân phối xác suất có điều kiện 𝑋 khi biến cố 𝐴𝑖 đã xảy ra được xác định như sau
𝐹 𝑥 𝐴𝑖 =𝑃( 𝑋 ≤ 𝑥 , 𝐴𝑖)
𝑃(𝐴𝑖)Trong đó 𝐹 +∞|𝐴𝑖 = 1 và 𝐹 −∞ 𝐴𝑖 = 0
Hàm mật độ xác suất có điều kiện của X khi biến cố 𝐴𝑖 xảy ra được xác định như sau
Trong đó 𝑓(𝑥) được gọi là hàm mật độ xác suất kết hợp của tổng thể
Khi 𝑋 và 𝑌 là 2 đại lượng ngẫu nhiên liên tục, định lý Bayes cho trường hợp này
là hàm mật độ xác suất có điều kiện 𝑓(𝑥|𝑦) được xác định như sau
𝑓 𝑥 𝑦 = 𝑓 𝑥 𝑓(𝑦|𝑥)
𝑓 𝑥 𝑓 𝑦 𝑥 𝑑𝑥
Trang 111.2 PHÂN PHỐI TIỀN NGHIỆM VÀ PHÂN PHỐI HẬU NGHIỆM
1.2.1 Phân phối tiền nghiệm
Phân phối tiền nghiệm theo định lý Bayes còn được gọi là xác suất tiền nghiệm
là xác suất xảy ra của biến cố 𝐴 mà không quan tâm đến những biến cố khác Thông tin tiền nghiệm của các tham số là nhân tố quan trọng trong quá trình suy luận Bayes Phân phối tiền nghiệm chứa đựng đầy đủ thông tin và nếu lượng dữ liệu quan sát được càng nhiều sẽ ảnh hưởng càng lớn lên phân phối hậu nghiệm Ngược lại, khi lượng dữ liệu quá ít thì thông tin trong phân phối tiền nghiệm sẽ đóng vai trò quan trọng trong phân phối hậu nghiệm
a Tiền nghiệm mang thông tin và không mang thông tin
Tiền nghiệm mang thông tin là tiền nghiệm làm thay đổi về cơ bản những thông tin chứa trong dữ liệu Phương pháp phổ biến để thể hiện thông tin tiền nghiệm là đưa ra phân phối cho tham số chưa biết mà tham số đó phản ánh được thông tin tiền nghiệm
Trong nhiều trường hợp niềm tin tiền nghiệm của ta rất mơ hồ và vì thế rất khó để chuyển thành tiền nghiệm mang thông tin Đây là trường hợp mà ta gọi là tiền nghiệm không mang thông tin hay tiền nghiệm mơ hồ và phân phối được lựa chọn để thể hiện phân phối này là phân phối đều xác định trên các giá trị mà tham
số có thể có
Chẳng hạn, tham số chỉ trung bình 𝜇 nhận giá trị (−∞; +∞) có phân phối
tiền nghiệm không mang thông tin Tham số độ lệch chuẩn 𝜎 nhận giá trị trên
(0; +∞) có phân phối tiền nghiệm không mang thông tin
b Phân phối tiền nghiệm liên hợp
Trong nhiều trường hợp, ta mong muốn chọn được phân phối tiền nghiệm sao cho việc phân tích và tìm ra phân phối hậu nghiệm được thuận lợi nhất Giả sử dữ liệu được sinh ra từ một phân phối xác định nào đó, khi đó ta gọi phân phối tiền nghiệm liên hợp để chỉ phân phối hậu nghiệm và phân phối tiền nghiệm cùng thuộc một lớp phân phối Mặc dù có cùng dạng phân phối nhưng chúng có tham số khác nhau, tham số của phân phối hậu nghiệm phản ánh sự kết hợp giữa thông tin tiền nghiệm và dữ liệu quan sát
1.2.2 Phân phối hậu nghiệm
Phân phối hậu nghiệm hay còn gọi là xác suất có điều kiện là xác suất xảy ra biến cố 𝐴 khi biết biến cố 𝐵 đã xảy ra
a Bảng phân phối xác suất hậu nghiệm
Bảng phân phối xác suất hậu nghiệm qua một giai đoạn
Tương tự như bảng phân phối xác suất, bảng phân phối xác suất hậu nghiệm dùng để thiết lập phân phối xác suất hậu nghiệm cho biến ngẫu nhiên rời rạc mà nó cung cấp xác suất 𝑝 với mỗi các giá trị của x Yêu cầu của một bảng phân phối xác suất hậu nghiệm là 0 ≤ 𝑝 ≤ 1 và 𝑛𝑖=1𝑝𝑖 = 1 Đồng thời ta có thể dựa vào bảng để tính xác suất hậu nghiệm một cách trực quan, hay nhìn vào bảng ta có thể tính xác
suất hậu nghiệm đơn giản hơn
Trang 12Không gian Bayes
Cho hai đại lượng ngẫu nhiên rời rạc 𝑋 và 𝑌 Gọi 𝑥𝑖, 𝑖 = 1,2, … , 𝑛 là các giá trị có thể có của 𝑋 và 𝑦𝑗, 𝑗 = 1,2, … , 𝑚 là các giá trị có thể có của 𝑌 Tập hợp các bộ giá trị trong ma trận hình chữ nhật cỡ 𝑛 × 𝑚 với phần tử thứ 𝑖 cột 𝑗 trong ma trận
𝑥𝑖, 𝑦𝑗 được gọi là không gian Bayes của hai biến 𝑋 và 𝑌
Bảng 1: Không gian Bayes
Phương pháp: Gọi 𝑃 𝑥𝑖, 𝑦0 là xác suất đồng thời để đại lượng ngẫu nhiên
𝑋 nhận giá trị 𝑥𝑖 và đại lượng ngẫu nhiên 𝑌 nhận giá trị 𝑦0, ta có
𝑃 𝑥𝑖, 𝑦0 = 𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦0|𝑋 = 𝑥𝑖) Trong đó 𝑃 𝑋 = 𝑥𝑖 là xác suất tiền nghiệm của 𝑋 = 𝑥𝑖
Theo công thức Bayes thì xác suất hậu nghiệm của 𝑋 = 𝑥𝑖 và 𝑌 = 𝑦0 được xác định như sau
𝑝𝑖(1)= 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦0 = 𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦0|𝑋 = 𝑥𝑖)
𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦0|𝑋 = 𝑥𝑖)
𝑛 𝑖=1
Khi đó ta lập được bảng phân phối xác suất hậu nghiệm của 𝑋 khi 𝑌 = 𝑦0 là
Bảng 2: Bảng phân phối xác suất hậu nghiệm của X qua một giai đoạn
Ví dụ 1.4: Trong một hộp có 5 viên bi, trong đó có 2 loại bi là bi đỏ và bi đen
(số lượng bi đỏ và bi đen không được xác định) Chọn ngẫu nhiên 1 viên bi từ hộp,
Trang 13nếu ta chọn đƣợc bi đỏ kí hiệu là 𝑌 = 1 và nếu ta chọn đƣợc bi đen thì kí hiệu là
𝑌 = 0 Gọi X là số lƣợng bi đỏ trong hộp
a Tìm không gian Bayes của (𝑋, 𝑌)
b Tìm bảng phân phối xác suất hậu nghiệm của 𝑋 khi 𝑌 = 1
Trang 14Bài toán: Giả sử đại lượng ngẫu nhiên X có thể nhận giá trị 𝑥1, 𝑥2, … , 𝑥𝑛 với
xác suất chưa biết Tiến hành m lần phép thử, lần thứ nhất ta nhận được kết quả
𝑌 = 𝑦1, lần thứ hai ta nhận được kết quả 𝑌 = 𝑦2,…, và lần thứ m ta nhận được kết
quả 𝑌 = 𝑦𝑚 Vấn đề đặt ra là ta cần lập bảng phân phối xác suất hậu nghiệm cho X
Phương pháp: Mở rộng cho trường hợp một giai đoạn, bảng phân phối xác
suất hậu nghiệm của X qua m giai đoạn như sau:
Bảng 3: Bảng phân phối xác suất hậu nghiệm của X qua nhiều giai đoạn
Trong đó 𝑝𝑖(𝑚 ) được xác định như sau
𝑝𝑖(𝑚 ) = 𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦1, 𝑦2, … , 𝑦𝑚 𝑥𝑖 )
𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦1, 𝑦2, … , 𝑦𝑚 𝑥𝑖 )
𝑚 𝑖=1
Với
𝑃 𝑌 = 𝑦1, 𝑦2, … , 𝑦𝑚 𝑥𝑖 = 𝑃 𝑌 = 𝑦1 𝑋 = 𝑥𝑖 𝑃 𝑌 = 𝑦2 𝑋 = 𝑥𝑖, 𝑌 = 𝑦1 …
… 𝑃(𝑌 = 𝑦𝑚|𝑋 = 𝑥𝑖, 𝑌 = 𝑦1, 𝑌 = 𝑦2, … , 𝑌 = 𝑦𝑚 −1)
Ví dụ 1.5: Trở lại ví dụ 1.4, giả sử ta chọn lần lượt 2 viên bi từ hộp, lần đầu
ta chọn được 1 viên bi đỏ, lần 2 ta chọn tiếp 1 viên bi thì thấy kết quả là viên bi đen
Gọi X là viên bi đỏ trong hộp Lập bảng phân phối xác suất hậu nghiệm của 𝑋
Giải
Ta có
𝑃 𝑌 = 0 𝑋 = 𝑥𝑖, 𝑌 = 1 = 4 − 𝑖
4Lập bảng tính sau:
𝑃(𝑌 = 0|𝑋
= 𝑥𝑖, 𝑌 = 1) (3)
𝑝2(𝑚 ) … 𝑝3(𝑚 )
Trang 15 1/4 1
Từ bảng tính trên ta nhận được bảng phân phối xác suất hậu nghiệm của X là
P 0 0,034 0,133 0,3 0,533 0
b Bảng phân phối xác suất hậu nghiệm tham số của một số phân phối đặc biệt
Tham số tỷ lệ trong phân phối nhị thức
Bài toán: Giả sử đại lượng ngẫu nhiên có phân phối nhị thức với xác suất
thành công là 𝑝 với 𝑝 là đại lượng ngẫu nhiên có thể nhận các giá trị: 𝑝1, 𝑝2, … , 𝑝𝑚với xác suất tiên nghiệm tương ứng 𝑞1, 𝑞2, … , 𝑞𝑚 Chọn một mẫu gồm n phần tử và gọi Y là số lần thành công Ta cần tìm bảng phân phối xác suất hậu nghiệm của p khi Y nhận giá trị cụ thể 𝑌 = 𝑘
Bảng phân phối xác suất hậu nghiệm
Theo công thức Bayes, bảng phân phối xác suất hậu nghiệm của tham số p như sau
Bảng 4: Bảng phân phối xác suất hậu nghiệm trong phân phối nhị thức
𝑝𝑖(𝐵) = 𝑃 𝑝 = 𝑝𝑖 𝑌 = 𝑘 = 𝑃 𝑝 = 𝑝𝑖 𝑃(𝑌 = 𝑘|𝑝 = 𝑝𝑖)
𝑃 𝑝 = 𝑝𝑖 𝑃(𝑌 = 𝑘|𝑝 = 𝑝𝑖)
𝑚 𝑖=1
Và
𝑃 𝑝 = 𝑝𝑖 = 𝑞𝑖, 𝑃 𝑌 = 𝑘 𝑝 = 𝑝𝑖 = 𝐶𝑛𝑘𝑝𝑖𝑘 1 − 𝑝𝑖 𝑛−𝑘
Tham số trung bình của phân phối chuẩn
Mẫu quan sát qua một giai đoạn
Cho đại lượng ngẫu nhiên X có phân phối chuẩn 𝑁(𝜇, 𝜎2) với 𝜎2 đã biết và
𝜇 chưa biết Giả sử 𝜇 nhận được các giá trị 𝜇1, 𝜇2, … , 𝜇𝑛 với xác suất tiên nghiệm
𝑃 𝜇 = 𝜇𝑖 = 𝑝𝑖 Chọn một mẫu ngẫu nhiên được một giá trị cụ thể của 𝑋 là 𝑥0 Cần tìm xác suất hậu nghiệm cho các giá trị của 𝜇𝑖, 𝑖 = 1,2, … , 𝑛
Bảng phân phối xác suất hậu nghiệm của 𝝁
Áp dụng công thức Bayes ta được bảng phân phối xác suất hậu nghiệm của 𝜇 như sau
Trang 16Bảng 5: Bảng phân phối xác suất hậu nghiệm của 𝝁 qua một gia đoạn
𝑝𝑖(𝑁) = 𝑃 𝜇 = 𝜇𝑖 𝑋 = 𝑥0) = 𝑃 𝜇 = 𝜇𝑖 𝑓(𝑥0|𝜇𝑖)
𝑃 𝜇 = 𝜇𝑖 𝑓(𝑥0|𝜇𝑖)
𝑛 𝑖=1
Với
𝑓 𝑥0 𝜇𝑖 = 1
𝜎 2𝜋𝑒𝑥𝑝 −
(𝑥0 − 𝜇𝑖)22𝜎2
Mẫu quan sát qua nhiều giai đoạn
Cho đại lượng ngẫu nhiên X có phân phối chuẩn 𝑁(𝜇, 𝜎2) với 𝜎2 đã biết nhưng 𝜇 thì chưa biết Giả sử 𝜇 có thể nhận các giá trị 𝜇1, 𝜇2, … , 𝜇𝑛 với xác suất tiên nghiệm 𝑃 𝜇 = 𝜇𝑖 = 𝑝𝑖 Thực hiện phép thử 𝑚 lần ta được các giá trị của 𝑋 lần lượt là 𝑥1, 𝑥2, … , 𝑥𝑚 Ta lập bảng phân phối xác suất hậu nghiệm cho 𝜇
Bảng phân phối xác suất hậu nghiệm của 𝝁 qua nhiều giai đoạn
Khi có nhiều giai đoạn ta lần lượt tìm xác suất hậu nghiệm của 𝜇 qua từng giai đoạn một và xác suất hậu nghiệm của giai đoạn trước chính là xác suất tiên nghiệm cho giai đoạn sau Bảng phân phối xác suất hậu nghiệm của 𝜇 là dựa vào xác suất hậu nghiệm của giai đoạn cuối cùng
1.2.3 Hàm mật độ xác suất hậu nghiệm cho tham số
a Hàm mật độ xác suất hậu nghiệm khi có một quan sát
Xét đại lượng ngẫu nhiên 𝑋 với hàm mật độ xác suất 𝑓(𝑥) có tham số 𝜃 chưa biết Giả sử 𝜃 có hàm mật độ xác suất tiên nghiệm 𝑔(𝜃) Thực hiện một quan sát, ta được giá trị cụ thể của 𝑋 là 𝑥0 Khi đó hàm mật độ xác suất hậu nghiệm của 𝜃 được xác định như sau
𝑔 𝜃 𝑥0 = 𝑔 𝜃 𝑓(𝑥0|𝜃)
𝑔 𝜃 𝑓 𝑥0 𝜃 𝑑𝑥
b Hàm mật độ xác suất khi có nhiều quan sát
Trong trường hợp X nhận nhiều giá trị quan sát 𝑥1, 𝑥2, … , 𝑥𝑛 thì hàm mật độ xác suất hậu nghiệm của 𝜃 trở thành như sau
𝑔 𝜃 𝑥1, 𝑥2, … , 𝑥𝑛 = 𝑔 𝜃 𝑓(𝑥 |𝜃)
𝑔 𝜃 𝑓 𝑥 𝜃 𝑑𝑥Trong đó
𝑥 =1
𝑛 𝑥𝑖
𝑛
𝑖=1
Trang 17c Hàm mật độ xác suất hậu nghiệm cho tham số của phân phối đặc biệt
Hàm mật độ xác suất phân phối nhị thức
Đại lượng ngẫu nhiên rời rạc X được gọi là có phân phối nhị thức với hai
tham số 𝑛 và 𝑝 Kí hiệu: 𝑋~𝐵(𝑛, 𝑝) Hàm mật độ của nó được xác định như sau
Hàm mật độ xác suất hậu nghiệm của phân phối nhị thức
Bài toán: Giả sử đại lượng ngẫu nhiên có phân phối nhị thức trong đó xác
suất thành công 𝑝 là đại lượng ngẫu nhiên có hàm mật độ xác suất chưa biết Thực hiện 𝑛 lần các phép thử, gọi 𝑌 là số lần thành công Ta xác định hàm mật độ xác suất cho tham số 𝑝 theo công thức sau
Giả sử 𝑌 = 𝑚, ta có
𝑔 𝑝 𝑌 = 𝑚 = 𝑔 𝑝 𝑓(𝑌 = 𝑚|𝑝)
𝑔 𝑝 𝑓(𝑌 = 𝑚|𝑝)01Trong đó 𝑔 𝑝 là hàm mật độ xác suất tiền nghiệm của 𝑝
𝑓 𝑌 = 𝑚 𝑝 = 𝐶𝑛𝑚𝑝𝑚 1 − 𝑝 𝑛 −𝑚
Các trường hợp đặc biệt
Khi p có hàm mật độ xác suất tiên nghiệm đều
Nếu 𝑝 có hàm mật độ xác suất tiên nghiệm đều trên [0, 1] thì hàm mật độ xác suất hậu nghiệm của nó là 𝛽(𝑎, 𝑏), trong đó
Trang 18𝑔 𝑝 𝑌 = 𝑚 = 𝑓(𝑌 = 𝑚|𝑝)
𝑓 𝑌 = 𝑚 𝑝 𝑑𝑝01 =
𝐶𝑛𝑚𝑝𝑚 1 − 𝑝 𝑛−𝑚
𝐶1 𝑛𝑚𝑝𝑚 1 − 𝑝 𝑛−𝑚 0
Khi p có hàm mật độ xác suất tiên nghiệm 𝑩𝒆𝒕𝒂
Hàm mật độ xác suất hậu nghiệm cho tham số p của phân phối nhị thức, khi thực hiện n lần phép thử độc lập và có m lần thành công với hàm mật độ xác suất tiên nghiệm của tham số p có phân phối 𝛽(𝑎, 𝑏) là phân phối 𝛽(𝑎 , 𝑏 ), trong đó
𝑔 𝑝 𝑓 𝑌 = 𝑚 𝑝 = Γ(𝑎 + 𝑏)
Γ 𝑎 Γ(𝑏) 𝐶𝑛𝑚𝑝𝑎 −1 1 − 𝑝 𝑏 −𝑚 −1 = 𝑀 𝛽(𝑎 , 𝑏 )
Do đó
Trang 19𝑔 𝑝 𝑌 = 𝑚 = 𝑔 𝑝 𝑓(𝑌 = 𝑚|𝑝)
𝑔 𝑝 𝑓 𝑌 = 𝑚 𝑝 𝑑𝑝01 =
𝑀 𝛽(𝑎 , 𝑏 )
𝑀 𝛽(𝑎 , 𝑏 )01 = 𝛽(𝑎 , 𝑏 )
Nhận xét: Khi tham số p có phân phối tiên nghiệm đều trên [0, 1] thì kết quả hàm
phân phối xác suất hậu nghiệm của p là trường hợp đặc biệt khi tham số p có phân
Hàm mật độ xác suất của phân phối chuẩn
Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối chuẩn với hai tham
số 𝜇 và 𝜎2 Kí hiệu: 𝑋~𝑁(𝜇, 𝜎2) và hàm mật độ xác suất của nó được xác định như
sau
𝑓 𝑥|𝜇, 𝜎2 = 1
𝜎 2𝜋𝑒𝑥𝑝 −
𝑥 − 𝜇 22𝜎
Các tham số đặc trưng 𝑇𝑟𝑢𝑛𝑔 𝑏ì𝑛: 𝐸 𝑋 = 𝜇
𝑃ươ𝑛𝑔 𝑠𝑎𝑖: 𝑉𝑎𝑟 𝑋 = 𝜎2
Hàm mật độ xác suất hậu nghiệm của phân phối chuẩn
Bài toán: Giả sử đại lượng ngẫu nhiên X có phân phối chuẩn với tham số
trung bình là 𝜇 chưa biết, phương sai 𝜎2 đã biết Giả sử 𝜇 có hàm mật độ xác suất là
𝑔(𝜇) Thực hiện một quan sát ta được một giá trị cụ thể của X là 𝑥0 Ta tìm mật độ xác suất hậu nghiệm của 𝜇
Hàm mật độ xác suất hậu nghiệm được xác định bởi công thức
Trường hợp 𝝁 có phân phối tiên nghiệm chuẩn 𝝁~𝑵(𝒎, 𝒔𝟐)
Trang 21Khi thực hiện n lần quan sát cho X ta nhận đƣợc các giá trị cụ thể
𝑥1, 𝑥2, … , 𝑥𝑛, khi đó hàm mật độ xác suất cho 𝜇 đƣợc xác định nhƣ sau
Trang 22CHƯƠNG 2: ƯỚC LƯỢNG THAM SỐ THỐNG KÊ
BẰNG PHƯƠNG PHÁP BAYES
Một đại lượng ngẫu nhiên được đặc trưng bởi các tham số mà trong thực tế hầu như không thể biết được chúng một cách chính xác Do đó, để xác định được những tham số này người ta sẽ ước lượng chúng từ mẫu đã chọn Bài toán ước lượng tham số thống kê là bài toán ước lượng giá trị tham số chưa biết của đại lượng ngẫu nhiên dựa vào quan sát trên mẫu được lấy ra Thông thường các tham số cần ước lượng là trung bình, phương sai và tỷ lệ những phần tử nào đó đang được quan tâm trong tổng thể Căn cứ vào kết quả ước lượng, người ta chia bài toán ước lượng tham số thống kê thành hai loại là ước lượng điểm và ước lượng khoảng tham
số thống kê
2.1 ƯỚC LƯỢNG ĐIỂM THAM SỐ THỐNG KÊ
Khi nghiên cứu đại lượng ngẫu nhiên X của tổng thể, chúng ta thường không
biết phân phối xác suất của nó như thế nào, vì thế không thể biết chính xác các tham
số đặc trưng Ước lượng điểm của các giá trị tham số chưa biết của X (một tham số
hoặc nhiều tham số) là việc dựa trên một mẫu (X X1, 2, ,X n) để tìm được một thống
kê ˆ( , , , )
2
1 X X n
X
để thay thế tham số chưa biết
Việc xác định điểm ước lượng bằng phương pháp Bayes của tham số chưa biết sẽ dựa vào phân phối xác suất hậu nghiệm của tham số đó
Tuy nhiên, khi ước lượng tham số chưa biết bằng phương pháp ước lượng điểm thì ta không biết được mức độ chính xác của ước lượng Vì thế, không đánh giá được mức độ sai lầm khi ta dùng ˆ thay cho Để khắc phục các hạn chế đó,
ta sử dụng ước lượng khoảng tin cậy cho tham số
2.2 ƯỚC LƯỢNG KHOẢNG THAM SỐ THỐNG KÊ
Giả sử là một tham số của biến ngẫu nhiên X cần biết Ước lượng khoảng
tham số là xác định khoảng (1; 2) sao cho xác suất để (1; 2) bằng một độ tin cậy cho trước
Trong bài toán ước lượng khoảng, ta sử dụng một số kí hiệu sau
: Mức ý nghĩa, là khả năng có thể mắc phải sai lầm khi ước lượng
1- : Độ tin cậy của ước lượng
( 1; 2): Khoảng tin cậy của ước lượng
Thông thường trong thực tế ta chỉ ước lượng khoảng tham số với khoảng tin cậy đối xứng Trong phần này để ngắn gọn ta chỉ nói “ước lượng” thay cho cách nói đầy đủ “ước lượng khoảng tin cậy đối xứng” Khi đó, tham số cần ước lượng thuộc khoảng ( ; 1 2)( 0 ; 0 ), trong đó
Trang 23 0 là ước lượng điểm của tham số ,
là độ chính xác hay sai số của ước lượng
Sau đây là một số bài toán ước lượng tham số cơ bản bằng phương pháp Bayes
2.2.1 Một số bài toán ước lượng liên quan đến trung bình
a Ước lượng trung bình
Giả sử đại lượng ngẫu nhiên X có tham số trung bình E(X) = chưa biết Cho trước số khá nhỏ, ước lượng trung bình với mức ý nghĩa là việc chỉ ra một khoảng (1,2) sao cho P(1 2) = 1.
Trường hợp biết phương sai 𝝈𝟐
Giả sử đại lượng ngẫu nhiên X có tham số trung bình 𝜇 chưa biết nhưng phương sai 𝜎2 đã biết Tham số 𝜇 có phân phối tiên nghiệm chuẩn 𝑁 𝑚, 𝑠2 Chọn
một mẫu gồm n phần tử Tham số trung bình mẫu là đại lượng ngẫu nhiên có phân
phối chuẩn 𝑁(𝜇, 𝜎2 ) Khi đó, 𝜇 có phân phối hậu nghiệm là phân phối chuẩn 𝑛𝑁(𝑚 , 𝑠 2) với
Giả sử đại lượng ngẫu nhiên X có tham số trung bình 𝜇 chưa biết và phương
sai 𝜎2 chưa biết Tham số 𝜇 có phân phối tiên nghiệm chuẩn 𝑁 𝑚, 𝑠2 Chọn một
mẫu gồm n phần tử Trong trường hợp này, phương sai 𝜎2 chưa biết ta sẽ thay bằng phương sai mẫu điều chỉnh là
𝜎 2 = 1
𝑛 − 1 (𝑥𝑖 − 𝑥 )
2 𝑛
𝑖=1
Khi đó, tham số trung bình mẫu là đại lượng ngẫu nhiên có phân phối chuẩn 𝑁(𝜇, 𝜎 2 ) và 𝜇 có phân phối hậu nghiệm cũng là phân phối chuẩn 𝑁(𝑚𝑛 , 𝑠 2) với
Trang 24Ví dụ 2.1: Hàm lượng vitamin trong một loại trái cây là một đại lượng ngẫu
nhiên có phân phối chuẩn với tham số trung bình chưa biết và độ lệch chuẩn bằng 3 Giả sử hàm lượng vitamin có phân phối tiên nghiệm chuẩn 𝑁(30; 102) Chọn một mẫu gồm 10 trái cây đo được hàm lượng vitamin (đơn vị %) ta có số liệu sau
38.7 40.4 37.2 36.6 35.9 34.7 37.6 35.1 37.5 35.6 Hãy ước lượng hàm lượng vitamin trung bình hậu nghiệm của trái cây với độ tin cậy 95%
Giải
Gọi 𝜇 là hàm lượng vitamin trung bình của trái cây
Đây là bài toán ước lượng khoảng trung bình trong trường hợp phương sai đã biết
Vì 𝜇 có phân phối tiên nghiệm chuẩn 𝑁(30, 102) nên phân phối hậu nghiệm của 𝜇
là phân phối chuẩn 𝑁(𝑚 , 𝑠 2) với
𝑚 =𝑚/𝑠
2 + 𝑛𝑦 /𝜎2𝑛/𝜎2 + 1/𝑠2 =30/10
2 + 10.36,93/3210/32 + 1/102 = 34,13
Trang 25Ví dụ 2.2: Một người muốn ước lượng chiều cao trung bình của loài cây
trồng, được trồng trên những vùng đất khác nhau Chọn giá trị tiền nghiệm của trung bình là phân phối chuẩn 2
(30, 4 )
N Giả sử chiều cao này có phân phối chuẩn với độ lệch chuẩn chưa biết Chọn một mẫu ngẫu nhiên gồm 15 cây ta có được trung bình mẫu là 32,5 cm, độ lệch chuẩn mẫu điều chỉnh là 2,2 cm Hãy ước lượng chiều cao trung bình hậu nghiệm của cây với độ tin cậy 95%
Giải
Gọi 𝜇 là chiều cao trung bình của cây
Đây là bài toán ước lượng khoảng trung bình trong trường hợp phương sai chưa biết
Ta có 𝑦 = 32,5, 𝜎 2 = 2,2 , 𝑛 = 15 < 30
Vì 𝜇 có phân phối tiên nghiệm chuẩn 2
(30,4 )
N nên phân phối hậu nghiệm của 𝜇 là
phân phối chuẩn 𝑁(𝑚 , 𝑠 2) với
𝑚 =𝑚/𝑠
2+ 𝑛𝑦 /𝜎 2𝑛/𝜎 2 + 1/𝑠2 =
30 1 42+ 15.32,5 1 2,22
152,22+ 1 42
b Ước lượng sự khác nhau của hai trung bình
Bài toán: Giả sử X 1 và X 2 là hai đại lượng ngẫu nhiên có phân phối chuẩn
𝑋1~𝑁(𝜇1, 𝜎12), 𝑋2~𝑁 𝜇2, 𝜎22 , chúng ta muốn ước lượng sự khác nhau giữa 𝜇1 và
𝜇2 dựa trên hai mẫu quan sát độc lập của X 1 và X 2 với độ tin cậy 1 − 𝛼 cho trước
Ở đây ta chỉ xét trường hợp đã biết phương sai và hai phương sai này bằng nhau
Ta có hai mẫu 𝑦11, … , 𝑦𝑛11 , (𝑦12, … , 𝑦𝑛22) của hai đại lượng ngẫu nhiên X 1
và X 2 độc lập nên phân phối hậu nghiệm của chúng cũng độc lập Giả sử ta có phân phối tiên nghiệm: 𝜇1~𝑁(𝑚1, 𝑠12) và 𝜇2~𝑁(𝑚2, 𝑠12) Khi đó
Trang 26𝜇1|𝑦11, … , 𝑦𝑛11~𝑁(𝑚1, 𝑠 12)
𝜇2|𝑦12, … , 𝑦𝑛22~𝑁(𝑚1, 𝑠 22) Phân phối hậu nghiệm của 𝜇1 là phân phối chuẩn 𝜇1~𝑁 𝑚1, 𝑠 12 , trong đó
𝜇𝑑|𝑦11, … , 𝑦𝑛11, 𝑦12, … , 𝑦𝑛22~𝑁(𝑚𝑑, 𝑠 𝑑2) Trong đó
Ví dụ 2.3: Tốc độ ánh sáng là đại lƣợng ngẫu nhiên có phân phối chuẩn với
độ lệch chuẩn là 100, tốc độ trung bình chƣa biết Một nhà vật lý thực hiện 2 lần thí nghiệm Lần thử thứ nhất đo 20 lần có tốc độ ánh sáng trung bình 299909 và lần thử thứ hai đo 23 lần và có tốc độ ánh sáng trung bình là 299756 Giả sử tốc độ ánh sáng có phân phối tiên nghiệm chuẩn N(300000, 5002)
Ƣớc lƣợng sự khác nhau giữa 2 lần thí nghiệm với độ tin cậy 95%
Trang 27Trong đó
𝑚𝑑 = 𝑚1 − 𝑚2 = 299909,98 − 299756,42 = 152,76
𝑠 𝑑2 = 𝑠 12 + 𝑠 22 = 499 + 434,03 = 933,03 Với độ tin cậy 95% khoảng ước lượng cho sự khác nhau của hai lần thí nghiệm là
𝑃 𝑝1 < 𝑝 < 𝑝2 = 1 − 𝛼 Giả sử phân phối tiên nghiệm của tỷ lệ là 𝛽(𝑎, 𝑏) Khi đó phân phối hậu nghiệm của 𝑝 là 𝛽 𝑎 , 𝑏 Trong đó 𝑎 = 𝑎 + 𝑚, 𝑏 = 𝑏 + 𝑛 − 𝑚
Ta chứng minh được rằng 𝛽(𝑎 , 𝑏 ) xấp xỉ phân phối chuẩn với trung bình và phương sai
𝜀 = 𝑢1−𝛼 2 𝑉𝑎𝑟 𝑝
Ví dụ 2.4: Gọi 𝑝 là tỷ lệ công ty làm ô nhiễm môi trường ở một tỉnh Giả
sử 𝑝 có phân phối tiên nghiệm 𝛽(1; 4) Chọn một mẫu gồm 145 công ty có 12 công ty làm ô nhiễm môi trường, với độ tin cậy 95% hãy ước lượng công ty làm ô nhiễm môi trường của tỉnh
Giải
Ta có hàm mật độ xác suất hậu nghiệm của p là 𝛽(𝑎 , 𝑏 ) với
Trang 28𝑎 = 𝑎 + 𝑚 = 1 + 12 = 13
𝑏 = 𝑛 + 𝑏 − 𝑚 = 145 + 4 − 1 = 148 Như vậy 𝛽 𝑎 , 𝑏 = 𝛽(13,148)
0,081 − 0,042; 0,081 + 0,042 = (0.039 ; 0.123)
b Ước lượng sự khác nhau của hai tỷ lệ
Giả sử hai tổng thể 𝑤1 và 𝑤2 có tỷ lệ những phần tử có tính chất A nào đó
chưa biết Gọi 𝑝1, 𝑝2 là tỷ lệ những phần tử có tính chất A của 𝑤1 và 𝑤2 Chọn một mẫu gồm 𝑛1 phần tử từ 𝑤1 ta có 𝑚1 và 𝑛2 phần tử từ 𝑤2 ta có 𝑚2 phần tử có tính
chất A
Giả sử 𝑝1 có phân phối tiên nghiệm 𝛽(𝑎1, 𝑏1) và 𝑝2 có phân phối tiên nghiệm 𝛽(𝑎2, 𝑏2), với độ tin cậy 1 − 𝛼 cho trước
Ta cần ước lượng trung bình sự khác nhau của 2 tỷ lệ 𝑝𝑑 = 𝑝1 − 𝑝2
Ta chỉ xét trường hợp hai phân phối trên độc lập
Khi đó hai phân phối hậu nghiệm của 𝑝1 và 𝑝1 là phân phối Beta độc lập sau
𝑝1~𝛽 𝑎 1, 𝑏 1 , 𝑝2~𝛽(𝑎 2, 𝑏 2) Trong đó
𝑎 1 = 𝑎1 + 𝑚1, 𝑏 1 = 𝑏1 + 𝑛1 − 𝑚1
𝑎 2 = 𝑎2 + 𝑚2, 𝑏 2 = 𝑏2 + 𝑛2− 𝑚2
Ta có phân phối Beta xấp xỉ phân phối chuẩn, do đó phân phối hậu nghiệm của
𝑝𝑑 = 𝑝1 − 𝑝2 cũng có phân phối chuẩn 𝑁(𝑚𝑑, 𝑠 𝑑2), trong đó
𝑚𝑑 = 𝑎 1
𝑎 1 + 𝑏 1 −
𝑎 2
𝑎 2 + 𝑏 2
Trang 30CHƯƠNG 3: KIỂM ĐỊNH THAM SỐ THỐNG KÊ
BẰNG PHƯƠNG PHÁP BAYES
3.1 TỔNG QUAN VỀ BÀI TOÁN KIỂM ĐỊNH THỐNG KÊ
Trong thực tế, dựa vào số liệu mẫu thu được người ta thường có nhu cầu kiểm tra một vấn đề thống kê nào đó là đúng hay sai Vấn đề thống kê được đặt ra ở đây được gọi là giả thiết thống kê Việc kiểm định các giả thiết thống kê có liên quan đến các tham số đặc trưng của tổng thể được gọi là kiểm đinh tham số thống
kê Để kiểm tra giả thiết thống kê là đúng hay sai, trước tiên ta xây dựng hai mệnh
đề trái ngược nhau có liên quan đến tham số cần kiểm định được gọi là giả thiết (H)
Sai lầm loại 1: Là sai lầm khi ta bác bỏ giả thiết trong khi nó thật sự đúng (bác bỏ giả thiết đúng)
Sai lầm loại 2: Là sai lầm khi ta chấp nhận giả thiết trong khi nó thật
sự sai (chấp nhận giả thiết sai)
Ta không thể khẳng định sai lầm nào nghiêm trọng hơn, nhưng đã gọi là sai lầm thì tất cả đều không tốt và cần phải được hạn chế Ta mong muốn tìm một tiêu chuẩn kiểm định giả thiết để đồng thời làm cho các xác suất sai lầm loại 1, sai lầm loại 2 là nhỏ nhất Các nhà thống kê hạn chế các sai lầm đó theo nghĩa xác suất xảy
ra mỗi sai lầm là nhỏ nhất Tuy nhiên, khi ta làm giảm sai lầm loại này thì có thể sai lầm loại kia sẽ tăng lên và ngược lại Do đó trong bài toán kiểm định người ta tiến hành như sau: Ấn định trước mức xác suất sai lầm loại 1 qua mức ý nghĩa và xây dựng lý thuyết sao cho khả năng mắc phải sai lầm loại 2 ( ) là nhỏ nhất trong khả năng có thể Trong thực tế chúng ta chọn đủ bé (từ 1% đến 10%)
Trang 31Việc thực hiện việc kiểm định tham số thống kê với mức ý nghĩa cho trước theo phương pháp Bayes có thể được thực hiện theo quy trình như sau
Chọn giả thiết, đối thiết
Tính giá trị 𝑝𝑣
Kết luận
𝑛ế𝑢 𝑝𝑣 ≤ 𝛼 𝑡𝑎 𝑏á𝑐 𝑏ỏ 𝑔𝑖ả 𝑡𝑖ế𝑡
𝑛ế𝑢 𝑝𝑣 > 𝛼 𝑡𝑎 𝑐ấ𝑝 𝑛ậ𝑛 𝑔𝑖ả 𝑡𝑖ế𝑡 Trong đó việc xác định 𝑝𝑣 sẽ dựa vào phân phối hậu nghiệm của tham số cần kiểm định
Sau đây là một số bài toán kiểm định về tham số trung bình và tỷ lệ
3.2 MỘT SỐ BÀI TOÁN KIỂM ĐỊNH LIÊN QUAN ĐẾN TRUNG BÌNH 3.2.1 Kiểm định trung bình
𝑝𝑣 = 0.5 + 𝜑 𝑚 − 𝜇0
𝑠 Nếu chọn đối thiết 𝜇 ≠ 𝜇0 thì
𝑝𝑣 = 1 − 2 𝜑 𝑚 − 𝜇0
𝑠
Kết luận: Theo nguyên tắc chung của bài toán kiểm định
Ví dụ 3.1: Hàm lượng vitamin trong một loại trái cây là một đại lượng ngẫu
nhiên có phân phối chuẩn với tham số trung bình chưa biết và độ lệch chuẩn mẫu bằng 3 Giả sử hàm lượng vitamin có phân phối tiên nghiệm chuẩn 𝑁(30; 102) Chọn một mẫu gồm 10 trái cây đo được hàm lượng vitamin (đơn vị %) ta có số liệu sau