ước lượng và kiểm định tham số thống kê bằng phương pháp bayes

Định lý Bayes là định lý có vai trò rất quan trọng trong xác suất và thống kê bởi ý tưởng của định lý Bayes trong xác suất là việc tính xác suất hậu nghiệm của một biến cố dựa trên việc

Trang 1

TRƯỜNG ĐẠI HỌC CẦN THƠ KHOA KHOA HỌC TỰ NHIÊN

Trang 2

LỜI CẢM ƠN - -

Trong suốt quá trình học tập và thực hiện luận văn tôi đã nhận được sự giúp

đỡ, động viên và sự hướng dẫn tận tình của quý Thầy, quý Cô, Cha, Mẹ, bạn bè cũng như sự nổ lực, cố gắng của bản thân để hoàn thành luận văn này

Tôi xin chân thành gửi lời cảm ơn đến:

Cô Dương Thị Bé Ba người đã tận tình hướng dẫn và dành nhiều thời gian quý báu của mình để truyền đạt kiến thức, giúp đỡ tôi hoàn thành luận văn này

Toàn thể quý thầy cô bộ môn Toán – Khoa Khoa học Tự nhiên của trường Đại học Cần thơ đã trang bị cho tôi những kiến thức cơ bản, những kỹ năng cần thiết trong suốt quá trình học tập tại trường, đó là hành trang quý báu không chỉ giúp tôi hoàn thành tốt luận văn mà còn giúp tôi tự tin hơn trên con đường sự nghiệp phía trước

Quý Thầy, quý Cô trong Hội đồng bảo vệ luận văn đã dành nhiều thời gian

để xem xét và đóng góp những ý kiến quý báu để bài luận văn được hoàn thiện hơn

Toàn thể các bạn sinh viên chuyên ngành Toán Ứng Dụng khóa 36, những người bạn luôn sát cánh và tận tình giúp đỡ tôi trong suốt quá trình vừa qua

Cuối cùng, tôi xin bày tỏ lòng kính trọng và sự biết ơn sâu sắc nhất đến Cha,

Mẹ và các anh, chị em trong gia đình đã luôn ủng hộ tôi về mọi phương diện, đây là nguồn sức mạnh tinh thần lớn nhất giúp tôi vươn lên trong cuộc sống

Tôi xin chân thành cám ơn!

Cần Thơ, tháng 5 năm 2014

Danh Đảnh

Trang 3

xã hội và đáp ứng nhu cầu thông tin thống kê của các tổ chức, cá nhân,… Do đó, thống kê có tính ứng dụng rất cao trong thực tế trong đó có hai bài toán cơ bản là ước lượng và kiểm định giả thiết thống kê

Trong khoa học có hai trường phái thống kê: Trường phái thống kê cổ điển

và trường phái thống kê Bayes Hai trường phái thống kê này khác nhau về triết lý khoa học và nhất là cách hiểu về khái niệm xác suất Thống kê cổ điển dựa vào những kết quả quan sát mẫu của hiện tại mà không quan tâm đến những thông tin liên quan về số liệu đã biết trước Các kết luận trong thống kê cổ điển đều dựa trên

dữ liệu mẫu Trong khi đó, thống kê Bayes dựa trên những thông tin dữ liệu đã biết trước về vấn đề đã quan sát để suy luận cho thống kê hiện tại Trong thống kê Bayes, thông tin tiền nghiệm cấu thành nên cơ sở lý thuyết, các kết luận dựa trên cơ

sở đã biết kết hợp với dữ liệu quan sát Do đó, các kết luận trong thống kê Bayes có

độ chính xác cao hơn Đặc biệt, trước sự phát triển mạnh mẽ của công nghệ thông tin cũng những phần mềm toán học, việc lưu trữ thông tin rất thuận lợi Do đó, thống kê Bayes ngày càng có điều kiện phát triển hơn

Với các lý do nêu trên em chọn đề tài “Ước lượng và kiểm định tham số

thống kê bằng phương pháp Bayes” để làm luận văn tốt nghiệp cuối khóa

II Mục đích nghiên cứu

Luận văn được nghiên cứu với mục đích

 Tổng kết một cách có hệ thống các vấn đề có liên quan đến thống kê Bayes

Trang 4

 Nghiên cứu một số ứng dụng của thống kê Bayes trong kinh tế và xã hội

III Phương pháp nghiên cứu

 Sưu tầm, tham khảo các tài liệu có liên quan đến đề tài

 Tổng hợp, hệ thống hóa kiến thức được trình bày trong tài liệu để từ đó trình bài lại các vấn đề có liên quan một cách logic, có hệ thống

IV Đối tượng và phạm vi nghiên cứu

 Đối tượng nghiên cứu: Các vấn đề lý thuyết có liên quan đến thống kê

Bayes

 Phạm vi nghiên cứu: Vì thời gian và kiến thức có hạn nên đề tài của em chỉ

nghiên cứu hai bài toán cơ bản là ước lượng và kiểm định tham số thống kê bằng phương pháp Bayes

V Bố cục luận văn

Cấu trúc luận văn bao gồm phần mở đầu, phần nội dung và phần kết luận Trong đó, phần nội dung gồm 4 chương:

 Chương 1: Kiến thức chuẩn bị

Trong chương này trình bày một số vấn đề cơ bản về thống kê Bayes như: thông tin tiền nghiệm, thông tin hậu nghiệm và một số hàm mật độ xác suất thông dụng Đây là cơ sở lý thuyết cho việc xây dựng bài toán ước lượng và kiểm định được trình bày trong chương 2 và chương 3

 Chương 2: Ước lượng tham số bằng phương pháp Bayes

Trong chương này trình bày bài toán ước lượng tham số thống kê bằng phương pháp Bayes

 Chương 3: Kiểm định tham số bằng phương pháp Bayes

Trong chương này trình bày bài toán kiểm định tham số thống kê bằng

phương pháp Bayes

 Chương 4: Bài tập áp dụng

Trình bày hệ thống bài tập ứng dụng một số vấn đề đã thực hiện trong lý thuyết

Trang 5

MỤC LỤC

LỜI CẢM ƠN i

PHẦN MỞ ĐẦU ii

I Lý do chọn đề tài ii

II Mục đích nghiên cứu ii

III Phương pháp nghiên cứu iii

IV Đối tượng và phạm vi nghiên cứu iii

V Bố cục luận văn iii

MỤC LỤC iv

CHƯƠNG 1: KIẾN THỨC CHUẨN BỊ 1

1.1 ĐỊNH LÝ BAYES 1

1.1.1 Định lý Bayes cho đại lượng ngẫu nhiên rời rạc 1

1.1.2 Định lý Bayes cho đại lượng ngẫu nhiên liên tục 4

1.2 PHÂN PHỐI TIỀN NGHIỆM VÀ PHÂN PHỐI HẬU NGHIỆM 5

1.2.1 Phân phối tiền nghiệm 5

1.2.2 Phân phối hậu nghiệm 5

1.2.3 Hàm mật độ xác suất hậu nghiệm cho tham số 10

CHƯƠNG 2: ƯỚC LƯỢNG THAM SỐ THỐNG KÊ BẰNG PHƯƠNG PHÁP BAYES .16

2.1 ƯỚC LƯỢNG ĐIỂM THAM SỐ THỐNG KÊ 16

2.2 ƯỚC LƯỢNG KHOẢNG THAM SỐ THỐNG KÊ 16

2.2.1 Một số bài toán ước lượng liên quan đến trung bình 17

2.2.2 Một số bài toán ước lượng liên quan đến tỷ lệ 21

CHƯƠNG 3: KIỂM ĐỊNH THAM SỐ THỐNG KÊ BẰNG PHƯƠNG PHÁP BAYES 24

3.1 TỔNG QUAN VỀ BÀI TOÁN KIỂM ĐỊNH THỐNG KÊ 24

3.2 MỘT SỐ BÀI TOÁN KIỂM ĐỊNH LIÊN QUAN ĐẾN TRUNG BÌNH 25

3.2.1 Kiểm định trung bình 25

3.2.2 So sánh hai trung bình 26

3.3 MỘT SỐ BÀI TOÁN KIỂM ĐỊNH LIÊN QUAN ĐẾN TỶ LỆ 31

3.3.1 Kiểm định một tỷ lệ 31

3.3.2 So sánh hai tỷ lệ 33

CHƯƠNG 4: BÀI TẬP ÁP DỤNG 36

PHẦN KẾT LUẬN 52

TÀI LIỆU THAM KHẢO 53

PHỤ LỤC 54

Trang 6

Phụ lục 1 Bảng phân vị chuẩn tắc z 54 Phụ lục 2 Bảng phân vị Student 55 Phụ lục 3 Bảng giá trị tích phân Laplace 56

Trang 7

CHƯƠNG 1: KIẾN THỨC CHUẨN BỊ

Như ta đã biết, xác suất và thống kê có mối liên hệ rất mật thiết với nhau Xác suất như là công cụ để các nhà thống kê sử dụng thông tin trên một mẫu để đưa

ra những suy luận hay mô tả tổng thể từ mẫu được lấy ra Định lý Bayes là định lý

có vai trò rất quan trọng trong xác suất và thống kê bởi ý tưởng của định lý Bayes trong xác suất là việc tính xác suất hậu nghiệm của một biến cố dựa trên việc biết được xác suất của biến cố tiền nghiệm, hầu như trong thực tế đa số các biến cố luôn chịu tác động của nhiều biến cố khác nhau Chính vì vậy nên định lý Bayes có tính ứng dụng rất cao Nền tảng của thống kê Bayes là việc mở rộng định lý Bayes đối với đại lượng ngẫu nhiên rời rạc cho đại lượng ngẫu nhiên liên tục Trong xác suất,

sử dụng định lý Bayes để thiết lập hàm mật độ xác suất hậu nghiệm cho một giai đoạn và mở rộng cho nhiều giai đoạn nhằm để xem xét cho các tham số cụ thể của phân phối nhị thức và phân phối chuẩn Trong thống kê, định lý Bayes được sử dụng để giải quyết các bài toán ước lượng, kiểm định tham số Trong chương này sẽ trình bày kiến thức nền tảng của thống kê Bayes

1.1 ĐỊNH LÝ BAYES

1.1.1 Định lý Bayes cho đại lượng ngẫu nhiên rời rạc

a Định nghĩa hệ biến cố đầy đủ

Gọi 𝛺 là không gian mẫu của một phép thử Một hệ các biến cố

𝐴1, 𝐴2, … , 𝐴𝑛 được gọi là một hệ biến cố đầy đủ hay là một hình thức chia của Ω nếu thỏa mãn hai tính chất sau

Trang 8

Nhận xét: Gọi B là một biến cố bất kỳ của 𝛺 Nếu 𝐴1, 𝐴2, … , 𝐴𝑛 là hình thức chia của 𝛺 thì 𝐴1𝐵, 𝐴2𝐵, … , 𝐴𝑛𝐵 sẽ là một hình thức chia của B

b Công thức xác suất toàn phần

Vì 𝐴𝑖 , 𝑖 = 1, 𝑛 là hệ các biến cố xung khắc từng đôi nên hệ 𝐴𝑖𝐴 , 𝑖 = 1, 𝑛 cũng là

hệ các biến cố xung khắc từng đôi

c Định lý Bayes ( công thức xác suất Bayes)

Trang 9

đ𝑝𝑐𝑚

Ví dụ 1.1: Có 2 lô sản phẩm Lô 1 có 20 sản phẩm trong đó có 15 sản phẩm

tốt Lô 2 có 20 sản phẩm trong đó có 10 sản phẩm tốt Lấy ngẫu nhiên một lô và trong lô đó lấy ra ngẫu nhiên một sản phẩm Giả sử sản phẩm lấy ra là sản phẩm tốt,

tính xác suất sản phẩm đó thuộc lô thứ nhất?

Giải

Gọi A là biến cố lấy ra 1 sản phẩm tốt và 𝐿1, 𝐿2 lần lƣợt là biến cố chọn đƣợc sản phẩm thuộc lô 1 và lô 2

⇒ 𝐿1, 𝐿2 là hệ biến cố đầy đủ

Xác suất đƣợc chọn của hai lô là: 𝑃 𝐿1 = 1 2 = 𝑃(𝐿2)

Theo công thức xác suất toàn phần, xác suất lấy đƣợc sản phẩm tốt là

=35

Ví dụ 1.2: Một hộp đựng 2 đồng xu, trong đó có 1 đồng xu cân đối, đồng

chất và 1 đồng xu luôn xuất hiện mặt sấp khi tung Chọn ngẫu nhiên một đồng xu từ hộp và khi tung đồng xu này lên 2 lần điều thấy nó xuất hiện mặt sấp Tính xác xuất đồng xu đã chọn là đồng xu cân đối, đồng chất

Trang 10

Nếu trong 2 lần đều xuất hiện mặt sấp Khi đó, theo công thức Bayes ta được xác suất đồng xu đã chọn là đồng xu cân đối và đồng chất là

Ví dụ 1.3: Cho hai hộp đựng bi, hộp một có 6 bi vàng và 4 bi đỏ, hộp hai có

7 bi vàng và 3 bi đỏ Lấy ngẫu nhiên từ hộp một 1 viên bi và bỏ vào hộp hai, sau đó lấy từ hộp hai ra 2 viên bi Tính xác suất 2 viên bi lấy ra có màu đỏ?

1.1.2 Định lý Bayes cho đại lượng ngẫu nhiên liên tục

Cho 𝑋 là đại lượng ngẫu nhiên liên tục Khi đó, hàm phân phối xác suất có điều kiện 𝑋 khi biến cố 𝐴𝑖 đã xảy ra được xác định như sau

𝐹 𝑥 𝐴𝑖 =𝑃( 𝑋 ≤ 𝑥 , 𝐴𝑖)

𝑃(𝐴𝑖)Trong đó 𝐹 +∞|𝐴𝑖 = 1 và 𝐹 −∞ 𝐴𝑖 = 0

Hàm mật độ xác suất có điều kiện của X khi biến cố 𝐴𝑖 xảy ra được xác định như sau

Trong đó 𝑓(𝑥) được gọi là hàm mật độ xác suất kết hợp của tổng thể

Khi 𝑋 và 𝑌 là 2 đại lượng ngẫu nhiên liên tục, định lý Bayes cho trường hợp này

là hàm mật độ xác suất có điều kiện 𝑓(𝑥|𝑦) được xác định như sau

𝑓 𝑥 𝑦 = 𝑓 𝑥 𝑓(𝑦|𝑥)

𝑓 𝑥 𝑓 𝑦 𝑥 𝑑𝑥

Trang 11

1.2 PHÂN PHỐI TIỀN NGHIỆM VÀ PHÂN PHỐI HẬU NGHIỆM

1.2.1 Phân phối tiền nghiệm

Phân phối tiền nghiệm theo định lý Bayes còn được gọi là xác suất tiền nghiệm

là xác suất xảy ra của biến cố 𝐴 mà không quan tâm đến những biến cố khác Thông tin tiền nghiệm của các tham số là nhân tố quan trọng trong quá trình suy luận Bayes Phân phối tiền nghiệm chứa đựng đầy đủ thông tin và nếu lượng dữ liệu quan sát được càng nhiều sẽ ảnh hưởng càng lớn lên phân phối hậu nghiệm Ngược lại, khi lượng dữ liệu quá ít thì thông tin trong phân phối tiền nghiệm sẽ đóng vai trò quan trọng trong phân phối hậu nghiệm

a Tiền nghiệm mang thông tin và không mang thông tin

Tiền nghiệm mang thông tin là tiền nghiệm làm thay đổi về cơ bản những thông tin chứa trong dữ liệu Phương pháp phổ biến để thể hiện thông tin tiền nghiệm là đưa ra phân phối cho tham số chưa biết mà tham số đó phản ánh được thông tin tiền nghiệm

Trong nhiều trường hợp niềm tin tiền nghiệm của ta rất mơ hồ và vì thế rất khó để chuyển thành tiền nghiệm mang thông tin Đây là trường hợp mà ta gọi là tiền nghiệm không mang thông tin hay tiền nghiệm mơ hồ và phân phối được lựa chọn để thể hiện phân phối này là phân phối đều xác định trên các giá trị mà tham

số có thể có

Chẳng hạn, tham số chỉ trung bình 𝜇 nhận giá trị (−∞; +∞) có phân phối

tiền nghiệm không mang thông tin Tham số độ lệch chuẩn 𝜎 nhận giá trị trên

(0; +∞) có phân phối tiền nghiệm không mang thông tin

b Phân phối tiền nghiệm liên hợp

Trong nhiều trường hợp, ta mong muốn chọn được phân phối tiền nghiệm sao cho việc phân tích và tìm ra phân phối hậu nghiệm được thuận lợi nhất Giả sử dữ liệu được sinh ra từ một phân phối xác định nào đó, khi đó ta gọi phân phối tiền nghiệm liên hợp để chỉ phân phối hậu nghiệm và phân phối tiền nghiệm cùng thuộc một lớp phân phối Mặc dù có cùng dạng phân phối nhưng chúng có tham số khác nhau, tham số của phân phối hậu nghiệm phản ánh sự kết hợp giữa thông tin tiền nghiệm và dữ liệu quan sát

1.2.2 Phân phối hậu nghiệm

Phân phối hậu nghiệm hay còn gọi là xác suất có điều kiện là xác suất xảy ra biến cố 𝐴 khi biết biến cố 𝐵 đã xảy ra

a Bảng phân phối xác suất hậu nghiệm

 Bảng phân phối xác suất hậu nghiệm qua một giai đoạn

Tương tự như bảng phân phối xác suất, bảng phân phối xác suất hậu nghiệm dùng để thiết lập phân phối xác suất hậu nghiệm cho biến ngẫu nhiên rời rạc mà nó cung cấp xác suất 𝑝 với mỗi các giá trị của x Yêu cầu của một bảng phân phối xác suất hậu nghiệm là 0 ≤ 𝑝 ≤ 1 và 𝑛𝑖=1𝑝𝑖 = 1 Đồng thời ta có thể dựa vào bảng để tính xác suất hậu nghiệm một cách trực quan, hay nhìn vào bảng ta có thể tính xác

suất hậu nghiệm đơn giản hơn

Trang 12

Không gian Bayes

Cho hai đại lượng ngẫu nhiên rời rạc 𝑋 và 𝑌 Gọi 𝑥𝑖, 𝑖 = 1,2, … , 𝑛 là các giá trị có thể có của 𝑋 và 𝑦𝑗, 𝑗 = 1,2, … , 𝑚 là các giá trị có thể có của 𝑌 Tập hợp các bộ giá trị trong ma trận hình chữ nhật cỡ 𝑛 × 𝑚 với phần tử thứ 𝑖 cột 𝑗 trong ma trận

𝑥𝑖, 𝑦𝑗 được gọi là không gian Bayes của hai biến 𝑋 và 𝑌

Bảng 1: Không gian Bayes

Phương pháp: Gọi 𝑃 𝑥𝑖, 𝑦0 là xác suất đồng thời để đại lượng ngẫu nhiên

𝑋 nhận giá trị 𝑥𝑖 và đại lượng ngẫu nhiên 𝑌 nhận giá trị 𝑦0, ta có

𝑃 𝑥𝑖, 𝑦0 = 𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦0|𝑋 = 𝑥𝑖) Trong đó 𝑃 𝑋 = 𝑥𝑖 là xác suất tiền nghiệm của 𝑋 = 𝑥𝑖

Theo công thức Bayes thì xác suất hậu nghiệm của 𝑋 = 𝑥𝑖 và 𝑌 = 𝑦0 được xác định như sau

𝑝𝑖(1)= 𝑃 𝑋 = 𝑥𝑖 𝑌 = 𝑦0 = 𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦0|𝑋 = 𝑥𝑖)

𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦0|𝑋 = 𝑥𝑖)

𝑛 𝑖=1

Khi đó ta lập được bảng phân phối xác suất hậu nghiệm của 𝑋 khi 𝑌 = 𝑦0 là

Bảng 2: Bảng phân phối xác suất hậu nghiệm của X qua một giai đoạn

Ví dụ 1.4: Trong một hộp có 5 viên bi, trong đó có 2 loại bi là bi đỏ và bi đen

(số lượng bi đỏ và bi đen không được xác định) Chọn ngẫu nhiên 1 viên bi từ hộp,

Trang 13

nếu ta chọn đƣợc bi đỏ kí hiệu là 𝑌 = 1 và nếu ta chọn đƣợc bi đen thì kí hiệu là

𝑌 = 0 Gọi X là số lƣợng bi đỏ trong hộp

a Tìm không gian Bayes của (𝑋, 𝑌)

b Tìm bảng phân phối xác suất hậu nghiệm của 𝑋 khi 𝑌 = 1

Trang 14

Bài toán: Giả sử đại lượng ngẫu nhiên X có thể nhận giá trị 𝑥1, 𝑥2, … , 𝑥𝑛 với

xác suất chưa biết Tiến hành m lần phép thử, lần thứ nhất ta nhận được kết quả

𝑌 = 𝑦1, lần thứ hai ta nhận được kết quả 𝑌 = 𝑦2,…, và lần thứ m ta nhận được kết

quả 𝑌 = 𝑦𝑚 Vấn đề đặt ra là ta cần lập bảng phân phối xác suất hậu nghiệm cho X

Phương pháp: Mở rộng cho trường hợp một giai đoạn, bảng phân phối xác

suất hậu nghiệm của X qua m giai đoạn như sau:

Bảng 3: Bảng phân phối xác suất hậu nghiệm của X qua nhiều giai đoạn

Trong đó 𝑝𝑖(𝑚 ) được xác định như sau

𝑝𝑖(𝑚 ) = 𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦1, 𝑦2, … , 𝑦𝑚 𝑥𝑖 )

𝑃 𝑋 = 𝑥𝑖 𝑃(𝑌 = 𝑦1, 𝑦2, … , 𝑦𝑚 𝑥𝑖 )

𝑚 𝑖=1

Với

𝑃 𝑌 = 𝑦1, 𝑦2, … , 𝑦𝑚 𝑥𝑖 = 𝑃 𝑌 = 𝑦1 𝑋 = 𝑥𝑖 𝑃 𝑌 = 𝑦2 𝑋 = 𝑥𝑖, 𝑌 = 𝑦1 …

… 𝑃(𝑌 = 𝑦𝑚|𝑋 = 𝑥𝑖, 𝑌 = 𝑦1, 𝑌 = 𝑦2, … , 𝑌 = 𝑦𝑚 −1)

Ví dụ 1.5: Trở lại ví dụ 1.4, giả sử ta chọn lần lượt 2 viên bi từ hộp, lần đầu

ta chọn được 1 viên bi đỏ, lần 2 ta chọn tiếp 1 viên bi thì thấy kết quả là viên bi đen

Gọi X là viên bi đỏ trong hộp Lập bảng phân phối xác suất hậu nghiệm của 𝑋

Giải

Ta có

𝑃 𝑌 = 0 𝑋 = 𝑥𝑖, 𝑌 = 1 = 4 − 𝑖

4Lập bảng tính sau:

𝑃(𝑌 = 0|𝑋

= 𝑥𝑖, 𝑌 = 1) (3)

𝑝2(𝑚 ) … 𝑝3(𝑚 )

Trang 15

 1/4 1

Từ bảng tính trên ta nhận được bảng phân phối xác suất hậu nghiệm của X là

P 0 0,034 0,133 0,3 0,533 0

b Bảng phân phối xác suất hậu nghiệm tham số của một số phân phối đặc biệt

 Tham số tỷ lệ trong phân phối nhị thức

Bài toán: Giả sử đại lượng ngẫu nhiên có phân phối nhị thức với xác suất

thành công là 𝑝 với 𝑝 là đại lượng ngẫu nhiên có thể nhận các giá trị: 𝑝1, 𝑝2, … , 𝑝𝑚với xác suất tiên nghiệm tương ứng 𝑞1, 𝑞2, … , 𝑞𝑚 Chọn một mẫu gồm n phần tử và gọi Y là số lần thành công Ta cần tìm bảng phân phối xác suất hậu nghiệm của p khi Y nhận giá trị cụ thể 𝑌 = 𝑘

Bảng phân phối xác suất hậu nghiệm

Theo công thức Bayes, bảng phân phối xác suất hậu nghiệm của tham số p như sau

Bảng 4: Bảng phân phối xác suất hậu nghiệm trong phân phối nhị thức

𝑝𝑖(𝐵) = 𝑃 𝑝 = 𝑝𝑖 𝑌 = 𝑘 = 𝑃 𝑝 = 𝑝𝑖 𝑃(𝑌 = 𝑘|𝑝 = 𝑝𝑖)

𝑃 𝑝 = 𝑝𝑖 𝑃(𝑌 = 𝑘|𝑝 = 𝑝𝑖)

𝑚 𝑖=1

Và

𝑃 𝑝 = 𝑝𝑖 = 𝑞𝑖, 𝑃 𝑌 = 𝑘 𝑝 = 𝑝𝑖 = 𝐶𝑛𝑘𝑝𝑖𝑘 1 − 𝑝𝑖 𝑛−𝑘

 Tham số trung bình của phân phối chuẩn

 Mẫu quan sát qua một giai đoạn

Cho đại lượng ngẫu nhiên X có phân phối chuẩn 𝑁(𝜇, 𝜎2) với 𝜎2 đã biết và

𝜇 chưa biết Giả sử 𝜇 nhận được các giá trị 𝜇1, 𝜇2, … , 𝜇𝑛 với xác suất tiên nghiệm

𝑃 𝜇 = 𝜇𝑖 = 𝑝𝑖 Chọn một mẫu ngẫu nhiên được một giá trị cụ thể của 𝑋 là 𝑥0 Cần tìm xác suất hậu nghiệm cho các giá trị của 𝜇𝑖, 𝑖 = 1,2, … , 𝑛

Bảng phân phối xác suất hậu nghiệm của 𝝁

Áp dụng công thức Bayes ta được bảng phân phối xác suất hậu nghiệm của 𝜇 như sau

Trang 16

Bảng 5: Bảng phân phối xác suất hậu nghiệm của 𝝁 qua một gia đoạn

𝑝𝑖(𝑁) = 𝑃 𝜇 = 𝜇𝑖 𝑋 = 𝑥0) = 𝑃 𝜇 = 𝜇𝑖 𝑓(𝑥0|𝜇𝑖)

𝑃 𝜇 = 𝜇𝑖 𝑓(𝑥0|𝜇𝑖)

𝑛 𝑖=1

Với

𝑓 𝑥0 𝜇𝑖 = 1

𝜎 2𝜋𝑒𝑥𝑝 −

(𝑥0 − 𝜇𝑖)22𝜎2

 Mẫu quan sát qua nhiều giai đoạn

Cho đại lượng ngẫu nhiên X có phân phối chuẩn 𝑁(𝜇, 𝜎2) với 𝜎2 đã biết nhưng 𝜇 thì chưa biết Giả sử 𝜇 có thể nhận các giá trị 𝜇1, 𝜇2, … , 𝜇𝑛 với xác suất tiên nghiệm 𝑃 𝜇 = 𝜇𝑖 = 𝑝𝑖 Thực hiện phép thử 𝑚 lần ta được các giá trị của 𝑋 lần lượt là 𝑥1, 𝑥2, … , 𝑥𝑚 Ta lập bảng phân phối xác suất hậu nghiệm cho 𝜇

Bảng phân phối xác suất hậu nghiệm của 𝝁 qua nhiều giai đoạn

Khi có nhiều giai đoạn ta lần lượt tìm xác suất hậu nghiệm của 𝜇 qua từng giai đoạn một và xác suất hậu nghiệm của giai đoạn trước chính là xác suất tiên nghiệm cho giai đoạn sau Bảng phân phối xác suất hậu nghiệm của 𝜇 là dựa vào xác suất hậu nghiệm của giai đoạn cuối cùng

1.2.3 Hàm mật độ xác suất hậu nghiệm cho tham số

a Hàm mật độ xác suất hậu nghiệm khi có một quan sát

Xét đại lượng ngẫu nhiên 𝑋 với hàm mật độ xác suất 𝑓(𝑥) có tham số 𝜃 chưa biết Giả sử 𝜃 có hàm mật độ xác suất tiên nghiệm 𝑔(𝜃) Thực hiện một quan sát, ta được giá trị cụ thể của 𝑋 là 𝑥0 Khi đó hàm mật độ xác suất hậu nghiệm của 𝜃 được xác định như sau

𝑔 𝜃 𝑥0 = 𝑔 𝜃 𝑓(𝑥0|𝜃)

𝑔 𝜃 𝑓 𝑥0 𝜃 𝑑𝑥

b Hàm mật độ xác suất khi có nhiều quan sát

Trong trường hợp X nhận nhiều giá trị quan sát 𝑥1, 𝑥2, … , 𝑥𝑛 thì hàm mật độ xác suất hậu nghiệm của 𝜃 trở thành như sau

𝑔 𝜃 𝑥1, 𝑥2, … , 𝑥𝑛 = 𝑔 𝜃 𝑓(𝑥 |𝜃)

𝑔 𝜃 𝑓 𝑥 𝜃 𝑑𝑥Trong đó

𝑥 =1

𝑛 𝑥𝑖

𝑛

𝑖=1

Trang 17

c Hàm mật độ xác suất hậu nghiệm cho tham số của phân phối đặc biệt

 Hàm mật độ xác suất phân phối nhị thức

Đại lượng ngẫu nhiên rời rạc X được gọi là có phân phối nhị thức với hai

tham số 𝑛 và 𝑝 Kí hiệu: 𝑋~𝐵(𝑛, 𝑝) Hàm mật độ của nó được xác định như sau

 Hàm mật độ xác suất hậu nghiệm của phân phối nhị thức

Bài toán: Giả sử đại lượng ngẫu nhiên có phân phối nhị thức trong đó xác

suất thành công 𝑝 là đại lượng ngẫu nhiên có hàm mật độ xác suất chưa biết Thực hiện 𝑛 lần các phép thử, gọi 𝑌 là số lần thành công Ta xác định hàm mật độ xác suất cho tham số 𝑝 theo công thức sau

Giả sử 𝑌 = 𝑚, ta có

𝑔 𝑝 𝑌 = 𝑚 = 𝑔 𝑝 𝑓(𝑌 = 𝑚|𝑝)

𝑔 𝑝 𝑓(𝑌 = 𝑚|𝑝)01Trong đó 𝑔 𝑝 là hàm mật độ xác suất tiền nghiệm của 𝑝

𝑓 𝑌 = 𝑚 𝑝 = 𝐶𝑛𝑚𝑝𝑚 1 − 𝑝 𝑛 −𝑚

Các trường hợp đặc biệt

 Khi p có hàm mật độ xác suất tiên nghiệm đều

Nếu 𝑝 có hàm mật độ xác suất tiên nghiệm đều trên [0, 1] thì hàm mật độ xác suất hậu nghiệm của nó là 𝛽(𝑎, 𝑏), trong đó

Trang 18

𝑔 𝑝 𝑌 = 𝑚 = 𝑓(𝑌 = 𝑚|𝑝)

𝑓 𝑌 = 𝑚 𝑝 𝑑𝑝01 =

𝐶𝑛𝑚𝑝𝑚 1 − 𝑝 𝑛−𝑚

𝐶1 𝑛𝑚𝑝𝑚 1 − 𝑝 𝑛−𝑚 0

 Khi p có hàm mật độ xác suất tiên nghiệm 𝑩𝒆𝒕𝒂

Hàm mật độ xác suất hậu nghiệm cho tham số p của phân phối nhị thức, khi thực hiện n lần phép thử độc lập và có m lần thành công với hàm mật độ xác suất tiên nghiệm của tham số p có phân phối 𝛽(𝑎, 𝑏) là phân phối 𝛽(𝑎 , 𝑏 ), trong đó

𝑔 𝑝 𝑓 𝑌 = 𝑚 𝑝 = Γ(𝑎 + 𝑏)

Γ 𝑎 Γ(𝑏) 𝐶𝑛𝑚𝑝𝑎 −1 1 − 𝑝 𝑏 −𝑚 −1 = 𝑀 𝛽(𝑎 , 𝑏 )

Do đó

Trang 19

𝑔 𝑝 𝑌 = 𝑚 = 𝑔 𝑝 𝑓(𝑌 = 𝑚|𝑝)

𝑔 𝑝 𝑓 𝑌 = 𝑚 𝑝 𝑑𝑝01 =

𝑀 𝛽(𝑎 , 𝑏 )

𝑀 𝛽(𝑎 , 𝑏 )01 = 𝛽(𝑎 , 𝑏 )

Nhận xét: Khi tham số p có phân phối tiên nghiệm đều trên [0, 1] thì kết quả hàm

phân phối xác suất hậu nghiệm của p là trường hợp đặc biệt khi tham số p có phân

 Hàm mật độ xác suất của phân phối chuẩn

Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối chuẩn với hai tham

số 𝜇 và 𝜎2 Kí hiệu: 𝑋~𝑁(𝜇, 𝜎2) và hàm mật độ xác suất của nó được xác định như

sau

𝑓 𝑥|𝜇, 𝜎2 = 1

𝜎 2𝜋𝑒𝑥𝑝 −

𝑥 − 𝜇 22𝜎

Các tham số đặc trưng 𝑇𝑟𝑢𝑛𝑔 𝑏ì𝑛𝑕: 𝐸 𝑋 = 𝜇

𝑃𝑕ươ𝑛𝑔 𝑠𝑎𝑖: 𝑉𝑎𝑟 𝑋 = 𝜎2

 Hàm mật độ xác suất hậu nghiệm của phân phối chuẩn

Bài toán: Giả sử đại lượng ngẫu nhiên X có phân phối chuẩn với tham số

trung bình là 𝜇 chưa biết, phương sai 𝜎2 đã biết Giả sử 𝜇 có hàm mật độ xác suất là

𝑔(𝜇) Thực hiện một quan sát ta được một giá trị cụ thể của X là 𝑥0 Ta tìm mật độ xác suất hậu nghiệm của 𝜇

Hàm mật độ xác suất hậu nghiệm được xác định bởi công thức

 Trường hợp 𝝁 có phân phối tiên nghiệm chuẩn 𝝁~𝑵(𝒎, 𝒔𝟐)

Trang 21

Khi thực hiện n lần quan sát cho X ta nhận đƣợc các giá trị cụ thể

𝑥1, 𝑥2, … , 𝑥𝑛, khi đó hàm mật độ xác suất cho 𝜇 đƣợc xác định nhƣ sau

Trang 22

CHƯƠNG 2: ƯỚC LƯỢNG THAM SỐ THỐNG KÊ

BẰNG PHƯƠNG PHÁP BAYES

Một đại lượng ngẫu nhiên được đặc trưng bởi các tham số mà trong thực tế hầu như không thể biết được chúng một cách chính xác Do đó, để xác định được những tham số này người ta sẽ ước lượng chúng từ mẫu đã chọn Bài toán ước lượng tham số thống kê là bài toán ước lượng giá trị tham số chưa biết của đại lượng ngẫu nhiên dựa vào quan sát trên mẫu được lấy ra Thông thường các tham số cần ước lượng là trung bình, phương sai và tỷ lệ những phần tử nào đó đang được quan tâm trong tổng thể Căn cứ vào kết quả ước lượng, người ta chia bài toán ước lượng tham số thống kê thành hai loại là ước lượng điểm và ước lượng khoảng tham

số thống kê

2.1 ƯỚC LƯỢNG ĐIỂM THAM SỐ THỐNG KÊ

Khi nghiên cứu đại lượng ngẫu nhiên X của tổng thể, chúng ta thường không

biết phân phối xác suất của nó như thế nào, vì thế không thể biết chính xác các tham

số đặc trưng Ước lượng điểm của các giá trị tham số chưa biết của X (một tham số

hoặc nhiều tham số) là việc dựa trên một mẫu (X X1, 2, ,X n) để tìm được một thống

kê ˆ( , , , )

2

1 X X n

X

 để thay thế tham số  chưa biết

Việc xác định điểm ước lượng bằng phương pháp Bayes của tham số chưa biết sẽ dựa vào phân phối xác suất hậu nghiệm của tham số đó

Tuy nhiên, khi ước lượng tham số  chưa biết bằng phương pháp ước lượng điểm thì ta không biết được mức độ chính xác của ước lượng Vì thế, không đánh giá được mức độ sai lầm khi ta dùng ˆ thay cho  Để khắc phục các hạn chế đó,

ta sử dụng ước lượng khoảng tin cậy cho tham số 

2.2 ƯỚC LƯỢNG KHOẢNG THAM SỐ THỐNG KÊ

Giả sử  là một tham số của biến ngẫu nhiên X cần biết Ước lượng khoảng

tham số  là xác định khoảng (1; 2) sao cho xác suất để  (1; 2) bằng một độ tin cậy cho trước

Trong bài toán ước lượng khoảng, ta sử dụng một số kí hiệu sau

 : Mức ý nghĩa, là khả năng có thể mắc phải sai lầm khi ước lượng

 1- : Độ tin cậy của ước lượng

 ( 1; 2): Khoảng tin cậy của ước lượng

Thông thường trong thực tế ta chỉ ước lượng khoảng tham số với khoảng tin cậy đối xứng Trong phần này để ngắn gọn ta chỉ nói “ước lượng” thay cho cách nói đầy đủ “ước lượng khoảng tin cậy đối xứng” Khi đó, tham số  cần ước lượng thuộc khoảng ( ; 1 2)(   0 ; 0 ), trong đó

Trang 23

 0 là ước lượng điểm của tham số ,

  là độ chính xác hay sai số của ước lượng

Sau đây là một số bài toán ước lượng tham số cơ bản bằng phương pháp Bayes

2.2.1 Một số bài toán ước lượng liên quan đến trung bình

a Ước lượng trung bình

Giả sử đại lượng ngẫu nhiên X có tham số trung bình E(X) =  chưa biết Cho trước số  khá nhỏ, ước lượng trung bình  với mức ý nghĩa  là việc chỉ ra một khoảng (1,2) sao cho P(1 2) = 1.

 Trường hợp biết phương sai 𝝈𝟐

Giả sử đại lượng ngẫu nhiên X có tham số trung bình 𝜇 chưa biết nhưng phương sai 𝜎2 đã biết Tham số 𝜇 có phân phối tiên nghiệm chuẩn 𝑁 𝑚, 𝑠2 Chọn

một mẫu gồm n phần tử Tham số trung bình mẫu là đại lượng ngẫu nhiên có phân

phối chuẩn 𝑁(𝜇, 𝜎2 ) Khi đó, 𝜇 có phân phối hậu nghiệm là phân phối chuẩn 𝑛𝑁(𝑚 , 𝑠 2) với

Giả sử đại lượng ngẫu nhiên X có tham số trung bình 𝜇 chưa biết và phương

sai 𝜎2 chưa biết Tham số 𝜇 có phân phối tiên nghiệm chuẩn 𝑁 𝑚, 𝑠2 Chọn một

mẫu gồm n phần tử Trong trường hợp này, phương sai 𝜎2 chưa biết ta sẽ thay bằng phương sai mẫu điều chỉnh là

𝜎 2 = 1

𝑛 − 1 (𝑥𝑖 − 𝑥 )

2 𝑛

𝑖=1

Khi đó, tham số trung bình mẫu là đại lượng ngẫu nhiên có phân phối chuẩn 𝑁(𝜇, 𝜎 2 ) và 𝜇 có phân phối hậu nghiệm cũng là phân phối chuẩn 𝑁(𝑚𝑛 , 𝑠 2) với

Trang 24

Ví dụ 2.1: Hàm lượng vitamin trong một loại trái cây là một đại lượng ngẫu

nhiên có phân phối chuẩn với tham số trung bình chưa biết và độ lệch chuẩn bằng 3 Giả sử hàm lượng vitamin có phân phối tiên nghiệm chuẩn 𝑁(30; 102) Chọn một mẫu gồm 10 trái cây đo được hàm lượng vitamin (đơn vị %) ta có số liệu sau

38.7 40.4 37.2 36.6 35.9 34.7 37.6 35.1 37.5 35.6 Hãy ước lượng hàm lượng vitamin trung bình hậu nghiệm của trái cây với độ tin cậy 95%

Giải

Gọi 𝜇 là hàm lượng vitamin trung bình của trái cây

Đây là bài toán ước lượng khoảng trung bình trong trường hợp phương sai đã biết

Vì 𝜇 có phân phối tiên nghiệm chuẩn 𝑁(30, 102) nên phân phối hậu nghiệm của 𝜇

là phân phối chuẩn 𝑁(𝑚 , 𝑠 2) với

𝑚 =𝑚/𝑠

2 + 𝑛𝑦 /𝜎2𝑛/𝜎2 + 1/𝑠2 =30/10

2 + 10.36,93/3210/32 + 1/102 = 34,13

Trang 25

Ví dụ 2.2: Một người muốn ước lượng chiều cao trung bình của loài cây

trồng, được trồng trên những vùng đất khác nhau Chọn giá trị tiền nghiệm của trung bình là phân phối chuẩn 2

(30, 4 )

N Giả sử chiều cao này có phân phối chuẩn với độ lệch chuẩn chưa biết Chọn một mẫu ngẫu nhiên gồm 15 cây ta có được trung bình mẫu là 32,5 cm, độ lệch chuẩn mẫu điều chỉnh là 2,2 cm Hãy ước lượng chiều cao trung bình hậu nghiệm của cây với độ tin cậy 95%

Giải

Gọi 𝜇 là chiều cao trung bình của cây

Đây là bài toán ước lượng khoảng trung bình trong trường hợp phương sai chưa biết

Ta có 𝑦 = 32,5, 𝜎 2 = 2,2 , 𝑛 = 15 < 30

Vì 𝜇 có phân phối tiên nghiệm chuẩn 2

(30,4 )

N nên phân phối hậu nghiệm của 𝜇 là

phân phối chuẩn 𝑁(𝑚 , 𝑠 2) với

𝑚 =𝑚/𝑠

2+ 𝑛𝑦 /𝜎 2𝑛/𝜎 2 + 1/𝑠2 =

30 1 42+ 15.32,5 1 2,22

152,22+ 1 42

b Ước lượng sự khác nhau của hai trung bình

Bài toán: Giả sử X 1 và X 2 là hai đại lượng ngẫu nhiên có phân phối chuẩn

𝑋1~𝑁(𝜇1, 𝜎12), 𝑋2~𝑁 𝜇2, 𝜎22 , chúng ta muốn ước lượng sự khác nhau giữa 𝜇1 và

𝜇2 dựa trên hai mẫu quan sát độc lập của X 1 và X 2 với độ tin cậy 1 − 𝛼 cho trước

Ở đây ta chỉ xét trường hợp đã biết phương sai và hai phương sai này bằng nhau

Ta có hai mẫu 𝑦11, … , 𝑦𝑛11 , (𝑦12, … , 𝑦𝑛22) của hai đại lượng ngẫu nhiên X 1

và X 2 độc lập nên phân phối hậu nghiệm của chúng cũng độc lập Giả sử ta có phân phối tiên nghiệm: 𝜇1~𝑁(𝑚1, 𝑠12) và 𝜇2~𝑁(𝑚2, 𝑠12) Khi đó

Trang 26

𝜇1|𝑦11, … , 𝑦𝑛11~𝑁(𝑚1, 𝑠 12)

𝜇2|𝑦12, … , 𝑦𝑛22~𝑁(𝑚1, 𝑠 22) Phân phối hậu nghiệm của 𝜇1 là phân phối chuẩn 𝜇1~𝑁 𝑚1, 𝑠 12 , trong đó

𝜇𝑑|𝑦11, … , 𝑦𝑛11, 𝑦12, … , 𝑦𝑛22~𝑁(𝑚𝑑, 𝑠 𝑑2) Trong đó

Ví dụ 2.3: Tốc độ ánh sáng là đại lƣợng ngẫu nhiên có phân phối chuẩn với

độ lệch chuẩn là 100, tốc độ trung bình chƣa biết Một nhà vật lý thực hiện 2 lần thí nghiệm Lần thử thứ nhất đo 20 lần có tốc độ ánh sáng trung bình 299909 và lần thử thứ hai đo 23 lần và có tốc độ ánh sáng trung bình là 299756 Giả sử tốc độ ánh sáng có phân phối tiên nghiệm chuẩn N(300000, 5002)

Ƣớc lƣợng sự khác nhau giữa 2 lần thí nghiệm với độ tin cậy 95%

Trang 27

Trong đó

𝑚𝑑 = 𝑚1 − 𝑚2 = 299909,98 − 299756,42 = 152,76

𝑠 𝑑2 = 𝑠 12 + 𝑠 22 = 499 + 434,03 = 933,03 Với độ tin cậy 95% khoảng ước lượng cho sự khác nhau của hai lần thí nghiệm là

𝑃 𝑝1 < 𝑝 < 𝑝2 = 1 − 𝛼 Giả sử phân phối tiên nghiệm của tỷ lệ là 𝛽(𝑎, 𝑏) Khi đó phân phối hậu nghiệm của 𝑝 là 𝛽 𝑎 , 𝑏 Trong đó 𝑎 = 𝑎 + 𝑚, 𝑏 = 𝑏 + 𝑛 − 𝑚

Ta chứng minh được rằng 𝛽(𝑎 , 𝑏 ) xấp xỉ phân phối chuẩn với trung bình và phương sai

𝜀 = 𝑢1−𝛼 2 𝑉𝑎𝑟 𝑝

Ví dụ 2.4: Gọi 𝑝 là tỷ lệ công ty làm ô nhiễm môi trường ở một tỉnh Giả

sử 𝑝 có phân phối tiên nghiệm 𝛽(1; 4) Chọn một mẫu gồm 145 công ty có 12 công ty làm ô nhiễm môi trường, với độ tin cậy 95% hãy ước lượng công ty làm ô nhiễm môi trường của tỉnh

Giải

Ta có hàm mật độ xác suất hậu nghiệm của p là 𝛽(𝑎 , 𝑏 ) với

Trang 28

𝑎 = 𝑎 + 𝑚 = 1 + 12 = 13

𝑏 = 𝑛 + 𝑏 − 𝑚 = 145 + 4 − 1 = 148 Như vậy 𝛽 𝑎 , 𝑏 = 𝛽(13,148)

0,081 − 0,042; 0,081 + 0,042 = (0.039 ; 0.123)

b Ước lượng sự khác nhau của hai tỷ lệ

Giả sử hai tổng thể 𝑤1 và 𝑤2 có tỷ lệ những phần tử có tính chất A nào đó

chưa biết Gọi 𝑝1, 𝑝2 là tỷ lệ những phần tử có tính chất A của 𝑤1 và 𝑤2 Chọn một mẫu gồm 𝑛1 phần tử từ 𝑤1 ta có 𝑚1 và 𝑛2 phần tử từ 𝑤2 ta có 𝑚2 phần tử có tính

chất A

Giả sử 𝑝1 có phân phối tiên nghiệm 𝛽(𝑎1, 𝑏1) và 𝑝2 có phân phối tiên nghiệm 𝛽(𝑎2, 𝑏2), với độ tin cậy 1 − 𝛼 cho trước

Ta cần ước lượng trung bình sự khác nhau của 2 tỷ lệ 𝑝𝑑 = 𝑝1 − 𝑝2

Ta chỉ xét trường hợp hai phân phối trên độc lập

Khi đó hai phân phối hậu nghiệm của 𝑝1 và 𝑝1 là phân phối Beta độc lập sau

𝑝1~𝛽 𝑎 1, 𝑏 1 , 𝑝2~𝛽(𝑎 2, 𝑏 2) Trong đó

𝑎 1 = 𝑎1 + 𝑚1, 𝑏 1 = 𝑏1 + 𝑛1 − 𝑚1

𝑎 2 = 𝑎2 + 𝑚2, 𝑏 2 = 𝑏2 + 𝑛2− 𝑚2

Ta có phân phối Beta xấp xỉ phân phối chuẩn, do đó phân phối hậu nghiệm của

𝑝𝑑 = 𝑝1 − 𝑝2 cũng có phân phối chuẩn 𝑁(𝑚𝑑, 𝑠 𝑑2), trong đó

𝑚𝑑 = 𝑎 1

𝑎 1 + 𝑏 1 −

𝑎 2

𝑎 2 + 𝑏 2

Trang 30

CHƯƠNG 3: KIỂM ĐỊNH THAM SỐ THỐNG KÊ

BẰNG PHƯƠNG PHÁP BAYES

3.1 TỔNG QUAN VỀ BÀI TOÁN KIỂM ĐỊNH THỐNG KÊ

Trong thực tế, dựa vào số liệu mẫu thu được người ta thường có nhu cầu kiểm tra một vấn đề thống kê nào đó là đúng hay sai Vấn đề thống kê được đặt ra ở đây được gọi là giả thiết thống kê Việc kiểm định các giả thiết thống kê có liên quan đến các tham số đặc trưng của tổng thể được gọi là kiểm đinh tham số thống

kê Để kiểm tra giả thiết thống kê là đúng hay sai, trước tiên ta xây dựng hai mệnh

đề trái ngược nhau có liên quan đến tham số cần kiểm định được gọi là giả thiết (H)

 Sai lầm loại 1: Là sai lầm khi ta bác bỏ giả thiết trong khi nó thật sự đúng (bác bỏ giả thiết đúng)

 Sai lầm loại 2: Là sai lầm khi ta chấp nhận giả thiết trong khi nó thật

sự sai (chấp nhận giả thiết sai)

Ta không thể khẳng định sai lầm nào nghiêm trọng hơn, nhưng đã gọi là sai lầm thì tất cả đều không tốt và cần phải được hạn chế Ta mong muốn tìm một tiêu chuẩn kiểm định giả thiết để đồng thời làm cho các xác suất sai lầm loại 1, sai lầm loại 2 là nhỏ nhất Các nhà thống kê hạn chế các sai lầm đó theo nghĩa xác suất xảy

ra mỗi sai lầm là nhỏ nhất Tuy nhiên, khi ta làm giảm sai lầm loại này thì có thể sai lầm loại kia sẽ tăng lên và ngược lại Do đó trong bài toán kiểm định người ta tiến hành như sau: Ấn định trước mức xác suất sai lầm loại 1 qua mức ý nghĩa  và xây dựng lý thuyết sao cho khả năng mắc phải sai lầm loại 2 ( ) là nhỏ nhất trong khả năng có thể Trong thực tế chúng ta chọn  đủ bé (từ 1% đến 10%)

Trang 31

Việc thực hiện việc kiểm định tham số thống kê với mức ý nghĩa  cho trước theo phương pháp Bayes có thể được thực hiện theo quy trình như sau

 Chọn giả thiết, đối thiết

 Tính giá trị 𝑝𝑣

 Kết luận

𝑛ế𝑢 𝑝𝑣 ≤ 𝛼 𝑡𝑎 𝑏á𝑐 𝑏ỏ 𝑔𝑖ả 𝑡𝑕𝑖ế𝑡

𝑛ế𝑢 𝑝𝑣 > 𝛼 𝑡𝑎 𝑐𝑕ấ𝑝 𝑛𝑕ậ𝑛 𝑔𝑖ả 𝑡𝑕𝑖ế𝑡 Trong đó việc xác định 𝑝𝑣 sẽ dựa vào phân phối hậu nghiệm của tham số cần kiểm định

Sau đây là một số bài toán kiểm định về tham số trung bình và tỷ lệ

3.2 MỘT SỐ BÀI TOÁN KIỂM ĐỊNH LIÊN QUAN ĐẾN TRUNG BÌNH 3.2.1 Kiểm định trung bình

𝑝𝑣 = 0.5 + 𝜑 𝑚 − 𝜇0

𝑠 Nếu chọn đối thiết 𝜇 ≠ 𝜇0 thì

𝑝𝑣 = 1 − 2 𝜑 𝑚 − 𝜇0

𝑠

Kết luận: Theo nguyên tắc chung của bài toán kiểm định

Ví dụ 3.1: Hàm lượng vitamin trong một loại trái cây là một đại lượng ngẫu

nhiên có phân phối chuẩn với tham số trung bình chưa biết và độ lệch chuẩn mẫu bằng 3 Giả sử hàm lượng vitamin có phân phối tiên nghiệm chuẩn 𝑁(30; 102) Chọn một mẫu gồm 10 trái cây đo được hàm lượng vitamin (đơn vị %) ta có số liệu sau

Định dạng
Số trang	62
Dung lượng	1,52 MB