Nhận dạng và ứng dụng phân phối nhị thức trong thống kê

7 549 0
Nhận dạng và ứng dụng phân phối nhị thức trong thống kê

Đang tải... (xem toàn văn)

Thông tin tài liệu

Bài viết trình bày về nhận dạng và ứng dụng qui luật phân phối nhị thức cho sự đo lường được thực hiện trong các điều kiện quan sát hay thí nghiệm, để giải một số bài toán xác suất thống kê, trong đó có những bài toán thống kê có ý nghĩa trong nghiên cứu khoa học thực nghiệm.

Đặng Kim Phương (2020) (18): 22-28 TẠP CHÍ KHOA HỌC – ĐẠI HỌC TÂY BẮC Khoa học Tự nhiên Công nghệ NHẬN DẠNG VÀ ỨNG DỤNG PHÂN PHỐI NHỊ THỨC TRONG THỐNG KÊ Đặng Kim Phương Trường Đại học Tây Bắc Tóm tắt: Trong khn khổ viết này, chúng tơi trình bày nhận dạng ứng dụng qui luật phân phối nhị thức cho đo lường thực điều kiện quan sát hay thí nghiệm, để giải số tốn xác suất thống kê, có tốn thống kê có ý nghĩa nghiên cứu khoa học thực nghiệm Đồng thời đưa hệ thống ví dụ minh họa nhằm cung cấp số kĩ giải toán thực tiễn nghiên cứu khoa học thực nghiệm Từ khóa: Đại lượng ngẫu nhiên, Trung bình, Phương sai, Độ lệch chuẩn, Kiểm định giả thiết thống kê Đặt vấn đề Nghiên cứu xã hội học cho thấy, tình yêu người Mỹ dành cho xe lớn Số ngày mà người Mỹ có sở hữu xe không ngồi sau tay lái để lái xe làm, mua sắm, hay lái xe u thích,… chẳng bao Tuy nhiên theo Fank Newport Leslie McAneny (1993) điều tra 1.003 người lớn vào tháng sáu 803 thiếu niên vào tháng chín năm 1993 người lớn thiếu niên Mỹ cho lái xe quyền lợi mà đặc quyền Theo kết điều tra họ thấy rằng: 70% số người lớn hỏi ủng hộ kỳ thi mang tính bắt buộc năm lần người lái xe 65 tuổi 56% số thiều niên hỏi ủng hộ điều luật từ chối cấp lái xe cho 21 tuổi mà bỏ học trung học Báo cáo hai tác giả khẳng định rằng: Kết điều tra tỷ lệ % người lớn ủng hộ kỳ thi mang tính bắt buộc năm lần khác với tỷ lệ % thực tế với toàn số người lớn Mỹ không lớn 3% kết điều tra tỷ lệ % thiếu niên ủng hộ điều luật từ chối cấp lái xe cho 21 tuổi mà bỏ học trung học khác với tỷ lệ % thực tế với toàn số thiếu niên Mỹ không lớn 4% Vấn đề đặt là: - Bằng cách mà khẳng định chắn tỷ lệ % báo cáo xác 22 điều tra thực cách sử dụng câu hỏi trả lời “có ” “khơng” - Mơ hình thống kê thích hợp tình - Việc sử dụng mơ hình để đánh giá độ tin cậy kết luận dựa câu hỏi trả lời “có ” “khơng”, xác định giá trị trung bình, độ lệch chuẩn,… thực nào? Trong báo này, trình bày phương pháp nhận dạng qui luật phân phối nhị thức ứng dụng qui luật phân phối thơng qua nội dung tốn thống kê có ý nghĩa nghiên cứu khoa học thực nghiệm Phương pháp nghiên cứu Trước hết, nhắc lại số khái niệm kết cần thiết sau [2] [4] 2.1 Định nghĩa Đại lượng ngẫu nhiên X gọi có phân phối nhị thức với tham số (n, p) phân phối xác suất có dạng k k P ( X= k= ) Cn p q n−k đó: n số lần thực phép thử X số lần xuất biến cố A n lần thực phép thử p xác suất xuất biến cố A lần thực phép thử (0 < p < 1) k = 0, 1, 2, , n ; q = - p n! k với n ! = 1.2 n Cn = k !(n - k )! 0! = Ký hiệu đại lượng ngẫu nhiên X phân phối theo quy luật nhị thức với tham số n p X ~ B(n, p) 2.2 Các số đặc trưng phân phối nhị thức Nếu đại lượng ngẫu nhiên X có phân phối nhị thức với tham số (n, p) i) Kỳ vọng EX = np ii) Phương sai DX = npq iii) Độ lệch chuẩn s = DX iiii) Mod (X ) = éë (n + 1)p ùû ; ([ a ] phần nguyên a ) Kết nghiên cứu Trong xác suất thống kê, dấu hiệu nghiên cứu có qui luật phân phối định, qui luật phân phối nhị thức có tần suất gặp phổ biến Để nhận dạng qui luật phân phối nhị thức dùng tiêu chuẩn Kolmogorov, tiêu chuẩn Palowski, Trong viết trình bày cách nhận dạng phân phối nhị thức phương pháp: sử dụng tiêu chuẩn kiểm định bình phương thơng qua đặc trưng phép thử nhị thức Kết chúng tơi cung cấp hệ thống ví dụ minh họa, chúng tơi sử dụng hệ thống kiến thức liên quan vào phân tích liệu thực nghiệm để giải số toán thống kê cụ thể 3.1 Sử dụng tiêu chuẩn kiểm định bình phương nhận dạng phân phối nhị thức Các bước sử dụng tiêu chuẩn kiểm định bình phương để kiểm định giả thiết qui luật phân phối nhị thức thực sau: khoảng Chia (a, b) thành k khoảng (hay gọi tổ): C1 , C2 , , Ck Gọi ni tần số ( X , X , , X n ) quan sát X i mẫu k thuộc khoảng = Ci , i 1,= k ; ∑ ni n i =1 Thay p ước lượng điểm p pˆ , tính xác suất pˆ i = P [ X ∈ Ci ] ; i = 1, 2, , k Tính tiêu chuẩn kiểm định k Z =∑ i =1 (ni − npˆ i ) npˆ i so sánh Z với Cα ( Cα giá trị tra bảng phân phối bình phương với k − r − bậc tự do, mức ý nghĩa α ) Nếu Z > Cα bác bỏ giả thiết cho dấu hiệu nghiên cứu X có phân phối nhị thức B (n, p ) Lưu ý, tiêu chuẩn kiểm định bình phương sử dụng tốt kích thước mẫu n đủ lớn tần số ni khoảng lớn 5, số liệu mẫu cho có khoảng có tần số nhỏ phải gộp khoảng vào khoảng trước sau Ví dụ Để đánh giá chất lượng sản phẩm doanh nghiệp A sản xuất, người ta tiến hành chọn ngẫu nhiên từ kiện hàng sản phẩm để kiểm tra Kết thu sau: Số sản phẩm loại I Số kiện hàng 13 107 376 504 Với mức ý nghĩa α = 0, 05 khẳng định tỷ lệ sản phẩm loại I kiện hàng doanh nghiệp A sản xuất 80% không? Giả sử ( X , X , , X n ) mẫu quan sát dấu hiệu nghiên cứu X Kiểm định giả thiết: X đại lượng ngẫu nhiên có phân phối nhị thức B (n, p ) mức ý nghĩa α Do tổng số sản phẩm 1000 kiện hàng doanh nghiệp A sản suất, nên dùng tiêu chuẩn kiểm định tỷ lệ để kiểm định giả thiết cho “tỷ lệ sản phẩm loại I kiện hàng doanh nghiệp A sản xuất 80% “ Để kiểm định giả thiết phải sử dụng tiêu chuẩn bình phương: Xét khoảng (a, b) trục số cho quan sát mẫu ( X , X , , X n ) nằm Gọi X số sản phẩm loại I lấy kiện hàng 23 Thiết lập toán kiểm định giả thiết: H : X có phân phối nhị thức B(3;0,8) K : X khơng có phân phối nhị thức B (3;0,8) mức ý nghĩa α = 0, 05 Gọi pˆi xác suất kiện hàng có i sản phẩm loại I pˆi = C 3i pˆi (1 - pˆ)3-i ; i = 0;1;2;3 Ta có :pˆ0 pˆ1 pˆ2 pˆ3 = C 30 0,80.0,23 = 0,008 = C 0,8 0,2 = 0,096 = C 0,82.0,21 = 0,384 = C 0,83.0,20 = 0,512 3 3 Tính tiêu chuẩn kiểm định hay khơng, ngồi cách sử dụng tiêu chuẩn kiểm định cịn nhận dạng qui luật phân phối nhị thức thông qua phép thử tạo nên qui luật phân phối này, phép thử nhị thức Phép thử nhị thức mơ hình tuyệt vời cho nhiều tình chọn mẫu thống kê, đặc biệt điều tra tạo loại hình liệu “có” “khơng” Sau chúng tơi trình bày đặc trưng phép thử nhị thức thông qua ví dụ giúp cho bạn đọc nắm qui trình phân tích số liệu thống kê để nhận dạng phân phối nhị thức ứng dụng phân phối vào giải toán thực tiễn nghiên cứu khoa học thực nghiệm [1], [2], [3] 3.2 Nhận dạng phân phối nhị thức thông (13 − 8) (107 − 96) Z= + + qua đặc trưng phép thử nhị thức 96 Phép thử nhị thức có đặc trưng sau: (376 − 384) (504 − 512) + = 4, 676 384 512 Phép thử thực n lần giống Tra bảng giá trị hàm phân phối bình phương: C a = c2 (3;0,05) = 7,8 Do Z < C a nên giả thiết H chấp nhận mức ý nghĩa α = 0, 05 tức X đại lượng ngẫu nhiên tuân theo qui luật phân phối nhị thức B (3;0,8) Vậy tỷ lệ sản phẩm loại I kiện hàng doanh nghiệp A sản xuất 80% Với số liệu thống kê kết kiểm định X đại lượng ngẫu nhiên tuân theo qui luật phân phối nhị thức B (3;0,8) giải số tốn đặt như: Tính xác suất: P(X P(X P(X P(X = 0) = C 30 0,80.0,23 = 0,008 = 1) = C 31 0,81.0,22 = 0,096 = 2) = C 32 0,82.0,21 = 0,384 = 3) = C 33 0,83.0,20 = 0,512 Tính giá trị trung bình X : EX = np = 3.0,8 = 2,4 Tính phương sai độ lệch chuẩn X : DX = npq = 3.0,8.0,2 = 0,48 s = DX = 0,48 = 0,69 Để nhận biết dấu hiệu cần nghiên cứu có tuân theo qui luật phân phối nhị thức 24 Mỗi lần thử có hai kết quả: “thành công” “thất bại” Xác suất thành công lần thử p (0 < p < 1) , xác suất thất bại lần thử - p = q Các lần thử độc lập với Ta quan tâm đến số lần thành công n lần thử Gọi X số lần thành cơng n lần thử X đại lượng ngẫu nhiên có phân phối nhị thức với tham số (n, p) Ví dụ Một chủ doanh nghiệp nhận rằng, số nhân viên doanh nghiệp làm giả mạo thông tin hồ sơ xin việc xác suất nhân viên làm giả mạo thông tin hồ sơ xin việc 0,35 Doanh nghiệp tiến hành kiểm tra hồ sơ xin việc nhân viên nhận vào làm việc Việc chọn mẫu có phải phép thử nhị thức không? Ta thấy: Việc kiểm tra hồ sơ xin việc nhân viên thực lần thử giống 2 Mỗi lần thử có hai kết quả: Hồ sơ “có” “khơng” làm giả mạo thơng tin Hai kết liên tưởng đến “thành công” hay “thất bại” phép thử Xác suất “thành công” lần thử 0,35 Các lần thử độc lập với nhau, xác suất “thành cơng” lần thử không bị tác động kết lần thử khác Ta quan tâm tới số hồ sơ xin việc làm giả mạo thông tin Vậy, việc kiểm tra hồ sơ xin việc nhân viên thỏa mãn đặc trưng phép thử nhị thức Gọi X số hồ sơ xin việc làm giả mạo thơng tin X đại lượng ngẫu nhiên có phân phối nhị thức với tham số (5;0,35) Ví dụ Trở lại với nghiên cứu điển hình trình bày phần mở đầu Sự ước tính tỷ lệ người lớn Mỹ ủng hộ kỳ thi mang tính bắt buộc năm lần người lái xe 65 tuổi, phụ thuộc vào số người điều tra ủng hộ kiểm tra mang tính bắt buộc người lái xe 65 tuổi Việc thực điều tra thỏa mãn đặc trưng phép thử nhị thức: Việc chọn mẫu bao gồm n = 1.003 lần thử giống Mỗi lần thử lựa chọn người từ số lớn người dân Mỹ Mỗi lần thử có hai kết quả: Người hỏi trả lời “có” “khơng” ủng hộ kỳ thi bắt buộc Hai kết liên tưởng đến “thành công” hay “thất bại” phép thử Xác suất “thành công” lần thử 0,7 xác suất giữ nguyên từ lần thử đến lần thử khác Các lần thử độc lập xác suất “thành công” lần thử không bị tác động kết lần thử khác Ta quan tâm tới số người mẫu n = 1.003 ủng hộ kiểm tra mang tính bắt buộc người lái xe 65 tuổi Gọi X số người mẫu n = 1.003 ủng hộ kiểm tra mang tính bắt buộc năm lần người lái xe 65 tuổi X đại lượng ngẫu nhiên có phân phối nhị thức B(1003;0,7) với trung bình độ lệch chuẩn: EX = np = 1003.0,7 = 702,1 s = npq = 1003.0,7.0,3 = 14,51 Với kết điều tra thực tế, tỷ lệ người lớn Mỹ ủng hộ kỳ thi mang tính bắt buộc năm lần người lái xe 65 tuổi p = 0,7 theo qui tắc thực chứng ta biết rằng, có khoảng 95% số người mẫu ủng hộ kỳ thi mang tính bắt buộc năm lần người lái xe 65 tuổi nằm khoảng lần độ lệch chuẩn so với giá trị trung bình: P éë EX - 2s £ X £ EX + 2s ùû = 0,95 P éë 673,08 £ X £ 731,12 ùû = 0,95 Tức là, với xác suất 0,95 có khoảng 673 đến 731 người ủng hộ kỳ thi mang tính bắt buộc người lớn ta có é 673 X 731 ùú £ £ = 0,95 n 1003 úû ë 1003 P éë 0,67 £ p £ 0,729 ùû = 0,95 P êê Với độ tin cậy 0,95 khẳng định tỷ lệ người lớn Mỹ ủng hộ kỳ thi mang tính bắt buộc năm lần người lái xe 65 tuổi nằm khoảng 67% đến 72,9% Vậy, báo cáo hai tác giả khẳng định rằng: Kết điều tra tỷ lệ % người lớn ủng hộ kỳ thi mang tính bắt buộc năm lần khác với tỷ lệ % thực tế với tồn số người lớn Mỹ khơng lớn 3% Tương tự, kiểm tra kết báo cáo tỷ lệ % thiếu niên ủng hộ điều luật tử chối cấp lái xe cho 21 tuổi mà bỏ học trung học 25 Ví dụ Giả sử có khoảng triệu người khu vực bán hàng người mua tiềm sản phẩm Để ước lượng tỷ lệ người mua sản phẩm đưa chào bán Người ta chọn mẫu gồm 1.000 người theo cách thức, người số triệu người khu vực bán hàng có hội ngang việc lựa chọn Mỗi người mẫu hỏi rằng: Ơng/bà có mua sản phẩm khơng chào bán? Ta kiểm tra việc chọn mẫu ví dụ có thỏa mãn đặc trưng phép thử nhị thức mô tả hay không? Việc chọn mẫu bao gồm n = 1.000 lần thử giống Mỗi lần thử lựa chọn người từ triệu người khu vực bán hàng Mỗi lần thử có hai kết quả: Người hỏi trả lời “có” “khơng” mua sản phẩm Hai kết liên tưởng đến “thành công” hay “thất bại” phép thử Xác suất “thành công” với tỷ lệ triệu người mua sản phẩm Theo luật số lớn, xác suất giữ nguyên từ lần thử đến lần thử khác Các lần thử độc lập xác suất “thành công” lần thử không bị tác động kết lần thử khác Ta quan tâm tới số người mẫu n = 1.000 mua sản phẩm Cuộc điều tra thỏa mãn năm đặc trưng phép thử nhị thức nên phép thử nhị thức Giả sử kết khảo sát mẫu có 650 người trả lời “có mua sản phẩm chào bán” để ước lượng tỷ lệ người mua sản phẩm đưa chào bán thực sau: Gọi p tỷ lệ người mua sản phẩm đưa chào bán Với độ tin cậy 0,95 ta có 26 0,65.0,35 < p < 0,65 + 1000 0,65.0,35 1,96 1000 0,621 < p < 0,679 0,65 - 1,96 Như vậy, với độ tin cậy 0,95 tỷ lệ người mua sản phẩm đưa chào bán nằm khoảng 62,1% đến 67,9% Kiểm định giả thiết H :p K :p 0,67 0,67 mức ý nghĩa a = 0,05 Tính giá trị kiểm định 650 - 1000.0,67 = 1,34 < 1,96 Z = 1000.0,67.0,33 Ta chấp nhận giả thiết: tỷ lệ người mua sản phẩm đưa chào bán 67% Gọi X số người mẫu mua sản phẩm đưa chào bán X đại lượng ngẫu nhiên có qui luật phân phối nhị thức B(1000;0,67) ta tính được: Số người trung bình mẫu mua sản phẩm đưa chào bán: EX = np = 1000.0,67 = 670 (người) Độ lệch chuẩn: s = npq = 1000.0,67.0,33 = 14,86 Kết luận Trong xác suất thống kê, phân phối nhị thức phân phối quan trọng thơng dụng, tính chất qui luật phân phối ứng dụng để giải nhiều toán nghiên cứu Khoa học kỹ thuật, Kinh tế, Giáo dục, Xã hội, … Việc quen thuộc với phân phối nhị thức nhận biết đặc tính phép thử tạo qui luật phân phối hữu ích Nó giúp cho nhà nghiên cứu, khơng tính xác suất số lần “thành công” n lần thử độc lập giống nhau, xác suất “thành cơng” lần thử ln p, mà cịn xác định thơng tin giá trị trung bình, độ lệch chuẩn, mod,… dấu hiệu cần nghiên cứu cách dễ dàng mà không cần phải qua qui trình tính tốn phức tạp TÀI LIỆU THAM KHẢO Đặng Hùng Thắng (2011) Mở đầu lý thuyết xác suất ứng dụng Nxb Giáo dục,47-48 Đào Hữu Hồ (2000) Thống kê xã hội học Nxb ĐHQG Hà Nội,57-70 Đinh Văn Gắng (2003) Lý thuyết xác suất thống kê Nxb Giáo dục,42-50 Phạm Văn Kiều (1998) Xác suất thống kê Nxb Giáo dục, 62-68 27 IDENTIFICATION AND APPLICATION OF BINOMIAL DISTRIBUTION IN STATISTICS Dang Kim Phuong Tay Bac University Abstract: In this article, we shall present the identification and application of binomial distribution for measurement conducted under the observational or experimental conditions to solve some statistical probability problems including those of significance in experimental scientific research We also offer a series of illustrative examples to provide some practical problem-solving skills when carrying out empirical scientific research Keywords: Random variables, Average, Expected Value, Standard deviation, Statistical hypothesis testing _ Ngày nhận bài: 14/8/2019 Ngày nhận đăng: 29/09/2019 Liên lạc: Đặng Kim Phương; Email: dangkimphuongtbu@gmail.com 28 ... số liệu thống kê để nhận dạng phân phối nhị thức ứng dụng phân phối vào giải toán thực tiễn nghiên cứu khoa học thực nghiệm [1], [2], [3] 3.2 Nhận dạng phân phối nhị thức thông (13 − 8) (107... tơi sử dụng hệ thống kiến thức liên quan vào phân tích liệu thực nghiệm để giải số toán thống kê cụ thể 3.1 Sử dụng tiêu chuẩn kiểm định bình phương nhận dạng phân phối nhị thức Các bước sử dụng. .. Kết nghiên cứu Trong xác suất thống kê, dấu hiệu nghiên cứu có qui luật phân phối định, qui luật phân phối nhị thức có tần suất gặp phổ biến Để nhận dạng qui luật phân phối nhị thức dùng tiêu

Ngày đăng: 22/02/2021, 12:01

Tài liệu cùng người dùng

Tài liệu liên quan