Phân tích liên tiếp

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - LÊ THỊ BÍCH NGỌC PHÂN TÍCH LIÊN TIẾP Chuyên ngành: LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN HỌC Mã số: 60.46.01.06 LUẬN VĂN THẠC SỸ KHOA HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: GS.TSKH ĐẶNG HÙNG THẮNG Hà Nội – Năm 2014 Mục lục MỞ ĐẦU 1.1 Giới thiệu phân tích liên tiếp 1.2 Thí dụ: Kiểm tra sản phẩm 1.2.1 Phân phối cỡ mẫu PHÂN TÍCH LIÊN TIẾP: KIỂM ĐỊNH GIẢ THIẾT ĐƠN 11 2.1 Tiêu chuẩn liên tiếp tỉ số xác suất(SPRT) 11 2.2 SPRT: Kết thúc hữu hạn bị chặn 13 2.3 Hàm OC (θ) 17 2.4 Số trung bình mẫu 20 2.5 Đồng thức Wald 28 2.5.1 Ứng dụng đồng thức 28 Các cận cận số trung bình mẫu 31 2.6 PHÂN TÍCH LIÊN TIẾP: KIỂM ĐỊNH CHO GIẢ THIẾT HỢP 35 3.1 3.2 Phương pháp hàm trọng lượng 35 3.1.1 Ứng dụng phương pháp hàm trọng lượng 36 Tiêu chuẩn liên tiếp t t2 37 3.2.1 Sự khai triển tiệm cận nghịch đảo tích phân 40 3.2.2 Tiệm cận chuẩn thống kê T 41 3.2.3 Tiêu chuẩn liên tiếp t 45 3.2.4 Tiêu chuẩn liên tiếp t2 (tiêu chuẩn hai phía) ƯỚC LƯỢNG LIÊN TIẾP 46 49 4.1 Các khái niệm 49 4.2 Tính đủ hồn tồn đầy đủ 50 4.3 Cận Cramer-Rao 59 4.4 Quy trình hai bước 64 4.4.1 Quy trình Stein cho ước lượng trung bình phân phối chuẩn với phương sai chưa biết 64 4.4.2 Quy trình ước lượng hiệu hai trung bình 68 4.4.3 Quy trình cho ước lượng trung bình chung 70 4.4.4 Khoảng tin cậy chiều dài cố định dựa SPRT 75 KẾT LUẬN 82 Tài liệu tham khảo 83 Lời nói đầu Ngày với phát triển xã hội gia tăng nhu cầu việc ứng dụng phương pháp thống kê tốn để phân tích số liệu thống kê thu lĩnh vực khoa học tự nhiên, kinh tế xã hội Trong luận văn tác giả trình bày thống kê liên tiếp, dùng để xử lí liệu số lượng quan trắc không cố định Luận văn chia thành bốn chương: Chương 1: Mở đầu Chương giới thiệu chung phương pháp phân tích liên tiếp thống kê, đặc điểm phân tích liên tiếp, ứng dụng kiểm tra sản phẩm Chương 2: Phân tích liên tiếp: kiểm định giả thiết đơn Nội dung chương sử dụng phân tích liên tiếp để kiểm định tốn giả thiết đơn, đối thiết đơn Đưa cách xây dựng tiêu chuẩn liên tiếp tỉ số xác suất (SPRT) ví dụ minh họa, tính hữu hạn, bị chặn SPRT Sau xét hàm OC, hàm ASN, đồng thức Wald Chương 3: Phân tích liên tiếp: kiểm định cho giả thiết hợp Nội dung chương ứng dụng SPRT kiểm định giả thiết hợp, đưa phương pháp hàm trọng lượng ( Phân phối tiên nghiệm ) để xây dựng SPRT tối ưu ứng dụng phương pháp hàm trọng lượng Chương đưa tiêu chuẩn liên tiếp t t2 tính chất Chương 4: Ước lượng liên tiếp Chương bao gồm khái niệm ước lượng liên tiếp, nghiên cứu tính đủ đầy đủ, cận Cramer - Rao, quy trình hai bước Và cách xác định khoảng tin cậy độ dài cố định dựa SPRT Luận văn thực trường Đại Học Khoa Học Tự Nhiên - Đại Học Quốc Gia Hà Nội, hướng dẫn nhiệt tình GS.TSKH Đặng Hùng Thắng Thầy dành nhiều thời gian hướng dẫn giải đáp thắc mắc suốt trình làm luận văn Tơi muốn bày tỏ lịng biết ơn sâu sắc đến thầy Qua đây, xin gửi tới q thầy Khoa Tốn-Cơ-Tin học, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội, thầy cô tham gia giảng dạy khóa cao học 2011- 2013, lời cảm ơn sâu sắc công lao dạy dỗ suốt trình học tập tơi Nhà trường Tơi xin cảm ơn gia đình, bạn bè bạn đồng nghiệp thân mến quan tâm, tạo điều kiện cổ vũ, động viên tơi để tơi hồn thành tốt nhiệm vụ Hà Nội, tháng 08 năm 2014 Tác giả luận văn Lê Thị Bích Ngọc Chương MỞ ĐẦU 1.1 Giới thiệu phân tích liên tiếp Phân tích liên tiếp khác với quy trình thống kê khác cỡ mẫu khơng cố định trước Người thí nghiệm chọn dãy quan sát (hoặc số cố định quan sát) thời điểm định xem: ngừng lấy mẫu đưa định tiếp tục lấy mẫu đưa định sau Những tốn định mà người thí nghiệm liên tục thay đổi phương pháp xử lí mức khó hơn, gọi toán thiết kế liên tiếp Chẳng hạn xét toán sau Bài toán 1.1: Nếu ta muốn so sánh vài loại thuốc khác phương pháp điều trị(như kiểm tra liên tiếp loại thuốc ung thư)để biết có nên giảm số loại thuốc khỏi giai đoạn đầu thử nghiệm, kết loại thuốc so với loại thuốc khác Vậy nét đặc trưng phân tích liên tiếp số quan sát cần tìm để kết thúc thí nghiệm biến ngẫu nhiên Vì phụ thuộc vào kết quan sát Phương pháp liên tiếp giúp ta đưa dự đốn sớm dùng phương pháp cỡ mẫu cố định Trong thí nghiệm liên tiếp ta cần xác định: Kích cỡ mẫu ban đầu Một quy tắc cho kết thúc thí nghiệm Số lượng quan sát làm thêm thí nghiệm tiếp tục Một quy tắc định cuối Trong thí nghiệm có số lượng quan sát phụ thuộc liên tiếp, đòi hỏi định lý đơn giản áp dụng chung, tốn thiết kế liên tiếp khơng có số phép thử mà số phương pháp xử lí phụ thuộc liên tiếp Nếu thí nghiệm tiếp tục quan sát X1 , , Xn , c tiêu chuẩn liên tiếp hoàn toàn xác định tập rời Rm , Rm Rm ∈ Rn - không gian Euclid m chiều với m = 1,2 X1 , , Xn phụ thuộc vào Rm , ta chấp nhận giả thiết H, bác bỏ H phụ thuộc vào Rm Và ta tiếp c tục lấy mẫu nằm Rm Bởi tập rời hợp chúng Rm suy cần xác định hai tập ba tập Vấn đề lựa chọn tập thích hợp hai tập Tiêu chuẩn lựa chọn tập định đặc trưng sử dụng(OC) cỡ mẫu trung bình(ASN), hàm xây dựng sau: Giả sử hàm phân bố tham số giá trị thực giả sử nhà thống kê lựa chọn hai giả thiết H0 H1 Hàm OC(θ) xác suất chấp nhận H0 θ giá trị thực tham số Với mong muốn hàm OC phải giá trị cao θ cho phù hợp với H0 giá trị thấp θ cho phù hợp với H1 Ví dụ người ta u cầu OC(θ) ≥ − α, ∀θ ∈ H0 OC(θ) ≤ β, ∀θ ∈ H1 , α β xác suất phạm sai lầm Một tiêu chuẩn liên tiếp S gọi chấp nhận hàm OC thỏa mãn tiêu chuẩn Như nói số lượng quan sát cần tìm phân tích liên tiếp biến ngẫu nhiên quan trọng giá trị kì vọng θ tham số giá trị thực Giá trị kì vọng hàm điển hình θ gọi hàm ASN(hàm cỡ mẫu trung bình) Với mong muốn có hàm ASN nhỏ với α, β cho trước, cỡ mẫu dự kiến nhỏ so với quy trình cỡ mẫu cố định Cho ν(θ|D) kí hiệu cỡ mẫu kì vọng quy trình D θ giá trị thực Nếu D0 chấp nhận ν(θ|D) = M inD ν(θ|D) D0 xem tiêu chuẩn tốt Tuy nhiên, nói chung khơng tồn tiêu chuẩn tốt Tiêu chuẩn tìm thấy phân tích liên tiếp tối ưu, H0 H1 giả thiết đơn Phép kiểm định theo tỉ số xác suất liên tiếp Wald cho ASN nhỏ với hai H0 H1 Hiệu quy trình D θ xác định tỉ lệ số lượng mẫu dự kiến nhỏ D θ với số lượng mẫu dự kiến D θ Wald’s SPRT có hiệu với hai giả thiết H0 H1 1.2 Thí dụ: Kiểm tra sản phẩm Phân tích liên tiếp sớm phương pháp lấy mẫu đôi Dodge Romig kiểm tra chất lượng sản phẩm Lấy n sản phẩm bác bỏ mẫu số lượng phế phẩm mẫu ≥ c (và chấp nhận < c ) Một phương pháp khác : lấy sản phẩm cách riêng biệt thời điểm khác nhau, bác bỏ mẫu mà số lượng phế phẩm mẫu ≥ c, chấp nhận mẫu mà số lượng thành phẩm mẫu ≥ n − c + 1, cỡ mẫu cần thiết c nhiều n Phương pháp gọi kiểm tra rút ngắn 1.2.1 Phân phối cỡ mẫu Kí hiệu N cỡ mẫu ngẫu nhiên cần thiết để kết thúc thí nghiệm, đó: Pθ (N = c bác bỏ H0 ) = θc Pθ (N = c + r bác bỏ H0 ) = c+r−1 c−1 (1.1) r θc (1 − θ) (1.2) với r = 1, 2, n − c Pθ (N = n − c + + s chấp nhận H0 ) = với s = 0, 1, c − n−c+s s θs (1 − θ) n−c+1 n : Eθ (N) = mPm m=1 Pm xác suất mà định đạt lần thử thứ m (1.3) Kí hiệu : P (N = m| bác bỏ H0 ) = với m < c P (N = m| chấp nhận H0 ) = với m < n − c + nữa: Pm = P0 (bác bỏ giai đoạn m) + P (chấp nhận giai đoạn m, m ≥ c) = m−1 c−1 m−c θc (1 − θ) m−1 n−c + (1 − θ) n−c+1 m−(n−c+1) θ (1.4) Do đó: n Eθ (N ) =c θ c m=1 m c m−c (1 − θ) n + (n − c + 1) (1 − θ) n−c+1 m=n−c+1 n=c =c θc r=0 r+c c (1 − θ) θm−(n−c+1) (1.5) θr (1.6) r c−1 + (n − c + 1) (1 − θ) m n−c+1 n−c+1+r n−c+1 r r=0 Người ta thường ưa dùng kế hoạch lấy mẫu rút ngắn kế hoạch lấy mẫu đơn tương đương E(N|θ)của kế hoạch lấy mẫu rút ngắn nhỏ cỡ mẫu kế hoạch lấy mẫu đơn Xét trường hợp c = 1: n−1 r (r + 1) (1 − θ) + n (1 − θ) E (N |θ) = θ n r=0 n−1 (r + 1) y r + ny r , y = − θ = (1 − y) r=0 n−1 n r jy j + ny n (r + 1) y − = r=0 j=1 n−1 n−1 r jy j (r + 1) y − = r=0 j=0 n−1 yr = = r=0 − yn 1−y (1.7) E (N |θ) tăng với y E (N |θ) giảm với θ c = Tuy nhiên điều không với c > Cho P1 (θ) = P (chấp nhận mẫu sử dụng quy trình mẫu cố định|θ) c−1 = r=0 n r θr (1 − θ) n−r (1.8) P2 (θ) = P (chấp nhận mẫu sử dụng luật liên tiếp|θ) n = P (chấp nhận mẫu vàN = m|θ) m=n−c+1 n m−1 n−c = m=n−c+1 θm−1−(n−c) (1 − θ) n−1 = (1 − θ) r=n−c c−1 = (1 − θ) r n−c n−c+1 n−c+1 r=0 n−c (1 − θ) θr−(n−c) r+n−c r θr (1.9) Khi có bổ đề sau: Bổ đề 1.2.1 P1 (θ) = P2 (θ) ∀ n,c Chứng minh cho c=1,P1 (θ) = P2 (θ) = (1 − θ)n cho c = 2,P1 (θ) = P2 (θ) = (1 − θ)n + nθ(1 − θ)n−1 Giả sử với c xét trường hợp c + giả sử c−1 k=0 n k c−1 k n−k θ (1 − θ) n−c+1 = (1 − θ) r=0 r+n−c r θr (1.10) ta cần chứng minh: c−1 k=0 n k c k θ (1 − θ) n−k n−c = (1 − θ) r=0 r+n−c−1 r θr (1.11) hàm đường thẳng số lượng quan sát Chi phí lấy mẫu cỡ n1 từ Π1 mẫu cỡ n2 từ Π2 a1 n1 + a2 n2 + a3 Nếu quy định cận A0 chi phí lấy mẫu, n1 n2 phụ thuộc vào giới hạn a1 n1 + a2 n2 ≤ A = A0 − a3 (4.39) Số i (σi2 /ni ) với phương sai T1 (n1 ) − T2 (n2 ) cho giá trị tích phân ni , cực tiểu cho ni > liên tục phụ thuộc vào 4.39 cách đặt ni = n0i 1/2 (A/ai )ai σi ni = (4.40) 1/2 a σ j j j giá trị cực tiểu cho V (A) = i σi2 n0i 1/2 i σi = A (4.41) tỉ số ρ = σ2 /σ1 mà giá trị tối ưu 4.41 phụ thuộc chưa biết, người ta sử dụng quy trình hai bước cho ước lượng θ1 − θ2 , trước tiên cách đặt mẫu m1 + m2 quan sát, mi từ Πi , sử dụng ước lượng cho σi thu từ mẫu ban đầu để phân phối quan sát lại Πi Chúng ta kiểm tra hiệu hoạt động quy trình ước lượng Πi chuẩn Các tập chuẩn Khi Πi biết chuẩn, chọn số nguyên dương mi cho a1 m1 + a2 m2 < A lấy mi quan sát từ Πi Cho s2i (mi ) = mi j=1 Xij − mi Ti2 (mi ) mi − (4.42) 1/2 U (m1 , m2 ) =    m1 ∗ n1 = (A − a2 m2 )/(a1 )   AU (m1 , m2 )/(a1 ), a1 s1 (m1 ) 1/2 (4.43) si (mi ) AU (m1 , m2 )/(a1 ) < m1 (A − a2 m2 )/(a1 ) < AU (m1 , m2 )/(a1 ) m1 ≤ AU (m1 , m2 )/(a1 ) ≤ (A − a2 m2 )/(a1 ) (4.44) 69 A − a1 n∗1 a2 (4.45) n˜i = [n∗i ] , (i = 1, 2) (4.46) n∗2 = [x] kí hiệu số nguyên lớn x Tính n˜i ta lấy thêm (n˜i − mi ) quan sát (Xij , j = mi + 1, n˜i ) từ Πi ước lượng θ1 − θ2 n˜1 T1 (n˜1 ) − T2 (n˜2 ) = j=1 X1j − n˜1 n˜2 j=1 X2j n˜2 (4.47) ˜ = var {T1 (n˜1 − T2 (n˜2 ))} Bây giờ, người ta viết Cho V (A) Ti (n˜i ) = mi Ti (mi ) (n˜i − mi )Ti (n˜i − mi ) + n˜i n˜i n˜i Ti (n˜i − mi ) = Xij (n˜i − mi ) j=m +1 i Vì n˜i phụ thuộc vào si (mi ) với si cố định, biến ngẫu nhiên T1 (m1 ), T2 (m2 ), T1 (n˜1 − m1 ), T2 (n˜2 − m2 ) độc lập với nhau, phân phối có điều kiện Ti (mi ) Ti (n˜i − mi ) chuẩn (θi , σi2 /mi ) chuẩn (θi , σi2 /(n˜i − mi )) Do đó, với si cố định phân phối có điều kiện T1 (n˜1 ) − T2 (n˜2 ) chuẩn θ1 − θ2 , i (σi2 /n˜i ) Do E [T1 (n˜1 − T2 (n˜2 ))] = θ1 − θ2 vàV (A) = E i σi2 n˜i (4.48) Ghuyre Robbins thu biểu thức rõ ràng cho V (A) xấp xỉ V ∗ (A) [.] số nguyên lớn chứa (.) Họ xếp thành bảng tỉ số V ∗ /V với lựa chọn giá trị tham số, ρ = σ2 /σ1 , ma/A A/a a = a1 = a2 m = m1 = m2 dựa tính tốn đó, họ suy quy trình hai bước cung cấp cải tiến đáng kể quy trình bước với giá trị ρ cách xa 1; Và dường biểu diễn tốt cho ma/A vùng lân cận σ1 /(σ1 + σ2 ) σ1 < σ2 4.4.3 Quy trình cho ước lượng trung bình chung Cho Π1 , Π2 hai tập có trung bình chung θ phương sai σ12 , σ22 Chúng ta muốn ước lượng θ sử dụng số lượng quan sát cố định Nếu tập phương sai 70 khơng có sẵn q mơ hồ để xác định số lượng, đương nhiên ta xét quy trình mà bao gồm lấy mẫu ban đầu cỡ m từ tập, tính tốn ước lượng phương sai, sau lấy n − 2m quan sát cịn lại từ tập có ước lượng phương sai nhỏ Nếu m lớn nhỏ, thuận lợi kế hoạch lấy mẫu hai bước quy trình đơn giản lấy n/2 quan sát, từ tập bị Do việc xác định vài ước lượng tốt lựa chọn tối ưu m hàm n, không phụ thuộc vào phương sai chưa biết quan trọng Chẳng hạn, giả sử có thiết bị để đo số vật lý, mà đo lường đắt đỏ tốn nhiều thời gian để tổng số chúng bị giới hạn, ta muốn ước lượng số đắn Richter (1960) nghiên cứu tốn kết ơng cho Cho Xi1 , Xi2 , Xi,m mẫu ngẫu nhiên từ Πi (i = 1, 2) cho η = σ22 /σ12 Cho m m s21 i=1 X1i ) /m i=1 X1i − ( R= = m (4.49) m −( s2 X2i ) /m X2i i=1 i=1 để 1/R ước lượng thông thường η dựa 2m quan sát Khi thực quan sát X1,m+1 , X1,m+2 , , X1,n−m R < thực quan sát X2,m+1 , X2,m+2 , X2,n−m trường hợp ngược lại Viết X i,Ni = ˆ j=1 Ni Xij /Ni , i = 1, Ta xét ước lượng θ θ có dạng θˆ = A1 X 1,N1 + A2 X 2,N2 (4.50) Trong N1 , N2 , A1 , A2 biến ngẫu nhiên cho N1 = n − m R < 1, N1 = m R ≥ 1, N1 + N2 = n, ≤ Ai ≤ 1, (i = 1, 2) A1 + A2 = với xác suất 1; Bên canh A1 A2 thỏa mãn EH X ik = E X ik , (i = 1, 2) EH X 1k X 2l = EH X 1k EH X 2l 2 EH X ik = E X ik , (i = 1, 2)với l k (4.51) Trong EH [.] = E [.|H] H = (N1 , N2 , A1 , A2 ) Nếu Xij giả sử phân phối chuẩn, đó, trung bình mẫu phương sai mẫu độc lập Do đó, giả định thay cho giả định A1 A2 hàm phương sai mẫu Ước lượng có dạng θˆ dường hợp lí, quan sát có sẵn biến ngẫu nhiên chuẩn Xij , j = 1, 2, ni , i = 1, η biết, 71 a1 X 1,n1 + a2 X 2,n2 ước lượng không chệch phương sai cực tiểu θ, a1 = n1 η/(n1 η + n2 ) a2 = − a1 Tiếp tục, cho V0 = (1/n) min(σ12 , σ22 ), phương sai ước lượng tiêu chuẩn θ trường hợp sgn(σ22 − σ12 ) biết trước đó, định ˆ Phần nghĩa Rn (m; η) = V −1 E θˆ − θ liên kết với ước lượng θ ˆ định lý nghĩa Rn (m; η) = V0−1 var(θ) Định lí 4.4.1 (Richter, 1960) Với ước lượng có dạng θˆ , ˆ =θ (i) E(θ) (ii) Rn (m; η) = n max(1, 1/η)E A21 /N1 + ηA22 /N2 (iii)Rn (m; η) ≥ n max(1, η)E [1/(N2 + N1 η)] ≥ ˆ = A1 EH (X 1,N1 ) + A2 EH (X 2,N2 ) = θ, E(θ) ˆ = θ Chứng minh Vì EH (θ) Tiếp theo EH θˆ − θ = EH A1 X 1,N1 + A2,N2 − θ = A21 σ12 A22 σ22 + N1 N2 Điều chứng minh (ii) Rn (m; η) = V0−1 E EH θˆ − θ Cuối cùng, A21 /N1 +ηA22 /N2 có cực tiểu theo A1 = 1−A2 A1 = N1 η/(N2 + N1 η) để E A21 /N1 + ηA22 /N2 ≥ ηE (N2 + N1 η)−1 điều chứng minh bất đẳng thức bên trái (iii); Vì N2 + N1 η ≤ n max(1, η) Vậy định lý chứng minh Chúng ta kiểm tra kĩ hàm rủi ro thí nghiệm bước thông thường cho ước lượng θ, mà quan sát n/2 X1j n/2 X2j Nếu ta muốn ước lượng không chệch θ , giả sử biến phân phối chuẩn, var(θ ) > 2σ22 /n(1+η), ηX + X /(1+η) ước lượng không chệch phương sai cực tiểu với phương sai 2σ22 /n(1 + η) phương sai biết Khi R(η) = max(1, η) var(θ ) ≥ V0 1+η Vì max(1, η) = 1/ min(1, 2/η), max(1, η) ≥1 1+η 72 dấu "=" xảy η = Do đó, với η = cố định, hàm rủi ro bị chặn cách xa đơn vị không phụ thuộc vào cỡ mẫu Người ta hi vọng hàm rủi ro phương pháp hai bước nhỏ hơn, phải m chọn hợp lý mẫu lớn Với thí nghiệm hai bước, rõ ràng ước lượng rõ lần, biến trái theo sử dụng nhà thống kê m Khi cho ước ˆ nói hàm giá trị thực m(n) cho lượng có dạng θ, ≤ 2m(n) < n với n ≥ lời giải cho toán Đối với ước lượng ˆ m(n) gọi lời giải thích hợp đều(uniformly consistent có dạng θ, solution-UCS) supη Rn [m(n); η] → n → ∞ Ta phải hạn chế lời giải chúng tồn Hơn nữa, supη Rn (m; η) < ∞, lời giải mà làm cực tiểu supη Rn (m; η) gọi lời giải minimax (MMS) Nếu tồn UCS lúc MMS UCS Do nguyên lý minimax cung cấp phương tiện để chọn lời giải từ lớp lời giải UC Một ước lượng đơn giản Sau đây, ta lời giải minimax tiệm cận cho ước lượng không chệch cụ thể Cho nghiên cứu sau, ta giả sử Xij phân phối chuẩn Do ηR = s21 σ22 /s22 σ12 có phân phối F với m − 1, m − bậc tự do, ta viết K(m; η) = P (R ≥ 1) =B m−1 m−1 , 2 −1 ∞ x(m−3)/2 (1 + x)1−m dx η Định nghĩa θˆ1 = A1 X 1,N1 + A2 X 2,N2 , A1 = theo R < hay R ≥ Ước lượng có dạng θˆ theo 4.4.1, θˆ không chệch A21 ηA22 + N1 N2 − K(m; η) K(m; η) = n max(1, 1/η) +η n−m n−m m −1 = max(1, 1/η) − [1 + (η − 1)K(m; η)] n R1n (m, η) = n max(1, 1/η)E (4.52) Dễ dàng R1n (m; η) = R1n (m; 1/η) cách sử dụng K(m; η) = − K(m; 1/η); Như vậy, nghiên cứu supη Rn (m; η), ta giả sử η ≥ 73 Vậy ta có kết sau MMS θ Định lí 4.4.2 (Richter, 1960) Lời giải minimax cho θˆ m(n) = (cn/2)2/3 + O(n1/3 ) minm maxη R1n (m; η) = + 3(c/2)2/3 n−1/3 + O(n−2/3 ) c = 2τ Φ(−τ ) τ nghiệm phương trình Φ(−τ ) − τ φ(τ ) = Một lớp ước lượng Người ta yêu cầu ước lượng tốt tồn (nghĩa độ rủi ro nhỏ hơn) kết định lý 4.4.2 tìm ước lượng Richter (1960) đưa câu trả lời khẳng định cho hai câu hỏi Cho θˆ2 = N1 ηX 1,N1 + N2 X 2,N2 / (N1 η + N2 ) rủi ro R2n (m; η) = n max(1; η).E [1/N1 η + N2 ] R2n (m; η) cận cho rủi ro tất ước lượng có dạng θˆ theo định lý 4.4.1(iii) Tuy nhiên, η chưa biết, người ta thay ηˆ ηˆ → η hội tụ xác suất Việc sử dụng ηˆ dựa vào bậc thuận lợi mặt toán học; Ta đặt ηˆ = 1/R định nghĩa θˆ3 = N1 X 1,N1 + N2 RX 2,N2 / (N1 + N2 R) Một động thúc đẩy khác θˆ3 sau Khi η biết, cho thí nghiệm bước, ước lượng không chệch phương sai cực tiểu (UMVU) n1 ηX 1,N1 + n2 X 2,N2 / (n1 η + n2 ) Tuy nhiên, n1 , n2 η chưa biết lấy ηˆ ước lượng thông thường η dựa min(n1 , n2 ) quan sát, thay n1 , n2 biến ngẫu nhiên N1 , N2 ta thu θˆ3 Ước lượng khác mà xem xét θˆ4 , trung bình lớn tất quan sát: θˆ4 = N1 X 1,N1 + N2 X 2,N2 /n Với θˆ4 tồn nghiệm không UC nghiệm không tầm thường MM Với θˆ2 , Richter thu định lý tương tự định lý 4.4.2 74 4.4.4 Khoảng tin cậy chiều dài cố định dựa SPRT Franzén (2003) đưa quy trình để có khoảng tin cậy cho tham số θ chưa biết dựa SPRT Wald Cho X có mật độ xác suất hàm mật độ f (x; θ) mà có tỉ số hợp lý x Giả sử ta quan sát liên tiếp X1 , X2 , Cho Xn = (x1 , x2 , xn ) ∈ X n θ ∈ Ω ⊆ R Tiêu chuẩn tỉ số tổng quát (GPRT) định nghĩa Lehman (1955) tiêu chuẩn để kiểm định H0 : θ = θ0 |H1 : θ = θ1 (θ0 < θ1 ) với cận thay đổi theo n, kiểm định tiếp tục với điều kiện: Bn < f (x1 , x2 , xn ; θ1 ) < An f (x1 , x2 , xn ; θ0 ) Khi ta có bổ đề sau Bổ đề 4.4.3 Cho X1 , X2 , dãy biến ngẫu nhiên với tỉ số hợp lý Khi hàm lực lượng tiêu chuẩn tỉ số xác suất tổng quát không giảm Rõ ràng SPRT phần tử lớp GPRT Từ bổ đề mà SPRT H0 : θ = θ0 |H1 : θ = θ1 với xác suất phạm sai lầm α β có tỉ lệ sai lầm loại ≤ α với tham số giả thuyết H0 : θ ≤ θ0 tỉ lệ sai lầm loại ≤ β với tham số phụ thuộc vào H1 : θ ≥ θ1 SPRT H0 : θ = θ0 |H1 : θ = θ1 sử dụng tiêu chuẩn H0 : θ ≤ θ0 |H1 : θ ≥ θ1 Tiếp theo, với θ0 cố định, xác định hai loại giả thiết, Hθ+0 : θ ≥ θ0 Hθ−0 : θ ≤ θ0 Cho H+ = Hθ+ : θ ∈ Ω H− = {Hθ : θ ∈ Ω} Với ∆ > cố định, bước ta kiểm tra với cấp α/2 mà phần tử Hθ+0 ∈ H+ bị + bác bỏ hay chấp nhận, đối thiết phần tử tương ứng Hθ+∆ ∈ H− Và + phần tử Hθ−0 ∈ H− bị bác bỏ chấp nhận, đối thiết Hθ+∆ ∈ H− Bất định đạt liên quan tới cặp giả thiết H− H+ giả thiết không xem xét thêm Sử dụng giả thiết hợp cho phép ta định giả thiết Hθ− |Hθ+ thực tính chất tỉ số hợp lý − R+ (xn , ∆) = θ : Hθ+ bị bác bỏ trước thời điểm m|Hθ−∆ 75 + R− (xn , ∆) = θ : Hθ− bị bác bỏ trước thời điểm m|Hθ+∆ tập tham số tương ứng với giả thiết bị bác bỏ quan sát x1 , x2 , xn Cho U (xn , ∆) = inf {θ : θ ∈ R+ (xn , ∆)} + = tham số θ nhỏ mà Hθ− bị bác bỏ|Hθ+∆ L(xn , ∆) = sup {θ : θ ∈ R+ (xn , ∆)} + = tham số θ lớn mà Hθ− bị bác bỏ|Hθ+∆ xn quan sát Bây ta định nghĩa khoảng tin cậy SPRT(∆) Chúng ta xây dựng dãy khoảng tin cậy tạm thời Giả sử, với thời điểm (sẽ xác định sau) mà Ω\ {R+ (xn , ∆) ∪ R− (xn , ∆)} khoảng Bước thứ Quan sát x1 xây dựng R+ (x1 , ∆) R− (x1 , ∆) Dựa vào ta tính U (x1 , ∆) L(x1 , ∆) Nếu U (x1 , ∆) − U (x1 , ∆) ≤ ∆ dừng lại nói khơng có khoảng tin cậy tìm thấy Nếu U (x1 , ∆) − U (x1 , ∆) > ∆, [U (x1 , ∆), L(x1 , ∆)] có khoảng tin cậy tạm thời − α thực thêm quan sát Bước thứ k Tại bước thứ k, quan sát đươc xk−1 = (x1 , x2 , xk−1 ) giả thiết tương ứng với tham số R+ (xk−1 , ∆), R− (xk−1 , ∆) khoảng tin cậy tạm thời [L(xk−1 , ∆), U (xk−1 , ∆)] bị bác bỏ Quan sát xk cho phép ta bác bỏ giả thiết tương ứng với tham số R+ (xk , ∆), R− (xk , ∆) Nếu U (xk , ∆) − L(xk , ∆) ≤ ∆ khơng có cặp giả thiết trái để kiểm tra, ta [L(xk−1 , ∆), U (xk−1 , ∆)] khoảng tin cậy nhỏ có dựa quan sát xk sử dụng ∆ tham số khoảng Tuy nhiên, U (xk−1 , ∆)−L(xk−1 , ∆) > ∆ kết luận [L(xk−1 , ∆), U (xk−1 , ∆)] khoảng tin cậy tạm thời − α thực thêm quan sát Khi khoảng tin cậy SPRT (∆) kí hiệu S(xn , ∆) = [L(xn , ∆), U (xn , ∆)] 76 Dãy {S(xi , ∆), i = 1, 2, } dãy khoảng tin cậy tạm thời Tính chất vốn có xây dựng R+ (xn , ∆) ⊆ R+ (xn+1 , ∆) R− (xn , ∆) ⊆ R− (xn+1 , ∆) S(xn+1 , ∆) ⊆ S(xn+1 , ∆) Tiếp theo, ta cần đảm bảo tập Ω\ {R+ (xn , ∆) ∪ R− (xn , ∆)} tham số tương ứng với giả thiết không bị bác bỏ quan sát xn thực khoảng xác suất phủ khoảng − α Định lí 4.4.4 Cho f (x; θ) có tỉ số hợp lý đều, (d2 /dθ2 ) × ln f (x; θ) < hai tỉ lệ sai số α/2 Khi tập Ω\ {R+ (xn , ∆)} ∪ R− (xn , ∆) khoảng S(xn , ∆) với xác suất phủ − α Nghĩa Pθ {θ ∈ S(xn , ∆)} ≥ − α Chứng minh Đầu tiên, ta θ ∈ R− (xn , ∆) θ ∈ R− (xn , ∆) với θ < θ Nếu θ ∈ R− (xn , ∆), với cỡ mẫu m ≤ n: Hθ− bị bác bỏ| Hθ++∆ Có nghĩa là: a < ln {λ(xn , θ + ∆, θ )} = ln f (xm , θ + ∆) − ln f (xm , θ ) = ln f (xm , θ + ∆) − ln f (xm , θ ) (d2 /dθ2 ) ln f (x; θ) < tức đạo hàm lần ln f (x; θ) giảm Do phải bác bỏ giả thiết Hθ− |Hθ+ +∆ trước cỡ mẫu m Vì tỉ lệ sai số nhau, nên chấp nhận giả thiết không SPRT tương đương với việc bác bỏ giả thiết thay Vậy, khơng có giả thiết tương ứng chấp nhận để tham số nhỏ L(xn , ∆) lớn U (xn , ∆), điều kiện U (xn , ∆) − L(xn , ∆) < ∆ không chấp nhận việc xây dựng dãy khoảng tin cậy Để hoàn thành chứng minh ta cần chứng minh Ω\ {R+ (xn , ∆) ∪ R− (xn , ∆)} khoảng 77 Xác suất phủ khoảng tin cậy phân tích sau Pθ {θ ∈ S(xn , ∆)} = − Pθ {θ ∈ / S(xn , ∆)} = − [Pθ {θ < L(xn , ∆)} + Pθ {θ > u(xn , ∆)}] Giả sử θ < L(xn , ∆) xảy Nghĩa bác bỏ giả thiết Hθ− , θ ≤ L(xn , ∆)|Hθ−+∆ với cỡ mẫu ≤ n + Đặc biệt, bước thứ k, bác bỏ nhầm Hθ− |Hθ+∆ với xác suất tối đa α/2 phép thử có cấp α/2 Như Pθ {θ ≤ L(xn , ∆)} = Pθ bác bỏ Hθ , θ < θ ∩ bác bỏ H0 + ≤ Pθ bác bỏ Hθ− |Hθ+∆ ≤ α/2 Chúng ta lập luận tương tự cho khẳng định Pθ {θ ≥ U (xn , ∆)} α/2 Điều chiều S(xn , ∆) phụ thuộc ∆ Ứng dụng Xét họ mũ cho f (x; θ) = c(θ)exp {θT (x)} θ tham số tự nhiên Dễ dàng ∂2 ∂2 ln f (x , θ) = n ln c(θ) = −nvar [T (x)] < n ∂θ2 ∂θ2 = c(θ) exp {θT (θ)} dµ(x) 78 (4.53) −c (θ) = c2 (θ) = T (x) exp {θT (θ)} dµ(x) R [T (X)] c(θ) tức E [T (X)] = − c (θ) ∂ = − ln c(θ) c(θ) ∂θ Chú ý phân phối Bernoulli, Poison, Normal thuộc họ mũ Và f (x; θ) = π [1 + (x − θ)2 ] − (x − θ)2 ∂2 ln f (x; θ) = − ∂θ2 [1 + (x − θ)2 ] (4.54) không âm |x − θ|, định lý 4.4.4 khơng cịn trường hợp mật độ Cauchy với tham số dịch chuyển Ví dụ 4.4.5 Cho X có hàm mật độ Bernouli cho f (x; θ) = θx (1 − θ)1−x , x = 0, Giả sử ta có n quan sát x1 , x2 , xn X Giả sử xác suất phạm sai lầm α/2 Để xác định giới hạn khoảng tin cậy ta tìm giá trị lớn θ0 cho bác bỏ giả thiết H0 : θ ≤ θ0 |H1 : θ ≥ θ0 + ∆ Nếu (B, A) cận Wald, đặt a = ln A, b = ln B SPRT bác bỏ H0 ln f (x, θ1 ) − ln f (x, θ0 ) > a (4.55) tức s(n) ln θ0 + ∆ θ0 + [n − s(n)] ln − θ0 − ∆ − θ0 >a (4.56) s(n) = x1 + x2 + xn Sử dụng xấp xỉ Wald cho giá trị biên xác suất phạm sai lầm , ta có a = ln [(2 − α)/α] b = ln [α/(2 − α)], để tìm giá trị lớn θ0 thỏa mãn 4.56 ta giải s(n) ln θ0 + ∆ θ0 + [n − s(n)] ln − θ0 − ∆ − θ0 79 = ln 2−α α (4.57) Sử dụng lí luận tương tự , giá trị nhỏ θ0 cho H0 bị bác bỏ|H1 : θ ≥ θ0 − ∆ tìm cách giải s(n) ln θ0 − ∆ θ0 + [n − s(n)] ln − θ0 − ∆ − θ0 = ln 2−α α (4.58) Chú ý việc thấy bất đẳng thức hoàn toàn với đẳng thức 4.57 4.58 hệ nhỏ khơng gian tham số liên tục Phương trình 4.57 4.58 phi tuyến, θ cần giải số lượng với n, s(n), ∆, α cho trước Lưu ý trước quan sát thỏa mãn (là đơn vị x)thì phương trình 4.57 khơng có nghiệm, giới hạn tin cậy đặt Tương tự, phương trình 4.58 khơng có nghiệm quan sát khơng thỏa mãn cuối (là 0), giới hạn tin cậy đặt đơn vị Các ứng cử cho giới hạn tin cậy ta thu bước thứ n so sánh với giới hạn tin cậy ta cho bước phía trước, lớn hai giá trị này, sử dụng giới hạn khoảng tin cậy Giới hạn tin cậy điều chỉnh theo cách tương tự Quá trình tiếp tục độ dài khoảng tin cậy tạm thời nhỏ D Trường hợp đặc biệt Cho ∆ = 0, 25 D = 0, 5, giả sử ta muốn xây dựng khoảng tin cậy độ dài cố định SPRT 90% cho θ nhị thức Với 17 quan sát 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, Đặt α = 0.1, ta thu kết sau 80 n Nghiệm CL nghiệm CL 0 0.005644 0.0426368 0.035993 0.035355 0 0.0050 0.0426 0.0426 0.0426 0.9861 0.9256 0.8502 0.8740880 0.892344 0.8328545 0.7740144 0.9861 0.9256 0.8502 0.8502 0.8502 0.8328 0.7740 10 11 12 13 14 15 0.026006 0.022218 0.055929 0.0497702 0.0846981 0.076936 0.0700812 0.0639904 0.0426 0,0426 0.0559 0.0559 0.0847 0.0847 0.0847 0.0847 0.6636085 0.6636085 0.702070 0.657106 0.690889 0.6524315 0.616872 0.584188 0.6636 0.6636 0.6636 0.6571 0.6571 0.6524 0.6169 0.5842 16 17 0.058550 0.05366896 0.0847 0.0847 0.55429599 0.5270667 0.5542 - 81 ← dừng lại KẾT LUẬN Luận văn trình bày số vấn đề sau: - Nêu nét đặc trưng phân tích liên tiếp, phân phối cỡ mẫu kiểm tra sản phẩm Và chứng minh xác suất chấp nhận mẫu sử dụng quy trình mẫu cố định với xác suất chấp nhận mẫu sử dụng quy trình mẫu liên tiếp - Trình bày cách sử dụng SPRT kiểm định giả thiết đơn, cách xác định miền tiếp tục lấy mẫu Đưa ví dụ cho thấy sử dụng SPRT kết thúc trình lấy mẫu sớm so với sử dụng quy trình mẫu cố định - Trình bày cách sử dụng SPRT kiểm định giả thiết hợp Chỉ tính chất kết thúc chắn hữu hạn tiêu chuẩn liên tiếp t, t2 định lý liên quan - Trình bày khái niệm bản, định nghĩa dãy đủ, thống kê đủ trường hợp liên tiếp Trình bày quy trình Stein cho ước lượng trung bình phân phối chuẩn với phương sai chưa biết, quy trình ước lượng hiệu hai trung bình, quy trình cho ước lượng trung bình chung Đưa cách xác định khoảng tin cậy chiều dài cố định dựa SPRT ứng dụng Mặc dù cố gắng hết mình, khả thời gian có hạn, luận văn khơng thể tránh khỏi thiếu sót phương diện kiến thức lỗi tả soạn thảo LaTex Tác giả luận văn mong nhận đóng góp ý kiến q thầy bạn đồng nghiệp để luận văn ngày hoàn chỉnh Tác giả xin chân thành cảm ơn! 82 Tài liệu tham khảo [1] Nguyễn Văn Hữu, Đào Hữu Hồ, Hồng Hữu Như (2004), Thống kê tốn học, NXB ĐHQGHN [2] Nguyễn Viết Phú, Nguyễn Duy Tiến (2004), Cơ sở lý thuyết xác suất, NXB ĐHQGHN [3] Đào Hữu Hồ, Xác suất Thống kê (2007), NXB ĐHQGHN [4] Đặng Hùng Thắng ( 2000), Thống kê ứng dụng, NXB Giáo dục [5] Wald, Abraham (1947),Sequential Analysis, John Wiley and Sons [6] Aivazyan, S.A (1959) A comparison of the optimal properties of the Neyman - Pearson and the Wald sequential probability ratio test Theor Probability Appl 86 - 93 [105] [7] Anscome, F.J (1953), Sequential estimaion, J.Roi.Statist.Soc.Ser B 15 129.[200] [8] Wilks S.S (1967), Mathematical statistics (bản dịch tiếng nga), Moskow [9] Zakula Govindarajulu, Sequential Statistics handp 83 ... pháp phân tích liên tiếp thống kê, đặc điểm phân tích liên tiếp, ứng dụng kiểm tra sản phẩm Chương 2: Phân tích liên tiếp: kiểm định giả thiết đơn Nội dung chương sử dụng phân tích liên tiếp. .. MỞ ĐẦU 1.1 Giới thiệu phân tích liên tiếp 1.2 Thí dụ: Kiểm tra sản phẩm 1.2.1 Phân phối cỡ mẫu PHÂN TÍCH LIÊN TIẾP: KIỂM ĐỊNH GIẢ THIẾT... đảo tích phân 40 3.2.2 Tiệm cận chuẩn thống kê T 41 3.2.3 Tiêu chuẩn liên tiếp t 45 3.2.4 Tiêu chuẩn liên tiếp t2 (tiêu chuẩn hai phía) ƯỚC LƯỢNG LIÊN TIẾP

Định dạng
Số trang	84
Dung lượng	477,77 KB