4 ƯỚC LƯỢNG LIÊN TIẾP
4.4 Quy trình hai bước
4.4.4. Khoảng tin cậy chiều dài cố định dựa trên SPRT
SPRT
Franzén (2003) đã đưa ra một quy trình để có được khoảng tin cậy cho một tham số θ chưa biết dựa trên SPRT của Wald. Cho X có mật độ xác suất hay là hàm mật độ f(x;θ) mà có tỉ số hợp lý đều trong x. Giả sử ta quan sát liên tiếp X1, X2, ... . Cho Xn = (x1, x2, ..xn)∈ Xn và θ ∈Ω⊆ R.
Tiêu chuẩn tỉ số tổng quát (GPRT) được định nghĩa bởi Lehman (1955) là một tiêu chuẩn để kiểm định H0 : θ =θ0|H1 :θ =θ1(θ0 < θ1) với các cận có thể thay đổi theo n, kiểm định này tiếp tục với điều kiện:
Bn < f(x1, x2, ...xn;θ1) f(x1, x2, ...xn;θ0) < An Khi đó ta có bổ đề sau
Bổ đề 4.4.3. Cho X1, X2, ... là một dãy các biến ngẫu nhiên với tỉ số hợp lý đều. Khi đó hàm lực lượng của tiêu chuẩn tỉ số xác suất tổng quát là không giảm.
Rõ ràng SPRT là một phần tử của lớp các GPRT. Từ bổ đề trên mà SPRT của H0 : θ = θ0|H1 : θ = θ1 với các xác suất phạm sai lầm α và β sẽ có tỉ lệ sai lầm loại 1 ≤ α với tham số bất kì trong giả thuyết H0 : θ ≤ θ0 và tỉ lệ sai lầm loại 2 ≤ β với tham số bất kì phụ thuộc vào H1 : θ ≥ θ1 và do đó SPRT của H0 : θ = θ0|H1 : θ = θ1 có thể sử dụng như một tiêu chuẩn của
H0 :θ ≤ θ0|H1 :θ ≥ θ1.
Tiếp theo, với θ0 cố định, xác định hai loại giả thiết, Hθ0+ : θ ≥ θ0 và
Hθ0− : θ ≤ θ0. Cho H+ = Hθ+ : θ∈ Ω và H− = {Hθ : θ∈ Ω}. Với ∆ > 0 cố định, tại mỗi bước ta kiểm tra với cấpα/2mà những phần tửHθ0+ ∈ H+có thể bị bác bỏ hay được chấp nhận, đối thiết là các phần tử tương ứng Hθ+∆+ ∈ H−. Và các phần tử Hθ0− ∈ H− có thể bị bác bỏ hoặc chấp nhận, đối thiết Hθ+∆+ ∈ H−. Bất cứ khi nào một quyết định đã đạt được liên quan tới một cặp giả thiết trong
H− và H+ thì những giả thiết này sẽ khơng được xem xét thêm nữa. Sử dụng các giả thiết hợp cho phép ta ra một quyết định đối với một giả thiết Hθ−|Hθ+
chỉ có thể thực hiện được bằng tính chất tỉ số hợp lý đều.
và
R−(xn,∆) = θ: Hθ−bị bác bỏ tại hoặc trước thời điểm m|Hθ+∆+
là tập các tham số tương ứng với các giả thiết đã bị bác bỏ khi quan sát
x1, x2, ..xn. Cho U(xn,∆) = inf{θ : θ ∈R+(xn,∆)} =tham sốθnhỏ nhất màHθ−bị bác bỏ|Hθ+∆+ và L(xn,∆) = sup{θ: θ ∈R+(xn,∆)} =tham sốθlớn nhất màHθ−bị bác bỏ|Hθ+∆+ khi xn quan sát được.
Bây giờ ta định nghĩa khoảng tin cậy SPRT(∆). Chúng ta xây dựng một dãy các khoảng tin cậy tạm thời. Giả sử, với mỗi thời điểm (sẽ được xác định sau) mà Ω\ {R+(xn,∆)∪R−(xn,∆)} là một khoảng.
Bước thứ nhất
Quan sát x1 và xây dựng R+(x1,∆) và R−(x1,∆). Dựa vào đây ta có thể tính
U(x1,∆) và L(x1,∆). Nếu U(x1,∆) −U(x1,∆) ≤ ∆ thì dừng lại và nói rằng khơng có khoảng tin cậy nào được tìm thấy. Nếu U(x1,∆)−U(x1,∆) >∆, thì [U(x1,∆), L(x1,∆)] có khoảng tin cậy tạm thời 1− α và thực hiện thêm một quan sát.
Bước thứ k
Tại bước thứ k, đã quan sát đươc xk−1 = (x1, x2, ...xk−1) và các giả thiết tương ứng với các tham số trong R+(xk−1,∆), R−(xk−1,∆) và khoảng tin cậy tạm thời hiện tại [L(xk−1,∆), U(xk−1,∆)] bị bác bỏ. Quan sát xk cho phép ta bác bỏ các giả thiết tương ứng với các tham số trong R+(xk,∆), R−(xk,∆). Nếu
U(xk,∆)−L(xk,∆) ≤ ∆ thì khơng có cặp giả thiết trái để kiểm tra, do đó ta [L(xk−1,∆), U(xk−1,∆)] là khoảng tin cậy nhỏ nhất có được dựa trên các quan sátxk sử dụng∆như tham số khoảng. Tuy nhiên, nếuU(xk−1,∆)−L(xk−1,∆) >
∆ thì kết luận [L(xk−1,∆), U(xk−1,∆)] như một khoảng tin cậy tạm thời 1−α
và thực hiện thêm một quan sát nữa.
Khi đó khoảng tin cậy SPRT (∆) được kí hiệu bởi
Dãy{S(xi,∆), i= 1,2, ...}sẽ là một dãy các khoảng tin cậy tạm thời. Tính chất vốn có trong sự xây dựng này là
R+(xn,∆) ⊆R+(xn+1,∆) và
R−(xn,∆) ⊆R−(xn+1,∆) và do đó
S(xn+1,∆) ⊆ S(xn+1,∆)
Tiếp theo, ta cần đảm bảo rằng tập Ω\ {R+(xn,∆)∪R−(xn,∆)} của các tham số tương ứng với các giả thiết không bị bác bỏ trong khi quan sát xn thực sự là một khoảng và xác suất phủ của khoảng này ít nhất là 1−α.
Định lí 4.4.4. Cho f(x;θ) có tỉ số hợp lý đều, (d2/dθ2)×lnf(x;θ) < 0 và cả hai tỉ lệ sai số là α/2. Khi đó tập Ω\ {R+(xn,∆)} ∪R−(xn,∆) là một khoảng bằng S(xn,∆) với xác suất phủ ít nhất là 1−α. Nghĩa là
Pθ{θ ∈ S(xn,∆)} ≥ 1−α
Chứng minh. Đầu tiên, ta sẽ chỉ ra rằng nếu θ0 ∈R−(xn,∆) thì θ00∈ R−(xn,∆) với mọi θ00 < θ0. Nếu θ0 ∈R−(xn,∆), khi đó với mỗi cỡ mẫu m ≤n: Hθ−0 bị bác bỏ| Hθ+0+∆. Có nghĩa là:
a <ln{λ(xn, θ0+ ∆, θ0)}
= lnf(xm, θ0+ ∆)−lnf(xm, θ0) = lnf(xm, θ00+ ∆)−lnf(xm, θ00)
vì (d2/dθ2) lnf(x;θ)< 0tức là đạo hàm lần 1 củalnf(x;θ) là giảm. Do đó phải bác bỏ giả thiết Hθ−00|Hθ+00+∆ tại hoặc trước cỡ mẫu m. Vì tỉ lệ sai số là bằng
nhau, nên sự chấp nhậngiả thiết không trong SPRT là tương đương với việc bác bỏ giả thiết thay thế.
Vậy, khơng có giả thiết tương ứng nào được chấp nhận để một tham số nhỏ hơn L(xn,∆) hoặc lớn hơn U(xn,∆), do đó điều kiện U(xn,∆)−L(xn,∆) <∆ là không được chấp nhận trong việc xây dựng dãy các khoảng tin cậy.
Để hoàn thành chứng minh này ta cần chứng minhΩ\ {R+(xn,∆)∪R−(xn,∆)} là một khoảng.
Xác suất phủ của khoảng tin cậy có thể được phân tích như sau
Pθ{θ ∈ S(xn,∆)}= 1−Pθ{θ /∈ S(xn,∆)}
= 1−[Pθ{θ < L(xn,∆)}+Pθ{θ > u(xn,∆)}]
Giả sửθ < L(xn,∆)xảy ra. Nghĩa là bác bỏ mọi giả thiếtHθ−0, θ0≤ L(xn,∆)|Hθ−0+∆
với cỡ mẫu ≤ n
Đặc biệt, tại bước thứ k, bác bỏ nhầm Hθ−|Hθ+∆+ với xác suất tối đa là α/2
vì mỗi phép thử có cấp α/2. Như vậy
Pθ{θ ≤ L(xn,∆)}=Pθ bác bỏ mọiHθ00, θ00 < θ ∩
bác bỏH0
≤Pθ bác bỏHθ−|Hθ+∆+
≤α/2
Chúng ta có thể lập luận tương tự cho khẳng định
Pθ{θ ≥U(xn,∆)}α/2
Điều đó chỉ ra rằng chiều của S(xn,∆) phụ thuộc ∆
Ứng dụng
Xét họ mũ cho bởi
f(x;θ) =c(θ)exp{θT(x)} (4.53) trong đó θ là một tham số tự nhiên.
Dễ dàng chỉ ra rằng ∂2 ∂θ2 lnf(xn, θ) =n ∂ 2 ∂θ2 lnc(θ) =−nvar[T(x)]<0 vì 1 c(θ) = Z exp{θT(θ)}dµ(x)
−c0(θ) c2(θ) = Z T(x) exp{θT(θ)}dµ(x) = 1 c(θ)R[T(X)] tức là E[T(X)] =−c 0(θ) c(θ) =− ∂ ∂θ2 lnc(θ)
Chú ý rằng các phân phối Bernoulli, Poison, Normal thuộc họ mũ. Và nếu
f(x;θ) = 1 π[1 + (x−θ)2] thì ∂2 ∂θ2lnf(x;θ) =−2 1−(x−θ)2 [1 + (x−θ)2]2 (4.54) là không âm khi |x−θ|, và như vậy định lý 4.4.4 khơng cịn đúng trong trường
hợp của mật độ Cauchy với tham số dịch chuyển. Ví dụ 4.4.5. Cho X có hàm mật độ Bernouli cho bởi
f(x;θ) =θx(1−θ)1−x, x = 0,1
Giả sử ta có n quan sát x1, x2, ...xn trên X. Giả sử xác suất phạm sai lầm bằng
α/2. Để xác định giới hạn dưới của khoảng tin cậy ta tìm giá trị lớn nhất của θ0 sao cho có thể bác bỏ giả thiết H0 : θ ≤ θ0|H1 : θ ≥ θ0 + ∆. Nếu (B, A) là các cận của Wald, đặt a= lnA, b= lnB. SPRT bác bỏ H0 khi
lnf(x, θ1)−lnf(x, θ0) > a (4.55) tức là khi s(n) ln θ0+ ∆ θ0 + [n−s(n)] ln 1−θ0−∆ 1−θ0 > a (4.56) trong đó s(n) = x1 +x2 +...xn. Sử dụng xấp xỉ của Wald cho các giá trị biên của các xác suất phạm sai lầm , ta có a = ln [(2. −α)/α] và b = ln [α/(2−α)],
và do đó để tìm giá trị lớn nhất của θ0 thỏa mãn 4.56 ta giải
s(n) ln θ0+ ∆ θ0 + [n−s(n)] ln 1−θ0−∆ 1−θ0 = ln 2−α α (4.57)
Sử dụng lí luận tương tự , giá trị nhỏ nhất của θ0 sao cho H0 bị bác bỏ|H1 : θ ≥ θ0−∆ được tìm bằng cách giải s(n) ln θ0−∆ θ0 + [n−s(n)] ln 1−θ0−∆ 1−θ0 = ln 2−α α (4.58)
Chú ý rằng việc thấy thế bất đẳng thức hoàn toàn với một đẳng thức trong 4.57 và 4.58 sẽ là một hệ quả nhỏ vì khơng gian tham số là liên tục. Phương trình 4.57 và 4.58 là phi tuyến, θ cần được giải về số lượng vớin, s(n),∆, αcho trước. Lưu ý trước khi quan sát được sự thỏa mãn đầu tiên (là đơn vị của x)thì phương trình 4.57 khơng có nghiệm, và giới hạn tin cậy dưới được đặt bằng 0.
Tương tự, phương trình 4.58 khơng có nghiệm cho đến khi quan sát được sự khơng thỏa mãn cuối cùng (là 0), và do đó giới hạn tin cậy trên được đặt bằng đơn vị. Các ứng cử cho giới hạn tin cậy dưới ta thu được ở bước thứ n được so sánh với giới hạn tin cậy ta đã cho ở bước phía trước, và lớn hơn hai giá trị này, được sử dụng như giới hạn dưới của khoảng tin cậy hiện tại. Giới hạn tin cậy dưới được điều chỉnh theo cách tương tự. Quá trình tiếp tục cho đến khi độ dài của khoảng tin cậy tạm thời là nhỏ hơn D.
Trường hợp đặc biệt
Cho ∆ = 0,25 và D = 0,5, giả sử ta muốn xây dựng một khoảng tin cậy độ dài cố định SPRT 90% cho θ nhị thức. Với 17 quan sát đầu tiên là
0,0,0,1,1,0,0,0,0,1,0,1,0,0,0,0,0 Đặt α= 0.1, ta thu được kết quả sau
n Nghiệm dưới CL dưới nghiệm trên CL trên 1 0 0 0.9861 0.9861 2 0 0 0.9256 0.9256 3 0 0 0.8502 0.8502 4 0.005644 0.0050 0.8740880 0.8502 5 0.0426368 0.0426 0.892344 0.8502 6 0.035993 0.0426 0.8328545 0.8328 7 0.035355 0.0426 0.7740144 0.7740 8 0.026006 0.0426 0.6636085 0.6636 9 0.022218 0,0426 0.6636085 0.6636 10 0.055929 0.0559 0.702070 0.6636 11 0.0497702 0.0559 0.657106 0.6571 12 0.0846981 0.0847 0.690889 0.6571 13 0.076936 0.0847 0.6524315 0.6524 14 0.0700812 0.0847 0.616872 0.6169 15 0.0639904 0.0847 0.584188 0.5842 ←dừng lại 16 0.058550 0.0847 0.55429599 0.5542 17 0.05366896 0.0847 0.5270667 -
KẾT LUẬN
Luận văn đã trình bày một số vấn đề sau:
- Nêu được nét đặc trưng cơ bản của phân tích liên tiếp, phân phối cỡ mẫu trong kiểm tra sản phẩm. Và chứng minh được xác suất chấp nhận mẫu sử dụng quy trình mẫu cố định là bằng với xác suất chấp nhận mẫu sử dụng quy trình mẫu liên tiếp.
- Trình bày cách sử dụng SPRT trong kiểm định giả thiết đơn, cách xác định miền tiếp tục lấy mẫu. Đưa ra được ví dụ cho thấy sử dụng SPRT có thể kết thúc q trình lấy mẫu sớm hơn so với sử dụng quy trình mẫu cố định.
- Trình bày cách sử dụng SPRT trong kiểm định giả thiết hợp. Chỉ ra được tính chất kết thúc chắc chắn hữu hạn của tiêu chuẩn liên tiếp t, t2 và các định lý liên quan.
- Trình bày được các khái niệm cơ bản, và các định nghĩa về dãy đủ, thống kê đủ trong trường hợp liên tiếp. Trình bày quy trình Stein cho ước lượng trung bình của một phân phối chuẩn với phương sai chưa biết, quy trình ước lượng hiệu của hai trung bình, và quy trình cho ước lượng trung bình chung. Đưa ra cách xác định khoảng tin cậy chiều dài cố định dựa trên SPRT và ứng dụng của nó.
Mặc dù đã cố gắng hết mình, nhưng do khả năng và thời gian có hạn, vì vậy luận văn khơng thể tránh khỏi những thiếu sót cả về phương diện kiến thức và lỗi chính tả trong soạn thảo LaTex. Tác giả luận văn mong nhận được sự đóng góp ý kiến của quý thầy cô và các bạn đồng nghiệp để luận văn ngày càng được hoàn chỉnh hơn. Tác giả xin chân thành cảm ơn!
Tài liệu tham khảo
[1] Nguyễn Văn Hữu, Đào Hữu Hồ, Hồng Hữu Như (2004), Thống kê tốn học, NXB ĐHQGHN.
[2] Nguyễn Viết Phú, Nguyễn Duy Tiến (2004), Cơ sở lý thuyết xác suất, NXB
ĐHQGHN.
[3] Đào Hữu Hồ, Xác suất Thống kê (2007), NXB ĐHQGHN .
[4] Đặng Hùng Thắng ( 2000), Thống kê và ứng dụng, NXB Giáo dục.
[5] Wald, Abraham (1947),Sequential Analysis, John Wiley and Sons.
[6] Aivazyan, S.A (1959). A comparison of the optimal properties of the Ney- man - Pearson and the Wald sequential probability ratio test. Theor. Prob-
ability Appl. 4 86 - 93. [105]
[7] Anscome, F.J (1953), Sequential estimaion, J.Roi.Statist.Soc.Ser B. 15 1-
29.[200]
[8] Wilks S.S (1967), Mathematical statistics (bản dịch tiếng nga), Moskow. [9] Zakula Govindarajulu, Sequential Statistics.