Không gian con đủ

Một phần của tài liệu Đặc trưng họ phân phối có chứa thống kê đủ Luận văn ThS. Đặc trưng họ phân phối có chứa thống kê đủ (Trang 40 - 49)

2 Đặc trưng họ phân phối có chứa thống kê đủ

2.4.1 Không gian con đủ

Giả sử (X1, . . . , Xn) là một mẫu ngẫu nhiên được rút ra từ biến ngẫu nhiên có hàm phân phối F(x, θ), trong đó x ∈ R1, θ ∈ Θ, và:

Giả sử đối với số nguyên k ≥ 1 và với mọi θ

Z

x2kdF(x, θ) < ∞. (2.4.1) Khi đó, tập các đa thức Q(X1, . . . , Xn) có bậc ≤ k sẽ lập thành một không gian Hilbert L(2)k với tích vô hướng

(Q1, Q2)θ = Eθ(Q1Q2).

Giả sử L là không gian con của L(2)k . Dựa trên sự tương tự đối với khái niệm thống kê đủ, chúng ta đưa ra định nghĩa sau đây:

Định nghĩa 2.4.1. L được gọi là một không gian con L(2)k _ đủ đối với họ {Pθ} nếu với mọi Q ∈ L(2)k thì tồn tại một q ∈ L, không phụ thuộc vào θ, sao cho:

ˆ

Eθ(Q/L) =q, (2.4.2)

trong đó, Eˆθ(./L) là phép chiếu lên L (hay là kì vọng toán có điều kiện theo nghĩa rộng), khi tích vô hướng (., .)θ trên L(2)k tương ứng với độ đo

Pθ.

Nếu L là không gian con đủ, 1 ∈ L và một phần từ Q ∈ L(2)k được coi như là một ước lượng không chệch của hàm tham số γ(θ) = EθQ, khi đó áp dụng định lý Rao - Blackwell đối với thống kê q = ˆE(Q/L), chúng ta có:

γ(θ) =Eθq và V arθ(q) ≤ V arθ(Q) với mọi θ.

Hơn thế nữa, với θ cố định, đẳng thức xảy ra nếu và chỉ nếu, đối với θ đó thì Q ∈ L. Như vậy, sự có mặt của không gian con đủ L mà thỏa mãn điều kiện 1 ∈ L, mọi đa thức Q ∈ L(2)k −L là không thể nhận vào lớp các ước lượng không chệch của hàm tham số γ(θ) = EθQ, với hàm tổn thất bậc hai.

Chúng ta sẽ xây dựng một lý thuyết tạm thời của tính đủ, tức là mô tả tất cả các F(x, θ) mà có tồn tại một không gian con đủ không tầm

thường (khác L(2)k ); sao cho một họ như thế phải là một sự mở rộng hợp lý của họ mũ (2.1.5). Dễ thấy, điều kiện để tồn tại một không gian con đủ không tầm thường có thể được biểu diễn chỉ trong ngôn ngữ của các momen: µ1(θ) = Z xdF(x, θ), . . . , µ2k(θ) = Z x2kdF(x, θ).

Ở đây chúng ta chỉ dừng lại ở những trường hợp đơn giản, khi θ là một tham số tịnh tiến hoặc tỷ lệ và L là một không gian con của các đa thức của X.

2.4.2 Đặc trưng phân phối với không gian con đủ

Định lý 2.4.2. Giả sử (X1, . . . , Xn) là một mẫu ngẫu nhiên được rút ra từ một biến ngẫu nhiên có hàm phân phối F(x−θ), θ ∈ R1,

dPθ = dF(x1 −θ). . . dF(xn−θ) và L = {a0Xk +· · ·+ak}.

Nếu 2k momen đầu tiên của F trùng với các momen tương ứng của luật chuẩn nào đó, khi đó L là một không gian con L(2)k - đủ đối với họ

{Pθ}. Nếu F thỏa mãn điều kiện R x2kdF(x) < ∞, L là một không gian con L(2)k - đủ và n ≥ 3, khi đó 2k momen đầu tiên của F trùng với các momen tương ứng của luật chuẩn nào đó.

Chứng minh. Giả sử F là hàm phân phối chuẩn. Mọi đa thức Q ∈ L(2)k có thể được biểu thị như sau:

Q = XkQ0(X1 −X, . . . , Xn −X) +Xk−1Q1(X1 −X, . . . , Xn−X) +· · ·+Qk(X1 −X, . . . , Xn−X)

trong đó Qi là các đa thức. Nhưng, nếu Xi là chuẩn, thì X và vectơ

(X1 −X, . . . , Xn −X) là độc lập. Do đó:

trong đó:

aj = Eθ(Qj|X) = Eθ(Qj) = E0(Qj). (2.4.4) DoEθ(Q|X) ∈ L, Eˆθ(Q|X) =Eθ(Q|X) và do (2.4.3), L là một không gian conL(2)k - đủ, nếu F là hàm phân phối chuẩn. Nhưng hai hàm phân phối mà 2k momen đầu tiên trùng nhau sẽ cảm sinh ra cùng một tích vô hướng trong L(2)k . Do đó, nếu 2k momen đầu tiên của F là trùng nhau với 2k momen đầu tiên của luật chuẩn thì:

ˆ

Eθ(Q|L) = a0Xk +. . . ak

trong đó,a0, . . . , ak là giống như trong (2.4.4). Điều đó chứng minh khẳng định đầu tiên của định lý.

Bây giờ, giả sử R x2kdF(x) < ∞, n ≥ 3 và L là L(2)k - đủ. Đầu tiên, chúng ta chỉ ra rằng nếu Q ∈ L(2)k có dạng: Q = Q(X1 −X, . . . , Xn −X) khi đó: ˆ Eθ(Q|L) = const = EθQ = E0Q. Thật vậy, giả sử: ˆ Eθ(Q|L) = q(X) = a0Xk +. . . ak thì EθQ = Eθq, do đó E0Q = E0q(X + θ). Chúng ta biểu thị q(X + θ)

theo các lũy thừa của X:

q(X + θ) =A0(θ)Xk +· · ·+Ak(θ)

trong đóAj(θ)là những đa thức củaθ. Nếua0 6= 0, thì bậc củaAk(θ)là k, và của cácAj(θ) khác không vượt quá (k−1). Đặt E0Q = c, E0Xj = vj, chúng ta có:

Nhưng phép đồng nhất này chỉ có thể thực hiện được nếu bậc của Ak(θ) ≤ k−1. Do đó, a0 = 0, bằng phương pháp tương tự, chúng ta có thể chỉ ra a1 = · · · = ak−1 = 0.

Giả sử µj = R xjdF(x) đối với j = 1,2.

Nếu Q = Q(X1 −X, . . . , Xn −X) thì như chúng ta đã chứng minh

ˆ

E0(Q|L) =E0Q hay có thể được viết lại là:

E0[Qq] = E0Q.E0q, q = q(X) (2.4.5) đối với mọi q ∈ L.

Chúng ta đặt Q = (X2 − X1)2, q = X. Khi đó hệ thức (2.4.5) cho phép ta biểu thị µ3 qua µ1 và µ2. Nói chung, nếu chúng ta đã nhận được s momen đầu tiên, s ≤2k−1, thì để xác định µs+1, chúng ta tiến hành làm như sau: giả sử r = min(k, s); trong (2.4.5), đặt:

Q= (X1 −X2)r−1(X1 −X3), q = Xs+1−r

Khi đó, từ hệ thức nhận được chúng ta sẽ biểu diễnµs+1 biểu thị được theo các số hạng µ1, . . . , µs. Theo cách đó, nếu hai momen đầu tiên của F là cố định, thì µ3, µ4. . . , µ2k sẽ được xác định duy nhất bởi chúng. Dễ dàng chỉ ra rằng chúng chính là các momen của luật chuẩn nào đó ( đối với F như thế, L là không gian con L(2)k - đủ) .

Định lý 2.4.2 được chứng minh.

Bây giờ, chúng ta quay trở lại với tham số tỷ lệ.

Định lý 2.4.3. Giả sử (X1, . . . , Xn) là một mẫu ngẫu nhiên được rút ra từ một biến ngẫu nhiên có hàm phân phối F(x|σ), σ ∈ R1

+,

dPσ = dF(x1/σ). . . dF(xn/σ), L = {a0Xk +· · ·+ak}.

Nếu 2k momen đầu tiên của F trùng với các momen tương ứng của phân phối Gamma nào đó, khi đó L là một không gian con L(2)k - đủ đối với họ {Pσ : σ ∈ R1+}.

Nếu F thỏa mãn điều kiện: µ2k = R x2kdF(x) < ∞, F(0) = 0 và L là

L(2)k - đủ đối với họ {Pσ}, khi đó hoặc F là hàm phân phối suy biến hoặc 2k momen đầu tiên của F trùng với các momen tương ứng của phân phối Gamma nào đó.

Chứng minh. Giả sử F là phân phối Gamma và xét Eσ(Xj1

1 . . . Xjn n |X), trong đó j1 +. . . +jn = j ≤k. Chúng ta có: Eσ(Xj1 1 . . . Xjn n |X) = XjEσ[(X1/X)j1. . .(Xn/X)jn|X]

Nếu F là phân phối gamma, thì X và vectơ (X1/X, . . . , Xn/X) là độc lập; điều này được suy ra trực tiếp do X là thống kê đủ đầy đủ đối với họ {Pσ}. Do đó, vế phải của đẳng thức trên trở thành cXj , trong đó c là giá trị hằng số của:

Eσ[(X1/X)j1. . .(Xn/X)jn|X].

Do đó, với mọi Q ∈ L(2)k , chúng ta có Eˆσ(Q|L) = Eσ(Q|X) và L là L(2)k - đủ. Điều đó cũng đúng với các hàm phân phối F mà có 2k momen đầu tiên trùng với 2k momen đầu tiên của phân phối gamma.

Bây giờ, chúng ta quay lại khẳng định hai của định lý. Giả sử L là không gian con L(2)k - đủ. Chúng ta sẽ chỉ ra rằng, khi đó các momen µ3, . . . , µ2k của F sẽ được xác định duy nhất qua các momen µ1 và µ2. Thật vậy, giả sử các momen µ3, . . . , µs, s < 2k, đã được xác định. Nếu s≤ k, thì xét đa thức:

X1s −aX1s−1X2, trong đó, hằng số a được xác định từ điều kiện:

E1(X1s−aX1s−1X2) = 0, tức là a = µs/µs−1µ1.

Chúng ta thấy rằng a có thể biểu diễn được qua các momen đã biết. Từ điều kiện L(2)k - đủ suy ra:

ˆ Eσ(X1s −aX1s−1X2|L) = k X j=0 ajXj.

Do đó: Eσ(X1s −aX1s−1X2) = Eσ k X j=0 ajXj ! .

Nhưng vế trái hệ thức trên thỏa mãn σsE1(X1s −aX1s−1X2) = 0, bằng cách chọn a và: Eσ k X j=0 ajXj ! = k X j=0 ajσjE1Xj.

Vì E1Xj > 0, đối với j = 0,1, . . . , k, chúng ta có aj = 0 với mọi j. Do đó: ˆ Eσ(X1s−aX1s−1X2|L) = 0 (2.4.6) từ đó chúng ta nhận được: E1[(X1s −aX1s−1X2)X] = 0 do đó µs+1 được xác định duy nhất.

Nếu s > k, thì chúng ta xét đa thức X1k−bX1k−1X2, trong đó b được chọn theo E1(X1k −bX1k−1X2) = 0.

Lý luận tương tự, từ điều kiện L(2)k - đủ, chúng ta nhận được: E1[(X1k−bX1k−1X2)Xs−k+1] = 0

do đó µs+1 được xác định duy nhất.

Bây giờ, chúng ta giả sử các momen µ1 và µ2 được liên hệ với nhau bởi hệ thức µ2 = µ21. Dễ dàng chỉ ra rằng điều này chỉ có thể xảy ra đối với hàm phân phối F suy biến, tất nhiên khi đó L là L(2)k - đủ. Nếu µ2 > µ21, thì chúng ta luôn luôn tìm được phân phối gamma F* với µ1 và µ2 là hai momen đầu tiên của nó. Bởi vì đối với hàm phân phối F mà có 2k momen đầu tiên trùng với các moment tương ứng của hàm phân phối gamma nào đó, L là L(2)k - đủ, các momen µ3, . . . , µ2k được xác định duy nhất bởi µ1 và µ2, và điều này cũng xảy ra đối với hàm phân phối gamma nào đó. Do đó, định lý đã được chứng minh.

Kết luận

Bản luận văn đã đi sâu tìm hiểu và trình bày các đặc trưng họ phân phối có chứa thống kê đủ:

1. Đặc trưng các phân phối chính quy một chiều mà lũy thừa của nó chứa thống kê đủ không tầm thường.

2. Nếu giới hạn trong họ mũ với tham số tịnh tiến và tỷ lệ thì dạng hàm mật độ đã được chỉ ra. Đặc biệt, khi thống kê đủ là X thì nếu họ mũ với tham số tịnh tiến thì đó phải là họ chuẩn, còn nếu họ mũ với tham số tỷ lệ thì đó phải là họ phân phối Gamma.

3. Đặc trưng họ phân phối bởi tính đủ riêng của trung bình mẫu (liên quan đến phân phối chuẩn và phân phối Gamma).

4. Đặc trưng họ phân phối bởi tính chất của không gian con đủ sinh bởi các lũy thừa của trung bình mẫu.

Do thời gian và trình độ còn hạn chế nên tôi không cập nhật được các kết quả mới sau năm 2000, vì vậy tôi rất mong nhận được sự chỉ bảo và đóng góp của thầy cô, bạn bè. Một lần nữa, tôi xin chân thành cảm ơn!

Tài liệu tham khảo

Tiếng Việt

[1] . Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như (2004), Thống kê toán học, NXB Đại học Quốc Gia Hà Nội.

Tiếng Anh

[2] . Dynkin, E. B. (1951), Neccessary and sufficient statistics for fam- ilies of probability distribution, Uspekhi Matem. Nauk VI, 66.

[3] . Ferguson, T. (1962), Location and scale parameters in expomential families of distributions, Ann. Math. Statist. 33, 986, 1001.

[4] . Halmos, P. R and Savage, L. J.Application of the Padon - Nykodym theorem to the theory of sufficient statistics, Ann. Math. Statis. 20 (1949), 225, 441.

[5] . Kagan A. M, Theory of estimation of families with shift - scale - and expomential parameters, Trudy Matem. Inst. Steklov. AN SSSR 104 (1968), 19-87.

[6] . Kagan A. M, Linik Y.U and Rao C.R (1973)Characterization Prob- lems in Mathematical Statistics, John Wiley and Sons. NewYork. [7] . Kagan F. M, Some theorems characterizing gamma distributions

and distributions close to them, Litovsku Matem. Sbornik VIII (1968), 265.

[8] . Lehmann, E. Testing of statistical Hypotheses (1959), John Wiley, New York.

[9] . Shohat, J.A and Tamarkin, J.D. The problem of moments (1943), Anner. Math. Soc. Colloquium Publ, NewYork.

[10] . Zinger, A.A. and Linnik, Yu. V. On class of differential equations and its application to some problems of regression theory, Vestnik Leningrad. Univ. 7(1957), 121-130.

Một phần của tài liệu Đặc trưng họ phân phối có chứa thống kê đủ Luận văn ThS. Đặc trưng họ phân phối có chứa thống kê đủ (Trang 40 - 49)

Tải bản đầy đủ (PDF)

(49 trang)