BIÊN NGẪU NHIÊN NHIÊU CHIÊU
2.2. Các đặc trưng mẫu
Từ nay về sau, trong các công thức liên quan đến đặc trư ng mẫu, thay vì Xị ta hay dùng X, do nhiều lý do. Thứ nhất, đó là các công thức tính toán làm việc trực tiếp với các quan s á t m ẫu cụ thể. Thứ hai, nếu dùng quá nhiều ký hiệu khác n h a u sẽ gây n h ầ m lẫn (hơn nữa vể m ặ t biện chứng trong ngẫu nhiên có tâ"t định và ngược lại). Thứ ba, các công thức chủ yếu d ù n g đê tín h toán, còn trong các trường hỢp chứng m in h các t í n h c h â t lý thuvết, ta dề dàng (và n ên cũng để tr á n h nhầm) th a y trở lại các giá trị m ẫu Xị bằngX,.
Một mẫu, như ta đã biết ở tiết 1 , có thể mó tả bằng bảng p h â n phôi Lần số hoặc bằng chính dãy sô^ liệu
a) Xị, x.>...(2.2) b) “
n, tĩ2 ... ìĩk
Trong trường hỢp m ẫu lóp, nhiều khi th ay khoảng giá tri b ằng giá trị tr u n g bình của khoảng; khi đó ta đưa về mẳu đơn d ạ n g (2.3).
1. Trung binh mẫu (hay kỳ vọng mẫu)
Nếu mẫu cho dưới dạng (2.2) thì tru n g bình mẫu ký hiệu là X , đưỢc xác định n hư sau:
1 "
riiTĨ (2.4)
Để ý là khi chứng minh lý thuyết, ta sẽ thay các Xị bằng là biến ngẫu nhiên cảm sinh ra quan sát có cùng phân phôi với X gốc. Nếu sô' liệu cho dưới dạng (2.3), ta có
x = i > . r n , . 1 (2.5)
1-1
về m ặt bản chât (2.4) và (2.5) là một (nếu k ~ n, thì n, - IVi), mặc dù vậv trên hình thức ta vẫn để riêng dưới dạng hai công thức khóc nhau.
Rõ ràngX theo cách hiểu lý thuyết sẽ là một biến ngẫu nhiên (do các Xị là biến ngẫu nhiên), nên có thể tìm các số đặc trưng của X . Giả sử biến ngẫu nhiên gốc X có E X = a và
vx = ỡ^; khi đó
EX = a , v x = (2-6)
n
Ta chứng minh công thức bên trái: do X = — + X2 + ... + x„) n
nên dùng tính chất của kỳ vong EX = — [EX, + ... + EX ); từ n
định nghĩa mẫu ngẫu nhiên cấcJỉị có cùng p h â n phôi với X nên EXị = EX =a, suy ra EX - —(na) - a . Công thức bên phải của
ĩl/
(2.6) đã được chứng minh ở phần tính chất của phương sai. Từ (2.6), do phương sai v x bé hơn n lần v x , nên các giá trị có thể có của X sẽ ôn định quanh kỳ vọng hơn các giá trị của X.
Chú ý rằng nếu tập nền có kích thước bé {N bé) và ta chọn m ẫu không hoàn lại, công thức v x trong (2.6) phải n h ân thêm với thừa sô' hiệu chỉnh {N ~ n) !{N — l)\
(2,7)
n N - l
Ta xét ý nghĩa của (2.7) trong các trường hỢp đặc biệt. Nếu chọn mẫu có n = N, tức là lấy toàn bộ các phần tử của tập nền, khi đó mọi thông tin của tập nền đã biết và rõ ràng v x = 0.
Trong mọi trường hỢp ta chọn ra mẫu rất bé so với tập nền (chẳng hạn N vô hạn hoặc chọn mẫu có hoàn lại vói trường hỢp N lôn và hữu hạn), rõ ràng v x trở thành như trong (2.6) vì
N^CC N - l
Thí dụ 2.2. Ta có năm mảnh bìa được đánh sô' từ 1 đến 5.
Nếu gọi X số thu đưỢc khi rút hú họa ra một mảnh bìa thì rõ ràng phân phối của X là
X 1
p{x) 0,2 0,2 0,2 0,2 0,2
Giả sử bây giờ ta lấv ra một mẫu 2 mảnh bìa không hoàn lại và thu được sô’ và X.2. Hãy tìm phân phôi của X và các sô"
đặc trưng của nó.
Giải. Rõ ràng X ~ í//(5 )v ớ i E X = 3 và vx = 2 (xem §4 chương II). Mặt khác đặt X = (X| +X.^)I2,CÓ thê tính được
uật phân phối của X
1,5 2 2,5 3 3,5 4 4,5
p{x) 0,1 0,1 0.2 0,2 0,2 0,1 0,1
Dễ dàng tính được
E X = 1,5.0,1 + 2.0,1 + 2,5.0,2 + 3.0,2 + 3,5. 0,2 + 4.0,1 + 4,5.0,1 = 3;
v x = (1,5 - .0,1 + (2 - 3)'\ 0,1 + (2,5 - 3)'-.0,2 + (3 - 3)-.
0,2 + (3,5 - 3)^0,2 + (4 - 3 ) l0 ,l + (4,5 - 3)^.0,1 = 0,75.
Ta thấy EX = EX\ v x = 0,75 < vx. Để ý nếu chọn có hoàn lại, ta có phương sai được tính theo (2.6) và bằng 1. Từ đó theo (2.7) v x = 1. — ^ 1.-^-^ = 0,75 như ở trên. Cũng lưu ý rằng
N - l 5 - 1
khi chọn mẫu không hoàn lại, Xỵ đã không cùng phân phối n h ư X nữa nên việc áp dụng (2.6) là không được phép.
2. Phương sai mẫu
Nếu mẫu cho đưới dạng (2.2), phương sai mẫu, ký hiệu là đưỢc xác định như sau:
s ' = - X ( a: , - x f ; (2.8)
^ Í = 1
với X xác định theo (2.4). Nếu mẫu cho dưới dạng (2.3), ta có (2.9) vối X xác định theo (2.5). Do là biến ngẫu nhiên, ta tìm sô' đặc trưng ES^\
Ta viết
i = l 1
- ~ ^ p ‘í-1 n ~ l ^
n
do Xi, i = l,n, độc lập đồng phân phôi với X nên E{XịK) = EXi.
EXj = ( W và £ ( x f ) = nên
ES'^ ^ ĩ ^ . n E ( x ^ ) - = - ^ v x = (2.10)
^ ^ rì^ n n
Chính vì ES^ ^ ơ^, nên ngưòi ta đưa vào đặc trưng mẫu thứ hai của phương sai với tên gọi là phương sai mẫu hiệu chỉnh, ký hiệu là s^, như sau (so sánh với (2.8) và (2.9)):
(2.11)
(2.12)
Rõ ràng và Es^ = ^ ES'^ = (xem (2.10)).
n ~ l 71-1
Ngoài trung bình mẫu và các phương sai mẫu, ta còn có thể xác định các đặc trưng mẫu khác:
— mô men mẫu cấp k = — V ; n Í-I
— mô men trung tăm mẫu cấp k Sị^ = — ;
^ i=\
~ trung vị mẫu, mốt mẫu...
3. v ề luật phân phối của các đặc trưng mẫu
Nếu biến ngẫu nhiên gôc tuân theo luật phân phôi chuẩn X c4 \ a , ơM, khi đó X và độc lập với nhau và
1
^ 2 \ Ỵ
a) X ~ aV a, — h a y— - ơ i ' (0; l);
{ n ) ơ
n _ 2
nS^ _ (n -l)s'^ _
ơ ơ ơ
X — a Ị — X - a I - /
= --- \ J n - l ~ t i n
(2.13)
'Ịn - ^ yln - 1 - í (ra - 1).
(2.14) (2.15)
s s
Các kết quả này đã được nhắc tới trong các công thức (4.17), (4.21)... của chương II. Ngoài ra, nếu ta xét hai mẫu khác nhau cảm sinh bởi hai biến ngẫu nhiên chuẩn và gọi và sỊ là các phương sai mẫu hiệu chỉnh của các mẫu tương ứng (với kích thưốc ỉii và n.2) thì với giả thiết crf ^ a ị
d) ~ - 1; n.^~ì) (2.16)
^2
s.^ /s.^ , 'ì -
nêu ơ-f ^ Ơ2\ Y / Ì ~ - 1; - 1) . Cuôi cùng để ý
r ^ 2 )
trong (2.14) nếu thay X bằng a ta sẽ có - a f / ~ (n).
i=i
Với các giả thiết tồn tại các giới hạn hoặc mômen tương ứng và dùng các kết quả của luật sô' lớn hoặc định lý giới hạn trung tâm, khi —> 00 ta sẽ có
a) X- hcc X
a; s
---^ ãị oo2
hix
cr
x - a
Ẹ ; —^ c y K ( 0 ,l) ; c)
/^4 - ơ'
2 _ 2
s ~ ơ
cyK(0,l),
o'K(0,1), Ị^^ -ơ-
d) (s -c r )7 ô L
ơ”
Các kết quả trên sẽ rất có ích trong thực hành vì không cần đến giả thiết chuẩn của biến ngẫu nhiên gốc và trong nhiều trường hỢp ta đã có thể châp nhận kết quả với n không quá lón. Chang hạn với n > 30, kết quả (b) đã có thể chấp nhận được. Ngoài ra theo định lý Gli-ven-cô - Can-te-li, khi n đủ lớn
làm phân phôi thực nghiệm đã khá gần với hàm lý thuyết.
K W - n x ) — B sup
r s R
^0.