LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN Chương 5 Kiểm định phi tham số NỘI DUNG Chương này dành riêng cho các kiểm định phi tham số, đây là các kiểm định cơbản thường được tiến hành để xác đ
Trang 1LÝ THUYẾT XÁC SUẤT VÀ THỐNG KÊ TOÁN
Chương 5 Kiểm định phi tham số
NỘI DUNG
Chương này dành riêng cho các kiểm định phi tham số, đây là các kiểm định cơbản thường được tiến hành để xác định tính chất của các tổng thể thông qua các bộ sốliệu hay các mẫu ngẫu nhiên Các kiểm định quan trọng hơn cả là kiểm định về dạngphân phối thực nghiệm và sự phù hợp của chúng với phân phối lý thuyết Chương nàycũng dành một phần quan trọng cho việc kiểm định các phân phối thông dụng như phânphối chuẩn, Poison, Đều, Mũ Trong một vài trường hợp các kiểm định cũng được trìnhbày như một kỹ thuật, ngoài ra các kiểm định đều có thể nhận được từ các phần mềmứng dụng Có thể chia nội dung kiểm định phi tham số thành hai phần, đó là kiểm địnhKhi bình phương và các kiểm định phi tham số khác mà chủ yếu là các kiểm định dựatrên các hệ số tương quan hạng Một số thủ tục, các tính toán cụ thể sẽ được giới thiệu đểngười học có thể tỡnh toỏn độc lập không cần đến sự trợ giúp của các phần mềm chuyêndụng Về phần mềm ứng dụng, chỳng tụi dành một phần riêng để giới thiệu các kiểmđịnh phi tham số của SPSS, với một số kiểm định không được trình bày cơ sở lý thuyết
YấU CẦU
Sau khi nghiờn cứu chương này người học cần đạt được một số yêu cầu sau:
- Phõn biệt rừ kiểm định phi tham số và kiểm định về giá trị các tham số của cácbiến ngẫu nhiên
- Nắm được một cách thổng quát cách tiếp cận kiểm định sự phù hợp của cácphân phối thực nghiệm với công cụ kiểm định Khi bỡnh phương
- Nắm được cách thức dùng các kiểm định dấu trong một số bài toán cụ thể
- Áp dụng thuần thục các kỹ năng kiểm định dựa trên tiêu chuẩn Khi bỡnhphương
- Nắm được thuật toán các kiểm định dạng phân phối đặc biệt là các kiểm địnhJacque-Bera, Kolmogorov, Kolmogorov-Simirnov Cách thức sử dụng các kỹ thuật nàytrên SPSS
- Cỏch hỡnh thành cỏc hệ số tương quan hạng và sử dụng các hệ số này trongtừng bài toán kiểm định các quan hệ không tuyến tính, phi tham số
- Sử dụng thành thạo các kiểm định trên Winstata và SPSS có liên quan
Trang 2I kiểm định khi bình phương
1- Kiểm định sự phù hợp của qui luật thực nghiệm
Kiểm định Khi bình phương được dùng phổ biến trong việc kiểm định giả thuyết
về dạng phân phối Kiểm định này dựa trên cơ sở đánh giá tổng bình phương khác biệtgiữa giá trị lý thuyết theo giả thuyết và giá trị thực nghiệm tương ứng Để đưa ra các giảthuyết về dạng phân phối, người ta thường mô tả và phân tích sơ bộ hiện tượng, đặc điểmcủa biến ngẫu nhiên thông qua số liệu quan sát Tuy vậy, trong nhiều trường hợp cácphân tích này có thể bị bỏ qua, vì nhận thức chủ quan hay kinh nghiệm của người phântích
Thống kê Khi bình phương thiết lập trên một mẫu kích thước n có thể mô tả tổngquát nhờ công thức sau:
2 n
(O E )E
=
−
(5.1)Trong đó: Ei là giá trị lý thuyết theo giả thuyết, Oi là giá trị thực nghiệm tương ứng Cỏcgiỏ trị Oi và Ei có thể là các tần số của các dấu hiệu hoặc giá trị thực của các biến ngẫunhiên Trong các kiểm định cụ thể chúng ta sẽ mô tả cụ thể cách chọn hai loại giá trị này
a- Kiểm định giả thuyết về phân phối đều
Phân phối đều trên đoạn [a, b] là phân phối liên tục, mà biến ngẫu nhiên tươngứng có khả năng nhận các giá trị khác nhau trong đoạn này bằng nhau Đây cũng làtrường hợp minh họa dễ dàng nhất đối với các kiểm định về dạng phân phối của các biếnngẫu nhiên lien tục Đặc điểm chính là thực tế quan sát chúng ta nhận được các giá trịrời rạc, kiểm định này thực hiện trên cơ sở phân khoảng và rời rạc hoá phân phối đềunhư sau: Giả sử X nhận các giá trị {xi} trong k khoảng thời gian có độ dài bằng nhau.Nếu X phân phối đều theo thời gian thì các giá trị của X trong mỗi khoảng thời gian làtrung bình của X (x* chẳng hạn) Thống kê khi bình phương được tính theo công thức
1
2 2
*
*)(
χ
thống kê này tuân theo qui luật Khi bình phương (k-1) bậc tự do nếu
X phân phối đều Với mức ý nghĩa α cho trước, giả thuyết X phân phối đều bị bác bỏ nếugiá trị quan sát lớn hơn giá trị tới hạn χ2(k-1) mức α
Thí dụ 1: Quan sát 12 tháng số lượng lương thực cung cấp cho 1 hộ người ta nhận được
kết quả sau
Trang 3Tra bảng giá trị phân phối χ2 ta có: χ2
0.05 (11) = 19.675 So sánh với giá trị quan sát, ta
thấy không có cơ sở bác bỏ giả thuyết cho rằng lượng lương thực cung cấp cho hộ là đều
đặn (phân phối đều theo thời gian)
b- Kiểm định giả thuyết về cấu trúc tổng thể
Giả thiết về cấu trúc tổng thể theo các dấu hiệu của 1 biến định tính hay các khoảng của
1 biến định lượng, có thể qui về một phân phối xác suất của một biến ngẫu nhiên rời rạc
Có thể xem đây là trường hợp tổng quát kiểm định phân phối xác suất của các biến ngẫunhiên rời rạc với việc sử dụng tiờu chuẩn Khi bỡnh phương để kiểm định cấu trúc tổngthể Không mất tính tổng quát, có thể mô tả kiểm định này qua một thí dụ cụ thể sau đây
Thớ dụ 2: Giả sử mức sống của cư dân một vùng có thể phân chia 5 bậc như sau: quá
nghèo, nghèo, trung bình, khá và giàu Có người cho rằng tỷ lệ dân cư ở các mức sốngtương ứng là:
Với mẫu ngẫu nhiên 1000 quan sát người ta thấy số cư dân có các mức sống như sau:
Ta có thể tính giá trị quan sát của thống kê Khi bình phương nhờ bảng sau:
Giá trị lý thuyết(Ei)
Giá trị quan sát(Oi)
(Oi -Ei)2/Ei
Trang 40.05 (4) = 9.4877 Như vậy đủ cơ sở bác bỏ giả thuyết về cấu trúc mức sống dân
cư nói trên
c- Kiểm định giả thuyết về phân phối Poison
Phân phối Poison là một trong những phân phối có nhiều ứng dụng trong thực tế,đây là phân phối của các hiện tượng “hiếm” Có nhiều cách nhận biết một biến ngẫunhiên X phân phối Poison, như dựa vào hiện tượng trung bình xấp xỉ phương sai; tínhchất của dòng biến cố theo thời gian Chúng ta nêu thủ tục, nhờ đó có thể kiểm tra lạichính các phân tích có tính định tính này nhờ tiêu chuẩn Khi bình phương qua một thí dụ
cụ thể
Thớ dụ 3: Quan sát số lần máy bay bay qua một không phận A, người ta có số liệu (k và
nk) và bảng tính toán sau:
Số lần(k)
số phút(nk)
Pk(λ=2.965)
0.05 (5) =11.07048, vậy không đủ cơ sở bác bỏ giả thuyết số máy lần máy bay
qua không phân A phân phối Poison
d- Kiểm định giả thuyết về phân phối chuẩn
Phân phối chuẩn là phân phối liên tục, tuy vậy trong thực hành chúng ta luônnhận được các giá trị quan sát rời rạc Để kiểm định giả thuyết về phân phối chuẩn củamột biến ngẫu nhiên X, người ta dựa trên các tần số theo khoảng Thủ tục kiểm định nhưsau:
Chia vựng giỏ trị quan sỏt thành k khoảng dạng (xi , xi+1); gọi ni là số giỏ trị quansỏt thuộc khoảng (xi , xi+1)
Kích thước mẫu
k i
Trang 5Tớnh giỏ trị trung bỡnh khoảng i:
i i 1 i
x
2+
zs
−
=
Tỡnh cỏc tần số lý thuyết:n,i =nP(zi < <Z z )i 1+ với Z là biến n.n phõn phốiN(0,1)
Tớnh giỏ trị quan sỏt của thống kờ Khi bỡnh phương (χ2qs).
So sỏnh với giỏ trị tới hạnχ2α(k 1)− và kết luận.
Thớ dụ 4: Sau đây là kiểm định về giả thuyết thu nhập ( X) của viên chức vùng A phân
phối chuẩn, (Z là biến chuẩn hoá của X)
n i ’=
nP(Z i <Z<Z i+1 ) (n i ’-n i ) 2 /n i ’
570 580 575 20 11500 12842.31 -2.906 -1.948 23.86 0.62478 580 590 585 142 83070 33414.82 -1.948 -0.990 135.29 0.33247 590 600 595 310 184450 8839.836 -0.990 -0.032 326.02 0.78778 600 610 605 370 223850 8034.772 -0.032 0.925 335.58 3.52996 610 620 615 128 78720 27509.2 0.9258 1.883 147.56 2.59467 620 630 625 30 18750 18243.47 1.883 2.840 27.59 0.21024
qs = 8.0798
Trung bình(x) =600.34 Độ lệch TC (s)=10.439 ; χ2
0.05 (5) =11.07048
Kết quả trên cho thấy có thể xem thu nhập của viên chức hành chính phân phối chuẩn
2- Kiểm định tính độc lập của hai dấu hiệu
Kiểm định tính độc lập của hai dấu hiệu định tính nhờ tiêu chuẩn Khi bìnhphương là kiểm định dựa trên cơ sở kiểm định sự đồng nhất của phân phân phối xác suấtđồng thời và tích hai phân phối biên Với biến ngẫu nhiên hai chiều (X,Y) chúng ta đãbiết rằng nếu X và Y độc lập thì hàm mật độ đồng thời f(x,y) bằng tích hai hàm mật độ
f1(x) và f2(y) Dựa trên cơ sở này người ta tiến hành kiểm định tính độc lập của hai dấuhiệu
Giả sử A và B là hai biến ngẫu nhiên định tính A có p dấu hiệu và B có q dấuhiệu Với mẫu ngẫu nhiên kích thước n ta có bảng tiếp liên
A 1 A 2 A p
Trang 6Theo mỗi dòng ta có các tần số Ri Tỷ lệ Ri/n là tần suất của dấu hiệu Bi.
Hãy xét một cột j ứng với dấu hiệu Aj Nếu A, B độc lập thì theo tỷ lệ Ri/n mỗi ô(i,j) sẽ có tần số lý thuyết là CjRi/n
Như vậy, chênh lệch tần suất và xác suất trong ô (i,j) có thể tính như sau:
)(
)(
n
C R n E
n
C
C R n
1 1
2 2
)(
χ
(5.2)
A, B độc lập thống kê này có phân phối χ2 với (p-1)(q-1) bậc tự do Với mức ý nghĩa α
cho trước ta kết luận A, B không độc lập nếu χ2
qs >χ2
α [(p-1)(q-1)]
Thí dụ 5: Với tệp số liệu GSS93 ta có thể kiểm định giả thuyết cho rằng sự ưa thích nhạc
cổ điển và nhạc đồng quê châu Âu độc lập với nhau Các tính toán từ bảng tiếp liên nhưsau:
Count ry West ern Music * Classical Music Crosst abulat ion
Mixed Feeling s
Dislike It
Dislike It Very Much Classical Music
Total
Trang 7Giá trị n
C
C R n
j i
j i ij
2)
tại các ô (i,j)
2.96876 2.119857 0.467262 7.718278 6.2818125.390035 5.956122 0.638465 0.449345 0.68899512.92389 1.485195 3.107843 8.480528 3.1481350.681022 0.021068 0.462626 0.09605 2.5151921.786564 0.553482 1.353052 1.76908 9.845455Giá trị thống kê Khi bình phương: 80.90812 Kết luận nhận được là bác bỏ ý kiến trên.Kết quả sau nhận được từ SPSS với chương trình:
3 Kiểm định dấu (sign test)
Kiểm định dấu là một trong những cách thức kiểm định đơn giản nhưng có nhiềuứng dụng Đơn giản nhất là kiểm định giả thuyết về trung vị của một biến X nhờ mộtmẫu ngẫu nhiên Tư tưởng của kiểm định dấu được mở rộng cho nhiều kiểm định khácnhư kiểm định xác suất, kiểm định tính ngẫu nhiên của một mẫu Thực tế kiểm địnhnày có thể qui về kiểm định cấu trỳc tổng thể đó trỡnh bày ở trờn, việc sử dụng các tiếpcận khác có thể làm cho việc kiểm định thuận tiện hơn
a- Kiểm định giá trị trung vị
Giả sử X là một biến ngẫu nhiên, gọi Md(X) là giá trị trung vị của X Giả thuyết
H0 là Md(X)= m0 thì P(X<=m0) =0.5, như vậy các giá trị quan sát từ một mẫu ngẫu nhiên
có khả năng chia đều về hai phía của m0 Nếu điều đó thực sự không đúng thì hoặc là giả
Trang 8thuyết H0 sai hoặc là mẫu được chọn thực tế là mẫu không ngẫu nhiên Trước tiên ta xemxét thủ tục kiểm định giá trị trung vị.
Với một quan sát mẫu, dấu của quan sát là dấu "-" nếu giá trị quan sát nhỏ hơn
m0, dấu của quan sát là dấu "+" nếu giá trị quan lớn hơn m0, các giá trị quan sát đúngbằng m0 được đánh dấu "0" Nguyên tắc kiểm định là nếu số dấu "-" (hoặc dấu "+") quánhỏ hay quá lớn giả thuyết H0 sẽ bị bác bỏ
Gọi số dấu "+ "(chẳng hạn khi có ít dấu "+") là Y, thì Y phân phối Nhị thức với hai tham
số n và 0.5- B(n, 0.5) Với giả thuyết trờn tại mỗi giỏ trị Y0 (số dấu “+“) quan sát được taxác định được P(Y<=Y0) và P(Y>=Y0) Cỏc giỏ trị này là cơ sở để kết luận về giả thuyếttrên với mức ý nghĩa cho trước
Vỡ việc lựa chọn Y là số dấu “+” hay số dấu”-“ không làm thay đổi phân phối của Y nờn
cú thể giả sử Y0 là số dấu có tần suất nhỏ, nếu xác suất P(Y<=Y0) nhỏ hơn mức ý nghĩacủa kiểm định thì bác bỏ giả thuyết H0, tức là giá trị trung vị không bằng m0
Thí dụ 6: Có giả thuyết cho rằng thu nhập hộ/tháng ở một thành phố có giá trị trung vị là
500$ Quan sát ngẫu nhiên 100 hộ ta nhận được 66 hộ có thu nhập không thấp hơn500$/tháng và 34 hộ có thu nhập thấp hơn 500$/tháng Như vậy số dấu - trong 100 quansát là 34 Gọi Y là số dấu - thì Y phân phối B(100, 0.5) và: P(Y<=34)= 0.009; Với mức ýnghĩa 5% ta bác bỏ giả thuyết trung vị của thu nhập hộ là 500$/tháng
b- Kiểm định giá trị xác suất
Hoàn toàn tương tự với kiểm định trung vị, ta có thể sử dụng phân phối nhị thức
để tiến hành kiểm định xác suất
Giả thuyết cần kiểm định là H0: P(A) =p0 và H1: P(A) ≠ p0 Với mẫu ngẫu nhiênkích thước n (quan sát A n lần), gọi m là số lần xuất hiện A, tương ứng số dấu "+", thì Akhông xuất hiện (n-m) lần, tương ứng số dấu "-" Không mất tính tổng quát có thể giả sử
p0 lớn và m nhỏ, gọi Y là số dấu "+" thì Y phân phối B(n, p0) Xác định P(Y<=m) nếu giátrị xác suất này nhỏ hơn mức ý nghĩa kiểm định thì bác bỏ giả thuyết H0 Trường hợp p0nhỏ và m lớn hoàn toàn tương tự
Thí dụ 7: Một dây chuyền sản xuất tự động được coi là bình thường nếu tỷ lệ phế phẩm
không quá 5% Kiểm tra ngẫu nhiên 50 sản phẩm thấy có 4 phế phẩm, có thể xem là dâychuyền hoạt động bình thường hay không?
Gọi Y là số phế phẩm thì Y phân phối nhị thức B(50, 0.05)
Như vậy P(Y>=4)= 1 - P(Y<=3) =0.2396 Vậy với mức ý nghĩa 5% không đủ cơ sở chorằng dây chuyền hoạt động không bình thường
Trang 9c- Kiểm định tính ngẫu nhiên của mẫu- Kiểm định các đoạn mạch (Runs test)
Một trong những yêu cầu của suy luận thống kê từ mẫu là tính ngẫu nhiên củamẫu cụ thể phải được đảm bảo Có nhiều thủ tục kiểm định hay xác nhận tính ngẫu nhiêncủa các quan sát, ở đây ta xét việc ứng dụng kiểm định dấu để giải quyết vấn đề này Giả
sử có n quan sát về X : x1, x2, , xn Theo một dấu hiệu nào đó mà chúng ta xác định làmtiêu chuẩn ngẫu nhiên, chẳng hạn nếu X là thu nhập hộ ta có thể chọn tiêu chuẩn nhỏ hơnhay lớn hơn trung bình để xem xét, hoặc thay cho trung bình ta có thể chọn trung vị Với một tiêu chuẩn xem xét xác định các quan sát được chia thành hai nhóm với hai dấuhiệu "+", "-" theo thứ tự quan sát Ta gọi dãy các dấu như nhau là một đoạn mạch
Kiểm định các đoạn mạch được thực hiện như sau:
Gọi: n1 là số dấu "+"; n2 là số dấu "-" và m là số đoạn mạch Sử dụng bảng tínhcác giá trị M1 và M2 cho kiểm định các đoạn mạch, nếu M1<m<M2 mẫu được xem làngẫu nhiên, ngược lại ta kết luận mẫu không ngẫu nhiên
Thí dụ 8: Quan sát số lần ốm đau trong năm và số con của phụ nữ trên 49 tuổi đã từng
kết hôn người ta nhận được số liệu về con của họ như sau: 2 3 2 4 5 3 2 1 1 3 4 6
2 4 3 5 6 3 2 Người ta cho rằng người quan sát đã không quan sát theo thứ tự ngẫunhiên ngẫu nhiên vì trung bình số con của phụ nữ đã hết tuổi sinh đẻ trong vùng có sốcon trung bình là 2,8 Hãy xác nhận tính ngẫu nhiên nếu có của số liệu quan sát với mức
Với n1, n2 >=10
Số đoạn mạch m phân phối xấp xỉ chuẩn với trung bình E(m)=
12
2 1
2
+n n
n n
và phương sai
)2
(2
2 1
2 2 1
2 1 2 1 2 1
−++
−
−
n n n n
n n n n n n
)(
m Var
m E
m−
Nếu |Uqs| > Uα /2 ta bác bỏ giả thuyết số liệu mẫu được quan sát ngẫu nhiên
Trang 10Xắp xếp dấu phần dư et nhận được từ hồi qui Y=a+bX theo chiều tăng của X người tanhận được 24 đoạn mạch với 42 dấu "+" và 64 dấu "-" Có thể kiểm định tự tương quantrong mô hình trên nhờ kiểm định tính ngẫu nhiên về dấu của các phần dư như sau:
E(m)= 51.71698Se(m)= 4.900433
Với mức ý nghĩa 5% ta bác bỏ giả thuyết các sai số ngẫu nhiên không tương quan tuyến
tính với nhau, hay mô hình có tự tương quan
II MỘT SỐ KIỂM ĐỊNH DẠNG PHÂN PHỐI THÔNG DỤNG
Phần này giới thiệu một số thủ tục kiểm định dạng phân phối của biến ngẫu nhiên
1 chiều Các thủ tục kiểm định được trỡnh bày ở đây tập trung cho một số dạng phânphối như: Phân phối đều; Phân phối Poison; Phân phối mũ và đựac biệt chú trọng đếnphân phối chuẩn
1- Tiêu chuẩn Kolmogorov
Tiêu chuẩn Konmogorov áp dụng được cho mọi phân phối liên tục, nhưng đây làtiêu chuẩn dựa trên các tham số lý thuyết xác định ngoài số liệu thống kê Tiêu chuẩn nàyđược sử dụng khi đã có một “chuẩn mực” cho đại lượng được nghiên cứu Chẳng hạn,một thiết kế kỹ thuật, một quá trình kinh tế hay một quá trình sinh hoá đã xác định cótính chất lý thuyết, vấn đề còn lại là thực tế đối tượng nghiên cứu có xảy ra như lý thuyếthay không Có thể tóm tắt tiêu chuẩn này như sau: Dựa trên cơ sở nào đó người ta chorằng X có phân phối F(x, θ*) với θ* đã xác định Dựa trên quan sát mẫu ta có các giá trị
xi Gọi phân phối thực nhiệm là F(x) ta có:
0 x)
1()
(
2 2
2
k
y k
k e khi y
K
Nếu Yqs >kα ta bác bỏ giả thuyết phân phối thực nghiệm phù hợp với phân phối lý thuyết.Bảng giá trị tới hạn của phân phối Kolmogorov
Trang 11kα 0.828
6
0.8952
0.9738
1.0727
1.2241
1.3576
1.520 1.627
4
1.9548
Thí dụ 9: Dây chuyền tự động sản xuất đồng hồ đo điện được thiết kế với số sản
phẩm/giờ là biến ngẫu nhiên phân phối chuẩn trung bình mỗi giờ 12 chiếc với độ lệchchuẩn 2 chiếc Quan sát 100 giờ sản xuất thực tế có số liệu sau:
Cú thể kiểm tra giỏ trị thống kờ Z trong bảng này theo cụng thức tớnh giỏ trị Y ở trờn
2- Tiêu chuẩn Jacque- Bera
Tiêu chuẩn Jacque-Bera kiểm định biến ngẫu nhiên phân phối chuẩn nhờ các đặc trưngđịnh dạng phân phối
Với mẫu ngẫu nhiên W(X) kích thước n, ta xác định các hệ số bất đối xứng S(Skew) và hệ số nhọn K (Kurt) Trong mô tả thống kê ta đã biết nếu X phân phối chuẩnthì hệ số bất đỗi xứng bàng 1 và hệ số nhọn bằng 3
Trang 12Với n đủ lớn thống kê JB phân phối Khi bình phương 2 bậc tự do.
n i i
n Skew X
1
i
X X Skew X
1
i
X X Kurt X
Thớ dụ 10: Mức xăng tiêu hao cho mỗi km đường đi trên mỗi xi lanh xe du lịch là biến
ngẫu nhiên X Với 397 quan sát người ta tính được Skew(x)=0,21 và Kurt(x)=-1,197.Phải chăng X phân phối chuẩn
Ta tính được: JB = 26,619; P(ữ2(2)> 26,619)=0,00001 Vậy cú thể kết luận X khụng phõnphối chuẩn
2- Tiờu chuẩn Kolmogorov-Simirnov
Tiờu chuẩn Kolmogorov-Simirnov cú thể dựng để kiểm định giả thuyết một biến ngẫu nhiên X phân phối Chuẩn, đều, Poisson hay phõn phối mũ
Cú thể túm tắt tiờu chuẩn này như sau: Giả sử quan sỏt mẫu Wn(x) là: x1 < x2 < x3 <…<
xm, goi fi là tần số tương ứng của xi. Hàm phõn phối xỏc suất thực nghiệm của x sẽ là:
1 k
i i=1
1
1
0 f
Trang 13Nếu p < ỏ bỏc bỏ giả thuyết phõn phối F0(x).
Thớ dụ 11: Dữ liệu mức chi tiờu của/khẩu của cỏc hộ cú mức sống trung bỡnh tại Hà
nội năm 1998 từ VLHS98 được cho ở hai cột đầu của bảng dưới đây Với mức ý nghĩatối thiểu là bao nhiờu là thể xem là chi tiêu/khẩu của các hộ loại này ở hà nồi năm 1998
là biến ngẫu nhiên phân phỗi chuẩn?
Các tính toán sau đây mô tả việc thực hiện kiểm định Kolmogrov-Simirnov
1924,81 4 7699,24 14819574 0,0506 0,0445 0,03398 0,00613 1988,63 4 7954,52 15818597 0,1013 0,0846 0,07486 0,01665 2075,64 5 10378,2 21541407 0,1646 0,1761 0,04087 0,01157 2096,75 4 8387 17585442 0,2152 0,2054 0,02074 0,00976 2116,9 2 4233,8 8962531 0,2405 0,2359 0,02328 0,00458
Trang 142134,08 9 19206,72 40988677 0,3544 0,2638 0,08159 0,09064 2139,46 6 12836,76 27463735 0,4304 0,2728 0,11973 0,15754 2161,04 4 8644,16 18680376 0,4810 0,3107 0,03546 0,17036 2230,95 4 8923,8 19908552 0,5316 0,4456 0,06239 0,08609 2242,65 4 8970,6 20117916 0,5823 0,4693 0,0779 0,11302 2259,9 5 11299,5 25535740 0,6456 0,5044 0,18095 0,14119 2441,87 3 7325,61 17888187 0,6835 0,8265 0,1474 0,14297 2445,28 5 12226,4 29896971 0,7468 0,8309 0,09928 0,08411 2457,42 5 12287,1 30194565 0,8101 0,8461 0,04698 0,03599 2466,72 5 12333,6 30423538 0,8734 0,8571 0,0243 0,01631 2506,11 3 7518,33 18841762 0,9114 0,8977 0,00184 0,01368 2519,69 3 7559,07 19046513 0,9494 0,9096 0,02652 0,03982
Vậy với mức ý nghĩa 5% ta bỏc bỏ giả thuyết biến ngẫu nhiên đang xét phân phối chuẩn,nhưng với mức ý nghĩa 1% thỡ giả thuyết này khụng bị bỏc bỏ
Thủ tục tạo tệp chikhau_hanoi.sav được thực hiện từ tệp Hhexpn98v.sav như sau:
USE ALL.
COMPUTE filter_$=(province=17).
VARIABLE LABEL filter_$ 'province=17 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
Trang 15VARIABLE LABEL filter_$ 'quint98 = 3 (FILTER)'.
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.
a Test distribution is Normal.
Kết quả nhận được như đó cú trong thớ dụ trờn
III các kiểm định trên cơ sở tương quan hạng
1- Kiểm định Wilcoxon
Kiểm định Wilconxon thường được sử dụng khi mẫu ngẫu nhiên thành lập từ haimẫu khi quan sát cho cùng một biến Như vậy từ giả thuyết về tính ngẫu nhiên của mẫu,khi áp dụng cho hai mẫu ghép một ta có giả thuyết về tính đối xứng của thông tin từ haimẫu thành phần Đây là một kiểm định dựa trên cơ sở kiểm định hạng Tổng quát hoáthành một qui trình ta xét một thí dụ, thí dụ này liên quan đến kiểm định dấu mà ta đã nói
ở trên
Thớ dụ 12: Để đánh giá về chất lượng một loại sản phẩm từ hai cơ sở sản xuất, người ta
chọn ngẫu nhiên 10 cặp sản phẩm của hai cơ sở này và yêu cầu 10 chuyên gia cho điểmtheo thang điểm 10 Kết quả nhận được như sau:
Chuyêngia
Trang 16G 7 9
Có thể cho rằng chất lượng sản phẩm của hai cơ sở như nhau hay không?
Với kiểm định Wilcoxon ta xắp xếp hạng của các chênh lệch thành hai loại hạng dương
và hạng âm như sau:
Chuyên gia Chênh lệch điểm Hạng "+" Hạng "-"
Thống kê Wilconxon T nhận giá trị của tổng hạng nhỏ, ở đây T = 6
Với n là số chênh lệch khác không thống kê T là biến ngẫu nhiên có các đặc trưngnhư sau:
E(T) = 4
)1(n+
n
và Var(T) = 24
)12)(
n
j j j
Với n đủ lớn biến Z = ( )
)(
T Se
T E
Có thể tóm tắt kiểm định Wincoxon như sau:
Trang 17Cho hai mẫu ngẫu nhiên kích thước m Các quan sát ngẫu nhiên từ hai mẫu tạo thành cáccặp ngẫu nhiên (Xi, Yi) Gọi di = Xi - Yi là chênh lệch của các cặp giá trị quan sát, tập dichia thành ba nhóm: nhóm "+" gồm các di > 0; nhóm "-" gồm các di < 0 và nhóm còn lạitạm gọi là nhóm "không".
Xếp hạng riêng từng nhóm và tính hai tổng hạng của nhóm "+" và nhóm"-", cỏcgiỏ trị di bằng nhau tớnh hạng theo hạng trung bỡnh Gọi tj là số quan sỏt của cỏc nhúm
cú hạng bằng nhau
Thống kê Wilconxon- T nhận giá trị của tổng hạng nhỏ với các đặc trưng:
E(T) = 4
)1(n+
n
;
)12)(
n
j j j
)(
T Se
T E
T −
phân phối xấp xỉ chuẩn N(0,1)
Nếu Zqs < - uα , giả thuyết H0 bị bác bỏ
Chú ý rằng kiểm định này chỉ sử dụng cho mẫu lớn, thí dụ bằng số nói trên chỉ cótính chất mô tả phương pháp
Có thể sử dụng kiểm định dấu với các tính toán ở bảng sau:
Chuyên gia Sản phẩm c.sở I Sản phẩm c.sở II Chênh lệch Dấu
-Sử dụng kiểm định giá trị trung vị (0,5) ta có: H0: p = 0,5 với H1: p < 0,5
Số dấu khác không là n= 9, số dấu "+" là 3 Sử dụng phân phối nhị thức p = 0,5 n = 9 tacó: P(X<=3) = 0,2539
Như vậy giả thuyết H0 có thể đúng với mức xác suất 25,39% Nếu bác bỏ H0chúng ta chịu mức sai lầm loại 1 tương ứng với mức xác suất trên
Trang 18Thực tế kiểm định Wilcoxon được sử dụng không chỉ kiểm định tính đối xứngcủa hai mẫu, kiểm định này hoàn toàn có thể sử dụng để kiểm định quan hệ của hai biếnngẫu nhiên trong cùng một mẫu Về mục đích, kiểm định Wilcoxon trong trường hợp nàynhư kiểm định Khi bình phương, tuy nhiên kiểm định này dựa trên cơ sở kiểm định hạng.
Sau đây ta xem xét cách thực hiện kiểm định này trên SPSS
Với tệp GSS93 ta kiểm định giả thuyết số con của người được phỏng vấn và số anh chị
em ruột có quan hệ hay độc lập Kiểm định này thực chất là kiểm định tương quan của sốcon theo dòng tộc:
Chương trình chi tiết như sau
GET FILE='C:\Program Files\SPSS\GSS93 subset.sav'
Deviation Minimum Maximum
Wilcoxon Signed Ranks Test
Ranks
207 c 1491
Negative Ranks Positive Ranks Ties
Total
Number of Children Number of Brothers and Sisters
-N
Mean Rank
Sum of Ranks
Number of Children < Number of Brothers and Sisters
Trang 19T est St at ist ics b
-20.893 a 000
Z Asymp Sig (2-tailed)
Number of Children - Number
of Brothers and Sisters
Based on positive ranks.
2- Kiểm định tương quan hạng Spearman
Kiểm định tương quan hạng Spearman thường thực hiện với hai biến ngẫu nhiêntrên cùng một mẫu ngẫu nhiên nhiều chiều Hệ số tương quan hạng được thành lập vớimục đích đo quan hệ của hai biến (không nhất thiết là quan hệ tuyến tính) Như vậy, yêucầu đối với hai biến được kiểm định phải là hai biến định lượng hoặc hai biến có thang
đo thứ bậc như nhau
61
n i i
Thớ dụ 13: Xột một mẫu nhỏ từ GSS93subset với biến X là số anh chi em ruột và Y là
số con mong muốn của người được điều tra Có thể dùng kiểm định Spearman kết luậnhai biến này độc lập không? Biết số liệu quan sỏt là:
Trang 20X 0 2 3 7 1 2 3 4 2 4 1 1 3
Các tính toán cụ thể như sau
Hệ số tương quan Spearman tính được là: rs= 0,467 Giỏ trị tới hạn của
rs(25;0,05)= 0,3977 vậy chúng ta bác bỏ giả thuyết hai biến X, Y độc lập
3- Kiểm định Mann-Whitney
Khác với hai kiểm định trên, kiểm định Mann-Whitney được thiết lập để kiểmđịnh tính độc lập của hai mẫu bất kỳ (không yêu cầu cùng kích thước) Tuy nhiên, điểmkhông thay đổi ở đây là các biến là các biến định lượng hoặc biến có thang đo thứ bậcnhư nhau Giả thuyết được chọn có thể thay đổi theo mục đích phân tích, nhưng thôngthường đây là tiêu chuẩn kiểm định về sự thuần nhất của 2 mẫu (2 mẫu cựng tổng thể)hoặc đối với các giá trị trung tâm của các biến Vì vậy, đôi khi người ta vẫn sử dụng cho
Trang 21kiểm định sự khác biệt của một biến, theo các dấu hiệu như thủ tục phân tích phương sai(xem chương 6).
Thủ tục như sau:
Giả sử X và Y là hai biến ngẫu nhiên, với hai mẫu ngẫu nhiên kích thước nX và
nY
Trộn hai mẫu và tính hạng cho các quan sát i=1 n; (n= nx +ny)
Với mỗi biến X và Y tính tổng hạng riêng, ký hiệu RX, RY
U Se
U E
=+W m m n U
Kết quả là hai kiểm định tương đương nhau khi chuẩn hoá U và W
Thí dụ 14: Bảng sau đây cho số liệu về số con mong muốn của theo giới tính của người
được điều tra Phải chăng số con mong muốn của hai giới này độc lập với nhau?
Rank(F) 1.5 1.5 10 10 10 10 10 10 10 10 20,5 20,5 24,5
Trang 22Rank(M) 10 10 10 10 10 10 10 20,5 20,5 20,5 20,5 24,5
Tổng hạng: RF =148,5; RM =176,5 nF=13; nM=12
U =57,5; E(U)=78; Var(U)=322; S(U)= 17,94
|Zqs| = 1,1424Với mức ý nghĩa 5% cú thể kết luận về số con mong muốn có thể xem là những người được điều tra ở cùng một tổng thể (không có mong muốn khác nhau theo gới tính)
Thớ dụ 15: Kiểm định Mann-Whitney về số con của những người được phỏng vấn ở hai
mức học vấn khác nhau, được thực hiện nhờ SPSS như sau:
College Degree
No College degree College degree Total
Number of Children
N
Mean Rank
Sum of Ranks
Test St at ist ics a
163666.000 223697.000 -5.048 000
Mann-Whitney U Wilcoxon W Z
Asymp Sig (2-tailed)
Number of Children
Grouping Variable: College Degree
a
Trong kết quả này kiểm định Wilcoxon chỉ được tính trên mẫu 346 quan sát Kết luậncủa cả hai kiểm định như nhau, đó là: ở hai mức học vấn khác nhau số con không nhưnhau
4- Kiểm định Friedman về sự thuần nhất của k mẫu
Kiểm định Friedman là một kiểm định trên cơ sở hạng về sự thuần nhất của kmẫu hay nói cách khác nó kiểm tra giả thuyết cho rằng k biến ngẫu nhiên có cùng phânphối xác suất Trong nhiều trường hợp phân phối xác suất này không được xác địnhtrước