Các bước của việc kiểm định giả thiết thống kê...12 II... PHÂN CÔNG NHIỆM VỤ:- Đồng Thị Ngọc: Tìm hiểu về các khái niệm cơ bản + báo cáo - Lê Đức Nam: Mean Kiểm định kỳ vọng - Nguyễn Th
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
──────── * ───────
BÁO CÁO BÀI TẬP LỚN
QUÁ TRÌNH NGẪU NHIÊN
ỨNG DỤNG
thống kê và kiểm định giả thiết
Giáo viên hướng dẫn: PGS.TS Nguyễn Thị Hoàng Lan Sinh viên thực hiện : Đồng Thị Ngọc 20091900
Lê Đức Nam 20091827
Nguyễn Thanh Tú 20093199
Nguyễn Bá Toản 20092788
Đinh Trọng Liên 20091578
Lê Quốc Đạt 20090667
Bùi Yên Bình 20090225
Nguyễn Trường Thịnh 20092595
MỤC LỤC
Trang 2PHÂN CÔNG NHIỆM VỤ 3
Phần I Giới thiệu chung 4
I Khái niệm cơ bản 4
II Bài tập ứng dụng 7
Phần II Kiểm định 8
I Kiểm định kì vọng 8
Phần III Phương sai và kiểm định độc lập 9
I Kiểm định phương sai: 9
II Kiểm định tính độc lập: 10
1 Bài toán đặt ra: 10
2 Ví dụ: 10
Phần IV Phân Phối 11
I Phương pháp Kolmogoroff-Mirnov 11
II Phương pháp Chi- Squared 12
Phần V: Kiểm định phân phối 12
I Các bước của việc kiểm định giả thiết thống kê 12
II Kiểm định phân phối 13
III Ví dụ 13
Phần VI: Likelihood radio test 14
Phần VII: Bài tập 15
Phần VIII: Ứng dụng Matlab 16
1 Các hàm thường sử dụng: 16
2 Ví dụ 17
Trang 3PHÂN CÔNG NHIỆM VỤ:
- Đồng Thị Ngọc: Tìm hiểu về các khái niệm cơ bản + báo cáo
- Lê Đức Nam: Mean ( Kiểm định kỳ vọng)
- Nguyễn Thanh Tú : Phương Sai và Kiểm định độc lập
- Nguyễn Trường Thịnh : Phân phối
- Nguyễn Bá Toản : Kiểm định phân phối
- Đinh Trọng Liên : Likelihood ratio test
- Bùi Yên Bình: Bài tập
- Lê Quốc Đạt : Ứng dụng Matlab để làm
Trang 4Phần I Giới thiệu chung
Xác suất là một môn toán học phát triển trí óc và theo kiểu trừutượng, khó hiểu Nó là những dự đoán và suy luận cơ bản về thực tế.Thống kê dựa trên các áp dụng lý thuyết để giải quyết các vấn đề thưc tế
và nó là những dự đoán và diễn giải cơ bản dựa trên sự theo dõi và quansát thực tế
Thống kê gồm hai phần là analysis và design
lặp lại chính của việc thử đi thử lại xem các sự kiện xác suấtđược tiến gần tới 0 hoặc là 1 Đó là sự tiên quyết để suy ra việc
có thể chấp nhận gần với cái đúng nhất
các dữ liệu thu lượm và tạo ra được trong những thử nghiệm, nó
có thể miêu tả chính xác bởi kiểu xác suất Trong chương này,chúng ta sẽ mở đầu bằng các đối tượng cơ bản của toán học xácsuất
Chúng ta bắt đầu quan sát sự kết nối giữa khái niệm xác suất và thực
tế :
p ≅ n a
thành công trong n lần thử Chúng ta sử dụng các cách thức thử nghiệm đểlàm sáng tỏ sự liên kết của tất cả các khái niệm xác suất Ví dụ, chúng tađưa ra ý nghĩa của η của một RV x có thể xấp sỉ bởi giá trị trung bình
η=1
của các lần thử giá trị x i của x, và nó được thống kê F ( x ) bằngcác lần thử trước đây
Trang 5F ( x )= n x
n x là số các giá trị x i, Giá trị của hàm ^F ( x ) không lớn hơn 1 Mối quan hệ
chính của người thống kê là mang tới cho mọi người một kết quả chính xácnhất
Trong nghiên cứu thống kê, chúng ta giải quyết hai vấn đề cơ bản
o Vấn đề thứ nhất, chúng ta giả sử rằng giả thuyết thống kê làđúng và chúng ta muốn rằng làm được việc dự đoán một điều gì
một RV x và chúng ta muốn nó dự báo được giá trị trung bình
suất p của một sự kiện A và chúng ta muốn dự đoán được số lần
cả hai trường hợp chúng ta đều tiến hành theo mô hình (Fig 9
-1 a)
về đối tượng mà chúng ta ước lượng, hoặc là những giá trị đó
xu 1000 lần và nó hiện lên mặt ngửa 465 lần Sử dụng thông tin
đó, chúng ra sẽ có được ước lượng xác suất p xuất hiện mặt
ngửa xuất hiện ít hơn hoặc là quyết định là xác suất xảy ra hai
sự hiện là bằng nhau (theo giả thuyết) Trong cả hai trường hợp,
thì chúng ta đang tiến hành dựa trên sự quan sát (Fig 9-b).
Trong chương này, chúng ta sẽ tập trung vào ước lượng tham số
và kiểm tra lí thuyết Để chuẩn bị trước thì chúng ta sẽ tập trungchú thích một cách ngắn gọn các vấn đề dự đoán (Prediction)
Prediction: Chúng ta đưa ra một RV x cùng sự thống kê của nó và chúng ta muốn ước lượng giá trị của x ở một lần thử trong tương lai Một
cách ước lượng x là quyết định chọn một hằng số c sao cho tổng các giá trị
trong nhiều giá trị Có thể các giá trị đó ko thể nào dự đoán trước, nó chỉ
Trang 6có thể ước lượng được Vì vậy ước lượng của một RV x là dự đoán một giátrị tiếp theo của x dựa vào giá trị của c Nếu chúng ta sử dụng tiêu chuẩncho sự lựa chọn c ở mức độ nhỏ nhất có thể của độ lệch sai số MS E{(x -
o Một quá trình lấy rời rạc của x là một sự quyết định hai tham số
c1 và c2:
P{ c1 < x < c2 } = γ = 1- δ
nếu chúng ta dự đoán giá trị x của x ở lần thử tiếp theo thì nó sẽ nằm trong
0.99 Để có được sự dự đoán tối ưu, chúng ta cần phải thêm vào một giá trịvào γ để chúng ta xác định rõ c1 và c2 để cho khoảng cách c2 – c1 là nhỏ
của x một giá trị lớn nhất, c2 – c1 là nhỏ nhất nếu như f(c1)=f(c2) Tạo ra c1
Trang 7xứng Điều đó có nghĩa là η là giá trị trung bình bởi vì f(c1)=f(c2) thì sẽ đối
xứng Nếu x là chuẩn, thì x u = η + z u σlà tỉ lệ % chuẩn (Fig 9-2b)
Ví dụ 9-1 Tuổi thọ dự tính của pin là một mẫu chuẩn RV với η = 4
năm và σ = 6 tháng Xe ô tô dùng loại pin này Tìm cách dự đoán độ lệch
so với tuổi thọ chuẩn với γ = 0.95
Trong ví dụ này, δ = 0.05, Z 1−δ / 2 = Z0.975=2=−Zδ /2 Điều này tương
pin nằm trong khoảng 3 tới 5 năm
quả np Độ lệch ước lượng (k1,k2) xác định rõ độ lệch nhỏ nhấ của k2 – k1
đố tượng tham chiếu
P{k1<n a<k2}=γ
Chúng ta giả sử rằng n là lớn và γ = 0.997 Để tìm tham chiếu k1và k2, chúng ta đặt k =n a và ε=√pq/n
P{np−3√npq<n a<np+3√npq}=0.997
nó có nghĩa là na sẽ nằm trong khoảng np ± 3√npq
Ví dụ 2: Chúng ta tung đồng xu 100 lần và muốn dự đoán được số lần
k1=np−3√npq=35 k2=np−3√npq=65
Chúng ta dự đoán, vì vậy, cùng với hệ số 0.997 là số mặt ngửa nằm trong khoảng từ 35 tới 65
Các ví dụ trên đã làm rõ vai trò của thống kê trong các ứng dụng xác
β={35<n a<65}
suất P ( β )=0.997 Nếu như P ( β )≈ 1 chúng ta có thể gần chắc chắn rằng β sẽ xảy ra ở một quá trình thực tế Chúng ta có sự thay đổi suy nghĩ “chủ
để kết luận rằng β sẽ chắc chắn chính xác, dựa trên xác suất P ( β )≈ 1
Chú ý: Tuy nhiên thì cả hai kết luận trên đều được dự đoán một cách
ngẫu nhiên, điểm khác giữa chúng chỉ là định lượng mà thôi
Phần II Kiểm định
Trang 81 Bài toán đặt ra:
Đại lượng ngẫu nhiên X có trung bình E(X) = m chưa biết Người
ta đưa ra giả thiết:
H :m=m0(H :m≠ m´ 0)
1.1 Trường hợp 1:
n ≥ 30 hoặc (n<30 và X có phân phối chuẩn)
Chọn thống kê U =(X−m´ 0)√n
2 Ta tìm được miền bác bỏ:
Trong trường hợp này ta vẫn chọn thống kê như trên trong
đó độ lệch tiêu chuẩn như trên trường hợp 1 trong đó độ lệch
Trang 9Phần III Phương sai và kiểm định độc lập
1 Bài toán đặt ra:
Đại lượng ngẫu nhiên X có phân phối N(ɳ, σ ) Người ta đưa ra giả thiết:
¿)
2 Ta tìm được miền bác bỏ:
Trang 10Lấy mẫu cụ thể và tính giá trị quan sát q=¿ ∑
Trong trường hợp này ta vẫn chọn thống kê như trên trong đó kì
trung bình X´của mẫu ngẫu nhiên S '
1 Bài toán đặt ra:
Chúng ta kiểm định giả thiết với hai sự kiện B và C là độc lập
Giả thiết:
Giả sử xác suất của hai sự kiện b = P(B) và c = P(C) đã biết Ta áp dụng kiểm định chi bình phương để phân vùng các sự kiện :
Trong một trường đại học , tỷ lệ sinh viên năm thứ nhất là nam giới là
60 % còn tỷ lệ đó với toàn bộ sinh viên tốt nghiệp đại học là 75%.Chọn ngẫu nhiên các hồ sơ của 299 nam và 101 nữ cùng với 168 nam
và 68 nữ tốt nghiệp
Trang 11Kiểm tra giả thuyết H0 rằng các sự kiện B={male} and C={graduate}
400 p 0 i = 4.1
Vì X2
0.95(3) = 7.81 >4.1, chúng ta chấp nhận giả thiết H0
Phần IV Phân Phối
Trong ng d ng này c a lý thuy t ki m đ nh gi thuy t, gi ứng dụng này của lý thuyết kiểm định giả thuyết, giả ụng này của lý thuyết kiểm định giả thuyết, giả ủa lý thuyết kiểm định giả thuyết, giả ết kiểm định giả thuyết, giả ểm định giả thuyết, giả ịnh giả thuyết, giả ả thuyết, giả ết kiểm định giả thuyết, giả ả thuyết, giả thuy t Hết kiểm định giả thuyết, giả o không liên quan đ n tham s , hàm phân b F(x) c a m t ết kiểm định giả thuyết, giả ố, hàm phân bố F(x) của một ố, hàm phân bố F(x) của một ủa lý thuyết kiểm định giả thuyết, giả ột
bi n ng u nhiên x đết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F ược giả thiết bằng một hàm Fc gi thi t b ng m t hàm Fả thuyết, giả ết kiểm định giả thuyết, giả ằng một hàm F ột 0(x)
I Ph ương pháp Kolmogoroff-Mirnov ng pháp Kolmogoroff-Mirnov
Phương pháp ng pháp này được giả thiết bằng một hàm Fc th c hi n b ng vi c hình thành 1 quá ực hiện bằng việc hình thành 1 quá ện bằng việc hình thành 1 quá ằng một hàm F ện bằng việc hình thành 1 quá trình ng u nhiên có phân ph i £(x) đ d đoán v n đ và s d ng ẫu nhiên x được giả thiết bằng một hàm F ố, hàm phân bố F(x) của một ểm định giả thuyết, giả ực hiện bằng việc hình thành 1 quá ấn đề và sử dụng ề và sử dụng ử dụng ụng này của lý thuyết kiểm định giả thuyết, giả
đ ki m tra s li u th ng kê cho bi n ng u nhiên ểm định giả thuyết, giả ểm định giả thuyết, giả ố, hàm phân bố F(x) của một ện bằng việc hình thành 1 quá ố, hàm phân bố F(x) của một ết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F
q= maxx| £(x)-F0(x)|
s l a ch n này đực hiện bằng việc hình thành 1 quá ực hiện bằng việc hình thành 1 quá ọn này được giả thích như sau: với mỗi tham số ¥ cụ thể , £ ược giả thiết bằng một hàm Fc gi thích nh sau: v i m i tham s ¥ c th , £ả thuyết, giả ư ới mỗi tham số ¥ cụ thể , £ ỗi tham số ¥ cụ thể , £ ố, hàm phân bố F(x) của một ụng này của lý thuyết kiểm định giả thuyết, giả ểm định giả thuyết, giả ( x) có ưới mỗi tham số ¥ cụ thể , £ ược giả thiết bằng một hàm Fc l ng ph thu c vào F(x), và nó có xu hụng này của lý thuyết kiểm định giả thuyết, giả ột ưới mỗi tham số ¥ cụ thể , £ng ti n t i F(x) ết kiểm định giả thuyết, giả ới mỗi tham số ¥ cụ thể , £khi n ti n t i vô cùngết kiểm định giả thuyết, giả ới mỗi tham số ¥ cụ thể , £
Kì v ng E(£(x)) =F(x)ọn này được giả thích như sau: với mỗi tham số ¥ cụ thể , £
£(x)→F(x) khi n ti n t i vô cùngết kiểm định giả thuyết, giả ới mỗi tham số ¥ cụ thể , £
Quay l i v n đ ại vấn đề ấn đề và sử dụng ề và sử dụng
Bi n ng u nhiên q có th ti n v 0 n u Hết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F ểm định giả thuyết, giả ết kiểm định giả thuyết, giả ề và sử dụng ết kiểm định giả thuyết, giả 0 đúng và t i 1 giá tr ới mỗi tham số ¥ cụ thể , £ ịnh giả thuyết, giả F(x)-F0(x) n u Hết kiểm định giả thuyết, giả 1 đúng Đ ph nh n gi thuy t Hểm định giả thuyết, giả ủa lý thuyết kiểm định giả thuyết, giả ận giả thuyết H ả thuyết, giả ết kiểm định giả thuyết, giả 0 hay ch p nh n Hấn đề và sử dụng ận giả thuyết H 0
ta đi so sánh q v i m t h ng s c đi u này ph thu c vào m c ý nghĩaới mỗi tham số ¥ cụ thể , £ ột ằng một hàm F ố, hàm phân bố F(x) của một ề và sử dụng ụng này của lý thuyết kiểm định giả thuyết, giả ột ứng dụng này của lý thuyết kiểm định giả thuyết, giả
và phân ph i c a bi n ng u nhiên q theo gi thuy t Hố, hàm phân bố F(x) của một ủa lý thuyết kiểm định giả thuyết, giả ết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F ả thuyết, giả ết kiểm định giả thuyết, giả 0 chúng ta ki mểm định giả thuyết, giả tra bi n ng u nhiên q b ng cách thay q vào bi n ng u nhiên w trong ết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F ằng một hàm F ết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm Fcông th c (9.28) t c là q= maxứng dụng này của lý thuyết kiểm định giả thuyết, giả ứng dụng này của lý thuyết kiểm định giả thuyết, giả x|£(x)-F(x)|
S d ng k t qu phân ph i Kolmogoroff(9.29), chúng ta thu ử dụng ụng này của lý thuyết kiểm định giả thuyết, giả ết kiểm định giả thuyết, giả ả thuyết, giả ố, hàm phân bố F(x) của một
được giả thiết bằng một hàm Fc
=P (q>c|H
α =P (q>c|H 0)= 1-e−2 n e2
T đây có th k t lu n: Hình thành các s toán th c nghi m£(x) ừ đây có thể kết luận: Hình thành các sự toán thực nghiệm£(x) ểm định giả thuyết, giả ết kiểm định giả thuyết, giả ận giả thuyết H ực hiện bằng việc hình thành 1 quá ực hiện bằng việc hình thành 1 quá ện bằng việc hình thành 1 quá
c a F(x)và quy t đ nh q t công th c q=maxủa lý thuyết kiểm định giả thuyết, giả ết kiểm định giả thuyết, giả ịnh giả thuyết, giả ừ đây có thể kết luận: Hình thành các sự toán thực nghiệm£(x) ứng dụng này của lý thuyết kiểm định giả thuyết, giả x||£(x)-F(x)|
Trang 12Ho được giả thiết bằng một hàm Fc ch p nh n n u q>ấn đề và sử dụng ận giả thuyết H ết kiểm định giả thuyết, giả √−ln (α
2)
2n
II Ph ương pháp Kolmogoroff-Mirnov ng pháp Chi- Squared
Phương pháp ng pháp này s d ng ki m tra th ng kê Pearson Và th c ử dụng ụng này của lý thuyết kiểm định giả thuyết, giả ểm định giả thuyết, giả ố, hàm phân bố F(x) của một ực hiện bằng việc hình thành 1 quá
hi n nh sauện bằng việc hình thành 1 quá ư
Đ a ra các ph n vùng U=[ Aư ần vùng U=[ A 1,…… ,Am] c a không gian P và mu n ủa lý thuyết kiểm định giả thuyết, giả ố, hàm phân bố F(x) của một
ki m tra gi thuy t các xác su t pểm định giả thuyết, giả ả thuyết, giả ết kiểm định giả thuyết, giả ấn đề và sử dụng i=P(Ai)c a s ki n Aủa lý thuyết kiểm định giả thuyết, giả ực hiện bằng việc hình thành 1 quá ện bằng việc hình thành 1 quá i b ng m cho ằng một hàm F
h ng s pằng một hàm F ố, hàm phân bố F(x) của một oi:
H0: pi=p0i v i m i i ới mỗi tham số ¥ cụ thể , £ ọn này được giả thích như sau: với mỗi tham số ¥ cụ thể , £
ngược giả thiết bằng một hàm F ại vấn đề c l i H1: pi≠p0i v i 1 vài giá tr c a iới mỗi tham số ¥ cụ thể , £ ịnh giả thuyết, giả ủa lý thuyết kiểm định giả thuyết, giả
d li u đ u vào là s l n th thành công kữ liệu đầu vào là số lần thử thành công k ện bằng việc hình thành 1 quá ần vùng U=[ A ố, hàm phân bố F(x) của một ần vùng U=[ A ử dụng i trong n l n th c a m i ần vùng U=[ A ử dụng ủa lý thuyết kiểm định giả thuyết, giả ỗi tham số ¥ cụ thể , £
s ki n Aực hiện bằng việc hình thành 1 quá ện bằng việc hình thành 1 quá i
Xét bi n ng u nhiên q=ết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F ∑
Đ tìm c, chúng ta ph i xác đ nh đểm định giả thuyết, giả ả thuyết, giả ịnh giả thuyết, giả ược giả thiết bằng một hàm Fc phân ph i c a q chúng ta ố, hàm phân bố F(x) của một ủa lý thuyết kiểm định giả thuyết, giả
sẽ đi tìm theo hưới mỗi tham số ¥ cụ thể , £ng gi đ nh n l n V i gi đ nh nh v y , bi n ng u ả thuyết, giả ịnh giả thuyết, giả ới mỗi tham số ¥ cụ thể , £ ới mỗi tham số ¥ cụ thể , £ ả thuyết, giả ịnh giả thuyết, giả ư ận giả thuyết H ết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm Fnhiên k là g n v i phân ph i chu n v i kì v ng là kpần vùng U=[ A ới mỗi tham số ¥ cụ thể , £ ố, hàm phân bố F(x) của một ẩn với kì vọng là kp ới mỗi tham số ¥ cụ thể , £ ọn này được giả thích như sau: với mỗi tham số ¥ cụ thể , £ i theo gi thuy t ả thuyết, giả ết kiểm định giả thuyết, giả
H0, bi n ng u nhiên q có phân ph i Xết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F ố, hàm phân bố F(x) của một 2(m-1),trên th c t , v i h ng s ực hiện bằng việc hình thành 1 quá ết kiểm định giả thuyết, giả ới mỗi tham số ¥ cụ thể , £ ằng một hàm F ố, hàm phân bố F(x) của một
Phương pháp ng pháp Chi-Square được giả thiết bằng một hàm F ử dụng ụng này của lý thuyết kiểm định giả thuyết, giả c s d ng trong vi c ki m đ nh ện bằng việc hình thành 1 quá ểm định giả thuyết, giả ịnh giả thuyết, giả
nh ng ki m tra liên quan đ n th a thu n các mô hình í thuy t v i ữ liệu đầu vào là số lần thử thành công k ểm định giả thuyết, giả ết kiểm định giả thuyết, giả ỏa mãn ận giả thuyết H ết kiểm định giả thuyết, giả ới mỗi tham số ¥ cụ thể , £
th c nghi m.ực hiện bằng việc hình thành 1 quá ện bằng việc hình thành 1 quá
Bài t p ng d ng: ập ứng dụng: ứng dụng: ụng:
Th nghi m 300 l n và quan sát th y r ng f có kử dụng ện bằng việc hình thành 1 quá ần vùng U=[ A ấn đề và sử dụng ằng một hàm F i= 55 43 44 61 40 57 l n ần vùng U=[ A
ki m tra gi thi t v i đ chính xác ểm định giả thuyết, giả ả thuyết, giả ết kiểm định giả thuyết, giả ới mỗi tham số ¥ cụ thể , £ ọn này được giả thích như sau: với mỗi tham số ¥ cụ thể , £ α =P (q>c|H=0.05 có p0i=1/6, m=6, và npoi=50.Thay nó vào công th c (9.75 )ta thu đứng dụng này của lý thuyết kiểm định giả thuyết, giả ược giả thiết bằng một hàm Fc q=7.6 do χ2
0.95= 11.07 >7.6 nênchúng ta ch p nh n gi thi tấn đề và sử dụng ận giả thuyết H ả thuyết, giả ết kiểm định giả thuyết, giả
Phần V: Kiểm định phân phối