1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu tổng quan về phương pháp thống kê và kiểm định giả thiết

22 611 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 22
Dung lượng 372,45 KB

Nội dung

Các bước của việc kiểm định giả thiết thống kê...12 II... PHÂN CÔNG NHIỆM VỤ:- Đồng Thị Ngọc: Tìm hiểu về các khái niệm cơ bản + báo cáo - Lê Đức Nam: Mean Kiểm định kỳ vọng - Nguyễn Th

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

──────── * ───────

BÁO CÁO BÀI TẬP LỚN

QUÁ TRÌNH NGẪU NHIÊN

ỨNG DỤNG

thống kê và kiểm định giả thiết

Giáo viên hướng dẫn: PGS.TS Nguyễn Thị Hoàng Lan Sinh viên thực hiện : Đồng Thị Ngọc 20091900

Lê Đức Nam 20091827

Nguyễn Thanh Tú 20093199

Nguyễn Bá Toản 20092788

Đinh Trọng Liên 20091578

Lê Quốc Đạt 20090667

Bùi Yên Bình 20090225

Nguyễn Trường Thịnh 20092595

MỤC LỤC

Trang 2

PHÂN CÔNG NHIỆM VỤ 3

Phần I Giới thiệu chung 4

I Khái niệm cơ bản 4

II Bài tập ứng dụng 7

Phần II Kiểm định 8

I Kiểm định kì vọng 8

Phần III Phương sai và kiểm định độc lập 9

I Kiểm định phương sai: 9

II Kiểm định tính độc lập: 10

1 Bài toán đặt ra: 10

2 Ví dụ: 10

Phần IV Phân Phối 11

I Phương pháp Kolmogoroff-Mirnov 11

II Phương pháp Chi- Squared 12

Phần V: Kiểm định phân phối 12

I Các bước của việc kiểm định giả thiết thống kê 12

II Kiểm định phân phối 13

III Ví dụ 13

Phần VI: Likelihood radio test 14

Phần VII: Bài tập 15

Phần VIII: Ứng dụng Matlab 16

1 Các hàm thường sử dụng: 16

2 Ví dụ 17

Trang 3

PHÂN CÔNG NHIỆM VỤ:

- Đồng Thị Ngọc: Tìm hiểu về các khái niệm cơ bản + báo cáo

- Lê Đức Nam: Mean ( Kiểm định kỳ vọng)

- Nguyễn Thanh Tú : Phương Sai và Kiểm định độc lập

- Nguyễn Trường Thịnh : Phân phối

- Nguyễn Bá Toản : Kiểm định phân phối

- Đinh Trọng Liên : Likelihood ratio test

- Bùi Yên Bình: Bài tập

- Lê Quốc Đạt : Ứng dụng Matlab để làm

Trang 4

Phần I Giới thiệu chung

Xác suất là một môn toán học phát triển trí óc và theo kiểu trừutượng, khó hiểu Nó là những dự đoán và suy luận cơ bản về thực tế.Thống kê dựa trên các áp dụng lý thuyết để giải quyết các vấn đề thưc tế

và nó là những dự đoán và diễn giải cơ bản dựa trên sự theo dõi và quansát thực tế

Thống kê gồm hai phần là analysis và design

lặp lại chính của việc thử đi thử lại xem các sự kiện xác suấtđược tiến gần tới 0 hoặc là 1 Đó là sự tiên quyết để suy ra việc

có thể chấp nhận gần với cái đúng nhất

các dữ liệu thu lượm và tạo ra được trong những thử nghiệm, nó

có thể miêu tả chính xác bởi kiểu xác suất Trong chương này,chúng ta sẽ mở đầu bằng các đối tượng cơ bản của toán học xácsuất

Chúng ta bắt đầu quan sát sự kết nối giữa khái niệm xác suất và thực

tế :

p ≅ n a

thành công trong n lần thử Chúng ta sử dụng các cách thức thử nghiệm đểlàm sáng tỏ sự liên kết của tất cả các khái niệm xác suất Ví dụ, chúng tađưa ra ý nghĩa của η của một RV x có thể xấp sỉ bởi giá trị trung bình

η=1

của các lần thử giá trị x i của x, và nó được thống kê F ( x ) bằngcác lần thử trước đây

Trang 5

F ( x )= n x

n x là số các giá trị x i, Giá trị của hàm ^F ( x ) không lớn hơn 1 Mối quan hệ

chính của người thống kê là mang tới cho mọi người một kết quả chính xácnhất

Trong nghiên cứu thống kê, chúng ta giải quyết hai vấn đề cơ bản

o Vấn đề thứ nhất, chúng ta giả sử rằng giả thuyết thống kê làđúng và chúng ta muốn rằng làm được việc dự đoán một điều gì

một RV x và chúng ta muốn nó dự báo được giá trị trung bình

suất p của một sự kiện A và chúng ta muốn dự đoán được số lần

cả hai trường hợp chúng ta đều tiến hành theo mô hình (Fig 9

-1 a)

về đối tượng mà chúng ta ước lượng, hoặc là những giá trị đó

xu 1000 lần và nó hiện lên mặt ngửa 465 lần Sử dụng thông tin

đó, chúng ra sẽ có được ước lượng xác suất p xuất hiện mặt

ngửa xuất hiện ít hơn hoặc là quyết định là xác suất xảy ra hai

sự hiện là bằng nhau (theo giả thuyết) Trong cả hai trường hợp,

thì chúng ta đang tiến hành dựa trên sự quan sát (Fig 9-b).

Trong chương này, chúng ta sẽ tập trung vào ước lượng tham số

và kiểm tra lí thuyết Để chuẩn bị trước thì chúng ta sẽ tập trungchú thích một cách ngắn gọn các vấn đề dự đoán (Prediction)

Prediction: Chúng ta đưa ra một RV x cùng sự thống kê của nó và chúng ta muốn ước lượng giá trị của x ở một lần thử trong tương lai Một

cách ước lượng x là quyết định chọn một hằng số c sao cho tổng các giá trị

trong nhiều giá trị Có thể các giá trị đó ko thể nào dự đoán trước, nó chỉ

Trang 6

có thể ước lượng được Vì vậy ước lượng của một RV x là dự đoán một giátrị tiếp theo của x dựa vào giá trị của c Nếu chúng ta sử dụng tiêu chuẩncho sự lựa chọn c ở mức độ nhỏ nhất có thể của độ lệch sai số MS E{(x -

o Một quá trình lấy rời rạc của x là một sự quyết định hai tham số

c1 và c2:

P{ c1 < x < c2 } = γ = 1- δ

nếu chúng ta dự đoán giá trị x của x ở lần thử tiếp theo thì nó sẽ nằm trong

0.99 Để có được sự dự đoán tối ưu, chúng ta cần phải thêm vào một giá trịvào γ để chúng ta xác định rõ c1 và c2 để cho khoảng cách c2 – c1 là nhỏ

của x một giá trị lớn nhất, c2 – c1 là nhỏ nhất nếu như f(c1)=f(c2) Tạo ra c1

Trang 7

xứng Điều đó có nghĩa là η là giá trị trung bình bởi vì f(c1)=f(c2) thì sẽ đối

xứng Nếu x là chuẩn, thì x u = η + z u σlà tỉ lệ % chuẩn (Fig 9-2b)

Ví dụ 9-1 Tuổi thọ dự tính của pin là một mẫu chuẩn RV với η = 4

năm và σ = 6 tháng Xe ô tô dùng loại pin này Tìm cách dự đoán độ lệch

so với tuổi thọ chuẩn với γ = 0.95

Trong ví dụ này, δ = 0.05, Z 1−δ / 2 = Z0.975=2=−Zδ /2 Điều này tương

pin nằm trong khoảng 3 tới 5 năm

quả np Độ lệch ước lượng (k1,k2) xác định rõ độ lệch nhỏ nhấ của k2 – k1

đố tượng tham chiếu

P{k1<n a<k2}=γ

Chúng ta giả sử rằng n là lớn và γ = 0.997 Để tìm tham chiếu k1và k2, chúng ta đặt k =n a và ε=pq/n

P{np−3npq<n a<np+3npq}=0.997

nó có nghĩa là na sẽ nằm trong khoảng np ± 3npq

Ví dụ 2: Chúng ta tung đồng xu 100 lần và muốn dự đoán được số lần

k1=np−3npq=35 k2=np−3npq=65

Chúng ta dự đoán, vì vậy, cùng với hệ số 0.997 là số mặt ngửa nằm trong khoảng từ 35 tới 65

Các ví dụ trên đã làm rõ vai trò của thống kê trong các ứng dụng xác

β={35<n a<65}

suất P ( β )=0.997 Nếu như P ( β )≈ 1 chúng ta có thể gần chắc chắn rằng β sẽ xảy ra ở một quá trình thực tế Chúng ta có sự thay đổi suy nghĩ “chủ

để kết luận rằng β sẽ chắc chắn chính xác, dựa trên xác suất P ( β )≈ 1

Chú ý: Tuy nhiên thì cả hai kết luận trên đều được dự đoán một cách

ngẫu nhiên, điểm khác giữa chúng chỉ là định lượng mà thôi

Phần II Kiểm định

Trang 8

1 Bài toán đặt ra:

Đại lượng ngẫu nhiên X có trung bình E(X) = m chưa biết Người

ta đưa ra giả thiết:

H :m=m0(H :m≠ m´ 0)

1.1 Trường hợp 1:

n ≥ 30 hoặc (n<30X có phân phối chuẩn)

Chọn thống kê U =(X−m´ 0)√n

2 Ta tìm được miền bác bỏ:

Trong trường hợp này ta vẫn chọn thống kê như trên trong

đó độ lệch tiêu chuẩn như trên trường hợp 1 trong đó độ lệch

Trang 9

Phần III Phương sai và kiểm định độc lập

1 Bài toán đặt ra:

Đại lượng ngẫu nhiên X có phân phối N(ɳ, σ ) Người ta đưa ra giả thiết:

¿)

2 Ta tìm được miền bác bỏ:

Trang 10

Lấy mẫu cụ thể và tính giá trị quan sát q=¿ ∑

Trong trường hợp này ta vẫn chọn thống kê như trên trong đó kì

trung bình X´của mẫu ngẫu nhiên S '

1 Bài toán đặt ra:

Chúng ta kiểm định giả thiết với hai sự kiện B và C là độc lập

Giả thiết:

Giả sử xác suất của hai sự kiện b = P(B) và c = P(C) đã biết Ta áp dụng kiểm định chi bình phương để phân vùng các sự kiện :

Trong một trường đại học , tỷ lệ sinh viên năm thứ nhất là nam giới là

60 % còn tỷ lệ đó với toàn bộ sinh viên tốt nghiệp đại học là 75%.Chọn ngẫu nhiên các hồ sơ của 299 nam và 101 nữ cùng với 168 nam

và 68 nữ tốt nghiệp

Trang 11

Kiểm tra giả thuyết H0 rằng các sự kiện B={male} and C={graduate}

400 p 0 i = 4.1

Vì X2

0.95(3) = 7.81 >4.1, chúng ta chấp nhận giả thiết H0

Phần IV Phân Phối

Trong ng d ng này c a lý thuy t ki m đ nh gi thuy t, gi ứng dụng này của lý thuyết kiểm định giả thuyết, giả ụng này của lý thuyết kiểm định giả thuyết, giả ủa lý thuyết kiểm định giả thuyết, giả ết kiểm định giả thuyết, giả ểm định giả thuyết, giả ịnh giả thuyết, giả ả thuyết, giả ết kiểm định giả thuyết, giả ả thuyết, giả thuy t Hết kiểm định giả thuyết, giả o không liên quan đ n tham s , hàm phân b F(x) c a m t ết kiểm định giả thuyết, giả ố, hàm phân bố F(x) của một ố, hàm phân bố F(x) của một ủa lý thuyết kiểm định giả thuyết, giả ột

bi n ng u nhiên x đết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F ược giả thiết bằng một hàm Fc gi thi t b ng m t hàm Fả thuyết, giả ết kiểm định giả thuyết, giả ằng một hàm F ột 0(x)

I Ph ương pháp Kolmogoroff-Mirnov ng pháp Kolmogoroff-Mirnov

Phương pháp ng pháp này được giả thiết bằng một hàm Fc th c hi n b ng vi c hình thành 1 quá ực hiện bằng việc hình thành 1 quá ện bằng việc hình thành 1 quá ằng một hàm F ện bằng việc hình thành 1 quá trình ng u nhiên có phân ph i £(x) đ d đoán v n đ và s d ng ẫu nhiên x được giả thiết bằng một hàm F ố, hàm phân bố F(x) của một ểm định giả thuyết, giả ực hiện bằng việc hình thành 1 quá ấn đề và sử dụng ề và sử dụng ử dụng ụng này của lý thuyết kiểm định giả thuyết, giả

đ ki m tra s li u th ng kê cho bi n ng u nhiên ểm định giả thuyết, giả ểm định giả thuyết, giả ố, hàm phân bố F(x) của một ện bằng việc hình thành 1 quá ố, hàm phân bố F(x) của một ết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F

q= maxx| £(x)-F0(x)|

s l a ch n này đực hiện bằng việc hình thành 1 quá ực hiện bằng việc hình thành 1 quá ọn này được giả thích như sau: với mỗi tham số ¥ cụ thể , £ ược giả thiết bằng một hàm Fc gi thích nh sau: v i m i tham s ¥ c th , £ả thuyết, giả ư ới mỗi tham số ¥ cụ thể , £ ỗi tham số ¥ cụ thể , £ ố, hàm phân bố F(x) của một ụng này của lý thuyết kiểm định giả thuyết, giả ểm định giả thuyết, giả ( x) có ưới mỗi tham số ¥ cụ thể , £ ược giả thiết bằng một hàm Fc l ng ph thu c vào F(x), và nó có xu hụng này của lý thuyết kiểm định giả thuyết, giả ột ưới mỗi tham số ¥ cụ thể , £ng ti n t i F(x) ết kiểm định giả thuyết, giả ới mỗi tham số ¥ cụ thể , £khi n ti n t i vô cùngết kiểm định giả thuyết, giả ới mỗi tham số ¥ cụ thể , £

Kì v ng E(£(x)) =F(x)ọn này được giả thích như sau: với mỗi tham số ¥ cụ thể , £

£(x)→F(x) khi n ti n t i vô cùngết kiểm định giả thuyết, giả ới mỗi tham số ¥ cụ thể , £

Quay l i v n đ ại vấn đề ấn đề và sử dụng ề và sử dụng

Bi n ng u nhiên q có th ti n v 0 n u Hết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F ểm định giả thuyết, giả ết kiểm định giả thuyết, giả ề và sử dụng ết kiểm định giả thuyết, giả 0 đúng và t i 1 giá tr ới mỗi tham số ¥ cụ thể , £ ịnh giả thuyết, giả F(x)-F0(x) n u Hết kiểm định giả thuyết, giả 1 đúng Đ ph nh n gi thuy t Hểm định giả thuyết, giả ủa lý thuyết kiểm định giả thuyết, giả ận giả thuyết H ả thuyết, giả ết kiểm định giả thuyết, giả 0 hay ch p nh n Hấn đề và sử dụng ận giả thuyết H 0

ta đi so sánh q v i m t h ng s c đi u này ph thu c vào m c ý nghĩaới mỗi tham số ¥ cụ thể , £ ột ằng một hàm F ố, hàm phân bố F(x) của một ề và sử dụng ụng này của lý thuyết kiểm định giả thuyết, giả ột ứng dụng này của lý thuyết kiểm định giả thuyết, giả

và phân ph i c a bi n ng u nhiên q theo gi thuy t Hố, hàm phân bố F(x) của một ủa lý thuyết kiểm định giả thuyết, giả ết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F ả thuyết, giả ết kiểm định giả thuyết, giả 0 chúng ta ki mểm định giả thuyết, giả tra bi n ng u nhiên q b ng cách thay q vào bi n ng u nhiên w trong ết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F ằng một hàm F ết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm Fcông th c (9.28) t c là q= maxứng dụng này của lý thuyết kiểm định giả thuyết, giả ứng dụng này của lý thuyết kiểm định giả thuyết, giả x|£(x)-F(x)|

S d ng k t qu phân ph i Kolmogoroff(9.29), chúng ta thu ử dụng ụng này của lý thuyết kiểm định giả thuyết, giả ết kiểm định giả thuyết, giả ả thuyết, giả ố, hàm phân bố F(x) của một

được giả thiết bằng một hàm Fc

=P (q>c|H

α =P (q>c|H 0)= 1-e−2 n e2

T đây có th k t lu n: Hình thành các s toán th c nghi m£(x) ừ đây có thể kết luận: Hình thành các sự toán thực nghiệm£(x) ểm định giả thuyết, giả ết kiểm định giả thuyết, giả ận giả thuyết H ực hiện bằng việc hình thành 1 quá ực hiện bằng việc hình thành 1 quá ện bằng việc hình thành 1 quá

c a F(x)và quy t đ nh q t công th c q=maxủa lý thuyết kiểm định giả thuyết, giả ết kiểm định giả thuyết, giả ịnh giả thuyết, giả ừ đây có thể kết luận: Hình thành các sự toán thực nghiệm£(x) ứng dụng này của lý thuyết kiểm định giả thuyết, giả x||£(x)-F(x)|

Trang 12

Ho được giả thiết bằng một hàm Fc ch p nh n n u q>ấn đề và sử dụng ận giả thuyết H ết kiểm định giả thuyết, giả √−ln ⁡(α

2)

2n

II Ph ương pháp Kolmogoroff-Mirnov ng pháp Chi- Squared

Phương pháp ng pháp này s d ng ki m tra th ng kê Pearson Và th c ử dụng ụng này của lý thuyết kiểm định giả thuyết, giả ểm định giả thuyết, giả ố, hàm phân bố F(x) của một ực hiện bằng việc hình thành 1 quá

hi n nh sauện bằng việc hình thành 1 quá ư

Đ a ra các ph n vùng U=[ Aư ần vùng U=[ A 1,…… ,Am] c a không gian P và mu n ủa lý thuyết kiểm định giả thuyết, giả ố, hàm phân bố F(x) của một

ki m tra gi thuy t các xác su t pểm định giả thuyết, giả ả thuyết, giả ết kiểm định giả thuyết, giả ấn đề và sử dụng i=P(Ai)c a s ki n Aủa lý thuyết kiểm định giả thuyết, giả ực hiện bằng việc hình thành 1 quá ện bằng việc hình thành 1 quá i b ng m cho ằng một hàm F

h ng s pằng một hàm F ố, hàm phân bố F(x) của một oi:

H0: pi=p0i v i m i i ới mỗi tham số ¥ cụ thể , £ ọn này được giả thích như sau: với mỗi tham số ¥ cụ thể , £

ngược giả thiết bằng một hàm F ại vấn đề c l i H1: pi≠p0i v i 1 vài giá tr c a iới mỗi tham số ¥ cụ thể , £ ịnh giả thuyết, giả ủa lý thuyết kiểm định giả thuyết, giả

d li u đ u vào là s l n th thành công kữ liệu đầu vào là số lần thử thành công k ện bằng việc hình thành 1 quá ần vùng U=[ A ố, hàm phân bố F(x) của một ần vùng U=[ A ử dụng i trong n l n th c a m i ần vùng U=[ A ử dụng ủa lý thuyết kiểm định giả thuyết, giả ỗi tham số ¥ cụ thể , £

s ki n Aực hiện bằng việc hình thành 1 quá ện bằng việc hình thành 1 quá i

Xét bi n ng u nhiên q=ết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F ∑

Đ tìm c, chúng ta ph i xác đ nh đểm định giả thuyết, giả ả thuyết, giả ịnh giả thuyết, giả ược giả thiết bằng một hàm Fc phân ph i c a q chúng ta ố, hàm phân bố F(x) của một ủa lý thuyết kiểm định giả thuyết, giả

sẽ đi tìm theo hưới mỗi tham số ¥ cụ thể , £ng gi đ nh n l n V i gi đ nh nh v y , bi n ng u ả thuyết, giả ịnh giả thuyết, giả ới mỗi tham số ¥ cụ thể , £ ới mỗi tham số ¥ cụ thể , £ ả thuyết, giả ịnh giả thuyết, giả ư ận giả thuyết H ết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm Fnhiên k là g n v i phân ph i chu n v i kì v ng là kpần vùng U=[ A ới mỗi tham số ¥ cụ thể , £ ố, hàm phân bố F(x) của một ẩn với kì vọng là kp ới mỗi tham số ¥ cụ thể , £ ọn này được giả thích như sau: với mỗi tham số ¥ cụ thể , £ i theo gi thuy t ả thuyết, giả ết kiểm định giả thuyết, giả

H0, bi n ng u nhiên q có phân ph i Xết kiểm định giả thuyết, giả ẫu nhiên x được giả thiết bằng một hàm F ố, hàm phân bố F(x) của một 2(m-1),trên th c t , v i h ng s ực hiện bằng việc hình thành 1 quá ết kiểm định giả thuyết, giả ới mỗi tham số ¥ cụ thể , £ ằng một hàm F ố, hàm phân bố F(x) của một

Phương pháp ng pháp Chi-Square được giả thiết bằng một hàm F ử dụng ụng này của lý thuyết kiểm định giả thuyết, giả c s d ng trong vi c ki m đ nh ện bằng việc hình thành 1 quá ểm định giả thuyết, giả ịnh giả thuyết, giả

nh ng ki m tra liên quan đ n th a thu n các mô hình í thuy t v i ữ liệu đầu vào là số lần thử thành công k ểm định giả thuyết, giả ết kiểm định giả thuyết, giả ỏa mãn ận giả thuyết H ết kiểm định giả thuyết, giả ới mỗi tham số ¥ cụ thể , £

th c nghi m.ực hiện bằng việc hình thành 1 quá ện bằng việc hình thành 1 quá

Bài t p ng d ng: ập ứng dụng: ứng dụng: ụng:

Th nghi m 300 l n và quan sát th y r ng f có kử dụng ện bằng việc hình thành 1 quá ần vùng U=[ A ấn đề và sử dụng ằng một hàm F i= 55 43 44 61 40 57 l n ần vùng U=[ A

ki m tra gi thi t v i đ chính xác ểm định giả thuyết, giả ả thuyết, giả ết kiểm định giả thuyết, giả ới mỗi tham số ¥ cụ thể , £ ọn này được giả thích như sau: với mỗi tham số ¥ cụ thể , £ α =P (q>c|H=0.05 có p0i=1/6, m=6, và npoi=50.Thay nó vào công th c (9.75 )ta thu đứng dụng này của lý thuyết kiểm định giả thuyết, giả ược giả thiết bằng một hàm Fc q=7.6 do χ2

0.95= 11.07 >7.6 nênchúng ta ch p nh n gi thi tấn đề và sử dụng ận giả thuyết H ả thuyết, giả ết kiểm định giả thuyết, giả

Phần V: Kiểm định phân phối

Ngày đăng: 15/01/2016, 16:41

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w