Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 21 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
21
Dung lượng
373,5 KB
Nội dung
Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê Bài Giảng Môn học Xác Suất và Thống Kê Nguyễn Văn Thìn Khoa Toán - Tin Học Đại Học Khoa Học Khoa Học Tự Nhiên Tp.HCM Ngày 4 tháng 9 năm 2011 Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê Nội dung Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê Kiểm định giả thiết về trung bình của tổng thể. Kiểm định giả thiết về tỷ lệ của tổng thể. Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê Bài toán kiểm định giả thiết thống kê. Định nghĩa (Giả thiết thống kê, kiểm định giả thiết thống kê) Giả thiết thống kê là những giả thiết nói về các tham số, dạng quy luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên. Việc tìm ra kết luận bác bỏ hay chấp nhận một giả thiết gọi là kiểm định giả thiết thống kê Ví dụ Trong một báo cáo nói rằng: thu nhập bình quân của những người làm trong ngành thư viện ở Việt Nam là 7 triệu đồng một tháng thì ta có thể coi đó là một giả thiết thống kê, giả thiết này nói về một tham số (kỳ vọng) của biến ngẫu nhiên X biểu thị mức lương của những người làm trong ngành thư viện. Dựa vào số liệu của một mẫu điều tra về thu nhập và quy tắc kiểm định để đưa một kết luận là bác bỏ hay chấp nhận giả thiết nói trên. Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê Cách đặt giả thiết. 1 Giả thiết được đặt ra với ý đồ bác bỏ nó, nghĩa là giả thiết đặt ra ngược lại với điều ta muốn chứng minh,muốn thuyết phục. 2 Giả thiết được đặt ra sao cho khi chấp nhận hay bác bỏ nó sẽ có tác dụng trả lời mà bài toán thực tế đặt ra. 3 Giả thiết được đặt ra nếu nó đúng thì ta sẽ xác định được qui luật phân phối xác suất của đại lượng ngẫu nhiên được chọn làm tiêu chuẩn kiểm định. 4 Khi đặt giả thiết ta thường so sánh cái chưa biết với cái đã biết. Cái chưa biết là điều mà ta cần kiểm định, kiểm tra, làm rõ. "Cái đã biết" mà ta nói ở đây thường là những thông tin quá khứ, các định mức kinh tế, kỹ thuật. 5 Giả thiết đặt ra thường mang ý nghĩa: "không khác nhau", hoặc "khác mà không có ý nghĩa" hoặc "bằng nhau". Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê Giả thiết không và đối thiết Giả thiết cần kiểm định được gọi là Giả thiết không ký hiệu H 0 . Một mệnh đề đối lập với H 0 được gọi là Giả thiết đối (Đối thiết) và được ký hiệu là H 1 . Ví dụ H 0 : θ = θ 0 ; H 1 : θ = θ 0 Nếu ta kiểm định giả thiết với đối thiết dạng như trên thì kiểm định được gọi là kiểm định giả thiết hai phía. Nếu kiểm định giả thiết với đối thiết có dạng H 1 : θ > θ 0 hoặc H 1 : θ < θ 0 thì kiểm định được gọi là kiểm định giả thiết một phía. Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê Tiêu chuẩn kiểm định. Xuất phát từ yêu cầu của bài toán thực tế , ta nêu ra giả thiết H 0 và đối thiết của nó. Giả sử rằng H 0 đúng, từ đó tìm một biến cố có xác suất đủ bé để có thể tin rằng biến cố đó hầu như không thể xảy ra trong một phép thử. Muốn vậy từ mẫu ngẫu nhiên (X 1 , X 2 , , X n ) ta chọn Z = f (X 1 , , X n , θ 0 ) sao cho: Nếu H 0 đúng thì ta sẽ xác định được quy luật phân phối xác suất của Z và với mẫu cụ thể ta có thể tính được giá trị của Z. Đại lượng ngẫu nhiên Z được gọi là Tiêu chuẩn kiểm định giả thiết H 0 . Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê Miền bác bỏ, mức ý nghĩa. Do quy luật phân phối xác suất của Z đã biết nên với α bé tùy ý ta có thể tìm được miền W α sao cho P(Z ∈ W α ) = α. Miền W α được gọi là miền bác bỏ giả thiết H 0 và α được gọi là mức ý nghĩa của kiểm định. Thực hiện một phép thử đối với mẫu ngẫu nhiên (X 1 , , X n ) ta thu được mẫu cụ thể (x 1 , , x n ). Từ mẫu cụ thể này ta tính được giá trị của Z (ký hiệu là z) và gọi là giá trị thực nghiệm z = f (x 1 , , x n , θ 0 ). • Nếu z ∈ W α thì ta bác bỏ giả thiết H 0 , thừa nhận H 1 . • Nếu z /∈ W α thì ta chấp nhận H 0 . Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê Sai lầm loại 1 và sai lầm loại 2. Khi kiểm định giả thiết thống kê, chúng ta có thể mắc phải một trong hai loại sai lầm sau đây: a Sai lầm loại 1: Là sai lầm mắc phải khi ta bác bỏ giả thiết H 0 trong khi thực tế thì giả thiết H 0 đúng. b Sai lầm loại 2: Là sai lầm mắc phải khi ta chấp nhận giả thiết H 0 trong khi thực tế thì giả thiết H 0 sai. Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê Quy trình kiểm định. Quá trình kiểm định giả thiết thống kê được tiến hành theo các bước sau đây 1 Phát biểu giả thiết không H 0 và đối thiết H 1 . Quyết định dữ liệu nào cần được thu thập và thu thập dưới các điều kiện nào. Chọn lựa một kiểm định thống kê (cùng với mô hình thống kê liên kết với nó) để kiểm định H 0 . 2 Từ một số kiểm định có thể được dùng cho mô hình nghiên cứu, chọn ra kiểm định thích hợp nhất dựa trên cơ sở là các điều kiện của nghiên cứu và các giả định cơ sở của kiểm định. 3 Chọn mức ý nghĩa α và kích thước mẫu n. 4 Tìm phân phối mẫu của kiểm định thống kê dưới điều kiện H 0 đúng. Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê 5 Trên cơ sở (2), (3) và (4) đã trình bày ở trên, xác định miền bác bỏ của kiểm định thống kê tương ứng. 6 Thu thập dữ liệu. Sử dụng dữ liệu thu được từ mẫu, tính giá trị của kiểm định. Nếu giá trị của thống kê nằm trong miền bác bỏ, ta bác giả thiết H 0 , nếu giá trị thu được nằm ngoài miền bác bỏ, kết luận không thể bác bỏ giả thiết H 0 ở mức ý nghĩa đã chọn. [...]... Gọi F là tần số xuất hiện A trong n phép thử thì F ∼ B(1, p) Gọi (F1 , , Fn ) là một mẫu ngẫu nhiên của F , khi đó 1 ¯ F = n n Fi = f i=1 Chọn thống kê Z= ¯ F − p0 p0 q0 n √ = ¯ n(F − p0 ) √ p0 q0 làm tiêu chuẩn kiểm định Nếu giả thiết H0 đúng thì Z ∼ N(0, 1) Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu Kiểm định giả thiết về tỷ lệ của... phân phối xác suất Một số biến ngẫu Kiểm định giả thiết về trung bình của tổng thể Trường hợp kích thước mẫu n ≥ 30 (hoặc n < 30 nhưng X có phân phối chuẩn), σ 2 đã biết Chọn thống kê Z= ¯ X − m0 √ = σ √ n ¯ n(X − m0 ) σ làm tiêu chuẩn kiểm định Nếu giả thiết H0 đúng thì Z ∼ N(0, 1) Từ đây ta suy ra miền bác bỏ tương ứng với từng loại đối thiết Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu... t1−α/2 Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu Kiểm định giả thiết về tỷ lệ của tổng thể Bài toán Cho tổng thể X , trong đó tỷ lệ cá thể mang đặc tính A nào đó là trong tổng thể là p (p chưa biết) Từ mẫu ngẫu nhiên (X1 , X2 , , Xn ) hãy kiểm định H0 : p = p0 , với mức ý nghĩa α H1 : p = p 0 (p < p0 , p > p0 ) Tập hợp - Giải tích tổ... - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu Kiểm định giả thiết về trung bình của tổng thể Bài toán Cho tổng thể với trung bình µ chưa biết với phương sai có thể đã biết hoặc chưa biết Từ mẫu ngẫu nhiên (X1 , X2 , , Xn ) hãy kiểm định H0 : µ = m0 , H1 : µ = m0 ( < m0 , µ > m0 ) với mức ý nghĩa α Tập hợp - Giải tích tổ hợp Biến cố và xác suất. .. tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu Kiểm định giả thiết về trung bình của tổng thể Trường hợp kích thước mẫu n < 30, σ 2 chưa biết, X tuân theo quy luật phân phối chuẩn Chọn thống kê T = ¯ X − m0 √ = S √ n ¯ n(X − m0 ) S làm tiêu chuẩn kiểm định Nếu giả thiết H0 đúng thì T ∼ T (n − 1) (Phân phối Student với n − 1 bậc tự do) Từ đây ta suy ra miền... loại giả thiết và miền bác bỏ tương ứng Giả thiết H0 : p = p 0 H1 : p < p 0 H0 : p = p 0 H1 : p > p 0 H0 : p = p 0 H1 : p = p 0 Miền bác bỏ √ (f Wα = z = √ −p0 ) : z < −zα Wα = z = : z > z1−α Wα = z = n p0 (1 −p0 ) √ (f √ −p0 ) n p0 (1 −p0 ) √ (f √ −p0 ) n p0 (1 −p0 ) : |z| > z1−α/2 ... luật phân phối xác suất Một số biến ngẫu Kiểm định giả thiết về trung bình của tổng thể Trường hợp kích thước mẫu n ≥ 30, σ 2 chưa biết Ta có thể dùng ước lượng của Var (X ) là S 2 để thay thế cho σ 2 Chọn thống kê Z= ¯ X − m0 √ = S √ n ¯ n(X − m0 ) S làm tiêu chuẩn kiểm định Nếu giả thiết H0 đúng thì Z ∼ N(0, 1) Từ đây ta suy ra miền bác bỏ tương ứng với từng loại đối thiết Tập hợp - Giải tích tổ... Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu Kiểm định giả thiết về tỷ lệ của tổng thể Trường hợp kích thước mẫu n ≥ 30 (hoặc n < 30 nhưng X có phân phối chuẩn, σ 2 đã biết: Quan sát sự xuất hiện của biến cố "Cá thể mang đặc tính A" trong n phép thử độc lập Nếu có m lần xuất hiện biến cố trên thì tần suất f = m là một ước lượng điểm của xác suất P(A) = p n Gọi...Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu Quy trình kiểm định trong bài làm 1 Từ mẫu cụ thể đã cho tính giá trị của các thống kê tương ứng với tiêu chuẩn kiểm định trong trường hợp tương ứng 2 Với mức ý nghĩa α cho trước, xác định miền bác bỏ 3 Kiểm tra giá trị của tiêu chuẩn kiểm... luật phân phối xác suất Một số biến ngẫu Kiểm định giả thiết về trung bình của tổng thể Ta có bảng tóm tắt các loại giả thiết và miền bác bỏ tương ứng Giả thiết H0 : µ = m0 H1 : µ < m0 H0 : µ = m0 H1 : µ > m0 H0 : µ = m0 H1 : µ = m0 Miền bác bỏ Wα = z = x −m0 ¯ √ σ/ n : z < zα Wα = z = x −m0 ¯ √ σ/ n : z > z1−α Wα = z = x −m0 ¯ √ σ/ n : |z| > z1−α/2 Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu . Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê 5 Trên cơ sở (2 ), (3 ) và (4 ) đã trình bày ở trên, xác định miền bác bỏ của kiểm định thống kê tương ứng. 6 Thu thập dữ liệu kê Bài Giảng Môn học Xác Suất và Thống Kê Nguyễn Văn Thìn Khoa Toán - Tin Học Đại Học Khoa Học Khoa Học Tự Nhiên Tp.HCM Ngày 4 tháng 9 năm 2011 Tập hợp - Giải tích tổ hợp Biến cố và xác suất Biến. - Giải tích tổ hợp Biến cố và xác suất Biến ngẫu nhiên và quy luật phân phối xác suất Một số biến ngẫu nhiên thông dụng Lý thuyết mẫu Ước lượng tham số thống kê Kiểm định giả thiết thống kê Bài