1. Trang chủ
  2. » Thể loại khác

LÝ THUYẾT XÁC XUẤT CHƯƠNG I XÁC XUẤT

94 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 94
Dung lượng 1,13 MB

Nội dung

Phần thứ LÝ THUYẾT XÁC XUẤT CHƯƠNG I XÁC XUẤT Chắc chắn đó, người ta nghiên cứu đưa vào sử dụng lý thuyết xác suất I Không gian mẫu Biến cố Lý thuyết xác suất, nay, lý thuyết toán học xây dựng chặt chẽ hệ tiên đề Tuy nhiên, để xây dựng hệ tiên đề chặt chẽ mặt toán học cho lý thuyết xác suất, người ta dựa vào khái niệm mang tính chất kinh nghiệm, trực quan Xác suất môn học nghiên cứu thí nghiệm ngẫu nhiên, i.e thí nghiệm mà khơng biết kết xảy ra, biết kết loại trừ xảy Từ nay, thí nghiệm gọi Phép thử Khi phép thử thực hiên, thấy xảy kết loại trừ nhau; kết gọi kết sơ cấp hay Biến cố sơ cấp Khi nói đến phép thử, trước hết, phải thống biến cố sơ cấp biểu diễn kết xảy Tập hợp tất biến cố sơ cấp gọi Không gian biến cố sơ cấp Để tiện lợi, xem biến cố sơ cấp điểm gọi Điểm mẫu (hay điểm cho gọn) Như vậy, biến cố sơ cấp biểu diễn điểm mẫu; không gian biến cố sơ cấp biểu diễn tập hợp mà phần tử điểm mẫu; cịn gọi Không gian mẫu thường ký hiệu M Không gian mẫu M gọi rời rạc tập hợp khơng đếm Chúng ta nói Biến cố A liên kết với phép thử xét (hay biến cố sơ cấp m) vào kết sơ cấp m, biết A xảy hay không xảy Nếu ký hiệu tập hợp tất kết sơ cấp, đó, xảy biến cố A Ao rõ ràng biến cố A xảy có mặt kết sơ cấp thuộc tập hợp Ao Do đó, từ nay, khơng phân biệt biến cố liên kết với phép thử xét tập hợp kết sơ cấp tương ứng Với cách hiểu biến cố tập hợp xác định gồm số biến cố sơ cấp (điểm mẫu) thuộc không gian biến cố sơ cấp (khơng gian mẫu) M; nói cách khác, tập hợp không gian mẫu M Tập hợp rỗng thân M biến cố được gọi biến cố M gọi biến cố chắn Từ biến cố cho trước, có biến cố sau: Giả sử A B hai biến cố không gian mẫu M cho trước i) Ký hiệu A , gọi Biến cố đối biến cố A, biến cố gồm tất điểm mẫu không thuộc A xảy A không xảy ii) Ký hiệu A B, gọi Hợp hai biến cố A B, biến cố “ít hai biến cố A B xảy ra“ Tương tự, định nghĩa hợp họ biến cố (Ai)i ∈ I ; ký hiệu: iii) Ký hiệu A B, gọi Giao hai biến cố A B, biến cố “ A B xảy “ A B ký hiệu AB Nếu AB = , i.e A B xảy đồng thời, người ta nói A B xung khắc; trường hợp đó, A B thường viết A + B Tương tự, định nghĩa giao họ biến cố (Ai)i ∈ I, ký hiệu: iv) Ký hiệu A \ B, gọi Hiệu A với B, biến cố “ A xảy B không xảy “ Rõ ràng, Thí dụ: hép thử: Gieo xúc xắc quan sát số xuất mặt Không gian mẫu M = {1, 2, 3, 4, 5, 6} Gọi A biến cố “xuất số chẵn” tiện, viết A = {xuất số chẵn}; tương tự, gọi B = {xuất số lẻ} C = {xuất số nguyên tố}, có A = {2, 4, 6}; B = {1, 3, 5} C = {2, 3, 5} Khi đó, A C = {2, 3, 4, 5, 6} = {xuất số chẵn số nguyên tố} B C = {3, 5} = {xuất số nguyên tố lẻ} = {1, 4, 6} = {không xuất số nguyên tố} A B xung khắc AB = ii) Phép thử: Gieo đồng tiền quan sát dãy mặt sấp (S) mặt ngửa (N) xuất Không gian mẫu M gồm phần tử, biểu diễn bởi: M = {SSS, SSN, SNS, SNN, NSS, NSN, NNS, NNN } Gọi A = {xuất hai mặt sấp} B = {xuất mặt giống nhau}, có: A = {SSS, SSN, SNS, NSS} B = {SSS, NNN} Khi đó, AB = {SSS} Biến cố “xuất mặt sấp” biến cố iii) Phép thử: Gieo xúc xắc mặt xuất đếm số lần gieo xúc xắc Không gian mẫu phép thử M = {1, 2, 3, , }; ký hiệu diễn tả trường hợp không xuất mặt vậy, xúc xắc gieo vô hạn lần Đây thí dụ khơng gian mẫu tập hợp đếm iv) Phép thử: Quan sát thời gian sống t linh kiện điện tử Không gian mẫu phép thử tập hợp số thực không âm Biến cố sơ cấp " t = to" có nghĩa linh kiện làm việc đến thời điểm to bị hỏng Biến cố " t >=to" biểu thị thời gian làm việc sản phẩm không nhỏ to Trong trường hợp này, không gian mẫu tập hợp không đếm 1.2 Ghi chú: Nếu không gian mẫu M tập hợp không đếm (gọi khơng gian mẫu rời rạc) tập M biến cố Nhưng M tập hợp không đếm có số tập M biến cố Thật ra, trường hợp, họ biến cố tạo thành lớp tập M thoả mãn số tính chất gọi đại số tập M.; nhiên, giáo trình khơng sâu vào lĩnh vực tuý toán học lý thuyết xác suất, nên không đề cập đến vấn đề này, không đề cập đến hệ tiên đề xác suất phần sau II khái niệm xác suất Nói chung, khái niệm xác suất dùng để “ khả “ (hay may) để xảy Khái niệm xác suất bắt đầu với việc nghiên cứu trò chơi may rủi, e.g trò roulette đánh Trong thực tiễn, có ba đường khác để tiếp cận khái niệm xác suất Trước hết, xét trường hợp: Do đặc điểm vật lý phép thử, điểm không gian mẫu hữu hạn M tương ứng có “ khả xảy “; trường hợp đó, M gọi Khơng gian hữu hạn đẳng xác suất hay Không gian hữu hạn Chúng ta có Định nghĩa (theo phương pháp cổ điển) Giả sử A biến cố có k điểm khơng gian hữu hạn gồm n điểm Người ta gọi số xác suất biến cố A, ký hiệu: P(A) Theo cách hiểu cổ điển, điểm không gian mẫu gọi “trường hợp” điểm A “ trường hợp thuận lợi cho A ”, (1) Thí dụ Chọn ngẫu nhiên sản phẩm từ lơ hàng chứa 12 sản phẩm, có phế phẩm Đặt A = {cả hai phế phẩm} B = {cả hai phẩm}.Tính P(A) P(B) Giải Chọn ngẫu nhiên sản phẩm từ 12 sản phẩm: có trường hợp có hội xảy A xảy trường hợp xảy ra, trường hợp, B xảy trường hợp Vậy, Định nghĩa theo phương pháp cổ điển dựa điều kiện “ lý tưởng ” vật nên khơng áp dụng vào biến cố thật đời sống không đạt điều kiện “ lý tưởng ” nói trên; chẳng hạn, làm để xác định xác suất bắn trúng bia xạ thủ? Ngay việc gieo đồng tiền, dựa vào đâu để khẳng định khả xuất hai “mặt sấp” “mặt ngửa” nhau? Suy nghĩ vấn đề này, nhà toán học khám phá điều thú vị sau: Giả sử thực phép thử, người ta quan tâm đến xuất biến cố A Bây lặp lại phép thử n lần, thấy A xuất s(A) lần s(A) gọi Tần số xuất biến cố A, tỉ số gọi Tần suất (hay Tần số tương đối) xuất biến cố A dãy n phép thử Bằng thực nghiệm, người ta nhận thấy rằng: Qua nhiều dãy phép thử, có nhiều dãy tần suất xuất ngẫu nhiên Quan sát dãy tần suất này, người ta nhận thấy có nét chung, mang tính qui luật Đó ổn định, chúng dao động biên độ định quanh số cố định Biên độ hẹp số phép thử tăng lên, i.e tiến đến giới hạn n tăng vơ hạn Các số liệu sau minh họa điều trên: Các kết gieo đồng tiền Buffon Pearson Người thí nghiệm Số lần gieo Số lần sấp Tần suất Buffon 4040 2048 0,5080 Pearson 12000 6019 0,5016 Pearson 24000 12012 0,5005 Từ ổn định tần suất, người ta đưa ra: Định nghĩa (theo tần suất) Xác suất biến cố A, ký hiệu P(A), giới hạn tần suất xuất biến cố A: (2) Trong thực tế, người ta dùng fn(A), với n đủ lớn, để P(A) Thí dụ Để xác định tỉ lệ bảo hiểm nhân thọ hợp lý, công ty bảo hiểm vào liệu thật với người đàn ơng nhóm tuổi vào khoảng 60 100.000 người chết vòng năm Như vậy, xác suất để người đàn ơng nhóm tuổi chết vịng năm tính xấp xỉ là: Định nghĩa xác suất tần suất có số nhược điểm như: Chỉ áp dụng cho phép thử ngẫu nhiên lặp lại nhiều lần điều kiện Điều không dễ thực thực tế Ngoài ra, nhiều trường hợp, đánh giá số phép thử “ đủ lớn” để tạo xác suất theo tần suất Hai định nghĩa xác suất cho giá trị xác suất khách quan Khi điều kiện khách quan khơng cho phép dùng chúng người ta dựa tính chủ quan để xác định xác suất Định nghĩa (theo chủ quan) Xác suất chủ quan biến cố mức độ tin tưởng cá nhân vào việc biến cố xảy Xác suất chủ quan biến cố dùng biến cố có hội xảy ra, xảy khơng xảy thời điểm khác Thí dụ Một nhà đầu tư xác định mua số lô đất có xác suất 0,90 giá đất tăng 50% hay nhiều vòng năm tới Dựa nghiên cứu dự án phát triển kinh tế vị trí địa lý vùng, ơng ta cho xác suất nói khoảng 0,75 Do đó, ơng ta dịnh khơng đầu tư vào lơ đất nói Sau đây, trừu tượng hoá chút khái niệm xác suất cho không gian mẫu rời rạc Định nghĩa Giả sử M = {m1, m2, }là không gian mẫu rời rạc Người ta gán cho điểm mi M số thực ký hiệu P({mi}), gọi xác suất {mi} Đó số khơng âm cho Xác suất P(A) biến cố A M định nghĩa tổng xác suất tất điểm mẫu A Để tiện việc ký hiệu, viết P(mi) thay cho P({mi}) Rõ ràng Định nghĩa 1.3 trường hợp đăc biệt Định nghĩa 1.6; trường hợp M = {m1, m2, , mn}là hữu hạn điểm M có xác suất (bằng 1/n) Một khơng gian mẫu, có xác định xác suất cho biến cố, gọi Không gian xác suất Đôi khi, khơng có lầm lẫn, người ta gọi M khơng gian xác suất III Tính chất xác suất Giả sử M không gian xác suất cho trước; từ (3), có ngay: • • • P(M ) = 1; Với biến cố A M , P(A) 1; Nếu A B hai biến cố xung khắc M thì: P(A + B) = P(A) + P(B) Ngoài ra, có: Định lý Với biến cố A B M: • • • • P( ) = 0; P( ) = - P(A); P(A\ B) = P(A) P(AB); P(A B) = P(A) + P(B) - P(AB) (Công thức cộng xác suất) Chứng minh Bằng phương pháp qui nạp toán học, chứng minh công thức mở rộng công thức cộng xác suất: Hệ Cho n biến cố A1, A2, , An (n>1) không gian xác suất; ký hiệu: , tổng, nhóm số ( i, j, k, ) xuất lần (Sr có số hạng) Khi đó: (4) Đặc biệt, với biến cố A, B C, có: Thí dụ Từ lớp có 100 sinh viên, 40 người biết tiếng Anh, 28 người biết tiếng Pháp 10 người biết thứ tiếng Anh Pháp, chọn ngẫu nhiên người Tính xác suất để người này: • • Biết ngoại ngữ Anh Pháp Không biết hai ngoại ngữ Giải Đặt A = {sinh viên chọn biết tiếng Anh} B = {sinh viên chọn biết tiếng Pháp} AB = {sinh viên chọn biết thứ tiếng Anh Pháp} A • B = {sinh viên chọn biết tiếng Anh tiếng Pháp} P( A B) = P ( A) + P ( B ) - P( A B ) = 0,4 + 0,28 - 0,1 = 0,58 • Đặt K = {sinh viên chọn khơng biết hai ngoại ngữ trên}, ta có : Vậy: P(K)=1-P(A B ) = - 0,58 = 0,42 IV Xác suất có điều kiện độc lập Khi quan sát tượng đời sống, thường gặp câu hỏi: Việc xảy biến cố H có ảnh hưởng đến khả xảy biến cố A hay khơng? Thí dụ đơn giản mối quan hệ là: “Việc xảy biến cố H làm cho biến cố A định phải xảy hay ngược lại, loại trừ khả khả xảy biến cố A“ Để trả lời câu hỏi này, người ta đưa vào lý thuyết xác suất khái niệm “xác suất có điều kiện độc lập biến cố“ Định nghĩa Trong không gian xác suất M, cho biến cố H với xác suất dương Với biến cố A M, người ta viết: (5) gọi đại lượng xác suất có điều kiện biến cố A giả thiết H (hoặc H xảy ra) Tính xác suất có điều kiện biến cố khác giả thiết H chẳng khác chọn H làm khơng gian mẫu Do cơng thức xác suất phần cho xác suất có điều kiện Chẳng hạn: , Từ công thức (5), có Định lý Với biến cố A B không gian xác suất , với P(B) > 0, (6) P(BA) = P(B).P(A/B) Người ta gọi (6) Công thức nhân xác suất Công thức (6) mở rộng phép qui nạp sau: Hệ Trong không gian xác suất, với biến cố A1, A2, , An có xác suất dương bất kỳ, có: (7)P(A1A2 An) = P(A1) P(A2 /A1) P(A3 /A1A2) P(An /A1A2 An -1) Với hai biến cố A B, thường P(A/B) khơng P(A) Trường hợp , nghĩa thông tin xẩy B không làm thay đổi xác suất biến cố A Khi đó, người ta nói biến cố A độc lập với biến cố B Với công thức (6), điều kiện P(A/B) = P(A) viết dạng P(AB) = P(A).P(B) Dạng đối xứng A B, nghĩa A độc lập với B B độc lập với A Định nghĩa Hai biến cố A B không gian xác suất gọi độc lập (8) P(AB) = P(A).P(B) Thí dụ Gieo đồng tiền vơ tư lần, không gian mẫu đều: M = {SSS, SSN, SNS, SNN, NSS, NSN, NNS, NNN} Xem biến cố: A = {xuất mặt sấp lần gieo thứ nhất}, B = {xuất mặt sấp lần gieo thứ hai} C = {xuất hai mặt sấp liên tiếp} Bằng trực giác, dễ nhận thấy độc lập A B, điều khơng rõ ràng A C với B C Để xác định, phải dùng Định nghĩa 1.7: P(A) = P({SSS, SSN, SNS, SNN}) = 1/2, P(B) = P({SSS, SSN, NSS, NSN}) = 1/2, P(C) = P({SSN, NSS}) = 1/4 Vậy, P(AB) = P({SSS, SSN}) = 1/4, P(AC) = P({SSN}) = 1/8, P(BC) = P(C) = 1/4 Chúng ta nhận thấy: P(A).P(B) = P(AB) nên A B độc lập, P(A).P(C) = P(AC) nên A C độc lập, P(B).P(C) P(BC) nên B C không độc lập Khái niệm độc lập mở rộng cho n (n > 2) biến cố Định nghĩa Các biến cố A1, A2, , An gọi độc lập với số nguyên m từ đến n với nhóm biến cố ( 0 lớn khác biệt tần số Chúng ta công nhận Định lý: Phân phối mẫu tiệm cận với phân phối định bởi: tần số lý thuyết không nhỏ Sự tiệm cận tốt với n lớn Bậc tự v cho bởi: a) v = k - tần số lý thuyết tính mà khơng có ước lượng từ mẫu b) v = k - - m tần số lý thuyết tính nhờ vào m ước lượng từ mẫu Trong thực hành, tần số lý thuyết tính sở giả thiết H0 Nếu với giả thiết chúng với mức ý nghĩa cho trước, giá trị tính (10) lớn ta kết luận khác tần số quan sát tần số lý thuyết có ý nghĩa.và giả thiết H0 bị bác bỏ H0 chấp nhận trường hợp ngược lại Thủ tục gọi Trắc nghiệm Trắc nghiệm thường dùng việc kiểm định giả thiết liên quan đến tính phù hợp phân phối thực nghiệm với phân phối lý thuyết, tính độc lập hai biến ngẫu nhiên khác nhiều tỉ lệ Dữ liệu dùng trắc nghiệm thường trình bày dạng bảng Thí dụ bảng nêu gọi bảng chiều, bảng x c Mở rộng, có bảng hai chiều dạng h X c, đó, tần số quan sát viết h hàng c cột Các báng gọi Bảng ngẫu nhiên Tương ứng với tần số quan sát bảng ngẫu nhiên h x c, có tần số lý thuyết tính dựa giả thiết khơng Những tần số ô bảng ngẫu nhiên gọi Tần số ô Tổng tần số theo hàng theo cột gọi Tần số lề Theo Định lý, phân phối mẫu thống kê (10) tiệm cận phân phối c > 1, cho bởi: với bậc tự v, với h > a) v = (h - 1)(c - 1) tần số lý thuyết tính mà khơng có ước lượng từ mẫu b) v = (h - 1)(c - 1) - m mẫu tần số lý thuyết tính nhờ vào m ước lượng từ I II III Tổng A o1 o2 o3 nA B o4 o5 o6 nB Tổng nI nII nIII n Bảng ngẫu nhiên - Thí dụ: Quan sát trọng lượng X (kg) nhóm ngời lữa tuổi, kết ghi lại sau: X (kg) (30, 40] (40, 45] (45, 50] (50, 55] (55, 60] (60, 70] Số người 15 24 27 17 Có tài liệu cho trọng lượng ngời lứa tuổi tuân theo luật phân phối chuẩn Tài liệu có phù hợp với kết quan sát mẫu không? ( kết luận mức 0,05 ) = Giải Các giả thiết: Giả thiết H0: trọng lượng người lứa tuổi tuân theo luật phân phối chuẩn Giả thiết H1: trọng lượng người lứa tuổi không tuân theo luật phân phối chuẩn Ước lượng trung bình phương sai X giá trị trung bình phương sai mẫu Từ mẫu, tính được: = 50,075 s2 = 60,032 Nếu H0 X ~ N (50 ; 60) Khi đó: Bảng tính với bậc tự do: ei (oi - ei)2 / ei 0,10 10 0,1 15 0,16 16 0,0625 (45, 50] 24 0,24 24 (50, 55] 27 0,24 24 0.375 (55, 60] 17 0,16 16 0,0625 (60, 70] 0,10 10 0,4 Tổng n = 100 Lớp oi (30, 40] (40, 45] Với mức ý nghĩa =1 = 0,05, giá trị tới hạn là: = 7,82 Vì < 7,82 nên, mức 5%, bác bỏ H0, i.e chấp nhận X tuân theo luật phân phối chuẩn Thí dụ: Gieo xúc xắc 120 lần, tần số quan sát mặt cho bảng sau: Mặt Tần số 25 17 15 23 24 16 Hãy kiểm định giả thiết cho xúc xắc vô tư mức ý nghĩa 5% Giải Giả thiết H0: Con xúc xắc vô tư Giả thiết H1: Con xúc xắc khơng vơ tư Với giả thiết H0, có tần số lý thuyết cho bảng sau: Mặt Tần số quan sát 25 17 15 23 24 16 Tần số lý thuyết 20 20 20 20 20 20 Giá trị với bậc tự là: Với mức ý nghĩa Vì nghĩa = 0,05, giá trị tới hạn = 11,1 < 11,1 nên bác bỏ giả thiết cho xúc xắc vô tư mức ý = 5% Thí dụ: Trong trường đại học, số sinh viên đậu rớt môn học Thầy A, B C cho bảng Hãy kiểm định giả thiết cho tỉ lệ sinh viên bị rớt môn học Thầy mức ý nghĩa = 5% Thầy A Thầy B Thầy C Tổng Đậu 50 47 56 153 Rớt 14 27 Tổng 55 61 64 180 Giải Với giả thiết H0 cho tỉ lệ sinh viên bị rớt môn học Thầy nhau, dễ dàng tính tần số lý thuyết, viết ngoặc đơn, phía tần số quan sát tương ứng Thầy A Thầy B Thầy C Tổng Đậu 50 ( 46,75 ) 47 ( 51,85 ) 56 ( 54,40 ) 153 Rớt ( 8,25 ) 14 ( 9,15 ) ( 9,60 ) 27 Tổng 55 61 64 180 Giá trị với (h - 1)(c -1) = bậc tự là: Với mức ý nghĩa = 0,05, giá trị tới hạn = 5,99 Vì < 5,99 nên bác bỏ giả thiết H0 mức ý nghĩa 5% Nói cách khác, chấp nhận tỉ lệ sinh viên bị rớt ba Thầy mức ý nghĩa 5% Chương Tương quan hồi qui tuyến tính I Hệ số tương quan Trong chương 2, qua Định nghĩa 2.19, Định lý 2.20, Định nghĩa 2.21 Định lý 2.22, đề cập đến định nghĩa tính chất Hệ số tương quan hai biến ngẫu nhiên X Y Nhắc lại: Hệ số tương quan hai biến ngẫu nhiên X Y số thực, ký hiệu định bởi: (1) , xác , hay tuỳ theo biến ngẫu nhiên rời rạc hay liên tục Định nghĩa: Người ta nói vectơ ngẫu nhiên (X, Y) phân phối theo qui luật chuẩn hai chiều với tham số mật độ f xác định R2 bởi: ( hệ số tương quan X Y) có hàm Hàm mật độ riêng fX X xác định với bởi: Hàm mật độ riêng fY Y xác định với bởi: Chúng ta nhận thấy rằng: Ngoài ra, = dễ thấy rằng: f (x, y) = fX (x) .fY (y) với , Theo Định lý 2.20, X Y độc lập điều vừa chứng minh, có: = 0, điều ngược lại khơng Nay, với Nếu X Y có phân phối chuẩn với hệ số tương quan độc lập) Trong thực tế, khơng biết ( = 0) tương đương ( X Y mà dựa vào mẫu để tìm ước lượng Định nghĩa: Giả sử (X1, Y1); (X2, Y2); ; (Xn, Yn) mẫu thành lập từ vectơ ngẫu nhiên (X, Y) Biến ngẫu nhiên (2) gọi Hệ số tương quan mẫu X Y Với mẫu cụ thể, giá trị hệ số tương quan mẫu tính bởi: (3) đó, ký hiệu II Kiểm định giả thiết hệ số tương quan Giả sử (X1, Y1); (X2, Y2); ; (Xn, Yn) mẫu thành lập từ tổng thể có phân phối chuẩn hai chiều Chúng ta muốn kiểm định giả thiết liên quan đến giá trị khác hệ số tương quan tổng thể, ký hiệu , dựa phân phối mẫu R kiểm định cặp giả thiết: H0: ; H1: Người ta chứng minh với giả thiết H0, phân phối mẫu R đối xứng; từ đó, thống kê (4) ~ Student (n - 2) Trắc nghiệm t dùng trường hợp kiểm định cặp giả thiết: H0: ; H1: Với giả thiết H0, phân phối mẫu R bị lệch nên dùng trực tiếp R Trong trường hợp này, Fisher đề nghị phép biến đổi đưa đến thống kê (5) có phân phối tiệm cận chuẩn với kỳ vọng phương sai Trắc nghiệm U dùng với U = Z*, biến chuẩn hoá Z Phép biến đổi (5) gọi phép biến đổi Fisher; dùng để tìm khoảng tin cậy cho hệ số tương quan tổng thể Thí dụ: Dựa vào mẫu ngẫu nhiên cỡ 18 chọn từ tổng thể có phân phối chuẩn chiều, người ta tính giá trị hệ số tương quan mẫu r = 0,32 Chúng ta kết luận mức ý nghĩa 5% hệ số tương quan tổng thể khác không? Giải Chúng ta phải có định hai giả thiết H0: Trắc nghiệm t dùng trường hợp Với mức = 5% , giá trị tới hạn là: với mẫu cụ thể, có: = 2,12; H1: Vì t < 2,12 nên giả thiết H0 bị bác bỏ mức ý nghĩa ta chấp nhận = mức ý nghĩa 5% = 5% Nói cách khác, chúng Thí dụ: Hệ số tương quan tính mẫu cỡ 24, chọn từ tổng thể có phân phối chuẩn chiều, r = 0,75 Với mức ý nghĩa = 5%, bác bỏ giả thiết cho hệ số tương quan tổng thể lớn 0,50 không? Giải Kiểm định cặp giả thiết H0: = 0,50 H1: > 0,50 Trắc nghiệm U đuôi sử dụng Với mức = 5% , giá trị tới hạn là: = 1,6449; với mẫu cụ thể, có : , mZ = 0,5493 , sZ = 0,2182 Vì u > 1,6449 nên mức ý nghĩa > 0,50 = 5%, giả thiết H0 bị bác bỏ, i.e chấp nhận III Phân tích hồi qui Phân tích tương quan phần giúp biết mức độ phụ thuộc tuyến tính biến ngẫu nhiên Bài tốn Phân tích hồi qui trình bày phần giúp thiết lập cấu trúc mối liên hệ phụ thuộc biến (gọi biến phụ thuộc) với hay nhiều biến khác (gọi biến độc lập); muốn thể mối liên hệ phụ thuộc biến dạng toán học phương trình nối biến Phương trình cho phép dự đoán biến phụ thuộc sở biết biến độc lập Giáo trình trình bày trường hợp có biến độc lập (hồi qui đơn) Giả sử X biến ngẫu nhiên độc lập Y biến ngẫu nhiên phụ thuộc vào X Nếu muốn ước lượng giá trị Y giá trị biến ngẫu nhiên o X, với hàm thực đó, mắc sai số (6) S( ) = E[(Y - oX)2], gọi Độ sai dự báo Vấn đề đặt chọn nghĩa S( ) đạt giá trị nhỏ ước lượng tốt nhất, theo Định nghĩa: Nếu S( ) đạt giá trị nhỏ = , i.e , gọi Hàm hồi qui Y X, đồ thị gọi Đường hồi qui Y X hàm đa thức hàm hữu tỉ, hàm mũ, v.v Khi hàm bậc , gọi Hàm hồi qui tuyến tính Y theo X., a b gọi hệ số hồi qui tuyến tính y = ax + b cịn gọi Phương trình đường thẳng hồi qui Y theo X Khi đó, người ta nói Y có hồi qui tuyến tính theo X Hàm hồi qui Nếu muốn ước lượng giá trị X từ giá trị cho trước Y với phương pháp (gọi Phương pháp bình phương bé nhất), hốn đổi vai trị X Y (Y biến độc lập X biến phụ thuộc), có Hàm hồi qui Đường hồi qui X theo Y Nói chung, đường hồi qui Y theo X không trùng với đường hồi qui X theo Y Định nghĩa: Giả sử X Y hai biến ngẫu nhiên không gian mẫu cho fX(x) > 0, đặt: dồng thời f Với có hàm mật độ Nếu X Y rời rạc, Nếu X Y liên tục, với điều kiện chuỗi hay tích phân vế phải hội tụ tuyệt đối E(Y/x) gọi Kỳ vọng có điều kiện Y X lấy giá trị x Biến ngẫu nhiên E(Y/X), có giá trị E(Y/x) X lấy giá trị x, gọi Kỳ vọng có điều kiện Y dối với X Định lý: Nếu biến ngẫu nhiên E(Y/X), Y, X E(Y/X) X.Y có kỳ vọng i) E[E(Y/X)] = E(Y) ii) E[X E(Y/X)] = E(X.Y) iii) E[Y E(Y/X)] = E([E(Y/X)] 2) iv) Hàm :x E(Y/x) hàm hồi qui Y X Chứng minh Giả sử X Y rời rạc có hàm mật độ đồng thời f i) Vậy, E[E(Y/X)] = E(Y) ii) Vậy, E[X E(Y/X)] = E(X.Y) Mở rộng, E[ oX E(Y/X)] = E( oX.Y) iii) Vậy, E[Y E(Y/X)] = E([E(Y/X)]2) iv) S( ) = E[(Y - oX)2] = E[(Y - E(Y/X) + E(Y/X) - oX)2] = E[(Y - E(Y/X))2] + E[(E(Y/X) - oX)2] + 2E[(Y - E(Y/X)(E(Y/X) - oX)] Dùng (ii), chứng minh được: E[(Y ( E(Y/X)(E(Y/X) ( oX)] = Vậy, S( ) đạt giá trị bé oX = E(Y/X) Trường hợp X Y liên tục chứng minh tương tự (xem tập) Định lý: Giả sử X Y hai biến ngẫu nhiên có hệ số tương quan tính theo X hàm hồi qui Y theo X y= = E(Y/x) = ax + b, với Chứng minh Với biến ngẫu nhiên E(Y/X) = aX + b, có: E[E(Y/X)] = E(aX + b) = a E[E(Y/X)] = nên Y = a Y X + b (*) X + b, Nếu Y có hồi qui tuyến Với biến ngẫu nhiên X E(Y/X) = aX2 + bX, có: E[X E(Y/X)] = a.E(X2) + b mX = b.E(X) + a.( X E[X E(Y/X)] = E(XY) = cov(X,Y) nên b Y + a = X Y - X + ) Y Y (**) Giải hệ gồm hai phương trình (*) (**), với hai ẩn a b, được: Chú ý: (a) Khi dùng hàm hồi qui Y theo X để tính xấp xỉ Y Độ sai dự báo là: = E[(Y - E(Y/X))2] = Chúng ta nhận thấy sai số nhỏ hồi qui để xấp xỉ Y sở biết X gần Do đó, nên dùng hàm gần Chúng ta tìm khoảng tin cậy cho trung bình Y X lấy giá trị x0 Vấn đề tìm hiểu kỹ giáo trình mơn Kinh tế lượng Trong giáo trình tạm hài lòng với dự báo Y cách thay giá trị x0 vào phương trình đường thẳng hồi qui Y theo X (b) Tương tự, hàm hồi qui tuyến tính X theo Y là: x = E(X/y) = với độ sai dự báo: IV Hàm hồi qui tuyến tính mẫu Trong thực tế, khơng khảo sát hết tổng thể, chưa biết phân phối vectơ ngẫu nhiên (X, Y) nên khó xác định dạng toán học hàm hồi qui tổng thể x E(Y/x) hay y E(X/y) Chúng ta phải dựa mẫu để xây dựng hàm hồi qui mẫu cho ước lượng tốt hàm hồi qui tổng thể Giả sử (x1, y1), (x2, y2), , (xn, yn) n cặp quan sát mẫu thành lập từ vectơ ngẫu nhiên (X, Y) Để có hình ảnh trực quan mối tương quan X Y, người ta biểu diễn cặp số (xi, yi) điểm Mi có toạ độ (xi, yi), (i = 1, 2, , n) mặt phẳng toạ độ Oxy Tập hợp điểm Mi (i = 1, 2, , n) tạo nên “đám mây thống kê” thường gọi Biểu đồ phân tán Biểu đồ phân tán cho nhìn khái quát mức độ cấu trúc tương quan Y X Từ biểu đồ phân tán, người ta thường nhận thấy có đường (cong thẳng) xấp xỉ liệu (các điểm (xi, yi) tụ tập gần đường đó) Nếu đường nói đường thẳng Y có hồi qui tuyến tính theo X yy Hồi qui tuyến tính Hồi qui khơng tuyến tính Từ mẫu trên, người ta xây dựng đường hồi qui tuyến tính mẫu cách thay số đặc trưng tổng thể ước lượng điểm tương ứng: Hàm hồi qui tuyến tính mẫu Y theo X: , với độ sai dự báo mẫu: Hàm hồi qui tuyến tính mẫu X theo Y: , với độ sai dự báo mẫu: Thí dụ: Giả sử giá trị quan sát mẫu biến ngẫu nhiên X Y cho bảng sau: xi 11 14 yi 4 a) Vẽ biểu đồ phân tán cho liệu bảng b) Hãy tính giá trị hệ số tương quan mẫu c) Giả sử X Y có hồi qui tuyến tính, viết phương trình đường thẳng hồi qui mẫu Y theo X Dự báo giá trị Y X lấy giá trị 12 d) Viết phương trình thẳng đường hồi qui mẫu X theo Y Giải: a) Biểu đồ: b) Chúng ta lập bảng tính sau: 1 1 4 16 16 16 36 24 16 64 40 25 81 63 49 11 121 88 64 14 196 126 81 =524 = 7, sX = 4,342, = 5, sY = 2,828 Giá trị hệ số tương quan mẫu: r = 0,977 Vì r gần nên xem X Y có hồi qui tuyến tính c) Phương trình đường thẳng hồi qui mẫu Y theo X Vậy, y = 0,636x + 0,545 Khi X lấy giá trị 12 dự báo Y có giá trị là: y = 0,636 x 12 + 0,545 = 8,177 d) Phương trình đường thẳng hồi qui mẫu X Y: Vậy, x = 1,50y - 0,50 =256

Ngày đăng: 25/06/2023, 21:46

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w