Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 94 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
94
Dung lượng
1,56 MB
Nội dung
ĐỀ CƯƠNG BÀI GIẢNG Học phần: XÁC SUẤT THỐNG KÊ Đơn vị: Bộ mơn Tốn, Khoa CNTT Thời gian: Tuần lễ: 1, Tiết 01 - 04 Giáo viên: Tô Văn Ban, Tạ Ngọc Ánh, Phan Thu Hà Chương Biến cố xác suất biến cố §1.1.Xác suất biến biến cố §1.2 Xác suất điều kiện §1.3 Sự độc lập Mục đích Nắm được, tính xác suất mơ hình đơn giản u cầu Đặc biệt, vận dụng cơng thức xác suất tồn phần, Cơng thức Bernaulli Thấy tính độc lập biến cố đặc thù lý thuyết XS a) Bài giảng Giới thiệu học phần XSTK(15 phút) Xuất phát điểm Lý thuyết xác suất tung đồng tiền, đánh bạc hay trò chơi may rủi Nhiều nghịch lý phát dẫn đến tranh cãi kịch liệt kỷ 19, dẫn đến luồng quan điểm coi lý thuyết xác suất “khoa học ngây thơ” Do nhu cầu phát triển vuc bão khoa học đầu kỷ 20, đòi hỏi vật lý, thiên văn, sinh học…, dựa lý thuyết tập hợp lý thuyết độ đo phát triển, Kolmogrov, nhà bác học Nga hàng đầu đưa hệ tiên đề LTXS, làm sở toán học vững cho ngành toán học Lý thuyết XS sở thống kê toán, ngành toán học ứng dụng rộng rãi Trên giới, thống kê phát triển Nhiều khoa toán nằm trường thống kê Chia làm phần: Phần XS gồm chương, phần thống kê gốm chương Chính sách riêng Mỗi lần lên bảng chữa tập ghi nhận, cộng vào điểm trình 0.5 điểm Chữa tập sai không bị trừ điểm Tài liệu tham khảo cho Học phần GTII TT Tên tài liệu Tác giả Nxb Xác suất thống Tô Văn Ban Nxb Giáo dục Việt Nam kê, Tô Văn Ban, Xác suất Thống Tống Đình Giáo dục kê Quỳ Năm xb 2010 2006 Mở đầu lý thuyết Xác suất ứng dụng Lý thuyết Xác suất Thống kê ứng dụng Đặng Thắng Hùng Giáo dục 2005 Nguyễn Xuân HV KTQS 1998 Viên Đặng Hùng Giáo dục 1999 Thắng Đề Bài tập nhà XSTK (Gạch dưới: Chữa lớp) CHƯƠNG I Tài liệu [1]: 1( – – – – – 10 - 11–13 – 15 – 17 – 18 –19 - 20 – 21 – 22 – 23 – 24 - 27 -29) Tài liệu [2]: Tr 35-38: 6, 9, 10, 12, 13, 15, 21, 25, 29, 30, 33 (sửa 10% thành 7%) CHƯƠNG II Tài liệu [1]: 2(1 - –3 - 4– 5- - - – - 10 - 11 –12- 14 – 16-17 - 18-2123- 26 - 27- 30-32) Tài liệu [2]: Tr 76-78: 2, 4, (sửa x thành |x|), 10 CHƯƠNG III Tài liệu [1]: 3(1 – – – – – -10- 11 – 21 – 22 – 24 -26- 27 – 33 – 38- 4049- 53 - 54- 55 ) Tài liệu [2]: Tr 110-112: 10, 11, 14, 15, 16 CHƯƠNG IV Tài liệu [1]: 4(1 – – – – 10 – 11 – 12 – 13 – 14 – 17 – 19 – 21 – 23 – 24 – 25(a) – 26(a,b) – 27 – 29 – 30 – 31 – 32 –33- 34 – 35 – 37) Tài liệu [2]: Tr 153-157: 11, 12,15,17, 19,22 CHƯƠNG V Tài liệu [1]: 5(1- - 5- 6- - 9- 12- 14 - 15 ) Tài liệu [2]: Tr187-189: 3, 4, 6, 8, 10, 14, 16, 17, 22, 26, 28 Cơ cấu điểm Học phần: Theo quy định chung, giống học phần khác Hình thức thi: Thi viết CẤU TRÚC ĐỀ THI Học phần Giải tích II Câu số Nội dung Điểm Lý thuyết 2.0 Chương 2.0 Chương 2, chương 2.0 Chương 2.0 Kiểm định độc lập, TQ, HQ 2.0 Bầu lớp trưởng lớp học phần Kết quả: Số điện thoại giáo viên: Địa Email cần: Webside cần: Chương BIẾN CỐ, XÁC SUẤT BIẾN CỐ § 1.1 XÁC SUẤT BIẾN CỐ (2 tiết) 1.1.1.Thí nghiệm ngẫu nhiên, biến cố, khơng gian mẫu Định nghĩa Thí nghiệm ngẫu nhiên thí nghiệm kết đầu khơng xác định từ hiểu biết đầu vào Kết đầu thí nghiệm quy định kết đơn, không phân tách được, lần thử có kết Vì ta hay gọi chúng kết cục (hay biến cố sơ cấp), ký hiệu hay thêm vào số: 1 , , Tập tất kết cục có thí nghiệm ngẫu nhiên, ký hiệu S (nhiều tài liệu viết ), gọi không gian mẫu (hay tập vũ trụ) thí nghiệm Hợp thành kết cục đó, tập S, gọi biến cố Bản thân tập S biến cố, gọi biến cố chắn Biến cố trống không chứa kết cục nào, ký hiệu , gọi biến cố bất khả (hay biến cố không thể) Biến cố {} gồm kết cục gọi biến cố sơ cấp, để đơn giản ký kiệu Các biến cố ký hiệu chữ in thêm số: A, B, , A1, A , Chúng ta thể biến cố cách liệt kê kết cục nêu thuộc tính nó, tất viết dấu ngoặc nhọn { } Nếu kết lần thử A ta nói biến cố A xảy lần thử Không gian mẫu có số hữu hạn đếm kết cục gọi không gian mẫu rời rạc; trái lại, không gian mẫu gọi liên tục Ví dụ 1.1 Tìm khơng gian mẫu thí nghiệm tung đồng tiền i)1 lần; ii) lần Giải i) Hai kết cục có thể: ngửa N sấp S Vậy S {N, S} ii) S {NN, NS, SN, SS} Như trường hợp ii) khơng gian mẫu có kết cục, có biến cố sơ cấp Cả thảy gồm 24 16 biến cố: , NN , NS , SN , SS , NN, NS , ,{NN, NS, SN, SS} Nói chung, khơng gian mẫu có N kết cục có thảy 2N biến cố Một số biến cố quan tâm là: A = {ngửa lần đầu} = { NN, NS} B = {chỉ có lần ngửa} = {NS, SN}, C = {ít lần ngửa} = {NN, NS, SN}, … # Ví dụ 1.2 Tung đồng tiền đến xuất mặt sấp dừng lại Đối với thí nghiệm đặt NS, , n NN .NS (n – lần N) 1 S, Không gian mẫu S {1, , , n , } Tuy nhiên, ta quan tâm đến số lần tung đồng tiền cần thiết xét không gian mẫu S {1, 2,3, } Với thí nghiệm này, khơng gian mẫu gián đoạn, có vơ hạn kết cục Một số biến cố quan tâm là: A = {số lần tung chẵn}, C = {số lần tung từ đến 10}, B = {số lần tung < 10}, D = {số lần tung 1, 4} # Ví dụ 1.3 Các chíp điện tử sản xuất cách cấy ion vào sâu màng silicon dioxide (Si O2 ) Quá trình cấy mang chất ngẫu nhiên, số ion vào sâu so với dự định, số khác khơng Thí nghiệm ngẫu nhiên xét đến độ sâu (theo m) ion cấy vào màng silicon Vậy chọn S [0; 20] Khơng gian mẫu vô hạn, liên tục # Chúng ta muốn gán biến cố A với số - ký hiệu P(A), gọi xác suất biến cố A - đặc trưng cho khả xảy biến cố A lần thử Việc gán phải thoả mãn tính chất tự nhiên sau P(A) (1.1.1) P(S) (1.1.2) Nếu A B hai biến cố xung khắc P(A B) P(A) P(B) (1.1.3) 1.1.2 Định nghĩa cổ điển xác suất Giả sử thí nghiệm ngẫu nhiên có thảy N kết cục chúng đồng khả Hơn nữa, giả sử có n A kết cục thuận lợi cho biến cố A (nghĩa biến cố A xảy kết cục xảy ra) Xác suất biến cố A xác định P(A) nA Sè kÕt cơc thn lỵi N Tỉng sè kết cục đồng khả (1.1.4) Vớ d 1.4 Trong bình có a cầu trắng, b cầu đen (a 0, b 0) với trọng lượng, kích thước giống hệt Lắc lấy ngẫu nhiên Tìm xác suất để cầu lấy có màu trắng Giải Rõ ràng số kết cục đồng khả a + b Đặt A = {rút cầu trắng} có a kết cục thuận lợi cho A (A xảy rút a cầu trắng) Từ định nghĩa P(A) a / (a b) # Ví dụ 1.5 Một hộp có 10 sản phẩm có phẩm (và phế phẩm) Lấy ngẫu nhiên từ hộp sản phẩm Tìm xác suất để: i) Cả sản phẩm phẩm; ii) Có phẩm Giải Đặt A = {cả sản phẩm rút phẩm}; B = {Rút phẩm} Số kết cục đồng khả số cách rút sản phẩm từ 10 sản phẩm hay C10 cách i) Số kết cục thuận lợi cho A C36 Vậy P(A) C36 / C10 1/ 0,167 ( 16, 7%) ii) Hai phẩm rút phẩm, có C 26 cách Một phế phẩm rút phế phẩm, có C14 cách Số kết cục thuận lợi cho B C62 C14 Vậy P(B) C62 C14 # C10 Ví dụ 1.6 Trong liên hoan tổ gồm 10 người ngồi quanh bàn tròn cách ngẫu ngiên Tìm xác suất để tổ trưởng A tổ phó B ngồi cạnh Giải Chúng ta đánh số ghế ngồi từ đến 10 coi cách ngồi khác có chỗ thấy có người ngồi khác Số kết cục (đồng khả năng) 10! (10 người ngồi vào 10 chỗ) Để tính số kết cục thuận lợi, ta xếp A ngồi tuỳ ý vào 10 chỗ (10 cách); B ngồi vào chỗ cạnh A (2 cách); người lại ngồi tuỳ ý vào chỗ lại (8! cách) Số kết cục thuận lợi 10 8! Ta nhận P(B) 10.2.8!/ 10! / # Xác suất hình học Nếu thí nghiệm ngẫu nhiên cho tương ứng với việc gieo ngẫu nhiên điểm tuỳ ý miền hình học G cho khả để điểm rơi vào miền g G tỷ lệ với diện tích miền này, khơng phụ thuộc vào vị trí tương đối g với G vào hình dạng Khi đó, xác suất biến cố A cho P(A) Sè ®o miÒn g A Sè ®o miÒn G (1.1.5) g A : miền ứng với biến cố A, số đo: độ dài, diện tích, thể tích (tương ứng 1 , , 3 ) Nhận xét Trong định nghĩa cổ điển phép thử giả định, ta thực phép thử nào; xác suất tiên nghiệm, suy đoán cách lơgíc từ tính đối xứng Định nghĩa thoả mãn đòi hỏi (1.1.1) (1.1.3) Tuy nhiên, định nghĩa có nhiều nhược điểm Trong định nghĩa có từ đồng khả năng, khái niệm mà ta cần xây dựng Như thấy, điều gây khó khăn xác định n A N Mặc dầu cải thiện tình hình, song xác suất hình học chưa giải trường hợp kết cục không đồng khả 1.1.3 Định nghĩa xác suất tần suất Lặp lại thí nghiệm n lần giả sử biến cố A cho xuất n A lần Số n A gọi tần số, tỷ số nA gọi tần suất (hay tần số tương đối) n xuất biến cố A n lần thử Ví dụ 1.9 Tiến hành tung đồng tiền cân đối cách vô tư người ta thu kết Người làm thí Số lần tung Số lần mặt Tần suất nghiệm sấp Buffon 040 048 0,5069 Pearson 12 000 019 0,5016 Pearson 24 000 12 012 0,5005 Khi số phép thử tăng lên vô hạn, ta hy vọng tần suất dần đến 0,5, số lấy làm xác suất biến cố mặt sấp tung đồng tiền lần # Nói chung, tần suất thay đổi từ loạt thử sang loạt thử khác Tuy nhiên n tăng, tần suất có tính ổn định, dường dao động quanh số p Số cố định p xem xác suất biến cố A Định nghĩa Giới hạn tần suất nA n tăng lên vô hạn gọi xác n suất biến cố A theo nghĩa thống kê (hay theo tần suất): P(A) lim n nA n (1.1.6) Theo định nghĩa này, n lớn, ta dùng xấp xỉ P(A) nA n (1.1.7) 1.1.4 Mối quan hệ biến cố, phép tốn biến cố Như nói, không gian mẫu S tập tất kết cục thí nghiệm ngẫu nhiên Mỗi tập S biến cố; thân S biến cố, gọi biến cố chắn Biến cố ký hiệu a) Hợp biến cố Biến cố C gọi hợp hai biến cố A B ta viết C A B C A B , lần thử (sau để đơn giản ta bỏ cụm từ này), biến cố C xảy A, B, A B xảy (xem lược đồ Venn Hình 1.2(a)) Chúng ta dễ dàng hiểu ý nghĩa hợp n biến cố, ký hiệu cách sau: A1 A A n ; A1 A A n ; n n i 1 i 1 Ai ; Ai b) Kéo theo Biến cố A gọi kéo theo biến cố B, ký hiệu A B , biến cố A xảy biến cố B xảy (xem lược đồ Venn Hình 1.2(b)) c) Biến cố xung khắc Hai biến cố A B gọi xung khắc biến cố A xảy biến cố B khơng xảy ngược lại, biến cố B xảy biến cố A khơng xảy (xem Hình 1.2(c)) Tổng qt, biến cố A1 , A , , A n gọi xung khắc đôi biến cố chúng xung khắc d) Biến cố đối Biến cố B gọi biến cố đối (hay phần bù) biến cố A, ta viết B A , chúng xung khắc hợp chúng biến cố chắn (xem Hình 1.2(d)) Như vậy, A A S; A, A xung khắc Rõ ràng, AA e) Giao biến cố Biến cố C gọi giao (hay tích) hai biến cố A B, ta viết C A B (hay C AB ) C xảy A B xảy (xem Hình 1.2(e)) Tổng quát, biến cố A gọi giao (hay tích) biến cố A1, , A n A xảy biến cố A1, , A n xảy Tích biến cố ký hiệu cách sau: n n A1A A n ; A1 A A n ; Ai ; Ai i 1 i 1 f) Hiệu biến cố A B , (xem Hình 1.2(f)) Hình 1.2 Lược đồ Venn: (a) hợp biến cố; (b) kéo theo; (c) xung khắc; (d) biến cố đối; (e) giao biến cố; (f) hiệu biến cố Quy tắc Đờ Moocgăng (De Morgan): i) A B A B; n i 1 i 1 i 1 n A B A B; (1.1.8) n i1 i1 i 1 i1 i1 n ii) B Ai B Ai ; B A i B A i ; (1.1.9) iii) B Ai B Ai ; B A i B A i (1.1.10) Ví dụ 1.10 Rút quân tú lơ khơ Xét biến cố: A={Rút quân đen}; B={rút quân đỏ}; C={Rút quân có số}; D={ Rút quân từ trở lên} Khi đó, A C xung khắc; B A , C B ; C D {Rút quân cơ}; C D {Rút 10 cơ}; C D { Rút quân từ đến 8}… # 1.1.5 Định nghĩa xác suất theo tiên đề a) - đại số Định nghĩa Họ ℱ khác trống biến cố không gian mẫu S gọi i) S ℱ; đại số (hay trường) thoả mãn tính chất: ii) A ℱ A ℱ; iii) A, B ℱ A B ℱ Ý tưởng tính chất ii) iii) chỗ, đại số đóng với phép lấy phần bù, lấy hợp Ngoài ra, suy diễn đơn giản từ quy tắc De Morgan ta thấy ℱ ℱ đóng với phép lấy hợp, giao, phần bù số hữu hạn lần phần tử theo thứ tự Ví dụ, A, B, C, D ℱ (B C) [D (C A)] A D ℱ Định nghĩa Nếu ngồi tính chất i-iii, họ ℱ có tính chất iii) A1 , A , ℱ Ai ℱ, i 1 ℱ gọi - đại số (hoặc -trường) Ví dụ 1.11 Nhóm biến cố {A1, , A n} gọi đầy đủ nếu: i) Chúng xung khắc đôi: A i A j (i j) ; ii) Hợp chúng biến cố chắn: A1 A n S Nếu nhóm biến cố {A1, , A n} đầy đủ đại số sinh nhóm đơn giản: Mỗi phần tử đại số hợp số hữu hạn biến cố họ cho # Ví dụ 1.12 ( - đại số Borel) (xem [1]) b) Các tiên đề xác suất Định nghĩa Giả sử (S, ℱ) gồm không gian mẫu S đại số ℱ biến cố S Xác suất P(.) hàm tập ℱ thoả mãn tiên đề sau đây: I P(A) 0, A ℱ (1.1.11) II P(S) (1.1.12) III A, B ℱ; A, B xung khắc (1.1.13) P(A B) P(A) P(B) Trong trường hợp ℱ - đại số, thay cho III IIIa Nếu dãy biến cố A1, A , xung khắc đôi P(A1 A ) P(A1 ) P(A ) (1.1.14) Định nghĩa Bộ ba (S, ℱ, P) bao gồm không gian mẫu S, đại số (hay - đại số) ℱ xác suất P(.) gọi không gian xác suất Mỗi thí nghiệm ngẫu nhiên mơ hình hố khơng gian xác suất (S, ℱ, P) Từ nay, nói đến biến cố A ta hiểu phần tử họ đại số - đại số khơng gian xác suất Cũng thấy rằng, định nghĩa xác suất theo tần suất trường hợp riêng xác suất theo tiên đề 1.1.6 Các tính chất xác suất 1) P() 2) P(A) P(A) ; P(A) P(A) 3) A B xung khắc P(A B) P(A) P(B) 3a) A1, , A n xung khắc đơi P(A1 A n ) P(A1 ) P(A n ) 3b) A, B tuỳ ý P(A B) P(A) P(B) P(AB) 3c) A,B, C tuỳ ý P(A B C) P(A) P(B) P(C) [P(AB) P(AC) P(BC)] P(ABC) 3d) A1, , A n , n n P Ai P(Ai ) P(Ai A j ) i 1 i n 1 i j n P(A i A jA k ) ( 1) n 1 P(A1 A n ) 1i j k n 4) A B P(A) P(B) 5) P(A) 6) P(A B) P(A) P(B) Chứng minh Tính chất mang tên “chuyển qua biến cố đối”: Nếu thấy khó khăn tính xác suất trực tiếp, dễ ta tính xác suất biến cố đối Các tính chất 3, 3a – 3d gọi quy tắc cộng xác suất Hai tính chất 7, sau - gọi tính chất liên tục xác suất - phải dùng đến tiên đề IIIa 7) Nếu A1, A , dãy tăng biến cố: A n ℱ, A1 A , A A n ℱ n 1 P(A) P A i lim P(A n ) n 1 n 8) Nếu A1, A , dãy giảm biến cố: A n , A1 A , A A n ℱ i1 P(A) P A n lim P(A n ) i1 n 1.1.7 Suy diễn xác suất Trong ứng dụng lý thuyết xác suất, ta hay gặp vấn đề sau: Giả sử cách đó, thơng qua quan sát khứ, biết xác suất biến cố A thí nghiệm p P(A) [0; 1] Ta nói xảy biến cố A lần thử đơn lẻ tiếp theo? Về vấn đề này, tách làm trường hợp sau i) Trường hợp p gần Một biến cố có xác suất nhỏ, chí khơng xảy thực phép thử Tuy nhiên, người ta chấp nhận nguyên lý sau đây, gọi nguyên lý xác suất nhỏ: Một biến cố có xác suất nhỏ thực tế coi rằng, biến cố khơng xảy (hoặc vài) phép thử tương lai Một biến cố coi có xác suất nhỏ tuỳ thuộc vào tốn cụ thể Ví dụ, xác suất để chuyến bay chở khách bị nạn 0,01 coi nhỏ Trái lại, xác suất để tàu hoả đường dài ga cuối chậm 15 phút 0,05 lại coi nhỏ xem tàu hoả Xác suất nhỏ thường chọn khoảng 0, 00001 0,1 , ví dụ 0,001; 0,005; 0,01; 0,02; 0,05; 0,1 ii) Trường hợp p gần Tương tự người ta có nguyên lý xác suất lớn sau đây: Nếu biến cố ngẫu nhiên có xác suất lớn, thực tế coi rằng, biến cố xảy (hoặc vài) phép thử tương lai iii) Trường hợp p xa Ví dụ p(A) 0, (xem [1]) §1.2 XÁC SUẤT ĐIỀU KIỆN (1 tiết) 1.2.1 Xác suất điều kiện Định nghĩa Cho trước hai biến cố A, B với P(A) Xác suất biến cố B tính điều kiện biến cố A xảy gọi xác suất điều kiện biến cố B với điều kiện A, ký hiệu P(B|A), xác định P(B|A) P(AB) , P(A) (P(A) 0) (1.2.1) Mô tả xác suất điều kiện lược đồ Venn cho Hình 1.3 Xét thí nghiệm gieo ngẫu nhiên điểm miền G giả sử biết điểm rơi vào miền A Khi đó, khả điểm rơi vào miền B diƯn tÝch miỊn A B diƯn tÝch miỊn A A AB Hình 1.3 10 B Giả thuyết bị bác bỏ mức Z E[Z] (Z E[Z]) n z /2 , V[z] 1 0 0 E[Z] ln 0 2(n 1) BÀI TẬP: Kiểm định dùng mẫu (tiếp - tiết) Kiểm định dùng hai mẫu (2 tiết) b) Thảo luận c) Tự học d) Bài tập chuẩn bị tối thiểu Tài liệu Bài tập chuẩn bị cho chương Tài liệu [1]: 5(1- - 5- 6- - 9- 12- 14 - 15 ) Tài liệu [2]: Tr187-189: 3, 4, 6, 8, 10, 14, 16, 17, 22, 26, 28 Tài liệu [1], tr ĐỀ CƯƠNG BÀI GIẢNG Học phần: XÁC SUẤT THỐNG KÊ Đơn vị: Bộ mơn Tốn, Khoa CNTT Thời gian: Tuần lễ: 14, Tiết 53 - 56 Giáo viên: Tô Văn Ban, Tạ Ngọc Ánh, Phan Thu Hà Chương Mơ hình hồi quy tuyến tính §5.1 Mơ hình hồi quy tuyến tính đơn §5.2 Mơ hình hồi quy tuyến tính bội Mục đích Nắm cách lập mơ hình, số kiểm định, số - yêu cầu cách sử dụng MH TT đơn, bội a) Bài giảng Chương MÔ HÌNH HỒI QUY TUYẾN TÍNH § 5.1 MƠ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN (1 tiết) 5.1.1 Vấn đề mơ hình hồi quy Nhiều tốn khoa học kỹ thuật đòi hỏi khảo sát quan hệ hai nhiều biến Lấy làm ví dụ, xét số liệu Bảng 5.1, y thị độ oxy sinh trình chưng cất hóa học, x nồng độ phần trăm hydrocarbon có mặt bình ngưng phận chưng cất 35 Bảng 5.1 Độ oxy ứng với tỷ lệ phần trăm hydrocarbon TT x(%) 0.99 1.02 1.15 1.29 1.46 1.36 0.87 y(%) 90.01 89.05 91.43 93.74 96.73 94.45 87.59 TT 10 11 12 13 14 x(%) 1.23 1.55 1.4 1.19 1.15 0.98 1.01 y(%) 91.77 99.42 93.65 93.54 92.52 90.56 89.54 TT 15 16 17 18 19 20 21 x(%) 1.11 1.2 1.26 1.32 1.43 0.95 1.32 y(%) 89.85 90.39 93.25 93.41 94.98 87.33 94.01 Để tổng quát hóa, nên dùng mơ hình xác suất cách coi Y BNN mà ứng với giá trị x biến X Y f (x) (5.1.2) với sai lầm ngẫu nhiên Trước hết xét trường hợp đơn giản nhất, hay xảy thực tế, f (x) ax b Khi (5.1.2) trở thành (5.1.3) Y ax b 100 95 90 85 1.0 1.2 1.4 1.6 Hình 5.1 Đồ thị rải điểm, đường hồi quy cho số liệu độ oxy Mơ hình (5.1.3) gọi mơ hình hồi quy (MHHQ) tuyến tính đơn; x gọi biến hồi quy (hay biến độc lập, biến giải thích), Y gọi biến phản hồi (hay biến phụ thuộc, biến giải thích); a, b gọi tham số hồi quy, a: hệ số chặn, b: hệ số góc; đường thẳng y ax b gọi đường hồi quy (lý thuyết) Mơ hình gọi tuyến tính tuyến tính với tham số a, b (a, b có lũy thừa 1); gọi đơn có biến hồi quy Ở §5.2 xét mơ hình hồi quy bội với biến hồi quy Người ta xét mơ hình hồi quy phi tuyến, hàm hồi quy hàm phi tuyến tham số (xem [1], [9]) Giả sử quan sát thứ i biến X nhận giá trị x i , biến Y nhận giá trị yi sai lầm ngẫu nhiên i Như vậy, dạng quan sát, mơ hình (5.1.3) trở thành 36 y1 a bx1 1 y a bx n n n Lưu ý yi BNN (5.1.4) 5.1.2 Ước lượng hệ số hồi quy Bây giả sử BNN y1, , y n nhận giá trị cụ thể đó, ký hiệu y1, , yn Khi i yi (ax i b) (5.1.5) thể độ lệch quan sát thứ i so với đường hồi quy lý thuyết (xem Hình 5.2) Tổng bình phương độ lệch n n i 1 i 1 ei2 (yi (a bx i ))2 thể “chất lượng” việc xấp xỉ số liệu đường hồi quy lý thuyết Ta biết đường hồi quy lý thuyết, việc ta làm tìm hệ số a, b để n (a, b) (yi (a bx i ))2 (5.1.6) i 1 Vì (a, b) đa thức bậc ẩn a, b; điều kiện cần để đạt cực tiểu a b (5.1.7) Độ lệch Đường hồi quy thực nghiệm Đường hồi quy lý thuyết Hình 5.2 Độ lệch đường hồi quy lý thuyết, thực nghiệm Thực chứng minh điều kiện đủ Đây hệ phương trình tuyến tính bậc a, b khơng khó khăn ta tính nghiệm hệ là: 37 ˆ xy x y b SXX / n ˆ ˆ a y b x (5.1.8) x n n n n x i ; y yi ; xy x i yi ; SXX (x i x) (5.1.9) n i1 n i1 n i1 i 1 Với ƯL ta phương trình hồi quy thực nghiệm ˆ bˆ y ax (5.1.10) 5.1.3 Tính chất ước lượng hệ số hồi quy ˆ Như vậy, đường hồi quy qua điểm “trung Từ (5.8) ta có y aˆ bx tâm” (x, y) số liệu Giả thiết: 1 , , n độc lập, phân bố chuẩn N(0; 2 ) (5.1.11) Khi ƯL hệ số có tính chất thống kê tốt thể định lý sau Định lý 5.1 Khi điều kiện (5.1.11) thỏa mãn thì: i) aˆ bˆ ƯL không chệch tham số a b: ˆ a; E[a] ˆ b E[b] (5.1.12) ii) Phương sai ƯL aˆ bˆ tính sau 2a 2 (x) ˆ , V[a] n S XX ˆ 2b V[b] SXX (5.1.13) iii) ƯL không chệch phương sai chung mơ hình cho ˆ n n e (yi yˆ i ) i n i1 n i1 (5.1.14) với ˆ : dự báo quan sát thứ i yˆ i aˆ bx i ei yi yˆ i : phần dư thứ i Định nghĩa Đối với mô hình HQTT đơn, sai số chuẩn hóa (thực nghiệm) hệ số góc hệ số chặn xác định 38 ˆ se(b) ˆ ; SXX x2 ˆ ˆ se(a) n SXX (5.1.15) đó, ˆ tính theo (5.1.14) 5.1.4 Kiểm định giả thuyết a) Sử dụng kiểm định T Hệ số góc tham số quan trọng MHHQ tuyến tính đơn Xét tốn kiểm định giả thuyết hai phía: H : b b0 / H1 : b b0 (5.1.16) Bác bỏ H (ở mức ý nghĩa ) Tb bˆ b ˆ se(b) bˆ b ˆ / SXX t (n 2) (5.1.18) Trường hợp đặc biệt quan trọng b0 : H : b / H1 : b (5.1.19) Điều liên quan đến ý nghĩa (hay tác dụng) hồi quy (significance of regression): Nếu không bác bỏ H (coi b 0) có nghĩa khơng có quan hệ tuyến tính X Y (có thể quan hệ thực X Y quan hệ phi tuyến), thay đổi biến X khơng kéo theo thay đổi dự đốn biến Y, X khơng có (hoặc ít) tác dụng để dự đoán Y; dự đoán cho Y tốt nên dùng Y Tương tự, giả thuyết liên quan đến hệ số chặn H : a a / H1 : a a (5.1.20) Giả thuyết bị bác bỏ mức Ta aˆ a ˆ se(a) aˆ a x2 ˆ n SXX t (n 2) (5.1.22) 5.1.5 Khoảng tin cậy a) Khoảng tin cậy tham số b) Khoảng tin cậy cho đáp ứng trung bình 2 t /2 (n 2) ˆ (x x) , SXX n ˆ yˆ aˆ bx c) Dự đoán quan sát tương lai 39 (5.1.27) ˆ yˆ aˆ bx (5.1.28) Ví dụ 5.1 Thơng thường, người ta nghĩ mức tiêu thụ nhiên liệu không phụ thuộc vào việc lái xe nhanh hay chậm Để kiểm tra người ta cho chạy thử xe nhiều vận tốc khác từ 45 đến 70 dặm/giờ Kết ghi thành bảng Vận tốc Mức tiêu thụ (ml/gal) 45 50 55 60 65 70 75 24,2 25,0 23,3 22,0 21,5 20,6 19,8 Liệu thay đổi cách nghĩ mức tiêu thụ nhiên liệu không phụ thuộc vào vận tốc xe? Tìm khoảng tin cậy 95% cho giá trị trung bình quan sát tương lai mức tiêu thụ nhiên liệu xe vận tốc 50 ml/h Giải Chúng ta xét mô hình HQTT đơn Y a bx , Y mức tiêu thụ nhiên liệu, x vận tốc xe Cần phải xét xem hệ số b có khơng hay khơng Muốn ta xét toán kiểm định: H : b / H1 : b Tính tốn thống kê liên quan ta x 60; SXX 700; y 22,343; SYY 21, 757; SXY 119 aˆ 32,543; bˆ 0.17; SS 1.527 R Mơ hình thực nghiệm: y 32,54 0,17x Tra bảng ta thấy t 0.025 (5) 2,571 Theo (5.1.26), khoảng tin cậy 95% b 1.527 ) ( 0, 224; 0,116) Khoảng không chứa điểm 0, 3500 ta bác bỏ giả thuyết b với mức ý nghĩa 5%; coi b , tức mức tiêu thụ nhiên liệu phụ thuộc vào vận tốc xe Cũng tính trực tiếp để bác bỏ b 0: ( 0,170 2.571 Tb bˆ b ˆ / SXX 0,17 0,305426 700 8,13 2,571 t 0.025 (5) 40 27 25 23 21 19 17 40 50 60 70 80 Hình 5.3 Khoảng tin cậy (2 đường Hyperbol giữa) khoảng dự đốn ( đường hyperbol ngồi) cho mức tiêu thụ nhiên liệu Dùng (5.1.27) (5.1.29), khoảng tin cậy khoảng dự đoán 95% vận tốc 50ml/h 24, 04 2,571 (50 60) (24, 04 1,37) (22,67; 24, 41) 700 (50 60) 24, 04 2,571 (24, 04 2,92) (21,12; 26,96) 700 d) Lưu ý sử dụng MHHQ Trường hợp nội suy Trường hợp ngoại suy y Ngoại suy Nội suy a b Hình 5.4 Dự đốn nội suy ngoại suy 5.1.6 Tính phù hợp mơ hình a) Phân tích phần dư Phần dư ei yi yˆ i Phần dư chuẩn hóa d i ei / ˆ , i 1, , n Có khoảng 95% phần dư chuẩn hóa rơi vào khoảng (-2; 2) 41 Hơn nữa, đồ thị di phải có dạng bình thường, tập trung “đều đặn” dải (-2; 2) quanh trục hồnh dạng (a) Hình 5.5 Vi phạm điều đó, chẳng hạn có dạng (b), (c), (d) phải sửa chữa mơ hình, hay tìm mơ hình khác phân tích lại (a) (b) (c) (d) Hình 5.5 Dáng điệu phần dư b) Hệ số xác định (coefficient of determination) Hệ số xác định ký hiệu R tính theo cơng thức sau: R2 SSR SS 1 E SST SST (5.1.30) Theo (5.1.23’), tính chất hệ số xác định R Gọi rXY hệ số tương quan mẫu cặp điểm (x i , yi ) (xem mục 4.1.2e) ta thấy R rXY (5.1.30’) Giá trị R thường xem thị cho tính “tốt” mơ hình: Khi giá trị gần 1, mơ hình phù hợp tốt; giá trị nhỏ, gần 0, mơ hình khơng phù hợp với số liệu, cần tìm mơ hình khác Tuy nhiên, cần thận trọng, ngưỡng cho mơ hình cụ thể lại điều ta chưa biết, đến thời điểm Lưu ý Liên quan đến máy tính bỏ túi CASIO, ta tính ˆ sau: n n2 n n ˆ 2 R 1 (yi yˆ i ) / n (yi y) n (yn)2 n n i1 i 1 ˆ n (1 R )(yn) n2 (5.1.31) 42 với (yn) S2Y n (yi y) n i1 Ví dụ 5.2 Trong nhà máy sản xuất linh kiện bán dẫn, linh kiện hoàn chỉnh dây bó xếp lại thành khung Người ta quan tâm đến biến: lực kéo (số đo lực làm cho khung bị hỏng), độ dài dây, chiều cao khn đúc Số liệu có 25 quan sát thể cột đầu Bảng 5.5 Trước hết ta quan tâm đến mối quan hệ lực kéo y độ dài x1 dây, để tiện ta ký hiệu x Thể số liệu lên đồ thị, dường quan hệ tuyến tính Chúng ta dùng mơ hình Y ax b để lọc số liệu Ta tính được: x n x i 8, 24; n i1 n SXX (x i x)2 698,56; i 1 n n y yi 29, 0328; n i1 (yn)2 xy xi yi 320,3388; n i1 n (yi y)2 224, 237 n i1 Từ ƯL hệ số xy x y ˆ 5,115 bˆ 2,9027; aˆ y bx SXX / n Ta thu phương trình : Y 5,115 2,9027x ƯL 2 tính theo ˆ (5.1.32) n (yi yˆ i ) Tuy nhiên trước hết ta n i1 tìm hệ số xác định: n SSR n 2 ˆ R (yi y) / (y i y) 0.964 SST i1 i1 Đây giá trị lớn Ta nói có 96,4% số liệu giải thích mơ hình Theo (5.1.31) ˆ n n (yi yˆ i ) (1 R )(yn) 9,5696 3, 0934 n i1 n2 Bây ta kiểm định hệ số b Theo (5.1.15), ˆ se(b) bˆ 2,9027 ˆ 0.1179 Tb 24,80 ˆ SXX 0,1179 se(b) P – giá trị phân bố Student 23 bậc tự ứng với giá trị 24,80 0,000 Vậy ta chấp nhận giả thuyết b 43 Bây ta xét phân tích phương sai n SSR (yˆ i y) 5885,9 SSR /1 5885,9 , i 1 n SSE (yi yˆ i ) 220,1 ˆ i 1 SSE 9,569 n2 n SST (yi y) 6105,9 i 1 F SSR /1 615,08 SSE / (n 2) P - giá trị phân bố F(1, 23) ứng với giá trị 615,08 0,000 nên ta kết luận b 5.1.7 Tuyến tính hóa số mơ hình Dùng phép biến đổi loga với biến hồi quy hay biến phản hồi, với hai, dùng phép nghịch đảo với biến hồi quy , ta đưa số mơ hình dạng tuyến tính Hồi quy logarith y a b.ln x Hồi quy mũ y a.e b.x ( ln y ln a b ln x) Hồi quy lũy thừa Hồi quy nghịch đảo y a.x b ( ln y ln a b ln x) y a b.(1/ x) Hồi quy tam thức y a bx cx Chẳng hạn, cần dùng hồi quy mũ, phần chọn mơ hình ta ấn Exp (3) ; thao tác khác tương tự Sử dụng máy tính bỏ túi Chúng ta mô tả ngắn gọn cách sử dụng máy tính bỏ túi CASIO fx-500MS để tính tốn hồi qui Dầu kết sơ lược so với phần mềm chuyên dụng, song chúng giúp ta định cơng việc Xố nhớ thống kê SHIFT Gọi chương trình tính MODE Chọn mơ hình Lin[1] MODE REG[3] Nhập liệu Chẳng hạn, cần nhập liệu Ví dụ 5.1 ta ấn 45 , 24.2 M Cứ ta nhập cho hết liệu Gọi kết Nhập liệu xong gọi kết Việc gọi kết với biến x y: x i2 , xi , x, s X , s X , yi2 , y i , y, s Y , s Y tiến hành với thống kê biến nêu cuối mục 4.1.2 Bảng 5.4 đưa vài tính tốn số tính tốn khác 44 Bảng 5.4 Một số thao tác phân tích hồi quy máy tính bỏ túi Lượng cần tính Kết Ấn xiyi SHIFT S SUM sY SHIFT S VAR yn [2] SHIFT S VAR yn [3] SHIFT S VAR rXY SHIFT S VAR xˆ (20) SHIFT S VAR yˆ (70) 20 SHIFT S VAR 70 SHIFT S VAR s Y aˆ bˆ xy [3] 9,265 1,762 1,904 32,543 A [1] -0.170 B [2] -0.964 r [3] 73.78 xˆ [1] 20.64 yˆ [2] Sau có giá trị rXY , dùng (5.1.31) ta tính ƯL cho sai số chung ˆ ; ta tính Ta , Tb , § 5.2 MƠ HÌNH HỒI QUY TUYẾN TÍNH BỘI (1 tiết) MHHQ tuyến tính bội mở rộng tự nhiên MHHQ tuyến tính đơn Chúng ta ghi kết tóm tắt 5.2.1 Phương trình hồi quy a) Dạng quan sát dạng ma trận Giả sử mối quan hệ biến phụ thuộc (biến phản hồi) Y k biến độc lập (biến hồi quy) x1, , x k cho mơ hình Y 0 1x1 k x k (5.2.1) 0 , 1 , , k tham số chưa biết, gọi hệ số hồi quy, 0 gọi hệ số chặn, 1, , k hệ số góc; sai số ngẫu nhiên có kỳ vọng phương sai Khi không sợ nhầm lẫn, ta viết ngắn gọn (5.2.1) dạng E[Y | x1 , , x k ] 0 1x1 k x k (5.2.2) hay đơn giản E[Y] 0 1x1 k x k (5.2.3) Để tìm hiểu mơ hình (5.2.1) tiến hành n quan sát ghi lại kết dạng bảng Bảng 5.5 Bảng 5.5 Số liệu cho mơ hình hồi quy bội 45 y y1 yn x1 x11 x n1 x2 x12 x n2 xk x1k x nk Như vậy, dạng quan sát, mơ hình (5.2.1) viết lại dạng y1 0 1x11 k x1k 1 y x x n1 k nk n n (5.2.4) Để thuận lợi cho ký hiệu phân tích tiếp theo, sử dụng ký hiệu ma trận sau y1 y ; y n β ; k 1 x11 x12 x1k X 1 x n1 x n x nk ε 1 n Khi đó, phương trình (5.2.4) viết lại dạng ma trận (5.2.5) y = X β + ε, y n - véc tơ quan sát, X ma trận cấp n p biến độc lập ( p k ) - gọi ma trận kế hoạch - β p - véc tơ hệ số hồi quy, ε n - véc tơ sai số ngẫu nhiên b) Tuyến tính hóa số mơ hình Mơ hình (5.2.3) tuyến tính tuyến tính với tham số i Trong ứng dụng thường gặp mơ hình dạng E[Y] 1g1 (x1 , , x ) pg p (x1 , , x ) (5.2.6) g1 , , g p hàm biến hồi quy x1, , x Đây mô hình tuyến tính với tham số i , phi tuyến với biến x1, , x Xét phép đổi biến z1 g1 (x1, , x ); ; z p g p (x1 , , x ) Ta đưa (5.2.5) dạng thông thường (5.2.7) E[Y] 1z1 p z p mơ hình tuyến tính với tham số lẫn biến hồi quy Như từ ta gọi mơ hình (5.2.6) tuyến tính Xét số trường hợp đặc biệt b1 Hồi quy đa thức Xét mơ hình 46 E[Y] a a1x a k x k Đặt z1 x; ; z k x k , ta đưa mơ hình dạng E[Y] a a1z1 a k zk Đặc biệt, người ta hay xét mơ hình tam thức đa thức bậc ba: E[Y] a cx cx , E[Y] a cx cx dx b2 Mơ hình đa thức bậc hai biến Đó mơ hình E[Z] a bx cy dx exy fy Đây mơ hình tuyến tính với tham số a, b, c, d, e, f Trường hợp giả thuyết e bị bác bỏ, ta nói hai biến hồi quy x y tương tác với nhau, mơ hình có chứa số hạng tích chéo xy Trái lại, e , ta nói mơ hình khơng chứa số hạng tích chéo xy, biến x y khơng tương tác với b3 Dùng phép biến đổi loga với biến phản hồi b4 Hồi quy có chứa sin, cos Giả sử biến phụ thuộc có dạng Y(t) a bt csin t d cos t Bằng cách đặt x1 t; x sin t; x cos t , ta đưa mơ hình dạng tuyến tính thơng thường 5.2.4 Ước lượng dự đoán a) Khoảng tin cậy cho tham số đơn lẻ b) Khoảng tin cậy cho đáp ứng trung bình c) Dự đốn cho quan sát ƯL điểm dự đoán cho quan sát tương lai mức x 01 , , x 0k biến độc lập yˆ = x0T 0 1x 01 k x 0k Khoảng dự đoán 100(1 )% cho quan sát tương lai yˆ t /2 (n p) ˆ (1 x 0T ( X T X) 1 x ) (5.2.17) 5.2.6 Sử dụng phần mềm Các phần mềm thống kê ngày cho phép phân tích mơ hình với số biến hồi quy lên đến hàng ngàn số quan sát lên đến hàng chục vạn Chúng ta cần có kiến thức để tận dụng lợi phần mềm Mỗi phần mềm có mạnh nó, song chúng có phần phân tích hệ số phân tích phương sai Chúng ta tìm hiểu sơ qua vài ví dụ 47 Ví dụ 5.3 ( Phân tích số liệu lực kéo) Chúng ta lấy lại ví dụ lực kéo Ví dụ 5.2 Giả sử nhập số liệu vào cửa sổ biên tập liệu Sau số thao tác Bảng 5.5 Kết xử lý với số liệu lực kéo dây dẫn TT 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Lực kéo yi 9.95 24.45 31.75 35.00 25.02 16.86 14.38 9.60 24.35 27.50 17.08 37.00 41.95 11.66 21.65 17.89 69.00 10.30 34.93 46.59 44.88 54.12 56.63 22.13 21.15 Độ dài x1 11 10 2 11 12 4 20 10 15 15 16 17 Độ cao x2 50 110 120 550 295 200 375 52 100 300 412 400 500 360 205 400 600 585 540 250 290 510 590 100 400 Dự báo yˆ i 8.38 25.60 33.95 36.60 27.91 15.75 12.45 8.40 28.21 27.98 18.40 37.46 41.46 12.26 15.81 18.25 64.67 12.34 36.47 46.56 47.06 52.56 56.31 19.98 21.00 Phần dư ei 1.57 -1.15 -2.20 -1.60 -2.89 1.11 1.93 1.20 -3.86 -.48 -1.32 -.46 49 -.60 5.84 -.36 4.33 -2.04 -1.54 03 -2.18 1.56 32 2.15 15 Phần dư chuẩn hóa d i 687 -.501 -.963 -.698 -1.265 487 843 523 -1.689 -.208 -.578 -.202 215 -.263 2.553 -.158 1.894 -.890 -.674 013 -.953 681 141 939 067 Ta thấy hệ số xác định R 0,981 , có 98,1% số liệu giải thích mơ hình; tỷ lệ lớn ƯL cho phương sai chung mơ hình ˆ 2,28812 Mức ý nghĩa thống kê F 0,000, nhỏ so với 0,01: Mơ hình có tác dụng tốt để giải thích số liệu Tất mức ý nghĩa thổng kê T tham số nhỏ 0,05 ( giá trị cực đại 0,044 ứng với biến số) Hậu khoảng tin cậy tất hệ số không chứa gốc tọa độ Như vậy, kiểm định T không bác bỏ mơ hình Mơ hình dự tuyển Y 2, 264 2,744x1 0,013x BÀI TẬP: Kiểm định phi tham số (2 tiết) b) Thảo luận c) Tự học 48 (*) d) Bài tập chuẩn bị tối thiểu Tài liệu Tài liệu [1], tr ĐỀ CƯƠNG BÀI GIẢNG Học phần: XÁC SUẤT THỐNG KÊ Đơn vị: Bộ mơn Tốn, Khoa CNTT Thời gian: Tuần lễ: 15, Tiết 57 - 60 Giáo viên: Tô Văn Ban, Tạ Ngọc Ánh, Phan Thu Hà Ôn tập Bài tập Hệ số tương quan (1tiết) Mô hình hồi quy tuyến tính (1 tiết) Chữa chưa có điều kiện chữa (2tiết) (Giáo viên làm chính) Nhắc lại câu hỏi lý thuyết, cách học chúng Chuẩn bị Một số kinh nghiệm thi thi Nhắc lại tinh thần nghiêm túc thi cử Nhắc số quy đinh kỳ thi Mục đích Củng cố tập cũ yêu cầu Sẵn sàng để thi cuối học kỳ a) Bài giảng 49 ... n th× P p n BÀI TẬP: Xác suất biến cố (1 tiết) Xác suất điều kiện (2 tiết) b) Thảo luận c) Tự học d) Bài tập chuẩn bị tối thiểu Tài liệu [1], tr Tài liệu # ĐỀ CƯƠNG BÀI GIẢNG Học phần: XÁC... số ngẫu nhiên x1, x2 , BÀI TẬP: Biến ngẫu nhiên hàm phân bố (2tiết) b) Thảo luận c) Tự học d) Bài tập chuẩn bị tối thiểu Tài liệu [1], tr Tài liệu 27 ĐỀ CƯƠNG BÀI GIẢNG Học phần: XÁC SUẤT THỐNG... 23- 26 - 27- 30-32) Tài liệu [2]: Tr 76-78: 2, 4, (sửa x thành |x|), 10 Tài liệu [1], tr ĐỀ CƯƠNG BÀI GIẢNG Học phần: XÁC SUẤT THỐNG KÊ Đơn vị: Bộ mơn Tốn, Khoa CNTT Thời gian: Tuần lễ: 4, Tiết