Ứng dụng của Xác suất Thống kê Trong cuộc sống hàng ngày thường gặp những hiện tượng không chắc chắn, thường gặp các “sự kiện” ngẫu nhiên. Ngẫu nhiên là một phần tất yếu của cuộc sống. XSTK kê trở thành ngành khoa học quan trọng, đặc biệt là những ứng dụng của nó. Cuốc sống càng hiện đại, con người càng bận rộn và chịu nhiều sức ép phải đối mặt với rất nhiều lựa chọn để đưa ra quyết định của mình. Quyết định chính xác sẽ dẫn chúng ta đến thành công. XSTK là cần thiết, nó là công cụ trợ giúp không thể thiếu khi mỗi cá nhân phải đứng trước các lựa chọn tình huống để đưa ra quyết định. XSTK ứng dụng trong một số lĩnh vực: Trong khoa học; Trong kinh tế, kỹ thuật; Trong TK dân số; Trong nông nghiệp; Trong Y học; Ứng dụng trong Địa chất, Địa lý, Khí hậu học, Khí tượng thủy văn. Ngoài ra, các phương pháp của XSTK còn được ứng dụng rộng rãi trong giao thông vận tải, bưu điện, thông tin liên lạc, phục vụ đám đông, đặc biệt là trong quốc phòng 1.2.1.3. Đặc điểm của môn Xác suất Thống kê Do đó đặc điểm của XSTK là: “ phát hiện cái ổn định trong cái có vẻ bất định, cái tất yếu trong cái ngẫu nhiên bằng phương pháp Toán học” ; Môn XSTK có hai phần tương đối độc lập về cấu trúc nhưng gắn rất chặt về nội dung. Phần lý thuyết XS và phần TK. 1.2.1.4. Đối tượng nghiên cứu của Xác suất Thống kê Đối tượng nghiên cứu của XSTK là các hiện tượng ngẫu nhiên, các quy luật ngẫu nhiên mà chúng ta thường gặp trong thực tế.
Phần Xác suất Chương Khái niệm phép tốn 1.1 Giải tích tổ hợp 1.1.1 Qui tắc cộng, quy tắc nhân a Quy tắc cộng Nếu công việc chia thành k trường hợp để thực hiện, trường hợp có n1 cách thực xong cơng việc, trường hợp hai có n2 cách thực xong công việc, , trường hợp k có nk cách thực xong cơng việc khơng có cách thực trường hợp lại trùng với cách thực trường hợp khác Khi ta có: n n1 n2 nk cách thực công việc b Qui tắc nhân Giả sử cơng việc chia thành k giai đoạn Có n cách thực giai đoạn thứ nhất, n2 cách thực giai đoạn thứ hai, , nk cách thực giai đoạn thứ k Khi ta có: n n1.n2 nk cách thực cơng việc Ví dụ 1.1.1 Giả sử để từ A đến C ta bắt buộc phải qua điểm B Có đường khác để từ A đến B có đường khác để từ B đến C Vậy có n = 3.2 = cách khác để từ A đến C 1.1.2 Chỉnh hợp a Chỉnh hợp không lặp Định nghĩa 1.1.2 Một chỉnh hợp chập k n phần tử nhóm thứ tự gồm k phần tử khác lấy từ n phần tử cho ( k n ) n! Ký hiệu công thức: Ank n(n 1) (n k 1) (n k ) ! Như vậy: Hai chỉnh hợp chập k n phần tử khác nếu: - Hoặc chúng có phần tử khác nhau; - Hoặc chúng gồm k phần tử xếp theo thứ tự khác 52 Ví dụ 1.1.3 Một lớp phải học 10 môn, ngày phải học môn Hỏi có cách xếp thời khóa biểu ngày Giải: Vì cách xếp thời khóa biểu ngày việc ghép hai mơn số 10 môn, cách xếp khác có mơn khác thứ tự xếp trước sau hai môn Vì cách xếp ứng với chỉnh hợp chập từ 10 phần tử Tức có: A10 10.9 90 (cách) b Chỉnh hợp có lặp Định nghĩa 1.1.4 Một chỉnh hợp có lặp chập k n phần tử nhóm thứ tự gồm k phần tử lấy từ n phần tử cho phần tử có mặt đến n lần nhóm tạo thành Ký hiệu cơng thức: Ank n k Ví dụ 1.1.5 Để đăng ký xe máy người ta dùng chữ số từ 0,1, ,9 cho sêri Hỏi sêri đăng ký xe Giải: Số xe máy đăng ký sêri chỉnh hợp có lặp chập 10 (trừ thực tế khơng dùng chữ số 0) A10 10 9999 (xe) Ví dụ 1.1.6 Để truyền tin tín hiệu mooc-xơ gồm hai kí hiệu chấm (.) vạch (-), người ta mã hóa chữ bảng chữ thành nhóm có thứ tự gồm khơng q kí hiệu Biết kí hiệu có mặt nhiều lần nhóm có thứ tự tạo thành Hỏi mã hóa chữ ? Giải: Một nhóm có thứ tự gồm k kí hiệu (1 k 4) tạo nên chỉnh hợp lặp chập k từ phần tử cho Vì số chữ mã hóa là: A12 A22 A23 A24 12 2 23 30 Như bảng chữ thứ tiếng gồm khơng q 30 chữ ta mã hóa theo cách 1.1.3 Hoán vị Định nghĩa 1.1.7 Hoán vị chỉnh hợp không lặp chập n n phần tử Hay hoán vị n phần tử nhóm có thứ tự gồm đủ mặt n phần tử cho Vậy hoán vị n phần tử khác thứ tự xếp phần tử Kí hiệu cơng thức: Pn n(n 1)(n 2) n! Ví dụ 1.1.8 Có cách xếp người ngồi vào ghế dài gồm chỗ Giải: Số cách xếp người vào ghế dài gồm chỗ hốn vị phần tử, nên ta có P5 5! 5.4.3.2.1 120 (cách) Ví dụ 1.1.9 Có cách xếp n đại biểu ngồi quanh bàn tròn Giải: Do chỗ ngồi quanh bàn trịn khơng có phần tử thứ phần tử cuối nên đại biểu thứ ngồi tự Các đại biểu cịn lại có số cách chọn vị trí ngồi là: (n-1),(n-2), ,1 53 Vậy cách xếp n đại biểu ngồi quanh bàn tròn là: (n 1)! (cách) 1.1.4 Tổ hợp Định nghĩa 1.1.10 Một tổ hợp chập k n phần tử (k n) nhóm khơng phân biệt thứ tự gồm k phần tử khác lấy từ n phần tử cho n! Ký hiệu công thức: Cnk k !(n k )! Vậy: Mỗi tổ hợp gồm phần tử khác nhau, hai tổ hợp khác phần tử chứa chúng khác khác thứ tự phần tử Một vài tính chất tổ hợp: + C nk C nnk + Cn0 Cnn (Quy ước: ! 1) + C1n Cnn 1 n + Cnk1 Cnk Cnk 1 Ví dụ 1.1.11 10 đội bóng thi đấu với theo thể thức đấu vòng Hỏi phải tổ chức trận đấu? Giải: Mỗi trận đấu ứng với nhóm gồm phần tử từ 10 đội (không phân biệt thứ tự) Vì phải tổ chức tất cả: 10.9 C10 45 trận đấu Chú ý: * Để nhận dạng hoán vị n phần tử ta thường dùng dấu hiệu đặc trưng sau: + n phần tử phải có mặt; + Mỗi phần tử xuất lần; + Có thứ tự phần tử * Ta sử dụng khái niệm chỉnh hợp gặp tình huống: + Phải chọn k phần tử từ n phần tử; + Sắp thứ tự k phần tử * Ta sử dụng khái niệm tổ hợp gặp tình huống: + Cần chọn từ tập có n phần tử tập có k phần tử; + Lưu ý tập k phần tử ta khơng quan tâm đến thứ tự phần tử 1.2 Phép thử biến cố 1.2.1 Phép thử biến cố 54 Định nghĩa 1.2.1 Khi thực nhóm điều kiện ta nói thực phép thử Hiện tượng xét phép thử gọi biến cố (hay kiện) Ví dụ 1.2.2 Tung xúc xắc thực phép thử Hiện tượng xúc xắc xuất mặt chấm; xúc xắc xuất mặt chấm; xúc xắc xuất mặt có số chấm lớn 6; xúc xắc xuất mặt có số chấm nhỏ biến cố Ví dụ 1.2.3 Tung đồng xu thực phép thử Hiện tượng: đồng xu xuất mặt sấp; đồng xu xuất mặt ngửa biến cố Phân loại phép thử: loại + Phép thử lặp: Là phép thử thực điều kiện + Phép thử không lặp: Là phép thử thực điều kiện khác Phân loại biến cố: loại + Biến cố ngẫu nhiên: biến cố xảy không xảy thực phép thử Ký hiệu: A, B, C, Ví dụ 1.2.4 Trong ví dụ 1.2.2 trên, biến cố “xúc xắc xuất mặt ba chấm”, “xúc xắc xuất mặt chấm” biến cố ngẫu nhiên + Biến cố chắn: biến cố định xảy thực phép thử Ký hiệu: U (hoặc ) Ví dụ 1.2.5 Trong ví dụ 1.2.2 trên, biến cố “xúc xắc xuất mặt có số chấm nhỏ 7” biến cố chắn + Biến cố khơng thể có: biến cố định không xảy thực phép thử Ký hiệu: V (hoặc ) Ví dụ 1.2.6 Trong ví dụ 1.2.2 trên, biến cố “xúc xắc xuất mặt có số chấm lớn 6” biến cố khơng thể có 1.2.2 Quan hệ biến cố a Hợp (tổng) biến cố Định nghĩa 1.2.7 Biến cố A gọi hợp biến cố A1, A2 , , An A xảy biến cố Ai (i 1, , n) xảy Và ta viết: A A1 A2 An Ví dụ 1.2.8 Tung xúc xắc, gọi Ai biến cố “xuất mặt i chấm“ (i=1,2, 6); gọi A biến cố “xuất mặt có số chấm chẵn” Khi ta có A A2 A4 A6 b Giao (tích) biến cố Định nghĩa 1.2.9 Biến cố B gọi giao biến cố A1, A2 , , An B xảy tất biến cố Ai (i 1, , n) xảy Và ta viết: B A1 A2 An Ví dụ 1.2.10 Một mạch điện gồm bóng đèn mắc song song Gọi A biến cố “bóng thứ bị cháy điện tải ”; B biến cố “bóng thứ bị cháy điện 55 tải”; C biến cố “mạch điện bị ngắt điện tải”, C A B C xảy biến cố A B đồng thời xẩy c Biến cố xung khắc Định nghĩa 1.2.11 Hai biến cố A B gọi xung khắc với chúng không đồng thời xẩy phép thử Như vậy, A B xung khắc thì: A B V Ví dụ 1.2.12 Tung xúc xắc, gọi A biến cố “xuất mặt chấm”; B biến cố “xuất mặt chấm”, A B xung khắc d Biến cố đối lập Định nghĩa 1.2.13 Biến cố không xảy biến cố A gọi biến cố đối lập A Kí hiệu biến cố đối lập biến cố A A A A U Như ta có: A A V Ví dụ 1.2.14 Bắn viên đạn vào bia, biến cố “bắn trúng bia” biến cố “bắn trượt bia” hai biến cố đối lập e Hệ đầy đủ biến cố Định nghĩa 1.2.15 Các biến cố A1 , A2 , , An gọi hệ đầy đủ biến cố kết phép thử xẩy biến cố (i j ) Ai A j V Nghĩa ta có n Ai U i 1 Ví dụ 1.2.16 Gieo xúc xắc Gọi Ai biến cố “xúc xắc xuất mặt i chấm” (i=1,2, 6) biến cố A1; A2 ; A3 ; A4 ; A5 ; A6 tạo nên hệ đầy đủ biến cố Nếu khả xẩy biến cố ta gọi hệ đầy đủ đồng khả 1.2.3 Biến cố sơ cấp không gian biến cố sơ cấp Một biến cố ngẫu nhiên gọi phức hợp biểu diễn dạng hợp hai biến cố không đồng với Một biến cố khơng phức hợp gọi biến cố sơ cấp (Nói cách khác: Các kết có phép thử thực gọi biến cố sơ cấp-hoặc biến cố bản) Vậy biến cố phức hợp xuất theo nhiều cách khác Biến cố sơ cấp xuất theo cách Các biến cố sơ cấp đôi xung khắc Tập hợp biến cố sơ cấp phép thử gọi không gian biến cố sơ cấp 1.3 Các định nghĩa xác suất Mọi biến cố ngẫu nhiên giống chỗ chúng không chắn, khả xảy biến cố lại khác Với biến cố ngẫu 56 nhiên, người ta dùng số để đặc trưng cho khả xảy biến cố nhiều hay ít, số gọi xác suất biến cố A Ký hiệu: P(A) (P viết tắt từ chữ Probability) 1.3.1 Định nghĩa cổ điển xác suất a Định nghĩa 1.3.1 Giả sử phép thử có n kết đồng khả xảy Khi xác suất xuất biến cố A phép thử tỷ số số kết cục thuận lợi cho A tổng số kết cục đồng khả xẩy thực phép thử m Nghĩa là: p( A) , đó: m số kết cục thuận lợi cho A; n tổng số kết n cục đồng khả xẩy b Tính chất: (a) P( A) (b) P(U ) (c) P(V ) Ví dụ 1.3.2 Trong lơ xổ số có 100 vé có vé có thưởng Mua ngẫu nhiên vé Tính xác suất để vé mua có vé trúng thưởng Giải: Gọi A biến cố “trong vé mua có vé có thưởng” Số cách mua vé là: n C100 Số kết cục thuận lợi cho A m C82 C92 Vậy P( A) C82 C92 C100 Ví dụ 1.3.3 Một người gọi điện thoại quên số cuối số điện thoại nhớ chúng khác Tìm xác suất để quay ngẫu nhiên lần số cần gọi Giải: Gọi A biến cố “quay ngẫu nhiên lần số cần gọi” Số kết cục đồng khả là: n A10 90 ; Số kết cục thuận lợi cho A là: m Vậy P( A) 90 Ví dụ 1.3.4 Trên bia kích thước có ghi chữ : ghi chữ H, ghi chữ O; ghi chữ C; ghi chữ A; ghi chữ T ghi chữ N Tính xác suất để xếp ngẫu nhiên bìa thành hàng ngang đọc chữ "HOCTOAN" Giải: Gọi A biến cố “đọc thành chữ HOCTOAN” Số kết cục đồng khả n 7! Số kết cục thuận lợi m 1.2!.1 57 7! Ví dụ 1.3.5 Một hộp chứa cầu trắng cầu đen kích thước Rút ngẫu nhiên lúc cầu Tính xác suất để bốn cầu rút có: a/ cầu đen b/ Ít cầu đen c/ Toàn cầu trắng Giải: Vậy P( A) Ta thấy rút ngẫu nhiên lúc 10 cầu có n = C10 cách a/ Gọi A kiện "trong cầu rút có cầu đen" Số kết cục thuận lợi A m = C32 C72 C32 C72 0,3 C10 b/ Gọi B kiện "trong cầu rút có cầu đen" Vậy P(A) = Số kết cục thuận lợi B m = C32 C72 C71 C33 Vậy P(B) = C72 C32 C71 C33 C10 c/ Gọi C kiện "4 cầu rút toàn cầu trắng" Số kết cục thuận lợi C m = C74 C74 Vậy P(C) = C10 c Ưu điểm hạn chế định nghĩa cổ điển xác suất + Ưu điểm tìm xác suất biến cố ta tiến hành phép thử (Phép thử tiến hành cách giả định) + Hạn chế: Nó địi hỏi số kết cục đồng khả xẩy phép thử phải hữu hạn Hạn chế lớn định nghĩa cổ điển thực tế nhiều biểu diễn kết phép thử dạng tập hợp kết cục đồng khả 1.3.2 Định nghĩa thống kê xác suất a Định nghĩa tần suất Định nghĩa 1.3.6 Tần suất xuất biến cố A n phép thử tỷ số số phép thử biến cố xuất tổng số phép thử thực m Kí hiệu: f ( A) n Ví dụ 1.3.7 Để nghiên cứu khả xuất mặt sấp tung đồng xu, người ta tiến hành tung đồng xu nhiều lần thu kết sau: 58 Người làm thí nghiệm Buffon Pearson Pearson Số lần tung (n) 4040 12000 24000 Số lần mặt sấp (m) 2048 6019 12012 Tần suất f(A)=m/n 0,5069 0,5016 0,5005 b Định nghĩa xác suất theo thống kê: Định nghĩa 1.3.8 Xác suất xuất biến cố A phép thử số p không đổi mà tần suất f xuất biến cố n phép thử hội tụ theo xác suất p số phép thử tăng lên vô hạn c Ưu điểm hạn chế định nghĩa xác suất theo thống kê + Ưu điểm: Nó khơng địi hỏi điều kiện áp dụng với định nghĩa cổ điển Nó hồn tồn dựa quan sát thực tế để làm sở kết luận xác suất xảy biến cố + Hạn chế: Chỉ áp dụng tượng ngẫu nhiên mà tần suất có tính ổn định Để xác định cách tương đối xác giá trị xác suất ta phải tiến hành thực tế số đủ lớn phép thử 1.3.3 Nguyên lý xác suất lớn xác suất nhỏ Trong nhiều toán thực tế ta thường gặp biến cố có xác suất nhỏ, tức gần khơng Trong trường hợp ta cho biến cố không xảy thực phép thử Thậm chí biến cố có xác suất khơng chưa chắn biến cố khơng thể có, tức xảy Qua quan sát người ta thấy biến cố có xác suất nhỏ gần không xảy tiến hành phép thử Trên sở đưa "Ngun lý thực tế khơng thể có biến cố có xác suất nhỏ" sau đây: Nếu biến cố có xác suất nhỏ thực tế cho phép thử biến cố không xảy (Lưu ý: việc qui định mức xác suất coi nhỏ tùy thuộc vào toán cụ thể) Một xác suất nhỏ mà với cho biến cố thực tế không xảy gọi mức ý nghĩa Tương tự ta đưa "Nguyên lý thực tế chắn xảy biến cố có xác suất lớn" sau: Nếu biến cố ngẫu nhiên có xác suất gần thực tế cho biến cố xảy phép thử (Việc qui định mức xác suất đủ coi lớn tùy thuộc vào toán cụ thể) 1.4 Các định lý xác suất 1.4.1 Định lý cộng xác suất Định lý 1.4.1 Nếu A B biến cố : P( A B) P( A) P( B) P( AB) Định lý 1.4.2 Nếu A, B C biến cố thì: 59 P(A +B + C) = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(ABC) Hệ 1.4.3 (a) Xác suất tổng hai biến cố xung khắc tổng xác suất biến cố đó: P( A B) P( A) P( B) (b) Xác suất tổng biến cố xung khắc đôi tổng xác suất n n biến cố đó: P Ai P( Ai ) i 1 i 1 (c) Nếu biến cố A1, A2 , , An tạo nên hệ đầy đủ biến cố tổng xác suất chúng 1, tức là: n P( Ai ) i 1 (d) Tổng xác suất hai biến cố đối lập 1, tức là: P( A) P( A) Ví dụ 1.4.4 Trong thùng đựng 30 cầu gồm 10 đỏ, xanh 15 trắng Rút hú họa Hãy tính xác suất xuất đỏ xanh Giải: Gọi A kiện "xuất màu đỏ", B kiện "xuất màu xanh" Rõ ràng kiện A, B xung khắc nên: 10 P( A B) P( A) P( B) 0,5 30 30 Ví dụ 1.4.5 Trong cỗ có 52 quân (trong có quân K) Lấy ngẫu nhiên quân Tính xác suất để quân lấy có: a/ Đúng quân K b/ Ít quân K c/ Không quân K Giải: Gọi Ai biến cố "lấy i quân K", (i=0,1,2,3,4) a/ Gọi A kiện "lấy quân K", ta có P( A) P( A2 ) C 42 C 48 C52 0,025 b/ Gọi B kiện "trong quân lấy có quân K" B A2 A3 A4 P( B) P( A2 ) P( A3 ) P( A4 ) C 42 C 48 C 43 C 148 C 44 4 C52 C52 C52 0,025 0,0007 0,0000036 0,026 c/ Gọi C kiện "trong qn lấy có khơng q quân K" C A0 A1 A2 C A3 A4 P(C ) 0,0007 Vậy P(C ) P(C ) 0,9993 60 1.4.2 Định lý nhân xác suất a Định nghĩa xác suất có điều kiện Định nghĩa 1.4.6 Xác suất biến cố A tính với điều kiện biến cố B xảy gọi xác suất có điều kiện A Ký hiệu: P A B Ví dụ 1.4.7 người rút thăm có vé xem đá bóng Trước lúc bắt thăm, xác suất rút vé anh A (cũng anh B) P( A) Nếu cho biết thêm điều kiện trước B rút vé xác suất để A rút vé 1/4 Rõ ràng xuất B (anh B rút vé) thay đổi khả rút vé A 2 Vậy P( A) ; P( A / B) ; P( A / B) 4 b Định lý nhân xác suất Định lý 1.4.8 Xác suất tích biến cố A B tích xác suất biến cố với xác suất có điều kiện biến cố cịn lại P( AB) P( A).P B P( B).P( A ) A B Hệ 1.4.9 P( AB) (a) Nếu P( B) P A B P( B) A (b) P( A1 A2 An ) P( A1 ).P A2 P n A A A A 1 n 1 Ví dụ 1.4.10 Trong bình kín có 10 cầu kích thước có trắng đen lấy ngẫu nhiên liên tiếp khơng hồn lại lần lần Tìm xác suất để: a/ Cả trắng b/ mầu c/ Có mầu trắng Giải: Gọi Ai biến cố "quả lấy lần thứ i có mầu trắng", (i=1,2) a/ Gọi A biến cố "cả mầu trắng" A A1 A2 P( A) P( A1 A2 ) P( A1 ).P( A2 / A1 ) 10 B A1 A2 A1 A2 b/ Gọi B kiện "2 lấy mầu", ta có: P( B) P( A1 ).P A2 P( A1 ).P A2 A1 A1 10 10 15 c/ Gọi C kiện "trong lấy có mầu trắng", C A1.A2 61 Chương Tương quan hồi quy Khi nghiên cứu phụ thuộc hai đại lượng mà đại lượng chịu phân tán ngẫu nhiên ( tản mát kiểm tra ) ta dùng phương pháp phân tích tương quan Phân tích tương quan khơng phát mối quan hệ phụ thuộc chúng mà "lượng hoá" mối quan hệ 4.1 Hệ số tương quan 4.1.1 Phân tích hệ số tương quan Định nghĩa 4.1.1 Giả sử X Y hai đại lượng ngẫu nhiên có D(X) > D(Y) > Hệ số tương quan hai đại lượng ngẫu nhiên X Y, ký hiệu (X,Y) xác định sau: (X,Y) = EX E X Y E Y D( X ) D(Y ) 4.1.2 Tính chất hệ số tương quan (a) (X,Y) = (Y,X) (b) (X,Y) = X Y độc lập với (c) X , Y Nhận xét 4.1.2 - Ta dùng (X,Y) để đo mức độ phụ thuộc tuyến tính hai ĐLNN lớn phụ thuộc tuyến tính rõ Đặc biệt =1 phụ thuộc tuyến tính xẩy với xác suất - Nếu nhỏ mức độ phụ thuộc tuyến tính X Y Đặc biệt = X Y khơng có quan hệ phụ thuộc tuyến tính Trong trường hợp ta nói X Y khơng tương quan với ( ý: hai ĐLNN độc lập với khơng tương quan, điều ngược lại chưa Riêng ĐLNN phân phối chuẩn tính khơng tương quan tính độc lập tương đương nhau.) 4.1.3 Hệ số tương quan mẫu 125 Giả sử tiến hành n quan sát độc lập cặp ĐLNN (X,Y) ta có mẫu ngẫu nhiên kích thước n sau đây: (X1,Y1), (X2,Y2), ,(Xn,Yn) Hệ số tương quan mẫu X Y, ký hiệu r(X,Y) = r xác định công thức sau đây: ( X i X )(Yi Y ) XY X Y n i r= = S X SY 1 ( X i X )2 (Yi Y ) n i n i Nếu mẫu cụ thể xi yi cách điều khoảng hx hy ta dùng phép đổi biến với x0 y0 chọn thích hợp tuỳ theo bảng số liệu y y x x đặt: ui = i vi = i , hx hy u v nuv i i r= u i i i n(u )2 v i n(v ) = uv uv u (u )2 v (v) i Chú ý 4.1.3 Sau đổi biến muốn trở biến cũ thì: x = hx u + x0; sx = hxsu y = hy v + y0 ; sy = hysv Nhận xét 4.1.4 (a) r r > X Y tương quan thuận r < X Y tương quan nghịch (b) 0,7 r X Y tương quan thuận mạnh - r - 0,7 X Y tương quan nghịch mạnh r 0,3 X Y tương quan yếu 4.2 Hồi quy tuyến tính đơn giản 4.2.1 Phương trình hồi quy tuyến tính đơn giản tổng thể Khi có phụ thuộc tuyến tính hai biến ngẫu nhiên tương đối chặt chẽ ta hy vọng xấp xỉ biến hàm tuyến tính biến Nghĩa cần tìm biểu thức aX + b cho xấp xỉ Y tốt theo nghĩa cực tiểu sai số bình phương trung bình E (Y aX b)2 Ta có: E (Y aX b)2 E (Y E ( y)) a( X E ( X )) E (Y ) aE ( X ) b E(Y E(Y ))2 a2 E( X E( X ))2 ( E(Y ) aE( X ) b)2 2aE (Y EY )( X EX ) Vế phải đạt cực tiểu tam thức bậc hai theo a: a D( X ) 2a DX DY DY đạt cực tiểu số hạng ( EY aEX b) Do ta chọn b = E(Y) - aE(X) cịn a tọa độ đỉnh tam thức bậc hai: 126 D( X ) D(Y ) D(Y ) D( X ) D( X ) Khi giá trị nhỏ vế phải giá trị tam thức bậc hai theo a đỉnh nó: DY DY E (Y aX b) DX DX DY DY DY (1 ) DX DX DY DY Vậy biểu thức aX + b cần tìm X EY EX DX DX Phương trình đường hồi qui bình phương trung bình tuyến tính Y theo X là: DY DY DY Y= X EY EX Y = ( X EX ) EY (1) DX DX DX Sai số bình phương trung bình dùng đường hồi qui trung bình tuyến tính để a xấp xỉ Y là: 2y DY (1 ) (2) x Sai số nhỏ gần tức mức độ phụ thuộc tuyến tính hai biến chặt Tương tự phương trình đường hồi qui bình phương trung bình tuyến tính X theo Y là: DX DX DX X= Y EX EY X= (Y EY ) EX (3) DY DY DY Sai số bình phương trung bình dùng đường hồi qui trung bình tuyến tính để xấp xỉ X là: 2x DX (1 ) (4) y Chú ý 4.2.1 Khi có mẫu ngẫu nhiên (xi, yi); i = n ta xây dựng đường hồi qui trung bình tuyến tính thực nghiệm cách thay (1) (3) EY Y ; EX sy s DY DX X r ; r x sy sx DX DY 4.2.2 Phương trình đường hồi quy tuyến tính thực mẫu - Phương trình đường hồi qui bình phương trung bình tuyến tính thực nghiệm Y theo X y=r s x x y s y x - Phương trình đường hồi qui bình phương trung bình tuyến tính thực nghiệm X theo Y s x=r x y y sy x * Ước lượng sai số bình phương trung bình 127 s 2y s 2y (1 r ) ; s 2x s x2 (1 r ) y x Ví dụ 4.2.1 Tính hệ số tương quan phương trình đường hồi qui trung bình tuyến tính thực nghiệm Y X dựa vào số liệu cho bảng tương quan sau: xi yi ni 3 2 5 Giải: Ta thiết lập lại bảng số liệu: xi 2 3 yi 5 ni n ix i 3 2 10 22 niyi 10 45 nixi2 18 16 58 niyi2 27 32 25 50 36 49 219 nixiyi 16 10 30 18 28 111 Nhìn vào bảng số liệu ta có: x = 2,2; y = 4,5; s x 5,8 (2,2) 2 x y = 5,8; = 0,96; s y = 21,9; xy = 11,1; xy x y = 1,2 21,9 (4,5)2 = 1,645; Hệ số tương quan mẫu là: r = ss x y = 1,26 1,2 = 0,952 1,26 Phương trình hồi qui tuyến tính thực nghiệm Y theo X là: y= r s x x y s y x 0,952 1,28 x 2,2 4,5 = 1,24x + 1,76 0,98 Ví dụ 4.2.2 Ở vùng có nghề phụ thủ cơng, quan sát 10 gia đình tiêu thức: Số trẻ em 16 tuổi (X) thu nhập thêm nghề phụ (Y đơn vị nghìn đồng) thu số liệu sau: Gia đình A B C D E G H I K L Số trẻ em 16 tuổi (X) 4 3 Thu nhập Y (Nghìn đồng) 58 89 72 71 68 64 98 49 59 62 a/ Hãy khảo sát mối tương quan hai tiêu thức b/ Xây dựng đường hồi qui bình phương trung bình tuyến tính thực nghiệm thu nhập theo số trẻ em c/ Ước lượng sai số bình phương trung bình 128 Giải: a/ Ta thấy mi =1 với i Đặt ui = xi - ta có bảng số liệu sau: xi 4 3 yi 58 89 72 71 68 64 98 49 59 62 690 u i2 1 0 1 21 ui -1 -2 0 -3 -1 -1 -5 yi2 3364 7921 5184 5041 4624 4096 9604 2401 3481 3844 49560 uiyi -58 89 -144 0 196 -147 -59 -62 -185 Từ bảng ta thấy: u 5 /10 0,5 u 0,25 x 3,5 y 4761 y 690 /10 69 u 21/ 10 2,1 y 49560 / 10 4956 uy 185 /10 18,5 s y 4956 4761 13,964 su 2,1 0,25 1,36 s x 18,5 (0,5) 69 0,842 1,36 13,964 Điều chứng tỏ có phụ thuộc tuyến tính chặt chẽ thu nhập số trẻ em Sự phụ thuộc đồng biến b/ Phương trình đường hồi qui bình phương tuyến tính thực nghiệm thu nhập theo số trẻ là: 13,964 y 0,842 ( x 3,5) 69 1,36 y 8,6446 x 39,256 r c/ Ước lượng sai số bình phương trung bình s 2y 195 (1 0,842 ) 56,745 x Ví dụ 4.2.3 Nghiên cứu mối liên hệ X số tiền đầu tư cho việc phòng bệnh tính theo đầu người Y tỷ lệ người mắc bệnh 50 địa phương, ta thu bảng tương quan thực nghiệm sau đây: (X: đơn vị nghìn đồng; Y: tính theo phần trăm) Y X 2,5 100 129 3,5 200 300 400 500 4 6 a/ Tìm hệ số tương quan tuyến tính b/ Tìm phương trình hồi qui tuyến tính Y X qua mẫu c/ Nếu năm sau đầu tư cho phịng bệnh 600.000 đồng/người tỷ lệ mắc bệnh khoảng phần trăm? Giải: Đặt ui y 3 xi 300 ; vj j 100 0,5 Ta có bảng số liệu sau: V -2 -1 U -2 -1 1 -2 6 -24 ni ni ui ni ui2 -4 -12 -10 20 -4 11 -11 11 -6 13 0 -6 1 12 12 12 18 36 79 -6 ni ni vi 13 13 12 50 -14 -13 12 10 -5 ni vi2 28 13 12 20 73 ni ui 9; n j v j 5; ni ui2 79; n j v 2j 73; nuv 63 u 0,18; v 0,1; u 1,58; v 1,46; uv 1,26; uv u.v = - 0,829 su sv b/ x 318; y 2,95 ; s x 124,4 ; -63 su 1,244; sv 1,204 a/ r Phương trình hồi qui y r s y 0,602 sy ( x x) y = - 0,004x + 4,222 sx c/ y (x=600) = - 0,004.600 + 4,222 = 1,822 % BÀI TẬP CHƯƠNG Cho bảng tương quan thực nghiệm chiều: (Từ ý đến ý 22) a/ Hãy tìm hệ số tương quan mẫu? b/ Viết phương trình đường hồi qui tuyến tính thực nghiệm Y theo X 130 1/ X Y 26 30 34 38 42 100 200 10 300 26 400 500 10 400 500 10 400 500 10 2/ X Y 20 30 40 50 60 100 200 10 300 26 3/ X Y 26 30 34 38 42 100 200 10 300 26 4/ X Y 100 110 120 130 50 100 150 200 250 4 1 5/ X Y 50 200 210 220 230 100 150 200 250 1 6/ X Y 50 60 70 131 80 90 100 110 120 130 4 1 7/ X Y 50 100 110 120 130 100 150 200 250 4 1 8/ X Y 10 20 20 15 25 35 45 55 30 23 30 10 40 50 60 47 11 20 12 13 2 9/ X Y 10 11 2 1 10 20 30 20 2 10/ X Y 25 35 45 55 65 23 30 10 40 50 60 47 11 20 30 40 11/ X Y 10 20 132 2 2 2 1 24 27 30 33 1 6 1 28 1 31 34 6 1 20 30 40 50 1 6 1 12/ X Y 120 125 130 135 140 145 150 36 2 1 13/ Y X 25 50 55 60 65 70 75 80 37 2 1 14/ Y X 120 130 140 150 160 170 180 60 2 1 Kiểm tra hai mơn tốn vật lý nhóm 10 sinh viên chọn ngẫu nhiên từ lớp ta có kết sau: Điểm toán (X) Điểm vật lý (Y) 6 7 10 133 5 8 9 a/ Hãy tìm hệ số tương quan mẫu? b/ Viết phương trình đường hồi qui tuyến tính thực nghiệm Y theo X Số vi khuẩn Y sinh sản sau X ghi lại bảng sau qua thí nghiệm: Thời gian (X) Số vi khuẩn (Y)(triệu) 30 32 35 40 48 52 58 62 69 a/ Hãy tính hệ số tương quan mẫu b/ Tìm phương trình đường hồi qui tuyến tính thực nghiệm Y theo X Để nghiên cứu lượng Protein chứa hạt lúa mỳ người ta tiến hành điều tra 10 ruộng kết sau: Năng suất X 9,0 9,5 10,0 10,5 11,0 11,5 12,0 12,5 13,0 13,5 Tỉ lệ Protein 10,0 10,2 11,0 10,5 12,0 12,2 12,5 12,6 12,7 12,8 Y a/ Hãy tính hệ số tương quan mẫu b/ Tìm phương trình đường hồi qui tuyến tính thực nghiệm Y theo X TÀI LIỆU THAM KHẢO 134 [1] Nguyễn Đình Trí, Tốn học cao cấp tập 1, Nhà xuất giáo dục, năm 2004 [2] Nguyễn Đình Trí, Tốn học cao cấp tập 2, Nhà xuất giáo dục, năm 2004 [3] Nguyễn Đình Trí, Tốn học cao cấp tập 3, Nhà xuất giáo dục, năm 2002 [4] Đào Hữu Hồ, Xác suất thống kê, Nhà xuất Đại học quốc gia Hà Nội, 2007 [5] Nguyễn Văn Cao, Giáo trình Lý thuyết Xác suất & Thống kê toán, Trường Đại học Kinh tế quốc dân, Nhà xuất Thống kê, 2005 Phụ lục 135 u 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,10 0,11 0,12 0,13 0,14 0,15 0,16 0,17 0,18 0,19 0,20 0,21 0,22 0,23 0,24 0,25 0,26 0,27 0,28 0,29 0,30 0,31 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,40 u u t / Bảng giá trị hàm (u ) dt (Hàm Láp-la-xơ) e 2 u u (u ) (u ) (u ) 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,0793 0,0832 0,0871 0,0910 0,0948 0,0984 0,1026 0,1064 0,1103 0,1141 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,1554 (u ) 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63 0,64 0,65 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79 0,80 0,81 u 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,2580 0,2611 0,2612 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852 0,2881 0,2910 (u ) 136 0,82 0,83 0,84 0,85 0,86 0,87 0,88 0,89 0,90 0,91 0,92 0,93 0,94 0,95 0,96 0,97 0,98 0,99 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10 1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,18 1,19 1,20 1,21 1,22 u 0,2939 0,2967 0,3995 0,3023 0,3051 0,3078 0,3106 0,3133 0,3159 0,3186 0,3412 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 0,3849 0,3869 0,3883 (u ) 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 1,31 1,32 1,33 1,34 1,35 1,36 1,37 1,38 1,39 1,40 1,41 1,42 1,43 1,44 1,45 1,46 1,47 1,48 1,49 1,50 1,51 1,52 1,53 1,54 1,55 1,56 1,57 1,58 1,59 1,60 1,61 1,62 1,63 1,64 1,65 1,66 1,67 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 1,68 1,69 1,70 1,71 1,72 1,73 1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,81 1,82 1,83 1,84 1,85 1,86 1,87 1,88 1,89 1,90 1,91 1,92 1,93 1,94 1,95 1,96 1,97 1,98 1,99 2,00 2,02 2,04 2,06 2,08 2,10 2,12 2,14 2,16 2,18 2,20 2,22 2,24 0,4535 0,4545 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 0,4772 0,4783 0,4793 0,4803 0,4812 0,4921 0,4830 0,4838 0,4846 0,4854 0,4861 0,4868 0,4875 Phụ lục 137 2,26 2,28 2,30 2,32 2,34 2,36 2,38 2,40 2,42 2,44 2,46 2,48 2,50 2,52 2,54 2,56 2,58 2,60 2,62 2,64 2,66 2,68 2,70 2,72 2,74 2,76 2,78 2,80 2,82 2,84 2,86 2,88 2,90 2,92 2,94 2,96 2,98 3,00 3,20 3,40 3,60 3,80 4,00 4,50 5,00 0,4881 0,4887 0,4893 0,4898 0,4904 0,4909 0,4913 0,4918 0,4922 0,4927 0,4931 0,4934 0,4938 0,4941 0,4945 0,4948 0,4951 0,4953 0,4956 0,4959 0,4961 0,4963 0,4965 0,4967 0,4969 0,4971 0,4973 0,4974 0,4976 0,4977 0,4979 0,4980 0,4981 0,4982 0,4984 0,4985 0,4986 0,49865 0,49931 0,49966 0,499841 0,499928 0,499968 0,499997 0,499997 Bảng giá trị phân vị U U U U U 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63 0,64 0,65 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74 0,00 0,025 0,030 0,075 0,100 0,126 0,151 0,176 0,202 0,228 0,253 0,279 0,305 0,332 0,358 0,385 0,412 0,440 0,468 0,496 0,524 0,553 0,583 0,613 0,643 0,75 0,76 0,77 0,78 0,79 0,80 0,81 0,82 0,83 0,84 0,85 0,86 0,87 0,88 0,89 0,90 0,905 0,910 0,915 0,920 0,925 0,930 0,935 0,940 0,945 0,674 0,706 0,739 0,772 0,806 0,842 0,878 0,915 0,954 0,994 1,036 1,080 1,126 1,175 1,227 1,282 1,311 1,341 1,372 1,405 1,440 1,476 1,514 1,555 1,598 0,95 0,951 0,952 0,953 0,954 0,955 0,956 0,957 0,958 0,959 0,960 0,961 0,962 0,963 0,964 0,965 0,966 0,967 0,968 0,969 0,970 0,971 0,972 0,973 0,974 1,645 1,655 1,665 1,675 1,685 1,695 1,706 1,717 1,728 1,739 1,751 1,762 1,774 1,787 1,799 1,812 1,825 1,837 1,852 1,866 1,881 1,896 1,911 1,927 1,943 0,975 0,976 0,977 0,978 0,979 0,980 0,981 0,982 0,983 0,984 0,985 0,986 0,987 0,988 0,989 0,990 0,991 0,992 0,993 0,994 0,995 0,996 0,997 0,998 0,999 1,96 1,977 1,995 2,014 2,034 2,054 2,075 2,097 2,120 2,144 2,170 2,197 2,226 2,257 2,290 2,326 2,366 2,409 2,457 2,512 2,576 2,652 2,748 2,878 3,090 Với < 0,5 suy giá trị U U1 Phụ lục 138 Phân vị student t(n) 0,90 0,95 0,975 0,99 0,995 3,078 1,886 6,314 2,920 12,706 4,303 31,821 6,965 63,657 9,925 1,638 2,353 3,183 4,541 5,842 1,533 2,132 2,776 3,767 4,601 1,476 1,440 1,415 2,015 1,943 1,895 2,571 2,447 2,365 3,365 3,143 2,998 4,032 3,707 3,499 1,397 1,383 1,860 1,833 2,306 2,262 2,896 2,821 3,335 3,325 10 1,372 1,812 2,228 2,764 3,169 11 12 1,363 1,356 1,796 1,782 2,201 2,179 2,718 2,681 3,106 3,055 13 14 15 16 17 1,350 1,345 1,341 1,337 1,333 1,771 1,761 1,753 1,746 1,740 2,160 2,145 2,131 2,120 2,110 2,650 2,624 2,602 2,583 2,567 3,012 2,977 2,974 2,921 2,898 18 19 20 21 22 23 24 25 26 27 28 29 30 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 n 139