1. Trang chủ
  2. » Tất cả

BgiangTKXHH(Tuan14-15)

10 5 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Nội dung

NỘI DUNG NGHIÊN CỨU TUẦN 14-15 Chƣơng TƢƠNG QUAN VÀ HỒI QUI 3.1 HỆ SỐ TƢƠNG QUAN MẪU 3.1.1 Hiệp phƣơng hệ số tƣơng quan Cần phải nhắc lại số khái niệm vector ngẫu nhiên Cho vector ngẫu nhiên chiều ( X , Y ) Khi Hiệp phƣơng sai (covariance) BNN X Y Cov( X , Y ) : - Cov( X , Y )  E ( X  EX )(Y  EY ) = E ( XY )  EX EY Hệ số tƣơng quan (correlation coefficie) BNN X Y ( X , Y ) hay  XY : Cov( X , Y ) E ( X  EX )(Y  EY )  XY   VX VY VX VY - Chúng có cá tính chất: a) 1  ( X , Y )  Nếu ( X , Y )  1 X Y có tương quan tuyến tính: Y  aX  b; a, b  R b) Ta nói X Y không tƣơng quan ( X , Y )  Điều tương đương với: Cov( X , Y )  hay E ( XY )  EX EY Trái lại, X Y gọi có tương quan với Hệ số tương quan biểu dặc trưng cho mức độ phụ thuộc lẫn BNN Giá trị  XY gần mức độ phụ thuộc lẫn X Y lứn  Lƣu ý Nếu X Y độc lập ( X , Y )  chúng khơng tương quan Điều ngược lại khơng Có thí dụ chứng tỏ rằng, ( X , Y )  X Y không độc lập Cov( X , Y )   Cov( X , X ) Cov( X , Y )   VX    Cov(Y , Y )   Cov( X , Y ) VY  - Ma trận hiệp phương sai:   Cov(Y , X ) - Ma trận hệ hệ số tƣơng quan:   XX   YX  XY )    YY    XY  XY )   Các ma trận ma trân đối xứng, xác định không âm 3.1.2 Hệ số tƣơng quan mẫu Giả sử  ( X1,Y1 );(X ,Y2 ); ;(X n ,Yn ) làt mẫu ngẫu nhiên vector ngẫu nhiên ( X , Y ) Hệ số tương quan mẫu là: r n k XY  X Y , với XY   X iYi   ni X iYi n i 1 n i 1 S x S y (3.1) 3.2 MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN 3.2.1 Vấn đề mơ hình hồi quy Nhiều tốn khoa học kỹ thuật đòi hỏi khảo sát quan hệ hai nhiều biến Nói chung BNN Y hàm BNN X ta có mơ hình Y  F ( X )   , với  sai lầm ngẫu nhiên Cần nghiên cứu hàm Trường hợp đơn giản nhất, ta nghiên cứu mơ hình tuyến tính: Y  (aX  b)   (3.2) Thí dụ 3.1 Xét số liệu Bảng 3.1, đô thị độ oxy sinh trình chưng cất hóa học, cịn x nồng độ phần trăm hydrocarbon có mặt bình ngưng phận chưng cất Bảng 3.1 Độ oxy ứng với tỷ lệ phần trăm hydrocarbon Hình 3.1 Đồ thị rải điểm, đường hồi quy cho số liệu độ oxy Mơ hình (9.2) gọi mơ hình hồi quy (MHHQ) tuyến tính đơn; - X gọi biến hồi quy (hay biến độc lập, biến giải thích), - Y gọi biến phản hồi (hay biến phụ thuộc, biến giải thích); - a, b gọi tham số hồi quy, a: hệ số chặn, b: hệ số góc; 3.2.2 Đường thẳng y  ax  b gọi đường hồi quy (lý thuyết) - Mơ hình gọi tuyến tính tuyến tính với tham số a, b Đƣờng hồi quy tuyến tính thực nghiệm phƣơng pháp bình phƣơng tối thiểu Khi lấy mẫu cụ thể  ( x1, y1);( x2 , y2 ); ;( xn , yn )  Từ mơ hình (9.2) ta có:  y1  a.x1  b  e1  y  a.x  b  e  2 (3.3)    yn  a.xn  b  en Với ei  yi  (a.xi  b), i  1, n sai số phép đo lần quan sát thứ i Do  ei2  {yi  (a.xi  b)}2 i i tổng bình phương sai số Ta cần ước lượng hệ số a b cho bé nhất, tức là: L(a, b)   {yi  (a.xi  b)}2  (3.4) i Để giải tốn (3.4) ta giải hệ phương trình:  n   n  n  L   xi2  a    xi  b   xi yi     i 1   a i 1  i 1  hay   n   n  L    x a  n b    i   yi  b  i 1  i 1 (3.5) Giải hệ phương nghiệm ( a , b ) ta đường hồi quy tuyến tính thực nghiệm: y  a.x  b (3.6) Phương pháp cịn gọi phương pháp bình phương tối thiểu Dễ dàng chứng minh cồng rhức nghiệm:  xy  x y a  S x2    b  y  a.x (3.7) Người ta chứng minh a , b ước lượng không chệch hệ số a b Thí dụ 3.2 Cho mẫu (x,y) đưới dạng bảng x -1,1 2,1 3,2 4,4 5,2 y 0,78 7,3 9,2 11,9 13,3 Ước lượng hệ số quan hệ quan hệ Y  a X  b phương pháp bình phương tối thiểu Giải Lập bảng tính Stt xi yi xi2 xi yi -1,1 2,1 3,2 4,4 5,2 13,8 0,78 7,3 9,2 11,9 13,3 42,48 1,21 4,41 10,24 19,36 27,04 62,26 -0,858 15,33 29,44 52,36 69,16 165,43  n  n   n   xi2  a   xi  b  xi yi    i 1  62, 26a  13,8b  1, 65, 43 a  1,9935 i 1  i 1  Từ bảng    n  b  2,9939 13,8a  5b  42, 48  n   n.b  yi  xi  a   i 1  i 1      Ta tìm quan hệ Y  1,9935.X  2,9939 3.2.3 Đƣờng hồi quy trung bình tuyến tính Đây phương pháp khác Tìm phương trình bậc lý thuyết dạng: Y  EY   Thay EX X , EY Y  y  y  r sy sx VY ( X  EX ) VX sy VY r ta có cơng thức tính: sx VX ( x  x) hay x  x  r sx ( y  y) sy (3.8) Ước lượng sai số bình phương trung bình để tính giá trị y x hai trường hợp là: s 2y / x  s 2y (1  r ) sx2/ y  sx2 (1  r ) Thí dụ 3.3 Điều tra số trẻ em thất học (X) số trẻ hư 30 địa phương bảng số liệu Y X 80 16 18 20 22 26 ∑ 90 100 1 2 5 30 110 120 130 ∑ a) b) 24 5 Tính hệ số tương quan mẫu Ý nghĩa nó? Tìm đường hồi quy thực nghiệm ? Có thể dùng đường hồi quy tìm để làm gì? Cho thí dụ Giải Từ bảng tần số biên X Y (n  30) tính được: k X   ni X i  102,667 n i 1 S X2  Y k  ni X i2  X   S X  15,691 n i 1 k  niYi  20,60 n i 1 k  niYi2  Y   SY  2,788 n i 1 XY   nij X iY j  2152,667 n i, j SY2  a) Tính hệ số tương quan mẫu XY  X Y 2152,667  102,667  20,6   0,8624 15,691 2,788 S x S y Với r  0,8624 (gần 1) ta thấy số trẻ hư số trẻ thất học có tương quan tuyến tính chặt Hơn r  có nghĩa X Y đồng biến r b) Tìm đường hồi qui thực nghiệm Sử dụng công thức y  y  r sy ( x  x) ta có sx 2,788 y  20,60  0,8624 ( x  102,667)  y  0,1532.x  4,8714 15,691 Có thể dùng đường hồi qui để dự đoán số trẻ hư biết số trẻ thất học.Chẳng hạn, với X  90 gíá trị quan sát trung bình: Y  (18   20   22  1)  19, 25 (  19) Y  0,1532  90  4,8714  18,66 ( 19) Nếu tính đường hồi qui Cho X  105 dự đoán Y  0,1532 105  4,8714  20,957  21 ÔN TẬP PHẦN THỐNG KÊ Một hãng sản xuất vịng găng cho động tơ cho biết đường kính vịng găng có phân bố chuẩn với độ lệch chuẩn 0,015 mm Người ta chọn ngẫu nhiên 13 vịng găng đo đường kính trung bình 74,035 mm Hãy tìm khoảng tin cậy hai phía 95% cho đường kính trung bình vịng găng Biết t0,025(12) = 2,719 ; z0,05 = 1,645 ; z0,025 = 1,960 Một vùng có 2000 hộ gia đình Để điều tra nhu cầu tiêu dùng loại hàng đó, người ta chọn ngẫu nhiên 100 hộ thấy có 70 hộ có nhu cầu loại hàng Với độ tin cậy 95% ước lượng khoảng tin cậy đối xứng cho tỷ lệ hộ gia đình có nhu cầu loại hàng Biết z0,01 = 2,33 ; z0,05 = 1,645 ; z0,025 = 1,960 Để điều tra thời gian hoàn thành sản phẩm công nhân người ta chọn ngẫu nhiên 100 công nhân thu kết sau: Thời gian (phút) 12-13 13-14 14-15 15-16 16-17 17-18 18-19 19-20 Số công nhân 10 15 23 19 16 a Với độ tin cậy 95%, ước lượng khoảng cho thời gian trung bình để cơng nhân hồn thành xong sản phẩm b Có người nói thời gian trung bình hồn thành sản phẩm cơng nhân vào khoảng 15 phút Với mức ý nghĩa 5%, kiểm tra điều hay sai Cho biết t0,025 (99)  1,99; t0,05 (99)  1,66; ; Z0,025  1,96; Z 0,05  1,65 Chiều cao sinh viên đại học đại lượng ngẫu nhiên có phân bố chuẩn Kiểm tra nhóm gồm 25 sinh viên thấy độ cao trung bình 1,67 m với độ lệch chuẩn hiệu chỉnh mẫu 0,08 m Hãy xây đựng khoảng tin cậy 95% cho chiều cao trung bình tồn sinh viên Biết t ,025  24   ,064;t ,025  25   ,060; Z ,05  1,645; Z ,025  1,960 Người ta thống kê giá bán hộ chung cư thành phố thu kết sau: Giá bán (triệu) 550 480 980 1000 500 490 750 540 368 Số nhà Hãy ước lượng giá bán hộ trung bình với độ tin cậy 95% Điều tra lương trung bình nhóm 26 cơng nhân cơng ty A thấy lương trung bình 2,4 triệu( đ) Biết lương cơng nhân tuân theo luật phân bố chuẩn với độ lệch chuẩn hiệu chỉnh mẫu 1,2 triệu(đ) Hãy xây dựng khoảng tin cậy 95% cho mức lương trung bình tồn cơng nhân cơng ty A Biết t ,025  25   ,060;t ,025  26   ,056; z ,05  1,645; z ,025  1,960 Một kỹ sư lốp nghiên cứu tuổi thọ lốp hỗn hợp cao su mới, ông chế tạo 15 đem chúng thử nghiệm đường hỏng.Trung bình mẫu độ lệch chuẩn mẫu 60139 3645 (km) Giả thiết tuổi thọ lốp tuân theo luật phân bố chuẩn Tìm khoảng tin cậy 95% cho tuổi thọ lốp trung bình Cho biết t0,025(14) = 2,145; t0.025(15) = 2,131; Z0,025 = 1,960 Vì cố kỹ thuật, máy đóng chai đóng thiếu nhiều ca sản xuất Kiểm tra ngẫu nhiên 78 chai thấy có tới 21 chai bị đóng thiếu Tính khoảng tin cậy 90% cho tỷ lệ chai bị đóng thiếu ca sản xuất nói Cho Z0,05 = 1,645 Để ước lượng mức xăng tiêu hao trung bình cho loại ôtô chạy từ A đến B, người ta quan sát mức xăng tiêu hao (X lít) 30 chuyến xe thu kết sau: Giả sử X tuân theo luật chuẩn a) Với độ tin cậy 95% mức xăng tiêu hao trung bìnhh nằm khoảng nào? b) Có người cho mức xăng tiêu hao trung bình lớn 9,4 lít Với mức 5%, kiểm định xem khẳng định hay sai? Cho biết t0,05(29)=1,70 ; t0,025(29) = 2,05; t0,025(30) = 2,04; 10 Để ước lượng điểm thi đại học trung bình mơn tốn học sinh trường A, người ta theo dõi điểm thi (X) 50 học sinh thu kết sau: Điểm Số học sinh (0,2] (2,4] (4,6] (6.8] (9,10] 13 17 10 Giả sử X tuân theo luật chuẩn a) Hãy ước lượng điểm thi trung bình b) Với độ tin cậy 95%, điểm thi trung bìnhh nằm khoảng nào? Muốn giảm độ rộng khoảng tin cậy cịn nửa cần theo dõi học sinh? Cho biết t0,025 (49)  2,01; t0,05 (49)  1,675 11 Để ước lượng chiều cao trung bình sinh viên, người ta đo chiều cao 100 sinh viên thu kết sau: X Số sinh viên [1,60; 1,65 ) 15 [1,65; 1,70) 40 [1,70; 1,75) 35 [1,75; 1,80) 10 Giả sử chiều cao sinh viên biến ngẫu nhiên X có phân bố chuẩn a) Với độ tin cậy 95% chiều cao trung bình nằm khoảng nào? b) Có người cho chiều cao trung bình lớn 1,7 m Với mức 5% kiểm định xem khẳng định hay sai Cho biết t0,05 (99)  1,66 ; t0,025 (99)  1,99 12 Để kiểm tra khối lượng trứng (đơn vị gam), người ta chọn ngẫu nhiên 100 thu kết sau: Khối lượng Số [140;145) [145;150) [150;155) [155;160) [160;165) [165;170) [170;17) 10 17 23 19 16 a) Với  = 5% , ước lượng khối lượng trung bình trứng b) Trứng loại I khối lượng từ 160 gam trở lên Với  = 5% , hỏi chấp nhận giả thuyết: tỷ lệ trứng loại I 40% hay không? Cho biết t0,05 (99)  1,66 ; t0,025 (99)  1,99 ; Z 0,025  1,96; Z 0,05  1,645 13 Điều tra mức chi tiêu hàng năm 100 công nhân công ty thu số liệu sau: Mức chi tiêu (triệu đồng/năm) Số công nhân 15,6 16,0 16,4 16,8 17,2 17,6 18,0 10 14 26 28 12 a) Với độ tin cậy 95% ước lượng: số cơng nhân cơng ty có mức chi tiêu năm 16 triệu đồng, biết cơng ty có 1000 công nhân b) Nếu năm trước mức chi tiêu trung bình cơng nhân là16 triệu đồng/năm với mức ý nghĩa 0,05 nói mức chi tiêu trung bình cơng nhân năm cao năm trước không? 14 Để ước lượng tuổi thọ trung bình loại bóng đèn, người ta kiểm tra ngẫu 16 bóng tính tuổi thọ trung bình chúng X=1200giờ với độ lệch tiêu chuẩn mẫu điều chỉnh 26,094 a) Hãy ước lượng tuổi thọ trung bình bóng đèn khoảng tin cậy đối xứng với độ tin cậy 0,95 Giả sử tuổi thọ bóng đèn biến ngẫu nhiên có phân bố chuẩn b) Với = 5%, để độ rộng khoảng tin cậy cịn nửa cần kiểm tra bóng đèn Cho biết t0,025 (15) =2,13; t0,05 (15)= 1,66; z0,025 =1,960; z0,05 = 1,645 15 Năng suất giống ăn vùng A đại lượng ngẫu nhiên có phân phối chuẩn Trên sở số liệu điều tra sau: Năng suất (kg/cây) 22 24 26 28 30 Số thu hoạch 10 15 30 25 20 Hãy ước lượng suất trung bình tối đa giống ăn nói với độ tin cậy 95% 16 Một trại chăn nuôi gà, tỷ lệ gà bị cúm A 30% Sau thời gian điều trị, kiểm tra 100 gà thấy 20 mắc cúm A Với mức ý nghĩa 0,05 kết luận điều trị có hiệu không 17 Tại thành phố người ta thông kê 88073 cháu sinh năm có 45682 cháu trai Với mức ý nghĩa 1% kết luận tỷ lệ trai lớn tỷ lệ gái không? 18 Để đánh giá chất lượng hai loại máy trộn bê tông mặt thời gian, người ta cho vận hành hai loại máy điều kiện giống hệt thu kết sau: Thời gian  5,0 [5,0; 5,5) [5,5; 6,0) [6,0; 6,5) [6,5; 7,0)  7,0 Số (máy loại 1) Số (máy loại 2) 15 12 13 18 10 Biết thời gian trộn trung bình bê tơng máy biến ngẫu nhiên có phân bố chuẩn với phương sai Hãy so sánh chất lượng hai loại máy với mức 5% Biết t0,05 (95)  1,66 19 Điều tra mức chi tiêu hàng năm 100 công nhân công ty thu số liệu sau: Mức chi tiêu (triệu đồng/năm) 15,6 16,0 16,4 16,8 17,2 17,6 18,0 Số công nhân 10 14 26 28 12 a) Với độ tin cậy 95% ước lượng: số cơng nhân cơng ty có mức chi tiêu hàng năm 16 triệu đồng, biết công ty có 2000 cơng nhân b) Nếu năm trước mức chi tiêu trung bình cơng nhân 16 triệu đồng/năm với mức ý nghĩa 0,05 nói mức chi tiêu trung bình cơng nhân năm cao năm trước không? Giả thiết mức chi tiêu cơng nhân có phân bố chuẩn Cho biết t0,05 (99)  1,66 ; t0,025 (99)  1,99 ; Z 0,025  1,96; Z 0,05  1,645 20 Tiến hành 50 quan sát biến ngẫu nhiên X ta thu số liệu có X  5.52,sX  2.05 a) Với độ tin cậy 0,95 , khoảng tin cậy cho EX b) Nếu giả thiết X có phân bố chuẩn với mức ý nghĩa   0.05 nói VX lớn 4,00 không? Cho biết  0,05 (49)  67,5 ; t0,05 (95)  1,66; Z 0.025  1,96; Z 0,05  1,645 21 Người ta điều tra mức thu nhập hàng tháng số người dân vùng số liệu sau đây: Mức thu nhập (triệu) [0; 1) [1; 2) [2; 3) [3; 4) [4; 5) [5; 6] Số người 12 14 a) Với độ tin cậy 95%, ước lượng mức thu nhập trung bình hàng tháng người dân vùng b) Có người nói mức thu nhập trung bình hàng tháng người dân vùng 3.5 triệu Với mức ý nghĩa 5%, kiểm tra xem người nói có không? Cho biết t29 (0,025)  2,05 ; t95 (0,05)  1,66; Z0.025  1,96; Z0.05  1,65 22 Đo chiều cao Y đường kính gốc X (đơn vị đo m) giống cây, gồm 20 cá thể chọn ngẫu nhiên, ta có kết sau: Chiều cao 9 10 10 11 11 12 12 13 Đ.kính gốc 0.16 0.18 0.20 0.18 0.20 0.20 0.22 0.25 0.26 0.26 2 2 1 Số a) Tính hệ số tương quan mẫu X Y b) Viết phương trình đường hồi quy tuyến tính thực nghiệm Y theo X Từ dự đốn chiều cao có đường kính gốc 0.30 m 23 Kết quan sát hai đại lượng X, Y sau xi yi 87 47 74 86 38 66 90 95 86 56 84 72 47 60 87 80 a) Xác định hệ số tương quan tuyến tính mẫu X Y b) Xác định đường hồi quy tuyến tính mẫu y  ax  b Dự đoán y biết x  50  Bảng kiểm định tham số  10 Bảng tóm tắt so sánh kỳ vọng so sánh phƣơng sai

Ngày đăng: 04/12/2020, 14:57

w