67 TẠP CHÍ KHOA HỌC Khoa học Tự nhiên và Công nghệ, Số 6 (9/2016) tr 67 72 Đặng Kim Phương Khoa Toán Lý Tin, Trường Đại học Tây Bắc PHÂN TÍCH MỐI LIÊN HỆ TUYẾN TÍNH CỦA HAI ĐẠI LƯỢNG NGẪU NHIÊN Tóm tắ[.]
TẠP CHÍ KHOA HỌC Khoa học Tự nhiên Cơng nghệ, Số (9/2016) tr 67 - 72 Đặng Kim Phương Khoa Toán - Lý - Tin, Trường Đại học Tây Bắc PHÂN TÍCH MỐI LIÊN HỆ TUYẾN TÍNH CỦA HAI ĐẠI LƯỢNG NGẪU NHIÊN Tóm tắt: Một nhiệm vụ trọng tâm người làm công tác thống kê phân tích mối liên hệ đại lượng ngẫu nhiên xác định mức độ liên hệ chúng lập phương trình hồi qui biểu diễn mối liên hệ Trong khn khổ viết giới thiệu cách sử dụng hệ số tương quan mẫu phương trình hồi qui tuyến tính mẫu để xác định mức độ liên hệ tuyến tính biểu diễn mối liên hệ tuyến tính dạng Y A X B hai đại lượng ngẫu nhiên X Y Từ khóa: Hệ số tương quan, Hàm hồi qui tuyến tính, Đại lượng ngẫu nhiên, Kiểm định giả thiết thống kê, Phân phối Student Mở đầu Trong học phần Xác suất thống kê giới thiệu cơng thức, cách tính hệ số tương quan mẫu cách xác định phương trình hồi qui tuyến tính mẫu dạng Y A X B hai đại lượng ngẫu nhiên X Y Vậy thống kê ngành Kinh tế, Nông học, Tài nguyên Môi trường, sử dụng hệ số tương quan mẫu phương trình hồi qui tuyến tính mẫu để phân tích mối liên hệ tuyến tính dạng Y A X B hai đại lượng ngẫu nhiên X Y nào? Thông qua sở lý luận ví dụ thực tiễn viết làm sáng tỏ vấn đề Phân tích mối liên hệ tuyến tính dạng Y A X B hai đại lượng ngẫu nhiên X Y 2.1 Hệ số tương quan Nghiên cứu sở xác suất ta biết hệ số tương quan đặc trưng cho mức độ liên hệ hai đại lượng ngẫu nhiên X Y xác định công thức: E ( X Y ) E ( X ) E ( Y ) D X D Y ( 1) Nếu Nếu X X thì và Y Y khơng tương quan có tương quan Nếu X Y có tương quan tuyến tính Nếu gần mức độ liên hệ X Y chặt chẽ Ngày nhận bài: 23/5/2016 Ngày nhận đăng: 25/9/2016 Liên lạc: Đặng Kim Phương, e - mail: dangkimphuongtbu@gmail.com 67 Nhưng chưa biết phân phối đại lượng ngẫu nhiên ( X Y ) hệ số tương quan lý thuyết hai đại lượng ngẫu nhiên X Y chưa tìm Do thống kê phân tích tìm hiểu mức độ liên hệ hai đại lượng ngẫu nhiên ta phải tìm cách ước lượng thơng qua hệ số tương quan mẫu hai đại lượng ngẫu nhiên X Y sau: Lấy mẫu ngẫu nhiên kích thước n cặp đại lượng ngẫu nhiên X Y: ( X , Y1 ) , ( X , Y ) , , ( X n , Y n ) Khi hệ số tương quan mẫu hai đại lượng ngẫu nhiên X Y xác định công thức: n n n n X i Yi ( X i ) ( Yi ) i1 r n X i1 i1 n Nếu Nếu Nếu n i ( i1 i1 2 X i ) n Yi ( Yi ) i1 i1 n n X Y khơng có mối liên hệ tuyến tính r X Y có mối liên hệ tuyến tính r gần mức độ liên hệ X Y chặt chẽ Do dao động ngẫu nhiên mặt thống kê mà xảy trường hợp: Hệ số tương quan mẫu r tổng thể hệ số tương quan , trường hợp thực tế hay xảy mẫu nhỏ Vậy nên thực tiễn r , mẫu nhỏ cần kiểm tra tồn hệ số tương quan sau: Thiết lập toán kiểm định giả thiết thống kê: r H0 : H1 : với mức ý nghĩa , (Mức ý nghĩa 0,1; 0,01; 0,05; để thuận tiện cho việc trình bày, viết ln thiết lập toán kiểm định giả thiết với mức ý nghĩa , ) Tính giá trị kiểm định r T 1 r Student Nếu T t(n 2; 0, 05) n tra giá trị t(n 2; 0, 05) bảng phân phối bác bỏ giả thiết H : 0, tức thực tồn mối liên hệ tuyến tính hai tổng thể X Y Khi xác định phương trình hồi qui tuyến tính biểu diễn mối liên hệ tuyến tính hai tổng thể X Y Nếu T t ( n ; , ) chấp nhận giả thiết tức hai tổng thể X Y không tương quan công việc phân tích mối liên hệ tuyến tính hai tổng thể X Y dừng lại H0 : 2.2 Phương trình hồi qui tuyến tính dạng Y A X B Phương trình hồi qui tuyến tính đơn giản hai đại lượng ngẫu nhiên X Y có dạng: A , B số A : Thể mức tăng (giảm) Y X tăng (giảm) đơn vị B : Thể giá trị Y giá trị X Trong thực tế xác định hệ số A , B phương trình hồi qui tuyến tính tổng thể Y A X B mà ước lượng hệ số A , B qua hệ số a , b phương trình hồi qui tuyến tính mẫu hai tổng thể X Y y a x b Muốn ước lượng hệ số A , B phương trình hồi qui tuyến tính tổng thể Y A X B phải xác định phương trình hồi qui tuyến tính mẫu y a x b Để xác định hệ số a , b ta lấy mẫu ngẫu Y AX B 68 nhiên kích thước n cặp đại lượng ngẫu nhiên X Y: hệ số a , b xác định sau: n n ( X , Y1 ) , ( X , Y ) , , ( X n , Y n ) Khi n n X i Yi ( X i ) ( Yi ) i 1 a i 1 n i 1 n n X ( X i ) i i1 i1 b Y aX, đó: X n a, b n X i ; Y n i1 n Yi i1 Do dao động ngẫu nhiên mặt thống kê mà xảy trường hợp tham số khác không tham số A , B tổng thể lại không Bởi sau xác định tham số a , b phương trình hồi qui tuyến tính mẫu y a x tham số A , B có thực tồn tổng thể hay không b cần phải kiểm tra Kiểm tra tồn tham số A: Ta đặt giả thiết: H0 : A H1 : A với mức ý nghĩa 0, 05 Tính giá trị kiểm định: a Ta đó: Sa QY a Q X S a Sˆ Sˆ ; QX n 2 n n QX X i Ta t ( n ; , ) n ; QY n bác bỏ giả thiết ( Yi ) i1 i 1 Nếu n ( X i ) Yi i 1 i1 n tức tồn tham số A tổng thể ta H0 : A ước lượng tham số A Kiểm tra tồn tham số B: Ta đặt giả thiết: H0 : B H1 : B với mức ý nghĩa 0, 05 n Tính giá trị kiểm định: Nếu Tb t ( n ; , ) Tb b Sb bác bỏ giả thiết S b Sˆ H0 : B X i 1 i nQX tức tồn tham số B tổng thể ta ước lượng tham số B 69 2.3 Ước lượng khoảng tham số A, B phương trình hồi qui tuyến tính Y AX B Nếu tham số A , B thực tồn ước lượng tham số A,B Ước lượng khoảng tham số A với độ tin cậy 0,95 là: a t(n 2; 0, 025)Sa A a t(n 2; 0, 025)Sa Ước lượng khoảng tham số B với độ tin cậy 0,95 là: b t(n 2; 0, 025)Sb B b t(n 2; 0, 025)Sb Ví dụ Biết suất lao động tuổi nghề cơng nhân có mối liên hệ tuyến tính dạng Y A X B Hãy phân tích mối liên hệ tuyến tính suất lao động tuổi nghề công nhân doanh nghiệp qua số liệu điều tra sau: Tên công nhân Tuổi nghề ( X - năm) Năng suất lao động ( Y - kg) A B 12 C D 16 Đ 12 E 21 G 21 H 10 24 I 11 19 K 12 27 Dựa vào số liệu điều tra ta lập bảng số liệu sau: Tên A B C D Đ E G H I K Tổng X Y 10 11 12 70 12 16 12 21 21 24 19 27 164 X Y 16 25 49 64 81 100 121 144 610 X Y 144 81 256 144 441 441 576 361 729 3182 36 36 80 84 168 189 240 209 324 1369 *Xác định hệ số tương quan mẫu: Hệ số tương quan mẫu X Y tính cơng thức: n n n n X i Yi ( X i ) ( Yi ) r i 1 n X i 1 n i 1 n i ( i 1 X i) i 1 1 2 n Yi ( Yi ) i 1 i 1 n n (1 ) (1 0, 91 ) Vì r , nên quan hệ X Y chặt chẽ, hệ số tương quan mẫu cao nên không cần kiểm tra tồn hệ số tương quan tổng thể *Xác định hệ số a , b phương trình hồi qui tuyến tính mẫu y a x b Tính: X n n i1 X i 70 10 ; Y n n i1 Yi 164 16, Ta có: 10 70 n n n n X i Y i ( X i )( Y i ) a i 1 i 1 n i 1 n X ( X i ) i i1 1 n 2 1, i1 b Y a X , 1, , Vậy phương trình hồi qui tuyến tính mẫu y 1, x 3, *Kiểm tra tồn tham số A , B phương trình hồi qui tuyến tính tổng thể Y A X B - Kiểm định tồn tham số A : Đặt giả thiết với mức ý nghĩa H0 : A H1 : A 0, 05 a Tính giá trị kiểm định: T a ta có: Sa QY a Q X S a Sˆ Sˆ ; n 2 QX n ( X i ) n QX X i 1 i 70 610 n i1 120 10 n ( Yi ) n QY i 1 Yi 3182 164 n i 1 492 10 , 1, 2 Sˆ 3, 8 S a 3, Ta 1, với mức ý nghĩa 6,1 0, - Kiểm định tồn tham số B Đặt giả thiết: 0, 120 : H0 : B H1 : B 0, 05 Tính giá trị kiểm định: Tb b ta có: Sb n S b Sˆ X i1 n Q X i 3, 610 2, 34 1 71 Tb b Sb 3, 1, 2, 34 Tra bảng phân phối Student ta có t ( n ; , ) t (8; , ) , Vì Ta , nên bác bỏ giả thiết H : A tức tồn tham số A tổng thể Vì Tb , nên ta chấp nhận giả thiết H0 : B tức không tồn tham số B tổng thể *Ước lượng khoảng tham số A Ước lượng khoảng tham số A với độ tin cậy 0,95 là: a t(n 2; 0, 5)Sa A a t(n 2; 0, 5)Sa 1, , , A 1, , , 1, A , Chúng ta tin tới mức 95% tham số A tổng thể nằm khoảng từ 1,15 kg đến 2,53 kg Kết luận - Năng suất lao động công nhân doanh nghiệp phụ thuộc nhiều vào tuổi nghề công nhân Nếu công nhân không đào taọ nghề khơng thể tham gia vào hoạt động kinh doanh doanh nghiệp - Nếu tuổi nghề cơng nhân tăng lên đơn vị suất lao đơng cơng nhân tăng từ 1,15 kg đến 2,53 kg TÀI LIỆU THAM KHẢO [1] Ngơ Kim Khơi (1998), Thống kê tốn học lâm nghiệp, Nxb Nông nghiệp [2] Phạm Văn Kiều (2004), Xác suất thống kê, Nxb Giáo dục [3] Hà Văn Sơn (2004), Lý thuyết thống kê, Nxb Thống kê ANALYSIS OF LINEAR RELATIONSHIP OF TWO RANDOM VARIABLES Dang Kim Phuong Faculty of Mathematics - Physics - Informatics, Tay Bac University Abstract: One of the key tasks when analyzing statistical relationship between random variables is identifying the level of relationship between them and making up the regression represented such a relationship Within the scope of an article, we will show how to use the sample correlation coefficient and linear regression to determine relationship and performing linear relationship between two random variables X and Y Keywords: Correlation coefficient, Linear regression function, Radom variable, Statistical hypothesis testing, Student's t-distribution 72 ... chưa biết phân phối đại lượng ngẫu nhiên ( X Y ) hệ số tương quan lý thuyết hai đại lượng ngẫu nhiên X Y chưa tìm Do thống kê phân tích tìm hiểu mức độ liên hệ hai đại lượng ngẫu nhiên ta phải... qui tuyến tính biểu diễn mối liên hệ tuyến tính hai tổng thể X Y Nếu T t ( n ; , ) chấp nhận giả thiết tức hai tổng thể X Y khơng tương quan cơng việc phân tích mối liên hệ tuyến tính hai. .. khơng có mối liên hệ tuyến tính r X Y có mối liên hệ tuyến tính r gần mức độ liên hệ X Y chặt chẽ Do dao động ngẫu nhiên mặt thống kê mà xảy trường hợp: Hệ số tương quan mẫu r tổng thể hệ số