1. Trang chủ
  2. » Tất cả

Mo hinh hi quy tuyn tinh dn

13 10 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Bài tập nhóm lần II Trần Nam Hưng, B1906052 Mai Nhựt Hảo, B1906045 Mục lục Câu Mơ hình hồi quy tuyến tính đơn 1 Đồ thị đường X Y .1 Hệ số tương quan biến X Y Mô hình hồi quy tuyến tính Kiểm tra điều kiện phần dư .4 Dự báo chi tiêu Câu Mơ hình hồi quy đa biến Hệ số tương quan Xây dựng hồi quy tuyến tính đa biến Xây dựng mơ hình tối ưu Kiểm định phần dư mô hình 11 Dự báo huyết áp bệnh nhân 13 Câu Mơ hình hồi quy tuyến tính đơn Đồ thị đường X Y load thunhap.mat plot(X, 'LineWidth', 2) hold on plot(Y, '-.', 'LineWidth', 2) hold off; legend({'Thu nhập','Chi tiêu'}) title('Đồ thị biểu diễn thu nhập chi tiêu') ylabel('Triệu đồng/năm') Hệ số tương quan biến X Y [r, p] = corrcoef(X,Y) r = 2×2 1.0000 0.9730 p = 2×2 1.0000 0.0000 0.9730 1.0000 0.0000 1.0000 Ta có giả thiết thu nhập chi tiêu hai biến độc lập Hai biến X Y độc lập (Thu nhập chi tiêu khơng có mối tương quan) Mối tương quan X Y có ý nghĩa thống kê Ta thấy, giá trị tương quan thuận với hệ số tương quan nên chấp nhận đối thiết Vậy có mối tương quan X Y, cụ thể scatterhist(Y,X); title('Đồ thị phân tán thu nhập chi tiêu') figure(gcf) Mơ hình hồi quy tuyến tính Để đánh giá ảnh hưởng thu nhập đến chi tiêu, ta tiến hành xây dựng mơ hình hồi quy tuyến tính model = LinearModel.fit(X,Y) model = Linear regression model: y ~ + x1 Estimated Coefficients: Estimate (Intercept) x1 9.2903 0.63778 SE tStat pValue 5.2314 0.028617 1.7759 22.287 0.086623 2.3272e-19 Number of observations: 30, Error degrees of freedom: 28 Root Mean Squared Error: 9.18 R-squared: 0.947, Adjusted R-Squared: 0.945 F-statistic vs constant model: 497, p-value = 2.33e-19 plot(model) title('Thu nhập so với chi tiêu') xlabel('Thu nhập') ylabel('Chi tiêu') Ta có phương trình hồi quy hai biến X Y Phương trình hồi quy cho ta biết Thu nhập tăng chi tiêu tăng (Khi thu nhập tăng triệu/năm chi tiêu tăng 0.63 triệu/năm) Mơ hình có hệ số xác định hệ số xác định điều chỉnh cao, chứng tỏ mức độ giải thích biến X đến biến Y tốt Kiểm tra điều kiện phần dư % Phần dư mơ hình epsilon = model.Residuals.Raw; • Kiểm định phân phối chuẩn cho phần dư Nhìn vào đồ thị QQ-plot cho phần dư, ta thấy giá trị phần dư nằm gần khớp vào đường xác suất cho thấy liệu có phân phối chuẩn subplot(1,2,1) plotResiduals(model,"probability") subplot(1,2,2) plotResiduals(model, "histogram") Để chắn, ta tiến hành kiểm định phân phối chuẩn Phần dư có phân phối chuẩn Phần dư khơng có phân phối chuẩn [h,p] = lillietest(epsilon) h = p = 0.3147 [h,p] = adtest(epsilon) h = logical p = 0.2573 Cả hai kiểm định lillietest adtest cho kết phân phối chuẩn ta chấp nhận giả thiết phần dư có • Kiểm định phần dư có kỳ vọng figure; plotResiduals(model, "fitted") Ta thấy, giá trị phần dư phân tán xung quanh giá trị nên ta nghi ngờ kỳ vọng cao Tiến hành kiểm định trung bình ta có giả thiết thống kê Phần dư có kỳ vọng phương sai chưa biết Phần dư có kỳ vọng khác [h,p] = ttest(epsilon) h = p = 1.0000 Vì giá trị nên ta có sở chấp nhận giả thiết phần dư có kỳ vọng thật • Kiểm định phương sai khơng đổi Ta đặt giả thiết thống kê sau Phần dư có kỳ vọng độ lệch chuẩn cho trước Phần dư có kỳ vọng khác [h,p] = ztest(epsilon, 0, std(epsilon)) h = p = 1.0000 Vì giá trị khơng đổi nên ta có sở chấp nhận giả thiết phần dư có kỳ vọng phương sai Các kiểm định phân phối chuẩn, kỳ vọng kiểm định phương sai không đổi cho kết mơ hình hồi quy đơn biến thỏa mãn điều kiện phần dư Ta chấp nhận mơ hình hồi quy nhập mơ hình tối ưu cho việc giải thích chi tiêu dựa vào thu Dự báo chi tiêu predict(model, [75 95 115]') ans = 3×1 57.1241 69.8798 82.6355 Khi thu nhập đạt 75, 95, 115 triệu đồng/năm chi tiêu đạt 57.12, 69.88, 82.64 triệu đồng/ năm Câu Mơ hình hồi quy đa biến clear load Huyetap.mat Hệ số tương quan [R,PValue] = corrplot(Huyetap) R = 7×7 1.0000 0.6591 0.9501 0.8659 0.2928 0.7214 0.1650 PValue = 7×7 1.0000 0.0016 0.0000 0.0000 0.2102 0.0003 0.4869 0.6591 1.0000 0.4073 0.3785 0.3438 0.6188 0.3681 0.9501 0.4073 1.0000 0.8753 0.2006 0.6593 0.0357 0.8659 0.3785 0.8753 1.0000 0.1305 0.4648 0.0202 0.2928 0.3438 0.2006 0.1305 1.0000 0.4015 0.3113 0.7214 0.6188 0.6593 0.4648 0.4015 1.0000 0.5067 0.1650 0.3681 0.0357 0.0202 0.3113 0.5067 1.0000 0.0016 1.0000 0.0746 0.0999 0.1378 0.0036 0.1103 0.0000 0.0746 1.0000 0.0000 0.3963 0.0016 0.8814 0.0000 0.0999 0.0000 1.0000 0.5833 0.0389 0.9326 0.2102 0.1378 0.3963 0.5833 1.0000 0.0793 0.1816 0.0003 0.0036 0.0016 0.0389 0.0793 1.0000 0.0226 0.4869 0.1103 0.8814 0.9326 0.1816 0.0226 1.0000 Xây dựng hồi quy tuyến tính đa biến model = LinearModel.fit(Huyetap(:, 2:end), Huyetap(:,1)) model = Linear regression model: y ~ + x1 + x2 + x3 + x4 + x5 + x6 Estimated Coefficients: Estimate _ SE tStat _ pValue -12.869 0.70334 0.96997 3.7722 0.068421 2.5566 0.049603 0.063116 1.5807 0.048437 -5.0335 14.179 15.368 2.3865 1.4126 0.00022902 2.7581e-09 1.0233e-09 0.032909 0.18127 (Intercept) x1 x2 x3 x4 x5 x6 -0.084505 0.0055724 0.05161 0.003412 -1.6374 1.6332 0.12552 0.12641 Number of observations: 20, Error degrees of freedom: 13 Root Mean Squared Error: 0.407 R-squared: 0.996, Adjusted R-Squared: 0.994 F-statistic vs constant model: 561, p-value = 6.39e-15 Phương trình hồi quy cho biến huyết áp Huyết áp ảnh hưởng yếu tố độ tuổi, trọng lượng, diện tích bề mặt thể, thời gian tăng huyết áp, nhịp mạch số stress Trong đó, độ tuổi cao có nguy tăng huyết áp Trọng lượng thể diện tích bề mặt thể ảnh hưởng sâu đến huyết áp với hệ số 0.97 3.77 hầu hết lớn Hệ số xác định mơ hình đa biến đạt 0.996 cao, giá trị 0.05 (chấp nhận giả thiết hệ số hồi quy 0) Nên ta chưa thể kết luận tối ưu mơ hình Xây dựng mơ hình tối ưu newmodel = step(model,'NSteps', 20) Adding x3:x4, FStat = 7.4511, pValue = 0.018278 Adding x5:x6, FStat = 15.6119, pValue = 0.00226806 Adding x4:x6, FStat = 14.2596, pValue = 0.00362452 Adding x3:x5, FStat = 9.3975, pValue = 0.013451 newmodel = Linear regression model: y ~ + x1 + x2 + x3*x4 + x3*x5 + x4*x6 + x5*x6 Estimated Coefficients: Estimate SE tStat _ pValue -37.9 0.79284 1.0381 10.163 -2.6654 0.41145 0.14941 1.3423 -0.23642 -0.0022429 -0.0017424 9.4478 0.01672 0.018761 4.9686 0.2695 0.1475 0.025848 0.12612 0.077121 0.00045884 0.00037155 -4.0115 47.418 55.337 2.0455 -9.8903 2.7895 5.7803 10.643 -3.0655 -4.8883 -4.6895 0.003057 4.133e-12 1.034e-12 0.071135 3.9221e-06 0.021072 0.00026596 2.1248e-06 0.013451 0.00086146 0.0011368 (Intercept) x1 x2 x3 x4 x5 x6 x3:x4 x3:x5 x4:x6 x5:x6 Number of observations: 20, Error degrees of freedom: Root Mean Squared Error: 0.111 R-squared: 1, Adjusted R-Squared: F-statistic vs constant model: 4.55e+03, p-value = 2.05e-15 Mơ hình hồi quy có biến đổi rõ rệt giá trị kết luận hệ số hồi quy khác Tất giá trị plot(newmodel) nhỏ 0.05, ta plotEffects(newmodel) 10 Mơ hình có tương quan thuận cao hai biến độ tuổi trọng lượng thể Độ tuổi có nguy mắc huyết áp cao trọng lượng thể đạt khoảng 85 đến 101 Kg huyết áp tăng cao Các biến cịn lại có ảnh hưởng đến số huyết áp Kiểm định phần dư mơ hình % Phần dư mơ hình Epsilon = model.Residuals.Raw; subplot(1,2,1) plotResiduals(newmodel,"probability") subplot(1,2,2) plotResiduals(newmodel, "histogram") • Kiểm định phân phối chuẩn cho phần dư Ta tiến hành kiểm định phân phối chuẩn Phần dư có phân phối chuẩn Phần dư khơng có phân phối chuẩn [h,p] = lillietest(Epsilon) h = p = 0.1922 [h,p] = adtest(Epsilon) 11 h = logical p = 0.1764 Cả hai kiểm định lillietest adtest cho kết phân phối chuẩn ta chấp nhận giả thiết phần dư có • Kiểm định phần dư có kỳ vọng Tiến hành kiểm định trung bình ta có giả thiết thống kê Phần dư có kỳ vọng phương sai chưa biết Phần dư có kỳ vọng khác [h,p] = ttest(Epsilon) h = p = 1.0000 Vì giá trị nên ta có sở chấp nhận giả thiết phần dư có kỳ vọng thật • Kiểm định phương sai khơng đổi Ta đặt giả thiết thống kê sau Phần dư có kỳ vọng độ lệch chuẩn cho trước Phần dư có kỳ vọng khác [h,p] = ztest(Epsilon, 0, std(Epsilon)) h = p = 1.0000 Vì giá trị khơng đổi nên ta có sở chấp nhận giả thiết phần dư có kỳ vọng phương sai • Kiểm định phần dư độc lập Ta đặt giả thiết thống kê sau Các phần dư độc lập Tồn cặp phần dư phụ thuộc [p,d] = dwtest(newmodel) p = 0.0607 d = 1.0633 Vì giá trị nên ta có sở chấp nhận giả thiết phần dư độc lập 12 Các kiểm định phân phối chuẩn, kỳ vọng 0, kiểm định phương sai không đổi phần dư độc lập cho kết mô hình hồi quy đa biến thỏa mãn điều kiện phần dư Dự báo huyết áp bệnh nhân X1 X2 X3 X4 X5 X6 = = = = = = [47 49 49 50]'; [85.4 94.2 95.3 94.7]'; [1.75 2.1 1.98 2.01]'; [5.1 3.8 8.2 5.8]'; [63 70 72 73]'; [33 14 10 99]'; Vậy huyết áp bệnh nhân biết giá trị X predict(newmodel, [X1 X2 X3 X4 X5 X6]) ans = 4×1 104.9798 114.9809 115.9209 116.9288 13

Ngày đăng: 04/02/2023, 11:51