3. Phân tích và xử lí số liệu
3.4.1 Xây dựng mơ hình phương tình hồi quy bảng phần mềm Statgraphics
Statgraphics
-Ta tiến hành hồi quy kết quả đo bằng phần mềm và viết 3 phương trình hồi quy khác nhau. Sau khi có phương trình hồi quy và giá trị liên quan, ta sẽ lựa chọn mơ hình có tỉ lệ % thể hiện được kết quả tốt nhất và tiến hành tối ưu hóa phương trình.
3.4.1.1 Phương trình hồi quy 1
-Tiến hành nhập dữ liệu vào phần mềm và phân tích và được các bảng và giá trị liên quan như sau:
Standard T
Parameter Estimate Error Statistic P-Value
CONSTANT 1.5626 0.0283095 55.1971 0.0000 chieu cao -0.0224867 0.000765774 -29.3646 0.0000 chieu dai 0.00182017 0.0000382887 47.538 0.0000
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 54.9256 2 27.4628 1561.07 0.0000
Residual 7.86375 447 0.0175923
Total (Corr.) 62.7893 449
Bảng giá trị phương sai và giá trị liên quan đến phương trình hồi quy -Kết quả phương trình hồi quy:
R-squared = 87.476 percentwww
R-squared (adjusted for d.f.) = 87.4199 percent Standard Error of Est. = 0.132636
Mean absolute error = 0.106613
Durbin-Watson statistic = 1.06732 (P=0.0000) Lag 1 residual autocorrelation = 0.46318 Phương trình hồi quy
ket qua = 1.5626 - 0.0224867*(chieu cao) + 0.00182017*(chieu dai)
-Ta thấy rằng giá trị P-Value nhỏ hơn 0.05% có ý nghĩa thống kê giữa các biến ở mức độ tin cậy 95%. Mức độ thể hiện kết quả được từ phương trình hồi quy đạt 87.4%.
3.4.1.2 Phương trình hồi quy 2
-Tiến hành nhập dữ liệu vào phần mềm và phân tích và được các bảng và giá trị liên quan như sau:
Standard T
Parameter Estimate Error Statistic P-Value
CONSTANT -0.0474124 0.133683 -0.354662 0.7230 LOG(chieu cao) -0.618038 0.026715 -23.1345 0.0000 LOG(chieu dai) 0.634592 0.0167459 37.8953 0.0000
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 51.1831 2 25.5916 985.63 0.0000
Residual 11.6062 447 0.0259647
Total (Corr.) 62.7893 449
Bảng giá trị phương sai và giá trị liên quan đến phương trình hồi quy -Kết quả phương trình hồi quy:
R-squared = 81.5156 percent
R-squared (adjusted for d.f.) = 81.4329 percent Standard Error of Est. = 0.161136
Mean absolute error = 0.127185
Durbin-Watson statistic = 0.735779 (P=0.0000) Lag 1 residual autocorrelation = 0.629822 Phương trình hồi quy
ket qua = -0.0474124 - 0.618038*LOG(chieu cao) + 0.634592*LOG(chieu dai) -Ta thấy rằng giá trị P-Value nhỏ hơn 0.05% có ý nghĩa thống kê giữa các biến ở mức độ tin cậy 95%. Mức độ thể hiện kết quả được từ phương trình hồi quy đạt 81.5%.
3.4.1.3 Phương trình hồi quy 3
-Tiến hành nhập dữ liệu vào phần mềm và phân tích và được các bảng và giá trị liên quan như sau:
Standard T
Parameter Estimate Error Statistic P-Value
CONSTANT 1.55213 0.0590059 26.3047 0.0000
SQRT(chieu cao) -0.237549 0.00908424 -26.1495 0.0000 SQRT(chieu dai) 0.0691995 0.00162273 42.644 0.0000
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 53.2729 2 26.6365 1251.1 5 0.0000 Residual 9.51642 447 0.0212895 Total (Corr.) 62.7893 449
Bảng giá trị phương sai và giá trị liên quan đến phương trình hồi quy -Kết quả phương trình hồi quy:
R-squared = 84.8439 percent
R-squared (adjusted for d.f.) = 84.7761 percent Standard Error of Est. = 0.145909
Mean absolute error = 0.115935
Durbin-Watson statistic = 0.888201 (P=0.0000) Lag 1 residual autocorrelation = 0.553162 Phương trình hồi quy
ket qua = 1.55213 - 0.237549*SQRT(chieu cao) + 0.0691995*SQRT(chieu dai)
3.4.1.4 Lựa chọn phương trình hồi quy
-Ta nhận thấy rằng phương trình hồi quy 1 có kết quả dữ liệu tốt nhất nên ta tiến hành lựa chọn phương trình hồi quy 1 để tối ưu hóa.
-Phương trình hồi quy 1
ket qua = 1.5626 - 0.0224867*(chieu cao) + 0.00182017*(chieu dai)
Giá trị P-Value nhỏ hơn 0.05% có ý nghĩa thống kê giữa các biến ở mức độ tin cậy 95%. Mức độ thể hiện kết quả được từ phương trình hồi quy đạt 87.4%.
3.4.2 Tối ưu hóa phương trình hồi quy
-Ta tiến hành tối ưu hóa phương trình hồi quy bằng cách gán trọng số Weight=1/XAc với X là biến số chủ đạo và bước nhảy c=0,1. Ta có được các phương trình sau:
3.4.2.1 Phương trình tối ưu 1
Weight variable: 1/Chieu caoA2
Standard T
Parameter Estimate Error Statistic P-Value
CONSTANT 0.607714 0.0244547 24.8506 0.0000
1/chieu caoA2 198.498 9.65725 20.5543 0.0000 chieu dai 0.00182017 0.0000469849 38.7394 0.0000
Source Sum of
Squares Df Mean Square F-Ratio P-Value
Model 50.9479 2 25.4739 961.61 0.0000
Residual 11.8414 447 0.0264909 Total
(Corr.)
62.7893 449
Bảng giá trị phương sai và giá trị liên quan đến phương trình hồi quy -Kết quả phương trình hồi quy:
R-squared = 81.141 percent
R-squared (adjusted for d.f.) = 81.0566 percent Standard Error of Est. = 0.16276
Mean absolute error = 0.134735
Durbin-Watson statistic = 0.705345 (P=0.0000) Lag 1 residual autocorrelation = 0.64449
-Phương trình hồi quy
Ket qua = 0.607714 + 198.498*1/chieu caoA2 + 0.00182017*chieu dai
3.4.2.2 Phương trình tối ưu 2
Weight variable: 1/Chieu caoA3
Standard T
Parameter Estimate Error Statistic P-Value
CONSTANT 0.700961 0.0235094 29.8162 0.0000
1/chieu caoA3 3158.35 169.725 18.6086 0.0000 chieu dai 0.00182017 0.0000491897 37.003 0.0000
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 49.8105 2 24.9052 857.75 0.0000
Residual 12.9789 447 0.0290355
Total (Corr.) 62.7893 449 R-squared = 79.3295 percent
R-squared (adjusted for d.f.) = 79.237 percent Standard Error of Est. = 0.170398
Mean absolute error = 0.141848
Durbin-Watson statistic = 0.643255 (P=0.0000) Lag 1 residual autocorrelation = 0.675436
ket qua = 0.700961 + 3158.35*1/chieu caoA3 + 0.00182017*chieu dai
Ta thấy rằng giá trị P-Value nhỏ hơn 0.05% có ý nghĩa thống kê giữa các biến ở mức độ tin cậy 95%. Mức độ thể hiện kết quả được từ phương trình hồi quy đạt 79.3%.
3.4.2.3 Phương trình tối ưu 3
Weight variable: 1/Chieu caoA4
Standard T
Parameter Estimate Error Statistic P-Value
CONSTANT 0.743285 0.0235444 31.5696 0.0000
1/chieu caoA4 55128.2 3212.55 17.1603 0.0000 chieu dai 0.00182017 0.000050879 35.7744 0.0000
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 48.9037 2 24.4518 787.14 0.0000
Residual 13.8856 447 0.0310641
Total (Corr.) 62.7893 449
Bảng giá trị phương sai và giá trị liên quan đến phương trình hồi quy -Kết quả phương trình hồi quy:
R-squared = 77.8853 percent
R-squared (adjusted for d.f.) = 77.7864 percent Standard Error of Est. = 0.17625
Mean absolute error = 0.1473
Durbin-Watson statistic = 0.601146 (P=0.0000)
ket qua = 0.743285 + 55128.2*1/chieu caoA4 + 0.00182017*chieu dai Lag 1 residual autocorrelation = 0.696382
Ta thấy rằng giá trị P-Value nhỏ hơn 0.05% có ý nghĩa thống kê giữa các biến ở mức độ tin cậy 95%. Mức độ thể hiện kết quả được từ phương trình hồi quy đạt 77.8%.
3.4.2.4 Kết luận
-Ta thấy rằng phương trình tối ưu 3 với các thơng số Weight variable: giá trị tốt
nhất trong tất cả phương trình.
ket qua = 1.5626 - 0.0224867*chieu cao + 0.00182017*chieu dai
-Giá trị P-Value nhỏ hơn 0.05% có ý nghĩa thống kê giữa các biến ở mức độ tin cậy 95%. Mức độ thể hiện kết quả được từ phương trình hồi quy đạt 87.7%.
3.4.3 Xây dựng phương trình hồi quy trên phần mềm Excel
-Để có mơ hình phương trình hồi quy tối ưu và kiểm tra lại tính chính xác, ta tiến hành sử dụng phần mềm Excel để tiến hành xây dựng phương trình hồi quy cho các dữ liệu đã được đo từ thực nghiệm. Sau khi tiến hành nhập dữ liệu và thao tác phân tích trên phần mềm ta được kết quả sau:
Regression Statistics Multiple R 0.958735935 R Square 0.919174594 Adjusted R Square 0.918812959 Standard E1TO1' 0.125690303 Observations 450 ANOVA ẩ£ ss MS F Significance F Regression 2 54.92558567 27.46 2792 8 3 1561.070069 2.217E-202 Residual 47 4 7.863752333 0.017 5922 8 7 Total 4 49 62.789338 Coefficients Standard
Error tstat P-value
Lower 95% Upper 95% Lower 95.0% Upper 95.0% Intercept 1.5626 0.028309476 55.19 7066 1 2 1.0594E-201 1.5069638 06 1.61823619 4 1.506963806 1.618236194 XVariable 1 -0.022486667 0.000765774 29.36 4631 6 6 2.2572E-106 0.0239916 31 0.02098170 3 -0.023991631 -0.020981703 X Variable 2 0.001820167 3.82887E-05 47.53 7969 5 1 6.3566E-177 0.0017449 18 0.00189541 5 0.001744918 0.001895415 -Phương trình hồi quy 112
Bảng giá trị phương sai và giá trị liên quan đến phương trình hồi quy -Phương trình hồi quy
Ket qua = 1.5626 -0.022486667*Chieu cao + 0.002192333*Chieu dai
-Ta thấy rằng giá trị P-Value nhỏ hơn 0.05% có ý nghĩa thống kê giữa các biến ở mức độ tin cậy 95%. Mức độ thể hiện kết quả được từ phương trình hồi quy đạt 91,9%.
3.4.4 Kết luận
-Sau q trình xử lí các số liệu, phân tích các mơ hình khác nhau và kể cả sử dụng phần mềm khác. Ta tiến hành chọn lựa được mơ hình hồi quy có kết quả tốt nhất là phương trình hồi quy: ket qua = 1.5626 - 0.0224867*chieu cao + 0.00182017*chieu dai với giá trị P-Value nhỏ hơn 0.05% có ý nghĩa thống kê giữa các biến ở mức độ tin cậy 95% và mức độ thể hiện kết quả được từ phương trình hồi quy đạt 87.7%.