Vìthế có rất nhiều nghiên cứu phải sử dụng mô hình gồm một biến phụ thuộc với haihoặc nhiều biến độc lập được gọi là hồi quy bội hay hồi quy nhiều biến.I.2 Mục tiêu nghiên cứuCó kiến thứ
Trang 1BỘ CÔNG THƯƠNG TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP THÀNH PHỐ HỒ CHÍ MINH
KHOA QUẢN TRỊ KINH DOANH
- ѠѠ
-TIỂU LUẬN GIỮA KỲ
MÔN HỌC: KINH TẾ LƯỢNG
CHƯƠNG 4: MÔ HÌNH HỒI QUY BỘI
Giảng viên phụ trách: ThS Hà Trọng Quang Lớp học phần: DHQT17CTT – 422000402903
TP HỒ CHÍ MINH, THÁNG 03 NĂM 2023
Trang 2DANH SÁCH THÀNH VIÊN:
STT Họ và tên Mã số SV Kết quả thực hiện
(Đánh giá của nhóm)
Trang 3MỤC LỤC
I GIỚI THIỆU CHUNG VỀ ĐỀ TÀI NGHIÊN CỨU 4
1.1 Lý do chọn đề tài 4
1.2 Mục tiêu nghiên cứu 4
1.3 Phương pháp nghiên cứu 4
II CƠ SỞ LÝ THUYẾT 5
2.1 Khái niệm 5
2.2 Ứng dụng của mô hình hồi quy bội 5
III TÌNH HUỐNG ỨNG DỤNG 7
3.1 Mô tả tình huống ứng dụng 7
3.2 Phân tích dữ liệu trên phần mềm SPSS 9
3.2.1 Nhập dữ liệu: 9
3.2.2 Phân tích: 10
3.2.3 Kết quả: 10
3.3 Kết luận 16
IV KẾT LUẬN CHUNG 17
TÀI LIỆU THAM KHẢO 18
I GIỚI THIỆU CHUNG VỀ ĐỀ TÀI NGHIÊN CỨU
Trang 4I.1 Lý do chọn đề tài
Mô hình hồi quy hai biến không đủ khả năng giải thích hành vi của biến phụ thuộc, cần phải có nhiều biến độc lập hơn Ví dụ, tiêu dùng phụ thuộc vào thu nhập khả dụng Tuy nhiên, có nhiều yếu tố khác cũng tác động lên tiêu dùng, chẳng hạn như
độ tuổi, giới tính, nghề nghiệp, khu vực sinh sống, vật giá, thói quen chi tiêu Vì thế có rất nhiều nghiên cứu phải sử dụng mô hình gồm một biến phụ thuộc với hai hoặc nhiều biến độc lập được gọi là hồi quy bội hay hồi quy nhiều biến
I.2 Mục tiêu nghiên cứu
Có kiến thức về kỹ thuật hồi quy của hàm ba biến, các loại kiểm định cần thiết như kiểm định các giả thuyết về tham số hồi quy, kiểm định sự phù hợp của mô hình và
dự báo
I.3 Phương pháp nghiên cứu
Bài tiểu luận được hoàn thành dựa trên các phương pháp nghiên cứu gồm: phương pháp nghiên cứu lý thuyết và phương pháp nghiên cứu thực tiễn Cụ thể:
+ Phương pháp nghiên cứu lý thuyết:
- Phương pháp phân tích – tổng hợp hóa lý thuyết
- Phương pháp mô hình hóa – phương pháp hồi quy
+ Phương pháp nghiên cứu thực tiễn:
- Phương pháp thu thập và xử lý dữ liệu
- Phương pháp phân tích – tổng kết
II CƠ SỞ LÝ THUYẾT
Khái niệm
Mô hình hồi quy bội (multiple regression) là một phương pháp trong kinh tế lượng
để dự đoán giá trị của một biến phụ thuộc (dependent variable) dựa trên một hoặc
Too long to read on your phone? Save to
read later on your computer
Save to a Studylist
Trang 5nhiều biến độc lập (independent variables) Mô hình này giả định rằng có một mối quan hệ tuyến tính giữa biến phụ thuộc và các biến độc lập
Mô hình hồi quy bội bao gồm các bước sau:
Chuẩn bị dữ liệu: thu thập và chuẩn bị các biến độc lập và phụ thuộc
Mô hình hóa: chọn biến độc lập để đưa vào mô hình, xây dựng mô hình hồi quy bội bằng cách tìm các hệ số tối ưu để giải thích biến độc lập cho biến phụ thuộc
Đánh giá mô hình: đánh giá mô hình bằng cách sử dụng các chỉ số đánh giá hiệu quả của mô hình như R-squared và F-test để đo lường độ chính xác của
mô hình
Kiểm định giả thuyết: kiểm tra các giả định của mô hình như sự độc lập tuyến tính giữa các biến độc lập, độc lập và phân phối chuẩn của sai số, và
sự tương quan giữa các biến độc lập
Ngoài ra, mô hình hồi quy bội cũng có thể được sử dụng để kiểm tra tác động của các biến độc lập lên biến phụ thuộc và để dự đoán giá trị của biến phụ thuộc trong các điều kiện khác nhau
Ứng dụng của mô hình hồi quy bội
Một số ứng dụng của mô hình hồi quy bội trong kinh tế lượng bao gồm:
Dự đoán doanh số bán hàng của một công ty dựa trên các biến độc lập như giá cả, quảng cáo và chất lượng sản phẩm
Nghiên cứu tác động của giáo dục và kinh nghiệm làm việc đến thu nhập của người lao động
Đánh giá ảnh hưởng của chính sách tài khóa đến tăng trưởng kinh tế
Để xây dựng mô hình hồi quy bội, chúng ta cần tìm hệ số hồi quy (hay còn gọi là
hệ số beta) cho mỗi biến độc lập Hệ số này cho biết mức độ ảnh hưởng của biến
Trang 6độc lập đó đến biến phụ thuộc, giữa đó mỗi hệ số được tính bằng cách so sánh giá trị trung bình của biến phụ thuộc khi biến độc lập thay đổi một đơn vị
Công thức của mô hình hồi quy bội cho biến phụ thuộc Y và các biến độc lập X1, X2, , Xp như sau:
Y = β0 + β1X1 + β2X2 + + βpXp + ε
Trong đó:
Y là biến phụ thuộc
X1, X2, , Xp là các biến độc lập
β0, β1, β2, , βp là hệ số hồi quy
ε là sai số ngẫu nhiên
Các hệ số hồi quy được tìm bằng cách sử dụng phương pháp bình phương tối thiểu
để tối ưu hóa một hàm mất mát Sau khi có các hệ số hồi quy, chúng ta có thể sử dụng mô hình để dự đoán giá trị của biến phụ thuộc trong các điều kiện khác nhau Khi phân tích mô hình hồi quy bội, chúng ta cần xem xét một số yếu tố như: Giá trị của hệ số hồi quy để hiểu mức độ ảnh hưởng của từng biến độc lập lên biến phụ thuộc
Độ chính xác của mô hình: đánh giá bằng các thống kê như R-square (hệ số xác định) hoặc RMSE (độ lỗi bình phương trung bình)
Kiểm tra giả định của mô hình như: độc lập, phân phối chuẩn và không có hiện tượng đa cộng tuyến giữa các biến độc lập
Kiểm tra nhiễu, giá trị bất thường và các tác động của giá trị ngoại lai lên mô hình
Tuy nhiên, khi sử dụng mô hình hồi quy bội, cần phải lưu ý đến các vấn đề như quan sát nhiễu, tương quan giữa các biến độc lập và nhiều biến độc lập không thực
Trang 7sự ảnh hưởng đến biến phụ thuộc Khi xử lý dữ liệu, cần phải đảm bảo dữ liệu là đầy đủ, chính xác và không chứa các giá trị bất thường hoặc thiếu sót
Tóm lại, mô hình hồi quy bội là một công cụ quan trọng trong kinh tế lượng để nghiên cứu mối quan hệ giữa các biến và dự đoán giá trị của biến phụ thuộc Tuy nhiên, để sử dụng mô hình này một cách hiệu quả, người ta cần có kiến thức về các giả định của mô hình và cách kiểm tra chúng, cũng như kỹ năng xây dựng và đánh giá mô hình
III TÌNH HUỐNG ỨNG DỤNG
Mô tả tình huống ứng dụng
Sử dụng mô hình hồi quy bội để phân tích tỷ lệ thất nghiệp tác động đến chỉ số giá tiêu dùng ở Việt Nam từ năm 2000 đến năm 2020
Bảng số liệu tỷ lệ thất nghiệp và chỉ số giá tiêu dùng của Việt Nam từ năm 2000 đến năm 2020 (Nguồn: World Bank)
Năm Tỷ lệ thất nghiệp (%U) Chỉ số giá tiêu dùng (%CPI)
Trang 82007 5.9 8.3
Phân tích dữ liệu trên phần mềm SPSS
Nhập dữ liệu:
Nhập số liệu trên SPSS với X là biến độc lập (tỷ lệ thất nghiệp) và Y là biến phụ thuộc (chỉ số giá tiêu dùng)
Trang 9I.2.1 Phân tích:
Các bước để phân tích dữ liệu theo mô hình hồi quy bội trên SPSS:
Bước 1: Nhập dữ liệu vào SPSS, gán tên cho các biến phụ thuộc và độc lập Kiểm tra các giả định cơ bản của mô hình hồi quy bội như tuyến tính, độc lập, phân phối chuẩn, đồng nhất phương sai và không đa cộng tuyến
Bước 2: Chọn Analyze -> Regression -> Linear để mở hộp thoại Linear Regression Chọn biến phụ thuộc vào ô Dependent và chọn các biến độc lập vào ô Independent(s)
Trang 10Bước 3: Chọn nút Statistics để mở hộp thoại Regression Statistics Chọn các tùy chọn như R-squared, Adjusted R-squared, ANOVA table, Durbin-Watson, Coefficients, Confidence intervals và Collinearity diagnostics
Bước 4: Chọn nút Plots để mở hộp thoại Regression Plots Chọn các tùy chọn như Normal probability plot of residuals, Histogram of residuals và Scatterplot of residuals
Bước 5: Chọn nút OK để chạy phân tích hồi quy bội và xem kết quả trên cửa sổ Output
I.2.2 Kết quả:
Model Summary b
Model R R Square Adjusted R
Square
Std Error of the Estimate
Durbin-Watson
a Predictors: (Constant), Tỷ lệ thất nghiệp (%U)
b Dependent Variable: Chỉ số giá tiêu dùng (%CPI)
Bảng Model Summary: cho biết giá trị R-squared và Adjusted R-squared để đánh giá mức độ giải thích của mô hình Giá trị này càng cao càng tốt, thường nằm trong khoảng từ 0 đến 1 Một mức tiêu chuẩn thường dùng là 0.5
Với kết quả trên, ta sẽ nhận xét như sau:
R: là hệ số tương quan giữa biến phụ thuộc và biến độc lập Giá trị này nằm trong khoảng từ -1 đến 1, càng gần 1 hoặc -1 thì mối quan hệ càng mạnh Theo kết quả trên, R bằng 0.105, cho thấy mối quan hệ giữa Chỉ số giá tiêu dùng (%CPI) và Tỷ lệ thất nghiệp (%U) là yếu và dương
Trang 11R Square: là hệ số xác định, cho biết phần trăm biến thiên của biến phụ thuộc được giải thích bởi biến độc lập Giá trị này nằm trong khoảng từ 0 đến 1, càng cao càng tốt Theo kết quả trên, R Square bằng 0.011, cho thấy chỉ có 1.1% biến thiên của Chỉ số giá tiêu dùng (%CPI) được giải thích bởi
Tỷ lệ thất nghiệp (%U)
Adjusted R Square: là hệ số xác định điều chỉnh, cho biết phần trăm biến thiên của biến phụ thuộc được giải thích bởi biến độc lập sau khi điều chỉnh cho số lượng biến độc lập trong mô hình Giá trị này cũng nằm trong khoảng
từ 0 đến 1, càng cao càng tốt Theo kết quả trên, Adjusted R Square bằng -0.044, cho thấy mô hình có hiệu suất kém hơn so với mô hình trung bình Std Error of the Estimate: là sai số chuẩn của ước lượng, cho biết sự chênh lệch trung bình giữa các giá trị quan sát và các giá trị dự đoán bởi mô hình Giá trị này càng thấp càng tốt Theo kết quả trên, Std Error of the Estimate bằng 5.56702, cho thấy mô hình có sai số khá cao
Durbin-Watson: là thống kê kiểm tra sự độc lập của các quan sát trong mô hình Giá trị này nằm trong khoảng từ 0 đến 4, càng gần 2 thì sự độc lập càng cao Theo kết quả trên, Durbin-Watson bằng 1.332, cho thấy có sự tương quan dương nhẹ giữa các quan sát liền kề
ANOVA a
Model Sum of
Squares
Square
1
Residual 557.851 18 30.992
a Dependent Variable: Chỉ số giá tiêu dùng (%CPI)
Trang 12b Predictors: (Constant), Tỷ lệ thất nghiệp (%U)
Bảng phân tích phương sai ANOVA: cho biết giá trị F-test và sig để kiểm tra sự phù hợp của mô hình Nếu sig nhỏ hơn 0.05, ta kết luận mô hình hồi quy là phù hợp với dữ liệu
Sum of Squares: là tổng bình phương sai số giữa các giá trị quan sát và các giá trị dự đoán bởi mô hình Có hai loại Sum of Squares: Regression là tổng bình phương sai số giữa các giá trị dự đoán và giá trị trung bình của biến phụ thuộc, Residual là tổng bình phương sai số giữa các giá trị quan sát và các giá trị dự đoán Total là tổng của Regression và Residual Trong trường hợp này, Sum of Squares Regression bằng 6.279, Sum of Squares Residual bằng 557.851 và Sum of Squares Total bằng 564.130
df: là bậc tự do, cho biết số lượng thông tin độc lập trong dữ liệu Có hai loại df: Regression là số lượng biến độc lập trong mô hình, Residual là số lượng quan sát trừ đi số lượng biến độc lập trừ đi 1 Total là tổng của Regression và Residual Trong trường hợp này, df Regression bằng 1, df Residual bằng 18
và df Total bằng 19
Mean Square: là tỷ lệ giữa Sum of Squares và df Có hai loại Mean Square: Regression là tỷ lệ giữa Sum of Squares Regression và df Regression, Residual là tỷ lệ giữa Sum of Squares Residual và df Residual Trong trường hợp này, Mean Square Regression bằng 6.279, Mean Square Residual bằng 30.992
F: là tỷ lệ giữa Mean Square Regression và Mean Square Residual Giá trị này càng cao thì mô hình càng phù hợp với dữ liệu Trong trường hợp này, F bằng 0.203
Sig.: là mức ý nghĩa thống kê của F-test Giá trị này càng nhỏ thì mô hình càng phù hợp với dữ liệu Một mức tiêu chuẩn thường dùng là 0.05 Nếu
Trang 13Sig nhỏ hơn 0.05, ta kết luận mô hình hồi quy là phù hợp với dữ liệu Trong trường hợp này, Sig bằng 0.658, lớn hơn 0.05, cho thấy mô hình hồi quy không phù hợp với dữ liệu
Coefficients a
Model Unstand
ardized
Coeffici
ents
Standar
dized
Coeffici
ents
t Sig Collinearity Statistics
Error
ce VIF
1
Tỷ lệ thất
nghiệp (%U) -.968 2.150 -.105 -.450 658 1.000 1.000
a Dependent Variable: Chỉ số giá tiêu dùng (%CPI)
Bảng phân tích hồi quy Coefficients: cho biết các hệ số hồi quy bội và các kiểm định t-test và VIF cho từng biến độc lập Nếu sig nhỏ hơn 0.05, ta kết luận biến đó
có ảnh hưởng có ý nghĩa thống kê đến biến phụ thuộc Nếu VIF lớn hơn 10, ta kết luận có hiện tượng đa cộng tuyến trong mô hình
Unstandardized Coefficients: là các hệ số hồi quy bội theo đơn vị gốc của các biến Có hai loại Unstandardized Coefficients: B là giá trị của hệ số hồi quy bội, Std Error là sai số chuẩn của hệ số hồi quy bội Trong trường hợp này, B (Constant) bằng 11.812, cho thấy giá trị dự đoán của Chỉ số giá tiêu dùng (%CPI) khi Tỷ lệ thất nghiệp (%U) bằng 0 B (Tỷ lệ thất nghiệp (%U)) bằng -0.968, cho thấy mối quan hệ âm giữa Chỉ số giá tiêu dùng (%CPI) và
Trang 14Tỷ lệ thất nghiệp (%U), tức là khi Tỷ lệ thất nghiệp (%U) tăng 1 đơn vị thì Chỉ số giá tiêu dùng (%CPI) giảm 0.968 đơn vị
Standardized Coefficients: là các hệ số hồi quy bội theo đơn vị chuẩn hóa của các biến Có một loại Standardized Coefficients: Beta là giá trị của hệ số hồi quy bội sau khi chuẩn hóa các biến Trong trường hợp này, Beta (Tỷ lệ thất nghiệp (%U)) bằng -0.105, cho thấy mối quan hệ âm giữa Chỉ số giá tiêu dùng (%CPI) và Tỷ lệ thất nghiệp (%U), tức là khi Tỷ lệ thất nghiệp (%U) tăng 1 đơn vị chuẩn hóa thì Chỉ số giá tiêu dùng (%CPI) giảm 0.105 đơn vị chuẩn hóa
t: là giá trị của kiểm định t-test cho từng biến độc lập Giá trị này càng cao thì biến đó càng có ảnh hưởng có ý nghĩa thống kê đến biến phụ thuộc Trong trường hợp này, t (Tỷ lệ thất nghiệp (%U)) bằng -0.450, cho thấy biến này không có ảnh hưởng có ý nghĩa thống kê đến Chỉ số giá tiêu dùng (%CPI)
Sig.: là mức ý nghĩa thống kê của kiểm định t-test cho từng biến độc lập Giá trị này càng nhỏ thì biến đó càng có ảnh hưởng có ý nghĩa thống kê đến biến phụ thuộc Một mức tiêu chuẩn thường dùng là 0.05 Nếu Sig nhỏ hơn 0.05,
ta kết luận biến đó có ảnh hưởng có ý nghĩa thống kê đến biến phụ thuộc Trong trường hợp này, Sig (Tỷ lệ thất nghiệp (%U)) bằng 0.658, lớn hơn 0.05, cho thấy biến này không có ảnh hưởng có ý nghĩa thống kê đến Chỉ số giá tiêu dùng (%CPI)
Collinearity Statistics là các chỉ số kiểm tra hiện tượng đa cộng tuyến trong
mô hình hồi quy bội trên SPSS Đa cộng tuyến là hiện tượng các biến độc lập có mối quan hệ tuyến tính mạnh với nhau, làm giảm độ tin cậy của các
hệ số hồi quy bội Có hai loại Collinearity Statistics: Tolerance và VIF Tolerance là tỷ lệ phần trăm biến thiên của một biến độc lập không được giải thích bởi các biến độc lập khác trong mô hình Giá trị này nằm trong khoảng
Trang 15từ 0 đến 1, càng cao càng tốt Một mức tiêu chuẩn thường dùng là 0.1 Nếu Tolerance nhỏ hơn 0.1, ta kết luận có hiện tượng đa cộng tuyến trong mô hình VIF là nghịch đảo của Tolerance, cho biết mức độ tăng của sai số chuẩn của hệ số hồi quy bội do đa cộng tuyến Giá trị này nằm trong khoảng
từ 1 trở lên, càng thấp càng tốt Một mức tiêu chuẩn thường dùng là 10 Nếu VIF lớn hơn 10, ta kết luận có hiện tượng đa cộng tuyến trong mô hình Trong trường hợp này, Tolerance (Tỷ lệ thất nghiệp (%U)) bằng 1.000 và VIF (Tỷ lệ thất nghiệp (%U)) bằng 1.000, cho thấy không có hiện tượng đa cộng tuyến trong mô hình
Phương trình hồi quy bội:
Chỉ số giá tiêu dùng (%CPI) = 11.812 - 0.968 * Tỷ lệ thất nghiệp (%U)
Trong đó:
Chỉ số giá tiêu dùng (%CPI) là biến phụ thuộc, cho biết mức độ tăng giá của một rổ hàng hóa và dịch vụ tiêu dùng trong một kỳ
Tỷ lệ thất nghiệp (%U) là biến độc lập, cho biết tỷ lệ người lao động không
có việc làm trong tổng số người lao động trong một kỳ
11.812 là hệ số chặn, cho biết giá trị dự đoán của Chỉ số giá tiêu dùng (%CPI) khi Tỷ lệ thất nghiệp (%U) bằng 0
-0.968 là hệ số hồi quy bội của Tỷ lệ thất nghiệp (%U), cho biết mối quan hệ
âm giữa Chỉ số giá tiêu dùng (%CPI) và Tỷ lệ thất nghiệp (%U), tức là khi
Tỷ lệ thất nghiệp (%U) tăng 1 đơn vị thì Chỉ số giá tiêu dùng (%CPI) giảm 0.968 đơn vị