tiểu luận tiểu luận giữa kỳ môn học kinh tế lượng chương 4 mô hình hồi quy bội

18 0 0
Tài liệu đã được kiểm tra trùng lặp
tiểu luận tiểu luận giữa kỳ môn học kinh tế lượng chương 4 mô hình hồi quy bội

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Vìthế có rất nhiều nghiên cứu phải sử dụng mô hình gồm một biến phụ thuộc với haihoặc nhiều biến độc lập được gọi là hồi quy bội hay hồi quy nhiều biến.I.2 Mục tiêu nghiên cứuCó kiến thứ

Trang 1

Giảng viên phụ trách: ThS Hà Trọng QuangLớp học phần: DHQT17CTT – 422000402903

TP HỒ CHÍ MINH, THÁNG 03 NĂM 2023

Trang 3

MỤC LỤC

I GIỚI THIỆU CHUNG VỀ ĐỀ TÀI NGHIÊN CỨU 4

1.1 Lý do chọn đề tài 4

1.2 Mục tiêu nghiên cứu 4

1.3 Phương pháp nghiên cứu 4

II CƠ SỞ LÝ THUYẾT 5

IV KẾT LUẬN CHUNG 17

TÀI LIỆU THAM KHẢO 18

I.GIỚI THIỆU CHUNG VỀ ĐỀ TÀI NGHIÊN CỨU

Trang 4

I.1 Lý do chọn đề tài

Mô hình hồi quy hai biến không đủ khả năng giải thích hành vi của biến phụ thuộc,cần phải có nhiều biến độc lập hơn Ví dụ, tiêu dùng phụ thuộc vào thu nhập khảdụng Tuy nhiên, có nhiều yếu tố khác cũng tác động lên tiêu dùng, chẳng hạn nhưđộ tuổi, giới tính, nghề nghiệp, khu vực sinh sống, vật giá, thói quen chi tiêu Vìthế có rất nhiều nghiên cứu phải sử dụng mô hình gồm một biến phụ thuộc với haihoặc nhiều biến độc lập được gọi là hồi quy bội hay hồi quy nhiều biến.

I.2 Mục tiêu nghiên cứu

Có kiến thức về kỹ thuật hồi quy của hàm ba biến, các loại kiểm định cần thiết nhưkiểm định các giả thuyết về tham số hồi quy, kiểm định sự phù hợp của mô hình vàdự báo.

I.3 Phương pháp nghiên cứu

Bài tiểu luận được hoàn thành dựa trên các phương pháp nghiên cứu gồm: phươngpháp nghiên cứu lý thuyết và phương pháp nghiên cứu thực tiễn Cụ thể:

+ Phương pháp nghiên cứu lý thuyết:

- Phương pháp phân tích – tổng hợp hóa lý thuyết- Phương pháp mô hình hóa – phương pháp hồi quy + Phương pháp nghiên cứu thực tiễn:

- Phương pháp thu thập và xử lý dữ liệu- Phương pháp phân tích – tổng kết

II.CƠ SỞ LÝ THUYẾTKhái niệm

Mô hình hồi quy bội (multiple regression) là một phương pháp trong kinh tế lượngđể dự đoán giá trị của một biến phụ thuộc (dependent variable) dựa trên một hoặc

Too long to read onyour phone? Save to

read later on yourcomputer

Save to a Studylist

Trang 5

nhiều biến độc lập (independent variables) Mô hình này giả định rằng có một mốiquan hệ tuyến tính giữa biến phụ thuộc và các biến độc lập.

Mô hình hồi quy bội bao gồm các bước sau:

Chuẩn bị dữ liệu: thu thập và chuẩn bị các biến độc lập và phụ thuộc.Mô hình hóa: chọn biến độc lập để đưa vào mô hình, xây dựng mô hình hồiquy bội bằng cách tìm các hệ số tối ưu để giải thích biến độc lập cho biếnphụ thuộc.

Đánh giá mô hình: đánh giá mô hình bằng cách sử dụng các chỉ số đánh giáhiệu quả của mô hình như R-squared và F-test để đo lường độ chính xác củamô hình.

Kiểm định giả thuyết: kiểm tra các giả định của mô hình như sự độc lậptuyến tính giữa các biến độc lập, độc lập và phân phối chuẩn của sai số, vàsự tương quan giữa các biến độc lập.

Ngoài ra, mô hình hồi quy bội cũng có thể được sử dụng để kiểm tra tác động củacác biến độc lập lên biến phụ thuộc và để dự đoán giá trị của biến phụ thuộc trongcác điều kiện khác nhau.

Ứng dụng của mô hình hồi quy bội

Một số ứng dụng của mô hình hồi quy bội trong kinh tế lượng bao gồm:

Dự đoán doanh số bán hàng của một công ty dựa trên các biến độc lập nhưgiá cả, quảng cáo và chất lượng sản phẩm.

Nghiên cứu tác động của giáo dục và kinh nghiệm làm việc đến thu nhập củangười lao động.

Đánh giá ảnh hưởng của chính sách tài khóa đến tăng trưởng kinh tế.Để xây dựng mô hình hồi quy bội, chúng ta cần tìm hệ số hồi quy (hay còn gọi làhệ số beta) cho mỗi biến độc lập Hệ số này cho biết mức độ ảnh hưởng của biến

Trang 6

độc lập đó đến biến phụ thuộc, giữa đó mỗi hệ số được tính bằng cách so sánh giátrị trung bình của biến phụ thuộc khi biến độc lập thay đổi một đơn vị.

Công thức của mô hình hồi quy bội cho biến phụ thuộc Y và các biến độc lập X1,X2, , Xp như sau:

Y = β0 + β1X1 + β2X2 + + βpXp + ε

Trong đó:

Y là biến phụ thuộc

X1, X2, , Xp là các biến độc lậpβ0, β1, β2, , βp là hệ số hồi quyε là sai số ngẫu nhiên

Các hệ số hồi quy được tìm bằng cách sử dụng phương pháp bình phương tối thiểuđể tối ưu hóa một hàm mất mát Sau khi có các hệ số hồi quy, chúng ta có thể sửdụng mô hình để dự đoán giá trị của biến phụ thuộc trong các điều kiện khác nhau.Khi phân tích mô hình hồi quy bội, chúng ta cần xem xét một số yếu tố như:

Giá trị của hệ số hồi quy để hiểu mức độ ảnh hưởng của từng biến độc lậplên biến phụ thuộc.

Độ chính xác của mô hình: đánh giá bằng các thống kê như R-square (hệ sốxác định) hoặc RMSE (độ lỗi bình phương trung bình).

Kiểm tra giả định của mô hình như: độc lập, phân phối chuẩn và không cóhiện tượng đa cộng tuyến giữa các biến độc lập.

Kiểm tra nhiễu, giá trị bất thường và các tác động của giá trị ngoại lai lên môhình.

Tuy nhiên, khi sử dụng mô hình hồi quy bội, cần phải lưu ý đến các vấn đề nhưquan sát nhiễu, tương quan giữa các biến độc lập và nhiều biến độc lập không thực

Trang 7

sự ảnh hưởng đến biến phụ thuộc Khi xử lý dữ liệu, cần phải đảm bảo dữ liệu làđầy đủ, chính xác và không chứa các giá trị bất thường hoặc thiếu sót.

Tóm lại, mô hình hồi quy bội là một công cụ quan trọng trong kinh tế lượng đểnghiên cứu mối quan hệ giữa các biến và dự đoán giá trị của biến phụ thuộc Tuynhiên, để sử dụng mô hình này một cách hiệu quả, người ta cần có kiến thức về cácgiả định của mô hình và cách kiểm tra chúng, cũng như kỹ năng xây dựng và đánhgiá mô hình.

III.TÌNH HUỐNG ỨNG DỤNGMô tả tình huống ứng dụng

Sử dụng mô hình hồi quy bội để phân tích tỷ lệ thất nghiệp tác động đến chỉ số giátiêu dùng ở Việt Nam từ năm 2000 đến năm 2020

Bảng số liệu tỷ lệ thất nghiệp và chỉ số giá tiêu dùng của Việt Nam từ năm 2000đến năm 2020 (Nguồn: World Bank)

Năm Tỷ lệ thất nghiệp (%U) Chỉ số giá tiêu dùng (%CPI)

Trang 9

I.2.1 Phân tích:

Các bước để phân tích dữ liệu theo mô hình hồi quy bội trên SPSS:

Bước 1: Nhập dữ liệu vào SPSS, gán tên cho các biến phụ thuộc và độc lập Kiểmtra các giả định cơ bản của mô hình hồi quy bội như tuyến tính, độc lập, phân phốichuẩn, đồng nhất phương sai và không đa cộng tuyến.

Bước 2: Chọn Analyze -> Regression -> Linear để mở hộp thoại LinearRegression Chọn biến phụ thuộc vào ô Dependent và chọn các biến độc lập vào ôIndependent(s).

Trang 10

Bước 3: Chọn nút Statistics để mở hộp thoại Regression Statistics Chọn các tùychọn như R-squared, Adjusted R-squared, ANOVA table, Durbin-Watson,Coefficients, Confidence intervals và Collinearity diagnostics.

Bước 4: Chọn nút Plots để mở hộp thoại Regression Plots Chọn các tùy chọn nhưNormal probability plot of residuals, Histogram of residuals và Scatterplot ofresiduals.

Bước 5: Chọn nút OK để chạy phân tích hồi quy bội và xem kết quả trên cửa sổOutput.

I.2.2 Kết quả: Model Summaryb

Model R R Square Adjusted RSquare

Std Error of the Estimate Watson

Với kết quả trên, ta sẽ nhận xét như sau:

R: là hệ số tương quan giữa biến phụ thuộc và biến độc lập Giá trị này nằmtrong khoảng từ -1 đến 1, càng gần 1 hoặc -1 thì mối quan hệ càng mạnh.Theo kết quả trên, R bằng 0.105, cho thấy mối quan hệ giữa Chỉ số giá tiêudùng (%CPI) và Tỷ lệ thất nghiệp (%U) là yếu và dương.

Trang 11

R Square: là hệ số xác định, cho biết phần trăm biến thiên của biến phụthuộc được giải thích bởi biến độc lập Giá trị này nằm trong khoảng từ 0đến 1, càng cao càng tốt Theo kết quả trên, R Square bằng 0.011, cho thấychỉ có 1.1% biến thiên của Chỉ số giá tiêu dùng (%CPI) được giải thích bởiTỷ lệ thất nghiệp (%U).

Adjusted R Square: là hệ số xác định điều chỉnh, cho biết phần trăm biếnthiên của biến phụ thuộc được giải thích bởi biến độc lập sau khi điều chỉnhcho số lượng biến độc lập trong mô hình Giá trị này cũng nằm trong khoảngtừ 0 đến 1, càng cao càng tốt Theo kết quả trên, Adjusted R Square bằng-0.044, cho thấy mô hình có hiệu suất kém hơn so với mô hình trung bình.

Std Error of the Estimate: là sai số chuẩn của ước lượng, cho biết sự chênhlệch trung bình giữa các giá trị quan sát và các giá trị dự đoán bởi mô hình.Giá trị này càng thấp càng tốt Theo kết quả trên, Std Error of the Estimatebằng 5.56702, cho thấy mô hình có sai số khá cao.

Durbin-Watson: là thống kê kiểm tra sự độc lập của các quan sát trong môhình Giá trị này nằm trong khoảng từ 0 đến 4, càng gần 2 thì sự độc lậpcàng cao Theo kết quả trên, Durbin-Watson bằng 1.332, cho thấy có sựtương quan dương nhẹ giữa các quan sát liền kề.

Model Sum ofSquares

Trang 12

b Predictors: (Constant), Tỷ lệ thất nghiệp (%U)

Bảng phân tích phương sai ANOVA: cho biết giá trị F-test và sig để kiểm tra sựphù hợp của mô hình Nếu sig nhỏ hơn 0.05, ta kết luận mô hình hồi quy là phùhợp với dữ liệu.

Sum of Squares: là tổng bình phương sai số giữa các giá trị quan sát và cácgiá trị dự đoán bởi mô hình Có hai loại Sum of Squares: Regression là tổngbình phương sai số giữa các giá trị dự đoán và giá trị trung bình của biến phụthuộc, Residual là tổng bình phương sai số giữa các giá trị quan sát và cácgiá trị dự đoán Total là tổng của Regression và Residual Trong trường hợpnày, Sum of Squares Regression bằng 6.279, Sum of Squares Residual bằng557.851 và Sum of Squares Total bằng 564.130.

df: là bậc tự do, cho biết số lượng thông tin độc lập trong dữ liệu Có hai loạidf: Regression là số lượng biến độc lập trong mô hình, Residual là số lượngquan sát trừ đi số lượng biến độc lập trừ đi 1 Total là tổng của Regression vàResidual Trong trường hợp này, df Regression bằng 1, df Residual bằng 18và df Total bằng 19.

Mean Square: là tỷ lệ giữa Sum of Squares và df Có hai loại Mean Square:Regression là tỷ lệ giữa Sum of Squares Regression và df Regression,Residual là tỷ lệ giữa Sum of Squares Residual và df Residual Trong trườnghợp này, Mean Square Regression bằng 6.279, Mean Square Residual bằng30.992.

F: là tỷ lệ giữa Mean Square Regression và Mean Square Residual Giá trịnày càng cao thì mô hình càng phù hợp với dữ liệu Trong trường hợp này, Fbằng 0.203.

Sig.: là mức ý nghĩa thống kê của F-test Giá trị này càng nhỏ thì mô hìnhcàng phù hợp với dữ liệu Một mức tiêu chuẩn thường dùng là 0.05 Nếu

Trang 13

Sig nhỏ hơn 0.05, ta kết luận mô hình hồi quy là phù hợp với dữ liệu Trongtrường hợp này, Sig bằng 0.658, lớn hơn 0.05, cho thấy mô hình hồi quykhông phù hợp với dữ liệu.

Model UnstandardizedCoefficients

t Sig Collinearity Statistics

Bảng phân tích hồi quy Coefficients: cho biết các hệ số hồi quy bội và các kiểmđịnh t-test và VIF cho từng biến độc lập Nếu sig nhỏ hơn 0.05, ta kết luận biến đócó ảnh hưởng có ý nghĩa thống kê đến biến phụ thuộc Nếu VIF lớn hơn 10, ta kếtluận có hiện tượng đa cộng tuyến trong mô hình.

Unstandardized Coefficients: là các hệ số hồi quy bội theo đơn vị gốc củacác biến Có hai loại Unstandardized Coefficients: B là giá trị của hệ số hồiquy bội, Std Error là sai số chuẩn của hệ số hồi quy bội Trong trường hợpnày, B (Constant) bằng 11.812, cho thấy giá trị dự đoán của Chỉ số giá tiêudùng (%CPI) khi Tỷ lệ thất nghiệp (%U) bằng 0 B (Tỷ lệ thất nghiệp (%U))bằng -0.968, cho thấy mối quan hệ âm giữa Chỉ số giá tiêu dùng (%CPI) và

Trang 14

Tỷ lệ thất nghiệp (%U), tức là khi Tỷ lệ thất nghiệp (%U) tăng 1 đơn vị thìChỉ số giá tiêu dùng (%CPI) giảm 0.968 đơn vị.

Standardized Coefficients: là các hệ số hồi quy bội theo đơn vị chuẩn hóacủa các biến Có một loại Standardized Coefficients: Beta là giá trị của hệ sốhồi quy bội sau khi chuẩn hóa các biến Trong trường hợp này, Beta (Tỷ lệthất nghiệp (%U)) bằng -0.105, cho thấy mối quan hệ âm giữa Chỉ số giátiêu dùng (%CPI) và Tỷ lệ thất nghiệp (%U), tức là khi Tỷ lệ thất nghiệp(%U) tăng 1 đơn vị chuẩn hóa thì Chỉ số giá tiêu dùng (%CPI) giảm 0.105đơn vị chuẩn hóa.

t: là giá trị của kiểm định t-test cho từng biến độc lập Giá trị này càng caothì biến đó càng có ảnh hưởng có ý nghĩa thống kê đến biến phụ thuộc.Trong trường hợp này, t (Tỷ lệ thất nghiệp (%U)) bằng -0.450, cho thấy biếnnày không có ảnh hưởng có ý nghĩa thống kê đến Chỉ số giá tiêu dùng(%CPI).

Sig.: là mức ý nghĩa thống kê của kiểm định t-test cho từng biến độc lập Giátrị này càng nhỏ thì biến đó càng có ảnh hưởng có ý nghĩa thống kê đến biếnphụ thuộc Một mức tiêu chuẩn thường dùng là 0.05 Nếu Sig nhỏ hơn 0.05,ta kết luận biến đó có ảnh hưởng có ý nghĩa thống kê đến biến phụ thuộc.Trong trường hợp này, Sig (Tỷ lệ thất nghiệp (%U)) bằng 0.658, lớn hơn0.05, cho thấy biến này không có ảnh hưởng có ý nghĩa thống kê đến Chỉ sốgiá tiêu dùng (%CPI).

Collinearity Statistics là các chỉ số kiểm tra hiện tượng đa cộng tuyến trongmô hình hồi quy bội trên SPSS Đa cộng tuyến là hiện tượng các biến độclập có mối quan hệ tuyến tính mạnh với nhau, làm giảm độ tin cậy của cáchệ số hồi quy bội Có hai loại Collinearity Statistics: Tolerance và VIF.Tolerance là tỷ lệ phần trăm biến thiên của một biến độc lập không được giảithích bởi các biến độc lập khác trong mô hình Giá trị này nằm trong khoảng

Trang 15

từ 0 đến 1, càng cao càng tốt Một mức tiêu chuẩn thường dùng là 0.1 NếuTolerance nhỏ hơn 0.1, ta kết luận có hiện tượng đa cộng tuyến trong môhình VIF là nghịch đảo của Tolerance, cho biết mức độ tăng của sai sốchuẩn của hệ số hồi quy bội do đa cộng tuyến Giá trị này nằm trong khoảngtừ 1 trở lên, càng thấp càng tốt Một mức tiêu chuẩn thường dùng là 10 NếuVIF lớn hơn 10, ta kết luận có hiện tượng đa cộng tuyến trong mô hình.Trong trường hợp này, Tolerance (Tỷ lệ thất nghiệp (%U)) bằng 1.000 vàVIF (Tỷ lệ thất nghiệp (%U)) bằng 1.000, cho thấy không có hiện tượng đacộng tuyến trong mô hình.

Phương trình hồi quy bội:

Chỉ số giá tiêu dùng (%CPI) = 11.812 - 0.968 * Tỷ lệ thất nghiệp (%U)Trong đó:

Chỉ số giá tiêu dùng (%CPI) là biến phụ thuộc, cho biết mức độ tăng giá củamột rổ hàng hóa và dịch vụ tiêu dùng trong một kỳ.

Tỷ lệ thất nghiệp (%U) là biến độc lập, cho biết tỷ lệ người lao động khôngcó việc làm trong tổng số người lao động trong một kỳ.

11.812 là hệ số chặn, cho biết giá trị dự đoán của Chỉ số giá tiêu dùng(%CPI) khi Tỷ lệ thất nghiệp (%U) bằng 0.

-0.968 là hệ số hồi quy bội của Tỷ lệ thất nghiệp (%U), cho biết mối quan hệâm giữa Chỉ số giá tiêu dùng (%CPI) và Tỷ lệ thất nghiệp (%U), tức là khiTỷ lệ thất nghiệp (%U) tăng 1 đơn vị thì Chỉ số giá tiêu dùng (%CPI) giảm0.968 đơn vị.

Trang 16

Tỷ lệ thất nghiệp không có ảnh hưởng có ý nghĩa thống kê đến chỉ số giátiêu dùng, vì giá trị Sig của kiểm định t-test trong bảng Coefficients lớn hơn0.05.

Mô hình hồi quy ba biến bao gồm một biến phụ thuộc Y và hai biến độc lập X, làtrường hợp đơn giản nhất đại diện cho mô hình hồi quy hội, có từ hai biển X trởlên Mô hình này cũng được ước lượng các tham số theo phương pháp OLS giốngnhư mô hình hai biến Bên cạnh đó, các kiểm định cũng được thực hiện như kiểmđịnh các giả thuyết về tham số hồi quy, kiểm định sự phù hợp của mô hình, v.v.Tuy nhiên, do có nhiều biến X, kỹ thuật tính toán phức tạp và mất nhiều thời gianhơn so với mô hình hai biến Tùy điều kiện khả thi của dữ liệu và mục tiêu của nhànghiên cứu, mô hình phù hợp được chọn để thực nghiệm

Trang 17

TÀI LIỆU THAM KHẢO

Giáo trình Kinh Tế Lượng – NXB Trường ĐH Công Nghiệp Thành phố HồChí Minh

Bảng số liệu tỷ lệ thất nghiệp và chỉ số giá tiêu dùng của Việt Nam từ năm2000 đến năm 2020 (Nguồn: World Bank)

https://www.phamlocblog.com/2016/11/cach-chay-hoi-quy-trong-spss.html

Ngày đăng: 25/05/2024, 17:35

Tài liệu cùng người dùng

Tài liệu liên quan