Các mô hình hồi quy hai biến thực hành bằng ngôn ngữ r

58 419 0
Các mô hình hồi quy hai biến thực hành bằng ngôn ngữ r

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI KHOA TOÁN ************* TRẦN HUYỀN TRANG CÁC HÌNH HỒI QUY HAI BIẾN: THỰC HÀNH BẰNG NGÔN NGỮ R KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên ngành: Toán ứng dụng HÀ NỘI – 2016 TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI KHOA TOÁN ************* TRẦN HUYỀN TRANG CÁC HÌNH HỒI QUY HAI BIẾN: THỰC HÀNH BẰNG NGÔN NGỮ R KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên ngành: Toán ứng dụng Người hướng dẫn khoa học TS Hà Bình Minh HÀ NỘI – 2016 Lời cảm ơn Trước trình bày nội dung khóa luận tốt nghiệp, em xin bày tỏ lòng biết ơn sâu sắc tới Tiến sĩ Hà Bình Minh tận tình hướng dẫn để em hoàn thành đề tài Em xin bày tỏ lòng biết ơn chân thành tới toàn thể thầy cô giáo khoa Toán, Trường Đại học Sư phạm Hà Nội dạy bảo em tận tình suốt trình học tập khoa Nhân dịp em xin gửi lời cảm ơn chân thành tới gia đình, bạn bè bên em, động viên, giúp đỡ em suốt trình học tập thực đề tài thực tập Hà Nội, ngày 27 tháng 04 năm 2016 Sinh viên Trần Huyền Trang i Lời cam đoan Tôi xin cam đoan số liệu kết nghiên cứu khóa luận trung thực không trùng lặp với đề tài khác Tôi xin cam đoan giúp đỡ cho việc thực khóa luận cảm ơn thông tin thu trích dẫn khóa luận rõ nguồn gốc Hà Nội, ngày 27 tháng 04 năm 2016 Sinh viên Trần Huyền Trang ii Mục lục Lời mở đầu iii Kiến thức chuẩn bị 1.1 1.2 Khái niệm hồi quy 1.1.1 Phân tích hồi quy 1.1.2 Biến phụ thuộc biến độc lập hình hồi quy hai biến tuyến tính 1.2.1 Dạng hình 1.2.2 Phương pháp phân tích hình 2 Giới thiệu ngôn ngữ R 2.1 2.2 Tổng quan R 2.1.1 Khái niệm R 2.1.2 Làm quen với R 2.1.3 Cách đặt tên R 2.1.4 Hỗ trợ R Lập trình với R 2.2.1 Cách nhập liệu vào R 2.2.2 Vẽ biểu đồ R 10 i Khóa luận tốt nghiệp Đại học 2.2.3 Trần Huyền Trang Phân tích hồi quy tuyến tính Các hình hồi quy hai biến 3.1 3.2 3.3 3.4 3.5 11 14 hình hồi quy qua gốc tọa độ (Regression - Through Origin model) 14 hình logarit kép (Log - Log) 17 3.2.1 Giới thiệu hình log-log 17 3.2.2 Cách chuyển hình hồi quy tuyến tính 17 3.2.3 Ví dụ 19 hình Log - Lin (Log-Linear model) hay hình tăng trưởng 25 3.3.1 Giới thiệu hình log - lin 25 3.3.2 Cách chuyển hình hồi quy tuyến tính 25 3.3.3 Ví dụ 27 hình tuyến tính - Logarit (Lin - Log model) 30 3.4.1 Giới thiệu hình lin - log 30 3.4.2 Ví dụ 33 hình nghịch đảo (Reciprocal Model) hay hình Hyperbol 36 3.5.1 Giới thiệu hình nghịch đảo 36 3.5.2 Ví dụ 40 3.6 So sánh R2 hình 45 3.7 Bảng tổng kết dạng hình hồi quy hai biến 47 Tài liệu tham khảo 48 ii Khóa luận tốt nghiệp Đại học Trần Huyền Trang Lời mở đầu Lý chọn đề tài Trong thực tiễn nghiên cứu số vấn đề kinh tế, xã hội GDP, tỷ lệ lạm phát người ta xây dựng hình hồi quy tuyến tính để thể mối quan hệ biến, từ phản ánh chất tượng Để khảo sát tượng kinh tế này, người ta viết phần mềm giúp xử lý số liệu đơn giản Năm 1996, hai nhà thống kê học Ross Ihaka Robert Gentleman [lúc đó] thuộc Trường đại học Auckland, New Zealand phát hoạ ngôn ngữ cho phân tích thống kê mà họ đặt tên R R phần mềm tiện ích, không đa năng, dễ sử dụng mà việc cài đặt đơn giản đặc biệt hoàn toàn miễn phí Trên cở sở đó, với mong muốn tìm hiểu sâu sắc hình hồi quy ứng dụng phần mềm R nào, em chọn đề tài "Các hình hồi quy hai biến: Thực hành ngôn ngữ R" làm đề tài khóa luận tốt nghiệp đại học Mục đích nghiên cứu Nghiên cứu hình hồi quy hai biến thực hồi quy tuyến tính việc sử dụng ngôn ngữ R Nhiệm vụ nghiên cứu Tìm hiểu hình hồi quy hai biến thực hành chúng phần mềm R Đối tượng phạm vi nghiên cứu Trong khuôn khổ khóa luận, em nghiên cứu hình hồi iii Khóa luận tốt nghiệp Đại học Trần Huyền Trang quy hai biến sử dụng ngôn ngữ R phân tích số liệu vẽ biểu đồ Ngoài ra, khóa luận giới thiệu cách tổng quát phần mềm chuyên dụng R Phương pháp nghiên cứu Sưu tầm, đọc nghiên cứu tài liệu, phân tích, tổng hợp kiến thức Trao đổi, thảo luận với người hướng dẫn khoa học qua tổng hợp kiến thức trình bày theo đề cương nghiên cứu, thực theo kế hoạch để hoàn thành khóa luận Cấu trúc khóa luận Ngoài phần mở đầu, kết luận, tài liệu tham khảo, khóa luận tốt nghiệp bao gồm ba chương: • Chương 1: Kiến thức chuẩn bị Chương trình bày số khái niệm biến độc lập, biến phụ thuộc, hình hồi quy hai biến tuyến tính cách thủ công để phân tích hình • Chương 2: Giới thiệu ngôn ngữ R Chương giới thiệu phần mềm R gồm làm quen bước đầu với R, cách nhập liệu, vẽ biểu đồ phân tích hồi quy tuyến tính • Chương 3: Các hình hồi quy hai biến Chương nghiên cứu hình hồi quy hai biến, cách chuyển chúng dạng hình hồi quy tuyến tính từ nêu ví dụ minh họa tương ứng sử dụng phần mềm R để phân tích số liệu iv Khóa luận tốt nghiệp Đại học Trần Huyền Trang vẽ biểu đồ hình hồi quy Do thời gian thực không nhiều, kiến thức hạn chế nên khóa luận không tránh khỏi sai sót Tác giả mong nhận góp ý ý kiến phản biện quý thầy cô bạn đọc Xin chân thành cảm ơn! Hà Nội, ngày 27/04/2016 Tác giả khóa luận Trần Huyền Trang v Chương Kiến thức chuẩn bị 1.1 Khái niệm hồi quy 1.1.1 Phân tích hồi quy Phân tích hồi quy tìm mối quan hệ phụ thuộc biến phụ thuộc vào nhiều biến khác (được gọi biến độc lập), nhằm mục đích ước lượng tiên đoán giá trị kỳ vọng biến phụ thuộc biết trước giá trị biến độc lập 1.1.2 Biến phụ thuộc biến độc lập Biến phụ thuộc ký hiệu Y nhận giá trị xác định, biến độc lập biến ngẫu nhiên, ký hiệu X2 , X3 , Trong mối quan hệ hai biến này, biến phụ thuộc chịu tác động biến độc lập, biến độc lập biến gây ảnh hưởng cho biến phụ thuộc Chẳng hạn, ta xét mối quan hệ kết học tập với thời gian rèn luyện Khi thời gian rèn luyện tăng lên, kết học tập cao ngược Khóa luận tốt nghiệp Đại học Trần Huyền Trang • Nếu ta thực hồi quy tuyến tính, với GNP biến phụ thuộc M2 biến độc lập: + Dữ liệu đầu vào R: > reg summary(reg) ⇒ Kết sau: • Nhận xét Với mẫu số liệu trên, yếu tố khác không đổi, GNP tăng lên triệu USD lượng cung tiền tăng lên khoảng 1,53 • Biểu đồ phân tán tả quan hệ M2 với GNP cho thấy GNP tăng gần đường thẳng Ngoài ra, để tìm hiểu xem lượng cung tiền tăng 1% GNP tăng lên (tỷ USD), ta sử dụng hình dạng lin - log Kết sau: > reg summary(reg) 35 Khóa luận tốt nghiệp Đại học Trần Huyền Trang Từ bảng kết hồi quy trên, ta nhận xét sau: Đối với mẫu số liệu nói trên, lượng cung tiền tăng lên 1% bình quân, kéo theo gia tăng GNP khoảng 25,85 triệu USD 3.5 hình nghịch đảo (Reciprocal Model) hay hình Hyperbol 3.5.1 Giới thiệu hình nghịch đảo hình nghịch đảo cho thấy biến phụ thuộc Y có quan hệ nghịch đảo với biến độc lập X Dạng tổng quát hình: Yi = β1 + β2 ( ) + Ui Xi ∗ Đặc điểm hình + Khi biến độc lập X tăng vô hạn 1/X tiến 0,khi biến phụ 36 Khóa luận tốt nghiệp Đại học Trần Huyền Trang thuộc Y tiến β1 , giá trị gọi tiệm cận ngang + Nếu β2 > 0, Y hàm giảm theo X; β2 < Y hàm tăng theo β2 X; Y = X = - β1 ∗ Một số áp dụng hình nghịch đảo phù hợp cho nghiên cứu đường chi phí sản xuất cố định trung bình (AFC - Average fixed cost) (biến Y) sản lượng (biến X); đường tiêu dùng theo thu nhập Engel đường cong Phillips (1) Quan hệ AFC sản lượng: Lý thuyết kinh tế cho thấy sản lượng tăng chi phí sản xuất cố định trung bình sản phẩm có khuynh hướng giảm dần không vượt qua mức tối thiểu Quan hệ biểu diễn qua biểu đồ sau: Hình 3.4: Dạng hàm nghịch đảo biểu thị quan hệ AFC (Y) sản lượng (X) (2) Đường cong Phillips biểu thị quan hệ tỷ lệ thay đổi tiền lượng (Y) tỷ lệ thất nghiệp (X) Khi tỷ lệ thất nghiệp tăng 37 Khóa luận tốt nghiệp Đại học Trần Huyền Trang mức tỷ lệ thất nghiệp tự nhiên U N tiền lương tăng (Y > 0), mức lương tăng có khuynh hướng giảm dần (đường cong xuống dốc, hướng 0) Khi tỷ lệ thất nghiệp tăng vượt mức U N , tiền lương giảm (Y < 0) mức giảm tăng dần (đường cong xa dần 0) tỷ lệ giảm sút tiền lương không vượt giá trị |β1 | Hình 3.5: Đường cong Engel biểu diễn quan hệ chi tiêu người tiêu dùng loại hàng (Y) tổng chi tiêu hay tổng thu nhập (X) 38 Khóa luận tốt nghiệp Đại học Trần Huyền Trang Hình 3.6: Ảnh hưởng thu nhập (X) lên chi tiêu mặt hàng (Y) Theo lý thuyết kinh tế, chi tiêu cho loại hàng hóa tăng thu nhập tổng chi tiêu tăng Tuy nhiên, số loại hàng hóa, thu nhập người tiêu dùng phải đạt mức tối thiểu -(-β2 /β1 ) gọi mức thu nhập tới hạn hay ngưỡng thu nhập họ sử dụng loại hàng hóa này(thường loại hàng hóa xa xỉ) Ngoài ra, nhu cầu loại hàng hữu hạn Cho nên, tới giới hạn nhu cầu, cho dù thu nhập có tăng lên họ không tiêu thụ thêm loại mặt hàng này, ta nói trạng thái bảo hòa (β1 ) 39 Khóa luận tốt nghiệp Đại học 3.5.2 Trần Huyền Trang Ví dụ Khảo sát mẫu số liệu sau mối quan hệ tỷ lệ lạm phát tỷ lệ thất nghiệp Hoa Kỳ giai đoạn (1960 - 1998)4 Năm LẠM PHÁT THẤT NGHIỆP Năm LẠM PHÁT THẤT NGHIỆP 1960 1.7 5.5 1980 13.5 7.1 1961 1.0 6.7 1981 10.3 7.6 1962 1.0 5.5 1982 6.2 9.7 1963 1.3 5.7 1983 3.2 9.6 1964 1.3 5.2 1984 4.3 7.5 1965 1.6 4.5 1985 3.6 7.2 1966 2.9 3.8 1986 1.9 7.0 1967 3.1 3.8 1987 3.6 6.2 1968 4.2 3.6 1988 4.1 5.5 1969 5.5 5.7 1989 4.8 5.3 1970 5.7 4.9 1990 5.4 5.6 1971 4.4 5.9 1991 4.2 6.8 1972 3.2 5.6 1992 3.0 7.5 1973 6.2 4.9 1993 3.0 6.9 1974 11.0 5.6 1994 2.6 6.1 1975 9.1 8.5 1995 2.8 5.6 1976 5.8 7.7 1996 3.0 5.4 1977 6.5 7.1 1997 2.3 4.9 1978 7.6 6.1 1998 1.6 4.5 1979 11.3 5.8 • Lưu ý: Từ sau công bố đường cong Phillips mối quan hệ lạm phát thất nghiệp, nhiều nhà nghiên cứu đề xuất giải Source: Economic Report of the President, 1999 Trích: Damodar N Gujarati, Basic Econometrics, Fourth Edition, page 188 40 Khóa luận tốt nghiệp Đại học Trần Huyền Trang pháp mở rộng dựa lý thuyết kinh tế nhờ vào kinh nghiệm thực tế Một số nhà nghiên cứu kể Oliver Blanchard5 Giải pháp mở rộng Oliver đề nghị tóm tắt sau: - Tỷ lệ lạm phát thời kỳ t tính dựa CPI: πt - Tỷ lệ lạm phát kỳ vọng thời điểm t, ước tính dựa vào tỷ lệ lạm phát thời điểm (t - 1): - Tỷ lệ thất nghiệp thực tế thời điểm t: U N t - Tỷ lệ thất nghiệp tự nhiên thời điểm t: U n - Đường cong Phillips cải tiến tả qua hình sau: πt − πte = β2 (U Nt − U n ) + ut - Tuy nhiên, đại lượng πte không trực tiếp quan sát được, nên để đơn giản hơn, người ta thay πt−1 , tỷ lệ lạm phát thời điểm (t-1) Phương trình trở thành: πt − πt−1 = β1 + β2 U N t + ut Trong đó: β1 = −β2 U n ⇒ U n = −ββ21 hình hình hồi quy tuyến tính, vế trái thể chênh lệch tỷ lệ lạm phát hai thời điểm t và(t - 1), chênh lệch có ảnh hưởng tỷ lệ thất nhiệp thời điểm t Trong hình trên, ta kỳ vọng giá trị β1 phải dương β2 phải âm Đường cong hình gọi đường cong Phillips cải tiến - Ngoài ra, ta khảo sát quan hệ thất nghiệp lạm phát qua Có thể tham khảo thêm: Oliver Blanchard, Macroeconomics, Prentice Hall, Englewood Cliffs, NJ.1977 41 Khóa luận tốt nghiệp Đại học Trần Huyền Trang hàm hồi quy nghịch đảo sau: πt − πt−1 = β1 + β2 + ut U Nt Trong hình nghịch đảo, ngược lại, ta kỳ vọng β2 > β1 < • Theo mẫu số liệu trên, ta hồi quy tuyến tính dạng πt − πt−1 = β1 + β2 U Nt + ut (mô hình 1) - Nhập số liệu đầu vào R: > L T data L1 = tail(L, −1) > L2 = head(L, −1) : Lạm phát khảo sát từ năm 1960-1997 > LL = L1 − L2 : LAMPHAT-LAMPHAT(-1) >T1 = tail(T, −1) : Thất nghiệp khảo sát từ năm 1961 - 1998 : Lạm phát khảo sát từ năm 1961 - 1998 Lệnh R: 42 Khóa luận tốt nghiệp Đại học Trần Huyền Trang > reg summary(reg) ⇒ Kết sau: > plot(LL, T1) Ta được, biểu đồ phân tán Lamphat - Lamphat(-1) theo Thatnghiep 43 Khóa luận tốt nghiệp Đại học Trần Huyền Trang • Xét hình hồi quy dạng nghịch đảo πt − πt−1 = β1 + β2 U1Nt + ut (mô hình 2) Lệnh R > a= 1/T1 > reg summary(reg) Kết sau: • Nhận xét chung hai hình + Các tham số hồi quy hai hình có ý nghĩa thống kê + Hệ số xác định có giá trị thấp (Mô hình(1): R2 = 0, 3037; hình (2): R2 = 0, 2067) Tuy nhiên, liên quan thất nghiệp lạm phát có nhiều yếu tố vĩ khác lượng cung tiền, sách ngoại thương, + Ý nghĩa kinh tế hệ số gốc hình (1): β2 = −0, 6791 = 44 Khóa luận tốt nghiệp Đại học Trần Huyền Trang −0, 68 Với mẫu số liệu trên, bình quân, tỷ lệ thất nghiệp năm t giảm 1% chênh lệch tỷ lệ lạm phát hai năm liên tiếp t (t-1) tăng vào khoảng 0,68% Nghĩa là, tỷ lệ lạm phát năm t tăng 0,68% so với năm (t-1) + Ý nghĩa tung độ góc hình (2): β1 = −3, 251: tỷ lệ thất nghiệp có tăng đến vô cùng, tỷ lệ lạm phát hai năm liên tiếp giảm khoảng 3,25% (Khi X → ∞, 1/X → 0, Y ∼ 3,25%) Lưu ý: Những nhận xét xem thông tin giúp nhà quản lý kinh tế tầm vĩ đề xuất giải pháp nhằm điều tiết tỷ lệ lạm phát tỷ lệ thất nghiệp 3.6 So sánh R2 hình Khi có nhiều hàm hồi quy khác nhau, ta vào R2 để chọn lựa hàm thích hợp hơn, R2 tiêu chuẩn thể mức độ phù hợp hình hồi quy Để so sánh R2 hình hồi quy khác nhau, cần thỏa điều kiện: - Cùng kích cỡ mẫu n - Cùng số biến độc lập Nếu hàm hồi quy không số biến độc lập, ta sử dụng hệ số xác định hiệu chỉnh - Biến phụ thuộc hàm hồi quy có dạng, biến độc lập dạng khác 45 Khóa luận tốt nghiệp Đại học Trần Huyền Trang - Nếu biến phụ thuộc khác dạng, phải đưa dạng Ví dụ: Cần so sánh R2 hai hình: Y = β1 + β2 X + U (3.8) lnY = β1∗ + β2∗ lnX + V (3.9) Ta vận dụng công thức chứng minh sau để quy đổi R2 hình dạng tương đương: R2 = (ryy )2 = yi yi )2 yi2 yi2 ( Có ba cách quy đổi: (1) Cách 1: Quy đổi logarit • Bước 1: Hồi quy hình (3.8), tính Y , lnY , lnY • Bước 2: Hồi quy hình (3.9), tính R(3.9) n [ • Bước 3: Tính RlnY.lnY (ln Yi )(ln Yi )]2 i=1 = n [ n (ln Yi )2 i=1 (ln Yi )2 so sánh với R(3.8) i=1 Trong đó: ln yi = ln Yi − ln Yi ln yi = ln Yi − ln Yi (2) Cách 2: Quy đổi Antilog • Bước 1: Thực hồi quy hình (3.8), tính R(3.8) • Bước 2: Hồi quy hình (3.9), tính lnY ; Y = elnY • Bước 3: Tính RY2 Y so sánh với R(3.8) (3) Cách 3: Tương tự cách (2), khác công thức tính Y 46 Khóa luận tốt nghiệp Đại học Trần Huyền Trang điều chỉnh để thu ước lượng vững E(Y /Xi ) δ2 Y = elnY + Lưu ý: Việc so sánh tương đối quy đổi logarit antilog ta ước lượng chệch 3.7 Bảng tổng kết dạng hình hồi quy hai biến Dạng hàm Y = β1 + β2 X Biên tế β2 Dẫn xuất từ biên tế ∆Y = β2 ∆X Hệ số Ý nghĩa co giãn hệ số góc β2 (X/Y ) Tuyến tính lnY = β1 + β2 lnX Y thay đổi β2 đơn vị β2 (Y /X) 100∆Y /Y = β2 (100.∆X/X) β2 Log kép lnY = β1 + β2 X β2 Y 100.∆Y /Y = 100.β2 ∆X β2 X X thay đổi 1đơn vị Y thay đổi 100 β2 % β2 (1/X) ∆Y = (β2 /100).(100.∆X/X) β2 (1/Y ) Lin - Log Y = β1 + β2 X1 X thay đổi 1% Y thay đổi β2 % Log - Lin Y = β1 + β2 lnX X thay đổi đơn vị, X thay đổi 1% Y thay đổi (β2 /100) đơn vị −β2 (1/X ) ∆Y /Y = −β2 (1/XY )(∆X/X) Nghịch đảo 47 −β2 (1/XY ) Kết luận chung Trong trình tìm hiểu nghiên cứu khóa luận, em bước đầu làm quen với cách thức làm việc khoa học, hiệu Qua em hệ thống lý thuyết Các hình hồi quy hai biến: Thực hành ngôn ngữ R Khóa luận trình bày hình hồi quy hai biến việc sử dụng phần mềm R việc phân tích hình Như nói đề tài hoàn thành nhiệm vụ nghiên cứu đặt Ngoài ra, khóa luận giới thiệu cách tổng quát phần mềm R, nên đề tài xem tài liệu tham khảo cho nhà kinh tế học người quan tâm đến ứng dụng phần mềm R nói chung phân tích hồi quy nói riêng, đồng thời thấy phong phú lý thú toán học Đó mục đích đề tài Do điều kiện thời gian ngắn sinh viên bước đầu làm quen với phương pháp nghiên cứu khoa học nên đề tài không tránh khỏi sai sót định.Vì em mong nhận đóng góp thầy cô bạn đọc để đề tài hoàn thiện Em xin chân thành cảm ơn! 48 Tài liệu tham khảo [1] Đào Hữu Hồ, Xác suất thống kê , nhà xuất Đại học Quốc Gia Hà Nội [2] Huỳnh Đạt Hùng, Kinh tế lượng, NXB Phương Đông (2013) [3] Nguyễn Văn Tuấn, Phân tích liệu với R, NXB Tổng hợp TP Hồ Chí Minh (2010) [4] Damodar N Gujarati, Basic Econometrics, Fourth edition 49 ... Chương Các mô hình hồi quy hai biến Chúng ta xem xét mô hình hồi quy hai biến thực hành chúng ngôn ngữ R 3.1 Mô hình hồi quy qua gốc tọa độ (Regression Through - Origin model) Dạng tổng quát hàm hồi. .. thời gian đóng vai trò biến độc lập, kết biến phụ thuộc 1.2 1.2.1 Mô hình hồi quy hai biến tuyến tính Dạng mô hình Mô hình hồi quy hai biến mô hình đơn giản nhất, gọi mô hình hồi quy đơn, có dạng:... cứu mô hình hồi quy hai biến thực hồi quy tuyến tính việc sử dụng ngôn ngữ R Nhiệm vụ nghiên cứu Tìm hiểu mô hình hồi quy hai biến thực hành chúng phần mềm R Đối tượng phạm vi nghiên cứu Trong

Ngày đăng: 04/04/2017, 16:05

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan