Bài giảng Các phương pháp nghiên cứu định lượng trong kinh tế gồm hai phần chính: Kinh tế lượng và Phân tích nhân tố. Phần kinh tế lượng tổng hợp các khái niệm cơ bản về thống kê và kinh tế lượng như thống kê mô tả, cơ sở xác suất đối với suy luận thống kê, chọn mẫu, ước lượng, kiểm định giả thuyết và thiết kế bảng hỏi. Học phần cũng cung cấp cho sinh viên những kỹ năng cần thiết về phân tích hồi quy. Phần phân tích nhân tố chủ yếu tập trung vào phương pháp và quy trình phân tích EFA. Mời các bạn cùng tham khảo nội dung phần 1 sau đây.
TRƯỜNG ĐẠI HỌC THĂNG LONG Khoa Kinh tế - Quản lý Tập giảng CÁC PHƯƠNG PHÁP NGHIÊN CỨU ĐỊNH LƯỢNG TRONG KINH TẾ Số tín chỉ: 03 Ngành: Các ngành khối Kinh tế Người biên soạn: TS Chu Thị Thu Thuỷ Ths Nguyễn Thị Tuyết Ths Nguyễn Thị Thu Trang Ths Nguyễn Thị Hà Thu Hà Nội, 2019 MỤC LỤC Chương I 1.1 TỔNG QUAN VỀ XÁC SUẤT VÀ THỐNG KÊ CƠ SỞ XÁC SUẤT ĐỐI VỚI SUY LUẬN THỐNG KÊ 1.1.1 Tổng quan xác suất thống kê 1.1.2 Cơ sở xác suất suy luận thống kê 1.2 CÁC ƯỚC LƯỢNG 1.2.1 Ước lượng cho mẫu lớn 1.2.2 Ước lượng cho mẫu nhỏ số trung bình tổng thể µ 1.2.3 Ước lượng khác biệt số trung bình 1.2.4 Ước lượng tỷ lệ nhị thức 10 1.3 KIỂM ĐỊNH GIẢ THUYẾT 13 1.3.1 Khái niệm 13 1.3.2 Miền bác bỏ 13 1.3.3 Các bước làm toán kiểm định 14 1.3.4 Phần bổ sung 15 1.4 CÁC PHƯƠNG PHÁP CHỌN MẪU 18 1.4.1 Phương pháp tiêu chuẩn lựa chọn 18 1.4.2 Xác định cỡ (kích thước) mẫu 20 1.5 SƠ LƯỢC VỀ LÝ THUYẾT BẢNG HỎI 23 1.5.1 Cơ sở thiết lập bảng hỏi 23 1.5.2 Phân loại bảng hỏi 24 1.5.3 Cấu trúc bảng hỏi- loại câu hỏi 25 Chương II 2.1 PHÂN TÍCH HỒI QUY ĐƠN 29 CÁC BƯỚC THỰC HIỆN PHÂN TÍCH HỒI QUY 29 2.1.1 Khái niệm phân tích hồi quy 29 2.1.2 Các bước thực phân tích hồi quy 30 2.2 MƠ HÌNH HỒI QUY 31 2.2.1 Mơ hình hồi quy tổng thể 31 2.2.2 Mô hình hồi quy mẫu 36 2.3 PHƯƠNG PHÁP BÌNH PHƯƠNG BÉ NHẤT (OLS) 38 2.3.1 Phương pháp OLS 38 2.3.2 Các giả thiết OLS2 39 2.3.3 Tính chất ước lượng 41 2.4 KIỂM ĐỊNH GIẢ THUYẾT 41 2.4.1 Kiểm định giả thuyết hệ số hồi quy 41 2.4.2 Kiểm định tính phù hợp mơ hình 43 Chương III 3.1 PHÂN TÍCH HỒI QUY ĐA BIẾN (HỒI QUY BỘI) 49 MƠ HÌNH HỒI QUY 49 3.1.1 Dạng giả thiết mơ hình 52 3.1.2 Ước lượng mô hình 59 3.1.3 Kiểm định giả thuyết hệ số mô hình 71 3.1.4 Dự báo 80 3.2 DẠNG HÀM VÀ GIẢI THÍCH Ý NGHĨA HỆ SỐ HỒI QUY 82 3.2.1 Biến giả 82 3.2.2 Hàm theo logarit Y và/hoặc X 86 3.2.3 Dạng đa thức 90 3.2.4 Hàm nghịch đảo (reciprocal function): 91 3.2.5 Dạng hàm với biến trễ 92 3.2.6 Các tiêu chí lựa chọn mơ hình 93 3.3 TỰ TƯƠNG QUAN, PHƯƠNG SAI SAI SỐ THAY ĐỔI 95 3.3.1 Hiện tượng phương sai sai số thay đổi 95 3.3.2 Phát phương sai sai số thay đổi xử lý 96 3.3.3 Hiện tượng tự tương quan 102 3.3.4 Phát tự tương quan xử lý 105 Chương IV 4.1 PHÂN TÍCH NHÂN TỐ 113 CỠ MẪU KHI ÁP DỤNG PHÂN TÍCH NHÂN TỐ EFA 113 4.1.1 Khái niệm phân tích nhân tố khám phá EFA 113 4.1.2 Ứng dụng phân tích nhân tố 114 4.1.3 Cỡ mẫu áp dụng phân tích nhân tố EFA 115 4.2 PHÂN TÍCH NHÂN TỐ EFA 116 4.2.1 Kiểm định độ tin cậy liệu 118 4.2.2 Tiêu chuẩn chọn số nhân tố 119 4.2.3 Phương pháp chiếu/xoay nhân tố 121 4.2.4 Giá trị nhân tố 124 4.2.5 Phân tích hồi quy với biến nhân tố 124 4.2.6 Thực hành tập tình với Stata 124 DANH MỤC SƠ ĐỒ, ĐỒ THỊ, HÌNH VẼ, BẢNG BIỂU DANH MỤC BẢNG, BIỂU Bảng 1-1.Khoảng tin cậy cho ước lượng khoảng cho mẫu lớn Bảng 2-1.Thu nhập chi tiêu hộ gia đình 34 Bảng 2-2 Kiểm định giả thuyết thống kê 42 Bảng 3-1.Biến nhị phân 82 Bảng 4-1 Hệ số tải cỡ mẫu 120 DANH MỤC ĐỒ THỊ Đồ thị 1-1 Ước lượng điểm Đồ Thị 1-2 Ước lượng khoảng Đồ thị 1-3 Kiểm định giả thuyết giá trị trung bình 16 DANH MỤC HÌNH VẼ Hình 1-1 Đồ thị quan hệ điểm thi tỷ lệ học sinh/giáo viên Hình 2-1.Các bước thực phân tích hồi quy 30 Hình 2-2 Ví dụ mẫu ngẫu nhiên 36 Hình 2-3 Mơ hình hồi quy mẫu phần dư 38 Hình 3-1 Biến phụ thuộc Y biến Xj không chứa tượng đa cộng tuyến 56 Hình 3-2 Các trường hợp đa cộng tuyến 56 Hình 3-3 Quan điểm Ballentine đa cộng tuyến 57 Hình 3-4 Phân tích độ thích hợp hồi quy 66 Hình 3-5 Chuyển dạng Log-log 89 Hình 3-6 Đồ thị phân tán phần dư ei theo 97 Hình 3-7 Đồ thị phân tán phần dư ei theo Xi 98 Hình 3-8 Các dạng tự tương quan 103 Hình 4-1 Các bước thực phân tích nhân tố 116 Hình 4-2.Biểu diễn phép xoay nhân tố 122 DANH MỤC CÁC CHỮ VIẾT TẮT EFA Phân tích nhân tố SE Sai số tiêu chuẩn GIỚI THIỆU VỀ HỌC PHẦN Mơ tả học phần: Học phần gồm hai phần chính: Kinh tế lượng Phân tích nhân tố Phần kinh tế lượng tổng hợp khái niệm thống kê kinh tế lượng thống kê mô tả, sở xác suất suy luận thống kê, chọn mẫu, ước lượng, kiểm định giả thuyết thiết kế bảng hỏi Học phần cung cấp cho sinh viên kỹ cần thiết phân tích hồi quy Phần phân tích nhân tố chủ yếu tập trung vào phương pháp quy trình phân tích EFA Mục tiêu học phần: Nắm vững kiến thức thống kê Nắm vững kiến thức kinh tế lượng Hiểu nghiên cứu định lượng thực nhà nghiên cứu khác Có thể tự thực nghiên cứu định lượng kinh tế Chuẩn đầu học phần - Về kỹ năng: Vận dụng phương pháp thu thập phân tích liệu cung cấp học phần cho tự nghiên cứu cần thiết Sử dụng phần mềm thống kê, kinh tế lương (Stata) thực phân tích số liệu phương pháp trang bị học phần Vận dụng kiến thức để hiểu, phân tích, đánh giá kết phân tích định lượng - Về kiến thức: Nắm vững kiến thức thống kê Hiểu rõ quy trình thực phân tích định lượng phương pháp hồi quy Hiểu rõ quy trình thực phân tích định lượng phân tích nhân tố EFA - Về thái độ: Ham thích tìm hiểu vấn đề tài doanh nghiệp vấn đề liên quan Sẵn sàng việc tiếp cận với vấn đề phát triển khả tự học thân Chuẩn bị Địa điểm: Phòng học có máy chiếu máy tính Người học: Chuẩn bị giáo trình, giảng ghi chép Chương I TỔNG QUAN VỀ XÁC SUẤT VÀ THỐNG KÊ Số giờ lý thuyết + tập Mục tiêu chương 1.1 1.1.1 CƠ SỞ XÁC SUẤT ĐỐI VỚI SUY LUẬN THỐNG KÊ Tổng quan xác suất thống kê Trước đề cập đến số khái niệm xác suất thống kê, băt đầu từ ví dụ phân tích thực nghiệm Đó mối quan hệ quy mô lớp học đầu đào tạo Câu hỏi là: việc cắt giảm bớt sinh viên hay giảm sinh viên lớp có tác động đến đầu đào tạo? Ta đo đầu đào tạo Phải là: Sự thỏa mãn bậc phụ huynh Sự phát triển thân sinh viên Phúc lợi / thu nhập thu trưởng thành Kết thi/kiểm tra học sinh Nếu lựa chọn kết thi học sinh làm đầu đào tạo sở số liệu thu thập được, ví dụ số liệu điều tra 420 trường phổ thơng California, phân tích mối quan hệ quy mô lớp học điểm thi học sinh Nhờ có phần mềm máy tính, việc phân tích số liệu trở nên dễ dàng thuận tiện Với số liệu thu thập được, minh họa đồ thị Hình 1.1 Hình I-1 Đồ thị quan hệ điểm thi tỷ lệ học sinh/giáo viên (Số liệu 420 trường chọn mẫu thuộc California) Nhìn vào đồ thị có nhận xét: phải lớp với quy mô nhỏ có kết thi cao hơn? Để chứng minh nhận định này, tiến hành bước sau: So sánh điểm thi trung bình quận có tỷ lệ học sinh/giáo viên (ký hiệu STR) thấp với quận có STR cao (“ước lượng”) Kiểm định giả thiết Ho: Điểm thi trung bình hai nhóm nhau, ngược lại giả thuyết đối: điểm trung bình hai nhóm khác (”kiểm định giả thiiết”) Ước lượng khoảng tin cậy hiệu điểm thi trung bình quận có STR cao STR thấp (“khoảng tin cậy”) Theo bước trên, kết phân tích liệu ban đầu cho thấy: Quy mô lớp Điểm trung bình Độ lệch chuẩn (sY) Số trường(n) (Y ) Nhỏ 657.4 19.4 238 Lớn 650.0 17.9 182 Trong đó, coi lớp có quy mơ lớp “nhỏ” STR 1.96 nên ta bác bỏ giả thiết H0 = mức ý nghĩa 5% Hay kết luận có khác điểm thi lớp có quy mơ nhỏ với lớp có quy mô lớn Một cách tương đương ước lượng khoảng tin cậy cho Khoảng tin cậy 95% hiệu giá trị trung bình () tính theo cơng thức: ( Ys – Yl ) 1,96SE( Ys – Yl ) = 7.4 1.961.83 = (3.8 ; 11.0) Rõ ràng khoảng không chứa giá trị Trên bước để thực kiểm chứng cho kết luận khác biệt điểm thi lớp có quy mơ nhỏ lớp có quy mơ lớn Tuy nhiên, đặt câu hỏi: Dựa sở để có tất điều này? Ước lượng: lại ước lượng Ys – Yl ? Kiểm định: thực chất sai số tiêu chuẩn Ys – Yl gì? Tại lại bác bỏ = |t| > 1,96? Khoảng tin cậy (ước lượng khoảng): khoảng tin cậy thực chất gì? 1.1.2 Cơ sở xác suất suy luận thống kê Chúng ta xem xét số khái niệm sau đây: Quần thể (Tổng thể) Đó nhóm tập hợp phần tử quan tâm Ví dụ tập hợp “tất được” trường học quận quần thể Chúng ta coi tổng thể số lớn vô hạn; nhiệm vụ đưa suy luận quần thể từ mẫu lấy từ quần thể Biến ngẫu nhiên Y Nếu = 0: X không ảnh hưởng đến Y, Y không phụ thuộc X hay X thay đổi Y khơng thay đổi Nếu ≠ 0: X có ảnh hưởng đến Y, Y có phụ thuộc X hay X thay đổi Y có thay đổi thay đổi tùy thuộc dấu hệ số > 0: X Y có quan hệ chiều, biến độc lập X tăng (giảm) đơn vị giá trị trung bình biến phụ thuộc Y tăng (giảm) đơn vị < 0: X Y có quan hệ ngược chiều, biến độc lập X tăng (giảm) đơn vị giá trị trung bình biến phụ thuộc Y giảm (tăng) | | đơn vị Ví dụ 1: Giải thích ý nghĩa kinh tế hệ số hồi quy hàm hồi quy sau: E(CT\TN) = 2,15 + 0,75TN Với CT: chi tiêu, TN: thu nhập hộ gia đình (đơn vị: triệu đồng/tháng) = 2,15: thu nhập hộ chi tiêu trung bình (mức tiêu dùng tự định trung bình) 2,15 triệu đồng/tháng = 0,75 > 0: thu nhập hộ tăng giảm triệu đồng/tháng chi tiêu trung bình hộ tăng giảm 0,75 triệu đồng/tháng (khuynh hướng tiêu dùng cận biên hộ 0,75 triệu đồng/tháng), khuynh hướng tiết kiệm cận biên – 0,75 = 0,25 triệu đồng/tháng Ví dụ 2: Xét tổng thể giả định gồm 30 hộ gia đình với mức chi tiêu thu nhập hàng tháng cho bảng đây: Bảng II-1.Thu nhập chi tiêu hộ gia đình Đơn vị: triệu đồng Thu nhập Chi tiêu 3,8 4,3 4,8 5,3 6,3 7,3 E(CT\TN) 1 4,3 2 3 4,8 5,3 34 1 5,8 6,3 Các giá trị bảng trình bày sau: ví dụ với cột thứ nhất, với lượng thu nhập triệu đồng/tháng/hộ có hộ có lượng chi tiêu 3,8 triệu đồng/tháng Có hộ gia đình có mức thu nhập triệu đồng/tháng chi tiêu 4,3 triệu, có hộ có mức thu nhập triệu đồng/tháng chi tiêu 4,8 triệu Tại mức thu nhập ta tính chi tiêu trung bình: ( | = 5) = ∗ 3,8 + ∗ 4,3 + ∗ 4,8 = 4,3 1+3+1 Để tính hai hệ số ta cẩn tối thiểu phương trình: E(CT\TN = 5)= + = 4,3 E(CT\TN = 6)= + = 4,8 = 1,8 ; = 0,5 Từ kết ta có hàm hồi quy tổng thể: E(CT | TN) =1,8 + 0,5TN Nếu tăng thu nhập thêm triệu đồng/tháng chi tiêu trung bình gia tăng 0.5 triệu đồng/tháng – số cho phép đánh giá tác động thu nhập lên chi tiêu hộ gia đình Khi lượng thu nhập chi tiêu trung bình (tiêu dùng tự định) 1,8 triệu đồng/tháng Khi thu nhập 10 triệu đồng/tháng chi tiêu trung bình 6,8 triệu đồng/tháng Đây tốn dự báo giá trị trung bình biến phụ thuộc: hộ gia đình dự báo thu nhập TNi cụ thể thỉ chi tiêu trung bình đạt => Ứng dụng phân tích hồi quy Phân tích hồi quy cho phép: Đánh giá tác động biến độc lập lên giá trị trung bình biến phụ thuộc Kiểm nghiệm lý thuyết kinh tế mối quan hệ phụ thuộc biến số Thực dự báo giá trị biến phụ thuộc biết giá trị biến độc lập Chú ý: phân tích hồi quy quan tâm chủ yếu đến mối quan hệ nhân mối quan hệ thống kê túy Ngoài ra, cần nhắc lại mối quan hệ nhân xác lập ngồi mơ hỉnh, dựa lý thuyết kinh tế suy diễn lôgic Chẳng hạn cầu lao động doanh nghiệp phụ thuộc vào mức lương, dư nợ tín dụng phụ thuộc vào lãi suất, suất lao động phụ thuộc vào số năm kinh nghiệm người lao động, Các mối quan hệ phụ thuộc xác lập sẵn trước xây dựng mơ hình hồi quy, mơ hình hồi quy dùng giúp định lượng mối quan hệ 35 2.2.2 Mô hình hồi quy mẫu Thơng thường khó để có số liệu cho tồn tổng thể, để ước lượng giá trị hệ số hàm hồi quy, người ta ước tính thông qua số liệu mẫu Điều dẫn đến khái niệm hàm hồi quy mẫu (iv)2.2.2.1 Mẫu ngẫu nhiên Mẫu ngẫu nhiên phận rút từ tổng thể chứa đựng vấn đề nghiên cứu cách ngẫu nhiên Số lượng phần tử mẫu thường xác định trước, tùy theo mục đích nghiên cứu điều kiện không gian, thời gian, nguồn lực Số lượng phần tử mẫu gọi kích thước mẫu, kí hiệu n Ví dụ: Nghiên cứu mối quan hệ thu nhập – chi tiêu hộ gia đình Việt Nam năm 2014 Tổng thể: tất hộ gia đình phạm vi nước Việt Nam năm 2014 Tuy nhiên số hộ lớn kinh phí điều tra lớn nên ta thực điều tra số hộ Như số liệu VHLSS 2014 thực với kết thông tin thu 9.399 hộ Hình II-2 Ví dụ mẫu ngẫu nhiên Mẫu Tổng thể Mẫu Trong hình tổng thể là tồn hộ gia đình năm 2014; Mẫu ngẫu nhiên là số hộ gia đình lựa chọn ngẫu nhiên để điều tra Có vơ số mẫu rút từ tổng thể với kích cỡ khác (v) 2.2.2.2 Mơ hình hồi quy mẫu Mơ hình hồi quy mẫu (SRM – Sample Regression Model): Là phương trình biểu diễn mối quan hệ biến phụ thuộc (Y) với biến độc lập (X) xác định mẫu ngẫu nhiên có dạng sau: = + Với quan sát cụ thể, ta viết: 36 + = + + Trong i = 1, 2,…, n với n kích thước mẫu Trong mơ hình hồi quy có thành phần: Biến số, Hệ số, Phần dư + Biến số: bao gồm biến phụ thuộc biến độc lập + Hệ số (còn gọi hệ số hồi quy mẫu, không gọi tham số): gắn liền với biến độc lập thể mối quan hệ biến phụ thuộc – biến độc lập Nhưng hệ số hồi quy hệ số hồi quy mẫu hay hệ số ước lượng (hay ước lượng hệ số) ước lượng hệ số hồi quy tổng thể Trong tổng thể, hệ số chữ Hy Lạp mẫu hệ số có thêm mũ, chẳng hạn tương ứng với hệ số tự tổng thể hệ số mẫu, tương ứng với hệ số góc tổng thể hệ số mẫu + Phần dư: Tương tự tổng thể, bên cạnh biến độc lập X yếu tố khác tác động đến biến phụ thuộc Y Yếu tố ngẫu nhiên mẫu gọi phần dư (residual) kí hiệu e Ví dụ: Một công ty xuất nhập lương thực muốn nghiên cứu lượng xuất gạo (Q) phụ thuộc vào giá bán (P) loại gạo Mơ hình hồi quy mẫu: = + + (vi)2.2.2.3 Hàm hồi quy mẫu Hàm hồi quy mẫu (SRF – Sample Regression Function) hàm số thể mối quan hệ trung bình biến phụ thuộc biến độc lập, xác định toàn mẫu Tương tự cách xây dựng hàm hồi quy tổng thể từ mơ hình hồi quy tổng thể ta xây dựng hàm hồi quy mẫu từ mơ hình hồi quy mẫu có dạng sau: = Trong + giá trị ước lượng cho giá trị Y Ý nghĩa hệ số hồi quy ước lượng: Với mẫu cụ thể cho sau: gọi ước lượng hệ số chặn, cho biết ước lượng giá trị trung bình biến phụ thuộc Y biến độc lập X nhận giá trị gọi ước lượng hệ số góc, thể quan hệ biến độc lập giá trị trung bình biến phụ thuộc mẫu: 37 = : mẫu X không ảnh hưởng đến Y, Y không phụ thuộc X hay Nếu X thay đổi Y khơng thay đổi ≠ : mẫu X có ảnh hưởng đến Y, Y có phụ thuộc X hay X thay Nếu đổi Y có thay đổi thay đổi cịn tùy thuộc dấu hệ số β2 > 0: mẫu X Y có quan hệ chiều, biến độc lập X tăng Nếu (giảm) đơn vị giá trị trung bình biến phụ thuộc Y tăng (giảm) đơn vị < : mẫu X Y có quan hệ ngược chiều, biến độc lập X tăng Nếu (giảm) đơn vị giá trị trung bình biến phụ thuộc Y giảm (tăng) | 2.3 | đơn vị PHƯƠNG PHÁP BÌNH PHƯƠNG BÉ NHẤT (OLS) 2.3.1 Phương pháp OLS Phương pháp OLS lần giới thiệu Gauss vào năm cuối kỷ 18 (Harper 1974–1976) sử dụng rộng rãi nhiều lĩnh vực Cho đến nay, người ta phát triển thêm phương pháp ước lượng mới, OLS phương pháp thông dụng nhiều người sử dụng ưu việt Xét mơ hình hồi quy tổng thể: = + +u Khi ta viết hàm hồi quy mẫu sau: = Ta cần ước lượng hệ số , Gọi sai lệch giữ giá trị thực tế mẫu + giá trị ước lượng tương ứng từ hàm hồi quy phần dư (residuals), ký hiệu ei: = − = − − Khi ta minh họa hàm hồi quy mẫu phần dư hình vẽ đây: Hình II-3 Mơ hình hồi quy mẫu phần dư 38 Ta cần phải tìm cho gần với giá trị thực sai lệch tổng hợp giá trị thực tế có thể, tức cho từ hàm hồi quy mẫu nhỏ Sai lệch định nghĩa bởi: Tổng phần dư ei Tổng giá trị tuyệt đối phần dư ∑ Tổng bình phương phần dư ∑ Vì ei âm, dương cần phải tìm | | cho tổng bình phương phần dư đạt cực tiểu, tức là: = − =∑ − − => Như phương pháp OLS thực chất toán cực trị với ẩn β1 , β2, cho ∑ − − => Điều kiện cần để hàm số đạt giá trị là: ⎧ ⎪ ⎨ ⎪ ⎩ ( , ) ( , ) =0 =0 Sau vài phép tốn biến đổi, ta tính được: = ∑ ∑ = Trong 2.3.2 = ∑ ; − −∑ − (∑ = ∑ Các giả thiết OLS2 39 ∑ ) =0 Khi sử dụng phương pháp OLS để ước lượng tham số cần giả thiết sau để đảm bảo hệ số ước lượng đáng tin cậy: Giả thiết 1: Mơ hình ước lượng sở mẫu ngẫu nhiên W kích thước n Giả thiết 2: Kỳ vọng sai số ngẫu nhiên với điều kiện X 0: E (u|X)=0 Khi giả thiết thỏa mãn ta có: E(u)=0 Cov(X ,u)=0 Giả thiết 3: Phương sai sai số ngẫu nhiên giá trị: Var(u|X)= Giả thiết 4: Khơng có tương quan Ui Cov(Ui,Uj)=0 với ∀ ≠ Giả thiết 5: Ui Xi không tương quan với nhau: Cov(Ui,Xi)=0 ) Giả thiết 6: Ui có phân bố N(0, Độ xác ước lượng Định lý 1.1.: Khi giả thiết thỏa mãn ước lượng khơng chệch , E( ) = , ước lượng nghĩa là: ; E( )= Định lý 1.2: Khi giả thiết – thỏa mãn phương sai hệ số ước lượng bằng: =∑ =∑ Ước lượng phương sai sai số ngẫu nhiên : Trong cơng thức có thành phần σ2 chưa biết ta cần ước lượng để ước lượng phương sai hệ số ước lượng theo công thức sau: = Thống kê ta + +⋯+ −2 gọi phương sai sai số hàm hồi quy Lấy bậc hai gọi sai số chuẩn hồi quy (Standard Error of Regression) Sai số chuẩn (standard error) hệ số ước lượng tính sau: 40 ∑ ∑ = = Với 2.3.3 ∑ = − Tính chất ước lượng , Với giả thiết trên, ước lượng xác định phương pháp bình phương nhỏ có tính chất ước lượng tuyến tính, khơng chệch tốt (có phương sai nhỏ nhất), cụ thể sau: Đây ước lượng tuyến tính Tuyến tính hiểu tuyến tính theo tham số tuyến tính theo Y Là ước lượng khơng chệch có phương sai nhỏ ước lượng tuyến tính khơng chệch (Có phương sai cực tiểu) Điều có nghĩa lấy mẫu khac nhau, trung bình chúng với giá trị cần tìm “Tốt nhất”- điều có nghĩa ước lượng nhận khác có phương sai nhỏ tất lớp ước lượng tuyến tính khơng chệch 2.4 KIỂM ĐỊNH GIẢ THUYẾT 2.4.1 Kiểm định giả thuyết hệ số hồi quy Giả thuyết thống kê giả sử hay phát biểu đúng, sai liên quan đến tham số tổng thể Khi thực kiểm định, người ta thiết lập cặp giả thiết thống kê, Giả thuyết không giả thuyết ngược lại (giả thuyết đối) + Giả thuyết không: giả sử mà muốn kiểm định thường ký hiệu H0 + Giả thuyết ngược lại: Việc bác bỏ giả thuyết không dẫn đến việc chấp nhận giả thuyết ngược lại Giả thuyết ngược lại thường ký hiệu H1 Ví dụ: H0: = 0.5 H1: ≠ 0.5 41 Miền bác bỏ miền chấp nhận: Tất giá trị có đại lượng thống kê kiểm định chia làm miền: miền bác bỏ miền chấp nhận + Miền bác bỏ miền chứa giá trị làm cho giả thuyết H0 bị bác bỏ + Miền chấp nhận miền chứa giá trị giúp cho giả thuyết H0 không bị bác bỏ Trong thực tế H0 khơng bị bác bỏ có nghĩa chấp nhận Giá trị chia đơi hai miền gọi giá trị giới hạn (Critical value) Giả thiết khơng giả thiết đối giả thiết đơn hay giả thiết kép Một giả thiết gọi đơn đưa giá trị cụ thể cho tham số (Ví dụ H0: = 0.5) Một giả thiết gọi kép đưa khoảng giá trị phân bố xác suất (ví dụ H0: > 0.5) Liên quan đến vấn đề người ta có kiểm định hai phía kiểm định phía Các bước kiểm định giả thuyết thống kê: Bước 1: Thành lập giả thuyết H0 Ví dụ: H0: = 0.5 Bước 2: Thành lập giả thuyết H1 Ví dụ: H1: ≠ 0.5 Bước 3: Xác định mức ý nghĩa Bước 4: Chọn tham số thống kê thích hợp cho việc kiểm định xác định miền bác bỏ, miền chấp nhận giá trị giới hạn Bước 5: Tính tốn biến ngẫu nhiên kiểm định biến Z (trong phân phối chuẩn), t (trong phân phối Student t) hay (Trong phân phối Chi bình phương) Bước 6: Ra định: Nếu giá trị tính tốn rơi vào miền bác bỏ H0 định bác bỏ Ho Ngược lại chấp nhận H0 = Kiểm định giả thiết βj, ví dụ = − ∗ Nếu giả thiết thì: ~ ( − 2) Ta có bảng sau đây: Bảng II-2 Kiểm định giả thuyết thống kê 42 Loại giả thiết Giả thiết H0 Giả thiết H1 Miền bác bỏ Hai phía = ∗ = ∗ t > t (n − 2) Phía phải ≤ ∗ > ∗ t > t (n − 2) Phía trái ≥ ∗ < ∗ t < −t (n − 2) Kiểm định : H0: =0 khơng tác động H1: ≠0 có tác động 0 tác động chiều 2.4.2 Kiểm định tính phù hợp mơ hình Nói chung có sai lệch giá trị mẫu biến phụ thuộc Yi ước lượng Nếu sai lệch nhỏ, ta nói hàm hồi quy mẫu phù hợp với số liệu mẫu, cịn sai lệch lớn hàm hồi quy mẫu phù hợp thấp với số liệu mẫu, minh họa hình Hình (a) Hình (b) Hình (a) cho thấy sai lệch giá trị mẫu giá trị ước lượng biến phụ thuộc nhỏ: điểm quan sát nằm gần với đường hồi quy mẫu, hàm hồi quy mẫu có độ phù hợp cao Trong đó, hình (b) cho thấy điều ngược lại: sai lệch lớn, điểm quan sát nằm cách xa với đường hồi quy mẫu, hàm hồi quy mẫu có độ phù hợp thấp Nếu hàm hồi quy mẫu phù hợp với số liệu mẫu ta kỳ vọng phản ánh tốt quan hệ biến số tổng thể Để đánh giá cách định lượng phù hợp hàm hồi quy mẫu đổi với số liệu mẫu, người ta đưa khái niệm hệ số xác định, ký hiệu R2 xác định sau: 43 Ta có: ∑ ( − ) =∑ = − + + − − +2 − Ta đặt: TSS =∑ ( − ) ESS = ∑ − RSS= ∑ Do ∑ − =0 (Vì ∑ = 0; ∑ = 0) Ta viết TSS= ESS+ RSS Ý nghĩa thành phần: TSS=Tổng bình phương tồn phần (Total Sum of Squares): tổng bình phương tất sai lệch giữa giá trị quan sát Yi giá trị trung bình, thể biến đổi biến Y quanh giá trị trung bình mẫu ESS = Tổng bình phương giải thích (Explained Sum of Squares): tổng bình phương tất sai lệch giá trị biến phụ thuộc Y nhân từ hàm hỗi quy mẫu giá trị trung bình của chúng Phần đo độ xác hàm hồi quy RSS = Tổng bình phương phần dư (Residual Sum of Squares): Độ dao động giá trị ước lượng, tổng bình phương tất sai lệch giá trị quan sát Y giá trị nhận từ hàm hồi quy Như biến đổi biến Y tổng hai thành phần: (1) biến đổi phần dư RSS – thể cho yếu tố không đưa vào mô hình (2) biến đổi thể mơ hình, ký hiệu ESS Chia vế cho TSS ta có: 1= + thể tỷ lệ phần trăm biến đổi biến Y mẫu giải thích mơ hình, cịn gọi hệ số xác định hàm hồi quy ký hiệu R2 = =1− Do RSS, TSS ESS khơng âm nên ta có: 0≤ 44 ≤1 Ý nghĩa R2: Giá trị R2 thể thay đổi biến phụ thuộc giải thích % biến độc lập mơ hình Trường hợp đặc biệt, hồn tồn khơng có sai lệch giá trị quan sát giá trị ước lượng, RSS = R2 = 1: biến X giải thích 100% thay đổi biến phụ thuộc Khi R2 = 0: biến X hoàn toàn khơng giải thích thay đổi biến Y, ta nói mơ hình khơng phù hợp, có nghĩa quan hệ biến X biến Y thể mơ hình hồi quy mẫu hồn tồn khơng phù hợp với số liệu mẫu Như vậy, cho mơ hình hồi quy tổng thể không phù hợp Nội dung tập: Thực hành ước lượng mơ hình dựa liệu GDP, vốn tỉnh Bước 1: Đưa giả thuyết Dựa vào lý thuyết, vốn yếu tố đầu vào sản xuất, vốn tăng giúp tăng sản lượng đầu ra, tức tăng GDP Vậy giả thuyết đưa là: Vốn (K) có tác động chiều tới GDP Bước 2: Thiết lập mơ hình: GDP= + + Bước 3: Thu thập liệu Ở đây, ta có liệu GDP vốn đầu tư 27 tỉnh thành Bước 4: Ước lượng tham số mơ hình Nhập liệu vào phần mềm: Vào Statistics => Linear models and related=> Linear regresstion 45 Sau chọn biến phụ thuộc biến độc lập=> OK Kết nhận sau: 46 Bước 5: Phân tích kết quả: Ước lượng hệ số chặn = 729659 > 0: có nghĩa vốn đầu tư trung bình GDP 729.659 Tuy nhiên cho vốn đầu tư thực tế khác nên hệ số khơng thực có ý nghĩa = 2190.22 > 0: có nghĩa vốn đầu tư tăng đơn vị trung bình GDP tăng 2190.22 đơn vị Kết phù hợp với lý thuyết giả thuyết đưa Cột Std Err chứa sai số chuẩn tương ứng với hệ số ước lượng: = 134.2461 = 280795.9 Các giá trị cho biết độ dao động hệ số ước lượng tương ứng Sai số chuẩn ; lớn ngụ ý lấy mẫu ngẫu nhiên khác giá trị ước lượng thu khác biệt lớn so với hệ số ; thu bảng Tuy nhiên lưu ý sai số chuẩn lớn hay nhỏ cần hiểu theo nghĩa tương đối, tức so sánh với thân giá trị ; Cột t-Statistic: gọi thống kê t, giá trị cột giá trị cột hệ số chia cho giá trị cột sai số chuẩn: = = 729659 = 16,31 280795,9 47 = = 2190,22 = 2,6 134,2464 Cột P>|t|: chứa giá trị xác suất tương ứng với số bên cột t (t-statistic), hiểu sau: P(|t P(|t Trong t | > 16,31) = 0.000 | > 2.6) = 0.015 biến ngẫu nhiên tuân theo quy luật phân phối Student với bậc tự (n-2), với n kích thước mẫu R-squared=0.9141, ngụ ý biến vốn đầu tư giả thích 91,41% thay đổi GDP Tổng bình phương phần dư RSS=3,8404x1013 ESS= 4,0889*1013 TSS=4,4729x1014 Khoảng tin cậy 95% hệ số (151349.1;1307969) Khoảng tin cậy 95% hệ số (1913.736; 2466.705) cho biết biến vốn đầu tư tăng đơn vị giá trị trung bình biến phụ thuộc thay đổi khoảng (1913.736; 2466.705) Tài liệu tham khảo Mamu Ramanathan (2002), Introductory Econometrics with applications, (5th edition), Harcourt College Publishers, Chương Ngô Văn Thứ (2015), Giáo trình thống kê thực hành, NXB Đại học Kinh tế quốc dân, Chương 48 ... KIỂM ĐỊNH GIẢ THUYẾT 13 1. 3 .1 Khái niệm 13 1. 3.2 Miền bác bỏ 13 1. 3.3 Các bước làm toán kiểm định 14 1. 3.4 Phần bổ sung 15 1. 4 CÁC PHƯƠNG PHÁP... phân p 2 bố chu? ??n sY Y 1. 4 CÁC PHƯƠNG PHÁP CHỌN MẪU 1. 4 .1 Phương pháp tiêu chu? ??n lựa chọn 1. 4 .1. 1 Sơ lược phương pháp mẫu Mẫu đối tượng nhận tin, nghiên cứu thống kê tồn nhiều phương pháp khác... Bảng 2-2 Kiểm định giả thuyết thống kê 42 Bảng 3 -1 . Biến nhị phân 82 Bảng 4 -1 Hệ số tải cỡ mẫu 12 0 DANH MỤC ĐỒ THỊ Đồ thị 1- 1 Ước lượng điểm Đồ Thị 1- 2 Ước