Bài giảng Thống kê ứng dụng trong kinh doanh: Chương 8 - Hồi quy và tương quan được biên soạn với các nội dung sau: Làm quen với hồi quy; Mô hình hồi quy tuyến tính đơn biến; Tương quan tuyến tính; Tương quan giữa các biến định tính; Hồi quy tuyến tính đa biến; Hồi quy với biến định tính; Hồi quy phi tuyến; Thực hành phân tích dữ liệu bằng hồi quy tuyến tính với Excel/SPSS. Mời các bạn cũng tham khảo bài giảng tại đây!
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN KINH TẾ VÀ QUẢN LÝ EM3230 THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH CHƯƠNG HỒI QUY VÀ TƯƠNG QUAN Nội dung 8.1 Làm quen với hồi quy (bài giảng video) 8.2 Mơ hình hồi quy tuyến tính đơn biến (bài giảng video) 8.3 Tương quan tuyến tính 8.4 Tương quan biến định tính 8.5 Hồi quy tuyến tính đa biến (bài giảng video) 8.6 Hồi quy với biến định tính (bài giảng video) 8.7 Hồi quy phi tuyến 8.8 Thực hành phân tích liệu hồi quy tuyến tính với Excel/SPSS EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS Mục tiêu chương Sau học xong chương này, người học sẽ: § Nói phạm vi ứng dụng phương pháp phân tích hồi quy tương quan § Biết cách thực phân tích hồi quy dựa liệu mẫu § Nói điều kiện giả định cần thiết phân tích hồi quy § Biết cách tính ý nghĩa hệ số tương quan Pearson hệ số tương quan hạng Spearman § Hiểu áp dụng phần mềm Excel/ SPSS cho hồi qui tuyến tính EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 8.1 Làm quen với hồi quy EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 8.1 Làm quen với hồi quy § Các vật tượng tồn mối liên hệ tác động qua lại lẫn § Có mối liên hệ chặt chẽ, ảnh hưởng định lẫn § Có mối liên hệ mang tính ngẫu nhiên, khơng chặt chẽ § Nhu cầu quản lý cần thiết phải lượng hóa mối quan hệ tượng với § Tương quan giúp đưa số lượng hóa mối liên hệ § Hồi quy giúp đưa mơ hình, hàm số mối liên hệ EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 8.1 Làm quen với hồi quy 8.1.1 Khái niệm hồi quy § Regression, Regression to mediority: quy điểm DL quan sát đường lý thuyết biết phương trình để dễ dàng tính tốn/ dự báo (nội suy hay ngoại suy) § Phân tích hồi quy nghiên cứu thống kê mối liên hệ nhiều biến đầu vào (biến độc lập) biến đầu (biến phụ thuộc) dạng phương trình nhằm ước lượng/ dự đốn giá trị trung bình biến phụ thuộc § Ví dụ: § Marketing: Doanh số = f(Sản phẩm, Giá bán, Kênh phân phối, Xúc tiến) § Chất lượng SP = f(NVL, thiết bị, người, quy trình, mơi trường) § Động lực làm việc = f(Thù lao, đặc điểm công việc, môi trường làm việc) EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 8.1 Làm quen với hồi quy 8.1.2 Phân biệt liên hệ thống kê liên hệ hàm số § Liên hệ hàm số: liên hệ chặt chẽ, thay đổi tượng hoàn toàn định thay đổi tượng có liên quan theo tỷ lệ chặt chẽ § § Y= f(x) : X có 1!Y Ví dụ mối liên hệ định mức NVL cho sản phẩm với tổng chi phí nguyên vật liệu cho kỳ phân tích § Liên hệ tương quan/ liên hệ thống kê (đối tượng nghiên cứu phân tích hồi quy): liên hệ khơng hồn tồn chặt chẽ, thay đổi nhân tố không gây thay đổi tương ứng nhân tố X có nhiều Y EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 8.1 Làm quen với hồi quy 8.1.3 Một số quy ước ký hiệu tên gọi ü Hồi quy đơn biến (1 biến độc lập) hồi quy đa biến/ hồi quy bội (nhiều biến độc lập) Y=b0+b1.X1+b2.X2+…+ bk.Xk+e ü Y thường ký hiệu cho biến phụ thuộc/ biến giải thích ü X1, X2, Xk biến độc lập ü Ký tự t i biểu thị lần quan sát thứ t giá trị thứ i biến ü Xki: giá trị quan sát thứ i biến Xk ü b0, b1,b2, …, bk hệ số phương trình hồi quy ü e: sai số/ phần dư EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 8.1 Làm quen với hồi quy 8.1.4 Các dạng liên hệ hai biến X Y Đồ thị rải điểm – scatter plot cách tốt để bắt đầu quan sát mối liên hệ Phát hướng (direction), dạng (form), độ chặt (strength), đặc điểm bất thường (unusual features) b: Perfect positive correlation EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 8.2 Mơ hình hồi quy tuyến tính đơn 8.2.1 Giới thiệu § Nghiên cứu mối quan hệ biến X biến Y § Đường lý thuyết E(Y|Xi)=b0+b1Xi § Mối liên hệ thực tế Yi=b0+b1Xi +ei § b0: hệ số chặn, hệ số tung độ gốc § b1: hệ số góc § ei: sai số, thành phần ngẫu nhiên, yếu tố nhiễu § E(Y|Xi): giá trị đường lý thuyết tạo giá trị trung bình/ kỳ vọng giá trị Yi X= Xi § ei=Yi - E(Y|Xi) EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 12 8.6.2 Hồi quy binary logistics § Kiểm định Chi-Square sử dụng vào mức ý nghĩa (Sig) bảng kiểm định Omnibus (trong SPSS) để định bác bỏ hay không bác bỏ giả thuyết H0 (các hệ số hồi quy 0: B1 = B2 =…= Bk = 0) EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 90 8.6.2 Hồi quy binary logistics § Kết EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 91 8.6.2 Hồi quy binary logistics § Dự báo khả trả nợ người có thời gian cư trú năm học vấn lớp 𝒛 = −𝟗 𝟎𝟎𝟑 + 𝟎 𝟒𝟓 ∗ 𝟗 + 𝟎 𝟐𝟕 ∗ 𝟐𝟒 =3.717 𝑷(𝒀 = 𝟏) = EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 𝒆𝒛 𝟏(𝒆𝒛 =0.821 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 92 8.7 Hồi quy phi tuyến § Tạo biến tiến hành hồi quy VD: Hàm bậc Yi = b + b1 X i + b X i2 + e i Từ Xi tính biến Xi2 coi biến biến độc lập X2= Xi2 hồi quy tuyến tính bình thường LnY = b + b1 LnX + b LnX + e i § Hàm logarit § Đặt LnYi= Y’, LnX1= X1’, LnX2=X2’ hồi quy tuyến tính theo biến Y ' = b + b1 X 1' + b X 2' + e i EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 93 Đánh giá/ Lựa chọn mơ hình hồi quy phù hợp § Menu Analyze> Regression> Curve Estimation EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 94 Đánh giá/ Lựa chọn mơ hình hồi quy phù hợp § Menu Analyze> Regression> Curve Estimation EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 95 Đánh giá/ Lựa chọn mơ hình hồi quy phù hợp § Linear Model whose equation is Y = b0 + (b1 * t) § Logarithmic Model whose equation is Y = b0 + (b1 * ln(t)) § Inverse Model whose equation is Y = b0 + (b1 / t) § Quadratic Model whose equation is Y = b0 + (b1 * t) + (b2 * t**2) § Cubic Model that is defined by the equation Y = b0 + (b1 * t) + (b2 * t**2) + (b3 * t**3) § Power Model whose equation is Y = b0 * (t**b1) or ln(Y) = ln(b0) + (b1 * ln(t)) § Compound Model whose equation is Y = b0 * (b1**t) or ln(Y) = ln(b0) + (ln(b1) * t) § S-curve Model whose equation is Y = e**(b0 + (b1/t)) or ln(Y) = b0 + (b1/t) § Logistic Model whose equation is Y = / (1/u + (b0 * (b1**t))) or ln(1/y-1/u) = ln (b0) + (ln(b1) * t) § Growth Model whose equation is Y = e**(b0 + (b1 * t)) or ln(Y) = b0 + (b1 * t) § Exponential Model whose equation is Y = b0 * (e**(b1 * t)) or ln(Y) = ln(b0) + (b1 * t) EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 96 Đánh giá/ Lựa chọn mơ hình hồi quy phù hợp EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 97 8.8 Phân tích liệu hồi quy tuyến tính với Excel/SPSS Cửa hàng 8.8.1 Phân tích hồi quy tuyến tính với Excel: Y=b0 + b1*X Số lượng sinh viên Doanh thu Phân tích mối quan hệ “số lượng sinh viên” “doanh thu” 58 hệ thống cửa hàng hang Armad Pizza Dữ liệu bao gồm: khu vực 105 mở cửa hàng (mã từ – 10); số lượng sinh viên khu vực mở cửa 88 hàng (X); doanh thu (Y) thu cửa hàng khu vực 118 A Nhập liệu: 12 117 Lập cột liệu tương ứng với ba trường: “Mã cửa hàng”, “số lượng sinh viên” “doanh thu” ô A1, B1 C1 16 137 20 157 Nhập liệu theo trường, tương ứng với ô A2:A11; 20 169 B2:B11 C2:C11 22 149 10 26 202 - EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 98 8.8 Phân tích liệu hồi quy tuyến tính với Excel/SPSS 8.8.1 Phân tích hồi quy tuyến tính với Excel B Ứng dụng excel để tạo kết hồi quy Bước Bấm vào mục Data Bước Trong lựa chọn Analysis, bấm Data Analysis Bước Chọn Regression từ lựa chọn Analysis Tool Bước Bấm OK Bước Hội thoại Regression xuất hiện: EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 99 8.8 Phân tích liệu hồi quy tuyến tính với Excel/SPSS 8.8.1 Phân tích hồi quy tuyến tính với Excel C Đọc kết - Regression statistics: Kết tóm tắt với hệ số xác định Adjusted R square - ANOVA: Kết phân tích ANOVA: tóm tắt tính tốn phân tích phương sai: ba nguồn biến thiên hồi quy, phần dư tổng cộng Giá trị p-value kiểm định F ý nghĩa mối liên hệ hồi quy - Kết phương trình hồi quy ước lượng với tung độ gốc đường hồi quy b0 độ dốc đường hồi quy b1; ; khoảng tin cậy tung độ độ dốc; giá trị p-value kiểm định t EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 100 8.8 Phân tích liệu hồi quy tuyến tính với Excel/SPSS 8.8.2 Phân tích hồi quy tuyến tính với SPSS: Y=b0 + b1*X Phân tích mối quan hệ “số lượng sinh viên” “doanh thu” hệ thống cửa hàng hang Armad Pizza Dữ liệu bao gồm: khu vực mở cửa hàng (mã từ – 10); số lượng sinh viên khu vực mở cửa hàng (X); doanh thu (Y) thu cửa hàng khu vực A Nhập liệu: (sử dụng liệu mục 8.8.1) - Định nghĩa biến sử dụng hồi qui: mở sheet tên Variable View: đặt tên biến đặc điểm biến - Nhập liệu: mở sheet tên Data View Nhập liệu theo tên biến đặt, 10 quan sát tương ứng với 10 dòng liệu EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 101 8.8 Phân tích liệu hồi quy tuyến tính với Excel/SPSS 8.8.2 Phân tích hồi quy tuyến tính với SPSS B Ứng dụng SPSS để tạo kết hồi quy Bước Bấm vào mục Analysis Bước Trong lựa chọn Analysis, bấm Regression Bước Chọn Linear từ lựa chọn Regression Bước Hội thoại Linear Regression xuất hiện: - Chuyển Dữ liệu DT (Doanh thu – Y) vào ô Dependent; Dữ liệu SLSV (số lượng sinh viên – X) vào ô Independent - Method: chọn Enter - Bấm OK EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 102 8.8 Phân tích liệu hồi quy tuyến tính với Excel/SPSS 8.8.2 Phân tích hồi quy tuyến tính với SPSS C Đọc kết - Regression statistics - ANOVA - Kết phương trình hồi quy ước lượng EM3230 Thống kê ứng dụng 8.1 Làm quen HQ 8.2 HQ tuyến tính 8.3 Tương quan đơn biến tuyến tính 8.4 TQ biến định tính 8.5 HQ tuyến tính đa biến 8.6 HQ biến đầu vào định tính 8.7 Hồi quy phi tuyến 8.8 Thực hành Excel/SPSS 103 TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN KINH TẾ VÀ QUẢN LÝ CHÚC CÁC BẠN HỌC TỐT ... đa biến (bài giảng video) 8. 6 Hồi quy với biến định tính (bài giảng video) 8. 7 Hồi quy phi tuyến 8. 8 Thực hành phân tích liệu hồi quy tuyến tính với Excel/SPSS EM3230 Thống kê ứng dụng 8. 1 Làm... đa biến (bài giảng video) 8. 6 Hồi quy với biến định tính (bài giảng video) 8. 7 Hồi quy phi tuyến 8. 8 Thực hành phân tích liệu hồi quy tuyến tính với Excel/SPSS EM3230 Thống kê ứng dụng 8. 1 Làm... EM3230 Thống kê ứng dụng 8. 1 Làm quen HQ 8. 2 HQ tuyến tính 8. 3 Tương quan đơn biến tuyến tính 8. 4 TQ biến định tính 8. 5 HQ tuyến tính đa biến 8. 6 HQ biến đầu vào định tính 8. 7 Hồi quy phi tuyến 8. 8