Bài giảng Thống kê ứng dụng trong kinh doanh Chương 11: Hồi quy và tương quan đơn biến cung cấp cho người học các kiến thức: Làm quen với hồi quy, mô hình hồi quy tuyến tính đơn, tương quan tuyến tính, tương quan giữa các biến định tính. Mời các bạn cùng tham khảo.
Trang 1Chương 11 HỒI QUY VÀ TƯƠNG QUAN ĐƠN BIẾN
Ths Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội
Email: dung.nguyentien3@hust.edu.vn
Trang 2MỤC TIÊU CỦA CHƯƠNG
● Nói được phạm vi ứng dụng của phương pháp
phân tích hồi quy và tương quan đơn biến
● Biết cách thực hiện một phân tích hồi quy dựa trên
dữ liệu mẫu
● Nói được những điều kiện và giả định cần thiết khi phân tích hồi quy
● Biết được cách tính và ý nghĩa của hệ số tương
quan Pearson và hệ số tương quan hạng
Spearman
Trang 3CÁC NỘI DUNG CHÍNH
11.1 Làm quen với hồi quy
11.2 Mô hình hồi quy tuyến tính đơn
11.3 Tương quan tuyến tính
11.4 Tương quan giữa các biến định tính
© Nguyễn Tiến Dũng Thống kê ứng dụng 3
Trang 411.1 LÀM QUEN VỚI HỒI QUY
● 11.1.1 Khái niệm hồi quy
● Regression, Regression to mediority: quy các điểm DL đã biết về một đường lý thuyết
● Đ/nghĩa của TK:
● NC mối liên hệ phụ thuộc giữa một biến phụ thuộc (biến đầu ra) và một hay
nhiều biến độc lập (biến đầu vào),
● nhằm ước tính hoặc dự báo giá trị trung bình tổng thể của biến phụ thuộc dựa trên các giá trị biết trước của biến độc lập
● Hồi quy đơn biến (simple regression): 1 biến PT và 1 biến ĐL, DL định lượng
Trang 511.1.2 Phân biệt liên hệ TK và liên hệ hàm số khi phân tích hồi quy
Trang 611.1.3 Quy ước về ký hiệu và tên gọi
● Biến số: Y = b0 + b1.X1 + b2X2
● Biến độc lập, biến đầu vào, biến giải thích: X1, X2
● Biến phụ thuộc, biến đầu ra, biến được giải thích: Y
● X ki : giá trị của quan sát thứ i của biến X k
● b0, b1, b2: các hệ số của phương trình hồi quy
● Hồi quy đơn biến và hồi quy đa biến (HQ bội)
● HQ đơn biến (simple regression): 1 biến ĐL
Trang 711.1.4 Các dạng liên hệ giữa biến độc lập và biến phụ thuộc
© Nguyễn Tiến Dũng Thống kê ứng dụng 7
Trang 811.2 MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐƠN
● 11.2.1 Mở đầu
● NC mối liên hệ giữa thu nhập
(X) và chi tiêu (Y)
● Lấy mẫu n hộ gia đình
● Đường hồi quy lý thuyết
Trang 911.2.2 Các giả định liên quan đến yếu tố nhiễu
● Các ei tại mỗi xi có phân
Trang 1011.2.3 Ý nghĩa và cách xác định các hệ số hồi quy
● b1: hệ số độ dốc, đo lường lượng thay đổi TB trong biến phụ thuộc Y khi X thay đổi 1 đơn vị
● b0: hệ số tung độ gốc cho biết giá trị của Y khi
X = 0, có thể coi là ảnh hưởng TB của các
yếu tố khác mà không có mặt trong mô hình
Trang 11Dữ liệu mẫu Bảng 11.1 Trang 311
Stt Số năm (X) Doanh số (Y)
Trang 13© Nguyễn Tiến Dũng 13
Tử số của b1Mẫu số của b1
Thống kê ứng dụng
Trang 1411.2.4 Tính toán các kết quả hồi quy bằng Excel
● Vẽ đồ thị Scatter Chart + Add Trendline
Trang 15Sử dụng Data Analysis: Regression
© Nguyễn Tiến Dũng Thống kê ứng dụng 15
Trang 1611.2.5 Vấn đề cần chú ý khi dự đoán với mô hình hồi quy
● Chỉ nên dự đoán 𝑌𝑖 với những giá trị Xi nằm giữa
Xmin và Xmax, hoặc không quá xa Xmin và Xmax
● Lý do: với những giá trị Xi nằm càng xa Xtb, thì sai
số khi ước lượng Yi càng lớn.
● 𝑥 = 4,583 chỉ nên dự báo y quanh giá trị TB này.
● TD: Nếu một NVBH có 5 năm kinh nghiệm, thì
doanh số người này có thể đạt là:
Trang 1711.2.6 Hệ số xác định của PTHQ
● Hệ số xác định (Coefficient of Determination)
2 1
2 1
2 1
n
i i
n
i i i
Trang 1811.2.7 Sai số chuẩn của hồi quy
● Sai số chuẩn của hồi quy sY/X: Thể hiện độ
lệch của các giá trị ŷi xung quanh yi
2
1 / X
Y
Y
SSE s
Trang 19© Nguyễn Tiến Dũng Thống kê ứng dụng 19
Trang 2111.2.8.2 Khoảng tin cậy cho hệ số độ dốc
© Nguyễn Tiến Dũng Thống kê ứng dụng 21
Trang 220 Bác bỏ H nếu
n
n
H H
Trang 23s s
Trang 2411.2.9 Phân tích phần dư (residuals/ errors)
● Mục đích: Kiểm tra tính đúng đắn của các giả định (assumptions) của phương trình hồi quy
tuyến tính trung bình của các phần dư ei
= 0
2. Các phần dư ei có PP normal
4. Các phần dư là độc lập với nhau (không có
hiện tượng tự tương quan giữa các phần
dư)
Trang 2511.2.10 Sử dụng PT hồi quy để dự đoán giá trị TB và giá trị cá biệt của Y
2; / 2 |
2 1
ˆ (y | )
2; / 2 |
2 1
ˆ ˆ
1 1
y
i i
Trang 2611.3 TƯƠNG QUAN TUYẾN TÍNH
● 11.3.1 Hệ số tương quan tổng thể rho
● 11.3.2 Hệ số tương quan mẫu r XY
cov( , ) var( ) var( )
.
XY
XY XY
Trang 27Giá trị và ý nghĩa của hệ số tương quan Pearson
Trang 28KĐ ý nghĩa của hệ số tương quan tuyến tính
2 1
Trang 2911.4 TƯƠNG QUAN GIỮA CÁC BIẾN ĐỊNH TÍNH
11.4.1 Hệ số tương quan hạng Spearman
Trang 30KĐ theo hệ số tương quan hạng Spearman r S
● Biến x1 và x2 có dữ liệu thứ bậc (hoặc DL khoảng, nhưng đã biến
thành DL thứ bậc bằng cách xếp hạng trong từng mẫu), mẫu n cặp quan sát
● Tính chênh lệch hạng di = x1i – x2i (i = 1, 2, … n)
● Tính hệ số tương quan hạng rS
● H0: Không có liên hệ giữa 2 biến (Hệ số tương quan hạng của tổng thể = 0)
● Nếu số trường hợp có di = 0 nhiều, thì cần thêm một hệ số hiệu chỉnh
● Nếu n > 10, PP của hệ số TQ hạng trên mẫu xấp xỉ PP bình thường với độ lệch chuẩn là 1/ (n – 1) Chỉ tiêu KĐ sẽ là z
6 1
n
i i
d