Xác định mô hình hồi quy phản ánh mối liên hệ Nhiệm vụ đầu tiên của phân tích hồi quy tương quan là xây dựng mô hình hay phương trình hồi quy và xác định tính chất thuận – nghịch cũng n
Trang 2Nội dung Mục tiêu
Nhiệm vụ của phân tích hồi quy và
tương quan
Một số mô hình hồi quy và cách xác
định các tham số của mô hình
Cung cấp phương pháp phân tích thống kê nghiên cứu mối liên hệ nhân quả giữa các hiện tượng kinh tế – xã hội
Thời lượng học Hướng dẫn học
7 tiết Đọc bài giảng và thảo luận
Trả lời câu hỏi ôn tập, câu hỏi trắc nghiệm
và làm bài tập
BÀI 4: PHÂN TÍCH HỒI QUY VÀ TƯƠNG QUAN
Trang 3Bài 4: Phân tích hồi quy và tương quan
TÌNH HUỐNG DẪN NHẬP
Tên tình huống: Phân tích thị trường xe máy
Giả sử bạn đang nghiên cứu về vấn đề mua bán xe máy
Honda Wave đã qua sử dụng Bạn nhận thấy giá bán của
chiếc xe do rất nhiều nhân tố quyết định Đó có thể là số
năm sử dụng xe, màu sắc, đối tượng mua, đối tượng bán,
thậm chí cả nhu cầu mua, nhu cầu bán cũng có ảnh hưởng
đến giá cả của nó Bạn thực hiện một điều tra thống kê trên
11 chiếc xe để tìm hiểu mối liên hệ giữa các nhân tố ảnh
hưởng và giá bán của nó Số liệu cho thấy, dường như đúng
là có mối liên hệ giữa các nhân tố nêu trên với giá của chiếc
xe Nhưng bạn lại không biết biểu diễn mối liên hệ đó như thế nào
Câu hỏi
Bài học này sẽ giúp bạn cách thức xây dựng mối liên hệ phụ thuộc qua lại giữa các hiện tượng kinh tế – xã hội, đồng thời cũng sẽ hướng dẫn bạn cách đánh giá mức độ chặt chẽ của mối liên
hệ đó như thế nào?
Trang 44.1 Nhiệm vụ của phân tích hồi quy và tương quan
4.1.1 Mối liên hệ giữa các hiện tượng kinh tế xã hội
Các hiện tượng kinh tế – xã hội tồn tại trong mối liên hệ phụ thuộc lẫn nhau Các mối liên hệ này có thể diễn ra theo thời gian hay không gian nhất định Các mối liên hệ diễn ra theo thời gian nghĩa là sự tác động qua lại và sự phụ thuộc vào nhau của các hiện tượng khi chúng ở các giai đoạn và quá trình của sự phát triển Các mối liên hệ diễn ra theo không gian nghĩa là sự tác động qua lại và sự phụ thuộc vào nhau của các hiện tượng khi chúng ở cùng một thời gian Thậm chí ngay trong cùng một hiện tượng nghiên cứu bao gồm nhiều tiêu thức khác nhau, thì những tiêu thức này cũng có mối liên hệ qua lại nhất định Tuỳ theo mức độ chặt chẽ, mà người ta chia mối liên hệ thành các loại dưới đây
4.1.1.1 Liên hệ hàm số
Khái niệm: Liên hệ hàm số là mối liên hệ hoàn
toàn chặt chẽ Sự thay đổi của hiện tượng này có tác dụng quyết định đến sự thay đổi của hiện tượng liên quan theo một tỷ lệ xác định
Liên hệ hàm số được viết dưới dạng: y = f(x), có nghĩa là cứ mỗi giá trị của x thì theo một hàm nào
đó có một giá trị của y tương ứng
Mối liên hệ này thường có trong tự nhiên Ví dụ trong vật lý: S = v t
Đặc điểm: Liên hệ hàm số không những được biểu hiện ở tổng thể mà còn được
biểu hiện trên từng đơn vị cá biệt
4.1.1.2 Liên hệ tương quan
Khái niệm: Liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ Sự thay
đổi của hiện tượng này có thể làm hiện tượng liên quan thay đổi theo nhưng không
có ảnh hưởng hoàn toàn quyết định
Mối liên hệ này rất phổ biến và thường gặp trong các hiện tượng kinh tế – xã hội
Đặc điểm: Liên hệ tương quan không được biểu hiện trên từng đơn vị cá biệt mà
phải thông qua hiện tượng số lớn (là tổng thể)
Ví dụ: Mối liên hệ giữa tuổi nghề và NSLĐ Tuổi nghề có tác động đến NSLĐ
nhưng NSLĐ không chỉ chịu ảnh hưởng của tuổi nghề mà còn chịu ảnh hưởng của các nhân tố khác Mặt khác, nếu nghiên cứu riêng lẻ từng đơn vị cá biệt, có những đơn vị, tuổi nghề hoàn toàn không ảnh hưởng tới NSLĐ Vì vậy, để có thể nêu lên được mối liên hệ tương quan cần phải nghiên cứu hiện tượng số lớn
4.1.2 Nhiệm vụ của phân tích hồi quy và tương quan
Phương pháp phân tích hồi quy và tương quan giải quyết hai nhiệm vụ chủ yếu sau:
4.1.2.1 Xác định mô hình hồi quy phản ánh mối liên hệ
Nhiệm vụ đầu tiên của phân tích hồi quy tương quan là xây dựng mô hình (hay phương trình) hồi quy và xác định tính chất (thuận – nghịch) cũng như hình thức của mối liên hệ (loại mô hình)
Trang 5Bài 4: Phân tích hồi quy và tương quan
Để giải quyết nhiệm vụ này, cần phải thực hiện 4 bước sau:
Bước 1: Giải thích sự tồn tại thực tế và bản chất của mối liên hệ bằng phân tích lý
luận Tuỳ theo mục đích nghiên cứu cụ thể mà xác định trong mối liên hệ đó, đâu
là nguyên nhân, đâu là kết quả
Ví dụ: Tuổi nghề có ảnh hưởng tới NSLĐ Như vậy, tuổi nghề là nguyên nhân có
ảnh hưởng đến NSLĐ
Nhưng nếu xét trong mối liên hệ với khối lượng sản phẩm sản xuất và giá thành đơn vị, ta thấy: NSLĐ tăng dẫn tới khối lượng sản phẩm sản xuất tăng Khi đó, NSLĐ lại là nguyên nhân, khối lượng sản phẩm là kết quả Khi khối lượng sản phẩm sản xuất tăng thì giá thành giảm Khối lượng sản phẩm sản xuất lại đóng vai trò là nguyên nhân, giá thành là kết quả
Ví dụ: Mối liên hệ giữa chi phí quảng cáo và
doanh thu Khi nghiên cứu các nhân tố tác động đến doanh thu thì chi phí quảng cáo là một nguyên nhân Nhưng khi nghiên cứu nhân tố tác động đến chi phí quảng cáo thì doanh thu cũng lại là một nguyên nhân Trong trường hợp này phải chú ý đến mục đích nghiên cứu là gì để xác định đâu là tiêu thức nguyên nhân, đâu là tiêu thức kết quả
Trong mối liên hệ này, có thể có nhiều nguyên nhân nhưng chỉ có một kết quả
Bước 2: Thăm dò mối liên hệ bằng các phương pháp thống kê: phương pháp đồ
thị, phân tổ, số bình quân, phương pháp quan sát 2 dãy số song song…
Bước 3: Lập phương trình hồi quy biểu hiện mối liên hệ
Ví dụ: Các phương trình y = a + bx; y = a + bx + cx2…
Bước 4: Tính toán các tham số và giải thích ý nghĩa của chúng
4.1.2.2 Đánh giá mức độ chặt chẽ của mối liên hệ tương quan
Sau khi đã xây dựng được phương trình hồi quy biểu diễn mối liên hệ giữa các hiện tượng kinh tế – xã hội, nhiệm vụ thứ hai của phân tích hồi quy tương quan là đánh giá
mức độ chặt chẽ của mối liên hệ tương quan và sự phù hợp của mô hình thông qua hệ
số tương quan (tuyến tính) và tỷ số tương quan (phi tuyến tính)
4.1.3 Ý nghĩa của phân tích hồi quy và tương quan
Phân tích hồi quy và tương quan là phương pháp thường được sử dụng để nghiên cứu mối liên hệ tương quan giữa các hiện tượng kinh tế – xã hội Bên cạnh đó, nó còn được sử dụng nhiều trong nghiên cứu thống kê, như phân tích dãy số thời gian, dự đoán thống kê
Trong phần tiếp theo, bài giảng sẽ đi vào trình bày cách thức xây dựng và phân tích một mô hình hồi quy thể hiện mối liên hệ giữa một tiêu thức nguyên nhân và một tiêu thức kết quả
4.2 Hồi quy và tương quan giữa hai tiêu thức số lượng
Trước hết là dạng mô hình đơn giản nhất, mô hình hồi quy tuyến tính
Trang 64.2.1 Mô hình hồi quy tuyến tính giữa hai tiêu thức số lượng
4.2.1.1 Mô hình hồi quy
Trước khi đi vào xây dựng mô hình hồi quy, chúng ta hãy xem xét một số khái niệm
có liên quan
Một số khái niệm liên quan
o Đường hồi quy thực nghiệm: là đường được hình thành bởi các tài liệu thực tế
o Đường hồi quy lý thuyết: là đường điều chỉnh bù trừ các chênh lệch ngẫu nhiên vạch ra xu hướng cơ bản của hiện tượng
o Mô hình hồi quy là mô hình xác định vị trí của đường hồi quy lý thuyết sao cho
mô tả gần đúng nhất mối liên hệ thực tế
Xây dựng mô hình hồi quy tuyến tính đơn
o Mô hình hồi quy tuyến tính biểu diễn mối liên hệ giữa 2 tiêu thức số lượng
có dạng:
x
ˆy = b0 + b1x Trong đó:
x: Trị số của tiêu thức gây ảnh hưởng (nguyên nhân) (biến độc lập)
ˆy : Trị số điều chỉnh của tiêu thức chịu ảnh hưởng (kết quả) (biến phụ xthuộc) theo quan hệ với x
b0: Hệ số tự do (hệ số chặn), là điểm xuất phát của đường hồi quy lý thuyết, nêu lên ảnh hưởng của các nhân tố khác (tiêu thức nguyên nhân khác) ngoài
x tới sự biến động của y
b1: Hệ số hồi quy (hệ số góc, độ dốc), phản ánh ảnh hưởng trực tiếp của tiêu thức nguyên nhân x đến tiêu thức kết quả y Mỗi khi x tăng lên 1 đơn vị thì
y sẽ thay đổi trung bình b1 đơn vị
b1 nói lên chiều hướng của mối liên hệ: b1 > 0: Mối liên hệ thuận; b1 < 0: Mối liên hệ nghịch
o Cách xác định tham số:
b0, b1 phải được xác định sao cho đường hồi quy lý thuyết mô tả gần đúng nhất mối liên hệ thực tế Trên hình vẽ, khoảng cách từ điểm thực tế đến điểm thuộc đường hồi quy lý thuyết nhỏ nhất sẽ là tốt nhất
Sử dụng phương pháp bình phương nhỏ nhất (OLS – Ordinary Least Square) với nội dung: tổng bình phương các độ lệch giữa giá trị thực tế và giá trị lý thuyết của biến phụ thuộc (tiêu thức kết quả) là nhỏ nhất
Đường hồi quy thực nghiệm
Đường hồi quy
lý thuyết
Trang 7Bài 4: Phân tích hồi quy và tương quan
Để thỏa mãn điều kiện trên, cần tính đạo hàm riêng theo 2 tham số cần tìm
Từ đó, b0 và b1 phải thỏa mãn hệ phương trình:
xn
yi
yn
xyxy
Yêu cầu: Lập mô hình hồi quy tuyến tính biểu diễn mối liên hệ giữa số năm
sử dụng xe và giá bán của xe
Hướng dẫn:
Ở đây chúng ta đang nghiên cứu các nhân tố ảnh hưởng đến giá bán xe máy nên số năm sử dụng sẽ là tiêu thức nguyên nhân x, còn giá bán sẽ là tiêu thức kết quả y
Trang 8Mô hình hồi quy có dạng: ˆy = bx 0 + b1x
< 0 mối liên hệ nghịch
b0 = y – b1x= 8,864 – (–2,03 5,273) = 19,57 Vậy phương trình hồi quy tuyến tính biểu diễn mối liên hệ giữa số năm sử dụng và giá bán có dạng:
x
ˆy = 19,57 – 2,03x Trong đó:
b0 = 19,57 nêu lên ảnh hưởng của các nhân tố khác ngoài số năm sử dụng tới
sự thay đổi của giá bán
b1 = – 2,03 nêu lên ảnh hưởng trực tiếp của số năm sử dụng tới sự thay đổi của giá bán Khi số năm sử dụng tăng thêm 1 năm thì giá bán của chiếc xe sẽ giảm
đi trung bình 2,03 triệu đồng
Cách kiểm tra kết quả:
x tăng từ 2 đến 7 năm làm y giảm từ 16,9 xuống còn 4,8 triệu đồng; vậy x tăng làm y giảm, ta có mối liên hệ nghịch, tức b1 < 0
Thay bất kỳ giá trị nào của x vào phương trình hồi quy phải ra giá trị ˆy ≈ yx x
4.2.1.2 Hệ số tương quan
Khái niệm: Hệ số tương quan là chỉ tiêu đánh giá mức độ chặt chẽ của mối liên hệ
tương quan tuyến tính đơn
Tác dụng:
o Xác định cường độ của mối liên hệ từ đó chọn ra nguyên nhân chủ yếu hoặc thứ yếu đối với hiện tượng nghiên cứu
o Xác định chiều hướng cụ thể của mối liên hệ (thuận – nghịch)
o Hệ số tương quan còn dùng trong nhiều trường hợp dự đoán thống kê và tính sai số của dự đoán
Công thức tính:
x 1
xy xy
r b
Trang 9Bài 4: Phân tích hồi quy và tương quanNhư vậy, dấu của hệ số tương quan r phụ thuộc vào dấu của hệ số b1 vì phương sai luôn mang dấu dương
Các tính chất của hệ số tương quan: Miền xác định: –1 ≤ r ≤ 1
o r > 0: Mối liên hệ tương quan tuyến tính thuận
o r < 0: Mối liên hệ tương quan tuyến tính nghịch
o r = ± 1: Mối liên hệ hàm số hoàn toàn chặt chẽ
o r = 0: Không có mối liên hệ tương quan tuyến tính giữa x và y
o r càng gần 1: Mối liên hệ càng chặt chẽ (cường độ mối liên hệ)
o r 0,9: Mối liên hệ rất chặt chẽ
o 0,7 r 0,9: Mối liên hệ tương đối chặt chẽ
o 0,5 r 0,7: Mối liên hệ bình thường (trong dự đoán thường không sử dụng r
này đối với tiêu thức số lượng nhưng với tiêu thức thuộc tính thì vẫn sử dụng)
o r < 0,5 : Mối liên hệ hết sức lỏng lẻo
353,1 = –0,925
Kết luận: Mối liên hệ giữa số năm sử dụng và giá bán xe Honda Wave cũ là mối liên
hệ tương quan tuyến tính nghịch và rất chặt chẽ
4.2.1.3 Hệ số xác định
Khái niệm: Hệ số xác định dùng để đánh giá sự phù hợp của mô hình, nó cho biết tỷ
lệ % thay đổi của y được giải thích bởi mô hình
Ở ví dụ trên, ta có: r2 = (–0,925)2 = 0,8556
Như vậy, 85,56% sự thay đổi của giá bán xe máy Honda Wave cũ được giải thích bởi
mô hình đã nói ở trên trong mối quan hệ với số năm sử dụng Điều đó nói lên rằng,
số năm sử dụng là hoàn toàn hữu ích khi dự đoán mức giá bán của một chiếc xe cũ
4.2.1.4 Kiểm định các tham số của phương trình hồi quy tuyến tính đơn
Trong mối liên hệ tương quan giữa x và y, cứ mỗi giá trị của x ta có thể thu được nhiều giá trị của y Khi đó, chúng ta phải có một số giả định sau:
o Đường hồi quy tổng thể chung: với phương trình tuyến tính yˆx= 0 + 1x, thì mỗi giá trị của x sẽ có nhiều giá trị tương ứng của y, khi đó số bình quân của các giá trị này sẽ nằm trên một đường thẳng Đường thẳng đó gọi là đường hồi quy tổng thể chung và phương trình của nó là phương trình hồi quy tổng thể chung
o Độ lệch tiêu chuẩn: độ lệch tiêu chuẩn của tổng thể chung gồm các giá trị y tương ứng với một giá trị cụ thể của x là như nhau, bất kể x là bao nhiêu
o Phân phối chuẩn: với một giá trị của x, tổng thể chung gồm các giá trị y tương ứng có phân phối chuẩn
Trang 10Nói cách khác, các giả định trên cho rằng, nếu có các tham số không đổi là 0, 1
và thì với mỗi giá trị của x, tổng thể chung gồm các giá trị của y tương ứng sẽ
có phân phối chuẩn với số bình quân là 0 + 1x và độ lệch tiêu chuẩn
Kiểm định hệ số hồi quy của phương trình tuyến tính đơn: Bài toán đặt ra như sau: Giả sử, phương trình hồi quy tuyến tính đơn yˆx= 0+ 1x, biểu diễn mối liên hệ phụ thuộc giữa tiêu thức nguyên nhân x và tiêu thức kết quả y Từ phương trình
đó, chúng ta cho rằng có thể dùng x để dự đoán giá trị của y Nhưng có thật sự là như vậy hay không?
Chúng ta đã biết, trong mô hình hồi quy, hệ số hồi quy thể hiện mối liên hệ giữa x
và y, nó cho biết ảnh hưởng trực tiếp của nguyên nhân x đến kết quả y Chính vì vậy, để trả lời câu hỏi trên, người ta thực hiện kiểm định hệ số hồi quy của phương trình tuyến tính đơn
Trình tự thực hiện kiểm định như sau:
o Bước 1: Phát biểu giả thiết không và giả thiết đối của nó
Giả thiết không là: H0: 1 = 0 (x không có mối liên hệ với y) Giả thiết đối là: H1: 1 ≠ 0 (có mối liên hệ tuyến tính giữa x và y)
o Bước 2: Xác định mức ý nghĩa α (với 1 – α là hệ số tin cậy)
o Bước 3: Chọn tiêu chuẩn kiểm định và tính giá trị của tiêu chuẩn kiểm định từ mẫu quan sát
Trên thực tế, các giá trị 0, 1 và là không biết nhưng chúng ta có thể ước lượng được qua một mẫu cụ thể
Giả sử rằng với một mẫu cụ thể, chúng ta xác định được phương trình hồi quy mẫu với hệ số hồi quy là b1, b1 có phân phối chuẩn với số bình quân
1
và độ lệch tiêu chuẩn b1
2 i
Nhưng trong phương trình trên, chúng ta chưa biết , nên có thể dùng sai số tiêu chuẩn
của mẫu để thay thế Khi đó, biến ngẫu nhiên kết quả
có phân phối t-student với bậc tự do df = n – 2
e 2 i
bt
S(x x)
Với giả thiết không H0: 1 = 0, tiêu chuẩn kiểm định là:
1 e 2 i
bt
S(x x)
Trang 11Bài 4: Phân tích hồi quy và tương quan
o Bước 4: Xác định miền bác bỏ và kết luận có bác bỏ giả thiết không hay không
Giá trị tới hạn là tα/2, với bậc tự do là n – 2 Tra bảng t để xác định giá trị tới hạn đó
Nếu giá trị tuyệt đối của t tính được mà lớn hơn giá trị tới hạn t tra bảng thì bác bỏ giả thiết H0 Ngược lại, thì chưa có cơ sở để bác bỏ giả thiết H0
Ví dụ:
Với số liệu ở ví dụ trên, giả sử có cơ sở cho rằng số năm sử dụng không có ảnh hưởng đến mức giá bán của chiếc xe Honda Wave cũ Khi đó, ta sẽ thực hiện kiểm định giả thiết sau:
Giả thiết không là: H0: 1 = 0 (số năm sử dụng không có mối liên hệ với mức giá bán)
Giả thiết đối là: H1: 1 ≠ 0 (có mối liên hệ tuyến tính giữa số năm sử dụng và mức giá bán)
Chúng ta thực hiện kiểm định giả thiết trên với mức ý nghĩa = 0,05
Giá trị tới hạn là tα/2 = t0,025, với bậc tự do là n – 2 = 11 – 2 = 9
Tra bảng ta tính được giá trị tới hạn ± t0,025 = 2,262
Từ mẫu đã cho, tính tiêu chuẩn kiểm định t:
1 e 2 i
b 2,03
t 7, 25
S 1, 2577
20,182(x x)
Trong đó: