Hai biến (đại lượng) được nói là có tương quan nếu chúng có quan hệ với nhau, chính xác hơn, sự thay đổi của biến này có ảnh hưởng đến thay đổi của biến còn lại.. Ký hiệu (x,y) là cặp gi[r]
(1)HỒI QUI VÀ
(2)TƯƠNG QUAN
Hai biến (đại lượng) nói có tương quan chúng có quan hệ với nhau, xác hơn, thay đổi biến có ảnh hưởng đến thay đổi biến cịn lại
(3)VÍ DỤ
Một cơng ty nghiên cứu ảnh hưởng quảng cáo tới doanh số bán hàng Dữ liệu quảng cáo doanh thu tháng thu thập sau:
Hãy vẽ biểu đồ phân tán.
Chi phí quảng cáo 1,3 0,9 1,8 2,1 1,5
Tổng doanh số tháng tới
(4)BIỂU ĐỒ PHÂN TÁN Biến độc lập: chi
(5)HỆ SỐ TƯƠNG QUAN PEARSON
Ký hiệu: r hay rX,Y
Công thức:
Trong n số lượng quan sát
1
2
2
, ; cov ,
cov , ; 1 n i i i n n i i i X Y X Y X i Y
x x y y
x y
n
x y r
x x y y
n n , 2 1 n i i i
X Y n n
i i
i i
x x y y
r
x x y y
(6)HỆ SỐ TƯƠNG QUAN PEARSON
Ký hiệu: r hay rX,Y
Cơng thức:
Trong n số lượng quan sát
,
2 2
2 2
.
X Y
n xy x y xy x y
r
n x x n y y x x y y
, 2 1 n i i i
X Y n n
i i
i i
x x y y
r
x x y y
(7)TRUNG BÌNH; PHƯƠNG SAI VÀ HIỆP PHƯƠNG SAI
Đối với quan sát mẫu Ta có:
1 1
2
2 2 2
2 1 2 1 1 2 1
1 1
; ; n n i i
n i n i
n n
i i
n i n i
n
i i
n n i
x y
x x x y y y
x y
n n n n
x y
x x x y y y
x y
n n n n
x y x y x y
(8)ĐÁNH GIÁ HỆ SỐ TƯƠNG QUAN
Miền giá trị: −1 ≤ ≤1
Nếu −1 ≤ ≤ tương quan âm rXY gần -1
thì mối liên hệ tuyến tính nghịch X, Y mạnh
Nếu ≤ ≤ tương quan dương rXY gần
thì mối liên hệ tuyến tính thuận X, Y mạnh
(9)(10)VÍ DỤ
Hãy tính hệ số tương quan Pearson chi phí quảng cáo doanh số ví dụ sau
Chi phí quảng cáo 1,3 0,9 1,8 2,1 1,5
Tổng doanh số tháng tới
(11)VÍ DỤ
X Y X2 Y2 XY
1,3 151,6 1,69 22.982,56 197,08
0,9 100,1 0,81 10.020,01 90,09
1,8 199,3 3,24 39.720,49 358,74
2,1 221,2 4,41 48.929,44 464,52
1,5 170,0 2,25 28.900,00 255,00
7,6 842,2 12,40 150.552,50 1.365,43
Σ Σ Σ Σ Σ
5
1
5 5
2
5 7, 842,
12, 40 150.552, 50 1365, 43
i i
i i
i i i i
n x y
x y x y
(12)VÍ DỤ
Ta có:
Hệ số tương quan:
Hoặc:
2
2
1, 52 2, 48 168, 44
30110, 273, 086
x x y
y xy
273, 086 1, 52.168, 44 2, 48 1, 52 30110, 168
0 , 44
, 993371434
XY
r
1 1
2
2 2
5.1365, 43 7, *842,
0, 993371434 5.12, 7, 5.150552, 842,
n n n
i i i i
i i i
XY
n n n n
i i i i
n x y x y
r
x x y y
(13)VÍ DỤ
Các giá trị trung bình
Độ lệch chuẩn:
Hệ số tương quan
2 12, 150552,5 1365, 43
2, 48; 30110, 5; 273, 086
5 5
x y xy
2 12, 150552,5 1365, 43
2, 48; 30110, 5; 273, 086
5 5
0, 460435 46, 61634
X Y
x y xy
0, 993371
(14)VÍ DỤ
Số liệu thời gian quảng cáo truyền hình lượng sản phẩm tiêu thụ công ty sản xuất đồ chơi trẻ em sau:
Thời gian: phút/tuần
Lượng tiêu thụ: 1000sp/tuần
Hãy tính hệ số tương quan mẫu cho kết luận
Thời gian 28 37 44 36 47 35 26 29 33 32 31 28
(15)HỆ SỐ TƯƠNG QUAN SPEARMAN
Hệ số tương quan hạng Ký hiệu R
Công thức:
Trong n cỡ mẫu d hiệu số hạng
( )
2
2
6 1
1
d R
n n
=
(16)
HỆ SỐ TƯƠNG QUAN SPEARMAN
Khi tuyển dụng, công ty đánh giá ứng viên thông qua vấn kiểm tra Khi vấn, ứng
viên đánh giá từ A (xuất sắc) đến E (khơng phù hợp) kiểm tra tính theo thang điểm 100 Kết ứng viên sau:
Tính hệ số tương quan hạng Spearman cho nhận xét
Ứng viên 1 2 3 4 5
(17)VÍ DỤ
Ta lập bảng sau:
Ứng viên Hạng phỏng vấn
Hạng kiểm tra
Hiệu số
Hiệu số bình phương
1 1,5 -2,5 6,25
2 3 0
3 1,5 -3,5 12,25
4
5
0 36,50
( ) ( )
2
2
6 6 * 36, 50
1 0, 825
5 25 1
d R
n n
= - = - =
(18)
VÍ DỤ
Một chuyên gia được yêu cầu nếm thử loại rượu có giá $ Hương vị loại rượu được xếp hạng từ (dở nhất) đến (ngon
nhất) Bảng tổng hợp xếp hạng giá các loại rượu sau:
Loại
rượu Hương vị Giá tiền
A 2,49
B 2,99
C 3,49
D 2,99
E 3,59
F 3,99
G 3,99
H 2,99
(19)VÍ DỤ
Ta lập bảng sau:
Loại rượu Hạng hương vị
Hạng giá tiền
Hiệu số
Hiệu số bình phương
A B C D E F G
(20)PHÂN TÍCH HỒI QUY
Phân tích hồi quy sử dụng để xác định mối liên hệ giữa:
Một biến phụ thuộc Y (biến giải thích)
Một hay nhiều biến độc lập X1, X2, …,Xn (còn gọi biến giải thích)
Biến phụ thuộc Y phải biến liên tục