Hồi quy tương quan

75 10 0
Hồi quy tương quan

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

RSS = tổng của các mức độ khác biệt bình phương giữa giá trị dự đoán của y và trị số trung bình của y.. CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH[r]

(1)(2)

TƯƠNG QUAN

Hai biến (đại lượng) nói có tương quan chúng có quan hệ với nhau, xác hơn, thay đổi biến có ảnh hưởng đến thay đổi biến lại

Ký hiệu (x,y) cặp giá trị quan sát hai biến X, Y

(3)

VÍ DỤ

Một cơng ty nghiên cứu ảnh hưởng quảng cáo tới doanh số bán hàng Dữ liệu quảng cáo doanh thu tháng thu thập sau:

Hãy vẽ biểu đồ phân tán.

Chi phí quảng

cáo 1,3 0,9 1,8 2,1 1,5

Tổng doanh số

(4)

BIỂU ĐỒ PHÂN TÁN Biến độc lập: chi

(5)

HỆ SỐ TƯƠNG QUAN PEARSON

Ký hiệu: r hay rX,Y Cơng thức:

Trong n số lượng quan sát

 

     

   

1

2

, ; cov ,

cov , n i i i n n i i X Y X Y

x x y y x y

n

x y r

x x y y

                     , 2 1 n i i i

X Y n n

i i

i i

x x y y r

x x y y

(6)

HỆ SỐ TƯƠNG QUAN PEARSON

Ký hiệu: r hay rX,Y Cơng thức:

Trong n số lượng quan sát

 

         

,

2 2

2 2

.

X Y

n xy x y xy x y r

n x x n y y x x y y

                       , 2 1 n i i i

X Y n n

i i

i i

x x y y r

x x y y

(7)

TRUNG BÌNH; PHƯƠNG SAI VÀ HIỆP PHƯƠNG SAI

Đối với quan sát mẫu Ta có:

1 1

2

2 2 2

2 2

; ; n n i i

n i n i

n n

i i

n i n i

n

i i

x y

x x x y y y

x y

n n n n

x y

x x x y y y

x y

n n n n

x y x y x y

(8)

ĐÁNH GIÁ HỆ SỐ TƯƠNG QUAN

 Miền giá trị:

 Nếu tương quan âm rXY gần -1 mối liên hệ tuyến tính nghịch X, Y mạnh

 Nếu tương quan dương rXY gần mối liên hệ tuyến tính thuận X, Y mạnh

(9)(10)

VÍ DỤ

Hãy tính hệ số tương quan Pearson chi phí quảng cáo doanh số ví dụ sau

Chi phí quảng

cáo 1,3 0,9 1,8 2,1 1,5

Tổng doanh số

(11)

VÍ DỤ

X Y X2 Y2 XY

1,3 151,6 1,69 22.982,56 197,08 0,9 100,1 0,81 10.020,01 90,09 1,8 199,3 3,24 39.720,49 358,74 2,1 221,2 4,41 48.929,44 464,52 1,5 170,0 2,25 28.900,00 255,00 7,6 842,2 12,40 150.552,5

0 1.365,43

X Y X2 Y2 XY

1,3 151,6 1,69 22.982,56 197,08 0,9 100,1 0,81 10.020,01 90,09 1,8 199,3 3,24 39.720,49 358,74 2,1 221,2 4,41 48.929,44 464,52 1,5 170,0 2,25 28.900,00 255,00 7,6 842,2 12,40 150.552,5

0 1.365,43

5

1

5 i 7,6 i 842,

i i

n x y

 

(12)

VÍ DỤ

Ta có:

Hệ số tương quan:

Hoặc:

2

1,52 2, 48 168, 44

30110,5 273,086

x x y

y xy

  

 

   

273,086 1,52.168, 44

2, 48 1,52 30110,5 168, 44 0,993371434

XY

r   

 

   

1 1

2

1 1

2 2

5.1365, 43 7,6*842,

0,993371434 5.12, 7,6 5.150552,5 842,

n n n

i i i i

i i i

XY

n n n n

i i i i

i i i i

n x y x y

r

x x y y

(13)

VÍ DỤ

Các giá trị trung bình

Độ lệch chuẩn:

Hệ số tương quan

2 12, 2, 48; 150552,5 30110,5; 1365, 43 273,086

5 5

x   y   xy  

2 12, 2, 48; 150552,5 30110,5; 1365, 43 273, 086

5 5

0, 460435 46,61634

X Y

x y xy

 

     

 

0,993371

(14)

VÍ DỤ

Số liệu thời gian quảng cáo truyền hình lượng sản phẩm tiêu thụ công ty sản xuất đồ chơi trẻ em sau:

Thời gian: phút/tuần

Lượng tiêu thụ: 1000sp/tuần

Hãy tính hệ số tương quan mẫu cho kết luận

Thời gian 28 37 44 36 47 35 26 29 33 32 3

1 28

(15)

HỆ SỐ TƯƠNG QUAN SPEARMAN

Hệ số tương quan hạng Ký hiệu R

Cơng thức:

Trong n cỡ mẫu d hiệu số hạng

( )

2

6 1

1

d R

n n

=

(16)

HỆ SỐ TƯƠNG QUAN SPEARMAN

Khi tuyển dụng, công ty đánh giá ứng viên thông qua vấn kiểm tra Khi vấn, ứng viên đánh giá từ A (xuất sắc) đến E (không phù hợp) kiểm tra tính theo thang điểm 100 Kết ứng viên sau:

Tính hệ số tương quan hạng Spearman cho nhận xét

Ứng viên 1 2 3 4 5

Điểm

vấn A B A C D

(17)

VÍ DỤ

Ta lập bảng sau:

Ứng viên Hạng phỏng vấn Hạng kiểm tra Hiệ u số Hiệu số bình phương

1 1,5 -2,5 6,25

2 3 0

3 1,5 -3,5 12,25

4

5

0 36,50

2

6 6* 36,50

1 d 0,825

(18)

-VÍ DỤ

Một chuyên gia yêu cầu nếm thử loại rượu có giá $ Hương vị loại rượu được xếp hạng từ (dở nhất) đến (ngon

nhất) Bảng tổng hợp xếp hạng giá loại rượu sau:

Loại

rượu Hương vị Giá tiền

A 2,49

B 2,99

C 3,49

D 2,99

E 3,59

F 3,99

G 3,99

H 2,99

(19)

VÍ DỤ

Ta lập bảng sau:

Loại

rượu hương vịHạng giá tiềnHạng Hiệu số Hiệu số bình phương

(20)

PHÂN TÍCH HỒI QUY

Phân tích hồi quy sử dụng để xác định mối liên hệ giữa:

Một biến phụ thuộc Y (biến giải thích)

Một hay nhiều biến độc lập X1, X2, …,Xn (còn gọi biến giải

thích)

Biến phụ thuộc Y phải biến liên tục

(21)

LIÊN HỆ HÀM SỐ VÀ LIÊN HỆ THỐNG KÊ

Liên hệ hàm số: Y=aX+b

Với giá trị X, có giá trị Y Liên hệ thống kê: Y=aX+b

Ví dụ: X: thời gian tự học; Y: điểm cuối kỳ

Một giá trị X có nhiều giá trị Y Dữ liệu X: liệu mẫu

(22)

VÍ DỤ

(23)

VÍ DỤ

Mặc dù điểm quan sát

không nằm đường thẳng tương quan tuyến tính mạnh

Cơng ty muốn xấp xỉ hàm chi phí bằng hàm tuyến tính:

• Ta cần xác định hệ số a, b cho đường thẳng xấp xỉ tốt cho hàm chi phí

.

(24)

THẶNG DƯ (RESIDUAL)

(25)

VÍ DỤ

Số liệu doanh số số lượng nhân viên kinh doanh khu vực công ty X sau:

Khu vực Doanh số Số nhân viên kinh doanh

A 236 11

B 234 12

C 298 18

D 250 15

E 246 13

(26)

TỔNG QUÁT

Giả sử có n quan sát (x1,y1), (x2,y2),…,(xn,yn)

Ta cần xác định đường thẳng y=a.x+b cho tổng bình phương thặng dư nhỏ

Hay cần cực tiểu hóa hàm số sau:

Chú ý:

a, b: hai ẩn cần tìm

xk; yk giá trị biết

( ) ( )2

1

, n k k

i

F a b y a x b

=

(27)

-TỔNG QT

Ta có:

Đường hồi quy ln qua điểm (

( )( ) ( ) ( ) 2 n k k k n k k

a y bx

x x y y

(28)

VÍ DỤ

Số liệu doanh số số lượng nhân viên kinh doanh khu vực công ty X sau:

Hãy tìm mơ hình tuyến tính dự đốn doanh số theo số nhân viên

Khu vực Doanh số Số nhân viên kinh doanh

A 236 11

B 234 12

C 298 18

D 250 15

E 246 13

(29)

ỨNG DỤNG KINH TẾ

(30)

HỒI QUY TUYẾN TÍNH TỔNG QUÁT

Vấn đề: có hai biến quan sát X Y

Ta cần tìm phương trình thể mối liên hệ giá trị Y X

Y: biến phụ thuộc; X: biến độc lập

(31)

HỒI QUY TUYẾN TÍNH

X Y có tương quan tuyến tính mạnh

Ta giả sử X Y có mối quan hệ tuyến tính với Mơ sau:

: hệ số góc (slope)

u: sai số ngẫu nhiên (nhiễu ngẫu nhiên, nhiễu trắng)

1

(32)

HỒI QUY TUYẾN TÍNH

Với giá trị quan sát ta có:

yi : giá trị quan sát Y X nhận giá trị xi

xi: giá trị quan sát thứ i X

ui: sai số ngẫu nhiên X nhận giá trị xi

1

i i i

(33)

HÀM HỒI QUY TỔNG THỂ Hàm hồi quy tổng thể

Đối với quan sát cụ thể ta có:

Mơ hình có biến phụ thuộc Y biến giải thích X.

( )

1

| i

E Y X X X

Y X

b b b b

= = +

= +

1

i i i

(34)

HÀM HỒI QUY MẪU SRF

Ta có số liệu tổng thể mà có số liệu mẫu (số liệu quan sát được)

Ta dùng số liệu mẫu để ước lượng tổng thể Hàm hồi quy mẫu:

Đối với quan sát thứ i:

µ µ µ

1

i i

Y = b + b X

µ µ µ

1

i i i

(35)

PRF SRF

Y

X

1

2

ˆ

1

ˆ

PRF

2

(36)

PRF VÀ SRF

Trong

ước lượng cho 1

ước lượng cho 2

ước lượng cho Y hay E(Y|Xi)

(37)(38)

CHÚ Ý

  Tình trạng Biện

pháp Hệ số Tham số

Khơng xác định xác giá trị

Ước lượng Kiểm định

Hệ số

Phương sai sai số

Hệ số Biến ngẫu nhiên

Có thể tính giá trị mẫu chọn

Dùng để ước lượng cho tham số tổng thể

Hệ số

Phương sai thặng dư mẫu

  Tình trạng Biện

pháp

Tham số

Khơng xác định xác giá trị

Ước lượng Kiểm định Biến ngẫu nhiên

Có thể tính giá trị mẫu chọn

(39)

ƯỚC LƯỢNG OLS Tìm giá trị ; cho:

Đạt giá trị nhỏ (pp bình phương tối thiểu) Dễ thấy:

( )2

2

1

1

n n

i i i

i i

u y b b x

= = = - -å å ( ) ( ) µ ( ) ( ) ( ) µ 2

1 2

2 2 ; n i i i n

x y x xy xy x y

x x x x

x x y y

(40)

HỆ SỐ HỒI QUY MẪU

Là ước lượng ; Dạng biểu diễn khác:

µ ( ) ( ) ( ) ( ) µ µ

2 2 2

1 1 ; n n i i i i

i i i

n n

i

i i

i i

x x y x x

cy c

x x x x

(41)

MỘT SỐ TÍNH CHẤT

Giá trị trung bình hệ số hồi quy mẫu:

Phương sai hệ số hồi quy mẫu:

Ta dùng kết để ước lượng giá trị hệ số hồi quy tổng thể ;

µ

( ) ( )µ

1 1; 2

E b = b E b = b

µ ( ) ( ) ( ) µ ( ) ( ) 2

1 2 2

1 1 n n i i i i x V V n

x x x x

s

b s b

(42)(43)

MỘT VÀI TÍNH CHẤT

Ta có:

     

1 1

0

n n n n

i i i i i i i

i i i i

u y y y y y y

   

      

(44)

KÝ HIỆU

(45)

TÁCH NHÓM BIẾN THIÊN: KHÁI NIỆM

TSS = tổng mức độ khác biệt bình phương từng giá trị yi trị số trung bình y

ESS = tổng mức độ khác biệt bình phương các giá trị quan sát giá trị dự đoán y

(46)

ĐO SỰ BIẾN THIÊN CỦA DỮ LIỆU

Tổng bình phương tồn phần (Total Sum of Squares)

Tổng bình phương hồi quy (Regression Sum of Squares)

Tổng bình phương sai số (Residual Sum of Squares)

( )2

1

n

i i

RSS y y

=

= å $

-( )2

1

n

i i

TSS y y

=

= å

-( )2

1

n

i i

i

ESS y y

=

(47)

RSS Tổng chênh lệch ESS SRF Y X yi Xi

Các tổng bình phương độ lệch

i

y

( )2

n

i i

RSS y y

=

= å $

-( )2

1

n

i i

T SS y y

=

= å

-( )2

1

n

i i

i

ESS y y

=

= å - $

(48)

CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH

Khi điểm quan sát gần đường thẳng ước lượng “độ thích hợp” cao, có nghĩa ESS nhỏ RSS lớn

Tham số đo độ thích hợp: R2 lớn tốt

ESS: biến thiên khơng giải thích RSS: biến thiên giải thích

R2 nhỏ nghĩa nhiều biến thiên Y khơng giải thích X Cần phải thêm nhiều biến khác vào mơ hình

2= ���

���

 

2

(49)

HỆ SỐ XÁC ĐỊNH

Coefficient of determination

Là tỷ lệ tổng biến thiên biến phụ thuộc gây biến thiên biến độc lập (biến giải thích) so với tổng biến thiên toàn phần

Tên gọi: R_bình phương (R squared) Ký hiệu:

Dễ thấy: R2 RSS

T SS

(50)

HỆ SỐ XÁC ĐỊNH

Đánh giá mơ hình tìm có giải thích tốt cho mối liên hệ biến phụ thuộc Y biến độc lập X hay không

Là bình phương hệ số tương quan mẫu

µ ( ) ( ) µ ( ) ( ) ( ) 2 2 2

2 2 2

2 2 i i XY

x x x x

RSS R

T SS y y y y

R r

b - b

-= = =

-

-=

(51)

Tính chất hệ số xác định R2

• 0≤ R2≤1

• Cho biết % biến động Y giải thích các biến số X mơ hình.

• R2 =1: đường hồi quy phù hợp hồn hảo

• R2 =0: X Y khơng có quan hệ

• R2 càng lớn tốt

• Đối với liệu chuỗi thời gian R2 thường lớn

0,9 Nếu thấp 0,6 hay 0,7 xem thấp

(52)(53)

ƯỚC LƯỢNG VÀ DỰ BÁO

1 Ước lượng hệ số góc 2 Ước lượng hệ số chặn

3 Ước lượng phương sai sai số 4 Dự báo giá trị trung bình

(54)

PHÂN PHỐI XÁC SUẤT CỦA

Nhớ

Với độ tin cậy 95% thì:

µ

µ

( ) ( ) 1

1

~t n

Se b b b -2,5% 2,5% 95%   0,025

t n 

  0,025 t n   ( ) µ µ ( ) ( ) 1 0,025 0,025 2

t n t n

Se b b b - £ £ -µ ( ) ( )µ µ ( ) ( )µ

1 t0,025 n Se 1 1 t0,025 n Se 1

(55)

ƯỚC LƯỢNG CHO

Tổng quát với độ tin cậy

2

2

 1  

 

2

2

tn

 

2

2

tn

  µ ( ) ( )µ ( ) 2 1 xx x Se V n S

b b s

ổ ửữ ỗ ữ ỗ ữ ỗ ữ ỗ = = ỗ + ữữ ỗ ữ ỗ ữữ ỗ ố ứ ( ) à ( ) ( ) 1

2 1

2

t n t n

Se a a b b b - £ £ -µ ( ) ( )µ µ ( ) ( )µ

1 t na Se 1 1 t na Se 1

b - - b £ b £ b + - b

(56)

-CÔNG THỨC ƯỚC LƯỢNG

Khoảng tin cậy hệ số 1

Trong đó:

 

^

2= � ��

(�− 2)

 

1=� /2 (�−2) .^2 .( 1

+

(´ )2

�� )

 

µ µ

(57)

PHÂN PHỐI XÁC SUẤT CỦA

Nhớ

Với độ tin cậy (1- ) thì:

µ

µ

( ) ( ) 2

2

~t n

Se b b b -/  /

 1  

 

/2

tn

 

/2

tn

 

( ) µ µ

( ) ( )

2 2

/ /

2

2

t n t n

Se a a b b b - £ £ -µ ( ) ( )µ µ ( ) ( )µ

2 t n Se t n Se

b - - b £ b £ b + - b

µ

( ) ( )µ

2

xx

Se V

S s

(58)

CÔNG THỨC ƯỚC LƯỢNG

Khoảng tin cậy của hệ số 2

Trong đó:

 

2=� /2(�−2 ).^ 2. 1

��

 

^

2= � ��

(�− 2)

 

µ µ

(59)

CƠNG THỨC ƯỚC LƯỢNG 2

• Khoảng tin cậy phương sai sai số tổng thể:

   

2

2

/2 /2

;

2 2

ESS ESS

n n

 

  

 

  

 

(60)

DỰ BÁO

Cho X nhận giá trị x0 Ta tiến hành dự báo: Trung bình Y X = x0 Ký hiệu: E(Y0|X0) Giá trị cụ thể Y X = x0 Ký hiệu:

Công thức chung:

(61)(62)(63)

BỔ SUNG KIẾN THỨC VỀ PHÂN PHỐI XÁC SUẤT

Phân phối chuẩn Phân phối Student

(64)

GIÁ TRỊ TỚI HẠN 2 (n; α)

Giá trị tới hạn mức α ( số thực ký hiệu 2(n;)sao cho với

Z~ 2(n) thì:

 

n; 

P Z    

 

2 n;

(65)(66)

GIÁ TRỊ TỚI HẠN

Giá trị tới hạn mức α ( số thực ký hiệu cho với Z~ (n) thì:

 

Z t n; 

P   

   

     

 

;0 ;1

;0,5 ;1 ;

;

0

n n

n n n

n n

t t

t t t

(67)(68)

VÍ DỤ

Quan sát biến động nhu cầu gạo Y (tấn/tháng) vào đơn giá X (ngàn đồng/kg) ta số liệu cho bảng Hãy lập mơ hình quy mẫu biễu diễn mối phụ thuộc nhu cầu vào đơn giá gạo

Xi 1 4 2 5 5 7

(69)

VÍ DỤ

Ta lập bảng sau:

Ta có: 24 4 36 6

6

(70)

VÍ DỤ Ta có: 2 2 . 111 6.4.6 ˆ 1,375 120 6.(4) .( ) n i i i n i i

Y X n X Y

X n X

           

ˆ Y ˆ X 6 ( 1,375).4 11,5

       

i

i X

(71)

Giải hồi quy máy tính

1 Bật tần số: Shift+Mode+↓ +4+1 (Freq On 2 Chọn Mode Regression: Mode+3+2(chọn

A+Bx)

3 Nhập liệu theo cột

4 Kiểm tra nhấn AC thoát

(72)

Bài tập 1

Thu thập số liệu điểm học tập học sinh mức thu nhập hàng năm bố mẹ ta có bảng số liệu sau:

Hãy tìm hàm hồi quy mẫu tính đặc trưng của nó

Xi: thu nhập (triệu/năm) Yi: điểm trung bình

Xi 45 60 30 90 75 45 10

5 60

Yi 8,7

(73)

Bài tập 1

b) Với độ tin cậy 95% ước lượng hệ số chặn, hệ số góc phương sai sai số.

c) Với độ tin cậy 90%, dự đoán điểm điểm trung bình thu nhập 80

Xi 45 60 30 90 75 45 10

5 60

Yi 8,7

(74)

Bài tập 2

Số liệu tỷ lệ lạm phát lãi suất năm 2011 quốc gia sau:

a) Ước lượng viết phương trình hồi quy tuyến tính

b) Tìm hệ số xác định giải thích ý nghĩa

c) Dự đốn lãi suất trung bình lạm phát 10%.

 

Lãi suất Y (%) 11 20 10 16 14

Lạm phát X

(75)

Bài tập 3 Cho bảng số liệu sau:

a) Tìm hệ số tương quan mẫu

b) Tìm phương trình hồi quy mẫu c) Tính Sxx, Sxy, Syy

d) Tính TSS, RSS, ESS.

e) Tính giá trị hồi quy từ tìm ESS f) Ước lượng cho với độ tin cậy 90%

 

X 4 7 8 15 12 14 20 16 9

Ngày đăng: 01/04/2021, 17:29

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan