Song mối liên hệ này không hoàn toàn chặt chẽ, tức là cứ không phải tuổi nghề tăng lên thì năng suất lao động cũng tăng theo một cách tương ứng.. Hay nói cách khác là mối liên hệ giữa tu
Trang 1Tên công nhân
A
B
C
D
E
F
G
H
I
J
Tuổi nghề (năm)
1
2
5
7
8
9
10
13
15
17
Năng suất lao động (sản phẩm)
5
6
10
12
11
13
14
12
18
16 Tài liệu trên cho thấy giữa tuổi nghề của công nhân và năng suất lao động của họ có mối liên hệ với nhau: Nhìn chung, với sự tăng lên của tuổi nghề (tiêu thức nguyên nhân) thì năng suất lao động (tiêu thức kết quả) cũng tăng lên Song mối liên hệ này không hoàn toàn chặt chẽ, tức là cứ không phải tuổi nghề tăng lên thì năng suất lao động cũng tăng theo một cách tương ứng Hay nói cách khác là mối liên hệ giữa tuổi nghề và năng suất lao động là mối liên hệ tương
quan
Để thấy rõ mối liên hệ này ta dùng hệ trục toạ độ vuông góc, với trục hoành
biểu diễn tuổi nghề (x) và trục tung biểu diễn năng suất lao động (y) Ta có đồ thị sau:
Trang 2""
Chương 5 Tương quan và hồi quy
-
-
Trên đồ thị những cặp trị số (x, y) tạo thành các điểm Nối chúng lại ta được đường gấp khúc gọi là đường hồi qui thực nghiệm Qua đường hồi qui thực nghiệm ta
thấy rõ khi tuổi nghề tăng lên thì năng suất lao động cũng tăng, biểu thị mối tương
quan thuận giữa hai tiêu thức trên Trên cơ sở quan sát đường hồi qui thực nghiệm
giúp ta phán đoán, tìm phương trình đường thẳng, có cùng hướng, thay thế cho đường hồi qui thực nghiệm Đường thẳng này gọi là đường hồi qui lý thuyết Đường hồi qui lý thuyết được xác định bởi phương trình:
Trong đó:
y x : Trị số điều chỉnh của tiêu thức y theo quan hệ phụ thuộc với tiêu thức
x
x: Trị số của tiêu thức nguyên nhân
a, b : các tham số xác định vị trí của đường hồi qui lý thuyết
Giữa các trị số thực tế và trị số lý thuyết luôn luôn có sự sai lệch Gọi e là sai lệch giữa trị số thực tế và trị số lý thuyết
Trong vô số đường lý thuyết thì đường hồi qui lý thuyết nào có tổng sai lệch
bình phương bé nhất thì đó là đường hồi quy lý thuyết tốt nhất, tức là:
Muốn vậy, đạo hàm riêng của các tham số phải triệt tiêu, tức ta có hệ phương trình sau đây, được gọi là hệ phương trình chuẩn:
Giải hệ phương trình trên ta được:
Với hệ 2 phương trình chứa 2 ẩn số, ta có thể giải ra để tìm a và b:
86
Trang 3và a = y/n – b x/n Để giải a và b ta lập bảng tính như sau:
Bảng 5.2
Tuổi nghề,
x
1
2
5
7
8
9
Năng suất lao động, y
5
6
10
12
11
13
xy
5
12
50
84
88
117
1
4
25
49
64
81
25
36
100
144
121
169
10
13
15
17
14
12
18
16
196
144
324
256
Thay các số liệu trong bảng vào hệ phương trình ta được;
117 = 10 a + 87 b
1194 =87 a + 1007b
Giải ra ta được:
Đây là phương trình hồi quy phản ánh mối liên hệ giữa tuổi nghề (x) và năng suất lao động (y) theo tài liệu từ 10 công nhân đã nói ở trên Trong phương trình
này, giá trị của a = 5,61 có thể xem như mức độ ảnh hưởng của các nguyên nhân
khác đến năng suất lao động ngoài tuổi nghề; b = 0,7 nói lên khi tăng thêm một
năm tuổi nghề thì năng suất lao động tăng bình quân là 0,7 sản phẩm
Trang 4""
Chương 5 Tương quan và hồi quy
-
-
b Hệ số tương quan:
Hệ số tương quan (được ký hiệu là r) là một số tương đối (biểu hiện bằng lần) dùng để đánh giá trình độ chặt chẽ của mối liên hệ tương quan tuyến tính Hệ số tương quan có thể được tính theo công thức sau đây:
x
y
x
2
y
2
x
x
y
y
Công thức này dễ nhớ, nhưng đôi khi trong tính toán không được thuận tiện, ta biến đổi công thức trên thành công thức khác, dễ sử dụng hơn:
Chia tử số và mẫu số cho n và tiếp tục biến đổi ta được:
r
_
_ _
x y
(ct 2)
x y
Với b là tham số trong phương trình hồi qui lý thuyết y = a + bx
Cũng từ công thức (2), ta có thể biến đổi tiếp tục để được công thức:
2
r [n xy y]/ [n x ( x)2][n y2( y) (ct.4)
hợp từ 4 công thức tính hệ số tương quan r nêu trên để tính cho gọn nhẹ
Tất cả các công thức tính hệ số tương quan này có thể vận dụng trong trường hợp tài liệu phân tổ nhưng phải lưu ý đến quyền số
*.1 Hệ số tương quan có giá trị từ -1 đến 1
88
Trang 5*.3 Nếu r = + 1: giữa x và y có liên hệ hàm số
*4 r càng gần + 1, môí liên hệ giữa x và y càng chặt chẽ
*5 r = 0 giữa x và y không có liên hệ tuyến tính
Tính r:
Để tính theo công thức (1), ta lập bảng sau:
Bảng 5.3
Tuổi nghề
x
1
Năng suất lao động
y
5
xy
5
7
8
9
12
11
13
84
88
117
49 144
64 121
81 169
-0,51 0,49 0,39
2,89 0,49 0,09
0,09 0,49 1,69
15
17
87
18
16
117
270 225 324
272 289 256
1 194 1 007 1515
39,69 39,69 39,69 35,69 68,89 18,49 176,1 250,1 146,10 Theo công thức 1:
176 ,1
250 ,1 x 146 ,1
Tính theo các công thức 2; 3; 4 ta cũng được kết quả r = 0,92 nhưng các phép tính gọn nhẹ hơn r = 0,92 cho phép ta kết luận mối liên hệ giữa tuổi nghề và năng suất lao động là mối liên hệ thuận và khá chặt chẽ
5.2.2 Trường hợp số liệu được phân tổ:
Ở phần trên để đơn giản hóa việc trình bày phương pháp, nên ví dụ được đưa
ra là tài liệu về tuổi nghề và năng suất lao động của 10 công nhân Song như chúng
ta đã biết: Để phản ánh đúng đắn mối liên hệ tương quan đòi hỏi phải nghiên cứu