chng VII ChØ sè Bµi gi¶ng Nguyªn lý thèng kª CHƯƠNG 5 HỒI QUY VÀ TƯƠNG QUAN 5 1 MỐI LIÊN HỆ GIỮA CÁC HIỆN TƯỢNG KINH TẾ XÃ HỘI VÀ PHƯƠNG PHÁP HỒI QUI VÀ TƯƠNG QUAN 5 1 1 Mối liên hệ giữa các hiện tượng kinh tế xã hội Liên hệ hàm số là mối liên hệ hết sức chặt chẽ giữa hai hiện tượng nghiên cứu Khi hiện tượng này thay đổi thì nó hoàn toàn quyết định sự thay đổi của hiện tượng có liên quan theo một tỷ lệ tương ứng chặt chẽ Liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ giưã hai hiện t.
Trang 1CHƯƠNG 5: HỒI QUY VÀ TƯƠNG QUAN 5.1 MỐI LIÊN HỆ GIỮA CÁC HIỆN TƯỢNG KINH TẾ XÃ HỘI VÀ PHƯƠNG PHÁP HỒI QUI VÀ TƯƠNG QUAN
5.1.1 Mối liên hệ giữa các hiện tượng kinh tế xã hội
- Liên hệ hàm số: là mối liên hệ hết sức chặt chẽ giữa hai hiện tượng nghiên cứu.
Khi hiện tượng này thay đổi thì nó hoàn toàn quyết định sự thay đổi của hiện tượng có liên quan theo một tỷ lệ tương ứng chặt chẽ
- Liên hệ tương quan: là mối liên hệ không hoàn toàn chặt chẽ giưã hai hiện tượng
nghiên cứu
Khi hiện tượng này thay đổi thì nó có thể làm cho hiện tượng có liên quan thay đổi theo nhưng không có ảnh hưởng hoàn toàn quyết định
5.1.2 Phương pháp hồi quy và tương quan
Hồi quy và tương quan là các phương pháp của toán học, được vận dụng trong thống kê học để biểu hiện và phân tích mối liên hệ tương quan giữa các hiện tượng kinh
tế xã hội Phương pháp tương quan được vận dụng để nghiên cứu mối liên hệ không
hoàn toàn chặt chẽ giữa các hiện tượng hoặc giữa các tiêu thức
Phương pháp tương quan giải quyết hai nhiệm vụ sau:
- Xác định tính chất và hình thức của mối liên hệ
- Đánh giá trình độ chặt chẽ của mối liên hệ bằng các chỉ tiêu như: hệ số tương quan, tỷ số tương quan
5.2 LIÊN HỆ TƯƠNG QUAN TUYẾN TÍNH GIỮA HAI TIÊU THỨC SỐ LƯỢNG
5.2.1 Phương trình hồi quy
Yx = a + bx Trong đó: Yx là trị số điều chỉnh của tiêu thức kết quả theo quan hệ phụ thuộc với tiêu thức x
x: trị số của tiêu thức nguyên nhân
a, b: các tham số quy định vị trí đường hối quy lý thuyết
Tham số a và b được giải ra từ hệ phương trình chuẩn sau:
∑y = n.a + b ∑x
∑xy = a∑x + b ∑x2
Trang 25.2.2 Hệ số tương quan (r)
Hệ số tương quan là một chỉ tiêu tương đối biểu hiện bằng số lần dùng để đánh giá trình độ chặt chẽ của mối liên hệ tương quan tuyến tính
- Tác dụng của hệ số tương quan
+ Giúp ta xác định được cường độ của mối liên hệ, xem xét giữa tiêu thức nguyên nhân
và tiêu thức kết quả có liên hệ với nhau đến mức độ nào
+ Còn được dùng nhiều trong trường hợp dự đoán thống kê và sai số dự đoán
- Công thức tính hệ số tương quan
x x y y r
− −
=
− −
∑
x y
xy x y r
δ δ
−
=
y
r bδ δ
=
- Tính chất của hệ số tương quan
+ Hệ số tương quan có trị số − ≤ ≤ +1 r 1 khi r mang dấu (+) ta có tương quan thuận, và ngược lại
+ r = ±1 giữa x và y có liên hệ hàm số
+ r = 0 giữa x và y không có liên hệ tuyến tính
+ Trị số của r càng gần 1 mối liên hệ giữa x và y càng chặt chẽ
VD: Giả sử có tài liệu về tuổi nghề (năm) và NSLĐ (sp) của 10 công nhân tại một xí
nghiệp như sau:
Tên công nhân Tuổi nghề (năm) NSLĐ (sp)
Trang 3Hoàng 11 19
5.3 LIÊN HỆ TƯƠNG QUAN PHI TUYẾN TÍNH GIỮA HAI TIÊU THỨC SỐ LƯỢNG
5.3.1 Các phương trình hồi quy
* Phương trình parabol bậc 2
2
Yx a bx cx= + +
Trong đó: x: trị số của tiêu thức nguyên nhân
Yx: trị số điều chỉnh của tiêu thức kết quả a: tham số biểu thị sự tác động của tiêu thức nguyên nhân khác
b, c: tham số biểu thị sự tác động của tiêu thức nguyên nhân x đến y Các tham số được xác định bằng phương pháp bình phương nhỏ nhất Khi đó có:
2
Y na b x c x
= + +
= + +
= + +
* Phương trình Hypecbol
x
= +
Các tham số được giải ra từ hệ
2
1
Y na b
x
= +
= + ÷
5.3.2 Tỷ số tương quan
- Khái niệm: tỷ số tương quan là chỉ tiêu đánh giá trình độ chặt chẽ của mối liên hệ tương quan phi tuyến tính giữa hai tiêu thức số lượng
- Cánh tính:
2
2
y y x y x
Y Y
Y Y
δ δ δ η
−
−
= = − = −
−
∑
∑
Trang 4- Tính chất:
+η lấy giá trị trong khoảng [0,1] tức 0≤ ≤η 1
Nếu η = 0 kết luận không có liên hệ tương quan giữa x và y.
Nếu η = 1 kết luận có liên hệ hàm số giữa x và y.
η càng gần 1 thì tương quan càng chặt chẽ.
+ η ≥ r nếuη= r thì giữa x và y có liên hệ tương quan tuyến tính
Ví dụ 2: Có tài liệu về tuổi nghề và NSLĐ của 10 công nhân cùng sx 1 loại sp trong doanh nghiệp A như sau:
Trang 5CHƯƠNG 6: DÃY SỐ THỜI GIAN 6.1 DÃY SỐ THỜI GIAN
6.1.1 Khái niệm về dãy số thời gian
- Khái niệm: Dãy số thời gian (DSTG) là dãy các trị số của chỉ tiêu thống kê được sắp xếp theo thứ tự thời gian dùng để biểu hiện tình hình phát triển của hiện tượng trong thời gian đó
- Tác dụng: Qua dãy số thời gian có thể nghiên cứu các đặc điểm về sự biến động của hiện tượng vạch rõ xu hướng và tính quy luật của sự phát triển, đồng thời còn được dùng làm cơ sở dự đoán mức độ tương lai của hiện tượng
- Cấu tạo: mỗi dãy số thời gian gồm có 2 thành phần:
+ Thời gian: thời gian biểu hiện là các mốc thời gian, có thể là ngày, tháng, năm… tuỳ theo mục đích nghiên cứu Độ dài giữa hai thời gian liền nhau trong dãy số gọi là khoảng cách thời gian
+ Chỉ tiêu về hiện tượng nghiên cứu: biểu hiện về mặt số lượng hay còn gọi là các mức
độ, chỉ tiêu này có thể là số tuyệt đối, số tương đối hoặc số bình quân
Phân loại DS biến động thời gian
* Dãy số thời kỳ: là dãy số biểu hiện biến động của chỉ tiêu qua từng thời kỳ Khoảng cách thời gian trong dãy số càng dài thì trị số của chỉ tiêu càng lớn, có thể cộng các trị số này với nhau để phản ánh mức độ của hiện tượng ở thời kỳ dài hơn
* Dãy số thời điểm: là dãy số biểu hiện biến động của chỉ tiêu qua các thời điểm nhất định Trong dãy số thời điểm các trị số của chỉ tiêu không phụ thuộc vào khoảng cách thời gian dài hay ngắn Không thể cộng các trị số này với nhau vì kết quả tính toán không có ý nghĩa
6.1.2 Các chỉ tiêu phân tích DSTG
(1) Mức độ bình quân theo thời gian
Chỉ tiêu này phản ánh mức độ đại biểu của các mức độ tuyệt đối trong một dãy số thời gian
* Đối với dãy số thời kỳ
i
Y Y
n
=∑
Trong đó: Yi các mức độ trong dãy số thời kỳ
n: số mức độ trong dãy số
Trang 6Y: mức độ bình quân theo thời gian.
* Đối với dãy số thời điểm
- Dãy số thời điểm có khoảng cách bằng nhau
1
2 1
1
n n
Y Y
Y
n
−
+ + + +
=
−
- Dãy số thời điểm có khoảng cách không bằng nhau
i i i
Y t Y
t
=∑
∑
Trong đó: t i: độ dài của các khoảng cách thời gian
(2) Lượng tăng (giảm) tuyệt đối
Là chỉ tiêu phản ánh sự thay đổi về trị số tuyệt đối của chỉ tiêu giữa hai thời gian nghiên cứu Giá trị của chỉ tiêu này mang dấu (+) gọi là lượng tăng tuyệt đối và ngược lại
* Lượng tăng (giảm) tuyệt đối liên hoàn
Là chênh lệch giữa mức độ kỳ nghiên cứu với mức độ của kỳ đứng liền trước đó
1
i Y Y i i
δ = − − (i=2,n)
* Lượng tăng (giảm) tuyệt đối định gốc
Là chênh lệch giữa mức độ kỳ nghiên cứu với mức độ của kỳ được chọn làm gốc
cố dịnh cho mọi lần so sánh (trong dãy số thời gian thường chọn mức độ đầu tiên)
1
i Y Y i
∆ = − (i=2,n)
* Lượng tăng (giảm) tuyệt đối bình quân
1
i
n
δ
δ =
−
(3) Tốc độ phát triển
Tốc độ phát triển là một số tương đối (thường biểu hiện bằng số lần, hoặc %) phản ánh tốc độ và xu hướng biến động của hiện tượng qua thời gian
* Tốc độ phát triển liên hoàn
Là tỷ số so sánh giữa mức độ kỳ sau so với mức độ của kỳ đứng liền trước đó
Trang 7i i i
Y t
Y −
= (lần) (i=2,n)
* Tốc độ phát triển định gốc
Là tỷ số so sánh giữa mức độ kỳ sau so với mức độ của kỳ được chọn làm gốc cố dịnh cho mọi lần so sánh (trong dãy số thời gian thường chọn mức độ đầu tiên)
1
i i
Y T Y
= (lần) (i=2,n)
* Tốc độ phát triển bình quân
1 2
n n i i
=
= ∏
(4) Tốc độ tăng (giảm)
Tốc độ tăng (giảm) dùng để đánh giá xem mức độ của hiện tượng nghiên cứu giữa hai thời gian đã tăng thêm (hoặc giảm đi) bao nhiêu lần hoặc bao nhiêu phần trăm
* Tốc độ tăng (giảm) liên hoàn
Là tỷ số giữa lượng tăng (giảm) tuyệt đối liên hoàn với mức độ kỳ gốc liên hoàn
1
i i i
a Y
δ
−
= (lần) (i=2,n)
hoặc a i=t i- 1 (nếu t i tính là số lần)
i
a =t i- 100 (nếu t i tính là %)
* Tốc độ tăng (giảm) định gốc
Là tỷ số giữa lượng tăng (giảm) tuyệt đối định gốc với mức độ kỳ gốc
1
i i
A Y
∆
= (lần) (i=2,n)
hoặc A i=T i- 1 (nếu T i tính là số lần)
i
A=T i- 100 (nếu T i tính là %)
* Tốc độ tăng (giảm) bình quân
Là chỉ tiêu phản ánh tốc độ tăng (giảm) đại biểu trong suốt thời gian nghiên cứu
1
a t= − (lần) 1
a t= − 00 (%)
(5) Giá trị tuyệt đối của 1% tăng (giảm)
Trang 8Chỉ tiêu này phản ánh cứ 1% tăng (giảm) của tốc độ tăng (giảm) liên hoàn thì tương ứng với một trị số tuyệt đối là bao nhiêu
( ) %
i i i
g a
δ
=
Công thức rút gọn:
1
100
i i
Y
g = −
Ví dụ 1: Có tài liệu về giá trị sản xuất của một doanh nghiệp:
Giá trị sản xuất (tỷ
đồng) 1,2 1,6 2,02 2,4 2,8 3,22 Yêu cầu:
Tính các chỉ tiêu phân tích dãy số thời gian?
6.2 CÁC PHƯƠNG PHÁP BIỂU HIỆN XU HƯỚNG BIẾN ĐỘNG CƠ BẢN CỦA HIỆN TƯỢNG KINH TẾ XÃ HỘI VÀ DỰ ĐOÁN THỐNG KÊ NGẮN HẠN
6.2.1 Phương pháp mở rộng khoảng cách thời gian: Phương pháp này được áp dụng
khi một dãy số thời gian có khoảng cách quá ngắn, hoặc có nhiều mức độ, làm ta khó thầý xu hướng phát triển cơ bản của hiện tượng Có thể rút bớt số lượng các mức độ trong dãy số bằng phương pháp mở rộng khoảng cách thời gian như biến đổi các mức độ hàng ngày thành mức độ hàng tuần; tuần thành tháng; tháng thành quý; quý thành năm
6.2.2 Phương pháp số bình quân trượt: Phương pháp này được vận dụng trong
trường hợp các mức độ trong dãy số tuy có dao động ngẫu nhiên nhưng mức dao động không lớn lắm Số bình quân trượt là số trung bình cộng của một nhóm nhất định các mức độ của dãy số được tính bằng cách lần lượt loại dần các mức độ đầu, đồng thời thêm vào các mức độ tiếp theo sao cho tổng số lượng các mức độ tham gia tính số trung bình là không thay đổi
Với phương pháp này, những dao động ngẫu nhiên trong dãy số bị san bằng, bù trừ và giảm bớt, tính quy luật của hiện tượng được biểu hiện rõ rệt hơn
6.2.3 Phương pháp hồi quy
Phương pháp này đã được nhắc đến trong chương hồi quy và tương quan Trong phần này thì các tiêu thức nguyên nhân x trong phương trình hồi quy được thay bằng t (thứ tự thời gian trong dãy số)
0 1
t
Y = +a a t
0 1
Y =na +a t
2
Yt a= t a+ t
Trong công tác thực tế, các tham số a0, a1 có thể tính theo công thức đơn giản hơn Vì t là thứ tự thời gian trong dãy số, cho nên có thể thay đổi bằng cách đánh số thứ
tự sao cho ∑t=0
- Nếu thứ tự thời gian là một số lẻ, ví dụ 7 năm (t1, t2, t3…t7), có thể đánh số thứ tự bằng cách lấy thời gian đứng ở giữa , các thời gian đứng trước nó lần lượt lấy thứ tự là
Trang 9-1,-2,-3 và các thời gian đứng sau nó lần lượt lấy thứ tự là +1, +2, +-1,-2,-3
- Nếu thứ tự thời gian là một số chẵn, ví dụ 8 năm (t1, t2, t3…t8), có thể đánh số thứ tự bằng cách lấy hai thời gian đứng ở giữa làm đích và lấy thứ tự t4 =-1; t5 =+1 , các thời gian đứng trước t4 lần lượt lấy thứ tự là -3,-5,-7 và các thời gian đứng sau t5 lần lượt lấy thứ tự là +3, +5, +7
Nếu ∑t=0 thì hệ phương trình trên sẽ được rút gọn:
0
Y =na +
∑
2 1
Yt a= t
Cũng với ví dụ 1 ở trên hãy tìm phương trình biêu hiện mối quan hệ giữa giá trị sản xuất theo thời gian?
6.2.4 Phương pháp biểu hiện quy luật biến động thời vụ
Chỉ tiêu thường dùng trong thống kê học để biểu hiện biến động thời vụ là chỉ số thời vụ
0
100
i
TV
Y
Y
= Trong đó: I TV : chỉ số thời vụ; Y i: Số bình quân của các mức độ các tháng cùng tên i Y0 : Số bình quân chung của tất cả các mức độ trong dãy số