môn lý thuyết thống kê
Trang 1Lời nói đầu
Gia tăng dân số trên thế giới hiện nay là mối bận tâm của cả loài ngời Hậuquả của việc gia tăng dân số quá nhanh càng nặng nề và nghiêm trọng, việc đảmbảo nhu cầu cho số dân ngày càng đông thật khó khăn Tốc độ tăng dân số ngàycàng nhanh làm cho đời sống của ngời dân ngày càng khổ
Các hiện tợng kinh tế luôn luôn biến đổi theo thời gian Để phân tích sự biến
động đó có nhiều môn khoa học nghiên cứu Trong quá trình học môn lý thuyếtthống kê đã trang bị cho em nhiều kiến thức để phân tích sự biến động của cáchiện tợng kinh tế - xã hội, đặc biệt là dãy số thời gian
Để nhận thức sau hơn về kiến thức chuyên ngành và nhất là kiên thức về dãy
số thời gian Đồng thời với mục đích vận dụng phơng pháp dãy số thời gian đểphân tích sự biến động của tốc độ tăng trởng của dân số để tìm hiểu đánh giá tốc
độ tăng trởng của dân số Việt Nam Vì vậy sau khi học xong môn lý thuyết thống
kê em đã chọn đề án môn học của mình là: “Phơng pháp dãy số thời gian và vận
dụng phơng pháp dãy số thời gian để phân tích sự biến động của tốc độ tăng trởng dân số và dự báo năm tới”.
Em xin chân thành cảm ơn sự chỉ dẫn của thầy Phạm Đại Đồng đã giúp đỡ
em hoàn thành đề án này Do trình độ còn hạn chếnên trong đề án này không tránhkhỏi những sai sót Em mong đợc sự góp ý của thầy và bạn bè
Chơng I:
Lý thuyết chung về phơng pháp dãy số thời gian
I:Phơng Pháp d y số thời gianã
1:Khái niệm về dãy số thời gian
Trang 2Lợng của các hiện tợng không ngừng biến động qua thời gian Để nghiên cứu
sự biến động này ngời ta thờng dựa vào dãy số thời gian hoặc để phản ánh quy luậtcủa s biến động
Độ dài của hai thời gian liền nhau gọi là khoảng cách thời gian
-Chỉ tiêu: Trị số của các chỉ tiêu gọi là mức độ của dãy số và đợc xắp xếptheo thứ tự thời gian
điểm;nó phụ thuộc vào khoảng cách thời gian
-Dãy số thời điểm:
+Các mức độ của nó phản ánh quy mô của hiện tợng tại một thời điểm nhất
định
Thực chất các mức độ của nó là số tuyệt đối thời điểm
+Đặc điểm:mức độ của hiện tợng ở thời điểm sau thờng bao gồm toàn bộhoặc một bộ phận mức độ của hiện tợng ở thời điểm trớc đó ì vậy việc cộng cáctrị số của chỉ tiêu không phản ánh quy mô của hiện tợng
1:4 Yêu cầu khi xây dựng dãy số thời gian.
-Khi xâymột cột dãy số thời gian phaỉ đảm bảo tính chất có thể so sánh đợcgiữa các mức độ trong dãy số nhằm phản ánh sự phát triển khách quan của hiện t-ợngqua thời gian.Muốn vậy thì nội dung và phơng pháp tính toán các chỉ tiêu quathời gian phải thống nhất , phạm vi hiện tợng nghiên cứu trớc sau phải nhất trí ,cáckhoảng cách thời gian trong dãy số phải bằng nhau (nhất là đối với dãy số thời kỳ)-Trong thực tế do những nguyên nhân khác nhau ma các yêu cầu trên bị viphạm cho nên đòi hỏi phải có sự chỉnh lý thích hợp để tiến hành phân tích và đảmbảo tính có thể so sánh đợc
Trang 31:5 Tác dụng của dãy số thời gian.
Qua dãy số thời gian có thể nghiên cứu các đặc điểm về sự biến động củahiện tợng,vạch rõ xu hớng và tính quy luật của sự phát triển ,đồng thời có dự đoáncác mức độ của hiện tợng trong tơng lai
2:Các chỉ tiêu phân tích dãy số thời gian.
2:1.Mức độ trung bình qua thời gian.
Chỉ tiêu này phản ánh mức độ đại biểu của các mức độ tuyệt đối trongmột số thời gian
* Đối với dãy số thời kỳ
*Đối với dãy số thời điểm
.Dãy số thời điểm có khoảng cách thời gian bằng nhau.Ta có công thức
y n i
n i i i
n
n n
t
t y t
t t
t y t
y t y
1
1 2
1
2 2 1 1
Trang 42.2 Lợng tăng giảm tuyệt đối
Chỉ tiêu này phản ánh sự thay đổi về mức độ tuyệt đối giữa hai thời giannghiên cứu.Tuỳ theo mục đích nghiên cứu cụ thể mà ngời ta có thể tính khối lợngtăng hoặc giảm các lợng tuyệt đối
*Lợng tăng giảm tuyệt đối thời kỳ
Thể hiện sự thây đổi về quy mô của hiện tợng Là hiệu số giữa các mức độ thời kỳ nghiên cứu y i và mức độ kỳ đứng liền trớc đó y i 1
Trong đó :i lợng tăng giảm tuyệt đối liên hoàn
*Lợng tăng giảm tuyệt đối trung bình
Là mức độ đại diện cho các lợng tăng giảm trong kỳ
=
1 1
1
2 1
n
n n n
* Tốc độ phát triển liên hoàn
Tốc độ phát triển liên hoàn phản ánh sự biến động của hiện tợng giữa hai
thời gian gần nhau Có công thức tính nh sau
Trong đó : t i tốc độ phát triển liên hoàn của thời gian i so với thời gian i-1
y i 1:Mức độ của hiện tợng ở thời gian i-1
y i: Mức độ của hiện tợng ở thời gian i
Trang 5y1 : Mức độ đầu tiên của dãy số
.Mối quan hệ giữatốc độ phát triển định gốc và tốc độ phát triển liên hoàn.
-Tích các tốc độ phát triển liên hoàn bằng tốc độ phát triển định gốc Tức là
t t
2.4 Tốc độ tăng, giảm
Chỉ tiêu này phản ánh mức độ của hiện tợng giữa hai thời gian đã tăng hoặcgiảm bao nhiêu lần (hoặc bao nhiêu phần trăm) ta có các tốc độ tăng (hoặcgiảm )sau đây:
-Tốc độ tăng (hoặc giảm)liên hoàn với mức độ kỳ gốc liên hoàn:
i i
i i
i i
y
y y
y y
y y a
y :Là mức độ của hiện tợng ở thời gian i-1:
-Tốc độ tăng (hoặc giảm )định gốc là tỷ số giữa lợng tăng (hoặc giảm)địnhgốc với mức độ kỳ gốc cố định
1
y
y y
y y
y y
i
Trang 6y :Mức độ của hiện tợng ở thời gian thứ nhất
-Tốc độ tăng (hoặc giảm )trung bình là chỉ tiêu phản ánh tốc độ tăng( hoặcgiảm ) đại biểu trong suốt thời gian nghiên cứu Công thức tính nh sau:
a =t-1
Trong đó:
a:Là tốc độ tăng ,giảm trung bình
t :Là tốc độ phát triển trung bình
2.5 Giá trị tuyệt đối của 1%tăng , giảm của tốc độ tăng giảm từng kỳ
Chỉ tiêu này phản ánh cứ 1% tăng ,giảm của tốc độ tăng ,giảm liên hoàn thì
t-ơng ứng với một trị số tuyệt đối là bao nhiêu Công thức tính nh sau:
(%)
i
i i
i i
y y
1 i n
y i : Mức độ của hiện tợng thời gian i-1
Trang 7II: Dự ĐOáN DựA VàO D Y Số ThờI GIAN ã
1.Phân tích các thành phần của dãy số thời gian.
Thành phần của dãy số thời gian bao gồm ba thành phần:
Thành phần xu thế f(t):Nói lên xu hớng phát triển cơ bản của hiện tợngkéodài theo thời gian
Thành phần thời vụ s(t):nói lên sự biến động mang tính chất lặp đi lặp lạitrong một năm
Thành phần ngẫu nhiên z(t)
1.1Phân tích các thành phần trong dãy số thời gian theo dạng công cộng bảng Buys-Ballot(BB)
) ( ) ( )
Y^ 0 1 Xác định b0,b1,c j bằng phơng pháp bình phơng nhỏ nhất
Ví dụ :Tài liệuvề doanh thu Yquamột số năm củacửa hàng A nh sau
Năm Quý I Quý II Quý III QuýIV Tổng dòngnăm t i i.T i
Trang 8) 2
1 (
) 1 (
S n
n m
T b
( ).
(t s t z t f
Y t
Xác định xu thế f(t) tìm cách khử ngẫu nhiên :
-Từ dãy số Y t ta tính dãy số trung bình trợt nhằm khử biến động thời vụ
và biến động ngẫu nhiên
-Từ dãy số trung bình trợt xác định f(t)
-Dùng sai phân bậc 1:i Y i Y i 1
-Dùng sai phân bậc 2: ( 1 )
1 ) 1 ( ) 2 (
.
t f
Y z
Trung bình mong đợi có thể là quý hoặc tháng
S(t) là chỉ số thời vụ điều chỉnh bằng trung bình xén * H
Xác định z(t):
) ( ).
(t s t f
Trang 9) 2 ( /
Min Y t /
)
(t f
Trang 10Trong quý I trung bình xén là giá trị nhỏ nhất
s(2)=(Trung bình xén quý II) H
s(3)=(Trung bình xén quý III) H
s(4)=(Trung bình xén quý IV) H
Khi đã biết s(t)ta xác định z(t) theo công thức sau
) ( ).
2 Các phơng pháp biểu hiện xu hớng phát triển cơ bản của hiện tợng
Sự biến động của hiện tợng qua thời gian chịu sự tác động của nhiều nhân
tố Ngoài các nhân tố chủ yếu, cơ bản quyết định xu hớng biến động của hiện tợng,còn có những nhân tố ngẫu nhiên gây ra những sai lệch khỏi xu hớng Xu hớng th-ờng đợc hiểu là chiều hớng tiến triển chung nào đó , một sự tiến triển kéo dài theothời gian , xác định tính quy luật biến động của hiện tợng theo thời gian Việc xác
định xu hớng động cơ bản của hiện tợng có ý nghĩa quan trọng trong nghiên cứuthống kê Vì vậy ,cần sử dụng những phơng pháp thích hợp, trong một chừng mựcnhất định ,loại bỏ tác động của những nhân tố ngẫu nhiên để nêu lên xu hớng vàtính quy luật về sự biến động của hiện tợng
Sau đây em sẽ trình bày một số phơng pháp thờng đợc sử dụng để biểu hiện
xu hớng biến động cơ bản của hiện tợng
Trang 112.1Phơng pháp mở rộng khoảng cách thời gian
Phơng pháp này đợc sử dụng khi có một dãy số thời kỳ có khoảng cách thờigian tơng đối ngắn và có nhiều mức độ mà qua đócha phản ánh đợc xu hớng biến
2.2 Phơng pháp dãy số trung bình trợt (di động)
Số trung bình trợt (còn gọi là số trung bình di động ) là số trung bình cộngcủa một nhóm nhất định các mức độ của dãy số đợc tính bằng cách lần lợt loại dầncác mức độ đầu đồng thời thêm vào các mức độ thời gian ,sao cho tổng số lợngcác mức độ tham tính số trung bình không thay đổi
Giả sử có dãy số thời gian:y1,y2,y3, ,y n2,y n1,y n
Nếu tính trung bình cho nhóm ba mức độ ,ta sẽ có :
Trang 123
3 2
Trợt với bao nhiêu mức độ phụ thuộc vào đặc điểm biến động của hiện tợng
và phụ thuộc vào sản lợng mức độ của dãy số thời gian
Sự biến động củahiện tợng qua thời gian ít thay đổi sản lợng mức độ của dãy
số thờng không nhiều 3,4 mức độ
Sự biến động của hiện tợng qua thời gian thay đổi lớn sản lợng mức độtơng
đối tơng đối nhiều 5, 6 ,7 mức độ
Trung trợt càng đợc tính tqf nhiều mức độ thì càng có tác dụng san bằng ảnhhởng của các nhân tố Nhng mặt khác số lợng mức độ dãy trợt trung bình giảmxuống thì ảnh hởng đến sự phân tích xu hớng phát triển cơ bản
a0, 1, , : các tham số
t: thứ tự thời gian
Để lựa chọn đúng đắn dạng của phơng trình hồi quy đòi hỏi phải dựa vào sựphân tích đặc điểm sự biến động của hiện tơng qua thời gian ,đồng thời kết hợp vớimột số phơng pháp đơn giản khác(nhdựa vào đồ thị , dựa vào độ tăng giảm tuyệt
đối ,dựa vào tốc độ phát triển …)
Các tham số a i(i=1,n) thờng đợc xác định bằng phơng pháp bình phơng nhỏnhất Tức là:
Sau đây là một số phơng trình hồi quy đơn giản thờng đợc sử dụng:
- Hàm tuyến tính :Y t =a t a t.t:
Trang 13Hàm tuyến tính đợc sử dụng khi các lợng tăng giảm tuyệt đối liên hoàn i
(gọi là sai phân bậc 1) xấp xỉ nhau
áp dụng phơng pháp bình phơng nhỏ nhất sẽ có hệ phơng trình sau để xác
1 0
.
.
t a t a y
t
t a a n y
-Phơng trình parabol bậc 2:
2 1
3 1
2 0
2
3 2
2 1
0
2 2
1 0
.
.
t a
t a
t a
y t
t a
t a
t a
y t
t a
t a
a n y
1 0
lg lg
lg
.
lg lg
lg
t a t a y t
t a a
n y
2.4 Phơng pháp biểu hiện biến động thời vụ
Sự biến động của một số hiện tợng kinh tế – xã hội thờng có tính thời vụnghĩa là hàng năm, trong từng thời gian nhất định ,sự biến động lặp đi lặp lại Ví
dụ :các sản phẩp của ngành nông nghiệp phụ thuộc vào từng mùa vụ Nguyênnhân gây ra biến động thời vụ là do ảnh hởng của điều kiện tự nhiên và phong tục,tập quán sinh hoạt của dân c
Biến động thời vụ làm cho hoạt động của một số ngành khi thì tăng khẩn
tr-ơng;lúc thì nhàn rỗi,bị thu hẹp lại
Nghiên cứu biến động thời vụ nhằm đề ra những chủ trơng biện pháp phùhợp,kịp thời, hạn chế những ảnh hởng của biến động thời vụ đối với sản xuất vàsinh hoạt của xã hội
Nhiệm vụ nghiên cứu thống kê là dựa vào số liệu của nhiều năm(ít nhất là 3năm) để xác định tính chất và mức độ của biến động thời vụ Phong pháp thờng đ-
ợc sử dụng là tính các chỉ số thời vụ Để nghiên cứu biến động thời vụ có một sốphơng pháp sau:
Trang 14- Chỉ số thời vụ: Đợc sử dụngtrong trờng hợp biến động thời vụ quanhững thời gian nhất định của các năm tơng đối ổn định Chỉ số thời vụ đợctính theo công thức sau.
100 0
y : Số trung bình các mức độ của các thời gian cùng tên i
y0 : Số trung bình của tất cả các mức độ trong dãy số
- Sự biến động thời vụ tăng, giảm rõ rệt qua thời gian thì chỉ số biến động
y I
3.1 Dự đoán dựa vào phơng trình hồi quy
Ta có phơng trình hồi quy theo thời gian:
) , , , , ( 0 1 n
t f t a a a
y
Có thể tiến hành dự đoán bằng cách ngoại suy phơng trình hồi quy:
) , , , ,
Mức độ dự đoán ở thời gian (t+h)
3.2 Dự đoán dựa vào lợng tăng(hoặc giảm)tuyệt đốibình quân
Phơng pháp này có thể đợc sử dụng khi các lợng tăng (hoặc giảm) liên hoànxấp xỉ nhau Ta có lợng tăng (hoặc giảm )tuyệt đối bình quân đợc tính
Trang 15Trong đó : y n mức độ cuối cùng của dãy số thời gian
3.3 Dự đoán dựa vào tốc độ phát triển trung bình
Phơng pháp dự đoán này đợc áp dụng khi các tốc độ phát triểnliên hoàn xấp
Trong đó:
y n:Mức độ cuối cùng của dãy số thời gian
y1 :Mức độ đầu tiên của dãy sốthời gian
Từ công thức trên , có mô hình dự đoán nh sau:
n h
SSE
min)Trong đó :
n: số lợmg mức độ của dãy số
p: số lợng tham số trong mô hình SSE: phơng sai của phần d
Trang 163.5 Dự đoán dựa vào san bằng mũ
Trong mô hình dự đoán thống kê ngắn hạn: Khi xây dựng các mô hình dự
đoán thì các mức độ của dãy số thời gian đợc xem nh nhau, nghĩa là có quyền sốtrong tính toán Do đó làm cho mô hình chở nên cứng nhắc, kém nhạy bén đối với
sự biến động của hiện tợng
Do đó khi xây dựng mô hình dự đoán, các mức độ của dãy số thời gian phải
đợc xem một cách không nh nhau Các mức độ càng mới càng cần phải chú ýnhiều hơn
Mô hình giản đơn
Giả sử ở thời gian t, có mức độ thực tế là y t và mức độ dự đoán là y t
dự đoánmức độ của hiện tợng ở thời gian tiếp sau đó có thể viết:
i t i n
i
i t
1 0
Nh vậy y t1 là tổng tất cả các mức độ của dãy số thời gian tính theo quyền
số, trong đó các quyền số giảm theo dạng mũ tuỳ thuộc vào mức độ cũ của dãy số
Trang 17Nếu càng lớn thì các mức độ mới trong dãy số càng đợc chú ý và ngợc lại
tốt nhất khi nó làm cho SSE min
)]
1 ( ) 1 ( )[
1 ( )
0 t y a t a t
) 1 ( ).
1 ( )]
1 ( ) ( [
1 (
` )
0
t a t
a S
y t
1 ( ) ( [ )
1 t a t a t a t
k t
t
t a
y
S ( 1 )
) (
Trang 181 ( ) (
1 ( ) ( [ )
1 t a t a t a t
k t t
[
] , [
k t t
k t t k
Y Var Y Var
Y Y Cov
k t t
( 1
t y y n
C
1
2
Trang 19
n t
C¸c to¸n tö thêng sö dông:
B : To¸n tö dÞch chuyÓ vÒ phÝa tríc
Cov[a t,a tk] 0
BiÓu diÔn qua to¸n tö B:
t t p
Y 1 1
hµm tù t¬ng quan:
k
Trang 20Y 1 1 2 2
Hµm tù t¬ng quan:
2 2 1
1
) 1 (
2 1 2
t t
2 2 1 1
q
k k q k
k k
t t
2 1
2 1
2 1 1
1
) 1 (
2 1
2 2
Trang 21
k
với k3
Quá trình tự hồi quybình quân trợt bậc p , q – ký hiệu ARMA(p,q)
Đó là sự kết hợp giữa AR(p)và MA(q)
q t q t
t p t p t
Y 1 1 1 1
Hay (B)Y t (B)a t
Trong thực tế phần lớn các quá trình ngẫu nhiên là không dừng ,do đó ngời ta
sử dụng toán tử sai phân để chuyển về quá trình dừng Khi đó ta có:
)
1
2 1
Mô hình biến động thời vụ
Có dãy sốY t có biến động thời vụ chúng ta phải khử biến động thời vụthông qua toán tử( 1 B ) s Y t thông thờng với s=4 theo tài liệu quýlà s =12 với tàiliệu là tháng
Sau khi biến động thời vụvẫn còn xu thế thì phải khử tiễp xu thế tức X t có
Phơng pháp Box – Jenkins dùng để lựa chọn mô hình tốt nhất để dự đoán
đ-ợc thực hiện qua các bớc sau
B
ớc 1: Chọn mô hình tốt nhất (trong thực tế thì mô hình tốt nhất là mô hình
có SE min) Khử biến động thời vụ và xu thế nếu có để đa về dãy để xây dựngARMA(p,q) choz t, cho bậc p , q
p=(0,1,2,3)
Trang 22Ta chọn tổ hợp (p,q)
Về mặt lý thuyết để chọn bậc thì Jenkinscos dựa vào tự tơng quan riêng phần
để từ đó chọn bậc (p,q) cho phù hợp trong thực tế việc này phức tạp tachỉ chọnmột số tổ hợp (p,q) cho SE min thì ta chọn tổ hợp đó làm bài tốt nhất
2 1 1 1
1
) 1 (
2 2
Trên cơ sở các ớc lợng sơ bộ các tham số t ngòi ta sẽ dùng các phong pháp
để đi đến ớc lợngtốt cho SE min
B
ớc3: Kiểm tra các giá trị của mô hình đã đợc xác định và dự đoán
+Kiểm tra mô hình:kiểm tra cáctham số , 0
Của mô hình phải khác không nếu nó bằng không phải loại bỏ mô hình
+Dự đoán:sau khi kiểm tra mô hình đựoc xác định thì đựoc dự đoán