Vận dụng phương pháp dãy số thời gian và dự đoán thống kê phân tích sự biến động về doanh thu của ngành Bưu chính viễn thông tỉnh Yên Bái từ năm 1999 đến 2003 và dự đoán cho năm 2004
Trang 1LờI Mở ĐầU
Những năm gân đây ,để đáp ứng nhu cầu đổi mới đất nớc và sựphát triển của nền kinh tế Đảng và nhà nớc ta đã có những chính sách rất
đúng đắn và thiết thực trong công cuộc mở cửa và hội nhập nền kinh tế nớc
ta với các nớc tiên tiến khác trên thế giới Nền kinh tế càng phát triển ,đờisống nhân dân càng cao thì nhu cầu về các loại hình dịch vụ càng lớn Để
đáp ứng nhu cầu đó ngày càng có nhiều loại hình dịch vụ ra đời Một trongnhững ngành dịch vụ phát triển mạnh mẽ nhất trong hơn 10 nam qua làngành Bu Chính Viễn Thông
Ngành Bu Chính Viễn Thông là một ngành dịch vụ phát triển khánhanh chóng và có những bớc tăng đáng kể về cả quy mô ,tốc độ và phạm
vi hoạt động Ngành không chỉ đáp ứng đợc quá trình thông tin liên lạc giữacác vùng trong nớc mà còn phát triển mạng lới thông tin liên lạc giữa trongnớc với quốc tế Ngày nay với yêu cầu ,đòi hỏi ngày càng cao của kháchhàng, ngành Bu Chính Viễn Thông đã không ngừng phát triển và hoàn thiệnhơn những loại hình dịch vụ của mình Một mặt ngành BCVT đóng gópmột phần đáng kể vào tổng thu nhập quốc dân ,mặt khác nó là động lựcthúc đẩy xã hội phát triển ,nhanh chóng hội nhập vơí nền kinh tế các nớctrong khu vực và trên thế giới
Trớc những đóng góp to lớn của ngành Bu Chính Viễn Thông vào
sự phát triển của đất nớc Em xin chọn đề tài “Vận dụng phơng pháp dãy
số thời gian,và dự đoán thống kê phân tích sự biến động về doanh thu của ngành Bu Chính Viễn Thông Tỉnh Yên Bái từ năm 1999 đến 2003 và dự
đoán cho năm 2004”
Tuy có nhiều cố gắng ,song đề tài không thể tránh khỏi những
thiếu sót Em kính mong sự giúp đỡ của Thầy để những bài viết sau đợc
hoàn thiện hơn Đề tài đợc hoàn thành dới sự giúp đỡ của Thạc sĩ Nguyễn
Hữu Chí giảng viên khoa thống kê trờng đại học Kinh tế quốc dân
Em xin chân thành cảm ơn Thầy
Trang 2
PHầN MộT:phơng pháp phân tích DãY Số THờI GIAN Và
Dãy số thời gian gồm 2 phần : -Thời gian
-Chỉ tiêu về hiện tơng nghiên cứu
Khoảng cách cuả dãy số thời gian chính là độ dài giữa hai thời gianliền nhau
Căn cứ vào đặc điểm tồn tại về quy mô của hiện tợng qua thời gian cóthể chia dãy số thời gian thành 2 loại :Dãy số thời kỳ và Dãy số thời điểm Dãy số thời điểm:Là dãy số biểu hiện quy mô (khối lợng )của hiện t-ợng trong từng khoảng thời gian nhất định Trong dãy số thời kỳ các mức
độ là những số tuyệt đối thời kỳ
Dãy số thời điểm :Là dãy số biểu hiện quy mô (khối lợng )của hiện ợng tại những thời điểm nhất định
t-Độ dài của dãy số thời gian:Có hai quan điểm nh sau
Quan điểm1:Dãy số thời gian tiến hành dự đoán càng dài càng tốt Quan điểm 2:Dãy số thời gian đợc tiến hành bởi một số ít mức độ cuốidãy
Do đó để quyết định độ dài phù hợp của dãy số thời gian phải phântích đặc điểm biến động của hiện tợng qua thời gian Nếu hiện tợng quathời gian biến động tơng đối ổn định có thể dùng 5,6.7 mức độ Nếu hiệntơng qua thời gian về cuối có những đột biến lớn thì chú ý số liệu của mấynăm cuối
Tầm dự đoán của thống kê luôn phải nhỏ hơn hoặc bằng 1/3 độ dài dãy
số thời gian
1.2,Các chỉ tiêu phân tích dãy số thời gian
1.2.1Mức độ trung bình theo thời gian
Đối với dãy số thời kỳ :Mức độ trung bình của dãy số đợc tính theocông thức sau :
n
y n
y y
y y
n i
Trong đó y i(i= 1,2,3, n) là các mức độ của dãy số thời kỳ
Đối với dãy số thời điểm :Để tính mức độ trung bình theo thời gian từmột dãy số thời điểm có khoảng cách thời gian bằng nhau ta có công thứctính nh sau:
y y
n n
Trong đó y i( i =1,2, ,n) là các mức độ của dãy số thời điểm cókhoảng cách thời gian bằng nhau
Đối với dãy số thời điểm có khoảng cách thời gian không bằng nhauthì mức độ trung bình theo thơì gian đợc tính theo công thức sau đây :
Trang 3n i i i
n
n n
t
t y t
t t
t y t
y t y y
1
1 2
1
2 2 1 1
Trong đó t i ( i= 1,2, ,n)là độ dài thời gian có mức độ y i
1 2.2.Lợng tăng( hoặc giảm) tuyệt đối
Đây là chỉ tiêu phản ánh sự thay đổi về mức độ tuyệt đối giữa hai thờigian nghiên cứu.Nếu mức độ của hiện tợng tăng lên thì trị số của chỉ tiêumang dấu dơng (+) và ngợc lại mang dấu âm (-)
Tuỳ theo mục đích nghiên cứu ,ta có các chỉ tiêu về lợng tăng (hoặcgiảm ) sau đây
_Lợng tăng (hoặc giảm ) tuyệt đối liên hoàn ( hay từng thời kỳ) là hiệu
số giữa mức độ kỳ nghiên cứu ( y i)và mức độ của kỳ đứng liền trớc đó (1
Trong đó :i là lợng tăng (hoặc giảm)tuyệt đối liên hoàn
Lợng tăng (hoặc giảm ) tuyệt đối định gốc (hay tính dồn )là hiệu sốgiữa mức độ kỳ nghiên cứu ( y i) và mức độ của một kỳ nào đó đợc chọnlàm gốc ,thờng là mức độ đầu tiên trong dãy số ( y1).Chỉ tiêu này phản ánhmức tăng (hoặc giảm) tuyệt đối trong những khoảng thời gian dài Nếu kýhiệu i là các lợng tăng (hoặc giảm) tuyệt đối định gốc ,ta có :
i y i y1 (i= 2,3 ,n)
dễ dàng nhận thấy rằng i
n i
i
2
(i =2,3 ,n) _Lợng tăng (hoặc giảm )tuyệt đối trung bình là mức trung bình củacác lợng tăng (hoăc giảm ) tuyệt đối liên hoàn Nếu ký hiệu là lợng tăng(hoặc giảm)tuyệt đối trung bình , ta có :
1 1
n
n n
n i i
Trang 41 2.3.Tốc độ phát triển
Tốc độ phát triển là một số tơng đối (thờng đợc biểu hiện bằng lầnhoăc %)phản ánh tốc độ và xu hớng biến động của hiện tợng qua thời gian
Ta có các loại tốc độ phát triển sau đây;
_Tốc độ phát triển liên hoàn phản ánh sự biến động của hiện tợng giữa haithời gian liền nhau công thc tính nh sau :
y
y
t ( i= 2,3, ,n)
Trong đó :
t1:Tốc độ phát triển liên hoàn của thời gian i so với thời gian i-1
y i 1 :Mức độ của hiẹn tợng ở thời gian i-1
y i:Mức độ của hiện tợng ở thời gian i
_Tốc độ phát triển định gốc phản ánh sự biến động của hiện tợng trongnhững khoảng thời gian dài :Công thức tính nh sau :
y i :Là mức độ của hiện tợng ở thời gian i
y1:Mức độ đầu tiên của dãy số
_Giữa tốc độ phát triển liên hoàn và tốc độ phát triển định gỗc có mối liên
Thứ hai:Thơng của hai tốc độ phát triển định gốc liền nhau bằng tốc độ
phát triển liên hoàn giữa hai thời gian đó Tức là:
i
i
i t T
T
1
( i = 2,3 ,n)_Tốc độ phát triển trung bình là trị số đại biểu của các tốc độ phát triển liênhoàn Vì các tốc độ phát triển liên hoàn có quan hệ tích nên để tính tốc độphát triển bình quân Ngời ta sử dụng công thức số trung bình nhân Nếu kíhiệu t là tốc độ phát triển trung bình ,thì công thức tính nh sau :
1
2
1 3
t t t t
1 2.4 Tốc độ tăng( hoặc giảm )
Chỉ tiêu này phản ánh mức độ của hiện tợng giữa hai thời gian đã tăng(+) hoặc giảm (-) bao nhiêu lần (hoặc bao nhiêu %).Tơng ứng với các tốc
độ phát triển ,ta có các tốc độ tăng hoặc giảm sau đây:
_Tốc độ tăng (hoặc giảm ) liên hoàn (hay từng thời kì ) là tỉ số giữa ợng tăng (hoặc giảm ) liên hoàn với độ kỳ gốc liên hoàn Nếu ký hiệu a i ( i
l-= 2,3, ,n) là tốc độ tăng hoặc giảm liên hoàn thì :
i i
i i i
y
y y
y y
y y a
a i t i 1 nếu t ính bằng% thì : a i% t i% 100
Trang 5_Tốc độ tăng hoặc giảm định gốc là tỷ số giữa lợng tăng hoặc giảm
định gốc với mức độ kỳ gốc định Nếu ký hiệu Ai là các tốc độ tăng hoặcgiảm định mức thì :
1 i
1
y
y y
y y
y y
1.2.5.Giá trị tuyệt đối của 1% tăng ( hoặc giảm)
Chỉ tiêu này phản ánh cứ 1% tăng (hoặc giảm )của tốc độ tăng (hoặcgiảm) liên hoàn thì tơng ứng với một trị số tuyệt đối là bao nhiêu Nếu kíhiệu gi ( i = 2,3, ,n) là giá trị tuyệt đối của 1% tăng ( hoặc giảm) thì :
100 100
1
1 1
i i i
y y
y y
y y g
Chú ý:Chỉ tiêu này chỉ tính cho tốc độ tăng ( hoặc giảm )liên hoàn ,đối với
tốc độ tăng (hoặcgiảm) định gốc thì không tính vì luôn là một số không đổi
2.Một số phơng pháp biểu hiện xu hớng biến động cơ bản của hiện tợng
_Sự biến động của hiện tợng qua thời gian chiụ sự tác động của nhiềunhân tố Ngoài những nhân tố chủ yếu ,cơ bản quyết định xu hớng biến
động của hiện tợng ,còn có những nhân tố ngẫu nhiên gây ra những sai lệchkhỏi xu hớng vì vậy cần sử dụng những phơng pháp thích hợp,trong mộtchừng mực nhất định ,loại bỏ tác động của những nhân tố ngẫu nhiên đểnêu lên xu hớng và tính quy luật về sự biến động của hiện tợng
Một số phơng pháp thờng đợc sử dụng để biểu hiện xu hớng biến động cơbản của hiện tợng qua thời gian
2.1.Phơng pháp mở rộng khoảng cách thời gian
Phơng pháp này đợc sử dụng khi một dãy số thời kì có khoảng cáchthời gian tơng đối ngắn và có nhiều mức độ mà qua đó cha phản ánh đợc xuhớng biến động của hiện tợng
Do khoảng cách thời gian đợc mở rộng (từ tháng sang quý )nên trongmỗi mức độ của dãy số mới thì sự tác động của các nhân tố ngẫu nhiên (vớichiều hớng khác nhau )phần nào đã bù trừ (triệt tiêu) và do đó cho ta thấy
rõ xu hớng biến động cơ bản
2.2.Phơng pháp số trung bình trợt (di động )
Số trung bình trợt (còn gọi là số trung bình di động )là số trung bìnhcủa một nhóm nhất định các mức độ của dãy số đợc tính bằng cách lần lợt
Trang 6loại dần các mức độ đầu ,đồng thời thêm vào các mức độ tiếp theo ,sao chotổng số lợng mức độ tham gia tính số trung bình không thay đổi
Giả sử có dãy số sau đây : y1,y2,y3 ,yn-2,,yn-1,yn
Nếu tính trung bình trợt cho 3 mức độ , ta sẽ có :
3
3 2 1 2
y y y
y
3
4 3 2 3
y y y
y
3
1 2 1
n n n n
y y y
y
Từ đó ta có một dãy số mới gồm các số trung bình trợt y2 ,y3 , ,y n1
Viêc lựa chọn nhóm bao nhiêu mc độ để tính trung bình trợt đòi hỏiphải dựa vào đặc điểm biến động của hiện tợng và số lợng các mức độ củadãy số thời gian.Nếu sự biến động của dãy số tơng đối đều đặn và số lợngcác mức độ của dãy số không nhiều thì có thể tính trung bình trợt với 3 mức
độ Nếu sự biến động của hiện tợng lớn và dãy số có nhiều mức độ thì cóthể tính trung bình trợt từ 5 đến 7 mức độ Trung bình trợt càng đợc tính từnhiều mức độ thì càng có tác dụng san bằng ảnh hởng của các nhân tố ngẫunhiên ,Nhng mặt khác lại làm giảm số lợng các mức độ của dãy trung bìnhtrợt
2 3.Phơng pháp hồi quy
Trên cơ sở dãy số thời gian ,ngời ta tìm một hàm số (gọi là phơng trìnhhồi quy )phản ánh sự biến động của hiện tợng qua thời gian có dạng tổngquát nh sau :
Để lựa chọn đúng dạng của phơng trình hồi quy đòi hỏi phai dựa vào
sự phân tích đặc điểm biêns động của hiện tợng qua thơi gian ,đồng thời kếthợp với một số phơng pháp đơn giản khác (nh dựa vào đồ thị , dựa vào độtăng (giảm ) tuyệt đối ,dụa vào tốc độ phát triển )
Các tham số ai ( i = 1,2,3, ,n) Thờng đợc xác định bằng phơng phápbình phơng nhỏ nhất Tức là
_phơng trình đờng thẳng đợc sử dụng khi các lợng tăng hoặc giảm tuyệt
đối liên hoàn i(còn gọi là sai phân bậc một)xấp xỉ nhau
_Theo phơng pháp bình phơng nhỏ nhất ta sẽ xác định đợc b0, b1theo hệphơng trình sau
1 0
t b t b ty
t b nb y
Phơng trình đờng parapol
2
2 1 0
y
Trang 73 1
2 0
2
3 2
2 1
0
2 2
1 0
t b
t b
t b
y
t
t b
t b
t b
ty
t b
t b
nb y
0
ˆ Theo phơng pháp bình phơng nhỏ nhất ta có thể tìm b0 ,b1bằng cáchgiải hệ phơng trình sau
1 0
1 1
1
t b t b t y
t b nb y
_phơng pháp hàm mũ
*
1 0
ˆ b b
y lgyˆ lgb0 tlgb1 Giải hệ sau
1 0
lg lg
lg
lg lg
lg
t b t b y t
t b b
n y
ta sẽ thu đợc b0.b1
2.4.Phơng pháp biểu hiện biến động thời vụ.
_Biến động của một số hiện tợng kinh tế ,xả hội thờng có tính thời
vụ ,trong từng thời gian nhất định sự biến động đợc lặp đi lặp lại Ngiên cứubiến động thời vụ để đề ra những chủ trơng biện pháp phù hợp kịp thời hạnchế những hởng của biến động thời vụ đối với sản xuất và sinh hoạt của xãhội
_Nhiệm vụ của thống kê là dựa vào số liệu của nhiều năm (ít nhất là 3năm )để xác định tính chất và mức độ của biến động thời vụ Phơng phápthờng đợc sử dụng là tính chỉ số thời vụ,
Trong đó : Ii:Chỉ số thời vụ của thời gian t
y t :Số trung bình các mức độ của các thời gian cùng tên i
y0 : Số trung bình của tất cả các mức độ
II.Phơng pháp dự đoán thống kê ngắn hạn
1 khái niêm về dự đoán thống kê:
1.1 khái niệm: Dự đoán thống kê là việc dự đoán quá trình tiếp theo của
hiện tợng trong những khoảng thời gian tơng đối ngắn ,nối tiếp với hiện tạibằng việc sử dụng những thông tin thống kê và áp dụng các phơng phápthích hợp
1.2.Đặc điểm của dự đoán thống kê:
-Đối với nghiên cứu thống kê không những phải biết điều đã xảy ra( đó là những hiện tợng quy luật )mà phải biết sự phát triển của tơng lai củahiện tợng cần dự đoán Kết quả của dự đoán thống kê là căn cứ để tiến hành
điều chỉnh kịp thời các hoạt động sản xuất kinh doanh là cơ sơ để đa ranhững quyết định kịp thời và hữu hiệu Hiện có 3 loại dự đoán thống kê nhsau
Dự đoán thống kê ngắn hạn : Khoảng 3 năm trở xuống
Trang 8Điều kiện sử dụng:i (i=2 ,n)
Trong đó :yn: Mức độ cuối cùng của dãy số thời gian
y1:Là mức độ đầu tiên của dãy số thời gian
2.2 Dự đoán dựa vào tốc độ phát triển trung bình
Mô hìnhdự đoán : l
n l
yˆ ( ) với l =1,2,3 n là tầm dự đoán với 1
yn: mức độ cuối cùng của dãy số thời gian
y1 :Mức độ đầu tiên của dãy số
y y
k n
sse
Trong đó k :Là số lợng các tham số trong mô hình
n :số trờng hợp nghiên cứu
1 0
x b x b xy
t b nb y
Trong đó :y là tiêu thức chỉ kết quả
x là số thứ tự theo thời gian
3 Dự đoán dựa vào phơng pháp san bằng mũ
Khi xây dựng mô hình dự đoán thì các mức độ của dãy số thời gian
đ-ợc xem nh nhau nghĩa là có cùng quyền số trong quá trình tính toán Do vậy
để mô hình không cứng nhắc kém nhạy bén với sự biến động của hiện tợng
đòi hỏi khi xây dựng mô hình dự đoán ,các mức độ thời gian phải xem xétmột cách không nh nhau ,các mức độ mới càng phải chú ý nhiều : Phơngpháp san bằng mũ là phơng pháp đơn giản để xây dựng loại mô hình dự
đoán
3.1 Mô hình dự đoán đơn giản
Giả sử ở thời gian t có : Mức độ thực tế của hiện tợng là yt
Mức độ dự đoán là yˆ t
Dự đoán ở thời gian t+1 : Mức dự đoán yˆt1 y t yˆt (1)
, đợc gọi là các tham số san bằng với 1 và nằm trongkhoảng [ 0;1]
yˆt1 là trung bình cộng gia quyền
ˆt y t y t y t y t
Trang 9
0 ˆ
.
0 1 1
n i i t
Nh vậy dự đoán mức độ hiện tợng ở thời gian t+1 nó chính là tổng tấtcả các mức độ của dãy số thời gian đợc tính theo quyền số Mà trong đó cácquyền số giảm dần theo dạng mũ tuỳ thuộc vào mức độ cũ của các mức độtrong dãy số thời gian
Từ biểu thức : yˆt1 y t yˆt có thể đợc viết nh sau ;
y0 có thể lấy mức độ đầu tiên trong dãy số ,hoặc có thể đợc xác địnhbằng trung bình cộng giản đơn Tuy nhiên dù chọn y0 nh thế nào thì quamột số bớc tính toán sẽ hội tụ về cho kết quả giống nhau ( hoặc không khácnhau là mấy )
3.2 Mô hình tuyến tính không biến động thời vụ
Để xác định đợc mô hình thời vụ ,trớc tiên phải xác định đợc điều kiệnban đầu
) 0 ( ) 0 (
1 0
a a
a0(0) : Dùng mức độ đầu tiên trong dãy số
a1(0) :Dùng lợng tăng giảm tuyệt đối trung bình để xác định Ta có
3.3 Mô hình tuyến tính kết hợp với biến động thời vụ
3.3.1.Mô hình tuyến tính kết hợp cộng với biến động thời vụ
Mô hình :yˆt1a0 (t) a1 (t) s t1
Với:a0(t) y t s tk ( 1 )a0(t 1 ) a1(t 1 )
Trang 10điều kiện ban đầu: a0(o)là mức độ đầu tiên trong dãy số ( a0(0)=y1)
a1(0) là lợng tăng giảm tuyệt đối trung bình
k là thời gian tính ( k=4đối với tài liệu quý ,k=12 đối với tài liệutháng )
a s
y t
a
k t
4.Dự đoán dựa vào mô hình tuyến tính ngẫu nhiên
Một quả tình ngẫu nhiên là một tập hợp các biến ngẫu nhiên xuấthiện qua thời gian theo một quy luật xác xuất nào đó Một quá trình ngẫunhiên đợc gọi là dừng nếu quy luật phân phối của Y tk,Y t k, ,Y t nk
2
là quy luật phân phối của Y t ,Y t , ,Y t n
2 1
Việc phân tích những đặc của một quá trình ngẫu nhiên chủ yếu dựavào hàm tự hiệp phơng sai ,hàm tự tơng quan
Giả sử có quá trình nhẫu nhiên dừng ; Y t ,Y t , ,Y t n
2 1
k t t k
Y Var Y Var
Y Y Cov
Trang 11Trong thực tế ,ta chỉ có dãy số thời gian y1,y2, ,yn.Do đó ta phải ớc ợng k và k qua Ck và rk đợc tính từ dãy này
k t t
t y y n
Để mô tả ta thờng dùng các toán tử sau đây để mô tả :
B: toán tử chuyển dịch về phía trớc
a t
t
a a Cov
a Var a E
Trang 122 1 1 1
2 1 2 2
Trang 134.1.2M« h×nh trung b×nh trît bËc q –kÝ hiÖu AR(p) kÝ hiÖu MA(q)
Z t a t 1a t1 2a t2 q a tq
q q
0
, 3 , 2 , 1 _
1
2 2
2
2 2 1 1
q voik
q víik
q q k q k
k k
0
1 _
2 1 1 1
) 1 (
2 2
t t p t p t
Trang 144.2.1Mô hình ARIMA (p,d,q)
Trong thực tế ta thờng gặp dãy thời gian tồn tại su thế (có thể tuyếntính hoặc phi tuyến tính )tức là các dãy không dừng Để áp dụng các môhình dừng ta phải khử xu thế đi bằng toán sai phân : d Y t Z t
Thông thờng: lấy sai phân bậc 1 với xu thế tuyến tính (d= 1)
Lấy sai phân bậc 2 với xu thế parabol (d=2)
Lấy sai phân bậc 3 với hàm xu thế bậc 3 ( d=3)
Nh vây ta có :Thay d Y t Z t vào mô hình ARMA(p,q) ta có mô hìnhARIMA(p.d.q)
(B) d Y t (B)a t ARIMA(p,d,q)
p là bậc của toán tử hồi quy
d; là bậc của toán tử sai phân
q; là toán tử của trung bình trợt
Một vài mô hình ; 1, ARIMA(1,1,1) : Y t 1 Y t 1 a t 1a t 1
2,ARIMA(0,1,1): Y t a t 1a t 1
3,ARIMA(0,2,2):Y t a t 1a t 1 2a t 2
4.2.2Mô hình biến động thời vụ –kí hiệu AR(p) kí hiệu SARIMA(p,d,q)
Trong thực tế chúng ta thờng gặp dãy thời gian có biến động thời vụ( thờng là quý và tháng ).Và có xu thế vì vậy để đa về dãy dừng ta phải ápdụng toán tử lùi và toán tử sai phân .và khi đó ta có mô hìnhSARIMA(p,d,q)Để khử biến động thời vụ ta phải thông qua toán tử
Xt= (1-Bs)Yt
s=4 nếu đó là tài liệu quý
s=12 nếu đó là tài liệu tháng
t D s d s p