Phơng pháp ngoại suy
Giới thiệu phơng pháp
Ngoại suy dự báo có nghĩa là nghiên cứu lịch sử của đối tợng và chuyển tính quy luật của nó đã phát hiện đợc trong quá khứ và hiện tại sang tơng lai bằng các phơng pháp xử lý dữ liệu chuỗi thời gian.
Theo ý nghĩa toán học thì phơng pháp ngoại suy chính là việc phát hiện xu thế vận động của đối tợng, khả năng tuân theo một quy luật hàm số f(t), để dựa vào đó dự báo giá trị của đối tợng ở ngoài khoảng giá trị đã biết.
2.1.2 Dữ liệu chuỗi thời gian
Việc nghiên cứu lịch sử là nghiên cứu quá trình thay đổi và phát triển của đối tợng dự báo theo thời gian Kết quả thu thập thông tin một cách liên tục theo một đặc trng nào đó về sự vận động của đối tợng thì hình thành một chuỗi thời gian.
Nếu quá trình ngẫu nhiên là một chuỗi các đại lợng ngẫu nhiên, khi ta quan sát kết quả của n phép thử theo một đặc trng nào đó thì chuỗi thời gian chính là một quá trình ngẫu nhiên. Điều kiện dữ liệu chuỗi thời gian:
- Khoảng cách giữa các thời điểm của chuỗi thời gian phải bằng nhau, tức là phải đảm bảo tính liên tục nhằm phục vụ cho việc xử lý.
- Đơn vị đo giá trị chuỗi thời gian phải đồng nhất.
Ngoại suy cho ta thông tin tơng lai của đối tợng dựa trên cơ sở chuỗi thời gian nhằm tìm ra xu thế của nó Việc sử dụng ngoại suy trong dự báo dựa trên giả định: quá trình thay đổi của đối tợng theo thời gian là sự kết hợp các thành phần xu thế và thành phần ngẫu nhiên Điều này dựa trên cơ sở toán học sau:
- Bản chất của dữ liệu chuỗi thời gian là một qúa trình ngẫu nhiên.
- Quá trình ngẫu nhiên đợc mô tả bằng hàm ngẫu nhiên với sự tham gia của hai đại lợng:
+ Kỳ vọng: với nghĩa là hàm trung bình của hàm ngẫu nhiên mà những thực hiện ngẫu nhiên xoay quanh nó - f(t).
+ Phơng sai: với nghĩa đại diện cho sự phân tán của hàm ngẫu nhiên so với hàm trung bình - ε( t )
Khi đó, f(t) là thành phần xu thế cần xác định của đối tợng dự báo, nó nói lên ảnh hởng của các nhân tố tác động thờng xuyên trong một thời gian dài. ε( t ) là thành phần ngẫu nhiên biểu hiện những sai lệch so với thành phần xu thế, đây chính là tác động ngẫu nhiên của các nhân tố ngẫu nhiên đối với đối tợng dự báo.
Trên cơ sở đó, ta hoàn toàn có thể dự báo theo công thức:
1 Đối tợng phải phát triển tơng đối ổn định theo thời gian.
2 Những nhân tố ảnh hởng chung nhất cho sự phát triển của đối tợng đ- ợc duy trì trong khoảng thời gian dự báo.
3 Không sảy ra những đột biến trong quá trình phát triển của đối tợng.
Nội dung phơng pháp
Phơng pháp dự báo ngoại suy dựa trên dữ liệu chuỗi thời gian là một quá trình gồm nhiều giai đoạn quan trọng:
+ Xử lý dữ liệu chuỗi thời gian
+ Phát hiện xu thế đối tợng
+ Xây dựng hàm xu thế
+ Kiểm định hàm xu thế và dự báo bằng hàm xu thế đã kiểm định.
2.2.1 Xử lý dữ liệu chuỗi thời gian
Chuỗi thời gian với các điều kiện của nó cần thiết đợc xử lý sơ bộ cho hoàn chỉnh Các trờng hợp xảy ra: a Nếu chuỗi thiếu một giá trị y i nào đó
Lúc này ta xác định giá trị yi bổ sung bằng trung bình cộng hai giá trị đứng trớc và đứng sau nó: y i bs = y i−1 + y i+1
2 b Xử lý dao động ngẫu nhiên
Việc phát hiện ngay đợc hàm xu thế f(t) khi căn cứ vào chuỗi thời gian ban đầu là không dễ Đối với chuỗi có dao động lớn do ảnh hởng của các yếu tố ngẫu nhiên thì phải sử dụng các phơng pháp làm trơn chuỗi thời gian với mục đích tạo ra một chuỗi thời gian mới có xu hớng dao động ổn định hơn, dĩ nhiên chuỗi thời gian tìm đợc chắc chắn vẫn giữ nguyên xu thế từ chuỗi thời gian.
Việc chuyển từ yi sang y t đợc xác định thông qua hai phơng pháp san cơ bản sau:
* Trung bình trợt không có trọng số:
Phạm vi: áp dụng cho các chuỗi số có khả năng tuân theo xu hớng đờng thẳng (hàm tuyến tính bậc 1).
Trong đó: m=2p+1 là khoảng trợt yi :giá trị chuỗi thời gian ban đầu vào thời điểm thứ i y t :giá trị chuỗi thời gian đợc san vào thời điểm t
* Ví dụ 2.1: Có chuỗi thời gian về mức tiêu thụ sản phẩm x qua các năm(Bảng 2.1)
* Trung bình trợt có trọng số:
- Phạm vi: áp dụng cho các chuỗi có xu hớng là đờng cong (xu thế phi tuyÕn)
- Cách xác định: y t của mỗi khoảng trợt đợc mô tả bằng các đa thức bËp p y t =a 0 +∑ i =1 p a i t i
Các ký hiệu (m=2p+1), yi và y t vẫn đợc hiểu nh trong phơng pháp bình quân trợt không có trọng số.
Vấn đề là: làm sao từ đa thức (*) ở trên có thể tìm ra mối quan hệ giữa yi và y t Đối với trờng hợp đầu tiên ta xác định khoảng trợt m=5 thì lúc này: y t =a 0 +a 1 t + a 2 t 2 t ∈ {−2, −1,0,1,2}= { t 1 , t 2 ,t 3 , t 4 , t 5 }
Theo phơng pháp bình phơng cực tiểu ta xác định a0 , a1 , a2 sao cho:
Trong đó: yt là giá trị thực tế của chuỗi thời gian y t i là giá trị lý thuyết của hàm xu thế y t
Lấy đạo hàm của S theo các biến a0, a1, a2 và cho bằng 0
Ta đợc hệ phơng trình:
Mặt khác dễ thấy y 0 =a 0 Đánh số lại t1=ti-2 , t2=ti-1 , t3=ti , t4=ti+1 , t5=ti+2
Thay giá trị của t i ∈ { t i−2 ,t i−1 ,t i ,t i +1 ,t i+ 2 } vào (4) ta đợc: y t i =a 0 = 1
(5) Đây là công thức tổng quát để tính giá trị y t i
Ví dụ 2.2: Sản lợng một loại hoa màu ở đồng bằng Bắc Bộ, số liệu trớc và sau khi san theo phơng pháp trung bình trợt có trọng số: (Bảng 2.2)
Năm yi(tạ/ha) Trung bình trợt m=5
2.2.2 Phát hiện hàm xu thế Đây là giai đoạn quan trọng, mang tính quyết định đối với kết quả dự báo bằng phơng pháp ngoại suy Qua việc phân tích những nét chung nhất của chuỗi số liệu ta có thể phát hiện ra xu thế và hàm xu thế của đối tợng Có nhiều phơng pháp phát hiện xu thế và chọn dạng hàm xu thế tơng ứng, sau đây ta xét các phơng pháp tiêu biểu đang đợc áp dụng rộng rãi. a Phơng pháp đồ thị
Nội dung: Biểu diễn các cặp số(ti,yi) lên hệ trục toạ độ, sau đó nối liền các điểm trên hệ trục thành một đờng gẫy khúc liên tục, từ đó so sánh đờng biểu diễn thực nghiệm với đờng biểu diễn các hàm số y=f(t) thờng gặp làm xác định xu thế và dạng hàm xu thế tơng ứng.
Các dạng hàm f(t) thờng gặp trong kinh tế:
Việc lựa chọn hàm xu thế theo phơng pháp đồ thị phụ thuộc vào kinh nghiệm của ngời nghiên cứu, do đó rủi ro gặp phải là rất lớn. b Phơng pháp phân tích số liệu quan sát
Nội dung: So sánh dữ liệu của đối tợng với một số dạng hàm cơ bản, từ đó tìm ra dạng hàm xu thế thích hợp.
3 Dạng ^y t =a 0 t a 1 điều kiện ln t i ≈ ln t i−1 + ln t i+1
Nội dung: Phơng pháp này dựa trên cơ sở sự xấp xỉ giữa sai phân chuỗi thời gian và vi phân hàm xu thế ở cùng bậc k nào đó ( Δ y k ≈d k y ) Do đó, chúng ta có thể lấy sai phân bậc k của chuỗi thời gian, nếu dừng lại ở bậc sai phân nào đó mà các giá trị sai phân đều có xu hớng tiến về hằng số thì kết luận có khả năng thích hợp với dạng hàm xu thế.
Sai phân chuỗi thời gian đợc định nghĩa nh sau:
Vi phân các hàm số dạng:
Hàm ^y dy/dt dy2/dt dy3/dt
Phơng pháp này chỉ áp dụng cho các hàm đa thức có dạng tổng quát là: y=a 0 +∑ a i t i riêng các hàm phi tuyến khác sẽ không có giá trị vì khi càng nâng cao bậc vi phân thì càng trở nên phức tạp và không có cơ sở so sánh với sai phân tơng ứng.
2.2.3 Xây dựng hàm xu thế
Khi phát hiện ra các khả năng về dạng hàm xu thế, vấn đề kế tiếp phải mô tả chuỗi thời gian thông qua các dạng hàm xu thế cụ thể với điều kiện xác định những tham số ai của nó với những giá trị bằng số cụ thể Thờng áp dụng các phơng pháp sau: a Phơng pháp điểm chọn Đây là một phơng pháp đơn giản xác định đợc các tham số ai ở mức độ xấp xỉ, tuy nhiên nó có nhợc điểm là lãng phí thông tin và tuỳ thuộc vào cách chọn các điểm chọn mà ta có các bộ tham số ai khác nhau.
Nội dung: phơng pháp này giả định dạng hàm lý thuyết đã chọn ở bớc phát hiện xu thế, chọn các cặp số(ti,yi).
- Khoảng cách giữa các điểm đợc chọn bằng nhau
- Tổng số các điểm chọn bằng tổng số các tham số ai
- Do yêu cầu về độ chính xác cần chọn những điểm thực nghiệm, mà đ- ờng biểu diễn của hàm xu thế có khả năng đi qua cao nhất.
* Ví dụ 2.3: có chuỗi thời gian (Bảng 2.4):
0 Giả sử ở giai đoạn phát hiện xu thế ta kết luận hàm xu thế có dạng:
^ y=a 0 + a 1 t +a 2 t 2 Bằng phơng pháp điểm chọn xác định các tham số ai
Ta đợc hệ phơng trình: t=4 ,a 0 +4a 1 +16a 2 ¿ } t=8,a 0 +8a 1 +64a 2 X ¿ } ¿¿¿ ⇒¿ { a 0 =2,0 ¿ { a 1 =−1,0 ¿¿¿
Vậy hàm xu thế đợc mô tả cho chuỗi thời gian có dạng:
^ y =2 −t +t 2 b Phơng pháp tổng bình phơng bé nhất
Là một trong những phơng pháp đợc ứng dụng rộng rãi nhất để xác định các tham số của hàm xu thế, mức độ chính xác của nó thể hiện ở chỗ là tổng bình phơng độ lệch giữa giá trị lý thuyết hàm xu thế và giá trị thực tế của chuỗi thời gian là nhỏ nhất.
( y i − ^y) 2 →minTrong đó: n: Độ dài của chuỗi thời gian. yi: giá trị thực tế của chuỗi thời gian.
^ y : giá trị lý thuyết của hàm xu thế.
Theo lý thuyết, để S → min ta lấy đạo hàm bậc nhất của S theo các tham số ai sau đó cho các biểu thức bằng 0 và giải hệ phơng trình vừa tạo ra, ta thu đợc các nghiệm là các tham số ai Cụ thể:
Nếu hàm xu thế có dạng hàm bậc nhất: ^ y= a 0 + a 1 t
(1.1) Lấy đạo hàm bậc nhất (1.1) và cho các biểu thức bằng 0 ta đợc:
Giải hệ trên ta thu đợc 2 nghiệm là giá trị của a0 và a1.
Nếu hàm xu thế có dạng bậc 2: ^ y= a 0 + a 1 t + a 2 t 2
(1.2) Lấy đạo hàm bậc nhất (1.2) và cho các biểu thức bằng 0 ta đợc:
Giải hệ phơng trình trên ta thu đợc các nghiệm là giá trị của các tham số a0, a1, a2.
Tổng quát: hàm xu thế có dạng:
S=∑ ( y i −a 0 −∑ i =1 p a i t i ) 2 →min Lấy đạo hàm bậc nhất và cho các biểu thức bằng 0 ta đợc:
Giải hệ phơng trình trên ta thu đợc các giá trị của các tham số ai
Nhận xét: Phơng pháp tổng bình phơng bé nhất tạo ra các tham số ai với độ chính xác cao hơn nhiều so với các phơng pháp khác.
Phơng pháp này chỉ áp dụng cho các dạng hàm
, nÕu muốn áp dụng cho các dạng hàm phi tuyến thì trớc tiên phải tuyến tính hoá chóng.
Trong quá trình giải hệ phơng trình tìm tham số ai của hàm xu thế, để đơn giản và rút gọn quá trình tính toán ta có thể thiết kế một quy luật ti sao cho: ∑ t i chon n = 0
+ Nếu n là số chẵn, ta chọn t chọn nh sau:
+ Nếu n là số lẻ, ta chọn t chọn nh sau:
Nhợc điểm của phơng pháp:
Trong trờng hợp các tham số của hàm xu thế phải thay đổi theo thời gian cho phù hợp với xu thế của đối tợng, thì việc áp dụng phơng pháp tổng bình phơng bé nhất có thể dẫn đến sai lầm cho kết quả dự báo.
Ví dụ2.4: Giả sử số lợng sản phẩm bán đợc của một doanh nghiệp trong
10 tuần đầu có hàm xu thế là: y = 1500 + 10.t Sau khi đa ra chiến dịch tiếp thị hợp lý, số lợng sản phẩm bán đợc ngày càng tăng lên Khi đó nếu vẫn áp dụng hàm xu thế ban đầu thì sẽ dự báo sai số lợng sản phẩm bán đợc trong các tuần tiếp theo, thay vào đó có thể sử dụng hàm xu thế sau: y = 1550 + 20.t để thu đợc kết quả dự báo chính xác hơn.
2.2.4 Kiểm định hàm xu thế và dự báo a Kiểm định hàm xu thế
Do ở bớc phát hiện hàm xu thế, hàm phát hiện đợc chỉ mang tính chất khả năng, vì vậy cần phải tiến hành kiểm định nhằm đánh giá lựa chọn hàm xu thÕ tèi u.
*) Các tiêu chí kiểm định:
^ y : giá trị lý thuyết hàm xu thế n: số mức độ của chuỗi
*) Giới hạn lựa chọn hàm xu thế
- Nếu Vy >10% thì hàm xu thế không đợc sử dụng cho dự báo.
- Nếu Vy ¿ 10% thì hàm xu thế đợc sử dụng cho dự báo b Dự báo bằng hàm xu thế đã kiểm định
Khoảng cách dự báo l : để đảm báo tính chính xác ta chỉ lấy khoảng l sao cho: l max ≤ n
Dự báo với khoảng cách dự báo l đợc xác định nh sau:
Là dự báo rơi vào khoảng nhất định với xác suất cho trớc
Trong đó: t α là giá trị của bảng phân phối Student vói (n-p) bậc tự do, và độ tin cậy là ( 1−α )
S l là sai số dự báo, S l đợc tính nh sau:
1 Nếu xu thế là hàm tuyến tính bậc nhất:
S l =S y √ 1+ 1 n + 3 ( n n+2 ( n 2 −1 l−1 ) ) 2 với sai số tuyệt đối S y = √ ∑ ( ^ n−2 y− y ) 2
2 Nếu xu thế là hàm bậc 2, bậc 3:
S l =S y √ 1 +T l ( T − 1 ) T l ' với S y đợc tính nh trên.
T l là vectơ dòng các giá trị luỹ thừa của t tại thời điểm n+l.
T -1 là ma trận nghịch đảo của ma trận hệ phơng trình chuẩn.
Ví dụ áp dụng
Ví dụ 2.5: Ta có số liệu về số lợng dân số trên thế giới (theo Tạp Chí Bu
Chính Viễn Thông kỳ1(2-2003)) (Bảng 2.5)
(triệu ngời) Năm Dân số thế giới
(triệu ngời) Năm Dân số thế giới
Sau khi san chuỗi thời gian bằng phơng pháp trung bình trợt có trọng số ta thu đợc bảng số liệu: (Bảng 2.6) y i =−0 , 0857 y i−2 + 0 , 3429 y i−1 +0 , 4857 y i +0 ,3429 y i+ 1 −0 , 0857 y i+2
N¨m DL gèc DL san N¨m DL gèc DL san
Trong giai đoạn phát hiện hàm xu thế, ta xác định hàm xu thế có dạng hàm Parabol: y = a0 + a1t + a2t 2
Bằng phơng pháp tổng bình phơng bé nhất ta xác định đợc các hệ số a0, a1, a2 : a0=2,5089; a1=0,0513; a2=0,0004
Vậy hàm xu thế đợc mô tả cho chuỗi thời gian có dạng:
Dựa vào hàm xu thế, dự báo dân số thế giới đến năm 2010 ta đợc (bảng 2.7)
Năm DL gốc Dự báo Sai số Năm DL gốc Dự báo Sai số
Nh vậy sai số khá nhỏ nên chấp thuận dự báo trên.
Giả sử ta có bảng số liệu về số lợng một loại sản phẩm mới X bán đợc trong mỗi tuần sau khi sản phẩm đó đợc chào hàng: (Bảng 2.8)
Số lợng (trăm chiếc) Tuần Số lợng
San chuỗi số liệu trên theo phơng pháp trung bình trợt không trọng số với khoảng trợt m=3 ta đợc: (Bảng 2.9)
TuÇn DL gèc San TuÇn DL gèc San TuÇn DL gèc San
Xác định đợc chuỗi thời gian trên có xu hớng tuyến tính, nên hàm xu thế có dạng: y = a0 + a1t
Bằng phơng pháp tổng bình phơng bé nhất, ta xác định các hệ số: a0 7,392 ; a1= 0,497 Nên hàm xu thế thu đợc là: yt = 7,392+ 0,497t
Xử dụng hàm xu thế dự báo số lợng sản phẩm bán đợc trong 5 tuần tiếp theo, ta thu đợc kết quả sau: (Bảng 2.10)
Tuần DL gốc Dự báo Sai số Tuần DL gốc Dự báo Sai số
Do Vy < 10% nên chấp nhận dự báo trên.
Phơng pháp san bằng hàm mũ
Giới thiệu phơng pháp
Đây là phơng pháp đợc dùng khá nhiều và hữu hiệu trong công tác dự báo trên thế giới Về thực chất, dự báo bằng phơng pháp san bằng hàm mũ cũng nằm trong nhóm phơng pháp dự báo ngoại suy theo số liệu chuỗi thời gian, nhng cơ sở phơng pháp luận có khác Nếu trong khoảng thời gian nghiên cứu các tham số của hàm xu thế không thay đổi, thì để xây dựng hàm xu thế ta áp dụng phơng pháp tổng bình phơng bé nhất Tuy nhiên, thờng sảy ra trờng hợp quá trình phân tích các tham số đó có sự thay đổi Khi đó áp dụng ph ơng pháp tổng bình phơng bé nhất để xây dựng hàm xu thế sẽ dẫn đến sai lầm. Nếu nh trong phơng pháp dự báo ngoại suy mô hình xu thế có dạng biểu thức giải tích, coi giá trị thông tin của mọi mức độ trong dãy là nh nhau, thì trong phơng pháp san bằng hàm mũ, lại coi giá trị thông tin của mỗi mức độ là tăng dần từ đầu dãy đến thời điểm nghiên cứu Nh vậy, mức độ càng xa thời điểm nghiên cứu thì càng ít giá trị thông tin, do đó càng ít ảnh hởng đến kết quả dự báo, mức độ ngay trớc thời điểm dự báo có giá trị thông tin cao nhất. Để đạt đợc điều này, ta sử dụng hệ thống quyền số, cho phép gia quyền lớn hơn đối với mức độ ở gần hơn thời điểm nghiên cứu Sau đó áp dụng hệ thống các công thức truy toán để tiến hành dự báo cho tơng lai Đồng thời, cứ mỗi khi có một thông tin mới thì mô hình dự báo lại thay đổi nhằm thích nghi với tình hình thực tế mới, thông tin mới lại là những thông tin có giá trị cao nhất so với các thông tin cũ.
nội dung phơng pháp
Gán cho mỗi quan sát một trọng số sao cho những quan sát sau có trọng số lớn hơn quan sát trớc nó.
Giả sử chuỗi thời gian {yt }đợc biểu diễn dới dạng đa thức bậc p: y t =a 0 +a 1 t + a 2
(1) Bài toán đặt ra: dự báo giá trị yt+l với yêu cầu gắn cho mỗi quan sát trong chuỗi {yt }một trọng số sao cho những quan sát sau có trọng số lớn hơn quan sát trớc.
Ta xét dự báo các mức của chuỗi{yt} tại thời điểm (n+l), bằng cách khai triển thành chuỗi Taylo: y n+l = y t 0 +ly t ( 1) + l 2
3! y t (3 ) + + l k k ! y ( t k ) + .+ l p p ! y ( t p ) trong đó: yt (k) là đạo hàm cấp k tại thì điểm t.
Ngời ta dã chứng minh đợc rằng bất kỳ một đạo hàm cấp k nào của (1) cũng có thể biểu diễn dới dạng tổ hợp tuyến tính của các trung bình mũ đến bËc (p+1).
Trung bình mũ bậc 1 tại thời điểm t đối với chuỗi {yt} là:
S t : là số trung bình mũ tại thời điểm t.
: là số trung bình mũ tại thời điểm t-1. y t
: là mức độ của dãy số thời gian tại thời điểm t. α : là tham số san bằng ( α =const, 0< α