Đại cương về chuỗi thời gian

Một phần của tài liệu (LUẬN văn THẠC sĩ) cơ sở dữ liệu ngoại suy và ứng dụng luận văn ths công nghệ thông tin 1 01 10 (Trang 38 - 41)

Chương 2: MỘT SỐ PHƯƠNG NGOẠI SUY DỮ LIỆU

3. Ngoại suy dữ liệu dựa trên phân tích chuỗi thời gian

3.1. Đại cương về chuỗi thời gian

Chương này trình bày một số ý tưởng cơ bản của bài toán phân tích chuỗi thời gian. Trong bài toán đó, khái niệm về tính dừng, về hệ số tương quan có vai trò đặc biệt quan trọng. Chúng ta cũng tóm tắt luợc qua một vài nét về các kỹ thuật cơ bản ước lượng, và loại bỏ đường xu thế cũng như tính chất theo mùa, từ một chuỗi thời gian quan sát đƣợc.

3.1.1. Khái niệm chuỗi thời gian [6]

Mục tiêu của việc phân tích kinh tế thể nghiệm chỉ ra cơ chế kiểm soát và đƣa ra quyết sách. Vì vậy ta đòi hỏi có một số lƣợng lớn các quan sát cho các đại lƣợng thích hợp, để nghiên cứu các mối quan hệ giữa các đại lƣợng này. Các quan sát này, có thể đƣợc tiến hành đều đặn qua các thời kỳ chẳng hạn: theo từng ngày, từng tuần, từng tháng, từng quý hoặc từng năm. Dãy các quan sát này gọi là chuỗi thời gian. Nhƣ vậy chuỗi thời gian là tập hợp các quan sát,đƣợc ghi nhận tại thời điểm t với tT. Chuỗi thời gian đƣợc gọi là rời rạc nếu T là tập các điểm rời rạc (Thí dụ các quan sát đƣợc thực hiện cách nhau một khoảng thời gian đều đặn, nhƣ doanh thu cước phí điện thoại hàng tháng, của một trạm bưu điện từ tháng 1 năm 1990 đến tháng 12 năm 2000). Ngƣợc lại nếu T là một khoảng thì chuỗi thời gian là liên tục. Biểu đồ ghi nhịp tim của một bệnh nhân trong 3 giờ là một ví dụ minh họa cho chuỗi thời gian liên tục với T=[0,3].

TIEU LUAN MOI download : skknchat@gmail.com

(LUAN.van.THAC.si).co.so.du.lieu.ngoai.suy.va.ung.dung.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).co.so.du.lieu.ngoai.suy.va.ung.dung.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).co.so.du.lieu.ngoai.suy.va.ung.dung.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).co.so.du.lieu.ngoai.suy.va.ung.dung.luan.van.ths.cong.nghe.thong.tin.1.01.10

3.1.2. Mục tiêu của việc phân tích chuỗi thời gian

Tất cả các kỹ thuật ngoại suy theo chuỗi thời gian dựa trên giả định, là có một mẫu hình cơ bản tiềm ẩn trong các số liệu nghiên cứu cùng với các yếu tố ngẫu nhiên ảnh hưởng lên hệ thống đang xét. Công việc của phân tích chuỗi thời gian là nghiên cứu ký thuật để tách mẫu hình cơ bản này và sử dụng nó nhƣ là cơ sở để sản sinh ra dữ liệu ngoại suy cho tương lai. [1]

Vấn đề là phần lớn các chuỗi thời gian trong cuộc sống thực tại là rất phức tạp, nên các kỹ thuật đơn giản như làm trơn số liệu… ở các phần trước là không thể áp dụng được trong trường hợp này. (kỹ thuật làm trơn số liệu chỉ phù hợp với chuỗi có độ thăng giáng không lớn lắm). Vì vậy chương này dành cho việc đề xuất phương pháp Box- Jenkins để sản sinh dữ liệu ngoại suy với các chuỗi thời gian có độ phức tạp cao hơn. Kỹ thuật này rất phù hợp cho công việc sản sinh các dữ liệu ngoại suy dựa trên chuỗi thời gian, mặc dù nó tương đối phức tạp về phương diện toán học và yêu cầu phải có nhiều số liệu. Trên thực tế nó đòi hỏi ít nhất 50 số liệu và thông thường tốt nhất là có khoảng 100 số liệu mới có thể nhận dạng chính xác mô hình.

Kỹ thuật sản sinh dữ liệu ngoại suy Box- Jenkins đƣợc đề xuất bởi George Box và Gwin Jenkins năm 1970, song thường được gọi là phương pháp dự báo các quá trình tự hồi quy trung bình trƣợt ARMA (ARMA là AutoRegressive Moving Average). [2]

Để làm được điều đó, trước hết ta giả thiết có một mô hình xác suất để biểu diễn dãy số liệu. Sau cùng hy vọng chọn ra một mô hình gần với dãy số liệu, chúng ta tiến hành ƣớc lƣợng các tham số của mô hình, kiểm tra lại xem mô hình đƣợc sử dụng có phù hợp không.

Ngoại suy dữ liệu dựa trên mô hình chuỗi thời gian là ƣớc lƣợng các giá trị tương lai Z~t của một biến ngẫu nhiên dựa trên các giá trị quan sát trong quá khứ của nó y1,y2,...,yt. Giá trị ngoại suy của yth thương được ký hiệu là yˆt(h).

Chất lượng của giá trị ngoại suy phụ thuộc vào nhiều yếu tố. Trước hết nó phụ thuộc vào xu hướng phát triển của chuỗi thời gian. Nếu chuỗi thời gian là hàm

“đều đặn” theo thời gian thì càng dễ xác định giá trị ngoại suy. Thí dụ nếu tiến trình phát triển kinh tế không có những biến động đặc biệt thì càng dễ dàng đánh giá tổng sản phẩm quốc nội (GDP) cho những năm tiếp theo. Cho đến nay, các phương pháp ngoại suy dựa trên chuỗi thời gian chƣa cho phép đánh giá ƣớc lƣợng đƣợc các giá trị đột biến. Chất lƣợng của ngoại suy dựa vào chuỗi thời gian còn phụ thuộc vào độ

TIEU LUAN MOI download : skknchat@gmail.com

(LUAN.van.THAC.si).co.so.du.lieu.ngoai.suy.va.ung.dung.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).co.so.du.lieu.ngoai.suy.va.ung.dung.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).co.so.du.lieu.ngoai.suy.va.ung.dung.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).co.so.du.lieu.ngoai.suy.va.ung.dung.luan.van.ths.cong.nghe.thong.tin.1.01.10

xa gần của thời gian. Các giá trị ngoại suy càng gần hiện tại thì độ chính xác càng cao. Nhƣ vậy việc ƣớc lƣợng GDP cho năm sẽ chính xác hơn việc ƣớc lƣợng GDP cho 10 năm sau. [7]

Ngoài ra, phương pháp ngoại suy cũng đóng vai trò hết sức quan trọng. Nếu chúng ta sử dụng phương pháp ngoại suy tốt, thì giá trị ngoại suy càng đáng tin cậy.

a) Tách các xu thế

Trong các chu kỳ tăng trưởng, nhiều chuỗi thời gian có sự tiến triển trung hạn tương tự nhau. Sự tiến triển trung hạn này được gọi là xu thế. Như vậy, nếu tồn tại một xu thế trong chuỗi thời gian thì ta nên tách nó ra để dể dàng cho việc xử lý các số liệu còn lại. [6]

b) Hiệu chỉnh theo mùa

Có lẽ chẳng cần nghiên cứu nhiều cũng biết hàng năm cứ đến mùa đông thì quần áo rét bán chạy hơn mùa hè. Cũng nhƣ vậy đối với hiện tƣợng khí tƣợng nhƣ mây mƣa, bão lụt cũng nhƣ các vấn đề kinh tế khác. Thí dụ nhƣ lƣợng hành khách tàu thống nhất tăng đột biến vào dịp tết nguyên đán. Ta gọi tình thế đó là hiện tƣợng theo mùa. Chuỗi thời gian sau khi loại bỏ xu hướng theo mùa trong chuỗi thời gian gọi là “chuỗi đƣợc hiệu chỉnh theo mùa”. [10]

Có nhiều phương pháp khác nhau để hiệu chỉnh một chuỗi thời gian theo mùa. Tuy nhiên bất cứ một phương pháp nào cũng đòi hỏi có các tính chất sau: nếu ta ký hiệu zSA là chuỗi hiệu chỉnh theo mùa của chuỗi (zt) thì

i) xSAySA (xy)SA,x,y ii) xSA (x)SA;x,R iii) xSAySA (xy)SA,x,y c) Phát hiện các thời điểm đột biến

Có thể do khủng hoảng kinh tế chính trị hay chiến tranh mà chiều hướng phát triển kinh tế có thể thay đổi mạnh mẽ, ở những thời điểm nào đó về xu thế cũng nhƣ mức độ. Rõ ràng rằng, việc phát hiện ra những điểm đột biến này càng sớm càng tốt, là một việc quan trọng trong việc ngoại suy chuỗi thời gian. [9]

TIEU LUAN MOI download : skknchat@gmail.com

(LUAN.van.THAC.si).co.so.du.lieu.ngoai.suy.va.ung.dung.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).co.so.du.lieu.ngoai.suy.va.ung.dung.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).co.so.du.lieu.ngoai.suy.va.ung.dung.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).co.so.du.lieu.ngoai.suy.va.ung.dung.luan.van.ths.cong.nghe.thong.tin.1.01.10

Một phần của tài liệu (LUẬN văn THẠC sĩ) cơ sở dữ liệu ngoại suy và ứng dụng luận văn ths công nghệ thông tin 1 01 10 (Trang 38 - 41)

Tải bản đầy đủ (PDF)

(76 trang)