Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 20 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
20
Dung lượng
475,42 KB
Nội dung
ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN - NGUYỄN THỊ KIM LOAN MÔ HÌNH CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO CHUỖI THỜI GIAN LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60.48.01 Giáo viên hướng dẫn: TS NGUYỄN CÔNG ĐIỀU THÁI NGUYÊN - 2009 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn MỤC LỤC MỞ ĐẦU CHƢƠNG CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN Chuỗi thời gian trình ngẫu nhiên 1.1 Khái niệm chuỗi thời gian trình ngẫu nhiên 1.2 Quá trình ngẫu nhiên dừng 1.3 Hàm tự tƣơng quan 1.4 Toán tử tiến, toán tử lùi Quá trình ARMA 2.1 Quá trình tự hồi quy 2.2 Quá trình trung bình trƣợt 11 2.3 Quá trình tự hồi quy trung bình trƣợt 13 Ƣớc lƣợng tham số mô hình ARMA 15 Những hạn chế mô hình ARMA chuỗi thời gian tài 16 CHƢƠNG LÝ THUYẾT TẬP MỜ VÀ CHUỖI THỜI GIAN MỜ 23 Lý thuyết tập mờ 23 1.1 Tập mờ 23 1.2 Các phép toán tập mờ 25 Các quan hệ suy luận xấp xỉ, suy diễn mờ 30 2.1 Quan hệ mờ 30 2.2 Suy luận xấp xỉ suy diễn mờ 31 Hệ mờ 33 3.1 Bộ mờ hoá 33 3.2 Hệ luật mờ 34 3.3 Động suy diễn 35 3.4 Bộ giải mờ 36 3.5 Ví dụ minh hoạ 37 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn CHƢƠNG MỘT SỐ THUẬT TOÁN CƠ BẢN TRONG CHUỖI THỜI GIAN MỜ VÀ MỘT SỐ THUẬT TOÁN CẢI TIẾN 39 Một số khái niệm 39 1.1 Định nghĩa tập mờ chuỗi thời gian mờ 39 1.2 Một số định nghĩa liên quan đến chuỗi thời gian mờ 40 Mô hình số thuật toán dự báo mô hình chuỗi thời gian mờ 41 2.1 Mô hình thuật toán Song Chissom 41 2.2 Mô hình thuật toán Chen 42 2.3 Thuật toán Singh 43 2.4 Mô hình Heuristic cho chuỗi thời gian mờ 45 Ứng dụng dự báo chứng khoán 48 3.1 Bài toán số chứng khoán Đài Loan 48 3.2 Xây dựng chƣơng trình 60 KẾT LUẬN 64 TÀI LIỆU THAM KHẢO 65 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn MỞ ĐẦU Chuỗi thời gian sử dụng công cụ hữu hiệu để phân tích kinh tế, xã hội nghiên cứu khoa học Chính tầm quan trọng phân tích chuỗi thời gian, nhiều tác giả đề xuất công cụ để phân tích chuỗi thời gian Trong năm trước, công cụ chủ yếu để phân tích chuỗi thời gian sử dụng công cụ thống kê hồi qui, phân tích Furie vài công cụ khác Nhưng hiệu có lẽ mô hình ARIMA Box-Jenkins Mô hình cho kết tốt phân tích liệu Tuy nhiên phức tạp thuật toán gây khó khăn ứng dụng phân tích chuỗi số liệu, chuỗi số liệu có thay đổi phản ánh phi tuyến mô hình Để vượt qua khó khăn trên, gần nhiều tác giả sử dụng mô hình chuỗi thời gian mờ Khái niệm tập mờ Zadeh đưa từ năm 1965 ngày tìm ứng dụng nhiều lĩnh vực khác điều khiển trí tuệ nhân tạo Trong lĩnh vực phân tích chuỗi thời gian, Song Chissom đưa khái niệm chuỗi thời gian mờ phụ thuộc vào thời gian không phụ thuộc vào thời gian để dự báo Chen cải tiến đưa phương pháp đơn giản hữu hiệu so với phương pháp Song Chissom Trong phương pháp mình, thay sử dụng phép tính tổ hợp Max- Min phức tạp, Chen tính toán phép tính số học đơn giản để thiết lập mối quan hệ mờ Phương pháp Chen cho hiệu cao mặt sai số dự báo độ phức tạp thuật toán Từ công trình ban đầu chuỗi thời gian mờ xuất năm 1993, mô hình sử dụng để dự báo nhiều lĩnh vực kinh tế hay xã hội lĩnh vực giáo dục để dự báo số sinh viên nhập trường, hay lĩnh vực dự báo thất nghiệp, lĩnh vực dân số, Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn chứng khoán nhiều lĩnh vực khác tiêu thụ điện, hay dự báo nhiệt độ thời tiết… Tuy nhiên xét độ xác dự báo, số thuật toán cho kết chưa cao Để nâng cao độ xác dự báo, số thuật toán cho moo hình chuỗi thời gian mờ liên tiếp đưa Chen sử dụng mô hình bậc cao chuỗi thời gian mờ để tính toán Sah Degtiarev thay dự báo chuỗi thời gian sử dụng chuỗi thời gian hiệu số bậc để nâng cao độ xác Đây phương pháp hay sử dụng mô hình Box-Jenkins để loại bỏ tính không dừng chuỗi thời gian Huarng sử dụng thông tin có trước tính chất chuỗi thời gian mức độ tăng giảm để đưa mô hình heuristic chuỗi thời gian mờ Trong thời gian gần đây, đề tài số tác giả nghiên cứu Các hướng tập trung nâng cao độ xác dự báo mô hình chuỗi thời gian mờ Bài báo I-Hong Kuo tác giả (2008) đưa phương pháp tăng độ xác dự báo tối ưu phần tử đám đông (Particle swarm optimaization) Ching Hsue Cheng đồng tác giả (2008) mở rông nghiên cứu phương pháp kỳ vọng (Exspectation method) Phương pháp lựa chọn mức (Grade Selection Method) thông qua ma trận chuyển dịch có trọng Ngoài có xu hướng sử dụng kết hợp phương pháp khác với chuỗi thời gian mờ phương pháp mạng Nơ ron Cagdas H Aladag (2008) hay Medey Khascay (2008) Ngay nhà nghiên cứu sâu lĩnh vực Huarng mở rộng theo hướng từ năm 2006 Thuật toán di truyền tìm ứng dụng hướng nghiên cứu Năm 2007 có báo Li-Wei Lee sử dụng mối quan hệ mờ thuật toán di truyền để dự báo nhiệt độ số tài Đài Loan Ngoài số tác giả khác tìm thuật toán khác đơn giản để dự báo báo Singh (2007) hay thuật toán dựa vào trend chuỗi thời gian (Baldwin 2000) Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Nghiên cứu dự báo chuỗi thời gian toán gây ý nhà toán học, kinh tế, xã hội học, Các quan sát thực tế thường thu thập dạng chuỗi số liệu Từ chuỗi số liệu người ta rút quy luật trình mô tả thông qua chuỗi số liệu Nhưng ứng dụng quan trọng dự báo khả xảy cho chuỗi số liệu Những thí dụ dẫn báo đưa khả dự báo kinh tế dự báo số chứng khoán, mức tăng dân số, dự báo nhu cầu sử dụng điện, dự báo số lượng sinh viên nhập học trường đại học Các thí dụ dẫn ngành kinh tế kỹ thuật Như trình bày phần trên, có nhiều phương pháp dự báo chuỗi thời gian Thông thường để dự báo, người ta sử dụng công cụ mạnh thống kê mô hình ARIMA Mô hình thích ứng hầu hết cho chuỗi thời gian dừng tuyến tính Trong chương trình xử lý số liệu có phần để dự báo chuỗi thời gian Nhưng chuỗi số liệu phi tuyến, số liệu kinh tế, sử dụng mô hình ARIMA hiệu Chính phải có phương pháp khác để xử lý chuỗi số liệu phi tuyến Đã có nhiều người sử dụng công cụ mạng nơ ron để xử lý tính chất phi tuyên chuỗi số liệu Đây hướng nhiều người tiếp cận có sách chuyên khảo vấn đề thí dụ Mandic Chambers “ Recurrent neural network and prediction” in vào năm 2001 Một hướng khác sử dụng khái niệm mờ để đưa thuật ngữ “ Chuỗi thời gian mờ” Phương pháp sử dụng chuỗi thời gian mờ đưa từ năm 1994 đến tiếp tục nghiên cứu để làm tăng độ xác dự báo Trong đề tài em trình bày phương pháp dự báo số chứng khoán công cụ chuỗi thời gian mờ số tác giả phát triển Tư tưởng phương pháp sử dụng số khái niệm Huarng Chen, Hsu để phát triển thuật toán Dựa thuật toán đề ra, em tính toán toán thực tế dựa liệu lấy từ thị trường chứng khoán Đài Loan để kiểm Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn chứng Kết thu khả quan Độ xác dự báo nâng lên nhiều so với thuật toán trước đề Nội dung luận văn nghiên cứu khái niệm, tính chất thuật toán khác mô hình chuỗi thời gian mờ để dự báo cho số chuỗi số kinh tế xã hội, trình bày chương: Chương 1: trình bày kiến thức chuỗi thời gian Chương 2: trình bày Lý thuyết tập mờ chuỗi thời gian mờ Chương 3: trình bày số thuật toán chuỗi thời gian mờ số thuật toán cải tiến Luận văn hoàn thành hướng dẫn tận tình TS Nguyễn Công Điều, tác giả xin bày tỏ lòng biết ơn chân thành thầy Tác giả xin chân thành cảm ơn thầy giáo Viện công nghệ thông tin, khoa Công nghệ thông tin Đại học Thái Nguyên tham gia giảng dạy giúp đỡ em suốt qúa trình học tập nâng cao trình độ kiến thức Tuy nhiên điều kiện thời gian khả có hạn nên luận văn tránh khỏi thiếu sót Tác giả mong thầy cô giáo bạn đóng góp ý kiến để đề tài hoàn thiện Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn CHƢƠNG CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN Trong phần này, tìm hiểu lớp mô hình chuỗi thời gian thông dụng thực tế Đó mô hình quy trình trượt ARMA(Autoregressive Moving Average) Ta nghiên cứu đặc trưng trình ARMA, xem xét tổng quan phương pháp ước lượng tham số lớp mô hình thấy rõ hạn chế áp dụng vào chuỗi thời gian tài Ngoài ra, mô hình ARMA đóng vai trò quan sở để xây dựng mô hình ARCH sau Chuỗi thời gian trình ngẫu nhiên Trước vào chi tiết tìm hiểu mô hình ARMA, ta nhắc lại số khái niệm liên quan đến chuỗi thời gian trình ngẫu nhiên Dù ta vào chi tiết mô hình khái niệm theo suốt trình nghiên cứu chuỗi thời gian 1.1 Khái niệm chuỗi thời gian trình ngẫu nhiên Một chuỗi thời gian dãy giá trị quan sát X:={x1, x2,……… xn} xếp thứ tự diễn biến thời gian với x1 giá trị quan sát thời điểm đầu tiên, x2 quan sát thời điểm thứ xn quan sát thời điểm thứ n Ví dụ: Các báo cáo tài mà ta thấy ngày báo chí, tivi hay Internet số chứng khoán, tỷ giá tiền tệ, số tăng cường hay số tiêu dùng thể thực tế chuỗi thời gian Bước việc phân tích chuỗi thời gian chọn mô hình toán học phù hợp với tập liệu cho trước X:={x1, x2,……… xn}nào Để nói chất quan sát chưa diễn ra, ta giả thiết quan sát xt giá trị thể biến ngẫu nhiên Xt với tT Ở T gọi tập số Khi ta coi tập liệu X:={x1, x2,……… xn} thể Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn trình ngẫu nhiên Xt, tT Và vậy, ta định nghĩa trình ngẫu nhiên sau Định nghĩa 1.1(Quá trình ngẫu nhiên) Một trình ngẫu nhiên họ biến ngẫu nhiên Xt, tT định nghĩa không gian xác suất(, ,) Chú ý: Trong việc phân tích chuỗi thời gian, tập số T tập thời điểm, ví dụ tập {1,2 } hay tập (-,+) Tất nhiên có trình ngẫu nhiên có T tập R giới hạn luận văn ta xét cho trường hợp TR Và thường ta xem T tập số nguyên, ta sử dụng ký hiệu tập số Z thay T Một điểm ý luận văn dùng thuật ngữ chuỗi thời gian để đồng thời liệu trình có liệu thể 1.2 Quá trình ngẫu nhiên dừng Định nghĩa 1.2 (Hàm tự hiệp phƣơng sai) Giả sử Xt, t Z trình ngẫu nhiên có var(Xt)0 ta phải ước lượng giá trị chưa biết t Thuật toán Hannan – Rissanen Bước 1: Dùng ước lượng Yule Walker để ước lượng tham số mô hình AR(m), với m > max(p,q) X t a X am X t m t , t m 1, , n t 1 Bước 2: Ước lượng vecto tham số (a , , a p , b , bq )t sở cực tiểu 1 hóa hàm Số hóa Trung tâm Học liệu – Đại học Thái Nguyên 15 http://www.lrc-tnu.edu.vn S ( ) n ( xt a x a x a p xt p b bqt q )2 theo t t t t mq1 Giải hệ Gauss-Markov, kết thu dạng sau: (Z t Z ) 1 Z t X n , Ta dùng phương pháp trực giao hóa Househoder để tìm Ở đây, X n (X m1q , , X n ) Và X mq X mq1 X X mq Z mq1 X X n2 n1 X mq mq1 p X mq2 p mq1 X n p n2 n2 mq1 . mq nq S ( ) HR nmq 2 Những hạn chế mô hình ARMA chuỗi thời gian tài Mô hình ARMA thu thành công lớn áp dụng cho chuỗi thời gian xuất phát từ lĩnh vực khoa học tự nhiên kỹ thuật thất bại áp dụng cho chuỗi thời gian kinh tế tài Nguyên nhân giả thiết mặt toán học phương sai chuỗi thời gian tài không thay đổi theo thời gian không phù hợp Và mô hình ARMA dự báo kỳ vọng thất bại dự báo phương sai chuỗi thời gian tài Sau ta xem xét ví dụ cụ thể để thấy rõ không phù hợp mô hình ARMA chuỗi thời gian tài 16 m2 Ước lượng phương sai t theo công thức Số hóa Trung tâm Học liệu – Đại học Thái Nguyên m1 http://www.lrc-tnu.edu.vn Xét chuỗi số chuỗi số liệu NYSE chứa giá trị số chứng khoán giao dịch ngày thị trường NewYork từ tháng ngày 02/01/1990 đến ngày 31/12/2001 Chuỗi gồm 3028 số liệu lưu tên file NYSE.txt Tuy nhiên thay trực tiếp làm việc với chuỗi số liệu gốc, ta lấy logarit tự nhiên chuỗi gốc lấy lại sai phân để chuỗi mà lĩnh vực kinh tế tài ta gọi chuỗi tăng trưởng Từ số liệu trên, chuỗi giá chuỗi tăng trưởng minh họa đồ thị sau Hình 1.1 Chuỗi giá Hình 1.2 Chuỗi tăng trưởng Nhìn vào đồ thị chuỗi giá, rõ ràng ta thấy tính dừng Ngược lại, chuỗi tăng trưởng có đồ thị giống với trình dừng Khi nhìn vào đồ thị chuỗi tăng trưởng ta thấy có xuất cụm biến động, có vùng biến đổi phương sai chuỗi thời gian Tiếp theo ta Số hóa Trung tâm Học liệu – Đại học Thái Nguyên 17 http://www.lrc-tnu.edu.vn [...]... của mô hình ARMA trong chuỗi thời gian tài chính Mô hình ARMA thu được thành công lớn khi áp dụng cho các chuỗi thời gian xuất phát từ các lĩnh vực khoa học tự nhiên và kỹ thuật nhưng thất bại khi áp dụng cho các chuỗi thời gian kinh tế và tài chính Nguyên nhân chính là giả thiết về mặt toán học phương sai của các chuỗi thời gian tài chính không thay đổi theo thời gian là không phù hợp Và vì vậy mô hình. .. hình ARMA có thể dự báo được kỳ vọng nhưng thất bại khi dự báo phương sai của chuỗi thời gian tài chính Sau đây ta sẽ xem xét một ví dụ cụ thể để thấy rõ sự không phù hợp của mô hình ARMA đối với chuỗi thời gian tài chính 16 m2 Ước lượng phương sai t theo công thức Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên m1 http://www.lrc-tnu.edu.vn Xét chuỗi số chuỗi số liệu NYSE chứa... 31/12/2001 Chuỗi gồm 3028 số liệu được lưu dưới tên file là NYSE.txt Tuy nhiên thay vì trực tiếp làm việc với chuỗi số liệu gốc, ta lấy logarit tự nhiên của chuỗi gốc rồi lấy lại sai phân của nó để được một chuỗi mới mà trong lĩnh vực kinh tế tài chính ta gọi là chuỗi tăng trưởng Từ số liệu ở trên, chuỗi giá và chuỗi tăng trưởng được minh họa bằng đồ thị sau Hình 1.1 Chuỗi giá Hình 1.2 Chuỗi tăng trưởng...Chú ý: Trong thực tế, ta chỉ quan sát được một thể hiện hữu hạn X:={xt, t = 1,2,…n}của một chuỗi thời gian đừng nên về nguyên tắc ta không thể biết chính xác được các hàm tự hiệp phương sai của chuỗi thời gian đó, muốn ước lượng nó ta đưa vào khái niệm hàm tự hiệp phương sai mẫu của thể hiện X Hàm tự hiệp... Trong hệ phương trình Jule – Walker, nếu ta đặt pi = ai, i =1,…p thì hệ phương trình Jule – Walker tương đương với ( j ) p1 ( j p), j 1, , p Đại lượng pp ở trên được gọi là tự tương quan riêng cấp p của quá trình {Xt, nó đóng vai trò rất quan trọng trong việc xác định bậc của quá trình tự hồi quy cũng như việc ước lượng tham số mô hình tự hồi quy sau này Trong việc thực tế, khi cho chuỗi. .. đặt với quá trình dừng Yt, t Z Các chuỗi theo B khi đó sẽ có những tính chất cho phép ta xử lý nó tương tự như đối với chuỗi nguyên thông thường Đặc biệt ta có thể thực hiện phép cộng, phép nhân hay phép lấy nghịch đảo Điều này có vai trò quan trọng trong các phép biến đổi của đa thức tự hồi quy, đa thức trung bình trượt và các phép biến đổi xử lý chuỗi thời gian khác 2 Quá trình ARMA 2.1 Quá trình... thị sau Hình 1.1 Chuỗi giá Hình 1.2 Chuỗi tăng trưởng Nhìn vào đồ thị của chuỗi giá, rõ ràng ta thấy nó không có tính dừng Ngược lại, chuỗi tăng trưởng có đồ thị rất giống với một quá trình dừng Khi nhìn vào đồ thị của chuỗi tăng trưởng ta cũng thấy có xuất hiện những cụm biến động, có vùng biến đổi về phương sai của chuỗi thời gian Tiếp theo ta sẽ Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên... http://www.lrc-tnu.edu.vn Lần lượt cho h = 0,1, p trong các chương trình trên và chú ý đến tính chẵn của hàm (h) ta có hệ phương trình tuyến tính đối với (0), , (p) hay với (1), ( p) p (h) ai (h i ), h q i 1 Và vì thế p (h) ai (h i), h q i1 3 Ước lượng tham số mô hình ARMA Giả sử ta cần ước lượng các tham số của mô hình ARMA(p,q) X t a1 X t 1 a p X t p ... mô hình ARMA(p,q) X t a1 X t 1 a p X t p t b1 t 1 bq t q , a1, a2 , , a p , b1, b2 , , bq R, a p 0, bq trong đó t đóng vai trò là sai số Đối với mô hình ARMA cũng có nhiều phương pháp ước lượng tham số hiệu quả và được nêu ra chi tiết trong P.Brockwell, R David, 2001 Dưới đây, ta sẽ xem xét phương pháp bình phương cực tiểu theo kiểu thuật toán Hannan – Rissanen Ý tưởng... trường hợp AR, nếu đa thức trung bình trượt b(z) không có nghiệm có mô un bằng 1 thì ta có thể biểu diễn X t dưới dạng sau: j 1 j X t j X t j t ; j Và có thể xác định i bằng cách chia 1(theo luỹ thừa tăng) cho b(z), ( 0 1) Khi quá trình X t có thể biểu diễn ở dạng trên, tức là khi b(z) chỉ có nghiệm có mô un lớn hơn 1 thì ta nói X t là một quá trình khả nghịch Và từ