Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 90 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
90
Dung lượng
2,15 MB
Nội dung
ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƢỜNG ĐẠI HỌC BÁCH KHOA LÂM HOÀNG VŨ DỰ BÁO CHUỖI THỜI GIAN SỬ DỤNG MÔ HÌNH ARIMA VÀ GIẢI THUẬT DI TRUYỀN Chuyên Ngành: Khoa Học Máy Tính Mã số: 60.48.01 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 07 năm 2012 ĐẠI HỌC QUỐC GIA TP HCM CỘNG HOÀ XÃ HỘI CHỦ NGHIÃ VIỆT NAM TRƢỜNG ĐẠI HỌC BÁCH KHOA Độc Lập - Tự Do - Hạnh Phúc -oOo Tp HCM, ngày tháng năm 2012 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Lâm Hoàng Vũ.…………… Giới tính: Nam �/ Nữ � Ngày, tháng, năm sinh: 14/10/1981… Nơi sinh: Quảng Ngãi Chuyên ngành: Khoa học Máy tính………………………………………………………………… Khoá: 2008……………………………………………………………………………………………… 1- TÊN ĐỀ TÀI: DỰ BÁO CHUỖI THỜI GIAN SỬ DỤNG MÔ HÌNH ARIMA VÀ GIẢI THUẬT DI TRUYỀN 2- NHIỆM VỤ LUẬN VĂN: 3- NGÀY GIAO NHIỆM VỤ: 4- NGÀY HOÀN THÀNH NHIỆM VỤ: 5- HỌ VÀ TÊN CÁN BỘ HƢỚNG DẪN: PGS TS Dƣơng Tuấn Anh…………….…………… Nội dung đề cƣơng Luận văn thạc sĩ đƣợc Hội Đồng Chuyên Ngành thông qua CÁN BỘ HƢỚNG DẪN CHỦ NHIỆM BỘ MÔN (Họ tên chữ ký) QUẢN LÝ CHUYÊN NGÀNH (Họ tên chữ ký) PGS TS Dƣơng Tuấn Anh TS Đinh Đức Anh Vũ CÔNG TRÌNH ĐƢỢC HOÀN THÀNH TẠI TRƢỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH Cán hƣớng dẫn khoa học: PGS TS Dƣơng Tuấn Anh Cán chấm nhận xét 1: Cán chấm nhận xét 2: Luận văn thạc sĩ đƣợc bảo vệ HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƢỜNG ĐẠI HỌC BÁCH KHOA, Ngày Tháng Năm 2012 LỜI CAM ĐOAN Tôi cam đoan rằng, ngoại trừ kết tham khảo từ công trình khác nhƣ ghi rõ luận văn, công việc trình bày luận văn thực chƣa có phần nội dung luận văn đƣợc nộp để lấy cấp trƣờng trƣờng khác Ngày 01 tháng 07 năm 2012 Lâm Hoàng Vũ i LỜI CÁM ƠN Tôi xin bày tỏ lòng biết ơn chân thành đến PGS.TS Dƣơng Tuấn Anh, Thầy tận tâm dẫn, truyền đạt kiến thức kinh nghiệm quý báu cho từ ngày đầu nhƣ ngày cuối suốt trình thực luận văn Tôi xin đƣợc gửi lời cám ơn đến quí Thầy Cô giáo tham gia giảng dạy chƣơng trình cao học khoa Khoa Học Kỹ Thuật Máy Tính, trƣờng Đại Học Bách Khoa TP Hồ Chí Minh trang bị cho kiến thức tảng quan trọng suốt trình theo học Và cuối cùng, xin đƣợc gửi lời cám ơn đến gia đình bạn bè, ngƣời động viên suốt thời gian vừa qua ii TÓM TẮT LUẬN VĂN Các nghiên cứu liệu chuỗi thời gian đem lại ứng dụng thực tế quan trọng lĩnh vực nhƣ thống kê, xử lý tín hiệu số, toán tài chính, … Một số dự báo chuỗi thời gian (hay dự báo giá trị tƣơng lai chuỗi thời gian từ giá trị khứ) từ việc xây dựng mô hình dự báo thích hợp Đã có nhiều nghiên cứu tập trung vào toán dự báo chuỗi thời gian, số sử dụng mô hình ARIMA, mô hình ARMA, việc lựa chọn mô hình dựa theo phƣơng pháp Box-Jenkins việc ƣớc lƣợng hệ số mô hình dựa phƣơng pháp toán học túy phức tạp Hơn nữa, kết phƣơng pháp Box-Jenkins phụ thuộc nhiều vào lực chuyên môn ngƣời làm dự báo Để giải vấn đề này, có nhiều phƣơng pháp meta-heuristic sử dụng giải thuật di truyền đƣợc đề xuất để việc lựa chọn mô hình (thể qua bậc biến thời gian trễ có mặt mô hình) tính toán hệ số mô hình cách tự động Tuy vậy, việc sinh mô hình trình tìm kiếm lời giải phƣơng pháp meta-heuristic đƣợc thực mang tính chất ngẫu nhiên (bởi chất giải thuật di truyền, giải thuật mô luyện kim) phƣơng pháp meta-heuristic thƣờng chạy chậm lời giải tốt Từ vấn đề nêu trên, đề tài này, với mục tiêu đƣa phƣơng pháp để tự động xác định bậc ƣớc lƣợng hệ số mô hình ARMA, đề xuất phƣơng pháp mở rộng không gian tìm kiếm lời giải mô hình ARMA dựa giải thuật tìm kiếm Tabu việc xác định bậc sử dụng giải thuật di truyền để ƣớc lƣợng hệ số mô hình ARMA Kết thực nghiệm cho thấy phƣơng pháp đem lại kết tốt hầu hết chuỗi liệu đƣợc kiểm tra so với phƣơng pháp meta-heuristic khác thời gian chạy dừng mức chấp nhận đƣợc iii MỤC LỤC LỜI CAM ĐOAN .i LỜI CÁM ƠN ii TÓM TẮT LUẬN VĂN iii MỤC LỤC .iv DANH MỤC HÌNH .vii DANH MỤC BẢNG .ix DANH MỤC TỪ VIẾT TẮT x Chƣơng GIỚI THIỆU 1.1 Dữ liệu chuỗi thời gian 1.1.1 Định nghĩa 1.1.2 Các thành phần chuỗi thời gian 1.1.3 Ứng dụng phân tích liệu chuỗi thời gian 1.1.4 Một số vấn đề thƣờng gặp nghiên cứu chuỗi thời gian 1.2 Bài toán dự báo chuỗi thời gian 1.3 Động mục tiêu nghiên cứu 1.4 Tóm lƣợc kết đạt đƣợc 1.5 Cấu trúc luận văn Chƣơng TỔNG QUAN VỀ PHƢƠNG PHÁP VÀ MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN 10 2.1 Các mô hình làm trơn ngoại suy liệu chuỗi thời gian 10 2.1.2 Mô hình làm trơn hàm mũ 12 iv 2.1.3 Dự báo phân tích xu hƣớng 14 2.2 Các mô hình dự báo tuyến tính 15 2.3 Các mô hình dự báo phi tuyến 17 2.3.1 Mạng nơ-ron nhân tạo (ANN) 17 2.3.2 Các mô hình phi tuyến khác 19 Chƣơng CƠ SỞ LÝ THUYẾT 22 3.1 Các kiến thức chuỗi thời gian 22 3.1.1 Quá trình ngẫu nhiên 22 3.1.2 Quá trình ngẫu nhiên tĩnh 23 3.1.3 Quá trình không tĩnh 24 3.2 Quá trình ARMA 25 3.2.1 Quá trình trung bình di động 25 3.2.2 Quá trình tự hồi qui 27 3.2.3 Quá trình ARMA 29 3.3 Giải thuật di truyền 31 3.3.1 Cách biểu diễn di truyền cho lời giải toán 33 3.3.2 Cách khởi tạo quần thể ban đầu 33 3.3.3 Phép toán chọn lọc 33 3.3.4 Phép toán lai 36 3.3.5 Phép toán đột biến 38 3.3.6 Các tham số giải thuật 38 3.3.7 Điều kiện dừng giải thuật 38 3.4 Mô hình ARMA sử dụng giải thuật di truyền 39 v 3.4.1 Ánh xạ mô hình ARMA thành nhiễm sắc thể 39 3.4.2 Phƣơng pháp siêu tiến hóa cho mô hình ARMA 41 Chƣơng PHƢƠNG PHÁP GIẢI QUYẾT VẤN ĐỀ 44 4.1 Giải thuật tìm kiếm Tabu 46 4.2 Mô hình GA-ARMA 50 4.2.1 Phép toán lai 51 4.2.2 Phép toán đột biến 51 4.3 Khởi tạo lời giải ban đầu giải thuật tìm kiếm Tabu 52 4.4 Phƣơng pháp tìm tập lân cận 52 4.5 Hiệu chỉnh giải thuật tìm kiếm Tabu 54 Chƣơng KẾT QUẢ THỰC NGHIỆM 57 5.1 Dữ liệu thực nghiệm 57 5.2 Kết thực nghiệm đánh giá 60 Chƣơng KẾT LUẬN 69 6.1 Tổng kết 69 6.2 Hƣớng phát triển đề tài 70 TÀI LIỆU THAM KHẢO 71 LÝ LỊCH TRÍCH NGANG 75 QUÁ TRÌNH ĐÀO TẠO 76 QUÁ TRÌNH CÔNG TÁC 77 vi DANH MỤC HÌNH Hình 1.1: Đƣờng biểu diễn liệu chuỗi thời gian cho số VN-Index từ ngày 3/1/2006 đến ngày 6/8/2008 Hình 1.2: Minh họa liệu chuỗi thời gian theo dõi trình đo nhiệt độ Hình 1.3: Đồ thị chuỗi thời gian giá trị dự báo Hình 2.1: Đƣờng cong xu hƣớng dùng phƣơng pháp trung bình di động 15 Hình 2.2: Kiến trúc ANN cho dự báo chuỗi thời gian với ngõ vào, lớp ẩn hai nơ-ron ngõ (là giá trị dự báo) 18 Hình 3.1: Chi tiết hoạt động giải thuật di truyền chuẩn 32 Hình 3.2: Minh họa bánh xe Roulette 34 Hình 3.5: Minh họa cho việc giải mã nhiễm sắc thể meta-level 41 Hình 3.6: Phƣơng pháp siêu tiến hóa 43 Hình 4.1: Kiến trúc hai mức M.T.Sơn cộng [28] 44 Hình 4.2: Quá trình lựa chọn lời giải tốt bƣớc lặp 46 Hình 4.3: Giải thuật tìm kiếm Tabu sử dụng tiêu chuẩn kỳ vọng 49 Hình 4.4: Nhiễm sắc thể biểu diễn thực đại diện mô hình GA-ARMA 50 Hình 4.5: Minh họa cho phép toán lai số học 51 Hình 4.6: Thủ tục xác định tập lời giải lân cận 53 Hình 4.7: Minh họa so sánh tham số lời giải với giá trị ngƣỡng để tạo bƣớc chuyển 54 Hình 4.8: Kết nối lời giải tập lân cận 55 Hình 4.9: Giải thuật tìm kiếm Tabu đƣợc hiệu chỉnh 56 Hình 5.1: Đồ thị chuỗi liệu Passengers 58 Hình 5.2: Đồ thị chuỗi liệu Paper 58 Hình 5.3: Đồ thị chuỗi liệu Deaths 58 Hình 5.4: Đồ thị chuỗi liệu Maxtemp 59 Hình 5.5: Đồ thị chuỗ liệu Chemical 59 vii Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh phƣơng pháp siêu tiến hóa [5] Các giá trị đƣợc in bảng ứng với phƣơng pháp đại lƣợng RMSE tập kiểm thử (trong ngoặc giá trị đại lƣợng NMSE) Kết thực nghiệm cho thấy phƣơng pháp đề nghị có cải thiện kết nhiều chuỗi liệu so với phƣơng pháp SAGA Meta-GAs Series ES ARIMA Meta-GAs SAGA Tabu-GA Passengers 16.5 (0.7%) 17.8 (0.81%) 17.2 (0.75%) 17.74 (0.83%) 15.68 (0.65%) Paper 49.2 (4.4%) 61.0 (6.8%) 52.5 (5%) 49.17 (4.39%) 41.57 (3.14%) Deaths 135 (37%) 144 (42%) 137 (38%) 142 (41%) 138.77 (13.56%) Maxtemp 0.72 (2.5%) 1.07 (5.6%) 0.93 (4.3%) 0.85 (3.6%) 0.80 (3.17%) Chemical 0.35 (51%) 0.36 (53%) 0.34 (48%) 0.33 (44.89%) 0.33 (45.93%) Prices 7.54 (0.39%) 7.72 (0.41%) 7.48 (0.38%) 7.54 (0.39%) 7.63 (0.39%) Sunspots 28.4 (35%) 21.4 (20%) 17.6 (14%) 16.57 (12%) 18.11 (14.44%) Kobe 3199 (105%) 582 (3.5%) 492 (2.5%) 491 (2.5%) 395.26 (1.61%) Bảng 5.3: So sánh kết phƣơng pháp dự báo khác Phƣơng pháp Tabu-GA cải thiện chất lƣợng lời giải 5/8 chuỗi liệu so với phƣơng pháp Meta-GA phƣơng pháp SAGA Đối với chuỗi liệu có yếu tố mùa (Seasonal), phƣơng pháp làm trơn hàm mũ (ES) cho kết tốt phƣơng pháp đƣợc thiết kế riêng cho chuỗi liệu dạng Các hình sau biểu diễn đồ thị dự báo giá trị 10% phần tử cuỗi chuỗi liệu đƣợc dùng cho thực nghiệm: SV: Lâm Hoàng Vũ – MSHV: 00708218 63 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh 700 600 500 400 Passengers 300 Forecasts 200 100 125 130 135 140 145 Hình 5.9: Đồ thị dự báo tập liệu Passengers 1200 1000 800 Paper 600 Forecasts 400 200 105 110 115 120 Hình 5.10: Đồ thị dự báo tập liệu Paper SV: Lâm Hoàng Vũ – MSHV: 00708218 64 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh 2000 1800 1600 1400 1200 Deaths 1000 Forecasts 800 600 400 200 170 175 180 185 190 195 Hình 5.11: Đồ thị dự báo tập liệu Deaths 30 25 20 Maxtemp 15 Forecasts 10 210 215 220 225 230 235 240 245 Hình 5.12: Đồ thị dự báo tập liệu Maxtemp SV: Lâm Hoàng Vũ – MSHV: 00708218 65 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh 18.4 18.2 18 17.8 Chemical 17.6 Forecasts 17.4 17.2 17 16.8 175 180 185 190 195 200 Hình 5.13: Đồ thị dự báo tập liệu Chemical 450 400 350 300 250 Prices 200 Forecasts 150 100 50 330 340 350 360 370 Hình 5.14: Đồ thị dự báo tập liệu Prices SV: Lâm Hoàng Vũ – MSHV: 00708218 66 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh 180 160 140 120 100 Sunspots 80 Forecasts 60 40 20 250 260 270 280 290 Hình 5.15: Đồ thị dự báo tập liệu Sunspot 10000 8000 6000 4000 Kobe 2000 Forecasts 175 180 185 190 195 200 -2000 -4000 Hình 5.16: Đồ thị dự báo tập liệu Kobe Thời gian chạy tƣơng ứng với số vòng lặp itermax = 500 tƣơng ứng với chuỗi liệu dùng thực nghiệm đƣợc liệt kê bảng 5.4 dƣới Thời gian SV: Lâm Hoàng Vũ – MSHV: 00708218 67 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh xem nhƣ thời gian ƣớc lƣợng cực đại giải thuật ứng với điều kiện dừng itermax = 500 giải thuật Tabu hiệu chỉnh phƣơng pháp Sở dĩ gọi thời gian ƣớc lƣợng cực đại thực tế, ta sử dụng thêm tham số nitermax giải thuật phép giải thuật kết thúc sớm nhƣ sau số lần vòng lặp (đƣợc định nitermax) mà chất lƣợng lời giải không đƣợc cải thiện thêm Series Passengers Data Points 144 Thời gian chạy Tabu-SA 33 phút Paper 120 46 phút Deaths 192 51 phút Maxtemp 240 56 phút Chemical 197 phút Prices 369 42 phút Sunspots 289 38 phút Kobe 200 44 phút Bảng 5.4: Thời gian chạy giải thuật Tabu-SA chuỗi liệu thực nghiệm Bảng thời gian chạy giải thuật Tabu-SA cho thấy phƣơng pháp mà đề nghị luận văn chấp nhận đƣợc mặt thời gian SV: Lâm Hoàng Vũ – MSHV: 00708218 68 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh Chƣơng KẾT LUẬN Trong chƣơng này, tổng kết lại việc làm đƣợc đề xuất hƣớng mở rộng để phát triển đề tài 6.1 Tổng kết Trong đề tài thực nghiên cứu toán dự báo chuỗi thời gian sử dụng phƣơng pháp meta-heuristic để xác định bậc ƣớc lƣợng hệ số mô hình ARMA Chúng tìm hiểu cách thức kết hợp giải thuật di truyền giải thuật di truyền, giải thuật mô luyện thép với giải thuật di truyền metaheuristic sử dụng kiến trúc hai mức, mức sử dụng giải thuật tìm kiếm cục riêng kết hợp hai mức lại với theo cách kết hợp giải thuật vừa nêu Từ nghiên cứu này, đề xuất phƣơng pháp kết hợp khác giải thuật tìm kiếm Tabu giải thuật di truyền, giải thuật Tabu đảm nhận việc xác định bậc mô hình ARMA giải thuật di truyền đảm nhận việc ƣớc lƣợng hệ số mô hình Giải thuật tìm kiếm Tabu đƣợc hiệu chỉnh để phù hợp với việc xác định bậc mô hình ARMA, phƣơng pháp đề nghị cách thức mở rộng không gian tìm kiếm mô hình ARMA bƣớc xác định lời giải lân cận giải thuật tìm kiếm Tabu quan trọng, dựa việc đánh giá gen NST biểu diễn cho mô hình ARMA gen yếu cần phải đƣợc loại bỏ, từ cho thấy việc thực bƣớc chuyển giải thuật Tabu mà đề xuất có định hƣớng không mang tính ngẫu nhiên nhƣ phƣơng pháp meta-heuristic trƣớc Giải thuật di truyền phƣơng pháp giải vấn đề sử dụng biến thể khác phép toán lai ghép phép toán đột biến dựa tổng kết gần heuristic đƣợc áp dụng toán tối ƣu số (numerical optimization) (ƣớc lƣợng hệ số mô hình ARMA toán thuộc dạng này) Kết thực nghiệm chứng minh đƣợc hiệu phƣơng pháp giải mà thực luận văn SV: Lâm Hoàng Vũ – MSHV: 00708218 69 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh 6.2 Hƣớng phát triển đề tài Đề tài đƣa giải pháp để xác định bậc ƣớc lƣợng hệ số mô hình ARMA toán dự báo chuỗi thời gian Tuy nhiên để cải thiện hƣớng nghiên cứu cần bổ xung tiếp cận nghiên cứu tƣơng lai nhƣ sau: Với kết thực nghiệm nhƣ trình bày chƣơng 5, có 3/8 chuỗi liệu thực nghiệm mà phƣơng pháp đề xuất không cải thiện nhiều so với phƣơng pháp khác Một điều dễ nhận thấy liệu thực nghiệm không qua giai đoạn tiền xử lý liệu trƣớc chạy trực tiếp với giải thuật Do giới hạn thời gian nghiên cứu, nên chƣa thể áp dụng kiểu tiền xử lý liệu nhƣ phƣơng pháp Box-Jenkins (chẳng hạn nhƣ phƣơng pháp chuyển liệu sang dạng logarithm) Dĩ nhiên qui trình tiền xử lý liệu hợp với phƣơng pháp xác định bậc ƣớc lƣợng tham số mô hình cách tự động không dựa vào lực nhƣ kinh nghiệm ngƣời làm dự báo theo phƣơng pháp Box-Jenkins Mặc dù thời gian chạy giải thuật phƣơng pháp đề xuất dừng mức chấp nhận đƣợc, nhƣng việc cải thiện tốc độ vấn đề quan trọng cần xem xét đến nhƣng số hƣớng phát triển tiếp đề tài SV: Lâm Hoàng Vũ – MSHV: 00708218 70 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh TÀI LIỆU THAM KHẢO [1] A.S.Weigend and N.A.Gershenfeld, editors Time Series Prediction: Forecasting the Future and Understanding the Past Addison Wesley, 1993 [2] G.E.P.Box, G.M.Jenkins and G.C.Reinsel Time Series Analysis: Forecasting and Control, San Francisco: Holden-Day, 1994 [3] Chris Chatfield Time-Series Forecasting Chapman and Hall/CRC, 2000 [4] P.Cortez, M.Rocha and J.Neves A Meta-Genetic Algorithm for Time Series Forecasting In Luís Torgo (Ed.), Proceedings of Workshop on Artificial Intelligence Techniques for Financial Time Series Analysis (AIFTSA -01), 10th Portuguese Conference on Artificial Intelligence (EPIA'01), pp 21-31, Porto, Portugal, December, 2001 [5] P Cortez, M Rocha and J Neves Genetic and Evolutionary Algorithms for Time Series Forecasting In L Monostori, J Váncza and M Ali (Eds), Lecture Notes in Artificial Intelligence 2070, pp 393-402, Budapest, Hungary, June, 2001 Springer, ISBN:3-540-42219-6 [6] A.M.Fraser and A.Dimitriadis Forecasting Probability Densities by Using Hidden Markov Models with Mixed States 1993 [7] C.C.Holt, Forecasting Seasonals and Trends by Exponentially Weighted Moving Averages, unpublished research report, Carnegie Institute of Technology, Pittsburgh, 1957 [8] E.J.Kostelich and D.P.Lathrop Time Series Prediction by Using the Method of Analogues 1993 SV: Lâm Hoàng Vũ – MSHV: 00708218 71 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh [9] J.G.Gooijer and R.J.Hyndman 25 years of time series forecasting, International Journal of Forecasting 22 (2006) 443– 473 [10] J.Han and M.Kamber, Data Mining: Concepts and Techniques, Second Edition, 2006 [11] A Lapedes and R Farber Nonlinear signal processing using neural networks Technical Report LA-UR-87-2662, Los Alamos National Laboratory, Los Alamos, NM, 1987 [12] K Lang and G Hilton A time-delay neural network architecture for speech recognition Technical Report CMU-CS-88-152, Carnegie Mellon University, Pittsburgh, PA, 1988 [13] M.C Mozer Neural Network Architectures for Temporal Sequence Processing, pages 243-264 Addison Wesley, 1993 [14] Minerva et al., Building ARMA Models with Genetic Algorithms, 2001, E.J.W Boers et al (Eds.) EvoWorkshop , LNCS 2037, pp 335-342 [15] A.Waibel Modular construction of time-delay neural networks for speech recognition Neur Comp., 1(1):39-46, 1989 [16] R.S.Pindyck and D.L.Rubinfeld Econometric Models and Economic Forecasts, Third Edition, McGraw-Hill, 1991 [17] E.A.Wan Time Series Prediction by Using a Connectionist Network with Internal Delay Line, pages 195-217 Addison Wesley, 1993 [18] P.Werbos Beyond Regression: New Tools for Prediction and Analysis in the Behavioural Sciences PhD thesis, Harvard University, Cambridge, MA, 1974 SV: Lâm Hoàng Vũ – MSHV: 00708218 72 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh [19] P Werbos Generalization of backpropagation with application to a recurrent gas market model Neur Net., 1:339-356, 1988 [20] A.S.Weigend, B.A.Huberman, and D E Rumelhart Predicting the future: A connectionist approach International Journal of Neural Systems, 1:193-209, 1990 [21] J.H.Holland Adaptation in natural and artificial Systems The University of Michigan Press, Ann Arbor, Michigan, 1975 [22] G.Schwarz Estimating the Dimension of a Model Annals of Statistics, 6:461-4, 1978 [23] Adelina Gnanlet and Chandrasekharan Rajendran Meta-Heuristics in ARMA Forecasting CJOM, Vol 7(1), 2009, 38-48 [24] Z Michalewicz Genetic Algorithms + Data Structures = Evolution Programs Springer-Verlag, USA, third edition, 1996 [25] Daniel A Spieleman and Shang-Hua Teng Smoothed Analyis of Algorithms and Heuristics: Progress and Open Questions Foundation of Computational Mathematics, Santander 2005 Cambride University Press (2006) [26] Juan J Flores, Héctor Rodríguez, and Mario Graff Reducing the search space in evolutive design of ARIMA and ANN models for time series prediction Proceeding MICAI'10 Proceedings of the 9th Mexican international conference on Artificial intelligence conference on Advances in soft computing: Part II Pages 325336, volume 6438 of Lecture Notes in Computer Science Springer, 2010 [27] Price G R., Selection and covariance Nature 227, 520-521 (1970) SV: Lâm Hoàng Vũ – MSHV: 00708218 73 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh [28] Mai Thai Son et al A New Approach to Time Series Forecasting using Simulated Annealing Algorithms ACOMP 2010 [29] Dƣơng Tuấn Anh Bài giảng môn học “Lập trình Logic ràng buộc” Khoa Khoa học kỹ thuật máy tính, ĐHBKTPHCM, 2012 [30] Nguyễn Xuân Hùng Sử dụng giải thuật di truyền tinh chỉnh cấu hình mạng nơron cho công tác dự báo liệu chuỗi thời gian Luận văn tốt nghiệp đại học, 2011, Khoa học kỹ thuật máy tính, ĐHBKTPHCM SV: Lâm Hoàng Vũ – MSHV: 00708218 74 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh LÝ LỊCH TRÍCH NGANG Họ tên: Lâm Hoàng Vũ Ngày sinh: 14/10/1981 Nơi sinh: Quảng Ngãi Địa liên lạc: 100 Trần Văn Dƣ, phƣờng 13, Quận Tân Bình, TP Hồ Chí Minh Email: lamhoangvu@gmail.com SV: Lâm Hoàng Vũ – MSHV: 00708218 75 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh QUÁ TRÌNH ĐÀO TẠO Trƣờng đào tạo Thời gian 1999 - 2005 Chuyên ngành Trƣờng Đại Học Bách Khoa – Điện – Điện Tử Trình độ Kỹ sƣ Đại Học Quốc TP Hồ Chí Minh 2008 - 2010 Trƣờng Đại Học Bách Khoa – Khoa Học Máy Tính Thạc sĩ Đại Học Quốc TP Hồ Chí Minh SV: Lâm Hoàng Vũ – MSHV: 00708218 76 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh QUÁ TRÌNH CÔNG TÁC Thời gian 2004 - 2009 Đơn vị công tác Vị trí công tác Công ty Silicon Design Solution, 3E/15 Phổ Quang, Lập trình viên phƣờng 4, Quận Tân Bình, TPHCM 2009 - Công ty eSilicon Vietnam, Lầu 9, tòa nhà eTown, Lập trình viên 364 Cộng Hòa, phƣờng 13, Quận Tân Bình, TPHCM SV: Lâm Hoàng Vũ – MSHV: 00708218 77 [...]... 00708218 9 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh Chƣơng 2 TỔNG QUAN VỀ PHƢƠNG PHÁP VÀ MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN Nhƣ đã đề cập sơ qua ở chƣơng 1, việc phân tích chuỗi thời gian nhằm cung cấp những công cụ để lựa chọn mô hình mô tả chuỗi thời gian và có thể sử dụng mô hình cho mục đích dự báo các giá trị tƣơng lai Tìm mô hình cho chuỗi thời gian là một vấn đề thống kê vì dữ liệu quan sát của chuỗi. .. 2.1.1 Mô hình trung bình di động SV: Lâm Hoàng Vũ – MSHV: 00708218 10 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh Mô hình trung bình di động (moving average model) thuộc về lớp các mô hình thƣờng dùng trong dự báo chuỗi thời gian [16] Giả sử ta cần dự báo chuỗi thời gian đƣợc thu thập theo từng tháng trong năm, có thể ta phải dùng đến mô hình sau: (2.1) Nhƣ vậy, giá trị dự báo 1-bƣớc ứng với mô hình. .. các chuỗi dữ liệu thích hợp cho mô hình ARMA), mô hình ARIMA và các thành phần của nó Trong chƣơng này chúng tôi cũng đi sâu vào việc tìm hiểu phƣơng pháp sử dụng giải thuật di truyền để xác định bậc của mô hình ARMA, phƣơng SV: Lâm Hoàng Vũ – MSHV: 00708218 8 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh pháp sử dụng giải thuật di truyền để ƣớc lƣợng tham số của mô hình của các nhóm tác giả khác nhau... mẽ để giải quyết các bài toán tìm kiếm và tối ƣu hóa Đối với mô hình ARIMA, ta sẽ xây dựng một giải thuật di truyền phù hợp để sử dụng đƣợc vào cả hai mục đích: xác định bậc phù hợp cho các thành phần AR và MA có trong mô hình ARIMA xác định các hệ số của mô hình SV: Lâm Hoàng Vũ – MSHV: 00708218 7 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh 1.4 Tóm lƣợc các kết quả đạt đƣợc Xây dựng mô hình. .. các chu kỳ thời gian khác nhau , trong đó Với và là độ dài của dãy dãy kết quả truy vấn là giá trị của chuỗi thời gian tại thời điểm Hệ thống dự báo sẽ đƣợc cung cấp tƣơng ứng với tập và ta sẽ cần tìm các giá trị SV: Lâm Hoàng Vũ – MSHV: 00708218 5 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh Hình 1.3: Đồ thị chuỗi thời gian và các giá trị dự báo Phân tích chuỗi thời gian cho mục đích dự báo là một... nào biết đƣợc chuỗi thời gian SV: Lâm Hoàng Vũ – MSHV: 00708218 6 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh quan sát là phù hợp với mô hình ARIMA) và lựa chọn mô hình ARIMA cụ thể (tức là xác định bậc của mô hình) nhƣ thế nào để sử dụng? Cách tiếp cận phổ biến đƣợc biết đến nhiều nhất cho vấn đề lựa chọn mô hình là phƣơng pháp Box-Jenkins [2], và mô hình ARIMA là một trong số các mô hình của phƣơng... phần AR và MA trong mô hình ARIMA Thế nhƣng ta thƣờng thấy rằng các mô hình khác nhau có thể có các giá trị tƣơng quan tƣơng tự nhau và nhƣ vậy việc lựa chọn mô hình trong số các mô hình ứng viên có tính tùy tiện Mục tiêu nghiên cứu của đề tài này là đƣa ra một phƣơng pháp tính toán tự động chọn ra mô hình phù hợp nhất trong lớp các mô hình ARIMA dựa vào giải thuật di truyền Giải thuật di truyền lấy... vì dữ liệu quan sát của chuỗi đƣợc sử dụng trong các thủ tục tính toán để ƣớc lƣợng các hệ số cho mô hình giả thiết Việc phân loại các phƣơng pháp dự báo tùy thuộc vào mô hình mô hình mà ngƣời ta lựa chọn Đã có rất nhiều chủ đề nghiên cứu về các mô hình dự báo chuỗi thời gian khác nhau [9], trong phần này chúng tôi sẽ điểm sơ qua về các mô hình dự báo chuỗi thời gian thƣờng đƣợc biết đến Ở giai đoạn... của chuỗi gần thời điểm dự báo) Do đó, một kỹ thuật thƣờng thấy trong vấn đề dự báo (không chỉ đối với mô hình EWMA) đƣợc áp dụng là loại bỏ các yếu tố xu hƣớng khỏi dữ liệu chuỗi thời gian trƣớc khi dùng đến mô hình EWMA Mỗi khi giá trị dự báo của chuỗi đã loại bỏ yếu tố xu hƣớng đƣợc tạo ra thì một số hạng biểu di n xu hƣớng sẽ đƣợc cộng thêm vào để đạt đƣợc giá trị dự báo cuối cùng Nếu ta sử dụng mô. .. quả mô hình tự hồi qui AR 2.2.2 Mô hình tự hồi qui (AR) Đối với mô hình tự hồi qui, chuỗi thời gian đƣợc mô tả bởi phƣơng trình sau: (2.13) SV: Lâm Hoàng Vũ – MSHV: 00708218 16 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh Phƣơng trình này đƣợc gọi là phƣơng trình biểu di n của mô hình tự hồi qui bậc (AR( )) 2.2.3 Mô hình ARMA Nhiều chuỗi thời gian không thể mô hình đƣợc nhƣ một quá trình trung bình di ... thời gian (hay dự báo giá trị tƣơng lai chuỗi thời gian từ giá trị khứ) từ việc xây dựng mô hình dự báo thích hợp Đã có nhiều nghiên cứu tập trung vào toán dự báo chuỗi thời gian, số sử dụng mô hình. .. 00708218 Luận văn thạc sĩ GVHD: PGS.TS Dƣơng Tuấn Anh 1.4 Tóm lƣợc kết đạt đƣợc Xây dựng mô hình GA-ARMA sử dụng giải thuật di truyền để ƣớc lƣợng tham số mô hình ARMA, giải thuật di truyền có sử dụng. .. nghiên cứu mô hình dự báo chuỗi thời gian khác [9], phần điểm sơ qua mô hình dự báo chuỗi thời gian thƣờng đƣợc biết đến Ở giai đoạn đầu việc nghiên cứu toán dự báo chuỗi thời gian, dự báo đƣợc