1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian

79 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Tác giả Lờ Minh Nam
Người hướng dẫn PGS. TS. Dương Tuấn Anh
Trường học ĐẠI HỌC QUỐC GIA TP.HCM
Chuyên ngành Khoa học máy tính
Thể loại Luận văn thạc sĩ
Năm xuất bản 2015
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 79
Dung lượng 31,86 MB

Cấu trúc

  • MỤC LUC BANG (12)
    • CHUONG 1 CHUONG 1 (13)
  • GIOI THIEU DE TAI (13)
    • CHƯƠNG 2 CHƯƠNG 2 (16)
  • CÁC CÔNG TRÌNH LIÊN QUAN (16)
    • CHƯƠNG 3 CHƯƠNG 3 (27)
  • CƠ SỞ LÝ THUYÉT (27)
    • CHƯƠNG 4 CHƯƠNG 4 (53)
  • MÔ HÌNH DỰ BÁO DÙNG NHIÊU MẠNG NƠ-RON (53)
    • CHƯƠNG 5 CHƯƠNG 5 (60)
  • HIỆN THỰC VA THU NGHIỆM (60)
    • CHƯƠNG 6 CHƯƠNG 6 (73)
  • KET LUẬN (73)
  • TAI LIEU THAM KHAO (75)
  • PHU LUC: BANG DOI CHIẾU THUẬT NGỮ ANH - VIỆT (76)
  • LÝ LỊCH TRÍCH NGANG (79)
  • QUA TRINH DAO TAO (79)
  • QUÁ TRÌNH CÔNG TÁC (79)

Nội dung

Ví dụ, kết quả doanhthu của một công ty ở thành phố Hồ Chí Minh được lưu trữ theo từng năm, hay số lượng hàng hóa bán được của siêu thị được lưu trữ theo từng tháng là các dữ liệu chuỗi

MỤC LUC BANG

GIOI THIEU DE TAI

CÁC CÔNG TRÌNH LIÊN QUAN

CƠ SỞ LÝ THUYÉT

MÔ HÌNH DỰ BÁO DÙNG NHIÊU MẠNG NƠ-RON

HIỆN THỰC VA THU NGHIỆM

KET LUẬN

Dự báo dữ liệu chuỗi thời gian là một công việc rất thường được sử dụng, giúp chúng ta dự báo được những điểm sắp sữa xảy ra để tránh những điều không mong muốn trong các lĩnh vực như chứng khoán, tỷ giá

Sử dụng mạng no-ron để dự báo là phương pháp được sử dụng rất nhiều nhưng hiện tại chỉ sử dụng một mạng để huấn luyện hết một chuỗi dữ liệu thời gian, điều này sẽ gây ra tình trạng không nam rõ được những biến động nhỏ cục bộ, khi dự báo trong các lĩnh vực tỷ giá hay chứng khoán.

Kết quả thực nghiệm cho ta thay cách tiếp cận mới khi sử dụng nhiều mang dé dự báo cho kết quả chính xác hơn so với phương pháp chỉ sử dụng một mạng nơ- ron dé dự báo.

6.2 _ Những đóng gop của đề tài Đưa ra một cải tiễn trong việc sử dụng mạng Nơ-ron nhân tạo để dự báo dữ liệu chuỗi thời gian, thay vì dùng một mạng nơ-ron thì dùng nhiều mạng nơ-ron So sánh với phương pháp chỉ dùng một mạng nơ-ron để dự báo dữ liệu chuỗi thời gian.

Quá trình tách các chuỗi con dựa vào những điểm cực trị quan trọng có sử dụng kỹ thuật cho phép các chuỗi con phủ lấp lên nhau.

Sử dụng giải thuật gom cụm phân cấp từ dưới lên HAC kết hợp với phương pháp tính độ tương tự Euclid để tìm kiếm chuỗi con trên dữ liệu chuỗi thời gian giúp nhận ra những chuỗi con có chiều dài hay biên độ dao động khác nhau.

6.3 Hướng phát triển của đề tài Đề tài đã sử dụng phương pháp tách các chuỗi dữ liệu con dựa vào các điểm cực tri quan trọng, và được gom thành các cụm để huấn luyện thành các mạng nơ- ron tương ứng Tuy nhiên để cải thiện hướng nghiên cứu này chúng ta cần bố sung các tiép cận nghiên cứu mới trong tương lai như sau:

Y Do giới hạn về thời gian nghiên cứu nên quá trình hiện thực chỉ thực hiên trên các tập dữ liệu về chứng khoán, ti giá (AUD/USD, AUD/EURO), nhu cầu năng lượng ở Ý, và dữ liệu doanh nghiệp Do vậy cần phải thu thập thêm nhiều loại dữ liệu chuỗi thời gian khác để đưa ra những đánh giá và quan sát khác.

Y Sử dụng phương pháp gom cụm khác tốt hơn HAC để có độ chính xác cao hơn.

Y Hiện tại phương pháp chỉ dự báo cho một điểm dữ liệu tiếp theo (dự báo một bước), có thé cải tiến dé dự báo cho nhiều điểm dữ liệu tiếp theo (dự báo nhiêu bước).

TAI LIEU THAM KHAO

Box, G., & Jenkins, G (n.d.) "Time series analysis: Forecasting and control" Revised Edition, Holden Day, San Francisco.

Gruber, C., Coduro, M., & Sick, B (2006) "Signature verification with dynamic RBF networks and time series motifs" In Tenth International Workshop on Frontiers in Handwriting Recognition.

H.N.Tin (2012) "Nhận diện motif trên dữ liệu chuỗi thời gian dựa vào điềm cực tri quan trọng” Master Thesis, Faculty of Computer Science and Engineering, Ho Chi Minh City University of Technology.

Han, J., & Kamber, M (2006) "Data Mining” (Vol 2).

Hanke, J E., & Wichenrn, D W (2005) "Business Forcasting" Pearson Prentice Hall.

Hastic, T., Tibshirani, R., & Friedman, J (2001) "The elements of statistical learning" Springer-Verlag.

Kolarik, T., & Rudorfer, G (1994) "Time Series Forecasting Using Neural Networks" ACM Sigapl Apl Quote Quad, 25(1), 86-94.

Mitchell, T M (1997) "Machine Learning” McGraw-Hill/ Engineering/

"Financial forecasting through unsupervised clustering and neural networks" Operational Research, 6(2), 103-127.

Pratt, K B., & Fink, E (2002) "Search for patterns in compressed time series" International Journal of Image and Graphics, 2(01), 89-106.

Riedmiller, M (1994) "Advanced Supervised Learning In Multi-layer Perceptrons" In Journal of Computer Standards and Interfaces.

Robert, A., & Yaffee (2008) "Introduction to Time Series Analysis and Forecasting".

T.D.Minh (2002) "Luận văn thạc si Mang Neural Truyền Thắng Va Ung

Dụng Trong Dự Báo Dữ Liệu" Dai học quôc gia Hà Nội.

Zhang, G., Eddy Patuwo, B., & Y Hu, M (1998) "Forecasting with artificial neural networks: The state of the art" [International journal of forecasting, 14(1), 35-62.

PHU LUC: BANG DOI CHIẾU THUẬT NGỮ ANH - VIỆT

Thuật Ngữ Tiếng Anh Thuật Ngữ Tiếng Việt Viết Tắt

Artificial Neural Network Mang no-ron nhan tao ANN Clustering Gom cum

Hierarchical Agglomerative Gom cụm phân cấp theo kiểu

Important Extreme Point Điểm cực trị quan trọng Time Series Dữ liệu chuỗi thời gian Backpropagation Giải thuật lan truyền ngược Probability Distribution Phân bố xác suất

Mean Absolute Errors Hàm trung bình tuyệt đối lỗi MAE

Mean Squared Errors nh trung bình bình phương MSE Mean Absolue Percentage Error trừng lào phan tram tuyệt đôi MAPE

Significant Minimum Cực tiểu quan trọng

Significant Maximum Cuc dai quan trong Spline Interpolation Technique | Phương pháp nội suy spline Homothetic Transformation Phép vi tu

Subsequence Chuỗi con Segment Phan doan Unit Mot don vi Bias Độ lệch

Activation Function Ham kich hoat

Feed-Forward Neural Network | Mang truyền thang FEN Recurrent Neural Network Mang hoi quy

Training Algorithm Thuật toán huấn luyện

Supervised Learning Học có giám sát

Unsupervised Learning Học không có giám sát

Target Values Các đầu ra mong muốn

Decision Surface Mat quyét dinh Hyperplane Siéu phang Linearly Separable Kha phan tuyén tinh

Perceptron Training Rule Luat huan luyén perceptron

Unthresholded Perceptron perceptron không phân ngưỡng

Linear Unit Don vi tuyén tinh

Training Error Function Ham lôi

Local Minimum Cực tiêu cục bộ Global Minimum Cực tiêu toàn cục Incremental Gradient Descent Giảm độ dôc tang cường

Sigmoid Unit Don vi sigmoid

Learning By Pattern Hoc theo mau Learning By Epoch Hoc theo epoch Overall Error Lỗi tổng thé

Batch Learning Hoc theo bó

Momentum Term Hệ sô quán tinh Random Variable Biên ngâu nhiên Autocorrelation Hệ số tự tương quan

Probability Distribution Phan bo xac suat Autocorrelation Function Hàm tự tương quan Trend Xu hướng

Cyclical Chu ky Seasonal Mua

Measurable Function Ham kha danh gia

Validation Set Tập dữ liệu xác thực

Learning Rate Hệ số học YI Momentum Term Hệ số quán tinh Aw Epoches Số lần lặp tối đa

Residual Of Errors Độ lệch sai số

Single Network Một mạng no-ron SN

Multi Network Tập nhiều mạng nơ-ron MN

Exponential Smoothing Lam tron ham mi

Moving Average M6 hinh ARIMA ARIMA

Single Exponential Smoothing | Lam trơn ham mũ bac nhất

Holt’s method Phuong phap Holt Winter’s method Phuong phap Winter

LÝ LỊCH TRÍCH NGANG

Họ và tên: Lê Minh Nam Ngày sinh: 20/05/1990

Nơi sinh: Đồng Nai Địa chỉ liên lạc: 442/119/49/5 KP3, P.An phú đông, Q.12, TP.HCMEmail: lenam20510@ gmail.com

QUA TRINH DAO TAO

Thoi gian Trường dao tao Chuyén nganh Trinh độ đào tạo

2006-2012 Trường đại học Công | Khoa Học Máy Tính | Kỹ Sư

2013-2015 Trường đại học Bách | Khoa Học Máy Tính | Thạc Sỹ

Ngày đăng: 09/09/2024, 15:34

HÌNH ẢNH LIÊN QUAN

Hình 2.1 Mot mang no-ron nhân tao truyền thăng [14] - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 2.1 Mot mang no-ron nhân tao truyền thăng [14] (Trang 16)
Hình 2.2: Vi du chọn điểm cực trị với độ nén 91% (trái) và và 94% (phải) [10] - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 2.2 Vi du chọn điểm cực trị với độ nén 91% (trái) và và 94% (phải) [10] (Trang 18)
Hình 2.7: Chuỗi đữ liệu sau khi lấy mẫu có chiéu dai 400 dimg phương pháp nội suy spline - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 2.7 Chuỗi đữ liệu sau khi lấy mẫu có chiéu dai 400 dimg phương pháp nội suy spline (Trang 22)
Hình 2.6: Chuỗi dữ liệu ban đầu có chiếu dai 470 điểm [3] - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 2.6 Chuỗi dữ liệu ban đầu có chiếu dai 470 điểm [3] (Trang 22)
Hình 2.9: Minh họa phép vị tự tâm O, hệ số vị tự k =1/2 - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 2.9 Minh họa phép vị tự tâm O, hệ số vị tự k =1/2 (Trang 23)
Hình 2.8: Chuỗi dit liệu sau khi lấy mau có chiêu dài 300 ding phương pháp nội suy spline - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 2.8 Chuỗi dit liệu sau khi lấy mau có chiêu dài 300 ding phương pháp nội suy spline (Trang 23)
Hình 2.10: Chuỗi dit liệu sau khi lấy mau có chiếu dai 150 điểm ding phương pháp vi tự - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 2.10 Chuỗi dit liệu sau khi lấy mau có chiếu dai 150 điểm ding phương pháp vi tự (Trang 25)
Hình 2.11: Chuỗi di liệu sau khi lấy mẫu có chiều dai 2000 điểm dùng phương pháp vị tự - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 2.11 Chuỗi di liệu sau khi lấy mẫu có chiều dai 2000 điểm dùng phương pháp vị tự (Trang 26)
Hình 3.1: Độ tăng nhiệt độ trung bình hang năm từ 1856 đến 2005 [5] - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 3.1 Độ tăng nhiệt độ trung bình hang năm từ 1856 đến 2005 [5] (Trang 29)
Hình 3.2 Chuỗi thời gian có tinh mùa [5] - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 3.2 Chuỗi thời gian có tinh mùa [5] (Trang 29)
Hình 3.3 Don vị mạng no-ron [8] - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 3.3 Don vị mạng no-ron [8] (Trang 34)
Hình 3.6 Mô hình học có giám sát [8] - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 3.6 Mô hình học có giám sát [8] (Trang 37)
Hình 3.8 (a) là một tập mẫu khả phân tuyến tính có thể được phân ra bởi một mặt quyết định của perceptron - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 3.8 (a) là một tập mẫu khả phân tuyến tính có thể được phân ra bởi một mặt quyết định của perceptron (Trang 39)
Hình 3.11 mô tả mã giả cho giải thuật lan truyền ngược có áp dụng hệ số quán tính. Giải thuật lan truyền ngược cần hai thông số nhập vào đó là hệ số học và hệ số quán tính - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 3.11 mô tả mã giả cho giải thuật lan truyền ngược có áp dụng hệ số quán tính. Giải thuật lan truyền ngược cần hai thông số nhập vào đó là hệ số học và hệ số quán tính (Trang 48)
Hình 3.13: Vi du giải thuật k-means [4] - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 3.13 Vi du giải thuật k-means [4] (Trang 50)
Hình 4.1: Vi du dit liệu chứng khoán - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 4.1 Vi du dit liệu chứng khoán (Trang 53)
Hình 4.2: Vi du về những phân đoạn có thé tương tự nhau - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 4.2 Vi du về những phân đoạn có thé tương tự nhau (Trang 54)
Hình 4.3: Mô hình dự báo dùng nhiều mạng no-ron - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 4.3 Mô hình dự báo dùng nhiều mạng no-ron (Trang 55)
Hình 5.1: Dữ liệu chứng khoán với 114789 điểm - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 5.1 Dữ liệu chứng khoán với 114789 điểm (Trang 61)
Bảng 5.4: Kết quả đánh giá - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Bảng 5.4 Kết quả đánh giá (Trang 63)
Hình 5.4: Dữ liệu tỉ gid AUD/USD với 7927 điểm - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 5.4 Dữ liệu tỉ gid AUD/USD với 7927 điểm (Trang 64)
Hình 5.5: Kết quả phân đoạn va huấn luyện đữ liệu ti giá AUD/USD Bảng 5.7 là đánh giá kết quả dự báo giữa 2 phương pháp. - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 5.5 Kết quả phân đoạn va huấn luyện đữ liệu ti giá AUD/USD Bảng 5.7 là đánh giá kết quả dự báo giữa 2 phương pháp (Trang 65)
Hình 5.7: Dữ liệu tỉ giá AUD/GBP với 7927 điểm - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 5.7 Dữ liệu tỉ giá AUD/GBP với 7927 điểm (Trang 66)
Hình 5.8: Kết qua phân đoạn va huấn luyện dữ liệu tỉ gid AUD/GBP Bảng 5.10 là kết quả đánh giá dự báo giữa 2 phương pháp. - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 5.8 Kết qua phân đoạn va huấn luyện dữ liệu tỉ gid AUD/GBP Bảng 5.10 là kết quả đánh giá dự báo giữa 2 phương pháp (Trang 67)
Bảng 5.10: Kết quả đánh giá giữa 2 phương pháp - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Bảng 5.10 Kết quả đánh giá giữa 2 phương pháp (Trang 68)
Hình 5.11: Kết quả phân đoạn và huấn luyện dữ liệu nhu cầu ở Y - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 5.11 Kết quả phân đoạn và huấn luyện dữ liệu nhu cầu ở Y (Trang 69)
Bảng 5.11: Các thông số tách chuỗi con - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Bảng 5.11 Các thông số tách chuỗi con (Trang 69)
Bảng 5.12: Các thông số huấn luyện một mạng no-ron - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Bảng 5.12 Các thông số huấn luyện một mạng no-ron (Trang 70)
Hình 5.13: Dữ liệu doanh nghiệp - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 5.13 Dữ liệu doanh nghiệp (Trang 71)
Hình 5.14: Kết quả phân đoạn và huấn luyện dữ liệu doanh nghiệp - Luận văn thạc sĩ Khoa học máy tính: Kết hợp gom cụm và một tập hợp mạng nơ-ron để dự báo dữ liệu chuỗi thời gian
Hình 5.14 Kết quả phân đoạn và huấn luyện dữ liệu doanh nghiệp (Trang 71)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN