Quá trình tìm kiếm ANN

Một phần của tài liệu Ảnh hưởng của phương pháp shuffle đối với giải thuật tiến hóa vi phân ứng dụng trong dự báo chuỗi thời gian (Trang 48 - 52)

CHƯƠNG I : TỔNG QUAN VỀ VẤN ĐỀ NGHIÊN CỨU

2.2. Quá trình tìm kiếm ANN

Để thiết kế ANN để dự báo chuỗi thời gian, một lược đồ mã hóa trực tiếp cho đầy đủ kết nối MLP đã được xem xét. Đề án trực tiếp này thông tin được đặt vào nhiễm sắc thể sẽ là: hai chữ số thập phân, nghĩa là hai gen, để hệ thống hóa số lượng đầu vào các nút (i); khác hai cho số nút ẩn (h); hai nhiều hơn cho các yếu

tố học tập (α); và 10 gen cuối cùng cho các giá trị giống khởi tạo các trọng số kết nối (s) (đó là lý do tại sao nó đã được sử dụng 10 gen (thập phân chữ số) để mã hóa "s"). Bằng cách này, các giá trị của "i", "h", "α" và "s" là thu được từ các nhiễm sắc thể vì nó có thể được nhìn thấy trong hình 2.2, Max_inputs và max_hidden là các thông số của hệ thống.

Quá trình tìm kiếm (DE) sẽ bao gồm các bước sau đây:

1. Một quần thể được tạo ngẫu nhiên, tức là một tập hợp các nhiễm sắc thể được tạo ra một cách ngẫu nhiên, thu được.

Hình 12: Quy trình mã hóa thông số ban đầu.

2. Các kiểu hình (ví dụ: ANN kiến trúc) và giá trị fitness của mỗi cá nhân của thế hệ hiện tại thu được. Để có được kết quả liên quan đến nhiễm sắc thể và giá trị fitness của nó:

 Cấu trúc liên kết của một cá nhân "i" từ thế hệ thực tế thu được.

 Sau đó, việc đào tạo và xác nhận mô hình tập con cho lưới thần kinh này "i" thu được từ dữ liệu chuỗi thời gian, tùy thuộc vào số lượng đầu vào các nút của lưới "i", vì nó đã nhận xét ở trên tại mục 2.1.1.

 Khi mỗi dòng được khởi tạo với cấu trúc liên kết của nó và các giá trị trọng số kết nối với các thông tin từ các nhiễm sắc thể, nó được huấn

luyện với BP. Kiến trúc (Topology và kết nối cân thiết) của ANN khi xác nhận lỗi là tối thiểu trong quá trình đào tạo sẽ được lưu lại. Đào tạo mô hình tập hợp con sẽ được sử dụng để huấn luyện ANN và các mô hình xác nhận tập hợp con sẽ được sử dụng để ước tính khả năng khái quát, lấy giá trị fitness của mình (Dừng quá trình đào tạo trước khi tập luyện quá sức đạt được). Vì vậy, kiến trúc này là kiểu hình của cá thể.

3. Khi mà các giá trị fitness cho toàn bộ quần thể thu được, DE khai thác vào quá trình huấn luyện và đột biến được áp dụng để tạo ra quần thể của thế hệ tiếp theo, tức là một tập mới của các nhiễm sắc thể.

4. Các bước 2 và 3 được lặp đi lặp lại cho đến khi thực hiện một số lượng tối đa các thế hệ đạt được. Một sơ đồ của quá trình tìm kiếm toàn bộ có thể được nhìn thấy ở hình 2.3 và hình 2.4. Các giá trị fitness cho mỗi cá thể sẽ được sau đó các lỗi xác nhận tối thiểu trong quá trình học tập (huấn luyện ANN), vì nó có thể được nhìn thấy trong phương trình dưới đây:

fitness function = minimum validation error.

5. Sau khi kết thúc đưa ra kết quả cho giá trị fitness tốt nhất qua nhiều thế hệ việc huấn luyện ANN và các giá trị tập mẫu được sử dụng xuyên suất trong toàn bộ quá trình, tính toán tổng hợp để đưa ra giá trị fitness tối ưu.

Hình 13: ANNs thiết kế theo lược đồ DE.

Hình 14: ANN thiết kế theo lược đồ DE của quá trình để có được fisness.

Về sử dụng MSE trong hàm mục tiêu, lý do là để giảm cực lỗi có thể ảnh hưởng đến rất nhiều bước trước dự báo. Ngoài ra, các thí nghiệm sơ bộ (sử dụng dữ liệu chỉ đào tạo và một vài bộ dữ liệu) đã chỉ ra rằng fitness MSE dẫn đến dự báo tốt hơn. Để chọn các gen thông số thuật toán, cùng với những kinh nghiệm thu được trong các thí nghiệm sơ bộ. Các thông số DE đã được thiết lập để: kích thước quần thể, 50; số lượng tối đa của các thế hệ, 100; Tỷ lệ tốt nhất cá nhân mà

ở lại không thay đổi cho thế hệ tiếp theo, 10%; chéo: cha mẹ được chia trong một thời điểm lựa chọn ngẫu nhiên, con là hỗn hợp của mỗi phần từ cha mẹ; xác suất đột biến sẽ được một phân chia giữa chiều dài của nhiễm sắc thể (1 / lengthchrom = 1/16 = 0,07), và nó sẽ được thực hiện cho mỗi gen của nhiễm sắc thể.

Để dự báo các giá trị tương lai không rõ (tại, theo số + 1, ..., tại + n) từng người một bằng cách sử dụng k giá trị trước đó được biết đến (tại - k, ..., tại - 2, tại - 1), các cá thể tốt nhất từ thế hệ cuối cùng là đã sử dụng. k là số lượng đầu vào của ANN thu được từ việc thực hiện DE (nghĩa là tốt nhất ANN từ quá trình tìm kiếm). Để dự đoán một vài giá trị liên tiếp (tại, theo số + 1, ..., tại + n) mỗi khi một giá trị mới (at) được dự báo, nó sẽ được đưa vào để vào trước giá trị đã biết thiết lập các chuỗi thời gian và sử dụng để dự báo một kế tiếp, theo số + 1 (từ 1 đến N trước dự báo).

Một phần của tài liệu Ảnh hưởng của phương pháp shuffle đối với giải thuật tiến hóa vi phân ứng dụng trong dự báo chuỗi thời gian (Trang 48 - 52)

Tải bản đầy đủ (PDF)

(63 trang)