Ứng dụng mạng nơron truyền thẳng nhiều lớp trong dự báo dữ liệu

Một phần của tài liệu Xây dựng mô hình mạng nơ ron dự báo dữ liệu và ứng dụng mô hình đó trong bài toán dự báo đỉnh lũ sông Trà Khúc tại trạm khí tượng Sơn Giang (Trang 60 - 62)

trong dự báo dữ liệu

Chơng này đề cập đến các vấn đề sau:

5.1. Sơ lợc về ứng dụng mạng nơ ron trong dự báo dữ liệu

5.2. Các bớc chính trong việc thiết kế mô hình mạng nơ ron dự báo

5.3. ứng dụng mạng nơ ron truyền thẳng nhiều lớp trong dự báo đỉnh lũ sông Trà Khúc trạm Sơn Giang

5.4. Chơng trình dự báo dữ liệu

5.1. Sơ lợc về ứng dụng mạng nơ ron trong dự báo dữ liệu

Mạng nơ ron truyền thằng có ứng dụng rộng rãi trong lĩnh vực dự báo dữ liệu, đặc biệt là ứng dụng trong các bài toán dự báo tiêu thụ năng lợng, dự báo kinh tế, dự báo các hiện tợng tự nhiên...

Dự báo dữ liệu là bài toán rất phức tạp cả về số lợng dữ liệu cũng nh độ chính xác của dữ liệu dự báo. Dữ liệu thu thập trong thực tế rất đa dạng và phong phú. Để có thể sử dụng luyện mạng nơ ron, dữ liệu phải đủ, đảm bảo độ chính xác, phải đợc làm sạch, đợc lợng hóa và mã hóa đa chúng về đoạn [0,1] hoặc [-1,1]. Để mạng có khả năng dự báo tốt, dữ liệu huấn luyện phải quét hết không gian dữ liệu thực. Mặt khác, việc chọn một cấu trúc mạng phù hợp với một bài toán thực tế cũng rất ảnh h - ởng đến khả năng dự báo. Đối với một bài toán thực tế, việc chọn cấu trúc mạng chính là việc chọn số nơ ron trong lớp ẩn (hay số nút ẩn), thông thờng sử dụng ph- ơng pháp thử sai (trial and errors). Ngoài ra, việc khởi tạo các tham số ban đầu của mạng trong quá trình huấn luyện nh giá trị các trọng số ban đầu, hằng số học ban đầu, hằng số học thích nghi, độ chính xác... cũng ảnh hởng không nhỏ tới khả năng

dự báo. Trong dự báo dữ liệu, ta chỉ có thể có đợc kết quả dự báo với độ chính xác nào đó chấp nhận đợc chứ không có đợc kết quả dự báo với độ chính xác 100%.

5.2. Các bớc chính trong việc thiết kế mô hình mạng nơ ron dự báoB B

ớc 1: Chọn lựa các biến

Nắm bắt đợc bài toán một cách tờng minh sẽ quyết định sự thành công trong việc thiết kế mô hình mạng nơ ron dự báo dữ liệu. Đối với một bài toán cụ thể, cần xác định các nhân tố ảnh hởng đến bài toán và phân định rõ các nhân tố nào là chính và nhân tố nào chỉ là các yếu tố ảnh hởng. Từ đó xác định đợc các biến đầu vào và biến đầu ra của mạng.

Về mặt dữ liệu, các biến có thể đợc chia thành hai loại dựa trên các đặc điểm và tính chất của chúng [15]. Việc phân loại này làm cơ sở để mã hóa dữ liệu đa vào mạng.

Biến phân loại (Categorical Variables)

Giữa chúng không xác định đợc các phép toán nh “lớn hơn” hay “nhỏ hơn”, chúng không có trị số nhng có thể đợc gán trị số khi đa vào mạng. Ví dụ kiểu màu

có thể nhận giá trị “xanh”, “đỏ” hoặc “vàng”...

Các biến thuộc loại này có thể đợc đa vào mạng bằng sơ đồ mã hóa 1-of-c, sơ đồ này mã hóa các giá trị của biến thành các xâu nhị phân có chiều dài bằng số các giá trị mà biến có thể nhận trong phạm vi bài toán. Một bit sẽ đợc bật lên tuỳ theo giá trị của biến, các bit còn lại sẽ đợc tắt. Trong ví dụ trên, biến kiểu màu cần ba biến vào, tơng ứng với ba màu đợc thể hiện bằng các xâu nhị phân 100, 010 và 001.

Một cách khác để mã hóa các biến phân loại là thể hiện tất cả các giá trị có thể vào một biến đầu vào liên tục. Ví dụ, các giá trị “đỏ”, ”xanh”, và “vàng” có thể đợc thể hiện bởi các giá trị số 0.0, 0.5, và 1.0. Điểm không tốt của phơng pháp này là tạo ra một trật tự nhân tạo trên dữ liệu mà trên thực tế, thứ tự này không hề có. Nhng đối với các biến với một số lợng lớn các phân loại, phơng pháp này có thể giảm rất nhiều số đơn vị đầu vào. Các biến kiểu này có thể đợc đa vào mạng bằng sơ đồ mã hóa 1-of-c

Các biến này có thứ tự tự nhiên xác định. Chúng có thể đợc chuyển trực tiếp thành các giá trị tơng ứng của một biến liên tục với một tỷ lệ nào đó.

Một phần của tài liệu Xây dựng mô hình mạng nơ ron dự báo dữ liệu và ứng dụng mô hình đó trong bài toán dự báo đỉnh lũ sông Trà Khúc tại trạm khí tượng Sơn Giang (Trang 60 - 62)

Tải bản đầy đủ (DOC)

(66 trang)
w