ISSN 1859 1531 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 11(96) 2015, QUYỂN 2 35 ỨNG DỤNG MÔ HÌNH HỖN HỢP TRONG ƯỚC LƯỢNG GIÁ TRỊ LỚN NHẤT VÀ NHỎ NHẤT CỦA NHIỆT ĐỘ MÔI TRƯỜNG NGÀY APPLICATION[.]
ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CƠNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 11(96).2015, QUYỂN 35 ỨNG DỤNG MƠ HÌNH HỖN HỢP TRONG ƯỚC LƯỢNG GIÁ TRỊ LỚN NHẤT VÀ NHỎ NHẤT CỦA NHIỆT ĐỘ MÔI TRƯỜNG NGÀY APPLICATION OF HYBRID MODEL IN ESTIMATING THE DAILY MAXIMUM AND MINIMUM VALUES OF THE ENVIRONMENT TEMPERATURE Đỗ Văn Đỉnh2, Đinh Văn Nhượng2, Trần Hoài Linh1 Trường Đại học Bách khoa Hà Nội; dodinh75@gmail.com, linh.tranhoai@hust.edu.vn Trường Đại học Sao Đỏ; nhuongdv2000@gmail.com, dodinh75@gmail.com Tóm tắt - Dự báo giá trị lớn nhỏ nhiệt độ môi trường ngày tốn có tính thực tiễn cao Đã có nhiều phương án đề xuất để dự báo hai đại lượng [1, 2], nhiên thông số mơ hình dự báo phụ thuộc vào điều kiện địa lý phát triển kinh tế khu vực cần dự báo Vì vậy, khu vực dự báo cần phải xác định lại thông số mơ hình đề xuất mơ hình phù hợp Bài báo đề xuất sử dụng mơ hình phối hợp mạng nơ-rôn nhân tạo MLP (Multi Layer Percepton) [3, 4] mơ hình tuyến tính để dự báo giá trị lớn nhỏ nhiệt độ môi trường ngày [5, 6] Các số liệu đầu vào giá trị lớn nhất, nhỏ nhiệt độ, độ ẩm ngày trước Đầu vào mơ hình đánh giá lựa chọn sử dụng thuật toán SVD (Singular Value Decomposition) Chất lượng giải pháp đề xuất kiểm nghiệm số liệu thực tế (1764 ngày từ 01/01/2010 đến 31/10/2014) tỉnh Bắc Ninh Abstract - The daily forecast of maximum and minimum of the ambient temperature is a problem with high applicability There have been many proposed methods to forecast these quantities [1, 2], however the parameters of the model depend strongly on regional geographical locations and economic indices Because of that, for each region, the forecast model needs to refine its parameters for better suitability This paper proposes a hybrid model consisting of an neural network MLP (Multi Layer Percepton) [3, 4] and a linear model to forecast the maximum and minimum of the daily environment temperature [5, 6] The input data is the daily maximum and minimum temperatures and humidity of previous days Model inputs were further evaluated and selected using an SVD (Singular Value Decomposition) algorithm The quality of the proposed solutions are tested on actual data (1764 days from 01/01/2010 to 31/10/2014) in Bac Ninh province Từ khóa - SVD; MLP; mơ hình tuyến tính; mơ hình phi tuyến; mơ hình hỗn hợp Key words - SVD; MLP; linear models; nonlinear models; hybrid model Đặt vấn đề Bài toán dự báo trường hợp đặc biệt toán ước lượng xây dựng mơ hình ánh xạ đầu vào đầu [5,6] Bài báo đề xuất mơ hình ước lượng hỗn hợp phối hợp ước lượng phi tuyến, ước lượng tuyến tính sử dụng cho hai toán ước lượng giá trị nhiệt độ lớn (max) nhỏ (min) ngày (gọi tắt Tmax Tmin) Trên Hình 1, tín hiệu đầu vào (x) véc-tơ chứa số liệu khứ; tín hiệu đầu (d) tổng hai thành phần ước lượng: ước lượng tuyến tính (dùng thuật tốn SVD) ước lượng phi tuyến (dùng mơ hình mạng MLP) Mơ hình hỗn hợp đề xuất Hình [5], theo đó: (1) d f ( x ) Linear ( x) NonLinear ( x) hay E p Linear (xi ) di i 1 (2) Sau có mơ hình tuyến tính, phần sai số cịn lại xấp xỉ mơ hình phi tuyến thuật tốn tối ưu hóa hàm sai số phi tuyến: i : NonLinear (xi ) di Linear (xi ) hay (3) p E NonLinear (xi ) (di Linear (xi )) i 1 Giả thiết giá trị Tmax ước lượng theo (4) (Giá trị Tmin làm tương tự): Tmax (d ) f1,2, , K (Tmax (d i ), Tmin (d i ), RH max (d i ), RH (d i )) (4) K Hình Cấu trúc mơ hình hỗn hợp Do việc xây dựng mơ hình tuyến tính (LN(x)) đơn giản có nhiều thuật toán hiệu hơn, nên báo ta xác định mơ hình tuyến tính trước, sau xác định mơ hình phi tuyến (NL(x)) Các mơ hình xây dựng sở mẫu cho trước Với số liệu gồm p mẫu {xi, di}, i=1, 2,…, p, mơ hình tuyến tính xác định sở tối ưu hóa hàm sai số tập mẫu số liệu này: i : Linear (xi ) d i ai1 Tmax (d i ) Tmin (d i ) i 1 RH max ( d i ) RH ( d i ) f() hàm phi tuyến, aij hệ số mơ hình tuyến tính Trong báo này, mơ hình tuyến tính xác định thuật toán SVD (SVD-Singular Value Decomposition) [3, 4, 5, 7], mơ hình phi tuyến xấp xỉ sử dụng nơ-rôn truyền thẳng nhiều lớp (MLP-Multi Layer Perceptron) [4, 8, 9] Ứng dụng phối hợp SVD MLP mơ hình hỗn hợp để dự báo 2.1 Các thuật tốn xây dựng mơ hình tuyến tính phi tuyến 2.1.1 Ứng dụng thuật toán SVD toán tối ưu hóa tuyến tính Bài tốn xây dựng mơ hình tuyến tính đưa 36 Đỗ Văn Đỉnh, Đinh Văn Nhượng, Trần Hồi Linh giải tìm nghiệm x hệ phương trình: (5) Trường hợp số phương trình nhiều số ẩn, nên thường khơng có nghiệm nhất, nghiệm hệ phương trình xác định từ tốn tối ưu hóa sai số (còn gọi residue r) định nghĩa bởi: A x b r ? (6) A x = b Nghiệm toán tối ưu (6) xác định dựa kết phân tích ma trận A theo giá trị kỳ dị Theo [5], với ma trận A mn khơng vng, ta xác định ma trận A nm từ phân tích SVD ma trận T A Với A U S V Hình Cấu trúc mạng MLP với lớp ẩn Mạng MLP với lớp ẩn đặc trưng A VS U (7) thông số sau: N–số đầu vào, M–số nơron thuộc lớp ẩn, với U, V ma trận trực giao, K–số nơ-rôn lớp đầu ra; hàm truyền đạt f1 lớp 1 S diag ( , , , ) nm - ma trận đường chéo ẩn f2 lớp đầu ra; ma trận trọng số W M ( N 1) 1 r kết nối lớp đầu vào lớp ẩn, ma trận trọng số kết 2.1.2 Mạng MLP ứng dụng xây dựng mơ hình nối V K ( M 1) lớp ẩn lớp đầu dự báo phi tuyến [3, 4, 7, 8, 9, 10] Nhiệm vụ q trình xây dựng mơ hình lựa chọn MLP mạng nơ-rơn nhiều lớp ứng dụng nhiều cấu trúc mạng ứng với cấu trúc chọn cần thực tế [8,9] xây dựng từ phần tử xác định giá trị trọng số ghép nối W V, cho gọi nơ-rơn Mơ hình nơ-rơn Hình [4] đáp ứng đầu mạng gần giống với giá trị đích Trong báo này, nhóm tác giả dùng thuật tốn Levenberg – Marquadrt, sử dụng đạo hàm bậc hàm sai số để xác định giá trị trọng số [7] 2.2 Mơ hình hỗn hợp dự báo Tmax, Tmin ngày Mơ hình hỗn hợp áp dụng ví dụ cho số liệu nhiệt độ, độ ẩm mơi trường khứ khu vực tỉnh Bắc Ninh, (a) 1764 ngày (từ 01/01/2010 đến 31/10/2014) Ta sử dụng 1564 ngày làm số liệu học dùng để xây dựng, điều chỉnh thích nghi tham số mơ hình ước lượng Số liệu 200 ngày lại dùng để kiểm tra chất lượng mơ hình ước lượng Trên Hình Hình số liệu học số liệu kiểm tra cho giá trị Tmax, Tmin Từ phương trình (4), hàm quan hệ tuyến tính Tmax (b) ngày d với Tmax ngày khứ xác Hình Mơ hình tốn học mạng nơ-rơn: mơ hình đầy đủ (a) định từ hệ phương trình ước lượng xấp xỉ công rút gọn (b) thức (8) (9) Từ (9) ta cần xác định véc-tơ Với phần tử nơ-rôn này, ta xây dựng T a a1 , a2 , , a K để đạt cực tiểu hàm sai số ước mơ hình cấu trúc mạng nhiều lớp, bao gồm lớp đầu vào X, lớp đầu Y số lớp gọi lớp ẩn Ví dụ, cấu lượng Trong thực tế áp dụng, ta cần trả lời hai câu hỏi: Cần sử dụng số liệu khứ?; trúc mạng MLP với lớp ẩn thể Hình Đó số liệu nào?: a1 Tmax ( K ) a2 Tmax ( K 1) aK Tmax (d K ) Tmax ( K 1) a T ( K 1) a T ( K 2) a T (d K 1) T ( K 2) max max K max max a1 Tmax ( N max 1) a2 Tmax ( N max 2) aK Tmax ( N max K ) Tmax ( N max ) (8) T Tmax ( K 1) Tmax (1) Tmax ( K ) a1 Tmax ( K 1) Tmax ( K 1) Tmax ( K 2) Tmax (2) a2 Tmax ( K 2) . Tmax ( N max 1) Tmax ( N max 2) Tmax ( N max K ) aK Tmax ( N max ) Trong báo này, phương pháp xác định thích nghi đề xuất áp dụng, cụ thể: (9) Trước tiên ta sử dụng số lượng lớn số liệu khứ (trong báo ta sử dụng K=60 - tương đương tháng số liệu trước - đủ lớn để dự báo ngày ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 11(96).2015, QUYỂN tiếp theo) Với K số liệu khứ, ta xác định véc-tơ T a a1 , a2 , , a K hàm ước lượng tuyến tính K Tmax (d ) Tmax d i phương pháp phân tích i 1 dùng SVD Xác định thành phần có giá trị tuyệt đối nhỏ véc-tơ a Thành phần tương ứng với ngày q khứ có ảnh hưởng tới ngày dự báo Ta loại bỏ ngày khỏi số liệu khứ, giảm K=K-1, quay lại bước K > Kmin chọn trước Quá trình lặp bước 2-3 tiếp tục K giảm xuống giá trị đủ nhỏ chấp nhận để mơ hình khơng q phức tạp, khó sử dụng thực tế Cụ thể báo ta chọn Kmin