Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 27 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
27
Dung lượng
533,34 KB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI ĐỖ VĂN ĐỈNH XÂYDỰNGMƠHÌNHDỰBÁOMỘTSỐTHƠNGSỐKHÍTƯỢNGCHOĐỊABÀNTỈNHHẢIDƯƠNG Ngành : Kỹ thuật điều khiển tự động hóa Mã số : 9520216 TĨM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HĨA Hà- Nội - - 2018 Cơng trình hoàn thành tại: Trường Đại học Bách khoa Hà Nội Người hướng dẫn khoa học: PGS.TSKH Trần Hoài Linh TS Đinh Văn Nhượng Phản biện 1:………………………………… Phản biện 2:………………………………… Phản biện 3:………………………………… Luận án bảo vệ trước Hội đồng đánh giá luận án tiến sĩ cấp Trường họp Trường Đại học Bách khoa Hà Nội Vào hồi …… giờ, ngày … tháng … năm ……… Có thể tìm hiểu luận án thư viện: Thư viện Tạ Quang Bửu - Trường ĐHBK Hà Nội Thư viện Quốc gia Việt Nam -2- MỞ ĐẦU Tính cấp thiết đề tài Đã có nhiều mơhình giải pháp đề xuất ứng dụngdựbáothơngsốkhí tượng, nhiên thời điểm chưa có mơhình coi chuẩn áp dụng hiệu cho đối tượngMột nguyên nhân vấn đề vùng, khu vực thơngsốkhítượng phụ thuộc khác vào số liệu khứ Sự khác đòi hỏi phải điều chỉnh lại thơngsốmơhình lựa chọn đến mức độ phải xâydựngmơhình hồn tồn Cũng lý đó, nên ta sử dụng giải pháp phần mềm có sẵn nước ngồi gặp số hạn chế sau: − Không chủ động cơng nghệ, thuật tốn, giải pháp, hạ tầng kèm theo; − Các phần mềm nước thường có u cầu phức tạp thơng tin đầu vào (ảnh vệ tinh, hệ thống đo nhiều tầng khí quyển,…), chi phí thu thập thơng tin đầu vào cao, hệ thốngtính tốn cấu hình lớn (u cầu máy chủ mạnh mạng nhiều máy tính chạy song song), sử dụng phức tạp; − Không chủ động việc điều chỉnh thông số, điều chỉnh yêu cầu người sử dụngđịa phương, Để khắc phục tồn trên, Luận án đề xuất: − Xâydựng giải pháp chohai toán dựbáo ước lượng thơngsốkhítượng phổ biến là: mơhìnhdựbáo ngắn hạn thơngsốkhítượng dựa vào kết đo khứ mơhình ước lượng thơngsốkhítượng dựa kết đo trạm quan trắc lân cận; − Các giải pháp đạt hướng đến mục tiêu: thông tin đầu vào ít, dễ thu thập điều kiện Việt Nam đảm bảo độ xác phù hợp, chủ động thuật toán để thuận tiện cho việc điều chỉnh mơhình nhằm tối ưu hóa theo số liệu địa phương -1- Mục đích nghiên cứu Xâydựngmơhìnhdựbáo ngắn hạn thơngsốkhítượng (thử nghiệm với haithơngsố nhiệt độ độ ẩm) dựa kết đo q khứ, Xâydựngmơhình ước lượng thơngsốkhítượng dựa kết đo thời điểm điểm đo lân cận Các mơhìnhdựbáo hướng tới mục tiêu đạt yêu cầu: − Dựbáothôngsốkhítượngcho nhiều địa điểm; − Thu thập số liệu khơng q phức tạp; − Hạ tầng tính tốn không cần cao; − Làm chủ công nghệ xâydựngmơhìnhdựbáo ước lượng thơngsốkhítượng Đối tượng phạm vi nghiên cứu 3.1 Đối tượng nghiên cứu − Các mơhình ước lượng phi tuyến để ứng dụng toán dựbáo toán ước lượng; − Bộ số liệu Đài Khítượng Thủy văn Khu vực Đồng Bắc Bộ cung cấp: thôngsố quan trắc (nhiệt độ lớn nhất, nhỏ nhất; độ ẩm lớn nhất, nhỏ nhất; tốc độ gió lớn nhất, nhỏ nhất; lượng mưa trung bình số nắng ngày); địa điểm quan trắc (tỉnh Thái Bình, Hưng Yên, Bắc Ninh, Quảng Ninh, thị xã Chí Linh, thành phố Hải Phòng thành phố Hải Dương); thời gian quan trắc từ 01/01/2010 đến 31/12/2015 − Phần mềm mô sử dụng Luận án: Matlab 7.11 (R2010b) thư viện LS-SVM1.8; 3.2 Phạm vi nghiên cứu − Nghiên cứu lý thuyết mơhìnhdựbáothơngsốkhí tượng; mơhình ứng dụng mạng nơ-rơn nhân tạo tốn ước lượng, dựbáothơngsốkhí tượng; − Xâydựngmơhình mạng nơ-rơn dự báo, ước lượng thơngsốkhítượng (nhiệt độ, độ ẩm lớn nhỏ ngày) chođịabàntỉnhHảiDương dựa kết đo khứ điểm quan trắc lân cận -2- Phương pháp nghiên cứu − Thu thập số liệu: số liệu đo nêu − Thực nghiệm: đánh giá sai sốmôhình mẫu số liệu, lựa chọn mơhình có sai số kiểm tra nhỏ Ý nghĩa khoa học thực tiễn đề tài 5.1 Ý nghĩa khoa học Đề xuất phương pháp ứng dụng kỹ thuật SVM mơhình lai để phân tích, xử lý dựbáosốthơngsốkhítượng điển hình nhiệt độ độ ẩm: − Xâydựngmơhìnhdựbáo nhiệt độ, độ ẩm lớn nhỏ dựa kết đo q khứ; − Xâydựngmơhình ước lượng nhiệt độ, độ ẩm lớn nhỏ dựa kết đo khu vực lân cận 5.2 Ý nghĩa thực tiễn đề tài Góp phần bổ sung số lượng giải pháp để tạo điều kiện cho việc lựa chọn ứng dụng thực tế dễ dàng Phương pháp yêu cầu sử dụngsố liệu đo quan trắc khứ kết đo quan trắc khu vực lân cận để dự báo, ước lượng thơngsốkhítượng nên việc thu thập số liệu đơn giản, tính kinh tế cao Những đóng góp Luận án Luận án có đóng góp sau: − Đã đề xuất mơhình lai gồm khối tuyến tính SVM để áp dụngcho toán ước lượng phi tuyến Mơhình lai có độ xác cao mơhình SVM sốmơhình phi tuyến khác; − Sử dụngmơhình lai đề xuất để xâydựng giải pháp có độ xác cao cho tốn dựbáothơngsốkhítượng dựa kết đo khứ; − Sử dụngmơhình lai đề xuất để xâydựng giải pháp có độ xác cao cho tốn ước lượng thơngsốkhítượng dựa kết đo trạm quan trắc lân cận -3- Bố cục Luận án Mở đầu: Trình bày vấn đề chung Luận án, tóm tắt nội dung nghiên cứu, đóng góp bố cục Luận án Chương Tổng quan mơhìnhdựbáothơngsốkhí tượng: Trong chương trình bày tóm tắt sốmơhìnhdựbáokhítượng áp dụng điều kiện thực tế Từ định hướng nghiên cứu Luận án mô tả khái quát số liệu sử dụng Luận án Chương Mơhình lai ứng dụng vấn đề mơhình hóa phi tuyến: Luận án trình bày mơhình lai gồm chế làm việc mơ hình, phương pháp xâydựngmơhình phù hợp chothơngsố ứng dụngmơhình phi tuyến Ngồi ra, Luận án trình bày số ví dụ ứng dụngmơhình lai để ước lượng hàm phi tuyến trình bày để minh họa cho khả tốt mơhình lai vấn đề Chương Xâydựng giải pháp dự báo, ước lượng sử dụngmơhình lai: Luận án trình bày cách xâydựngmơhình lai Chương Các kết tính tốn mơ phỏng: Trình bày kết nghiên cứu đề xuất chương 3, đánh giá độ xác mơhình đề xuất Tiếp theo kết luận kiến nghị Luận án với vấn đề cần nghiên cứu tiếp, tài tài liệu tham khảo, cơng trình công bố quan đến Luận án phần phụ lục Chương 1: TỔNG QUAN VỀ CÁC MƠHÌNHDỰBÁOTHƠNGSỐKHÍTƯỢNG 1.1 Đặt vấn đề Trình bày tổng quan mơhìnhdựbáothơngsốkhí tượng, phương pháp dựbáokhí tượng, mơhìnhdựbáo ứng dụng giới, Việt Nam số đề xuất nghiên cứu Luận án -4- 1.2 Mộtsố phương pháp dựbáothơngsốkhítượng Với phát triển khoa học kĩ thuật, nhiều mơhìnhdựbáothơngsốkhítượng đời [12, 15, 16, 19, 24, 27] đưa vào ứng dụngdựbáo nghiệp vụ nhiều trung tâm dựbáokhítượng giới Hiện nay, giới có nhiều nghiên cứu phương pháp dựbáothơngsốkhí tượng, nghiên cứu chia làm số nhóm phương pháp sau: Phương pháp synopse [27]; Phương pháp thống kê (Statistical methods) [22, 65, 79]; Phương pháp số trị (Numerical methods) [10, 27, 36] − Phương pháp dựbáo phối kết hợp (Ensemble forecast methods) [61, 83] 1.3 Các mơhìnhdựbáothơngsốkhítượng ứng dụng giới Những nghiên cứu giới từ trước tới cho thấy tính ưu việt mơhìnhsố trị, mơhình chia thành bốn nhóm chủ yếu chia làm hai loại bản: mơhìnhsố trị tồn cầu mơhìnhsố trị khu vực Sau sốmơhìnhsố trị tồn cầu khu vực nghiên cứu, phát triển ngồi nước 1.3.1 Mộtsốmơhìnhsố trị tồn cầu Mơhìnhdựbáo trường số trị tồn cầu RHMC [95] quan Khítượng Thuỷ văn Liên bang Nga xâydựng đưa vào dựbáo nghiệp vụ với hạn dựbáo cách 6h lần từ 12h đến 240h (10 ngày) Mơhình có ký hiệu T85L31 Mơhình GME [53] (Global Model for Europe) Cơ quan Khítượng Cộng hòa Liên bang Đức (DWD) đưa vào dựbáo nghiệp vụ từ cuối năm 1999 (độ phân giải khoảng 60 km) GME mơhìnhxâydựngcho 06 biến nhiệt độ, khí áp, nước, nước lỏng mây hai thành phần gió ngang Mơhình AVN Trung tâm Quốc gia Dựbáo Môi trường Mỹ (National Centers for Environmental Prediction - NCEP) [92] mơhình phổ dựbáo hạn ngắn tồn cầu Mơhìnhdựbáo hạn vừa MRF (Medium Range Forecast Model) NCEP -5- (Mỹ) mơhình phổ sử dụng hệ toạ độ theo phương thẳng đứng Đây mơhìnhdựbáo với hạn dựbáo lớn 48h giới Mơhình MRF có độ phân giải ngang khoảng 150 km đưa vào dựbáo nghiệp vụ Mỹ từ năm 1995 Hiện nay, NCEP thực dựbáo hạn vừa dài (đến 384h hay 16 ngày) mơhình MRF Mơhình GFS (Global Forecasting System) [92] NCEP mơhình phổ tồn cầu, bắt đầu đưa vào sử dụng nghiệp vụ Trung tâm Khítượng quốc gia NMC (National Meteorological Centre), tiền thân NCEP từ năm 1988 Mơhình GSM (Global Spectral Model) [93] mơhình phổ tồn cầu Cơ quan Khítượng Nhật Bản (JMA) GSM bắt đầu đưa vào sử dụng nghiệp vụ JMA từ năm 1988 1.3.2 Mơhìnhsố trị khu vực a Mơhình ETA [59, 66] Mơhình khu vực hạn chế ETA Trường Đại học Belgrade Viện Khítượng Thuỷ văn Belgrade với Trung tâm Khítượng quốc tế Mỹ xâydựng áp dụngcho đối tượng đặc biệt khu vực có địahình núi b Mơhình RAMS (Regional Atmospheric Modeling System) [67] Phiên mơhình RAMS đời vào năm 1993, kết kết hợp haimơhình có tính chất giống nhau: mơhình mây quy mơ vừa Tripoli Cotton mơhình mây thuỷ tĩnh Tremback c Mơhình HRM (High Resolution Regional Model) [90] HRM mơhìnhsố thuỷ tĩnhchodựbáo thời tiết khu vực hạn chế quy mơ vừa, sử dụng hệ phương trình bao gồm nhiều đối tượng vật lý như: xạ, mơhình đất, trình rối lớp biên, tạo mưa theo lưới, đối lưu nơng/sâu, d Mơhình WRF (Weather Research and Forecasting) [97] Mơhình WRF hình thành Trung tâm quốc gia Nghiên cứu Khí Mỹ (National Center of Atmospheric Research-NCAR) với đóng góp nhiều quan khítượng đại học Hoa Kỳ giới -6- e Mơhình MM5 [94] Mơhìnhkhítượng động lực quy mơ vừa MM5 mơhình hệ NCAR Trường Đại học Tổng hợp Pennsylvania Mỹ (PSU) MM5 nhiều quan phủ (như Nha KhíTượng Hoa Kỳ NASA) nhiều trường đại học danh tiếng Hoa Kỳ quốc gia khác giới Âu Châu, Hồng Kông Đài Loan dùng để làm dựbáo thời tiết 1.4 Các mơhìnhdựbáokhítượng ứng dụng Việt Nam Qua nghiên cứu tìm hiểu, 100% mơhìnhdựbáo thời tiết nghiên cứu khai thác ứng dụng Việt Nam nhập ngoại, chủ yếu sử dụngmơhìnhsố trị khu vực tóm tắt 1.5 Mộtsốmơhìnhdựbáothơngsốkhítượngdùng mạng nơ rôn Mạng nơ-rôn nhân tạo (Artificial Neural Networks-ANN) cơng cụ mơhình hóa phi tuyến sử dụng phổ biến nhiều ưu điểm bật như: có thuật tốn học để điều chỉnh tự động thôngsố mạng để giảm sai sốsố liệu mẫu, lựa chọn cấu trúc đơn giản phức tạp để phù hợp với đối tượngmơ [38,48,51,60,75] Có nhiều dạng mạng đề xuất ứng dụng mạng MLP (Multi Layer Perceptron), mạng Hopfield, mạng Elman, mạng RBF (Radial Basis Function), mạng lô-gic mờ [49,50, 63,77,78] Gần mạng Deep Learning [57] Các ứng dụngmơhình phi tuyến nói chung tốn dựbáothơngsố thời tiết, khí tượng, mơi trường mạng nói riêng phong phú Nội dung chương I đề cập tới nhóm giải pháp: nhóm giải pháp thương mại sử dụng thực tế, hai nhóm giải pháp (đang mức độ nghiên cứu, mô phỏng) giới thiệu tài liệu tham khảo Đối với giải pháp thương mại, phần mềm mã nguồn đóng nên khơng có đầy đủthông tin giải pháp ứng dụng -7- bên Nhược điểm chung giải pháp yêu cầu cao thôngsố đầu vào hạ tầng tính tốn, giá thành đắt, khó chủ động cập nhật hay điều chỉnh theo yêu cầu địa phương Đối với giải pháp tổng hợp từ báo khoa học, NCS tìm hiểu trình bày nhiều mơhình tốn học sốthôngsố tác giả đưa Tuy nhiên khó khăn chung so sánh mơhình sử dụngchođịa điểm khác nhau, thôngsố đầu vào đầu khác Vì so sánh dừng mức độ định 1.6 Đề xuất Luận án Hiện nay, việc áp dụngmơhìnhdựbáothơngsốkhítượng tiên tiến khơng phù hợp với điều kiện HảiDương do: − Kinh phí thu thập số liệu lớn − Hạ tầng máy tính cơng nghệ thơng tin khơng đáp ứng − Khơng chủ động cơng nghệ nên khó điều chỉnh thơngsốmơhìnhcho phù hợp với tỉnhHảiDương Để khắc phục tồn Luận án đề xuất giải pháp thực nhiệm vụ sau: − Dựbáothơngsốkhítượngcho nhiều địa điểm; − Thu thập số liệu không q phức tạp; − Hạ tầng máy tính khơng cần q cao; − Xâydựngmơhình ước lượng dựbáo phù hợp với thực tế HảiDương Chương 2: MƠHÌNH LAI VÀ ỨNG DỤNG TRONG CÁC VẤN ĐỀ MƠHÌNH HĨA PHI TUYẾN 2.1 Giới thiệu chung Đã có nhiều cơng trình nghiên cứu chứng minh công cụ mạng véc-tơ hỗ trợ SVM (Support Vector Machines) có khả tốt khơng toán nhận dạng phân loại mẫu rời rạc mà tốn ước lượng hàm phi tuyến [70, 76, 85] Trong Luận án NCS đề -8- hình ước lượng nội suy dạng hàm biến thiên liên tục nên Luận án sử dụngmơhình SVR Nhiều ý tưởng SVR xuất phát từ công thức gốc SVM nên Luận án trình bày tóm tắt công thức trước giới thiệu SVR 2.4.2 Bài toán phân lớp nhị phân Bài toán phân lớp nhị phân [85] phát biểu sau: Cho tập liệu gồm p mẫu huấn luyện xi , di , i = 1,2, , p, xi N di 1 đầu rời rạc nhận giá trị đại diện chohai nhóm số liệu Tìm siêu phẳng wT x + b = để tách tập liệu thành lớp cho: wT xi + b → yi = 1; wT xi + b −1 → yi = −1 Do tồn nhiều mặt phẳng phân cách, nên để có nghiệm xác định nhất, ta bổ sung thêm điều kiện tổng khoảng cách từ điểm gần hai nhóm tới mặt phân cách (còn gọi véc-tơ hỗ trợ) lớn [85] 2.4.3 Kỹ thuật SVR (Support Vector Regression) Phát triển tiếp ý tưởng SVM dùng toán phân loại, giá trị đầu mã phân lớp (là giá trị rời rạc), SVM mở rộng để sử dụng toán ước lượng cách sử dụng hàm tổn thất (lost function) Lúc này, kỹ thuật SVM gọi máy véc-tơ đỡ ước lượng (SVR – Support Vector Regression) 2.4.4 Phương pháp LS-SVM Phương pháp LS-SVM cải tiến dựa kỹ thuật SVR [23] Xét liệu học gồm p điểm xk , yk k =1 với p liệu đầu vào xk N đầu yk Trong không gian đặc trưng, phương pháp LS-SVM có dạng: (2.6) y ( x) = wT ( x) + b Các thôngsốmơhình xác định việc tối ưu - 11 - hóa hàm giá trị phạt: T p (2.7) Minimize : w w + ek 2 k =1 với ek = y ( xk ) − wT ( xk ) + b , k = 1,2, , p sai số − thơngsố điều chỉnh Bài tốn ước lượng chuyển thành dạng phi tuyến sử dụng hàm nhân K ( x, xk ) sau: p y ( x) = k K ( x, xk ) + b (2.8) k =1 Hàm sở xuyên tâm (RBF) LS-SVM sử dụng hàm nhân với công thức sau: ( xk − xl ) ( xk − xl )T K ( xk , xl ) = exp − , k = 1, , p độ rộng hàm RBF 2.5 Ví dụ ứng dụng minh họa Trình bày ví dụ kiểm chứng khả ứng dụng SVM toán ước lượng hàm phi tuyến khả mơhình lai dùng SVM mơhìnhdùng SVM trực tiếp 2.6 Kết luận chương Luận án đề xuất sử dụng SVM để ước lượng khối phi tuyến mơhình lai, cải thiện độ xác so với mơhình lai dùng mạng MLP sử dụng [5] Để so sánh tính ưu việt mơhình lai tốn ước lượng hàm phi tuyến, Luận án tiến hành thực nghiệm, kết mơhình lai sử dụng SVM cho sai số tốt sử dụng trực tiếp mạng SVM sở để Luận án đề xuất sử dụngmơhình lai để ước lượng, dựbáothơngsốkhítượng - 12 - Chương 3: XÂYDỰNG CÁC GIẢI PHÁP DỰ BÁO, ƯỚC LƯỢNG XỬ DỤNGMƠHÌNH LAI 3.1 Đặt vấn đề Luận án tiến hành xâydựnghai giải pháp dựbáothôngsốkhítượng điểm dựa số liệu đo q khứ (còn gọi tắt tốn dự báo), ước lượng thơngsốkhítượng vị trí dựa số liệu đo điểm lân cận (còn gọi tắt tốn ước lượng) Cả hai giải pháp sử dụngmơhình lai cho phần ước lượng hàm truyền đạt phi tuyến 3.2 Xâydựngmơhình lai cho tốn dựbáo 3.2.1 Lựa chọn đầu vào Trích chọn đặc tính đầu vào bước quan trọng trình nhận dạng, điều khiển tín hiệu hay dự báo… sau thu thập cách loại bỏ thơng tin đặc trưng có khơng có thơng tin dự đốn 3.2.2 Xác định hệ số khối tuyến tính Từ phương trình (2.8), giả thiết ta có tập hợp N thơngsố T1, T2 , , TN đo thời gian, thơngsố có p mẫu: Ti1, Ti , , Tip (i = 1, , N ) Các mơhìnhdựbáoxâydựng độc lập chothơng số, mơhình có đầu tương ứng với giá trị thôngsố ngày Tuy nhiên đầu vào sử dụngchomơhình xác định độc lập (và danh sách đầu vào khác chomơ hình) Trước tiên thành phần quan hệ tuyến tínhthơngsố Ti ngày d với thơngsố Ti ngày khứ biểu diễn xác định từ hệ phương trình ước lượng xấp xỉ công thức (3.1) (3.2) Từ (3.2) ta cần xác định véc-tơ a = a1, a2 , , aK T để đạt cực tiểu hàm sai số ước lượng Trong thực tế áp dụng, ta xác định xem đầu vào chomơhìnhdựbáosố liệu khứ: - 13 - Ti (d − 2) Ti (d −1) T ( d − 2) Ti (d − 3) i Ti (d − p) Ti (d − p −1) Ti ( d − K ) a1 Ti (d ) Ti ( d − K −1) a2 Ti (d −1) = Ti ( d − p − K −1) aK Ti (d − p + 1) (3.1) Trước tiên danh sách đầu vào khứ tìm kiếm theo ý tưởng trình bày Chương khoảng thời gian đủ xa (Luận án chọn K=60 - tươngđương tháng khứ) để thử nghiệm Ví dụ, sử dụng phương pháp đánh giá theo hệ số khai triển tuyến tính, ta xét với K đầu vào khứ với số liệu nhiều mẫu có, ta xác định véc-tơ a = a1, , aK hàm T ước lượng tuyến tính Ti (d ) j =1 a j Ti ( d − j ) phương pháp khai triển ma trận dùng SVD Tiếp theo xác định thành phần có giá trị tuyệt đối nhỏ véc-tơ a Thành phần tương ứng với ngày khứ có ảnh hưởng tới ngày dựbáo Ta loại bỏ ngày khỏi số liệu khứ, giảm K=K-1, quay lại bước K > Kmin chọn trước Quá trình lặp bước 2-3 tiếp tục K giảm xuống giá trị đủ nhỏ chấp nhận để mơhình khơng q phức tạp, khó sử dụng thực tế Cụ thể Luận án ta chọn Kmin