Dự báo lượng mưa tại một số trạm quan trắc Việt Nam dựa trên lập trình di truyền

10 83 1
Dự báo lượng mưa tại một số trạm quan trắc Việt Nam dựa trên lập trình di truyền

Đang tải... (xem toàn văn)

Thông tin tài liệu

Trong bài viết này, nghiên cứu trình bày một phương pháp mới để giải quyết bài toán dự đoán lượng mưa là lập trình di truyền (Genetic Programming - GP).

BÀI BÁO KHOA HỌC DỰ BÁO LƯỢNG MƯA TẠI MỘT SỐ TRẠM QUAN TRẮC VIỆT NAM DỰA TRÊN LẬP TRÌNH DI TRUYỀN Nguyễn Thị Hiền1, Nguyễn Xuân Hoài2, Đặng Văn Nam3, Ngơ Văn Mạnh4 Tóm tắt: Dự báo lượng mưa tốn thách thức nhất, thể đặc điểm độc đáo khơng tồn liệu chuỗi thời gian khác Hơn nữa, lượng mưa thành phần cần thiết cho việc áp dụng quy hoạch tài nguyên nước Chính vậy, viết tập trung vào việc dự đoán lượng mưa sử dụng liệu từ Cơ quan Khí tượng Việt Nam Hiện hầu hết nghiên cứu dự báo lượng mưa, trình dự báo thường bị chi phối mơ hình thống kê, cụ thể sử dụng chuỗi Markov mở rộng với dự báo lượng mưa (MCRP) Trong báo này, nghiên cứu trình bày phương pháp để giải toán dự đoán lượng mưa lập trình di truyền (Genetic Programming - GP) Đây lần GP sử dụng bối cảnh dự báo lượng mưa số thành phố Việt Nam Nghiên cứu so sánh hiệu suất GP thuật toán học máy khác SVM, MLP, DCT, kNN liệu khác thành phố Việt Nam báo cáo kết Mục tiêu để xem liệu GP có khả dự báo tốt so với phương pháp học máy khác hay không? Các kết nói chung GP vượt trội đáng kể so với phương pháp học máy khác, cách tiếp cận chủ đạo viết Từ khóa: Lập trình di truyền, dự báo lượng mưa Ban Biên tập nhận bài: 12/09/2019 Ngày phản biện xong: 20/10/2019 Ngày đăng bài:25/11/2019 Đặt vấn đề Mưa tượng quan trọng hệ thống khí hậu, có chất hỗn loạn có ảnh hưởng trực tiếp đến quy hoạch tài nguyên nước, nông nghiệp hệ thống sinh học Bài toán dự báo lượng mưa đặt nhiều trở ngại, nghiên cứu thực tiễn (lượng mưa tương đối khó để đo xác) Đã có nhiều nghiên cứu thực để giải toán Trong viết nghiên cứu mô tả việc sử dụng lập trình di truyền để áp dụng cho tốn dự báo lượng mưa tích lũy Mục đích viết khám phá xem GP có vượt trội so với cách tiếp cận khác thường áp dụng tốn dự báo lượng mưa hay khơng GP lựa chọn cho báo kỹ thuật học máy khác, GP đưa lời giải toán dạng hộp trắng (giúp ta hiểu phụ thuộc lời giải vào thuộc tính chọn, trái ngược với mơ hình hộp đen), cho phép ta hiểu sâu lời giải Hơn nữa, có hiểu phần phi tuyến mẫu liệu mà không cần giả định liên quan đến liệu Điều cho phép dễ dàng đưa mơ hình dự báo phản ánh q trình thay đổi lượng mưa Xa nữa, người dự báo nắm bắt sai lệch hàng năm mà số cách tiếp cận truyền thống làm (sử dụng chuỗi Markov để dự báo) Do đó, đóng góp viết Học viện Kỹ thuật quân Viện AI Việt nam Đại học Mỏ-Địa Chất Trung tâm Thông tin Dữ liệu khí tượng thủy văn Email: manh.ngovan@gmail.com; nguyenthihienqn@gmail.com TẠP CHÍ KHÍ TƯỢNG THỦY VĂN Số tháng 11 - 2019 BÀI BÁO KHOA HỌC nghiên cứu đề xuất GP với số thay đổi nhỏ áp dụng cho toán dự báo lượng mưa so sánh hiệu suất dự đốn so với phương pháp học máy khác thường áp dụng cho toán dự báo tương tự Phần lại báo tổ chức sau Phần trình bày GP bao gồm giới thiệu chung, số điểm riêng dùng cho toán dự báo lượng mưa Phần đưa tham số cụ thể GP chạy thực nghiệm, liệu để thí nghiệm, với phương pháp học máy khác để so sánh với GP Phần trình bày kết thí nghiệm đánh giá, phân tích, so sánh kết phương pháp Cuối cùng, phần kết luận lại phát đề xuất nghiên cứu tương lai Phương pháp nghiên cứu  Tốn tử di truyền Thể q trình trao đổi nhiễm sắc thể hai bố mẹ Toán tử gồm bước sau: • Chọn nút ngẫu nhiên bố mẹ • Hốn đổi hai có gốc hai nút vừa chọn tráo đổi chúng cho Toán tử đột biến (Mutation) Là trình đột biến nhiễm sắc thể tạo Gồm bước sau: Lập trình di truyền (Genetic Programming GP) đời vào năm 1992 [3] với tham vọng nhằm đưa quần thể chương trình mà chúng tiến hóa cách tự động liệu huấn luyện Với nghĩa này, GP xem phần học máy Dựa lýthuyết tiến hóa của Darwinian, GP đưa chương trình mã hóa dạng chuỗi di truyền thơng qua q trình tiến hóa chọn lọc tự nhiên để tìm chuỗi di truyền (chương trình) tốt đáp ứng yêu cầu tốn Biểu diễn chương trình Chương trình GP biểu diễn dạng cây, nút gán nhãn ký hiệu thuộc tập hàm (F) hay tập kết (T) Hình Biểu diễn chương trình GP Tốn tử lai ghép (crossover) • Chọn ngẫu nhiên nốt cha (mẹ) TẠP CHÍ KHÍ TƯỢNG THỦY VĂN  Số tháng 11 - 2019 a Lập trình di truyền  • Xóa thuộc nốt chọn • Sinh ngẫu nhiên vào vị trí vừa xóa Tái sinh (reproduction) Nếu cá thể tái sinh chúng chép y nguyên vào quần thể, hay nói cách khác có hai cá thể giống quần thể Đánh giá độ tốt (fitness) Mỗi chương trình gán giá trị gọi độ tốt, giá trị có ảnh hưởng quan trọng đến việc cá thể có lựa chọn để thực tốn tử di truyền hay khơng   BÀI BÁO KHOA HỌC    Hình Tốn tử lai ghép Hình Tốn tử biến dị Như bước để chạy thuật toán GP: 1) Khởi tạo ngẫu nhiên quần thể (thế hệ 0) cá thể tạo từ tập hàm tập kết 2) Thực lặp (các hệ) theo bước phụ sau thỏa mãn điều kiện kết thúc (tìm thấy lời giải tối ưu đạt đến số hệ đó): a Đánh giá độ tốt cá thể b Chọn cá thể từ quần thể với xác suất phụ thuộc vào độ tốt chúng để tham gia vào toán tử di truyền c c Tạo cá thể cho quần thể việc áp dụng phép toán di truyền sau với xác suất định   • Tái sinh • Lai ghép • Đột biến Sau kết thúc q trình tiến hóa, cá thể tốt tồn q trình chạy coi kết trình chạy Bên cạnh phương pháp truyền thống: định, tập luật định, hàm thống kê mạng nơron nghiên cứu cho thấy GP  phương pháp giải toán dự báo với độ xác cao cách tiến hóa biểu thức Một lý cho phép ta tin tưởng điều trình tìm kiếm GP có kết tốt tốn có khơng gian TẠP CHÍ KHÍ TƯỢNG THỦY VĂN Số tháng 11 - 2019 BÀI BÁO KHOA HỌC tìm kiếm lớn b Lập trình di truyền cho dự báo lượng mưa Việc sử dụng lập trình di truyền (GP) để dự báo lượng mưa theo thời gian thực mở rộng năm gần Madsen cộng [4] tiến hành so sánh việc sử dụng mơ hình hồi quy tự động, AR (p), sử dụng GP mạng nơ-ron để chỉnh sửa lỗi dư thừa mơ hình có hiệu chỉnh Để đánh giá ảnh hưởng chất lượng mơ hình mơ lên dự báo, kỹ thuật sửa lỗi (hoặc cập nhật giá trị đầu ra) áp dụng cho mơ hình hiệu chỉnh mơ hình khơng hiệu chỉnh Whigham & Crapper [8] đề xuất sử dụng GP dựa văn phạm phi ngữ cảnh Bài báo xác định tập hàm GP bao gồm hàm số học hàm mũ Tập kết bao gồm số giá trị lượng mưa khứ lượng mưa trung bình 5, 10, 15, 25, 30, 40, 50, 60 100 ngày gần Năm 2002, Liong cộng dùng GP để xác định mơ hình mơ tả mối quan hệ lượng mưa dòng chảy cách sử dụng mã hóa cổ điển GP giống Koza định nghĩa [3] Tập hàm bao gồm hàm số học hàm mũ, mơ hình xây dựng tốn hồi quy Hai báo đưa mơ hình khơng cung cấp giải thích vật lý tượng Khu cộng [2] sử dụng GP mạng nơ-ron để sinh lỗi thời gian thực dựa tiến hóa cập nhật chương trình để bổ sung cho mô hinhd dự báo thời gian thực gọi WRIP (Bộ xử lý thông tin thời tiết radar) dựa phép đo lượng mưa ghi lại radar Các thử nghiệm thực cách sử dụng tổng lượng mưa lượng mưa thực tế, với mạng nơ-ron GP để tối ưu hóa lỗi Đối với chức hiệu chỉnh, liệu ghi lại trận mưa tháng 12 năm 1999 lưu vực nơng thơn ngược dòng từ Taunton, Vương quốc Anh sử dụng và, trình hợp lệ, ước tính thực cách sử TẠP CHÍ KHÍ TƯỢNG THỦY VĂN Số tháng 11 - 2019 dụng liệu từ tháng năm 2000 Có thể cải thiện dự báo dòng chảy với mơ hình WRIP sử dụng lập trình di truyền mạng nơ-ron nhân tạo cách cập nhật lỗi theo thời gian thực dòng chảy cần đo giá trị mô cho tối đa năm khoảng thời gian Phương trình kết GP xem dạng cải tiến mô hình hồi quy tự động Trong nước chưa có nghiên cứu rõ ràng tốn dự báo lượng mưa, hầu chắn chưa có nghiên cứu sử dụng công cụ học máy để dự báo lượng mưa Thí nghiệm Trong phần nghiên cứu trình bày cách thiết kế thí nghiệm tham số GP hiệu chỉnh cho phù hợp với toán dự báo lượng mưa a Tham số GP Bảng Tham số GP 7KDPVӕ *LiWUӏ 7ұSKjP [VLQFRVOQ— 7ұSNӃW %LӃQWKXӝFWtQK tFKWKѭӟF  TXҫQWKӇ 7KXұWWRiQNKӣLWҥR 5DPSHGKDOIDQGKDOI ĈӝFDROӟQQKҩWFӫD  Fk\ 6ӕWKӃKӋ  ;iFVXҩWWKӵFKLӋQ  ODLJKpS ;iFVXҩWWKӵFKLӋQ  ÿӝWELӃQ 3KѭѫQJSKiSFKӑQ 7UDQKÿҩXNtFKWKѭӟF BÀI BÁO KHOA HỌC Dữ liệu lấy từ ngày 1/6/2016 đến ngày 1/1/2019, ngày gồm giá trị (đo cách giờ) Bảng trình bày tham số cụ thể để chạy GP Ở hàm đánh giá độ tốt cá thể nghiên cứu sử dụng hàm RMSE (root mean square error) Sau có liệu dạng chuỗi thời gian, nghiên cứu chuyển thành liệu phụ thuộc có dạng: GP chạy 30 lần lần với giá trị khởi tạo  khác nhau, mỗi lần nhận lời giải tốt  lựa chọn lời giải trung vị (median) sau (1)             dãy 30 lời giải tốt dùng làm mơ hình                cuối Trong rt lượng mưa thời điểm t   toán       b Dữ liệu         Sau  khi chuyển     liệu phụ  thuộc  và chọn     Dữ liệu thử nghiệm liệu đo           = 6,nghiên cứu lấy 5000 bản ghi làm dữ liệu    Mường Lay (trạm 1), Lào Cai (trạm 2), Hà huấn luyện, phần lại 2556 ghi làm   Giang (trạm 3), Sơn La(trạm 4), Cao Bằng (trạm liệu kiểm tra  6), Tuyên  Biên   (trạm  5), Điện Quang (trạm 7)                                                                                                                    Hình Một số giá trị lượng mưa đo trạm Mường Lay                            c Tổng quan học máy cộng thêm giá trị vào hàm lỗi Để minh họa   kỹ thuật                   GP với Để so sánh   kỹ  thuật  học  máy khác ta xem xét mơ hình tuyến tính dự báo cho       giải tốn dự báo lượng mưa, nghiên cơng thức (2):                       cứu lựa chọn kỹ     HHH      (2)    thuật học máy đưa mơ hình dự báo dựa  có khả phản  trọng  số, b  độ dốc   vào liệu w HHH véc-tơ       ánh ánh xạ biến đầu vào đầu x véc-tơ đầu vào Gọi xm ym   véc-  (bài toán dự báo) mà không cần xem xét trực tiếp  tơ đầu vào, giá trị đầu thứ  m  tập huấn   lý chế mưa Những mô  luật vật quy luyện Cơng thức tính hàm lỗi cơng thức (3): hình nàyhồn tồn dựa thơng tin có từ              (3)  việc thu thập liệu Đó mơ hình sau:    hạng thứ hàm lỗi giá trị Số  hỗ  trợ (Support Vector Machine) Máy vec-tơ        phạt độ phức tạp mơ hình, số hạng thứ  tơ hỗ trợ hồi quy (Support Vector Máy véc hai giá trị lỗi nhạy cảm với ε Nếu hàm  lỗi  nhỏ  Regression -SVR) [5], phương pháp thành   ε  không phạt, tham số đưa  tạp mô                công để xử phạt  sự phức thêm vào để điều chỉnh giảm độ phức tạp mơ   hình   cách                 VĂN  TẠP CHÍ KHÍ TƯỢNG THỦY Số tháng 11 - 2019                               BÀI BÁO KHOA HỌC             (4)            Chính  hình     vì lời  giải  sẽ cực tiểu hóa hàm  lỗi công thức (4):    !            Một  đối  tượng phân lớp dựa vào k láng giềng nó, k số nguyên dương xác định trước thực thuật toán Người ta  thường dùng khoảng cách Euclidean để tính  khoảng cách  đối tượng     Mạng Perceptron nhiều lớp (Multi-layer      - MLP)  [7] là mạng   nơ-ron nhân tạo Perceptron gọi perceptron nhiều lớp tập   hợp perceptron chia làm nhiều nhóm, nhóm tương ứng với  layer.Hoạt động  chúng mơ tả sau tầng đầu Trong đó α*m, αm là nhân  tử  Lagrange  Véc   tơ huấn luyện đưa số nhân Lagrange khác không gọi véc-tơ hỗ trợ            một khái niệm lý thuyết SVR Các véctơ khơng hỗ trợ khơng đóng góp trực tiếp vào lời giải số lượng vectơ hỗ trợ độ đo đo độ phức  cho tạp mơ hình Mơ hình mở rộng   trường hợp phi tuyến        tính  thông   qua  khái niệm vào nơron nhận tín hiệu vào xử lý (tính tổng  nhân κ sinh công thức (5):               số, gửi tới hàm truyền)    !    trọng   rồi cho  ra kết  quả      "      (5)  (là kết hàm truyền); kết     Trong  thí  nghiệm   này nghiên   cứu   sử dụng truyền tới nơron thuộc tầng ẩn thứ nhất; nhân Gauss        tín hiệu  đầu vào,  nơron tiếpHHHnhận Cây định (Decision Tree - DCT) [6]  xử lý gửi  kết  đến tầng ẩn thứ 2;…; q kiểu mơ hình dự báo Mỗi nút trình tiếp tục nơron thuộc tầng ra  kết  Bốn mô hình sử dụng tương  ứng với biến; cạnh nối cho     với nút thể giá trị cụ thể cho phổ biến cho tốn học máy cho biến  Mỗi nút đại diện cho giá trị dự báo thấy hiệu đáng kể chúng    biến mục tiêu, cho trước giá trị Phân tích kết biến biểu diễn đường từ nút gốc tới     Trong phần này, ta xem xét kết nút Kỹ thuật học dùng HHH máy   trong     định   gọilàhọc bằngcây định, chạy GP so với thuật tốn học máy điển hình phương hay gọi với tên ngắn gọn Để so sánh hiệu suất GP với  pháp khác nghiên cứu sử dụng hai độ đo định                   công thức (6, 7): Cây định học cách ) ( * + +012/ * /3) ,-./ chia tập hợp nguồn thành tập dựa theo   5 #$%&'  +,-.456 +,-.4/* kiểm tra giá trị thuộc tính Q trình * +,-./ +7,- +012/ +7012 lặp lại cách đệ quy cho tập   /3)  7 ,- +012/ +7012 (* /3)+,-./ + dẫn xuất Quá trình đệ quy hồn thành khơng thể  tiếp  tục thực  việc  chia   tách nữa, Trong NRMSE (normal root mean hay phân loại đơn áp dụng cho squared error) RMSE chuẩn hóa tính theo phần tử tập dẫn xuất Một phân phần trăm, CC (correlation coefficien) hệ số loại rừng ngẫu nhiên (random forest) sử dụng tương quan  HHH      số định để cải thiện tỉ lệ Trong công thức n độ lớn tập huấn phân loại luyện, ypre,i giá trị dự báo điểm mẫu i  k-láng giềng gần (k Nearest Neighbor yobs,i giá trị đo điểm mẫu i - kNN) [1] phương pháp để phân lớp đối Mục đích GP q trình tiến hóa tượng dựa vào khoảng cách gần đối tìm kết có giá trị NRMSE nhỏ CC tượng cần xếp lớp tất đối tượng lớn tập liệu TẠP CHÍ KHÍ TƯỢNG THỦY VĂN Số tháng 11 - 2019     BÀI BÁO KHOA HỌC Hình Giá trị NRMSE CC mơ hình dự báo với liệu trạm Mường Lay Hình Giá trị NRMSE CC mơ hình dự báo với liệu trạm Lào Cai Trong hình 5, giá trị NRMSE phương pháp dự báo nằm khoảng từ 0,035 đến 0,045 Còn giá trị CC nằm khoảng từ 0,03 đến 0,4 Và ta thấy phương pháp GP vừa cho kết giá trị NRMSE nhỏ CC lớn phương pháp Trong hình 6, giá trị NRMSE phương pháp rơi vào khoảng từ 0,025 đến 0,030, MLP SVM gần DCT GP Tuy nhiên giá trị CC SVM nhỏ giá trị phương pháp lại từ 0,1 đến 0,4 Và tương tự dự báo trạm Mường Lay, lời giải GP cho kết tốt NRMSE lẫn CC Hình Giá trị NRMSE CC mơ hình dự báo với liệu trạm Hà Giang Hình Giá trị NRMSE CC mơ hình dự báo với liệu trạm Sơn La Trong hình 7, giá trị NRMSE mơ hình nằm khoảng 0,04 đến 0,05, giá trị SVM MLP gần nhau, giá trị DCT GP trùng Giá trị CC phương pháp nằm khoảng từ 0,05 đến 0,35 DCT GP gần Đối với liệu trạm hiệu GP DCT tốt Kết hình cho thấy giá trị NRMSE phương pháp học máy tương đồng với Chỉ có giá trị CC khác biệt GP có giá trị CC lớn nhất, MLP, SVM phương pháp cung cấp giá trị CC liệu dự báo TẠP CHÍ KHÍ TƯỢNG THỦY VĂN Số tháng 11 - 2019 BÀI BÁO KHOA HỌC Hình Giá trị NRMSE CC mơ hình dự báo với liệu trạm Cao Bằng Hình 10 Giá trị NRMSE CC mơ hình dự báo với liệu trạm Điện Biên Hình 11 Giá trị NRMSE CC mơ hình dự báo với liệu trạm Tun Quang Kết hình cho thấy khơng có khác biệt kết mơ hình SVM MLP, GP chiếm ưu vượt trội hai giá trị Hình 10 cho thấy khả dự báo mơ hình liệu trạm khơng có khác biệt sai số, có giá trị CC khác nhau, DCT có giá trị lớn nhất, GP thứ hai SVM MLP khơng có khác biệt Kết hình 11 cho thấy kNN có giá trị sai số mơ hình dự báo tồi hẳn mơ hình lại, SVM MLP tương đương nhiên CC MLP tốt Với liệu trạm mơ hình DCT cho kết tốt nhất, GP chút lỗi giá trị CC TẠP CHÍ KHÍ TƯỢNG THỦY VĂN Số tháng 11 - 2019 Như tập liệu thực tế trạm khác nhau, GP cho mơ hình dự báo tốt tập liệu Trên toán lại GP thua so với DCT khơng đáng kể sai số mơ hình Các kết khẳng định hiệu GP vượt trội so với mơ hình dự báo khác Mơ hình kết tiến hóa GP Dưới lời giải cho toán dự báo lượng mưa trạm kết q trình tiến hóa GP có dạng: sqrt(add(mul(mul(sqrt(mul(X4,X3)),X2),add (mul(mul(X2,X2),mul(X2,X2)),mul(add(X3,X3 ),X2))),mul(add(mul(add(X3,X3),sin(X3)),div( mul(X4,X5),sin(X5))),sin(sqrt(X3))))) Biểu thức tương ứng với là:   BÀI BÁO KHOA HỌC         (8)     9:; < := < : < : =  >:; < :  >:; B HHH  8 < ?@A:;  := < C  EFG9:; DBC  Với mơ hình kết việc dự báo trở nên dễ dàng với biến Xi giá trị đầu vào Và với mơ hình nhận ta nhận thấy phụ thuộc kết vào tham số tham khảo để lựa chọn đặc trưng cho phù hợp tốn Đây ý nghĩa hộp trắng GP mà có mơ hình DCT số mơ hình có Kết luận  Bài báo trình bày việc sử dụng GP để dự báo lượng mưa số trạm quan trắc Việt Nam,   kết cho thấy GP vượt trội hiệu so với phương pháp dự báo khác (MLP, SVM, kNN, DCT) Tuy nhiên giá trị CC mơ hình tương đối thấp, tức kết dự báo chưa đốn xu liệu Chính vậy, tương lai nghiên cứu tiếp tục cải tiến GP để thu kết dự báo tốt Ngoài tham số phụ thuộc vào số giá trị thời điểm trước cần điều chỉnh linh hoạt để có kết dự báo phù hợp với thực tế Lời cảm ơn: Nghiên cứu hỗ trợ đề tài “Nghiên cứu sở khoa học giải pháp ứng dụng trí tuệ nhân tạo để nhận dạng, hỗ trợ dự báo cảnh báo số tượng khí tượng thủy văn nguy hiểm bối cảnh biến đổi khí hậu Việt Nam”, mã số BĐKH.34/16-20.” Tài liệu tham khảo Hastie, T.T., (2009), The Elements of Statistical Learning: Data Mining, Inference and Prediction New York: Springer Khu, S.T., (2004), An evolutionary-based real-time updating technique for an operational rainfall-runoff forecasting model Proceedings of the 2nd Biennial Meeting of the International Environmental Modelling and Software Society, Manno, Switzerland, 141-146 Koza, J.R., (1992), Genetic Programming: On the Programming of Computers by Means of Natural Selection Cambridge, MA, USA: MIT Press Madsen, H.B., (2000), Data assimilation in rainfall-runoff forecasting Hydroinformatics 2000, 4th International Conference of Hydroinformatics , (pp 1-6) Iowa, USA ̈olkop, A.J., (2004), A tutorial on support vector regression Statistics and Computing, 14(3), 199-222 Rokach, L., Maimon, O (Eds) Data mining with decision trees: theory and applications World Scientific Publishing Co., Inc River Edge, NJ, USA, Series in Machine Perception and Artificial Intelligence, 81, pp 328 Rosenblatt, F., (1961), Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms Arch Gen Psychiatry 7(3), 218-219 Whigham, P.A (2001), Modelling rainfall-runoff using genetic programming Mathematical and Computer Modelling, 33, (6–7), 707-721 TẠP CHÍ KHÍ TƯỢNG THỦY VĂN Số tháng 11 - 2019 BÀI BÁO KHOA HỌC A GENETIC PROGRAMMING-BASED RAINFALL PREDICTION USING DATA FROM THE VIETNAM METEOROLOGICAL AGENCY Nguyen Thi Hien1, Nguyen Xuan Hoai2, Dang Van Nam3, Ngo Van Manh4 Le Quy Don Technical University AI Academy Vietnam Hanoi University of Mining and Geology Center for Hydro-Meteorological Data and Information Abstract: Rainfall is one of the most challenging variables to predict, as it exhibits very unique characteristics that not exist in other time series data Moreover, rainfall is a major component and is essential for applications that surround water resource planning In particular, this paper is interested in the prediction of rainfall using data from the Vietnam Meteorological Agency Currently in the rainfall prediction literature, the process of predicting rainfall is dominated by statistical models, namely using a Markov chain extended with rainfall prediction (MCRP) In this paper we outline a new methodology to be carried out by predicting rainfall with Genetic Programming (GP) This is the first time in the literature that GP is used within the context of rainfall prediction in some city at Vietnam We have used a GP to this problem domain and we compare the performance of the GP and SVM, MLP, DCT, kNN on different data sets of cities at Vietnam and report the results The goal is to see whether GP can outperform other machine learning methods Results indicate that in general GP significantly outperforms other machine learning methods, which is the dominant approach in the literature Keywords: Genetic Programming, rainfall prediction 10 TẠP CHÍ KHÍ TƯỢNG THỦY VĂN Số tháng 11 - 2019 ... tháng 11 - 2019 BÀI BÁO KHOA HỌC tìm kiếm lớn b Lập trình di truyền cho dự báo lượng mưa Việc sử dụng lập trình di truyền (GP) để dự báo lượng mưa theo thời gian thực mở rộng năm gần Madsen cộng... có mơ hình DCT số mơ hình có Kết luận  Bài báo trình bày việc sử dụng GP để dự báo lượng mưa số trạm quan trắc Việt Nam,   kết cho thấy GP vượt trội hiệu so với phương pháp dự báo khác (MLP,... chương trình mã hóa dạng chuỗi di truyền thơng qua q trình tiến hóa chọn lọc tự nhiên để tìm chuỗi di truyền (chương trình) tốt đáp ứng u cầu tốn Biểu di n chương trình Chương trình GP biểu di n

Ngày đăng: 09/02/2020, 22:16

Tài liệu cùng người dùng

Tài liệu liên quan