Phát biểu bài toán

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Mạng nơron RBF và ứng dụng (Trang 58 - 62)

CHƯƠNG 5: BÀI TOÁN XẤP XỈ HÀM TRONG KHÍ TƯỢNG THỦY VĂN

5.1. Phát biểu bài toán

Công tác Khí tượng Thủy văn và Hải dương học là một trọng những lĩnh vực đóng vai trò quan trọng tại Việt Nam. Lãnh thổ Việt Nam ở điều kiện địa lý tự nhiên bao gồm các vùng địa lý khác nhau (biển, núi, lục địa, …), môi trường khí hậu khá đa dạng và phức tạp, đặc biệt phần lớn dân số hoạt động trong những lĩnh vực nông nghiệp, thủy hải sản (là những lĩnh vực phụ thuộc và bị ảnh hưởng trực tiếp bởi khí hậu, thời tiết). Với những yếu tố nhƣ vậy, vai trò của công tác Dự báo các số liệu liên quan đến Khí tƣợng trở nên vô cùng quan trọng.

Trên thực tế, công tác Khí tượng Thủy văn và Hải dương học là một lĩnh vực lớn bao gồm rất nhiều vấn đề khác nhau. Tuy nhiên vấn đề chính nằm trong hầu hết các hoạt động thực tế là vấn đề Dự báo, hay nói cách khác, đó là việc “đƣa ra các số liệu cần thiết của một địa điểm xác định nào đó khi số liệu tại các điểm xác định khác đã đƣợc biết”.

Trong công tác dự báo, hai đặc điểm quan trọng nhất cần phải quan tâm đó là Thời gian thực và Sai số dự báo. Đặc điểm thời gian thực quy định việc kết quả dự báo phải đƣợc đƣa ra tại thời điểm mong muốn. Đặc điểm sai số quy định mức độ chính xác so với thực tế của số liệu kết quả đƣa ra. Ta có thể thấy rằng hai yếu tố này thường tỷ lệ nghịch với nhau. Hay nói cách khác nếu cần kết quả dự báo cho một khoảng thời gian xa thì sai số sẽ lớn và ngƣợc lại nếu quy định mức sai số cho phép là nhỏ thì thời gian để đƣa ra kết quả dự báo sẽ kéo dài và khó có thể dự báo tại thời điểm cách xa so với thời điểm đƣa ra kết quả.

Có rất nhiều yếu tố ảnh hưởng đến kết quả của công tác dự báo, ở đây xin lưu ý đến yếu tố các tập số liệu thu thập được. Khi tập số liệu thu thập được là phân bổ rải rác, với các khoảng biên giá trị của số liệu là cách xa nhau (trên thực tế

thường là như vậy) thì việc dự báo sẽ rất khó khăn, hay nói cách khác, khi đó sẽ rất khó khăn để áp dụng các thuật toán hoặc các công cụ máy tính.

Ta có thể xét ví dụ về tập số liệu thu đƣợc nhƣ sau: Bộ số liệu về nhiệt độ.

Thông thường số liệu về nhiệt độ sẽ được các trạm quan trắc tổng hợp lại tại một thời điểm đã đƣợc quy định, số liệu về nhiệt độ ở đây bao gồm (vĩ độ, kinh độ, độ cao, nhiệt độ). Vì các trạm quan trắc là phân bổ ngẫu nhiên theo điều kiện địa lý, điều kiện xã hội, … nên bộ số liệu này sẽ đƣợc phân bổ không đều (tọa độ các điểm quan trắc là ngẫu nhiên và không theo quy luật). Biểu đồ dưới thể hiện điều này:

Biểu đồ trên bao gồm 474 điểm quan trắc thu đƣợc ngày 14 tháng 02 năm 2005, nằm phân bổ rải rác trong khoảng vĩ độ (80.83, 129.87), kinh độ (-3.7, 34.92), độ cao (0, 4670) (số liệu này đƣợc cung cấp từ Khoa Khí tƣợng Thủy Văn – Đại học Khoa học Tự nhiên – Đại học Quốc gia Hà Nội). Ta dễ dàng nhận thấy các điểm quan trắc thu đƣợc tập trung cao trên vùng đất liền thuộc lãnh thổ Việt Nam và vùng phía Bắc, khu vực Biển Đông chỉ tồn tại rất ít các điểm số liệu. Và ta có thể dễ dàng thấy đƣợc rằng nếu cần dự báo nhiệt độ cho các điểm có tọa độ (vĩ độ, kinh độ, độ cao) nào đó cho trước thì kết quả sẽ chính xác đối với điểm nằm trong vùng tập trung cao các số liệu quan trắc hơn là đối với điểm nằm tại vùng rất ít số liệu. Ví dụ một vùng số liệu cần phải nội suy nhƣ sau:

Biểu đồ trên bao gồm 12 822 điểm số liệu, các điểm số liệu này thuộc vào khoảng số liệu ở biểu đồ 474 điểm quan trắc bao gồm: vĩ độ (97.25, 117.25), kinh độ (7.13, 21.5), độ cao (0, 1767.14) (số liệu này đƣợc cung cấp từ Khoa Khí tƣợng Thủy Văn – Đại học Khoa học Tự nhiên – Đại học Quốc gia Hà Nội). Hay nói cách khác là từ 474 điểm quan trắc đã biết, ta cần đƣa ra giá trị của 12 822 điểm số liệu cần theo dõi.

Ở ví dụ trên, ta có thể thấy rằng đây chính là bài toán xấp xỉ hàm hay bài toán nội suy, từ những mốc đã biết trước (những mốc quan trắc) ta cần phải tìm được giá trị của các điểm mốc chưa biết (những mốc trên lưới đều) nằm trong miền giá trị (nội suy). Chi tiết sẽ đƣợc đƣa ra ở các phần tiếp theo.

5.1.2. Đặt bài toán

Thực tế, khi giải các bài toán khí tượng bằng mô hình số, người ta cần giá trị của các biến trường khí tượng tại các điểm nút lưới điều hòa (có thể hiểu đó là các điểm nút của một lưới ô vuông nếu sử dụng hệ tọa độ Đềcác, còn trong hệ tọa độ trái đất các ô vuông đó có các cạnh bằng nhau về độ đo kinh, vĩ, nhƣng có thể khác nhau về khoảng cách địa lý) để có thể tính được các đạo hàm theo phương pháp sai phân hữu hạn, hoặc để có thể khai triển chuỗi. Tuy nhiên, số liệu ban đầu

của các biến trường khí tượng lại chỉ có thể có được ở các trạm quan trắc mà sự phân bố của nó đƣợc xác định bởi tọa độ địa lý và độ cao trạm (phân bố một cách ngẫu nhiên). Bài toán đặt ra ở đây là cần xác định giá trị của biến trường khí tượng tại các điểm nút lưới điều hòa khi cho trước giá trị của nó tại các điểm nào đó.

Có thể phát biểu bài toán dưới dạng sau :

Cho tập giá trị quan trắc của một biến trường khí tượng F(xl,yl,hl), l=1…n trong đó xl, yl, hl tương ứng là tọa độ theo phương vĩ tuyễn, kinh tuyến và độ cao của trạm quan trắc thứ l. Hãy xác định giá trị của biến trường ~( , , )

k j

i y h

x

F , tại các

điểm nút lưới cho trước (xi,yj) mà độ cao của các điểm này là hk, trong đó i=1…nx, j=1…ny, xi1xi x, yj1xj y, hơn nữa xy.

Một dạng khác của bài toán này là số liệu ban đầu đƣợc cho tại các điểm nút lưới, cần xác định giá trị của biến trường tại các vị trí trạm cho trước.

Một ví dụ ứng dụng đơn giản là: Giả sử kết quả dự báo nhiệt độ không khí của một mô hình được cho tại các điểm nút lưới của mô hình. Để đánh giá độ chính xác của kết quả dự báo, người ta cần so sánh nó với số liệu quan trắc. Có hai phương pháp so sánh: 1) Nội suy số liệu quan trắc về các điểm nút lưới của mô hình rồi so sánh chúng với kết quả dự báo. Đây là trường hợp sử dụng dạng thứ nhất của bài toán. 2) Nội suy kết quả dự báo của mô hình về các vị trí trạm quan trắc rồi so sánh chúng với chính số liệu quan trắc tại trạm. Đây là trường hợp sử dụng dạng thứ hai của bài toán.

5.2. Một vài phương pháp áp dụng 5.2.1. Phương pháp địa phương

Các phương pháp địa phương thường lưu lại các mẫu (các điểm đã biết).

Các mẫu này được lưu lại cho đến khi một tập mẫu mới cần được phân lớp. Mỗi lần bắt gặp một phân lớp mẫu mới, mối quan hệ với các mẫu đã được lưu trữ trước đây lại được kiểm tra để gán cho hàm mục tiêu một giá trị tương ứng với trường hợp mẫu mới này.

Các phương pháp địa phương có thuận lợi là thay vì chỉ ước lượng hàm mục tiêu một lần cho toàn bộ không gian mẫu, thì các phương pháp này có thể ước lƣợng hàm mục tiêu một cách cục bộ cho mỗi tập mẫu mới đƣợc phân lớp.

Tuy nhiên các phương pháp địa phương cũng có những hạn chế. Hầu hết các tính toán đều xảy ra ở lúc phân lớp hơn là khi lần đầu tiên bắt gặp các mẫu huấn luyện, điều này khiến cho chi phí tính toán cao và đôi khi không đáp ứng kịp với yêu cầu đặt ra (như yêu cầu về thời gian). Hạn chế tiếp theo là các phương pháp địa phương xem xét điển hình mọi thuộc tính của các ví dụ khi cố gắng tìm ra các ví dụ huấn luyện tương tự đã được lưu trữ. Nếu khái niệm mục tiêu chỉ dựa trên một vài trong nhiều thuộc tính có giá trị thì các ví dụ mà thật sự tương tự có thể cách nhau một khoảng cách lớn.

5.2.2. Mạng MLP

Mạng MLP có ƣu điểm là với số nơron tầng ẩn thích hợp, có thể xấp xỉ hàm tùy ý với sai số trung bình bình phương <  cho trước. Tuy nhiên mạng MLP khi đưa vào bài toán này có hạn chế là thời gian huấn luyện lâu (trong trường hợp số lƣợng mốc huấn luyện lớn và cần đƣa ra kết quả nhanh thì MLP khó đáp ứng đƣợc).

Trong kiến trúc mạng MLP, số nơron tầng ẩn chưa tìm được phương pháp phù hợp để xác định, kết quả nội suy phụ thuộc nhiều vào giá trị khởi tạo ban đầu.

5.2.3. Dùng RBF và phương pháp lặp

Đề tài trình bày một phương pháp tiếp cận, giải quyết bài toán nội suy đưa ra ở trên thông qua mạng nơron RBF. Mạng nơron RBF này đƣợc cải tiến, tối ƣu tốc độ hội tụ và độ sai số bằng đề xuất “Thuật toán học lặp cho mạng RBF”.

Mạng RBF đề xuất đƣợc huấn luyện bằng một thuật toán 2 pha với hàm cơ sở bán kính dạng Gauss. Trong pha thứ nhất, tham số ảnh hưởng của hàm cơ sở bán kính đƣợc xác với sự cân đối giữa đặc tính tổng quát hóa và tốc độ hội tụ của pha sau. Tiếp theo, các trọng số tầng ra đƣợc xác định nhờ tìm điểm bất động của ánh xạ co. Nhờ ƣu điểm của ánh xạ co, thuật toán có thời gian chạy nhanh, dễ ƣớc lƣợng sai số và song song hóa. Thực nghiệm cho kết quả tốt kể cả khi số mốc nội suy lớn.

Mạng RBF này được trình bày trong Chương 3 của đề tài. Trong chương tiếp theo, đề tài giới thiệu một chương trình máy tính để kiểm tra hoạt động của mạng RBF đƣợc xây dựng theo đề xuất ở trên và đƣợc áp dụng cho bài toán nội suy mốc quan trắc được phát biểu trong chương hiện tại.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Mạng nơron RBF và ứng dụng (Trang 58 - 62)

Tải bản đầy đủ (PDF)

(81 trang)