Kết luận chương 2

Một phần của tài liệu Lựa chọn tốc độ huấn luyện hợp lý khi sử dụng thuật toán lan truyền ngược giải bài toán dự báo (Trang 44)

Mạng nơ ron nhân tạo là sự kết hợp giữa cấu trúc mạng và thuật toán huấn luyện mạng.

Có nhiều cấu trúc và thuật toán học, lựa chọn cấu trúc nào và thuật toán nào tùy thuộc vào từng ứng dụng cụ thể. Trong luận văn, mạng lan truyền ngược 3 lớp được lựa chọn để cài đặt thử nghiệm vì thuật toán lan truyền ngược là thuật toán tiêu biểu, được dùng rộng rãi, dễ sử dụng, dễ cài đặt kết hợp với cấu trúc truyền thẳng nhiều lớp của mạng MLP, mà mạng MLP với 3 lớp trở lên và hàm kích hoạt phi tuyến đã được chứng minh rằng có thể xấp xỉ một đường cong bất kỳ trong không gian với độ chính xác tùy ý, như vậy đó là bộ dự báo tổng quát.

CHƯƠNG III: CHƯƠNG TRÌNH THỬ NGHIỆM THUẬT TOÁN LAN TRUYỀN NGƯỢC TRONG BÀI TOÁN DỰ BÁO THỜI TIẾT 3.1. Giới thiệu về bài toán dự báo

3.1.1. Giới thiệu

Trong lĩnh vực dự báo, thường được chia ra làm các hướng như sau [2]:

3.1.1.1 Dự báo định tính

Dự báo định tính (đôi khi được gọi là phương pháp chuyên gia hay phương pháp phân tích cơ sở) thường được sử dụng khi những dữ liệu lịch sử không có sẵn, có hay không đầy đủ, hay những đối tượng dự báo bị ảnh hưởng bởi những nhân tố không thể lượng hóa được: sự thay đỏi tiến bộ kỹ thuật, ảnh hưởng của tác động môi trường …. Những phương pháp này bao gồm việc sử dụng những đánh giá, những kinh nghiệm của một hay nhiều chuyên gia trong lĩnh vực có liên quan. Thủ tục dự báo định tính thông thường được trình bày dưới dạng giải thích, chuẩn tắc.

Dự báo bằng giải thích sẽ sử dụng những thông tin quá khứ và hiện tại để hướng tới tương lai thông qua những kịch bản có thể. Từ đó các chuyên gia có thể cung cấp những dự báo “về điều gì có thể diễn ra và khi nào điều đó có thể diễn ra”. Những ước lượng chi phí nhằm đạt được mục tiêu thường được áp dụng dưới dạng dự báo giải thích.

Dự báo bằng chuẩn tắc sẽ căn cứ những mục tiêu tương lai và kế đó sẽ quy ngược trở lại hiện tại để tìm hiểu và đánh giá rằng những nguồn lực nào hiện có, những giới hạn cần loại bỏ hay khắc phục. Thông thường những đột phá khoa học nào đó (ví dụ như là những đột phá phát triển bởi chương trình không gian NASA) sẽ là những sản phẩm phụ để đạt được một vài mục tiêu dài hạn khác nhau trong tương lai.

* Ưu điểm:: Sử dụng tối đa những thông tin có được (bao gồm những thông tin có thể lượng hóa và không thể lượng hóa) để tiến hành dự báo.

* Nhược điểm: Không có một phương phương pháp hệ thống để cải thiện độ chính xác dự báo; Có thể làm sai lệch kết quả dự báo xuất phát từ dánh giá chủ quan của các chuyên gia dự báo.

3.1.1.2 Dự báo định lượng

Ngược lại với dự báo định tính, dự báo định lượng sử dụng những dữ liệu quá khứ theo thời gian. Nói cách khác, dựa trên những dư liệu lịch sử để phát hiện chiều hướng vận động của đối tượng phù hợp với một mô hình toán học nào đó và đồng thời sử dụng mô hình này là mô hình ước lượng. Tiếp cận định lượng dựa trên giả định rằng giá trị tương lai của biến số dự báo sẽ phụ thuộc vào xu thế vận động của đối tượng đó trong quá khứ.

Có một số các loại dự báo định lượng như sau:

Dự báo bằng chuỗi thời gian: Dựa trên phân tích chuỗi quan sát của một biến duy nhất theo biến số độc lập là thời gian. Tần suất có thể là ngày, tháng, quý, năm.

Dự báo bằng mô hình mạng nơron kết hợp với các giải thuật: Có nhiều cách kết hợp giải thuật với mạng nơron. Tuy nhiên sử dụng phương pháp nào còn phải dựa vào yêu cầu của bài toán. Tuy nhiên ta có thể xem đây là phương pháp hiệu quả:

o Xem mạng nơron như một cá thể.

o Quần thể bao gồm nhiều cá thể mạng nơron.

o Trước khi chọn ra cá thể tốt thực hiện các pháp toán để sinh ra tập quần thể mới, các cá thể tự tối ưu bằng phương phương pháp backpropation.

3.1.2. Các phương pháp giải bài toán dự báo thời tiết phổ biến

Có rất nhiều phương pháp dự báo khác nhau như: Phương pháp quán tính; Phương pháp dự báo theo xu hướng; Phương pháp khí hậu học; …

Hiện nay có 3 phương pháp chính thường được sử dụng trong các hệ thống dự báo thời tiết nghiệp vụ trên thế giới, đó là: Phương pháp Synôp, phương pháp số trị và phương pháp thống kê. [4]

3.1.2.1. Phương pháp Synôp

Đây là phương pháp dự báo thời tiết cổ điển được sử dụng chủ yếu trong hơn 100 năm qua và cho đến nay vẫn được các nhà khí tượng ở nhiều nước sử dụng, trong đó có Việt Nam, dựa trên việc thiết lập các bản đồ thời tiết. Việc dự báo phụ thuộc rất lớn vào kinh nghiệm phân tích và đánh giá chủ quan của người làm dự báo bên cạnh các thông tin bổ trợ từ các sản phẩm của mô hình dự báo số và phân tích ảnh mây vệ tinh,… Dự báo theo phương pháp này cho kết quả tương đối tốt trong phần lớn các trường hợp, riêng với mưa, sản hẩm dự báo mang tính định tính như mưa vừa, mưa to, mưa rất to,… mà không có con số định lượng cụ thể. Hiện nay, bản tin dự báo thời tiết đưa trên Đài truyền hình Việt Nam là kết quả của phương pháp này. Dự báo theo phương pháp này đòi hỏi người dự báo ngoài kiến thức về kỹ thuật dự báo còn phải có những kinh nghiệm và hiểu biết về khí hậu thời tiết ở địa phương. Đây cũng là một hạn chế của phương pháp Synôp, cũng do đặc điểm này mà dẫn đến những hạn chế khác như: không dự báo trước nhiều ngày, không thể dự báo cho nhiều vùng khác nhau,…

3.1.2.2. Phương pháp số trị

Phương pháp dự báo số trị là phương pháp dự báo bằng mô hình thủy động lực học hiện đại có độ phân giải cao áp dụng cho từng khu vực đã được sử dụng ở nhiều quốc gia trên thế giới, đặc biệt là ở các nước phát triển. Phương

pháp này sử dụng sức mạnh của máy tính điện tử, bằng rất nhiều cách khác nhau để giải hệ phương trình mô tả khí quyển để suy ra các biến khí quyển như áp suất, nhiệt độ, vận tốc gió,…Chất lượng dự báo mưa lớn cao hơn hẳn các phương pháp đã nêu ở trên và sản phẩm số của mô hình dự báo có thể đảm bảo những yêu cầu của mô hình dự báo thủy văn đối với lũ lụt, lũ quét. Một trong những nhân tố quyết định gây nên sự hình thành và phát triển mưa lớn trong các hiện tượng thời tiết nguy hiểm như xoáy thuận nhiệt đới, dải hội tụ nhiệt đới,… là đối lưu mây tích. Các quá trình đối lưu này đóng vai trò quan trọng trong chu trình vận chuyển năng lượng của khí quyển và do đó phân bổ lại sự đốt nóng không đồng đều trên bề mặt trái đất. Các quá trình này có thể tính được bằng các mô hình số trị. Với phương pháp số trị, hiện nay những trung tâm khí tượng lớn trên thế giới có thể đưa ra những dự báo thời tiết trên phạm vi toàn quốc trước hàng tuần mà phương pháp Synôp cổ điển không thể nào thực hiện được.

3.1.2.3. Phương pháp thống kê

Phương pháp thống kê lấy số liệu quá khứ làm đầu vào. Phương pháp này có ưu điểm mang tính chất khách quan, đơn giản và dễ xây dựng mô hình cũng như sử dụng trong nghiệp vụ. Độ chính xác của mô hình phụ thuộc rất nhiều vào việc lựa chọn các tham số dự báo và quá trình xử lý số liệu. Bên cạnh đó, do đặc điểm cơ bản của phương pháp thống kê là coi những quá trình xảy ra ở hiện tại và tuân lai đều tuân theo các quy luật thu được từ các số liệu trong quá khứ, dẫn tới kết quả của mô hình dự báo phụ thuộc nhiều vào độ dài tập mẫu. Chuỗi số liệu tập mẫu quá ngắn sẽ chứa trong nó những quy luật mà hiện tại không có, còn chuỗi số liệu quá dài có thể gây mất ổn định hệ thống.

3.1.3. Quy trình thực hiện dự báo

Dự báo là một quá trình phức tạp, về cơ bản quy trình dự báo thực hiện theo các bước sau:

Hình 3.1. Quy trình dự báo

Bước 1. Thu thập số liệu

Cần phải xem xét số liệu mà hệ thống sẽ sử dụng: nguồn dữ liệu, cách phân loại, chọn lọc, xử lý dữ liệu làm đầu vào cho hệ thống. Trong hệ thống dự báo thời tiết, nguồn dữ liệu có thể được lấy từ các trạm khí tượng, vệ tinh, ra đa, các phương tiện truyền thông, …Tùy theo loại dữ liệu mà có cách phân loại và xử lý phù hợp, ví dụ: dữ liệu ảnh, dữ liệu âm thanh,…

Thu thập số liệu

Lựa chọn mô hình dự báo

Đánh giá mô hình dự báo

Áp dụng mô hình để dự báo

Trình bày kết quả dự báo

1. Xác định mục tiêu

Bước 2. Lựa chọn mô hình dự báo

Việc quyết định xem mô hình dự báo nào là thích hợp liên quan đến nhiều yếu tố: dữ liệu đầu vào, các yêu cầu về thời gian, yêu cầu về kết quả đầu ra,…Lựa chọn mô hình dự báo có thể dựa trên chiến lược dự báo sau:

+ Tiền định: Dựa trên mối quan hệ mật thiết giữa hiện tại và tương lai.

+ Triệu chứng: Dựa trên những dấu hiệu hiện tại để dự báo cho tương lai.

+ Hệ thống: Dựa trên ý tưởng cho rằng xu hướng phát triển trong tương lai sẽ tuân thủ theo một quy tắc nào đó.

Bước 3. Đánh giá mô hình dự báo

Đối với các phương pháp dự báo định tính thì không cần phải đánh giá mô hình, nhưng với các phương pháp dự báo định lượng thì cần phải đánh giá mức độ phù hợp của mô hình (trong phạm vi mẫu dữ liệu) và đánh giá mức độ chính xác của dự báo (ngoài phạm vi mẫu dữ liệu). Nếu mô hình không phù hợp thì quay lại bước 5.

Bước 4. Áp dụng mô hình để dự báo

Sau khi đã lựa chọn và đánh giá được mô hình dự báo phù hợp thì chuẩn bị các số liệu phục vụ cho việc dự báo.

Bước 5.Trình bày kết quả dự báo

Có nhiều cách để trình bày kết quả dự báo. Có thể dùng bảng biểu, đồ thị, hình ảnh minh họa; Có thể trình bày ở dạng viết hoặc nói; Trình bày tại một vị trí hoặc trên phương tiện thông tin đại chúng,…Cho dù trình bày kết quả bằng cách nào thì những kết quả dự báo phải ngắn gọn, rõ ràng, thể hiện được sự tin cậy của dự báo và phải bằng ngôn ngữ mà người nghe hiểu được.

Bước 6. Theo dõi kết quả dự báo

Độ lệch giữa giá trị dự báo và giá trị thực phải được thảo luận tích cực, khách quan, cởi mở. Mục tiêu của việc thảo luận là để hiểu tại sao lại có các sai số và xác định độ lớn của các sai số đó, qua đó bảo trì và nâng cấp hệ thống dự báo.

3.2. Phân tích và đánh giá các trọng số của bài toán 3.2.1. Phân tích bài toán 3.2.1. Phân tích bài toán

Bài toán dự váo thời tiết được thử nghiệm trên 6 thống số:

Nhiệt độ : đơn vị là oC.

Độ ẩm : đơn vị là %.

Mưa : đơn vị là %.

Hướng gió : đơn vị là o .

Tốc độ gió : đơn vị là km/h

Mây : đơn vị là %

Dữ liệu đầu vào là các thông số thời tiết của một ngày

Dữ liệu đầu ra là các thông số thời tiết của ngày tiếp theo

Quy trình thực hiện dự báo được mô tả như sau:

Hình 3.2. Kiến trúc hệ dự báo thời tiết

1. Chuẩn hóa dữ liệu đầu vào

2. Mạng nơron: dữ báo

3. Xử lý dữ liệu đầu ra

Mô đun 1: Chuẩn hóa dữ liệu đầu vào

Tất cả các thông số thời tiết đều được đưa về một giá trị tương ứng nằm trong khoảng [0,1].

Các tham số số được chuẩn hóa như sau:

- Nhiệt độ : Giá trị nhiệt độ được chia cho 100

- Độ ẩm : Giữ nguyên giá trị %

- Hướng gió : Giá trị hướng gió được chia cho 360

- Tốc độ gió : Giá trị hướng gió được chia cho 100

- Mưa : được chuẩn hóa như hình 3.3:

Hình 3.3. Đồ thị biểu diễn mức độ mưa

0 NG N KM MBM MPN MP MV MT MRT 100 80 60 50 40 30 mư %

Chú thích: NG : Nắng gắt MBM: Mưa bóng mây MV: Mưa vừa

N : Nắng MPN : Mưa phùn nhẹ MT: Mưa to

KM :Không mưa MP : Mưa phùn MRT: Mưa rất to

- Mây : được chuẩn hóa như hình 3.4:

Hình 3.4. Đồ thị biểu diễn mức độ mây

Chú thích: KM : Không mây NM : Nhiều mây

IM : ít mây RNM : Rất nhiều mây

CM : Có mây 100 80 60 40 0 KM IM CM NM RNM mây %

Môdun 2: Mạng nơron

Các giá trị ở các đầu vào và đầu ra mạng nơron đều là các giá trị thuộc khoảng [0,1].

Trong quá trình huấn luyện mạng nơron, đầu vào của mạng là các thông số thời tiết của ngày thứ nhất, thì đầu ra là các thông số thời tiết của ngày thứ hai; đầu vào của mạng là các thông số thời tiết của ngày thứ hai, thì đầu ra là các thông số thời tiết của ngày thứ ba, …mỗi một cặp đầu vào, đầu ra như thế gọi là một cặp huấn luyện, sau khi huấn luyện mạng nơron nhiều lần với n

cặphuấn luyện như thế thì mạng nơron có thể đã nắm được quy luật biến đổi của thời tiết.

Muốn mạng nơron dự báo thời tiết của ngày mai thì nó sẽ lấy thông số thời tiết của ngày hôm nay để làm đầu vào và thực hiện dự báo

Mô đun 3: Xử lý dữ liệu đầu ra

Các giá trị đầu ra của mạng nơron là các giá trị nằm trong khoảng [0,1].

Mô đul 3 làm ngược lại với mô đul 1 để chuyển các giá trị này thành các giá trị có đơn vị của các thông số thời tiết. Cụ thể như sau:

Với µ(a)  [0,1] là giá trị của biến số thời tiết a tại đầu ra của mạng nơron.

- Nhiệt độ : a = µ(a) * 100

- Tốc độ gió : a = µ(a) * 100

- Độ ẩm : a = µ(a)

- Mưa :

if (0 ≤ µ(a)  5) then a = “nang gat”

else if (5 ≤ µ(a)  10) then a = “nang”

else if (10 ≤ µ(a)  20) then a = “khong mua”

else if (20 ≤ µ(a)  30) then a = “mua bong may”

else if (30 ≤ µ(a)  40) then a = “mua phun nhe”

else if (40 ≤ µ(a)  50) then a = “mua phun”

else if (50 ≤ µ(a)  60) then a = “mua vua”

else if (60 ≤ µ(a)  80) then a = “mua to”

else a = “mua rat to”.

- Mây:

if (0 ≤ µ(a)  20) then a = “khong may”

else if (20 ≤ µ(a)  40) then a = “it may”

else if (40 ≤ µ(a)  60) then a = “co may”

else if (60 ≤ µ(a)  80) then a = “nhieu may”

else a = “rat nhieu may”

3.2.2. Đánh giá các trong số của bài toán

Thuật toán học lan truyền ngược, trong đó có các giá trị trọng số được điều chỉnh một cách hệ thống để đáp ứng của mạng ngày càng gần với mong

muốn có thể coi như bài toán tối ưu. Tiêu chuẩn chung của thuật toán tối ưu đơn giản là hạ gradient với kích thước bước nhảy cố định.

Bản chất của thuật toán lan truyền ngược là ước lượng một trọng số riêng biệt dẫn tới đầu ra. Tuy nhiên trong thực tế, việc cài đặt thuật toán này gặp nhiều khó khăn khác nhau. Một trong những vấn đề đó là cực tiểu đạt được có thể chỉ là cực tiểu địa phương của hàm lỗi.

Hình 3.5. Minh họa vấn đề cực tiểu địa phương

Hình 3.5 chỉ là một lát cắt của không gian lỗi trong chiều của một trọng số. Có thể thấy rằng lỗi là một hàm không âm của biến trọng số. Trong trường hợp lý tưởng, giá trị E giảm về không. Tuy nhiên, trong thực tế việc học được coi là thành công nếu E nhó hơn một giá trị Emin có thể chấp nhận được. Hàm lỗi chỉ trong hình 3.5 có một cực tiểu toàn cục dưới giá trị Emin, nhưng nó cũng

Một phần của tài liệu Lựa chọn tốc độ huấn luyện hợp lý khi sử dụng thuật toán lan truyền ngược giải bài toán dự báo (Trang 44)

Tải bản đầy đủ (PDF)

(87 trang)