Phương phỏp luyện mạng thần kinh nhõn tạo ANN

Một phần của tài liệu LUẬN ÁN TIẾN SĨ KHÍ TƯỢNG HỌC " NGHIÊN CỨU KHẢ NĂNG MÔ PHỎNG MÙA CÁC YẾU TỐ KHÍ TƯỢNG TRÊN LÃNH THỔ VIỆT NAM BẰNG PHƯƠNG PHÁP THỦY ĐỘNG VÀ THỐNG KÊ " pdf (Trang 72 - 166)

Phương phỏp luyện ANN là một trong những phương phỏp hiệu quả được

đỏnh giỏ cao trong số cỏc phương phỏp thống kờ sản phẩm mụ hỡnh số do khả năng biểu diễn quan hệ vật lý phi tuyến giữa cỏc đại lượng khớ tượng. Hỡnh 2.6 biểu diễn tổng quỏt quỏ trỡnh này từ sản phẩm dự bỏo của GCM hoặc RCM về quy mụ địa phương, trong đú giỏ trị tại lưới thụ của GCM hoặc RCM trờn một khu vực nhỏ nào

đú được trớch ra làm nhõn tố dự bỏo cho cỏc điểm trạm hoặc cỏc vựng nhỏ hơn thụng qua cỏc phương trỡnh hồi quy, tương quan, ...

Hỡnh 2.6: Dự bỏo cho địa phương bằng phương phỏp thống kờ sản phẩm của GCM hoặc RCM.

71

í tưởng xõy dựng ANN bắt nguồn từ việc nghiờn cứu hệ thần kinh sinh học của con người, trong đú quan trọng nhất là sựđiều khiển của bộ nóo sau đú là sự lan truyền thụng tin trong hệ thống cỏc tế bào thần kinh [Haykins, 1994]. Tuy khụng

được xõy dựng chặt chẽ và phức tạp như hệ thống thần kinh sinh học nhưng ANN lại cú thể mụ hỡnh hoỏ được rất nhiều quỏ trỡnh phức tạp của cỏc hệ thống thần kinh sinh học và ngoài ra, rất nhiều đặc tớnh của ANN lại khụng cú trong cỏc hệ thần kinh sinh học. Vớ dụ, ANN cú thể bao gồm cỏc đầu ra là cỏc giỏ trị hằng số riờng lẻ

trong khi đú đầu ra của cỏc neuron sinh học là một chuỗi liờn kết và biểu hiện phức tạp theo thời gian của cỏc nhỏnh. Sau đõy là hỡnh vẽ so sỏnh cấu trỳc của mạng thần kinh sinh học với ANN (Hỡnh 2.7).

Hỡnh 2.7: Cấutrỳc của mạng thần kinh sinh học (trờn) và cấu trỳc ANN (dưới). [http://www.emeraldin sight.com/fig/0330250 106025.png]

Đối với mạng thần kinh sinh học, thụng tin cú thể lan truyền từ cơ quan thụ

cảm về nóo bộ hoặc ngược lại nhưng đều theo một cỏch thức như nhau là thụng qua cỏc xung thần kinh trờn cỏc sợi trục thần kinh và liờn kết hoỏ học trờn cỏc khớp thần kinh. Cỏch thức lan truyền thụng tin này được ANN mụ phỏng đơn giản hơn rất nhiều nhưng cũng khỏ đầy đủ và tương đồng. Ban đầu, thụng tin từ cỏc nhỏnh thần kinh đi vào một neuron sinh học, tương ứng với việc cung cấp cỏc đầu vào cho cỏc nodes trờn ANN. Sau đú thụng tin lan truyền trờn sợi trục thần kinh, tương ứng với cỏc hàm truyền của ANN. Cỏc khớp thần kinh sinh học tương ứng với cỏc trọng số

trong ANN. Cuối cựng thụng tin đi tới một cơ quan thực hiện hành động, tương ứng với việc ANN cho ra một kết xuất. ANN cú thể rất phức tạp bao gồm nhiều nỳt, nhiều lớp ẩn nhưng đơn giản nhất là chỉ cú 1 lớp đầu vào, 1 lớp ẩn và lớp kết xuất.

72

Một trong những toỏn tử thường được sử dụng nhiều nhất trong ANN là toỏn tử lan truyền ngược (back-propagation) trong đú thụng tin khụng những được lan truyền tiến dọc theo cỏc nỳt nhờ hàm truyền và cỏc trọng số mà cũn được lan truyền ngược trở lại để cập nhật cỏc trọng số sao cho sai số giữa kết xuất và hàm đớch giảm

đi. Phương phỏp cực tiểu hoỏ sai số giữa kết xuất và hàm đớch thường được sử dụng là phương phỏp học giảm dốc nhất (phương phỏp giảm gradient). Mục đớch là tớnh gradient sao cho cực tiểu húa sai số tổng cộng giữa giỏ trị mong muốn trong thực tế

và kết xuất của ANN. Nguyờn tắc học là trọng số được cập nhật sao cho làm giảm gradient tổng cộng của sai số theo mọi trọng số trờn tất cả cỏc mẫu nghĩa là di chuyển theo hướng ngược lại của gradient sai số tổng cộng, theo hướng giảm sai số

nhiều nhất trờn mặt lỗi (Hỡnh 2.8).

Hỡnh 2.8: Mặt lỗi là hàm của cỏc trọng số. Điểm dốc nhất trờn mặt lỗi là nơi sai số tổng

cộng nhỏ nhất.

ANN thường sử dụng hàm truyền logistic sigmoid (logsig) hoặc hyperbolic tangent sigmoid (tansig) trong cỏc lớp ẩn. Đối với lớp kết xuất, nếu hàm đớch là những giỏ trị biến đổi từ 0 đến 1, ANN sẽ sử dụng hàm sigmoid, ngược lại sẽ sử

dụng hàm tuyến tớnh (purelin) nhưđược biểu diễn trong Hỡnh 2.9.

(a) Hàm truyền logistic sigmoid

(b) Hàm truyền hyperbolic

tangent sigmoid (c) Hàm truytớnhền tuyến

Hỡnh 2.9: Cỏc dạng hàm truyền cơ bản của ANN, (a) hàm Log-sigma, (b) tan- sigma, (c) tuyến tớnh [Demuth vcs., 2000].

73

Thuật toỏn Levenberg-Marquardt là một trong những cải tiến của phương phỏp lan truyền ngược và grandient giảm dốc nhất trong đú trọng số được cập nhật khụng phải hằng số theo thời gian mà biến đổi tựy thuộc gradient tại bước ngay trước đú. Đõy là thuật toỏn chớnh thức của phương phỏp ANN trong chương trỡnh MatLab (Matrix Laboratory, Mỹ), được luận ỏn sử dụng để hiệu chỉnh nhiệt độ và lượng mưa.

Đầu vào Lớp ẩn 1 Lớp ẩn 2 Lớp ẩn 3 Kết xuất

Đầu vào Lớp ẩn 1 Lớp ẩn 2 Lớp ẩn 3 Kết xuất

Hỡnh 2.10: Mạng thần kinh 3 lớp theo phương phỏp Levenberg-Marquardt.

Đầu vào Lớp ẩn 1 Lớp ẩn 2 Lớp ẩn 3 Kết xuất

Đầu vào Lớp ẩn 1 Lớp ẩn 2 Lớp ẩn 3 Kết xuất

Hỡnh 2.11: Dạng vectơ của mạng 3 lớp trong Hỡnh 2.10.

Mạng thần kinh 3 lớp cú dạng và cụng thức cụ thể như trờn hỡnh Hỡnh 2.10 hoặc dạng vectơ như trờn hỡnh Hỡnh 2.11 trong đú ký hiệu p là vectơđầu vào, IW là ma trận trọng số của đầu vào, b là cỏc vectơ tham số tại từng lớp, LW là cỏc ma trận trọng số tại cỏc lớp, f là cỏc hàm truyền, a là vectơ chứa cỏc giỏ trị tại cỏc nỳt (cỏc nơron) và y là vectơ đầu ra. Trong trường hợp tổng quỏt, khi cú nhiều lớp thỡ khụng

74

thể viết cụng thức tường minh như trờn vỡ quỏ dài, thay vỡ đú, sử dụng cụng thức quy nạp để mụ phỏng một mạng thần kinh với chỉ số trờn là số thứ tự của lớp: ( ) ( ) ( ) 1 1 1 1 1 2 2,1 1 2 2 2 2 , 1 1 , , ... , N N N N N N N N n IWp b a f n n LW a b a f n n LWab a f n y = + = = + = = + = = (2.80)

Mạng thần kinh nhõn tạo được luyện bằng cỏch thay đổi cỏc trọng sốIW, LW

bđể sai số giữa đầu ra và mục tiờu là nhỏ nhất. Phương phỏp được lựa chọn là từng bước cập nhật trọng số theo đường dốc nhất (hướng õm của gradient). Cụng thức thay đổi theo đường dốc nhất cú dạng: xk+1 =xk −αkgk trong đú xk là vectơ

chứa cỏc trọng số và b tại bước (thế hệ) thứk, gk là gradient của sai sốđối với trọng số và b, αk là bước tiến. Thuật toỏn này cú thể hiểu một cỏch hỡnh tượng giống như

một hũn bi lăn trong một cỏi chảo sẽ tỡm đường dốc nhất để đi tới đỏy chảo. Trong những chương trỡnh luyện mạng đơn giản, người ta cho bước tiến αk là hằng số và quỏ trỡnh hội tụ rất chậm. Cỏc thuật toỏn cải tiến sẽ thay đổi bước tiến trong quỏ trỡnh luyện. Ởđõy ta sử dụng thuật toỏn Levenberg-Marquardt để luyện. Thuật toỏn Levenberg-Marquardt được trỡnh bày chi tiết trong Phụ lục B.

2.3. Ngun s liu s dng

a/ S liu cho RegCM3

Nguồn số liệu cung cấp cho mụ hỡnh RegCM3 bao gồm số liệu vềđộ cao địa hỡnh, cỏc loại bề mặt, nhiệt độ mặt nước biển và số liệu tỏi phõn tớch làm điều kiện ban đầu và điều kiện biờn cập nhật theo thời gian. Tất cả số liệu đầu vào cần để

chạy mụ hỡnh cú thể được tải về từ trang web http://www.ictp.trieste.it/pubregcm/ RegCM3.

™ Bộ số liệu Đặc trưng đất phủ toàn cầu (Global Landuse Cover Characteric: GLCC) cung cấp thụng tin về thực vật/mặt đệm, nhận được từ số liệu Bức xạ

75

từ thỏng 4/1992 đến thỏng 3/1993 và được chia thành 18 loại đất phủ/thực vật

được định nghĩa trong sơ đồ tương tỏc sinh quyển-khớ quyển BATS. Mặt đệm của mỗi ụ lưới của mụ hỡnh được xỏc định thuộc 1 trong số 18 loại này. Cú thể

xem kỹ hơn về số liệu GLCC tại trang web http://edcdacc.ugs.gov/glcc/ glcc.html.

™ Số liệu độ cao địa hỡnh được lấy từ USGS. Cỏc file số liệu mặt đệm và độ cao địa hỡnh đều cú sẵn tại cỏc độ phõn giải 30 và 10 phỳt và cú thể tải về từ trang web của ICTP là http://www.ictp.trieste.it/pubregcm/RegCM3/ DATA/SURFACE.

™ Số liệu SST cú thể là nhiệt độ mặt biển toàn cầu (GISST) hàng thỏng trờn lưới cỏch nhau 1 độ (1871-2002) cú sẵn từ Cơ quan Khớ tượng Trung tõm Hadley (Hadley Center Meteorological Office) (http://badc.nerc.ac.uk/data/gisst/) hoặc bộ số liệu phõn tớch hàng tuần trờn lưới 1 độ của nhiệt độ mặt biển ngoại suy tối

ưu (OISST) (1981-2002) cũng cú sẵn từ Cơ quan quản lý biển và khớ quyển quốc gia (National Ocean and Atmosphere Administration) trờn trang web http://www.cdc.noaa.gov/.

™ Số liệu phõn tớch toàn cầu để sử dụng đối với cỏc điều kiện ban đầu và biờn bao gồm:

9 ECMWF: Số liệu tỏi phõn tớch của Trung tõm dự bỏo thời tiết hạn vừa của Chõu Âu (European Centre for Medium-Range Weather Forecasts Reanalysis, T42, L15) từ 1993-1997.

9 NNRP1: Số liệu tỏi phõn tớch của Trung tõm quốc gia Dự bỏo Mụi trường của Mỹ (National Centre for Environmental Prediction (NCEP) Reanalysis datasets), lưới 2.5 độ, L17, từ 1948-2001.

9 NNRP2: Số liệu tỏi phõn tớch của Trung tõm quốc gia Dự bỏo Mụi trường của Mỹ (National Centre for Environmental Prediction (NCEP) Reanalysis datasets), lưới 2.5 độ, L17, từ 1979-2001.

9 ERA40: Số liệu tỏi phõn tớch của Trung tõm dự bỏo thời tiết hạn vừa của Chõu Âu (ECMWF Re-analysis), là số liệu tỏi phõn tớch toàn cầu của cỏc

76

biến khớ quyển từ rất nhiều quan trắc truyền thống và số liệu vệ tinh cho giai đoạn từ thỏng 9/1957 đến 8/2002.

b/ S liu thm định

™ CRU: Số liệu tỏi phõn tớch của Trung tõm nghiờn cứu khớ hậu của Anh với độ

phõn giải ngang 0,5 độ, chỉ cú số liệu nhiệt độ bề mặt, lượng mưa, tổng lượng mõy và độẩm tuyệt đối trung bỡnh thỏng.

™ Số liệu đầu vào: cú thể so sỏnh với chớnh số liệu đầu vào ERA40 (ECMWF) để

xem xột khả năng tỏi tạo cỏc trường giú, nhiệt và ẩm của mụ hỡnh.

™ Quan trắc thực tế trờn Việt Nam: 60 trạm quan trắc khớ tượng điển hỡnh trải đều trờn lónh thổ Việt Nam. Trong 1 ngày cú số liệu tại 4 ốp quan trắc chuẩn. Nhiệt

độđược tớnh trung bỡnh ngày, sau đú tớnh trung bỡnh cỏc thỏng để so sỏnh. Lượng mưa tớnh tổng lượng ngày, sau đú tớnh trung bỡnh thỏng để so sỏnh.

Túm lược cỏc bước thc hin trong chương 3 và 4:

™ Trước hết chọn cỏc tham số động lực và vật lý thớch hợp nhất cho mụ hỡnh RegCM3 đối với khu vực ĐNA, sau đú chạy mụ phỏng khớ hậu hạn mựa trong 10 mựa hố từ năm 1991 đến 2000 với cỏc tham sốđược chọn.

™ Đỏnh giỏ kết quả mụ phỏng bằng cỏc chỉ số thống kờ, chỉ ra sai số hệ thống của nhiệt độ và lượng mưa mụ phỏng so với quan trắc.

™ Hiệu chỉnh nhiệt độ và lượng mưa trung bỡnh thỏng bằng ANN.

77 Chương 3 KT QU Mễ PHNG CÁC TRƯỜNG KHÍ TƯỢNG TRấN KHU VC ĐễNG NAM Á BNG Mễ HèNH KHÍ HU KHU VC RegCM3 3.1. Thi tiết, khớ hu khu vc ĐNA trong thp k cui thế k XX

Trong thập kỷ cuối của thế kỷ XX, thời tiết khu vực ĐNA đó chịu ảnh hưởng mạnh mẽ của hiện tượng ENSO. ENSO là từ ghộp được cấu tạo bởi “El

Nino/Southern Oscillation (El Nino/Dao động Nam)”, thực chất là chỉ cả 2 hai hiện tượng El Nino và La Nina và cú liờn quan với dao động của khớ ỏp giữa 2 bờ phớa

Đụng Thỏi Bỡnh Dương với phớa Tõy Thỏi Bỡnh Dương - Đụng Ấn Độ Dương gần xớch đạo. “El Nino” là từđược dựng để chỉ hiện tượng núng lờn dị thường của lớp nước biển bề mặt ở khu vực xớch đạo trung tõm và Đụng Thỏi Bỡnh Dương, kộo dài 8 - 12 thỏng, hoặc lõu hơn, thường xuất hiện 3 - 4 năm một lần, song cũng cú khi dày hơn hoặc thưa hơn. “La Nina” là hiện tượng lớp nước biển bề mặt ở khu vực núi trờn lạnh đi dị thường, xảy ra với chu kỳ tương tự hoặc thưa hơn El Nino.

Hiện tượng El Nino và La Nina cú ảnh hưởng đến thời tiết, khớ hậu toàn cầu với mức độ khỏc nhau và rất đa dạng. Tuy nhiờn, đối với từng khu vực cụ thể, vẫn cú thể xỏc định được những ảnh hưởng chủ yếu cú tớnh đặc trưng của mỗi hiện tượng núi trờn [Nguyễn Đức Ngữ, 2007]. Cỏc kỳ El Nino và La Nina từ mức độ

yếu, ụn hũa đến mạnh, xảy ra trong thế kỷ XX được tổng kết trong Bảng 3.1, trong

đú 10 năm cuối của thế kỷ XX đó xảy ra 4 đợt El Nino với một đợt xảy ra năm 1997-1998 được xem là mạnh nhất thế kỷ [Nguyễn Đức Ngữ và Phạm Thị Thanh Hương, 2003]. Cỏc đợt El Nino và La Nina trong thời kỳ 1991-2000 được trỡnh bày trong Bảng 3.2. Hiện tượng El Nino chủ yếu bắt đầu xảy ra vào cỏc thỏng mựa hố, kộo dài đến hết mựa hố năm đú hoặc sang mựa hố năm sau.

78

Những thời kỳ xảy ra ENSO mạnh sẽđược chỳ ý trong khi phõn tớch kết quả

mụ phỏng hoàn lưu, nhiệt độ, độẩm và lượng mưa của mụ hỡnh RegCM3 trong mựa giú mựa mựa hố trờn khu vực ĐNA tiếp sau đõy.

Bảng 3.1:Cỏc kỳ El Nino và La Nina trong thế kỷ XX.

El Nino yếu hoặc ụn hũa 57-58, 65-66, 77-78, 87-88, 92-93, 94-95 El Nino mạnh 72-73, 82-83, 91-92, 97-98

La Nina yếu hoặc ụn hũa 50-51, 56-57, 64-65, 70-71, 71-72, 74-75, 98-99, 2000 La Nina mạnh 55-56, 73-74, 75-76, 88-89

Bảng 3.2: Cỏc đợt ENSO trong thập kỷ của cuối thế kỷ XX [Nguyễn Đức Ngữ, 2007; Trenberth, 1997]

ENSO Năm Thỏng bắt đầu Thỏng kết thỳc Thời gian kộo dài

1991-1992 4/1991 6/1992 15 thỏng 1993 2/1993 8/1993 7 thỏng 1994-1995 6/1994 3/1995 10 thỏng El Nino 1997-1998 4/1997 6/1998 15 thỏng 1995-1996 8/1995 4/1996 9 thỏng La Nina 1998-2000 8/1998 7/2000 18 thỏng

3.2. Hoàn lưu, nhit độ, độm và lượng mưa ca RegCM3

3.2.1. Cấu hỡnh động lực

Cỏc thử nghiệm đều sử dụng cấu hỡnh như trong Bảng 3.3. Độ phõn giải ngang 60km và 18 mực thẳng đứng trong đú cú 6 mực trong lớp PBL (dưới 850mb) và mực trờn cựng của mụ hỡnh ở 70mb. Sau một số thử nghiệm về số liệu đầu vào, thời gian spin-up và thời đoạn mụ phỏng chỳng tụi lựa chọn điều kiện ban đầu và biờn xung quanh biến đổi theo thời gian từng 6h là tỏi phõn tớch ERA40 (ECMWF), thời gian spin-up là 10 ngày và hạn mụ phỏng là 3 thỏng. Khu vực đệm xung quanh gồm 12 điểm lưới, sử dụng thuật toỏn "giảm dư" trờn biờn [Giorgi vcs, 1993].

79

Bảng 3.3: Cấu hỡnh động lực trong RegCM3.

Động lực học Thủy tĩnh Số liệu đầu vào ERA40

Miền tớch phõn 15S-27N; 70-135E

Độ phõn giải ngang 60km

Độ phõn giải thẳng đứng 18 mực sigma (từ mặt đất ặ 70mb)

Thời gian mụ phỏng 3 thỏng mựa hố (6-8) trong 10 năm (1991-2000) Thời gian Spin-up 10 ngày (bắt đầu từ 20/5 hàng năm)

Đối với dự bỏo thời tiết, điều kiện ban đầu rất quan trọng, cũn với bài toỏn DBKHKV, điều kiện ban đầu sẽ bị quờn đi sau một thời gian tớch phõn, trong khi

điều kiện biờn được cập nhật theo thời gian lại cú vai trũ quan trọng. Do đú, lựa chọn miền tớnh và điều kiện biờn, nhất là biờn xung quanh cần lưu ý trước nhất khi mụ phỏng hoặc dự bỏo khớ hậu khu vực. Kớch thước miền càng nhỏ, ảnh hưởng của biờn xung quanh đến kết quả mụ phỏng càng lớn [Giorgi vcs., 1993; Jones vcs., 1995; Seth và Giorgi, 1998] bởi vỡ trong khi tỏc động của biờn xung quanh trong cỏc thử nghiệm miền nhỏ ộp buộc mụ hỡnh để nhận được mụ phỏng tốt hơn, cũng

đồng thời làm xuất hiện những phản ứng khụng thực đối với cỏc tỏc động nội tại khụng phự hợp với tỏc động quy mụ lớn được truyền vào. Do đú, miền tớnh phải đủ

lớn để RCM cú thể bộc lộ được động lực nội tại của nú thay vỡ bị ộp buộc về trạng

Một phần của tài liệu LUẬN ÁN TIẾN SĨ KHÍ TƯỢNG HỌC " NGHIÊN CỨU KHẢ NĂNG MÔ PHỎNG MÙA CÁC YẾU TỐ KHÍ TƯỢNG TRÊN LÃNH THỔ VIỆT NAM BẰNG PHƯƠNG PHÁP THỦY ĐỘNG VÀ THỐNG KÊ " pdf (Trang 72 - 166)

Tải bản đầy đủ (PDF)

(166 trang)