Ứng dụng mạng Thần kinh nhân tạo dự báo một số yếu tố khí tượng cho khu vực đồng bằng phía bắc Việt Nam, tài liệu dành cho các bạn nghiên cứu, học tập cũng như tham khảo trong quá trình học của mình về vấn đề này.
Trang 1Mục lục
Mục lục 1
Mở đầu 2
Chơng 1: tổng quan 4
1.1 Tình hình nghiên cứu và ứng dụng mạng TKNT 4
1.2 Các đặc trng vật lý cơ bản của bức xạ 7
1.3 Sự hấp thụ bức xạ trong khí quyển 15
1.4 Sự khuếch tán bức xạ trong khí quyển 20
1.5 Cách tính bức xạ sóng ngắn trong khí quyển 21
1.6 Chế độ nhiệt và bức xạ ở khu vực đồng bằng phía bắc 28
Chơng 2: cơ sở lý thuyết mạng thần kinh nhân tạo (TKNT) 32
2.1 Các khái niệm cơ bản về mạng thần kinh nhân tạo 32
2.2 Các quy tắc và phơng pháp xây dựng mạng TKNT 42
2.3 Các loại mạng TKNT và ứng dụng 51
Chơng 3: ứng dụng mạng tknt dự báo một số yếu tố khí tợng cho khu vực đồng bằng phía bắc việt nam 63
3.1 Giới thiệu phần mềm NeuroSolutions 64
3.2 Một số kỹ thuật phụ trợ 67
3.3 Các chỉ số đánh giá, so sánh 68
3.4 Kết quả 70
Kết luận 88
Tài liệu tham khảo 91
Trang 2Mở đầu
Bức xạ Mặt trời là nguồn năng lợng chủ yếu và vô cùng quý giá đối với trái
đất Nó quyết định đến sự biến đổi khí hậu, sự sống của con ngời Chính điều đó đòihỏi con ngời phải biết khai thác triệt để và sử dụng nguồn năng lợng này một cách
có hiệu quả nhất Nghiên cứu giảm thiểu những ảnh hởng xấu đến sự sống của conngời và động thực vật nhằm mục tiêu phát triển bền vững Trong những thập kỷ gần
đây, ở những nớc tiên tiến ngời ta không chỉ mở rộng mạng lới đo đạc, nghiên cứuquy luật biến đổi theo không gian và thời gian của các yếu tố bức xạ Mặt Trời, màcòn đi sâu thêm nghiên cứu phân bố năng lợng trong những dải phổ hẹp của trực xạ,tổng xạ nh C.P.Jacovide đã nhận xét: “Với sự gia tăng ứng dụng của phổ bức xạ nh:Pin Mặt Trời, bình thu nhiệt và những ứng dụng trong môi trờng, nông nghiệp thúc
đẩy nghiên cứu không chỉ với bức xạ tổng cộng của Mặt Trời tại mặt đất mà còntrong từng thành phần phổ của nó”
Quả thực, những nghiên cứu về năng lợng mặt trời có ý nghĩa rất lớn trongnông nghiệp, trong công nghiệp chiếu sáng và năng lợng nhiệt cho các công trìnhxây dựng, và tất nhiên, trong nghiên cứu khí tợng Hơn thế nữa, vai trò của năng l-ợng mặt trời ngày càng tăng cũng thúc đẩy những nghiên cứu sâu hơn và đầy đủ hơn
về năng lợng mặt trời
Có nhiều nguyên nhân về kinh tế và môi trờng thúc đẩy sự xúc tiến nghiêncứu nguồn năng lợng này, đó là: sự phá hủy môi trờng do tiêu thụ khí ga, xăng,dầu ; sự lo ngại về mức tăng khí CO và CO2 trong khí quyển có thể dẫn đến pháhủy tầng ozon và sự sống trên trái đất; viễn cảnh về sự thiếu hụt dầu và khí ga trongmột vài thập kỷ tới nếu mức khai thác hiện nay vẫn đợc duy trì; nhu cầu của cácngành và các khu công nghiệp mới, các nớc có nền kinh tế phát triển, sự thiếu hụtnguồn nớc đối với các công trình thủy điện và các mối đe dọa khác khi giá dầu thếgiới tiếp tục tăng cao
Xuất phát từ những nguyên nhân đó, năng lợng mặt trời đợc xem là nguồnnăng lợng sạch, đầy hứa hẹn, thay thế cho năng lợng dầu mỏ đang đợc khai thác triệt
để hiện nay Nguồn năng lợng này rất dồi dào ở các nớc và khu vực nhiệt đới.Những hạn chế của năng lợng mặt trời hiện nay là giá thành của nó còn quá đắt, tínhchất dao động mạnh phụ thuộc vào điều kiện thời tiết Tuy nhiên đó sẽ không phải lànhững vấn đề trong một vài thập kỷ tới, khi khoa học dự báo thời tiết, khoa học nănglợng đều đã có những tiến bộ đáng kể trong thời gian gần đây Do đó, những nghiêncứu về tiềm năng, sự biến đổi theo thời gian, và khả năng dự báo bức xạ mặt trời làrất cần thiết Nhu cầu thực tế đòi hỏi những dự báo năng lợng mặt trời chính xác hơn
Trang 3so với những gì các mô hình khí hậu ngày nay đã làm đợc Gần đây nhất, tác giảRicardo A Guarnieri và cộng sự [24] đã sử dụng mạng TKNT điều chỉnh kết quả dựbáo bức xạ mặt trời của mô hình quy mô vừa Eta cho khu vực nam Brazil, kết quả đ-
ợc đánh giá là khả quan và có ý nghĩa thực tiễn, giúp cải thiện đáng kể dự báo củamô hình (sai số của mô hình giảm 20 – 30%)
Cùng với bức xạ, nhiệt độ tối cao là một trong các yếu tố khí tợng từ lâu ít
đ-ợc quan tâm đúng mức Nhiệt độ tối cao đặc biệt có ý nghĩa đối với sản xuất nôngnghiệp, ngành xây dựng, và tất nhiên là trong khoa học khí tợng, đặc biệt là trongnhững tháng mùa hè
Trong tập luận văn này, để xây dựng mạng TKNT dự báo hai yếu tố khí tợng
là tổng xạ và nhiệt độ tối cao, tôi sử dụng số liệu quan trắc của các yếu tố: Bức xạtổng cộng (Tổng xạ), nhiệt độ tối cao của 4 trạm: Láng (Hà Nội), Phủ Liễn (HảiPhòng), Yên Định (Thanh Hóa) và Vinh (Nghệ An) trong vòng 10 năm (1981 -1990) kết hợp với sử dụng các số liệu tái phân tích của NCEP của các yếu tố: tổngxạ ngày tại bề mặt, tổng xạ đến đỉnh của khí quyển, nhiệt độ trung bình ngày, nhiệt
độ tối cao, độ ẩm tuyệt đối tầng 1000mb, độ ẩm tơng đối bề mặt, lợng mây trungbình ngày, tổng lợng nớc khả giáng trong cột khí quyển, các thành phần gió bề mặt,
độ dày lớp khí quyển giữa các mực 1000, 850 và 500mb,
Ngoài phần mở đầu, kết luận, tài liệu tham khảo, luận văn gồm 3 chơng:
Chơng I: Tổng quan
Chơng II: Cơ sở lý thuyết về mạng TKNT
Chơng III: ứng dụng mạng TKNT dự báo một số yếu tố khí tợng cho khu vực đồng bằng phía Bắc Việt Nam.
Trang 4Chơng 1: tổng quan 1.1 Tình hình nghiên cứu và ứng dụng mạng TKNT
Các công nghệ mới trong kỹ thuật, vật lý, đặc biệt là vật lý khí quyển, sinhhọc đã làm nảy sinh một loạt các vấn đề phi tuyến, bất ổn định và phức tạp Đểgiải đợc các bài toán đó đòi hỏi phải có các công cụ xử lý, tính toán phi tuyến, trong
số các công cụ đó, mạng thần kinh nhân tạo (TKNT) tỏ ra có u thế vợt trội MạngTKNT đáp ứng đợc nhu cầu vì nó đợc luyện trên các mẫu, sử dụng các công cụthống kê và giả thuyết tối u Có nhiều loại mạng TKNT khác nhau, trong đó cómạng truy hồi, mạng nhận thức đa lớp và mạng thời gian trễ Việc sử dụng mạngtruy hồi nh một công cụ dự báo ngày càng thể hiện nhiều u điểm trên nhiều lĩnh vựcnhờ vào khả năng liên kết giữa các lớp, các phần tử hoạt động1 trong mạng
Quá trình phát triển của mạng TKNT trải qua nhiều giai đoạn khác nhau, đợc
đánh dấu bằng các mốc quan trọng: những năm 40 của thế kỷ 20 đánh dấu nhữngphát triển đỉnh cao đầu tiên với các nghiên cứu của McCulloch và Pitts (1943); nhng
mãi đến năm 1949, Hebb đa ra thuật toán học đầu tiên của mạng, gọi là thuật toán
Hebb, mạng TKNT chính thức ra đời và khẳng định khả năng tính toán trong các bài
toán phi tuyến Dấu mốc thứ hai xuất hiện những năm 60 với giả thuyết hội tụ của
mạng nhận thức của Rosenbatt (1960), thành công đầu tiên trong lĩnh vực mạng
TKNT là nơron thích ứng tuyến tính – ADALINE2 và nơron thích ứng tuyến tính
đa biến - MADALINE3 do Widrow và Hoff (1960) phát triển; sau đó, Minsky cùng
Papert chỉ ra hạn chế của mạng nhận thức đơn giản (1969) Kết quả của Minsky và
Papert đã làm thất vọng nhiều nhà khoa học, đặc biệt là các nhà khoa học trongngành khoa học tính toán lúc bấy giờ Chính những công bố này đã làm chậm tiếntrình phát triển của mạng TKNT gần 20 năm Mãi đến những năm 80, mạng TKNTmới có đợc những thành tựu đáng chú ý mới Đó là công trình của Hopfield [16] với
cách tiếp cận dới khía cạnh năng lợng và thuật toán học lan truyền ngợc cho mạng nhận thức đa lớp Nhiều ngời nhắc đến công trình này của Hopfield nh một sự khởi
đầu thứ hai cho mạng TKNT Sau đó công trình đợc tiếp tục phát triển và công bố
rộng rãi năm 1986 trong bài viết của Rumelhart và cộng sự Từ đó đến nay, cùng với
sự phát triển của công nghệ thông tin và truyền thông, cộng đồng ngời sử dụngmạng TKNT tăng lên đáng kể và đợc mở rộng trên nhiều lĩnh vực Trong khí tợnghọc, đã có nhiều nhà khí tợng học trên thế giới và Việt Nam sử dụng mạng TKNT
nh những công cụ thống kê cho các bài toán phức tạp giúp hiệu chỉnh sản phẩm môhình số, tái tạo và bổ xung số liệu, tính toán tổng lợng ozon trong khí quyển
1 Processing Elements
2 ADAptive LInear Neuron
3 Multiple ADALINE
Trang 5Do tính đa dạng của các loại mạng khác nhau nên rất khó cho việc phân loạimạng, nhng trong luận văn này, tôi cũng cố gắng đa ra một cách phân loại phổ biếnnhất mà đã đợc nhiều tác giả trình bày Sự phân loại ở đây chỉ áp dụng cho các thuậttoán và các phơng pháp học phổ biến đợc dùng trong mạng TKNT, có thể còn nhiềuthuật toán cũng nh phơng pháp khác nhng do không đợc sử dụng rộng rãi nên cũngkhông đợc đa vào phân loại trong luận văn này.
Nhận thức đa lớp (Zuruda, 1992;
Carling, 1992; Haykin, 1994;
Bishop, 1995; Patterson, 1996)
Lan truyền ngợc(Zuruda, 1992; Haykin,1994; Bishop, 1995;)
Lan truyền ngợc
Bình phơng tối thiểu
-Trung bình k phần tử (Bishop, 1995)
Trang 6Bảng 1: Phân loại mạng TKNT và ứng dụng (tiếp)
Thuật toán Oja (Zurada,1992; Kung, 1993)
-Dự báo
Mạng thời gian trễ (Zurada, 1992;
Kung, 1993, de Vries và Principe,
sử dụng mạng TKNT là công cụ nội suy trờng khí tợng về trạm thay cho các phơngpháp nội suy truyền thống và nhiều công trình nghiên cứu chuyên biệt về lĩnh vựcmạng TKNT đáng chú ý khác nh các công trình của Danilo P Mandic [9], Hopfield[16], Jose C Principe [18], Lakhmi C Jain và N.M Martin [19], Marcelo C.Medeiros và đồng nghiệp [20], Pattrick van der Smagt và Ben Krose [21] và S.Haykin [25]
Còn ở Việt Nam, các tác giả Lê Xuân Cầu [1] đã ứng dụng mạng TKNT dựbáo lũ trong thủy văn, tác giả Nguyễn Hớng Điền và cộng sự cũng đã có nhiều côngtrình nghiên cứu ứng dụng mạng TKNT trong dự báo khí tợng thủy văn [3, 4] Tất cảcác công trình trên đều có chung kết luận: Mạng TKNT đã cải thiện đáng kể kết quả
dự báo so với các phơng pháp khác
Trang 71.2 Các đặc trng vật lý cơ bản của bức xạ
Năng lợng đợc truyền từ nơi này đến khác dới 3 dạng: quá trình truyền dẫn
liên quan đến vận chuyển năng lợng động lợng của nguyên tử và phân tử (thờng biểuhiện dới dạng nhiệt) Do đó, nếu một đầu của thanh kim loại bị đốt nóng thì phân tửkim loại ở đó sẽ chuyển động nhanh hơn, va chạm với các phân tử khác và truyền
động lợng cho chúng Đến lợt nó, các phân tử này lại truyền động lợng đó cho cácphân tử xung quanh; và kết quả là nhiệt lợng đợc truyền đến đầu thanh kim loại bênkia
Năng lợng cũng có thể đợc vận chuyển thông qua sự vận chuyển vật lý củavật chất Trong chất khí và chất lỏng, sự vận chuyển năng lợng này đợc biết đến là
quá trình đối lu Theo nghĩa rộng của từ đối lu nó không chỉ bao gồm vận chuyển
năng lợng theo chiều thẳng đứng khi lớp không khí hoặc chất lỏng bên dới bị đốtnóng mà nó còn là sự khuyếch tán rối và bình lu nhiệt theo mọi hớng
Và cuối cùng, năng lợng còn có thể đợc truyền từ vật thể này sang vật thểkhác nhờ các sóng điện từ có hoặc không có sự tồn tại của một phơng tiện vật lý
trung gian, thông qua quá trình bức xạ Năng lợng điện từ lan truyền theo đờng
thẳng và với một vận tốc không đổi trong chân không
c 3.00x1010 cm/sBức xạ đợc đặc trng bởi bớc sóng, , là khoảng cách giữa hai đỉnh sóng liêntiếp; hoặc bởi tần số, , là số đỉnh sóng đi qua một điểm cố định trong một đơn vịthời gian Rõ ràng rằng:
. = cChi tiết về các loại sóng và bớc sóng trong không gian xem bảng 2
Mặt trời là một ngôi sao (định tinh) gần chúng ta nhất Nó là một quả cầu lửakhổng lồ, có đờng kính khoảng 1 390 600 km (gấp 109 lần đờng kính trái đất), thểtích 1,41.1018km3, khối lợng khoảng 1.1030 kg (gấp hơn 330 000 lần trái đất) Trái
đất quay xung quanh mặt trời theo một quĩ đạo elíp gần tròn (mặt trời ở một tiêu
điểm) mà khoảng cách ngắn nhất từ mặt trời đến trái đất là 147 triệu km (ngày 3tháng 1) khoảng cách xa nhất là 152 triệu km (ngày 5 tháng 7), khoảng cách trungbình là 149,5 triệu km (ánh sáng truyền mất hơn 8 phút) Mặt trời bức xạ liên tục l-ợng bức xạ khổng lồ ra xung quanh Lợng bức xạ mặt trời lớn tới mức có thể làm tan
và bốc thành hơi một vỏ nớc đá dầy 12m bọc quanh nó trong vòng 1 phút Tuy
Trang 8nhiên, khí quyển trái đất chỉ hứng đợc một phần 2 tỷ lợng bức xạ của mặt trời Tuy
vậy, lợng bức xạ này cũng rất lớn, vào khoảng 1,5.1028 J mỗi ngày [2]
Bức xạ mặt trời trên đờng tới trái đất bị nhiều tác dụng làm suy yếu cho nênphổ bức xạ mặt trời mà ta quan trắc đợc trên trái đất không giống nh phổ bức xạ tạigốc của mặt trời Ngời ta thấy phổ bức xạ điện từ của mặt trời rất rộng, từ tiaGamma đến sóng vô tuyến
Bảng 2: Các loại bức xạ và bớc sóng trong không gian
Những kết luận về bức xạ của mặt trời có thể chỉ ra là:
- Phổ bức xạ mặt trời tơng tự nh của vật đen tuyệt đối Nếu chúng ta đo tổngnăng lợng nhận đợc từ mặt trời tới một đơn vị diện tích trong một đơn vị thời gian vàtính toán nhiệt độ của vật đen theo định luật Stefan-Boltzmann ứng với tổng năng l-ợng đó thì ta nhận đợc nhiệt độ của mặt trời là 57500K Mặt khác, chúng ta cũng cóthể do bức xạ nh là một hàm của bớc sóng, ứng với năng lợng phát xạ cực đại, vàtính toán nhiệt độ vật đen từ định luật Wien1 Bức xạ cực đại là 0.4740m, tơng ứngvới nhiệt độ 61080K Hiển nhiên mặt trời không phải là vật đen tuyệt đối vì hai nhiệt
độ này không thống nhất với nhau Sự khác biệt này là do sự hấp thụ sóng ngắn củalớp “khí” phía ngoài mặt trời (sự hấp thụ này không ảnh hởng đến phát xạ cực đại -0.4740m nhng lại ảnh hởng đến năng lợng rọi tới trái đất) Tuy nhiên, gần đúngvật đen tuyệt đối của mặt trời là thích hợp cho rất nhiều mục đích khác nhau
- Cờng độ phát xạ năng lợng của mặt trời là rất ổn định: Những đo đạc về độrọi của bức xạ mặt trời đã đợc S.P Langley và đặc biệt là C G Abbot thực hiện từnhiều năm trớc đây Sự thay đổi khoảng cách giữa mặt trời và trái đất trong năm cóthể dễ dàng đợc đa vào tính toán, nhng những biến đổi về sự hấp thụ của khí quyểnlại gây ra rất nhiều khó khăn Phơng pháp hiệu quả nhất đợc Abbot và các đồngnghiệp đa ra là:
Trang 9trong đó, Sz là độ rọi bức xạ mặt trời đơn sắc tại mực z
S0 là độ rọi bức xạ mặt trời đơn sắc tại giới hạn trên của khí quyển
k là hệ số suy yếu khối đơn sắc
là mật độ không khí
là góc thiên đỉnh của mặt trời
Và giá trị này đợc Abbot tính toán ra là khoảng 1.00 cal/cm2/phút (1cal/cm 2 còn đợc gọi là 1 langley, ký hiệu là ly) đối với mặt phẳng vuông góc với tia sáng mặt
trời ở khoảng cách trung bình giữa trái đất và mặt trời (152 triệu km) và đợc gọi là
hằng số mặt trời
Về sau, nhờ những thiết bị hiện đại, ngời ta có thể xác định đợc giá trị chínhxác hơn của hằng số mặt trời Năm 1986, Hội nghị Quốc tế ở Davos (Thụy Sỹ) đãchấp nhận giá trị So = 1367 W/m2 = 1.968 cal/cm2/phút
Các nghiên cứu còn cho thấy hằng số mặt trời và phổ bức xạ của mặt trời cóbiến đổi theo thời gian, nhất là vùng phổ bức xạ cực tím, ảnh hởng tới sự hấp thụnăng lợng ở các mực trên của khí quyển
Trái đất nhận năng lợng bức xạ chủ yếu từ mặt trời Năng lợng đến trái đất từcác thiên thể khác trong vũ trụ là không đáng kể Khi truyền trong khí quyển, dotính bất đồng nhất về mặt quang học, về trạng thái lý hoá của khí quyển, bức xạ mặttrời bị hấp thụ và khuếch tán Phần khá lớn của bức xạ mặt trời đến đợc mặt đất dớidạng chùm tia song song đợc gọi là bức xạ trực tiếp hay trực xạ Phần bức xạ bị khíquyển khuếch tán từ mọi điểm của vòm trời đến mặt đất gọi là bức xạ khuếch tánhay tán xạ Tổng của trực xạ và tán xạ gọi là bức xạ tổng cộng hay tổng xạ
Bức xạ mặt trời khi đến mặt đất, phần cơ bản bị hấp thụ chuyển thành nhiệt
đốt nóng mặt đất, phần khác bị phản xạ trở lại khí quyển Phần bức xạ mặt trời bịmặt đất hay khí quyển (chủ yếu do mây) phản xạ trở lại đợc gọi là bức xạ phảnchiếu hay phản xạ
Mức độ hấp thụ bức xạ của mặt đệm lớn hơn rất nhiều so với khí quyển vì khíquyển về cơ bản là môi trờng khuếch tán bức xạ, chứ hấp thụ thì rất ít, trừ mây Nóichung, phần bức xạ do mặt đệm hấp thụ thờng gấp ba lần phần bức xạ do khí quyểnhấp thụ
Đến lợt mình, do bị đốt nóng, mặt đất trở thành nguồn phát xạ nhiệt hớng tớikhí quyển Bức xạ phát ra từ mặt đất gọi là bức xạ mặt đất Tơng tự nh vậy, khíquyển cũng phát xạ về mọi hớng và một phần hớng về mặt đất, phần này gọi là bứcxạ nghịch của khí quyển
Trang 10Các dòng bức xạ kể trên khác nhau về thành phần phổ Phần cơ bản của bứcxạ mặt trời do phát xạ ở nhiệt độ cao, nên nằm trong khoảng phổ nhìn thấy Trongkhi đó bức xạ mặt đất và bức xạ khí quyển phần lớn ở bớc sóng lớn hơn 4 m Do sựkhác biệt này mà bức xạ mặt trời đợc gọi là bức xạ sóng ngắn còn bức xạ mặt đất vàkhí quyển gọi là bức xạ sóng dài
Nh vậy, trong khí quyển luôn tồn tại một hệ các dòng bức xạ khác nhau vềthành phần phổ và hớng Khi nghiên cứu các dòng này ta thờng xét phần đợc vậnchuyển, phần bị phản xạ và phần bị hấp thụ chuyển thành nhiệt Về mặt năng lợng,tổng đại số của tất cả các dòng bức xạ qua một bề mặt nào đó (năng lợng bức xạ tới-năng lợng bức xạ rời khỏi bề mặt) đặc trng cho sự hấp thụ- phát xạ, còn đợc gọi làcán cân bức xạ
Nghiên cứu tất cả các dòng bức xạ trong khí quyển là nhiệm vụ của chuyênngành bức xạ học
Nếu không có khí quyển, bức xạ mặt trời tới mặt đất dới dạng những tia song
song Khi đó trong một đơn vị thời gian trên mỗi đơn vị diên tích mặt đất nằm ngang
ở điểm bất kỳ sẽ có năng lợng bức xạ mặt trời đi tới, tức độ rọi trực xạ (mà trongnhiều tài liệu vẫn gọi là cờng độ trực xạ) bằng:
o 2 o
sinhR
S'
S (1.1)
trong đó SO là hằng số mặt trời,
R là khoảng cách tơng đối giữa mặt trời và trái đất, bằng tỷ số giữa khoảng cáchthực r và khoảng cách trung bình r , còn hO là độ cao mặt trời trên chân trời (xemhình 1) tại thời điểm đang xét (Tỷ số SO/R2 cho ta độ rọi bức xạ mặt trời tới mặtvuông góc với các tia mặt trời ở thời điểm đang xét)
Độ cao mặt trời tại mỗi điểm phụ thuộc vào vĩ độ địa lý , thời gian trongnăm và trong ngày Trong thiên văn học ngời ta đã chứng minh đợc công thức:
Trang 11sinhO=sinsin+coscoscoscos (1.2)
trong đó là xích vĩ (“vĩ độ” của mặt trời), thay đổi theo thời gian trong năm giữa
hai giá trị 23027', còn là góc giờ mặt trời,
2 t với là chu kỳ quay của trái
đất quanh trục của nó ( 24 giờ), còn t là thời điểm trong ngày (theo giờ thực ứng
với kinh độ địa phơng) tính mốc lúc giữa tra Thay (1.2) vào (1.1) ta đợc:
)coscoscossin
0
2coscoscossin
sin sin 2
cos (1.4)
) arccos(
tg tg
o
t
t o t
dt t S
dt S
S
2sinsin
2
Vì to đợc xác định theo công thức (1.5) nên H chỉ phụ thuộc vào vĩ độ địa lý
và thời gian trong năm Do đó nó biểu thị quy luật phân bố của bức xạ mặt trời theo
vĩ độ và thời gian trong năm trong điều kiện không có khí quyển
Trang 12Từ (1.1) và (1.2) ta thấy độ rọi đạt giá trị lớn nhất tại thời điểm t = 0 (lúc giữa
tra) tại nơi thoả mãn điều kiện:
sinsin +cos coscos = cos(-) = 1 (1.7)
tức là tại lúc giữa tra ngày mặt trời qua thiên đỉnh (=), còn độ rọi sẽ nhỏ nhất,E=0, tại thời điểm mặt trời mọc và lặn (hO=0)
Các kết quả tính theo công thức (1.6b) đối với các vĩ độ khác nhau ở Bắc bán
cầu vào các ngày hạ chí và đông chí (=23,450) đợc đa ra trong bảng 3
Bảng 3: Độ phơi bức xạ mặt trời H (MJ/m2ngày đêm) tới mặt đất trong trờng hợp
không có khí quyển ở một số vĩ độ thuộc bán cầu Bắc
nhập nhiệt) sau ngày đêm có
biến trình kép thể hiện hai
cực tiểu vào ngày đông chí
và hạ chí ở giữa xích đạo
thì hai cực đại rơi vào ngày
xuân phân (22/3) và thu
phân (22/9) Dịch lên phía
bắc, nh ở Việt Nam chẳng hạn, hai cực đại này xích lại gần nhau hơn, tới chí tuyến
thì chúng nhập lại thành một cực đại duy nhất ở vùng vĩ độ trung bình ở bán cầuBắc, biến trình năm của H có dạng đơn thể hiện một cực đại vào ngày hạ chí và một
cực tiểu vào ngày đông chí ở vùng vĩ độ cao xung quanh vòng cực (66,550) cómột thời gian dài trong năm không có bức xạ tới, nhng thời gian giữa mùa hè có l-
Hình 2: Biến trình năm của bức xạ ở một số vĩ độ
Trang 13ợng bức xạ tới lớn nhất (tại đỉnh cực, bức xạ đến sau 24 giờ vào ngày hạ chí gấp1,365 lần lớn hơn ở xích đạo).
ở bán cầu Nam sự việc xảy ra tơng tự nhng về thời gian lệch đi 6 tháng so vớibán cầu Bắc Thêm vào đó, do quỹ đạo trái đất quanh mặt trời có dạng elíp và lúctrái đất xa mặt trời nhất lại vào ngày mùng 5 tháng 7, gần ngày đông chí ở bán cầuNam (22/6), cho nên lợng bức xạ tới lại càng ít Ngợc lại, trái đất gần mặt trời nhấtvào ngày mùng 3 tháng 1, gần ngày hạ chí ở bán cầu Nam, nên lợng bức xạ tới lạicàng tăng mạnh Sự tăng, giảm bức xạ do khoảng cách mặt trời - trái đất thay đổitrong một năm chỉ vào khoảng 3% so với mức trung bình nhng cũng là một trongnhững nhân tố làm cho khí hậu ở bán cầu Nam có phần khắc nghiệt hơn ở bán cầuBắc
Để rõ hơn về điều này, ta có thể xem trong hình vẽ dới đây:
Hình 3: Bức xạ mặt trời (cal/cm2/ngày) đến bề mặt trái đất trong trờng hợp không
có khí quyểnNhận xét: Trong trờng hợp không có khí quyển, độ rọi bức xạ đạt cực đại tại
khu vực xích đạo, khoảng 790 - 895 ly/ngày (cal/cm2/ngày) Trong khi đó, ở hai cực
có dao động rất lớn, xấp xỉ 0 vào mùa đông và cực đại vào mùa hè đạt tới 1100
ly/ngày Một cực đại thứ hai xuất hiện ở khoảng gần vĩ tuyến 450 ở cả hai bán cầu, làkết quả của sự kết hợp giữa sự tăng của thời gian chiếu sáng theo vĩ độ và sự tăngcủa độ rọi theo vĩ độ Qua hình 3, ta nhận thấy phân bố giữa hai bán cầu là khá tơng
đồng, tuy nhiên, bán cầu nam nhận bức xạ ngày nhiều hơn bán cầu bắc, ví dụ, giá trị
cực đại của bắc bán cầu là 1077 ly/ngày, còn ở nam bán cầu là 1149 ly/ngày do bán
cầu nam vào mùa hè gần mặt trời hơn so với bán cầu bắc vào mùa hè
Trang 141.3 Sự hấp thụ bức xạ trong khí quyển
Nh trên đã trình bày, sự suy yếu bức xạ trong khí quyển là do sự hấp thụ vàkhuếch tán của không khí Khí quyển hấp thụ tơng đối ít bức xạ mặt trời Trongkhoảng phổ cực tím và hồng ngoại thì khí quyển hấp thụ mạnh hơn (có độ hấp thụlớn hơn) Tính trung bình, độ hấp thụ của khí quyển chỉ vào khoảng 18% đối với bứcxạ sóng ngắn tới của mặt trời và vào khoảng 62% đối với bức xạ sóng dài của mặt
đất phát đi Sự khác nhau đó dẫn tới kết quả là bức xạ sóng ngắn của mặt trời xuyênqua khí quyển khá dễ dàng đốt nóng mặt đất (vào ban ngày), nhng bức xạ sóng dàicủa mặt đất và các lớp khí quyển thấp lại khó thoát ra không gian vũ trụ, giữ chonhiệt độ trung bình của trái đất cao hơn hẳn so với trờng hợp không có khí quyển.Tác dụng giữ ấm mặt đất của khí quyển tơng tự nh kính bảo vệ cây trong vờn, vì vậyngời ta thờng gọi tính chất ấy của khí quyển là hiệu ứng nhà kính
Đóng vai trò quan trọng hơn cả trong sự hấp thụ bức xạ trong khí quyển làcác khí oxy, ozon, cacbonic, hơi nớc và xon khí ( bụi và nớc ngng kết ) Song sự hấpthụ của các chất này có chọn lọc, nghĩa là mỗi chất chỉ hấp thụ những tia bức xạ cóbớc sóng nhất định Mức độ hấp thụ và các dải hấp thụ chính của các chất khí trên ởdải sóng ngắn có thể nhận biết trên hình 4a qua việc so sánh đờng cong phân bố phổbức xạ mặt trời tại biên giới trên của khí quyển và tại mặt đất Nh ta thấy trên hình,mức độ hấp thụ phụ thuộc vào cả độ cao mặt trời Hình 4b biểu diễn trên cùng mộtthang độ đờng phân bố phổ bức xạ sóng ngắn từ mặt trời và sóng dài của vật đentuyệt đối ở nhiệt độ T cùng độ lớn với nhiệt độ thờng gặp của mặt đất hoặc khíquyển dới thấp Qua đây ta hiểu đợc rằng, khi có nắng, năng lợng bức xạ sóng ngắn
từ mặt mặt trời thờng lớn gấp nhiều lần bức xạ sóng dài của khí quyển tới mặt đất ởdải sóng lân cận bớc sóng =4-5m năng lợng tới mặt đất là ít nhất Hình 4c là sựphóng to đờng cong phân bố phổ bức xạ sóng dài của mặt đất coi là đen tuyệt đối (đ-ờng đứt nét phía trên) và một đờng phân bố trong thực tế (đờng liền nét phía dới) ởvùng phát xạ cực đại của nó (bớc sóng 5 - 15m)
Trang 15Hình 4: Phân bố năng lợng bức xạ mặt trời và mặt đất theo bớc sóng
tím Trong khoảng phổ nhìn thấy có các dải A với tâm ở 0,76 m và dải B với tâm ở0,69m Song hệ số hấp thụ của oxy trong hai dải này không lớn nên ảnh hởng của
nó đến sự suy giảm bức xạ là không đáng kể Oxy hấp thụ các sóng cực tím mạnhhơn rất nhiều ở các dải mang tên Runghe - Surman, Gherxbeg
Sự hấp thụ này chủ yếu diễn ra ở các lớp trên cao dẫn đến sự phân ly phân tửoxy và tạo thành ozon
Trang 16Đối với ozon (O 3 ): Ozon chủ yếu phân bố ở độ cao từ 10km đến 60km, có
mật độ tập trung lớn nhất ở độ cao 22km Ozon có khả năng hấp thụ bức xạ trongmột số khoảng phổ, đặc biệt là trong khoảng phổ cực tím Vạch hấp thụ quan trọngnhất của ozon là vạch Gartlei nằm trong khoảng phổ cực tím từ = 0,200m đến
= 0,320 m, ngoài ra còn có vạch yếu hơn với tâm ở = 0,360m Trong vạchGartlei, hấp thụ cực đại xảy ra ở bớc sóng = 0,255m Qua lớp ozon bức xạ ởkhoảng bớc sóng này bị suy giảm tới một nửa (khi áp suất và nhiệt độ ở điều kiệntiêu chuẩn)
Trong khoảng phổ nhìn thấy ozon hấp thụ một dải bức xạ có bớc sóng từ0,430 - 0,750m, hấp thụ mạnh nhất xảy ra ở bớc sóng = 0,600m Tuy hệ số hấpthụ của ozon trong dải này nhỏ hơn nhiều so với dải Gartlei nhng năng lợng bức xạtập trung trong khoảng phổ này lớn nên sự suy yếu cũng đáng kể
Do sự hấp thụ của ozon, phổ mặt trời quan trắc đợc ở mặt đất bị gián đoạnnhiều nơi trong khoảng bớc sóng nhỏ hơn 0,300m Điều này có tầm quan trọng lớn
đối với sự sống trên trái đất, bởi vì tia bức xạ cực tím cờng độ mạnh có thể phá huỷcác mô trong tế bào sống, gây nên bệnh ung th da , nhng tia cực tím (tử ngoại) c-ờng độ yếu lại rất cần thiết cho con ngời
Ngoài ra ozon còn có một số vạch hấp thụ yếu trong miền hồng ngoại trongdải hẹp 9,4 - 9,9m, song đa số các vạch này bị bao phủ bởi các vạch hấp thụ mạnhcủa hơi nớc và khí cacbonic
Đối với khí cacbonic (CO 2 ): Khí cacbonic có một số dải hấp thụ trong
khoảng phổ hồng ngoại, trong đó dải mạnh nhất là dải hẹp có tâm ở b ớc sóng4,3m Song dải này không có ý nghĩa lớn vì năng lợng trong quang phổ này củabức xạ mặt trời và bức xạ trái đất đều nhỏ Dải quan trọng hơn là dải rộng (12,9 - 17,1m) có tâm ở = 14,7m, vì dải này nằm trong quang phổ bức xạ nhiệtcực đại của khí quyển Ngoài hai dải chính trên, cacbonic còn có một số dải yếu cótâm ở = 2,7m và = 2,05m
Nồng độ khí cacbonic trong khí quyển trong những thập kỷ gần đây đã tănglên đáng kể do hoạt động của con ngời Sự gia tăng này kết hợp với khả năng hấpthụ mạnh của cacbonic trong quãng phổ bức xạ nhiệt cực đại của khí quyển đã cảntrở sự thoát nhiệt của trái đất ra không gian vũ trụ Trong các loại khí nhà kính nhântạo thì cacbonic đóng góp nhiều nhất vào sự tăng lên của nhiệt độ trái đất trongnhững thập kỷ vừa qua, do đó loài ngời cần có những nỗ lực chung để giảm thiểu sựphát thải nó
nhất Nó có ý nghĩa lớn nhất trong sự hấp thụ bức xạ khí quyển, giữ ấm cho trái đất
Đó là vì lợng hơi nớc có trong khí quyển rất lớn và nó có phổ hấp thụ phức tạp với
Trang 17nhiều vạch, dải khác nhau Trong khoảng phổ nhìn thấy, hơi nớc cũng có khá nhiềuvạch hấp thụ, song chúng không mạnh lắm, đáng kể hơn cả là dải (0,685 - 0,730m) và dải "ma" (0,585 - 0,606m).
Sự hấp thụ bức xạ hồng ngoại của hơi nớc có ý nghĩa to lớn hơn cả Các dảihấp thụ cơ bản trong quãng phổ này đợc đa ra trong bảng 4
Bảng 4: Các dải hấp thụ của hơi nớcKí
Lợng bức xạ do hơi nớc hấp thụ trong các dải này phụ thuộc vào lợng hơi nớc
có trong khí quyển Nhiều tác giả đã đa ra các công thức thực nghiệm liên hệ giữahai đại lợng này Một trong các công thức nh vậy là công thức Miuk và Moller:
S=0,172(mW0)0,303 (1.8)Trong đó S: giá trị hấp thụ mật độ thông lợng trực xạ tính ra cal/cm2phút, m: khối lợng quang học khí quyển theo hớng đến mặt trời,
W0: lợng hơi nớc trong cột không khí tiết diện đơn vị tính ra g/cm2
Để thiết lập công thức trên, các tác giả đã coi ảnh hởng của sự biến động cácchất hấp thụ khác (nh ozon, CO2, O2,…) tới trực xạ là không đáng kể
Sự hấp thụ bức xạ của hơi nớc trong quãng phổ sóng dài hơn 4m cũng đáng
đợc quan tâm Các nghiên cứu cho thấy trong toàn bộ miền phổ từ 4 - 40m, nănglợng bức xạ hầu nh bị hơi nớc hấp thụ hoàn toàn, trừ khoảng phổ từ 8 - 12m.Khoảng phổ từ 8 -12m lại trùng với vùng phát xạ mạnh nhất của mặt đất và các lớpkhí quyển dới thấp nên vào những đêm trời quang mây, trái đất "nguội" nhanh nhờthoát nhiệt (phát xạ) vào không gian vũ trụ trên dải sóng này Do vậy, dải sóng nàycòn đợc gọi là cửa sổ của khí quyển
Đối với xon khí: Vấn đề hấp thụ bức xạ của xon khí rất phức tạp, tuỳ thuộc
vào bản chất, kích thớc, nồng độ của các hạt xon khí và cha đợc nghiên cứunhiều, song có thể thấy rằng khi lợng xon khí trong khí quyển tăng sẽ làm suy giảmdòng trực xạ Điều này đặc biệt thấy rõ khi quan trắc trực xạ tại các thành phố côngnghiệp nơi có nhiều bụi, giá trị trực xạ đo đợc thờng nhỏ hơn so với vùng xung
Trang 18quanh vài phần trăm ảnh hởng của bụi còn thấy rõ khi có những vụ cháy rừng hoặc
ở vùng có núi lửa phun
Các hạt nớc lỏng hoặc băng tuyết trong mây và sơng mù cũng có các dải hấpthụ nh hơi nớc, song ảnh hởng lớn của chúng tới chế độ nhiệt của trái đất lại chủ yếu
do khả năng phản xạ và khuếch tán, chứ không phải do khả năng hấp thụ bức xạ củachúng gây ra Tính trung bình trên toàn trái đất, mây chỉ hấp thụ khoảng 3% (trongkhi đó phản xạ tới 21%) năng lợng bức xạ của mặt trời [2]
1.4 Sự khuếch tán bức xạ trong khí quyển
Khuếch tán bức xạ là nhân tố quan trọng làm suy giảm bức xạ trong khíquyển Khuếch tán chỉ xảy ra trong trờng hợp môi trờng mà tia bức xạ đi qua là bất
đồng nhất về quang học Đó là môi trờng có những phần tử "ngoại lai" với các tínhchất khác với tính chất của môi trờng xung quanh, hoặc môi trờng có thăng giángcủa mật độ
Có thể sơ bộ giải thích bản chất của sự tán xạ nh sau: dới tác động của cácdao động của vectơ điện tử trong phần tử khuếch tán này sẽ thực hiện những dao
động cỡng bức và phát sóng Nh vậy chính những phần tử khuếch tán đã trở thànhnhững nguồn phát sóng điện từ thứ cấp Tập hợp các sóng điện từ này nói chung làrất phức tạp, song nếu kích thớc phần tử nhỏ hơn nhiều so với bớc sóng tới thì tậphợp này có thể đợc xác định nh dao động của một điện cực Khi đó dao động cỡngbức trong phần tử khuếch tán sẽ có cùng tần số và bớc sóng với bớc sóng tới Nếusóng đầu phân cực thì sóng khuếch tán thứ hai cũng phân cực và độ chói của nó sẽkhác nhau theo các hớng Trong trờng hợp kích thớc phần tử tơng đơng hoặc lớn hơnbớc sóng tới, chúng ta phải dùng lập luận khác để giải thích
Độ rọi và hớng khuyếch tán phụ thuộc vào tỷ số giữa kích thớc phân tửkhuyếch tán và bớc sóng của ánh sáng khuyếch tán Nếu tỷ số này nhỏ, nh trờng hợpcác phân tử không khí và ánh sáng khuyếch tán, thì độ rọi khuyếch tán tỷ lệ với -4
Đây là một trờng hợp đặc biệt và đợc gọi là khuyếch tán Rayleigh-Cabannes Do
b-ớc sóng ngắn bị khuyếch tán hiệu quả hơn so với các bb-ớc sóng dài hơn, nên trongmột luồng sáng, ánh sáng xanh bị khuyếch tán nhiều hơn ánh sáng đỏ và vàng, do
đó, bầu trời có mầu xanh, còn khu vực gần mặt trời có mầu đỏ Linke đã tính toán sựtruyền qua của bức xạ mặt trời trong khí quyển, bỏ qua sự hấp thụ và giả thiết rằngkhí quyển là trong suốt Bảng sau đây cho ta giá trị mà Linke đã tính toán cho thínghiệm của mình:
Trang 19Bảng 5: Sự truyền bức xạ xuống bề mặt biển bỏ qua sự hấp thụ và khuyếch tán của
bụi (chỉ có khuyếch tán phân tử)Bớc sóng
(m)
Tỷ lệ truyền(%)
và ánh sáng nhìn thấy, mây có màu trắng; nếu các hạt nớc mây nhỏ hơn đáng kể, nó
sẽ có mầu xanh Các phân tử khuyếch tán quan trọng trong khí quyển gồm: các phân
tử khí, các hạt nớc và bụi
Nh vậy, sự khuếch tán bức xạ mặt trời chính là nguồn bức xạ tới mặt đất từmọi điểm trên vòm trời Sau đây chúng ta sẽ xét kỹ hơn sự khuếch tán bức xạ trongtrờng hợp phần tử khuếch tán có kích thớc nhỏ hơn bớc sóng tới và ngợc lại
1.5 Cách tính bức xạ sóng ngắn trong khí quyển
Bây giờ ta xét năng lợng do các dòng bức xạ sóng ngắn đem tới mặt đất Sóngngắn ở đây ta quan niệm những sóng nào có bớc sóng < 4m Hầu hết năng lợngmặt trời phát ra đều là sóng ngắn (99%) Năng lợng toàn phần đến một điểm nào đósau một khoảng thời gian nhất định (giờ, ngày, tháng, năm .) đợc xác định là tổngnăng lợng do tất cả các dòng bức xạ đem lại Dới đây ta lần lợt xét các thành phầncủa tổng xạ sóng ngắn tới mặt đất [2]
Trong các phần trên ta đã xét trực xạ tới mặt đất khi không có khí quyển Khi
có khí quyển, để tính độ rọi trực xạ (trong các tài liệu trớc đây vẫn gọi là cờng độ
trực xạ) trên mặt đất, E, ta cần lu ý đến sự suy yếu của nó theo định luật
Bouguer-Lambert, do đó thay cho công thức (1.1) hoặc (1.3) ta có :
Trang 20)(sin0(sinh
)0(
0 2
R
S R
S
trong đó (0) là độ trong suốt toàn phần, m là khối lợng quang học của khí quyển
Để tính đợc độ phơi (tổng lợng) trực xạ trong một khoảng thời gian nào đó tacần tích phân phơng trình trên theo thời gian Song việc đó rất khó thực hiện vì (0)trong thực tế biến đổi rất ngẫu nhiên Để tính gần đúng ta có thể dùng giá trị trungbình (0)m trong khoảng thời gian đang xét Đối với một ngày việc làm này sẽ dẫn
đến kết quả tơng tự nh công thức (1.6b), chỉ khác một hệ số m( 0 ) và biến trìnhnăm của độ phơi ngày H cũng tơng tự nh hình 2, chỉ giảm thiểu đi 1/m( 0 ) lần mà thôi Trong khí quyển lý tởng (sạch và khô) ( o ) d( o ) 0 , 925
dựa vào (1.9) ta dễ dàng tính đợc S' Đối chiếu giữa (1.9) và các số liệu quan trắc
ng-ời ta nhận thấy:
Tại một nơi, ở mực nớc biển, theo (1.9) trong một ngày S' đạt cực tiểu khi ho
và (o) đạt cực đại Quả vậy, các giá trị cực đại của S' thờng quan trắc đợc vào buổitra những ngày hè, khi bầu trời quang đãng Giá trị này ở các điểm khác nhau khôngkhác nhau nhiều và vào khoảng 75 - 80% hằng số mặt trời Ngay cả ở cực (nơi có độcao mặt trời nhỏ) giá trị này cũng khoảng nh vậy Điều đó có thể giải thích qua sựgiảm của hơi nớc làm tăng độ trong suốt từ xích đạo về cực Nói cách khác, tuy ở độcao mặt trời nhỏ, song độ trong suốt lại lớn nên ảnh hởng của chúng đến trực xạ cóthể bù trừ lẫn nhau
Theo chiều cao (so với mực biển) trực xạ tăng, càng lên cao mức độ tăng càngchậm phù hợp với sự tăng lên của (o)
Biến trình của S' theo thời gian trong thực tế rất phức tạp, do sự biến đổi của
ho và (o), ngoài ra nó còn phụ thuộc nhiều vào việc mây không che, che một phầnhay che kín đĩa mặt trời và tính chất vật lý (độ trong suốt) của mây Đối với biếntrình ngày, độ rọi trực xạ trung bình S ' (trung bình trợt) thờng đạt cực đại vào giữatra và bất đối xứng qua giữa tra: buổi chiều S ' thờng lớn hơn buổi sáng ở thời điểm
đối xứng tơng ứng qua giữa tra Đối với biến trình năm, cực đại của S' không rơivào các tháng giữa hè mà thờng rơi vào các tháng cuối xuân, đầu hè (lúc có độ trongsuốt lớn) và cực tiểu vào tháng mời hai
Độ rọi trực xạ trung bình năm hoặc độ phơi (tổng lợng) trực xạ trong mộtnăm nói chung giảm dần khi lên vĩ độ cao Nhng giá trị cao nhất lại đạt đợc ở những
vĩ độ cận nhiệt đới - nơi có nhiều sa mạc, ít mây, ma Qua bảng 6 ta thấy rõ điềunày Trong bảng, ngoài các giá trị độ phơi năm trung bình thực tế quan trắc đợc còn
Trang 21có độ phơi năm khả năng, tức độ phơi thu đợc khi khí quyển trong sạch và độ phơi
năm nếu không có khí quyển (lý thuyết)
Bảng 6 Độ phơi năm của trực xạ (kJ/m2năm) ở các vĩ độ khác nhau
Nh ta đã biết, việc xác định đợc tổng năng lợng do trực xạ mang tới có ý
nghĩa to lớn đối với khí hậu và thực tiễn Song số điểm quan trắc bức xạ lại không
nhiều Vì vậy ta phải xây dựng các phơng pháp tính gần đúng độ phơi thực của trực
xạ Nếu gọi HSkn là độ phơi khả năng của trực xạ con HSt là độ phơi thực của nó trong
cùng một khoảng thời gian thì giữa chúng có mối liên hệ sau:
HSt=HSknf(a) (1.10)
trong đó f(a) là một hàm nào đấy của thông số a, đặc trng cho ảnh hởng của mây và
f(a)=1 khi quang mây ảnh hởng của mây có thể thông qua lợng mây n, dạng mây,
thời gian chiếu nắng s trong khoảng thời gian đang xét, chẳng hạn, công thức của
H St Skn (1.11)
trong đó s' là thời gian chiếu nắng tơng đối của mặt trời (tỷ số giữa thời gian chiếu
nắng thực tế s và thời gian chiếu nắng thiên văn hoặc tối đa s o tức thời gian nắng nếu
không có khí quyển hoặc khi bầu trời không mây), n là lợng mây trung bình Một
công thức khác do Ukrainsev đa ra có dạng:
H St =as+b (1.12)
trong đó a và b là các hằng số thực nghiệm phụ thuộc vào điều kiện địa phơng, s là
tổng thời gian nắng Ngỡng "có nắng" ứng với độ rọi trực xạ bằng 200 W/m2.
Các công thức trên nếu tính cho khoảng thời gian một tháng thì sai số chỉ vào
khoảng 5% Vì vậy chúng đợc sử dụng khá rộng rãi trong thực tế
Trang 22c Tán xạ và cách tính nó trong điều kiện khí quyển lý tởng
Bức xạ mặt trời khuếch tán tới vị trí quan trắc từ mọi điểm của vòm trời.Trong thực tế ngời ta thờng quan tâm tới độ rọi bức xạ khuếch tán (trong các tài liệutrớc đây vẫn gọi là cờng độ tán xạ) đến mặt ngang và ký hiệu nó là D Việc tính toán
lý thuyết độ rọi bức xạ khuếch tán là công việc hết sức khó khăn Trong khí quyểnbình thờng, ta có thể thiết lập công thức bán thực nghiệm gần đúng để tính D đơngiản nh sau:
Ta biết độ rọi trực xạ ở biên trên của khí quyển là
0 2
Nếu coi sự suy yếu của trực xạ trong khí quyển hoàn toàn do khuếch tán gây
ra (coi khí quyển không hấp thụ và không phản xạ) thì có thể viết:
0
m o
h R
S S
S S
))(sin0(1(2))0(1(sin
0 0
R
S D
(1.14)
Từ hệ thức trên ta thấy:
D có giá trị cực đại khi ho có giá trị lớn nhất
Khí quyển càng trong suốt, tức là (0) càng lớn thì D càng nhỏ, tráilại thì D càng lớn.Trong khí quyển bình thờng hệ thức trên có độchính xác thấp do hệ số thay đổi nhiều khi khí quyển có nhiềuxon khí đặc biệt là khi có mây phản xạ mạnh bức xạ mặt trời Vìvậy ngời ta thờng áp dụng công thức trên cho khí quyển gần với lýtởng (sạch và khô), tuy nhiên trong trờng hợp này, do (0) lớn, làmcho D nhỏ và dẫn tới sai số tơng đối lớn
Bảng 7: Giá trị độ trong suốt của khí quyển sạch và khô
Trang 23Trên thực tế số trạm quan trắc trực xạ và tán xạ ít hơn nhiều so với số trạmquan trắc tổng xạ vì quan trắc tổng xạ dễ thực hiện hơn và cũng may là các nghiêncứu về tổng xạ có ý nghĩa thực tiễn lớn hơn.
Do tổng xạ là tổng của trực xạ và tán xạ nên nó cũng phụ thuộc vào các yếu
tố có ảnh hởng tới trực xạ và tán xạ nh: độ cao mặt trời, độ trong suốt của khí quyển
và các nhân tố khác Theo các tài liệu quan trắc, khi trời quang mây sự phụ thuộccủa tổng xạ vào độ cao mặt trời h0 hầu nh tuân theo quy luật tuyến tính dạng:
G=ch0,trong đó c là hệ số tỉ lệ có giá trị khác nhau ở các điểm khác nhau và với độ trongsuốt khí quyển khác nhau Khi có mây, sự phụ thuộc của tổng xạ vào độ cao mặt trờiphức tạp hơn nhiều
Nhìn chung lợng mây, các đặc trng của mây và sự phân bố của nó trên vòmtrời là yếu tố quan trọng nhất làm thay đổi tổng xạ Khi lợng mây không lớn vàkhông che phủ mặt trời thì tổng xạ nhiều khi còn lớn hơn so với khi trời quang mây(do D lớn) thậm chí lớn hơn cả hằng số mặt trời
Năm 1960, Liu và Jordan lần đầu tiên tìm ra mối liên hệ trực tiếp giữa độ phơitán xạ và tổng xạ ngày dạng:
Trang 243 2
G G G G
0
G
G G
Hệ thức (1.15) sau này còn đợc Liu-Jordan và các tác giả khác phát triển chonhững khoảng thời gian phơi khác nhau và các vùng khác nhau Dựa vào các hệ thức
nh vậy và giá trị độ phơi tổng xạ HG quan trắc đợc ta có thể tính đợc độ phơi tán xạ
HD
Nếu xét biến trình năm của độ phơi tổng xạ ngày ta thấy ở đa số các điểmtrên mặt đất chúng đều thể hiện rõ cực đại vào tháng 6 hoặc tháng 7, cực tiểu vàotháng 12 (ở bán cầu Bắc) Song ở một số địa điểm, biến trình năm của đại lợng nàyphức tạp hơn nhiều, phụ thuộc vào biến trình năm của lợng mây ở Hà Nội, cực tiểucủa tổng xạ lại rơi vào tháng 2 hoặc tháng 3 là lúc bầu trời thờng có nhiều mây chephủ Những địa điểm mà lợng mây cao nhất xảy ra vào mùa hè thì cực đại của tổngxạ có thể rơi vào mùa xuân hoặc mùa thu [2]
Đơn vị đo bức xạ là năng lợng 1 calo nhận đợc (hoặc mất đi) trên 1 cm2 bềmặt trong 1 phút (thứ nguyên: cal/cm2/phút) Đại lợng này đợc gọi là độ rọi năng l-ợng, độ chiếu sáng của một mặt hoặc mật độ mặt của thông lợng phát xạ Trong bứcxạ học thực hành dùng một thuật ngữ tơng đơng là "độ rọi bức xạ" Trong hệ thống
đơn vị đo quốc tế (SI) độ rọi bức xạ đợc biểu thị bằng 1watt trên 1m2 (w/m2) hoặcmiliwat trên 1cm2 (mw/cm2) Ta có:
Trang 25tác động của bức xạ Trong bức xạ học, thuật ngữ "lợng bức xạ" hoặc "tổng lợng bứcxạ" đợc dùng đồng nghĩa với thuật ngữ "lợng chiếu sáng" Tổng lợng bức xạ trong
một khoảng thời gian xác định đợc biểu thị bằng cal/cm 2 hoặc kcal/cm 2
1.6 Chế độ nhiệt và bức xạ ở khu vực đồng bằng phía bắc
Nhiệt độ nói chung và nhiệt độ tối cao nói riêng đợc sử dụng nhiều trong cácmô hình thủy văn và mô hình khí tợng nông nghiệp Gần đây, dự báo nhiệt độ và
đặc biệt là nhiệt độ tối cao rất có ý nghĩa trong việc đánh giá sự nóng lên của khíhậu toàn cầu
Cùng với bức xạ, nhiệt độ tối cao còn có ý nghĩa quan trọng đối với các ngànhnh: nông nghiệp, công nghiệp năng lợng, công nghiệp máy móc và xây dựng Nhiệt
độ có ảnh hởng rất lớn đến hoạt động của các công trình thủy điện, các công trìnhgiao thông, công nghiệp chế biến thực phẩm,
Nhiệt độ tối cao còn là thớc đo để xác định thời kỳ nắng nóng (thời gian, quymô) trong dự báo nghiệp vụ tại Trung tâm Dự báo KTTV Trung ơng Do đó, dự báonhiệt độ tối cao thực sự là một bài toán có ý nghĩa thực tiễn
Trên thế giới đã có nhiều nghiên cứu dự báo nhiệt độ tối cao sử dụng đầu racủa các mô hình số trị nh trong các tài liệu tham khảo của Bin Li [8], Darel R.Massie [11], Eric J Alfaro [13],
Khu vực đồng bằng phía bắc bao gồm các tỉnh thuộc vùng đồng bằng Bắc Bộ
và 3 tỉnh Thanh Hóa, Nghệ An, Hà Tĩnh (đồng bằng Thanh Nghệ Tĩnh) Chế độnhiệt ở các tỉnh thuộc khu vực này không hoàn toàn đồng nhất Tiêu biểu cho chế độnhiệt mùa lạnh là nhiệt độ tháng I và cho mùa nóng là nhiệt độ tháng VII Khu vực
đồng bằng Bắc Bộ chịu ảnh hởng nhiều hơn của hệ thống gió mùa đông bắc nên cómùa đông lạnh hơn (Hà Nội: 16.60C so với Thanh Hóa: 17.30C, Vinh: 17.90C), dao
động nhiệt trong mùa đông cũng lớn hơn so với khu vực Thanh Nghệ Tĩnh Vào mùa
hè, dới tác động của vị trí địa lý, địa hình, do hiệu ứng phơn cùng với gió mùa tâynam hoạt động mạnh nên khu vực Thanh Nghệ Tĩnh có nền nhiệt độ cao hơn rõ rệt.Các tháng có khả năng xuất hiện nhiệt độ lạnh nhất có thể rơi vào các tháng từ thángXII năm trớc đến tháng II năm sau trong đó lớn nhất là tháng I với xác suất 60%;còn xác suất xuất hiện nhiệt độ tối cao cực đại lớn nhất là vào tháng VII (45%) vàtháng VI (40%), còn lại có thể xuất hiện vào các tháng V, và tháng VIII Mùa đôngtrên khu vực đồng bằng Thanh Nghệ Tĩnh cũng rất ẩm ớt do không khí cực đới đã đ-
ợc bổ xung ẩm từ bề mặt biển và do front lạnh thờng dừng lại và mờ dần trên khuvực này Tình trạng thời tiết nồm ẩm, ma phùn cũng xuất hiện ở khu vực đồng bằngBắc Bộ vào cuối mùa đông (khoảng tháng II, tháng III)
Những đặc điểm quan trọng nhất của khu vực diễn ra vào mùa hè đó là sựxuất hiện của thời kỳ gió Tây khô nóng Dạng thời tiết này ảnh hởng rõ rệt hơn đối
Trang 26với khu vực Thanh Nghệ Tĩnh Tháng VII là tháng nóng nhất đồng thời cũng làtháng khô nhất đối với khu vực Thanh Nghệ Tĩnh Nhiệt độ tối cao cực đại trên khuvực này có thể đạt tới 42 – 430C, cao hơn khu vực đồng bằng Bắc Bộ (khoảng
400C)
Một vài đặc trng về nhiệt độ của khu vực nghiên cứu có thể đợc tóm tắt nh
sau: Đối với khu vực đồng bằng Bắc Bộ, nhiệt độ trung bình năm vào khoảng
23 – 240C, tổng nhiệt độ cả năm vào khoảng 8500 đến 8600 độ C Hàng năm có 4tháng nhiệt độ trung bình dới 200C (rét) là từ tháng XII đến tháng III Tháng lạnhnhất là tháng I có nhiệt độ trung bình vào khoảng 16 – 170C và tối thấp trung bình
là 13 – 140C Trừ các tháng chuyển tiếp, còn lại 5 tháng từ tháng V đến tháng IXnhiệt độ trung bình vợt quá 270C và tối cao trung bình trên 300C Hai tháng nóngnhất là VII và tháng VI Nhiệt độ tối cao tuyệt đối phần lớn các nơi vợt quá 400C,riêng ven biển không quá 37 – 380C Biên độ dao động ngày đêm của nhiệt độtrung bình vào khoảng 6 – 70C, tổng số giờ nắng cả năm thờng vào khoảng 1600-
1700 giờ Đối với khu vực đồng bằng Thanh Nghệ Tĩnh, nhiệt độ trung bình năm
cũng khoảng 23 – 240C, tổng nhiệt độ cả năm vào khoảng 8600-87000C Khu vựcphía bắc (khu vực Thanh Hóa) có 4 tháng nhiệt độ trung bình dới 200C (từ tháng XII
đến III), ở phần phía nam (Nghệ An – Hà Tĩnh) chỉ còn 3 tháng (từ tháng XII đếntháng II) Tháng lạnh nhất là tháng I có nhiệt độ trung bình khoảng 17 – 180C vànhiệt độ tối thấp trung bình khoảng 150C Trong 4 tháng đầu và giữa mùa hè (từtháng V đến tháng VIII), nhiệt độ trung bình trên 270C và tối cao trung bình trên
330C nhiệt độ tối cao tuyệt đối có thể lên tới 42 - 430C Biên độ dao động nhiệt ngày
đêm vào khoảng 6 – 70C, tổng số giờ nắng cả năm thờng vào khoảng 1600 - 1700giờ; vào mùa đông là mùa ít nắng
Các đặc trng về chế độ nhiệt đợc cho trong bảng dới đây:
Bảng 9: Đặc trng của chế độ nhiệt (độ C)
Nội
PhủLiễn
Nam
Định
ThanhHóa Vinh
HàTĩnh
Nhiệt độ TB tháng cao nhất (VII) 28.8 28.2 29.0 28.9 29.5 29.4Nhiệt độ TB tháng thấp nhất (I) 16.6 16.7 16.8 17.4 17.9 18.0Nhiệt độ tối cao tuyệt đối 42.8 41.5 40.1 42.0 42.4 40.1Nhiệt độ tối thấp tuyệt đối 2.7 4.5 5.8 5.4 4.0 7.6
Trang 27I II III IV V VI VII VIII IX X XI XII Tháng
MJ/m2/tháng
0 50 100 150 200 250 Giờ
Thanh Hóa Giờ
Tổng xạ Cân bằng bức xạ Số giờ nắng
0 100 200 300 400 500 600 700 800
I II III IV V VI VII VIII IX X XI XII Tháng
MJ/m2/tháng
0 50 100 150 200 250
Vinh Giờ
Tổng xạ Cân bằng bức xạ Số giờ nắng
Hình 6: Đặc trng khí hậu bức xạ khu vực đồng bằng phía Bắc
Trang 28Chơng 2: cơ sở lý thuyết mạng thần kinh nhân
tạo (TKNT) 2.1 Các khái niệm cơ bản về mạng thần kinh nhân tạo
Các loại mạng thần kinh nhân tạo (TKNT)4 là một trong số những kỹ thuật xử
lý tín hiệu mới nhất hiện nay, và đã đợc ứng dụng trên rất nhiều lĩnh vực khác nhau.Trong khoa học kỹ thuật, mạng TKNT phục vụ hai chức năng quan trọng chính, đó
là bài toán phân loại và bài toán xấp xỉ hàm phi tuyến Đã có rất nhiều công trìnhtrong lĩnh vực khí tợng thủy văn có sử dụng mạng TKNT, trong số các công trình đóphải kể đến hai công trình của Ricardo [25] và Bin Li [8] Công trình của Ricardotập chung vào dự báo tổng xạ cho nam Brazil sử dụng mạng TKNT và đầu ra của môhình quy mô vừa Êta Luận văn thạc sỹ khoa học của Bin Li lại đa ra một ứng dụngmới của mạng TKNT trong việc thay thế các công cụ nội suy truyền thống nhằm đacác biến khí tợng của mô hình khí hậu về trạm Kết quả từ cả hai công trình trên đềucho thấy mạng TKNT đã cho kết quả tốt hơn các dự báo của mô hình khí hậu đợcnội suy về trạm theo các phơng pháp truyền thống
Về bản chất, mạng TKNT là một hệ thống thích ứng, và thờng là phi tuyến(trừ mạng có hai lớp, một nhập và một xuất), mạng đợc học để xấp xỉ một hàm từtập số liệu nguồn (nhân tố dự báo) đến tập số liệu đích (yếu tố dự báo) Thích ứng cónghĩa là các tham số của mạng đợc thay đổi trong suốt quá trình vận hành, và thờng
đợc gọi là pha luyện mạng Sau khi luyện, các tham số của mạng đợc cố định và hệ thống đợc kiểm nghiệm giải một vấn đề sắp xảy ra (pha kiểm tra) Mạng TKNT đợc
thiết kế từng bớc sao cho tối u hóa những điều kiện cho trớc hoặc theo một trình tự
xác định trớc, đợc biết đến nh những quy tắc học Số liệu đầu vào và đầu ra của tập
mẫu luyện rất quan trọng đối với các phơng pháp dự báo nói chung và mạng TKNT
nó riêng, bởi chúng bao gồm những thông tin cần thiết để "khám phá" ra các quyluật, và đối với mạng TKNT là điểm "tối u" Bản chất phi tuyến của các nhân tốmạng thần kinh đã cung cấp cho hệ thống nhiều khả năng để biểu diễn đợc chínhxác bất kỳ ánh xạ nào5
Một trong những loại mạng TKNT đợc mô phỏng trong hình vẽ dới đây
4 Artificial Neural Network – ANN
5 Universal Mapper – ánh xạ phổ dụng
Trang 29Hình 7: Mô phỏng tính toán của mạng TKNT
Mạng bao gồm một tập hợp các giá trị nhập (input – x i) đợc nối với mạng và
một tập hợp các kết quả mong muốn (desired – d i ) để so sánh, tính sai số (e) giữa các giá trị đầu ra của mạng (y i) và giá trị thực (do đó loại mạng này đợc gọi là mạnghọc có điều kiện6) Sai số này đợc truyền lại mạng để điều chỉnh các tham số theo
một quy tắc thống nhất (quy tắc học) Quá trình này đợc lặp lại cho đến khi kết xuất
của mạng là chấp nhận đợc Từ đây ta có thể thấy, hiệu quả của mạng phụ thuộc rấtnhiều vào số liệu, nếu số liệu có nhiễu hoặc không phủ đợc vùng giá trị cần thiết thìmạng sẽ cho kết xuất sai Mặt khác, nếu có nhiều số liệu và bài toán không rõ đợcxác định nh thế nào thì mạng TKNT là một lựa chọn thích hợp
Vấn đề cốt lõi của mạng TKNT là phải có nhiều số liệu, phải lựa chọn đợcthuật toán, hàm tác động, quy tắc học và các điều kiện ngừng quá trình luyện thíchhợp
Mạng lan truyền là một hàm phi tuyến có thể xấp xỉ gần đúng nhất một hàm
đích đợc cho qua một số mẫu trong tập mẫu Hình dới đây minh hoạ một mạng lantruyền
6 Supervised learning Network
Trang 30Hình 8: Sơ đồ mạng thần kinh nhân tạo với 3 lớp [15]
Trong hình 8, mạng gồm 3 lớp: lớp nhập, lớp ẩn và lớp xuất Mỗi nút trong lớpnhập nhận giá trị của một biến độc lập và chuyển vào mạng (Do đó, số lợng nútnhập bị quy định bởi số lợng biến đầu vào) Dữ liệu từ tất cả các nút trong lớp nhập
đợc tích hợp - hay còn gọi là tổng trọng hoá - và chuyển kết quả cho các nút tronglớp ẩn Gọi là lớp ẩn vì các nút trong lớp này chỉ liên lạc với các nút trong lớp nhập
và xuất; và chỉ ngời thiết kế mạng mới biết sự tồn tại của chúng (ẩn đối với ngời sửdụng mạng) Tơng tự, các nút trong lớp xuất cũng nhận tín hiệu tổng trọng hoá từcác nút ẩn Mỗi nút trong lớp xuất tơng đơng với một biến phụ thuộc
Phần lớn các bài toán chỉ có một biến phụ thuộc (nh biểu diễn trong hình 8),nhng với mô tả nh trên, mạng nơron cho phép số biến phụ thuộc là tuỳ ý Ví dụ, nếu
ta xây dựng mạng với mục đích nhận biết các chữ số thì ta dùng 10 nút xuất, dùng
để nhận biết chữ viết thì dùng 26 nút xuất (tơng ứng với 26 ký tự chữ cái), và dĩnhiên, ta vẫn có thể sử dụng mạng một nút xuất cho 2 bài toán này nhng hiệu quả sẽthấp hơn [7]
Một mạng lan truyền tổng quát có n (n2) lớp; lớp đầu là lớp nhập, lớp thứ n
là lớp xuất, và n-2 lớp trung gian là các lớp ẩn Cũng trong mạng lan truyền, mỗi nút
của lớp thứ i liên kết với mọi nút của lớp thứ i + 1, các nút trong cùng một lớp
không liên kết với nhau Ngoài ra cũng có thể xuất hiện các cung liên kết trực tiếpgiữa lớp nhập và lớp xuất, ta gọi mạng loại này là mạng lan truyền có nối trực tiếp(mạng có 2 lớp (nhập và xuất) thuộc loại này)
Mạng lan truyền chỉ có thể ở một trong hai trạng thái: trạng thái ánh xạ vàtrạng thái học Trong trạng thái ánh xạ, thông tin lan truyền từ lớp nhập đến lớp xuất
và mạng thực hiện ánh xạ để tính giá trị các biến phụ thuộc dựa vào các giá trị biến
độc lập đợc cho:
Trang 31nhất Mỗi nút ẩn tính tổng trọng hoá của tất cả các dữ liệu nhập bằng cách cộng dồn
tất cả các tích giữa giá trị nút ẩn (vừa nhận đợc từ nút nhập) với trọng số của cung
liên kết giữa nút nhập và nút ẩn Kế tiếp, một hàm truyền đợc áp dụng trên tổng trọng hoá này cùng với một ngỡng của nút ẩn để cho ra giá trị thực của nút ẩn Hàm
truyền đơn giản chỉ nén giá trị vào một miền giới hạn nào đó, nh minh hoạ trong
hình dới đây với hàm truyền tang hypebol (tanh)
Hình 9: Hàm truyền tanh
Sau khi nén tổng trọng hoá của nó, đến lợt nó, mỗi nút ẩn sẽ gửi kết quả đến tấtcả các nút ẩn trong lớp ẩn tiếp theo (nếu có) và mỗi nút ẩn trong lớp ẩn cuối cùng sẽtruyền kết quả cho tất cả các nút xuất trong lớp xuất
Mỗi nút xuất thực hiện thao tác tơng tự nh đã thực hiện ở nút ẩn để cho ra giátrị kết xuất của nút xuất Giá trị của nút xuất chính là giá trị thực, hay giá trị củabiến phụ thuộc
Bản chất ánh xạ do mạng thực hiện tuỳ thuộc vào giá trị trọng số trong mạng.Lan truyền ngợc là một phơng pháp cho phép xác định tập trọng số tốt nhất củamạng để giải bài toán đã cho Việc áp dụng phơng pháp lan truyền ngợc là quá trình
lặp đi lặp lại nhiều lần hai tiến trình chính: ánh xạ và lan truyền ngợc sai số
Quá trình luyện mạng đợc bắt đầu với các giá trị trọng số tuỳ ý và tiến hành
lặp đi lặp lại Mỗi lần lặp đợc gọi là một thế hệ Trong mỗi thế hệ, mạng hiệu chỉnh
Trang 32các trọng số sao cho sai số giảm dần Tiến trình điều chỉnh nhiều lần giúp cho trọngdần dần đạt đợc tập hợp các giá trị tối u.
Đối với từng mẫu, mạng thực hiện các bớc sau đây: trớc tiên, mạng thực hiện
lan truyền tiến, nghĩa là mạng ánh xạ các biến nhập hiện hành thành các giá trị xuất,
sử dụng giá trị các trọng hiện thời Kế tiếp, sai số của bớc lặp lần trớc sẽ đợc truyền cho bớc lặp lần sau nh một tham số, có nhiều thuật toán khác nhau giúp xử lý những
thông tin này nh: quy tắc giảm gradient, quy tắc giảm dốc nhất (delta), quy tắc quántính (hay mômen)
Quá trình luyện mạng kết thúc khi mạng có dấu hiệu "quá khớp", hoặc mạng
đạt đợc một giá trị sai số xác định trớc Mạng nơron có sức mạnh đáng kể, theoRumelhart, McClelland (1986), Haykin (1994), Bishop (1995) thì với một mạnghai lớp ẩn và số nút ẩn thích hợp cho từng lớp (tùy thuộc bài toán cụ thể) có khảnăng xấp xỉ một hàm đích bất kỳ Nhng cùng với khả năng tuyệt vời đó, nó cũngchứa những nguy cơ tiềm ẩn: nếu nhiễu trong số liệu nhiều, mạng càng phức tạp sẽmô phỏng toàn bộ dữ liệu nhiễu đó và mất đi khả năng tổng quát hóa, điều luôn cầncho các bài toán thống kê, đặc biệt là bài toán dự báo Để hạn chế điều này, ta có thểbắt đầu luyện mạng với số nút ẩn nhỏ, sau đó tăng dần Cách thứ hai là ngừng quátrình luyện khi xuất hiện dấu hiệu "quá khớp"
Trong phần trên, ta đã biết là giá trị các nút (phần tử hoạt động) trong lớp ẩn vàtrong lớp xuất là giá trị của hàm truyền với tham số là tổng trọng hoá Về mặt hìnhhọc, đồ thị của hàm truyền có dạng chữ S - còn đợc gọi là hàm dạng S Một hàm
s(u) là một hàm truyền dạng S nếu nó thoả mãn:
- s(u) là hàm bị chặn Nghĩa là các giá trị của s(u) không bao giờ vợt quá
chặn trên cũng nh thấp hơn chặn dới với giá trị của u bất kỳ;
- s(u) là hàm đơn điệu tăng Giá trị của s(u) luôn tăng khi giá trị của u
tăng Kết hợp với tính chất thứ nhất, có thể nói, s(u) tiệm cận với giới
hạn trên và giới hạn dới;
- s(u) là hàm liên tục và trơn Vì hàm s(u) liên tục nên nó không có khe và
góc cạnh, có đạo hàm (độ dốc) rõ ràng và phân biệt tại mọi điểm
Mọi hàm thoả mãn 3 tính chất trên đều có thể sử dụng là hàm truyền trongmạng Một số hàm đợc sử dụng phổ biến nhất gồm:
1 )
(
(2.1)
Trang 33Trong đó e là cơ số của logarit tự nhiên (e 1.7183) Khi u tăng, e tăng Dovậy 1/eu giảm và g(u) tăng Nhng tốc độ tăng của g(u) sẽ giảm khi u lớn Khi u tiến
đến +cos, 1/eu tiến về 0, g(u) tiệm cận 1 và ngợc lại.
u u
e e
e e
Tất cả các hàm truyền này đều phục vụ khá tốt cho các mục đích của mạngnơron và chúng có thể thay thế cho nhau vì giữa chúng tồn tại các mối liên hệ :
h(u) = 2*g(u) - 1;
Hàm tanh(u) tiến đến các giới hạn của nó nhanh hơn hàm h(u) Đó chính là lý
do chọn hàm tanh cho mọi loại mạng đợc xây dựng trong luận văn này Đồ thị biểu diễn hàm tanh đợc cho trong hình 9.
Học (hay luyện mạng) là quá trình tìm các trọng số của mạng sao cho ánh xạf(X) khớp nhất với bộ dữ liệu chứa các mẫu (tập mẫu) của hàm đích
Sai số trung bình bình phơng thờng đợc sử dụng để đo lờng sự trùng khớp giữa
ánh xạ cần xây dựng với hàm đích cho trớc (qua tập mẫu)
Gọi Tk = f(Xk) = (tk1, …, tkN) là kết quả của ánh xạ do mạng xây dựng
Khi đó, hàm lỗi (sai số trung bình bình phơng) giữa kết xuất z k và kết xuất đích
Trang 34Hình 10: Hình dạng của mặt lỗi với 2 trọng số w1 và w2 [3]
Mục tiêu của mạng là tìm đợc điểm trũng nhất trên mặt lỗi, nơi đó z k và t k gầnnhau nhất Ban đầu, khi chọn một cặp trọng số bất kỳ ta đợc một điểm trên mặt lỗi
và mạng phải đi theo một đờng nào đó để tìm đợc điểm trũng nhất Hớng đi củamạng qua từng bớc là hớng làm giảm sai số của bớc trớc nó
Biểu diễn toán học của quá trình cực tiểu hoá sai số đợc trình bày dới dây
Thiết kế một mạng TKNT gồm đầu vào bao gồm n mẫu, mỗi mẫu gồm các giá trị nhập x i (i=1 N), lớp ẩn gồm các nút y j (j=1 H) và kết xuất là các giá trị đích t k (k=1 K) Ký hiệu lại hàm truyền sigma là g(x).
x
x g
exp 1
1 )
2
…y
H
b0b
2
…u
H
v
1
…v
Trang 351 )
1
2
)(
k k
v v
z z
E b
k k
) ).(
1 (
j jk
t z z z
y b
p y b
Trang 36i i j K
k k
k k ij
i i
j j
u u
y b
v v
z z
E a
u u
y y
E a
k
jk k
u u
y b p a
1
(2.20)trong đó
) 1
j i
x y y
b p a
E
)
1.(
Trên đây là phân tích cụ thể với hàm truyền sigma Nếu các hàm truyền là
tang hypebol hay hypebol thì các bớc thực hiện cũng tơng tự Đạo hàm của các nút
xuất theo các trọng số đợc tính theo công thức (2.18) và ở nút ẩn tính theo công thức(2.23)
Các trọng số a ij và b jk đợc cập nhật sao cho gradient tổng cộng của sai số theo
mọi trọng số trên tất cả các mẫu giảm đi Gọi d là tổng gradient sai số theo mọi
trọng số ( nút ẩn và nút xuất, ký hiệu chung là ) của bớc trớc nó:
trong đó là hệ số học, là hệ số thực nghiệm do ngời sử dụng tự chọn Đây chính
là nguyên tắc của thuật toán lan truyền ngợc, sự điều chỉnh trọng số dựa trên đạo
hàm của hàm lỗi ở bớc trớc
Theo dõi sự biến thiên của sai số E theo thời gian đến khi E giảm ít hoặc hầu
nh không giảm nữa thì dừng lại và chọn số thế hệ luyện phù hợp Quá trình luyện
đ-ợc thực hiện nhiều lần để tránh rơi vào các cực tiểu địa phơng trên mặt lỗi hay còngọi là bị rơi vào “bẫy”
Trong công thức (2.26), biến thiên trọng số tỷ lệ với đạo hàm hàm lỗi d và hệ
số học Trong thực nghiệm, việc chọn hệ số học là rất quan trọng, nếu quá lớn,sai số của mạng có thể "nhảy qua lại" giá trị cực tiểu, nếu quá nhỏ, quá trình luyện
Trang 37mạng sẽ rất lâu Để khắc phục nhợc điểm này, ta có thể áp dụng phơng pháp học
quán tính (mômen) nh trình bày trong mục 2.2a dới đây.
Nh vậy, trên lý thuyết mạng TKNT có thể tìm đợc sai số cực tiểu, có thể bằngkhông (0) và kết xuất sẽ hoàn toàn trùng khớp với kết xuất đích Nhng có một số vấn
đề làm cho mạng TKNT không tìm đến đợc điểm trũng nhất của mặt lỗi Việc họccủa mạng TKNT hoàn toàn độc lập với con ngời, con ngời không tác động đến bất
cứ một hoạt động nào của nó nhng việc chọn số nút, số lớp ẩn, số thế hệ quá nhiềuhoặc quá ít lại có thể làm cho mạng TKNT không tìm đợc sai số cực tiểu Ngoài ramạng còn thờng gặp phải một vấn đề nữa là vấn đề quá khớp Khi kiểm nghiệm chothấy đối với tập số liệu luyện, sai số rất nhỏ nhng với tập số liệu độc lập dùng đểkiểm chứng hoặc đánh giá thì sai số lại tăng lên Điều này phần lớn là do mạng đãluyện với quá nhiều thế hệ Những vấn đề này chỉ có thể hạn chế đợc nhờ việc luyệnnhiều lần và lấy tổ hợp các kết quả nhận đợc
2.2 Các quy tắc và phơng pháp xây dựng mạng TKNT
Quy tắc giảm gradien - giảm dốc nhất - quy tắc delta
Trớc hết phải nói, cả ba tên gọi trên đều ám chỉ cùng một phơng pháp luyện
Đây là một trong những quy tắc nguyên thủy nhất của lan truyền ngợc Phơng pháp
đợc Rumelhart, Hilton và Williams giới thiệu năm 1986
Khi hoàn thành một bớc lặp qua toàn bộ tập mẫu, tất cả các trọng số củamạng sẽ đợc cập nhật dựa trên các thông tin đạo hàm riêng theo từng trọng số Đúng
nh tên đợc đặt cho phơng pháp, giảm dốc nhất, các trọng số sẽ đợc cập nhật theo ớng mà hàm lỗi E giảm mạnh nhất
h-Để hiểu phơng pháp, các bạn hãy tởng tợng mạng lỗi di chuyển trên mộtchuỗi các điểm trong không gian lỗi Để dễ hình dung, cắt mặt lỗi này theo một mặtphẳng song song với một trọng số nào đó Trong mặt cắt này, ta có một đờng conglỗi, và tại bất kỳ điểm nào trên đờng cong này ta sẽ có tơng ứng giá trị một trọng số.Trong suốt tiến trình luyện, mạng sẽ di chuyển qua một chuỗi các điểm trên đờng(mặt) cong lỗi nh thế
Tại một điểm cho trớc trong không gian trọng số, có hai vấn đề ta quan tâm:thứ nhất là xác định hớng nào để lỗi giảm nhanh nhất; và vấn đề thứ hai là quyết
định độ lớn của "bớc" chuyển trọng số theo hớng đó (Nh đề cập trong phần 2.1)
Có thể hình dung tóm tắt các bớc của quy tắc giảm gradient nh sau:
- Chọn ngẫu nhiên một điểm x0 trong không gian trọng số; (1)
- Tính độ dốc của mặt lỗi tại x0;(2)
Trang 38- Chọn "bớc" và cập nhật các trọng số theo hớng dốc nhất của mặt lỗi
theo công thức (2.26); (3)
- Xem điểm này nh điểm x0 mới.(4)
Lặp đi lặp lại quá trình từ (2) đến (4) thì đến một lúc nào đó các giá trị của bộtrọng số sẽ tiếp cận đợc điểm thấp nhất trong mặt lỗi
Vấn đề nảy sinh ở đây là sau khi xác định đợc hớng dốc nhất của mặt lỗi, ta sẽphải cập nhật các trọng số nh thế nào? Độ lớn của ‘bớc’ chuyển trọng số (hệ sốhọc) sẽ là bao nhiêu? Hiện nay cha có lý thuyết cho việc xác định giá trị tối u, do
đó, cách tốt nhất là bằng phơng pháp thực nghiệm Đây là hạn chế của quy tắc giảmgradien, quá trình học rất chậm và ít hiệu quả Do đó quy tắc này không đợc sử dụngtrong luận văn này
Quy tắc mômen - quy tắc quán tính
Để khắc phục những hạn chế của quy tắc giảm gradien trong việc chọn hệ sốhọc (và hệ số này đợc cố định trong mọi bớc học), quy tắc mômen ra đời Quy tắc
mômen là một cải tiến của quy tắc giảm gradien theo hớng thay đổi giá trị hệ số học
cho thích hợp với từng bớc học
Quy tắc đợc diễn tả nh sau: nếu các bớc học trớc đang giảm mạnh thì theo đà,bớc tới cũng giảm mạnh – tăng hệ số học để biến thiên trọng tăng lên, ngợc lại,giảm hệ số học Vì thế, quy tắc này còn đợc gọi là quy tắc quán tính Công thức biếnthiên trọng số của quy tắc mômen nh sau :
cm = cm-1 – (1-)dm , 01 (2.27)
trong đó, cm và cm-1 là các hệ số học,
tham số quyết định vai trò của thông tin trong quá khứ
Thông tin bớc trớc đợc sử dụng lại ở bớc sau (đợc thể hiện trong số hạng đầucủa vế phải); khi = 0 thì công thức trên chính là công thức của quy tắc giảmgradien và thông tin trong quá khứ không ảnh hởng đến lựa chọn hiện tại Bằng cáchthêm một tham số cho hệ số học nh thế, hệ thống không còn quá nhạy cảm với hệ sốhọc nh trong trờng hợp quy tắc giảm gradien nữa Trong thực hành, thờng đợc chogiá trị từ 0.5 đến 0.9
Khi kết hợp với phơng pháp học từng mẫu, quy tắc mômen thúc đẩy nhanhviệc giảm lỗi mà thời gian tính chỉ chậm đi chút ít Nhng cũng có những hạn chếnhất định Nếu thứ tự các mẫu không tốt có thể đa đến những kết quả ngoài ý muốn
Ví dụ, nếu có một số mẫu có kết xuất đích cao xuất hiện trong một dãy liên tục,mạng có thể tạo ra mômen đủ để đa nó ra xa trên nhánh kia của mặt lỗi; ở đây, nó
có thể mắc kẹt với những đạo hàm rất nhỏ làm cho việc học về sau sẽ bị chậm lại
Điều tơng tự nh vậy cũng có thể xảy ra nếu trọng số ban đầu tạo các kết xuất quá
Trang 39cao (hay quá thấp) cho tất cả các mẫu; vào lúc các kết xuất có thể đạt đ ợc giá trịthích hợp thì mạng lại tạo ra mômen đủ để đa nó ra khỏi dãy về phía bên kia.
Việc sử dụng quy tắc mômen sẽ thích hợp nếu mạng gặp phải một khe rãnhtrong mặt lỗi
Hình 12: Khe trong mặt lỗiTrong hình 12, ta thấy một khe rãnh trong mặt lỗi trên không gian 2 trọng số
Dù hai bên khe rãnh rất dốc, thế nhng đáy của nó hầu nh không phẳng Khi mạng đixuống một phần của một bên rãnh khe rãnh, hớng của điểm giảm tốc độ sẽ băng quakhe rãnh, nhng lỗi cực tiểu của bộ trọng số lại nằm đâu đó theo hớng dọc khe rãnh,tại vị trí vuông góc với gradient Và kết quả là mạng không tìm đợc giá trị cực tiểuchính xác trên mặt lỗi Ngay cả khi sử dụng phơng pháp học toàn mẫu, không sửdụng quy tắc mômen thì mạng có khe rãnh dạng này cũng mất nhiều thời gian nhảyqua nhảy lại hai bên khe rãnh và chỉ có thể tiến rất chậm đến các trọng số tối u
Quy tắc mômen giúp giải quyết vấn đề này Khi mạng nhảy qua nhảy lại liêntục hai bên khe rãnh, có nghĩa là biến thiên trọng số sẽ đổi dấu liên tục và nh vậy sẽcho ta số trung bình cho một thay đổi đủ nhỏ chính xác Nh vậy, mạng có thể ổn
định ở đáy của khe rãnh ở đó, nó bắt đầu di chuyển đúng hớng - ban đầu chậm rồisau đó theo mômen Nói chung, những bài toán có mặt lỗi nh trong hình 12 rất ítgặp trong thực tế, thông thờng các bài toán có mặt lỗi dốc thoai thoải và phẳng hơn.[6, 19]
Hình 13: Hớng giảm trong không gian trọng số a) Tốc độ học nhỏ; b) Tốc độ học
lớn và c) Tốc độ học có thêm yếu tố quán tính
Quy tắc học thích nghi - phơng pháp delta-bar-delta
Quy tắc học thích nghi là một quy tắc cải tiến đợc xem là hiệu quả nhất củaquy tắc giảm gradien Quy tắc này đợc Robert Jacobs và cộng sự giới thiệu năm
Trang 401988 Trong quy tắc này, mỗi trọng số có một hệ số học e khác nhau Khi cập nhật trọng số, nếu hớng giảm lỗi hiện hành cùng hớng với bớc trớc thì cho e lớn, còn nếu ngợc với hớng ở bớc trớc thì e sẽ nhỏ Hớng giảm lỗi đợc xác định bởi dấu của đạo hàm riêng d m của hàm lỗi theo trọng số ở bớc lặp đó Nếu d m dơng, lỗi giảm khi
trọng số giảm, d m âm, lỗi giảm khi trọng tăng Quy tắc học thích nghi sử dụng kháiniệm hớng lỗi "vừa mới" giảm Ta có thể định nghĩa hớng cho bớc lặp mới là:
trong đó, 0 <1 là tham số cho biết "khoảng thời gian mới đây" là bao lâu Tổng
quát cho trờng hợp = 0.5 ta có:
Khi tiến về 1, giá trị d m hiện tại giảm và các giá trị quá khứ của d đợc tính bởi
f m lại tăng Nếu ta cho f là trung bình trọng số của các đạo hàm hiện tại và quá khứ,
là trọng số cho biết đạo hàm đã qua và (1-) là trọng số cho biết đạo hàm hiện tại.
Nếu f dơng thì có thể biết mới đây là "lỗi giảm khi trọng giảm" và ngợc lại, cũng nh
đối với chính đạo hàm
Dựa vào dấu của d m và f m ta có thể đo chính xác cả hớng và lỗi hiện giảm lẫn ớng và lỗi vừa giảm Nếu chúng cùng dấu, việc giảm lỗi xảy ra theo cùng hớng cũ,nếu khác dấu, hớng ngợc với hớng cũ
h-Chúng ta có thể kiểm chứng xem hớng mà lỗi giảm có thay đổi không bằng
cách nhân d m với f m Nếu tích số này dơng thì cùng dấu và âm là khác dấu Hệ số họcthích nghi đợc tính theo công thức:
0 ,
1 1
m m m
m m m
f d e
Trong thực hành, hệ thống thờng không nhạy cảm đối với việc chọn các giá trị
, và Thờng các giá trị này đợc chọn cố định Các giá trị thờng đợc chọn là: = 0.7; = 0.1 và = 0.5.
Quy tắc học thích nghi giúp tăng tốc độ học, đặc biệt là trong các bài toán lớn
và phức tạp Để đạt đợc cùng một sai số nh quy tắc gradien, số bớc học của quy tắchọc thích nghi thờng chỉ bằng 1/10 so với quy tắc gradien [6]
Học từng mẫu một