Các nhân tố ảnh hưởng đến thời tiết

Một phần của tài liệu ứng dụng phương pháp hồi quy bayes vào việc dự báo thời tiết (Trang 48 - 78)

2.3.1. Nhiệt độ không khí trung bình

Nhiệt độ không khí trung bình[8] là số bình quân của nhiệt độ không khí trung bình của các ngày trong tháng.

Trong đó:

Nhiệt độ trung bình ngày được tính theo phương pháp bình quân số học giản đơn từ kết quả của 4 lần quan trắc chính trong ngày tại các thời điểm 1giờ, 7 giờ, 13 giờ, 19 giờ hoặc được tính từ kết quả của 24 lần quan trắc tại các thời điểm 1 giờ, 2 giờ, 3 giờ, … và 24 giờ của nhiệt kế.

Nhiệt độ không khí được đo bằng nhiệt kế thường, nhiệt kế tối cao (thủy ngân), nhiệt kế tối thấp (rượu) và nhiệt ký (bộ phận cảm ứng là một tấm lưỡng kim) đặt trong lều khí tượng ở độ cao 2m cách mặt đất nơi không có trực xạ của bức xạ mặt trời.

2.3.2. Độ ẩm không khí trung bình

Độ ẩm không khí trung bình[8] các tháng trong năm là số bình quân của độ ẩm không khí tương đối trung bình của các ngày trong tháng.

Trong đó:

Độ ẩm không khí tương đối: là tỉ số giữa sức trương hơi nước có trong không khí và sức trương hơi nước bão hòa (tối đa) ở cùng một nhiệt độ. Nó được thể hiện bằng tỉ lệ (%). Độ ẩm không khí được đo bằng ẩm kế và ấm ký. Độ ẩm tương đối giúp ta biết được không khí là khô hay ẩm và còn chứa thêm được bao nhiêu hơi nước. Khi độ ẩm tương đối là 100% nghĩa là không khí đã bão hòa hơi nước.

Độ ẩm không khí tương đối trung bình ngày: được tính theo phương pháp bình quân số học giản đơn từ kết quả của 4 lần quan trắc chính trong ngày tại thời điểm 1 giờ, 7giờ, 13 giờ, 19 giờ hoặc được tính từ kết quả của 24 lần quan trắc tại các thời điểm 1 giờ, 2 giờ, 3 giờ, … và 24 giờ của ẩm ký.

Độ ẩm tuyệt đối: là lượng hơi nước được tính bằng gam trong 1m3 không khí ở một thời điểm nhất định. Tuy nhiên, không khí chỉ có thể chứa được một lượng hơi nước nhất định, lượng hơi nước tối đa mà 1m3 không khí có thể chứa được gọi

là độ ẩm bão hòa. Độ ẩm bão hòa thay đổi theo nhiệt độ của không khí, nhiệt độ càng cao không khí càng chứa được nhiều hơi nước.

2.3.3. Mây

Không khí càng lên cao càng lạnh, đến độ cao nào đó (tùy theo nhiệt độ) sẽ bão hòa hơi nước, tiếp tục lên cao, hơi nước ngưng tụ thành những hạt nước nhỏ và nhẹ, các hạt nước tụ thành đám còn gọi là mây[8].

2.3.4. Mưa

Các hạt nước trong đám mây vận động, kết hợp với nhau, ngưng tụ thêm, kích thước lớn hơn và rơi xuống thành mưa[8].

Nước rơi nếu gặp nhiệt độ khoàng 0oC và trong điều kiện không khí yên tĩnh sẽ tạo thành tuyết rơi.

Mưa đá xảy ra trong điều kiện thời tiết nóng, oi bức. Khi không khí đối lưu từ mặt đất bốc lên rất mạnh khiến cho các hạt nước bị đẩy lên xuống nhiều lần, gặp lạnh trở thành các hạt băng. Các hạt băng lớn dần qua mỗi lần bị đẩy lên xuống, cuối cùng rơi xuống mặt đất trở thành mưa đá.

Các nhân tố ảnh hưởng đến lượng mưa:

- Khí áp: Các khu khí áp thấp hút gió và đẩy không khí ẩm lên cao sinh ra mây, mây gặp nhiệt độ thấp ngưng thành giọt gây ra mưa. Các vùng khí áp thấp thường là nơi có lượng mưa lớn trên Trái đất.

Ở các khu khí áp cao, không khí ẩm không bốc lên được lại chỉ có gió thổi đi, không có gió thổi đến nên mưa rất ít hoặc không có mưa. Vì thế dưới các khu cao áp cận chí tuyến thường là những nơi hoang mạc lớn.

- Front: Sự xáo trộn giữa khối không khí nóng và khối không khí lạnh sẽ dẫn đến nhiều loại không khí và sinh ra mưa. Dọc các front nóng cũng như front lạnh, không khí nóng bốc lên trên không khí lạnh bị không khí lạnh co lại và lạnh đi gây ra mưa trên cả front nóng và lạnh. Miền có front, dải hội tụ nhiệt đới đi qua thường mưa nhiều. Đó là mưa front hoặc mưa dải hội tụ.

- Gió: Những vùng sâu trong các lục địa nếu không có gió từ đại dương thổi vào thì mưa rất ít, mưa ở đây chủ yếu là do sự ngưng kết hơi nước từ hồ, ao, ruộng và rừng cây bốc lên. Miền có gió mậu dịch mưa ít vì gió mậu dịch chủ yếu là gió khô, miền có gió mùa có lượng mưa lớn vì gió mùa hạ thổi từ đại dương vào đem theo nhiều hơi nước.

- Dòng biển: Cùng nằm ven bờ đại dương nơi có dòng biển nóng đi qua thường có mưa nhiều vì không khí trên dòng biển nóng chứa nhiều hơi nước, gió mang hơi nước từ lục địa vào gây mưa. Nơi có dòng biển lạnh đi qua mưa ít vì không khí trên dòng biển bị lạnh, hơi nước không bốc lên được do vậy một số nơi mặc dù nằm ven bờ đại dương nhưng vẫn hình thành hoang mạc như hoang mạc A- ta-ca-ma, Na-mip.

- Địa hình: Địa hình ảnh hưởng nhiều đến sự phân bố mưa. Cùng một sườn núi, càng lên cao nhiệt độ càng giảm, mưa càng nhiều nhưng tới một nhiệt độ nào đó, nhiệt độ không khí đã giảm nhiều sẽ không còn mưa, vì thế những đỉnh núi cao thường khô ráo.

Cùng một dãy núi thì sườn đón gió mưa nhiều còn ở sườn khuất gió thì mưa ít, khô ráo.

2.4. Cơ sở lý thuyết

2.4.1. Một số khái niệm cơ bản 2.4.1.1. Các tiên đề xác suất 2.4.1.1. Các tiên đề xác suất

- 0P A( a)1 với mọi giá trị trong miền xác định của biến A

- P true( )1; (P false)0

- P A( B)P A( )P B( )nếu A và B loại trừ tương hỗ

Các tính chất:

Ngoài các tiên đề trên, xác suất có một số tính chất quan trọng sau: -P(~ A) 1 P A( ); ~A: phủ định của A

-P A( )P A B(  )P A(  ~ )B ; ~B: phủ định của B

-P A( B)P A( )P B( )P A( B)

- ( ) 1

aP Aa

 , trong đó tổng lấy theo các giá trị a thuộc miền giá trị của A

2.4.1.2. Xác suất đồng thời

Xác suất đồng thời[13] của các sự kiện là xác suất quan sát thấy đồng thời xảy ra các sự kiện đó và được kí hiệu:

1 1 2 2

( , ,..., n n)

P Vv Vv Vv

Với một bài toán xác suất, nếu chúng ta biết tất cả các phân bố xác suất đồng thời tức là xác suất tất cả các tổ hợp giá trị của các biến liên quan thì ta có thể tính được xác suất mọi mệnh đề liên quan đến bài toán đang xét.

Ví dụ: cho 3 biến nhị phân (true = T, false = F): “chim”, “non”, “bay được”. Ta có các xác suất đồng thời cho trong bảng sau:

Bảng 2.1. Bảng xác suất đồng thời

Nguồn[13]

Chim Bay được Non Xác suất

T T T 0 T T F 0.2 T F T 0.04 T F F 0.01 F T T 0.01 F T F 0.01 F F T 0.23 F F F 0.5

Từ bảng xác suất trên, ta có thể tính giá trị mọi xác suất liên quan đến 3 biến của bài toán. Sau đây là ví dụ tính một số xác suất.

- Xác suất một vật nào đó là “chim”: P(chim = T) = 0 + 0.2 + 0.04 + 0.01 = 0.25

- Xác suất “chim không biết bay”: P(chim = T, bay = F) = 0.04 + 0.01 = 0.05

2.4.1.3. Xác suất điều kiện

Xác suất điều kiện[13] là xác suất xảy ra sự kiện A khi biết sự kiện B xảy ra. Xác suất điều kiện được tính như sau:

( ) ( | ) ( ) P A B P A B P B  

Xác suất điều kiện đóng vai trò quan trọng trong suy diễn xác suất và có ý nghĩa như sau:

- Khi P A B( | )0: B đúng thì suy ra ~A

- Có thể xem B là bằng chứng hoặc quan sát và A là kết luận. Khi đó, P A B( | )là xác suất hoặc niềm tin A là đúng khi quan sát thấy B.

Quá trình suy diễn là quá trình tính xác suất điều kiện của kết luận khi biết bằng chứng. Cụ thể là khi cho biết bằng chứng E1, …, En suy diễn xác suất được thực hiện bằng cách tính xác suất điều kiện P Q E | 1,...,En, tức là niềm tin kết luận Q đúng khi có các bằng chứng E1, …, En

Các tính chất của xác suất điều kiện:

- Quy tắc nhân:

( , ) ( | ) ( )

P A BP A BP B

- Quy tắc chuỗi (là mở rộng của quy tắc nhân):

( , , , ) ( | , , ) ( | , ) ( | ) ( )

P A B C DP A B C DP B C DP C DP D

- Quy tắc chuỗi có điều kiện:

( , | ) ( | , ) ( | ) P A B CP A B CP B C - Cộng: ( ) ( | ) ( ) b P A  P A B  b P B b - P(~B A| ) 1 P B A( | ) 2.4.1.4. Tính độc lập xác suất

Sự kiện A độc lập với sự kiện B[13] nếu:

( | ) ( )

P A BP A

Tức là biết giá trị của B không cho ta thêm thông tin gì về B Tương đương với công thức trên, khi A độc lập với B, ta có:

( , ) ( ) ( )

P A BP AP B

P B A( | )P B( )

Mở rộng cho trường hợp xác suất điều kiện, ta nói rằng A độc lập có điều kiện với B khi biết C nếu:

( | , ) ( , )

P A B CP A C hoặc P B A C( | , )P B C( | )

khi đó ta có:

( , | ) ( | ) ( | )

Ý nghĩa: nếu đã biết giá trị của C thì việc biết giá trị của B không cho ta thêm thông tin về A.

2.4.2. Phát biểu định lý Bayes

Định lý Bayes[13] cho phép tính xác suất xảy ra của một sự kiện ngẫu nhiên A khi biết sự kiện liên quan B. Xác suất này được kí hiệu là P A B( | ), và đọc là “xác suất của A nếu có B”. Đại lượng này được gọi là xác suất có điều kiện hay xác suất hậu nghiệm vì nó được rút ra từ giá trị được cho của B hoặc phụ thuộc vào giá trị đó. Theo định lý Bayes, xác suất xảy ra A khi biết B sẽ phụ thuộc vào 3 yếu tố:

- Xác suất xảy ra A của riêng nó, không quan tâm đến B. Kí hiệu P(A) đọc là xác suất của A, đây được gọi là xác suất tiên nghiệm (tiên nghiệm nghĩa là không quan tâm đến bất kì thông tin về B).

- Xác suất xảy ra B của riêng nó, không quan tâm đến A. Kí hiệu P(B) và đọc là “xác suất của B”. Đại lượng này còn gọi là hằng số chuẩn hóa (normalizing_constant), vì nó luôn giống nhau, không phụ thuộc vào sự kiện A đang muốn biết.

- Xác suất xảy ra B khi biết A xảy ra. Kí hiệu P B A( | )và đọc là “xác suất của B nếu có A”. Đại lượng này gọi là khả năng (likelihood) xảy ra B khi biết A đã xảy ra.

Khi biết 3 đại lượng này, xác suất của A khi biết B được cho bởi công thức:

( | ) ( ) ( | ) ( ) P B A P A P A B P B  = _ likelihood prior normalizing constant  từ đó dẫn tới: ( | ) ( ) ( ) ( | ) ( ) P A B P BP ABP B A P A

Khi có n giả thuyết thì:

1 ( | ) ( ) ( | ) ( | ) ( ) i i i n i i i P B A P A P A B P B A P A   

2.4.3. Mạng Bayes (Bayesian Network)

Mạng Bayes[23] là một đồ thị biểu diễn phân phối xác suất trên một tập biến. Nó thường dùng để mã hóa các tri thức của chuyên gia và ý niệm của họ về một lĩnh vực nào đó. Do đó mạng Bayes còn được gọi là mạng ý niệm (Belief Network) hoặc mạng nhân quả (Causal Network).

Các nút trong mạng Bayes biểu diễn các biến cần quan tâm và các cung đại diện cho các phụ thuộc có điều kiện giữa các biến. Các phụ thuộc được định lượng bởi các xác suất có điều kiện.

Trong trường hợp tổng quát, các nút có thể đại diện cho các loại biến khác, một tham số đo được, một biến ẩn (latent variable), hay một giả thuyết…

2.4.3.1. Khái niệm mạng Bayes

Mạng Bayes[23] biểu diễn phân phối trên một tập biến U V1,...,Vngồm hai thành phần:

- Đồ thị G không chu trình, có hướng gọi tắt là DAG (Directed acyclic graph): mỗi đỉnh biểu diễn một biến. Cạnh giữa hai nút Vi và Vj biểu diễn ảnh hưởng trực tiếp giữa trạng thái của hai nút; nếu không có cạnh giữa hai nút thì hai nút này độc lập có điều kiện với nhau. Các nút cha của nút V kí hiệu là Pa(V), với các thực thể là pa(V). Kí hiệu Fv  VPa V là họ hàng của V. Cấu trúc DAG này mã hóa một tập các nhận định độc lập, điều này hạn chế một số tương tác có thể xảy ra giữa các biến. Nút V độc lập với các nút không là hậu duệ của nó khi cho trước giá trị của các nút cha Pa(V).

- Một phần định lượng của G: về mặt ngữ nghĩa, một biến chỉ ở một trạng thái nhưng vì ta không biết là trạng thái nào nên phần định lượng của đồ thị là một bảng phân phối xác suất biểu diễn ý niệm về trạng thái của các biến. Mỗi biến V trong G được định lượng bởi một bảng xác suất có điều kiện P V Pa V( | ( )), tức là biểu diễn cường độ của sự phụ thuộc giữa V và Pa(V). Vì P V Pa V( | ( ))là một hàm của Fv, nên ta xem nó theo cách sau đây: với mỗi thực thể Pa(V), một số thực thuộc [0,1] được gán cho mỗi giá trị v của V sao cho tổng của chúng bằng 1. KhiPa V( ) ,

( | ( ))

P V Pa V được gọi là xác suất có điều kiện của V với Pa(V) đã cho; ngược lại,

( | ( )) ( )

P V Pa VP V và gọi là xác suất tiên nghiệm của V.

2.4.3.2. Tính độc lập xác suất trong mạng Bayes

Mạng Bayes thể hiện 2 thông tin chính sau:

- Thứ nhất, đây là biểu diễn rút gọn của toàn bộ xác suất đồng thời. Tùy theo kích thước và đặc điểm cụ thể của bài toán, hiệu quả của việc rút gọn số lượng xác suất có thể lớn hơn rất nhiều. Chẳng hạn, với mạng gồm 30 nút nhị phân, mỗi nút có

5 nút cha, ta cần tất cả 960 xác suất điều kiện cho mạng Bayes, trong khi bảng xác suất đồng thời cho 30 biến như vậy phải có 230 – 1, tức là hơn 1 tỉ dòng.

- Thứ hai, mạng Bayes cho thấy sự phụ thuộc hoặc độc lập xác xuất có điều kiện giữa các biến. Về thực chất, chính việc độc lập về xác suất dẫn tới khả năng biểu diễn rút gọn các xác suất đồng thời.

Tính độc lập xác suất trong mạng Bayes[11] thể hiện qua tính chất sau:

- Mỗi nút trên mạng Bayes độc lập có điều kiện với tất cả các nút không phải là hậu duệ của nút đó nếu biết giá trị các nút cha.

- Mỗi nút độc lập có điều kiện với tất cả các nút khác trên mạng nếu biết giá trị tất cả các nút cha, nút con và nút cha của các nút con.

Tính các xác suất đồng thời:

Giả sử mạng có n nút tương ứng n biến ngẫu nhiên V1, …, Vn của bài toán đang xét. Từ thông tin của mạng, có thể tính mọi xác suất đồng thời của n biến, trong đó mỗi xác suất đồng thời có dạng P V( 1     v1 V2 v2 ... Vn vn)hay viết gọn là P v( ,...,1 vn). Xác suất đồng thời được tính theo công thức tổng quát sau:

1 1 1 ( ,..., ) ( | ( )) n n n i i i i P V v V v P V v Pa V      Hay viết gọn là: 1 1 ( ,..., ) ( | ( )) n n i i i P v v P v Pa V   đặt U v1,...,vnkhi đó ta có: 1 ( ) ( | ( )) n i i i P U P v Pa V  

trong đó Pa(Vi) là giá trị cụ thể các nút cha của nút Vi

2.4.4. Cách xây dựng mạng Bayes

Quá trình xây dựng mạng Bayes[19,23] bao gồm việc xác định tất cả các biến ngẫu nhiên liên quan, xác định cấu trúc đồ thị của mạng, và cuối cùng là xác định giá trị cho các bảng xác suất điều kiện. Trong phần này, ta coi như đã có biến ngẫu nhiên, việc xây dựng mạng chỉ bao gồm xây dựng cấu trúc và bảng xác suất điều kiện.

- Cách 1: do con người (chuyên gia) thực hiện dựa trên hiểu biết của mình về bài toán đang xét. Việc xây dựng mạng được chia thành 2 bước là xác định cấu trúc đồ thị và điền giá trị cho bảng xác suất điều kiện.

- Cách 2: là tự động xác định cấu trúc và xác suất điều kiện từ dữ liệu. Ở đây,

Một phần của tài liệu ứng dụng phương pháp hồi quy bayes vào việc dự báo thời tiết (Trang 48 - 78)