Mạng Bayes (Bayesian Network)

Một phần của tài liệu ứng dụng phương pháp hồi quy bayes vào việc dự báo thời tiết (Trang 53 - 55)

Mạng Bayes[23] là một đồ thị biểu diễn phân phối xác suất trên một tập biến. Nó thường dùng để mã hóa các tri thức của chuyên gia và ý niệm của họ về một lĩnh vực nào đó. Do đó mạng Bayes còn được gọi là mạng ý niệm (Belief Network) hoặc mạng nhân quả (Causal Network).

Các nút trong mạng Bayes biểu diễn các biến cần quan tâm và các cung đại diện cho các phụ thuộc có điều kiện giữa các biến. Các phụ thuộc được định lượng bởi các xác suất có điều kiện.

Trong trường hợp tổng quát, các nút có thể đại diện cho các loại biến khác, một tham số đo được, một biến ẩn (latent variable), hay một giả thuyết…

2.4.3.1. Khái niệm mạng Bayes

Mạng Bayes[23] biểu diễn phân phối trên một tập biến U V1,...,Vngồm hai thành phần:

- Đồ thị G không chu trình, có hướng gọi tắt là DAG (Directed acyclic graph): mỗi đỉnh biểu diễn một biến. Cạnh giữa hai nút Vi và Vj biểu diễn ảnh hưởng trực tiếp giữa trạng thái của hai nút; nếu không có cạnh giữa hai nút thì hai nút này độc lập có điều kiện với nhau. Các nút cha của nút V kí hiệu là Pa(V), với các thực thể là pa(V). Kí hiệu Fv  VPa V là họ hàng của V. Cấu trúc DAG này mã hóa một tập các nhận định độc lập, điều này hạn chế một số tương tác có thể xảy ra giữa các biến. Nút V độc lập với các nút không là hậu duệ của nó khi cho trước giá trị của các nút cha Pa(V).

- Một phần định lượng của G: về mặt ngữ nghĩa, một biến chỉ ở một trạng thái nhưng vì ta không biết là trạng thái nào nên phần định lượng của đồ thị là một bảng phân phối xác suất biểu diễn ý niệm về trạng thái của các biến. Mỗi biến V trong G được định lượng bởi một bảng xác suất có điều kiện P V Pa V( | ( )), tức là biểu diễn cường độ của sự phụ thuộc giữa V và Pa(V). Vì P V Pa V( | ( ))là một hàm của Fv, nên ta xem nó theo cách sau đây: với mỗi thực thể Pa(V), một số thực thuộc [0,1] được gán cho mỗi giá trị v của V sao cho tổng của chúng bằng 1. KhiPa V( ) ,

( | ( ))

P V Pa V được gọi là xác suất có điều kiện của V với Pa(V) đã cho; ngược lại,

( | ( )) ( )

P V Pa VP V và gọi là xác suất tiên nghiệm của V.

2.4.3.2. Tính độc lập xác suất trong mạng Bayes

Mạng Bayes thể hiện 2 thông tin chính sau:

- Thứ nhất, đây là biểu diễn rút gọn của toàn bộ xác suất đồng thời. Tùy theo kích thước và đặc điểm cụ thể của bài toán, hiệu quả của việc rút gọn số lượng xác suất có thể lớn hơn rất nhiều. Chẳng hạn, với mạng gồm 30 nút nhị phân, mỗi nút có

5 nút cha, ta cần tất cả 960 xác suất điều kiện cho mạng Bayes, trong khi bảng xác suất đồng thời cho 30 biến như vậy phải có 230 – 1, tức là hơn 1 tỉ dòng.

- Thứ hai, mạng Bayes cho thấy sự phụ thuộc hoặc độc lập xác xuất có điều kiện giữa các biến. Về thực chất, chính việc độc lập về xác suất dẫn tới khả năng biểu diễn rút gọn các xác suất đồng thời.

Tính độc lập xác suất trong mạng Bayes[11] thể hiện qua tính chất sau:

- Mỗi nút trên mạng Bayes độc lập có điều kiện với tất cả các nút không phải là hậu duệ của nút đó nếu biết giá trị các nút cha.

- Mỗi nút độc lập có điều kiện với tất cả các nút khác trên mạng nếu biết giá trị tất cả các nút cha, nút con và nút cha của các nút con.

Tính các xác suất đồng thời:

Giả sử mạng có n nút tương ứng n biến ngẫu nhiên V1, …, Vn của bài toán đang xét. Từ thông tin của mạng, có thể tính mọi xác suất đồng thời của n biến, trong đó mỗi xác suất đồng thời có dạng P V( 1     v1 V2 v2 ... Vn vn)hay viết gọn là P v( ,...,1 vn). Xác suất đồng thời được tính theo công thức tổng quát sau:

1 1 1 ( ,..., ) ( | ( )) n n n i i i i P V v V v P V v Pa V      Hay viết gọn là: 1 1 ( ,..., ) ( | ( )) n n i i i P v v P v Pa V   đặt U v1,...,vnkhi đó ta có: 1 ( ) ( | ( )) n i i i P U P v Pa V  

trong đó Pa(Vi) là giá trị cụ thể các nút cha của nút Vi

Một phần của tài liệu ứng dụng phương pháp hồi quy bayes vào việc dự báo thời tiết (Trang 53 - 55)