Quy tắc cộng

Một phần của tài liệu BÀI GIẢNG HỌC MÁY Ngành Khoa học Máy tính (Trang 50 - 53)

III. Bài tập và thí nghiệm chương

4) Quy tắc cộng

P (A) = (4.13)

4.2.3. Tính xác suất điều kiện từ bảng xác suất đồng thời

Trong trường hợp có đầy đủ xác suất đồng thời như đã xem xét ở trên, ta có thể thực hiện suy diễn thơng qua tính xác suất điều kiện. Sau đây là một số ví dụ minh họa sử dụng bảng xác suất đồng thời trong phần trên với ký hiệu “Chim” là C, “Bay” là B và “Non” là N

Ví dụ. Giả sử các bằng chứng cho thấy một sinh vật biết bay, cần tính xác suất sinh vật đó là

chim. Theo định nghĩa ta có:

P (Chim|Bay)=P(C|B) =P(C, B)/P (B)= P(C, B, N) + P(C, B, ~N) P(C, B, N) + P(~C, B, N) + P(C, ~B, N) + P(~C, ~B, N) = (0 + 0,2) / (0 + 0,04 + 0,01 +0,23) Cúm: P(C)=1/40 Đau đầu: P(Đ)=1/10 P(C∧ Đ) = 1/80 P(Đ|C)=P(C∧Đ)/P(C)=11/80/40=12

Ví dụ. Ví dụ này minh họa cho việc kết hợp nhiều bằng chứng. Giả sử có bằng chứng sinh vật

biết bay và khơng c n non, cần tính xác suất đây khơng phải là Chim. Ta có:

P(~ C,B,~ N) = 0,01

P (¬Chim | Bay, ¬Non) = 0,048

P(C,B,~ N) +P(~ C,B,~ N) 0,01+ 0,2

Trong trường hợp tổng quát, khi cho bảng xác suất đồng thời của n biến V1, …, Vn, ta có thể tính xác suất của một số biến này khi biết giá trị một số biến khác như sau:

Công thức tổng quát

P (V1 = v1, … Vk = vk| Vk+i = vk+i, … Vn = vn)=

tổng các d ng có V1 = v1, …, VK = vk, Vk+i = vk+i, … Vn = vn

= (4.14)

tổng các d ng có Vk+i = vk+i, … Vn = vn

Một cách hình thức hơn, gọi các biến cần tính xác suất là Q, các biến đã biết là E, các biến c n lại (ngoài E và Q) là Y, ta có

∑P(Q, E,Y)

P(Q | E) = Y (4.15)

∑P(Q, E,Y) Q,Y

Mặc dù công thức trên tương đối đơn giản nhưng trên thực tế, khi số lượng biến tăng lên, số lượng các d ng chứa tổ hợp giá trị các biến ở tử số và mẫu số của công thức trên sẽ tăng theo hàm mũ, dẫn tới kích thước bảng xác suất đồng thời quá lớn nên không thể sử dụng cho suy diễn xác suất được. Trên thực tế, việc suy diễn với bảng xác suất đồng thời chỉ có thể thực hiện được với những bài tốn có dưới 10 biến ngẫu nhiên nhị phân.

4.2.4. Tính độc lập xác suất

Tính độc lập xác suất là một trong những tính chất quan trọng, cho phép giảm số lượng xác suất cần biết khi xây dựng bảng xác suất đồng thời.

Tính độc lập xác suất được định nghĩa như sau: sự kiện A độc lập về xác suất với sự kiện B nếu:

P(A |B)=P(A) (4.16) Tức là biết giá trị của B không cho ta thêm thơng tin gì về A.

Ví dụ. Giả sử A là sự kiện một sinh viên thi mơn trí tuệ nhân tạo được 10 điểm, và B là sự kiện

năm nay là năm nhuận. Việc biết năm nay là năm nhuận hay không rõ ràng không làm tăng thêm xác suất sinh viên được 10 điểm trí tuệ nhân tạo và do vậy ta có P (A | B) = P (A), tức là A độc lập xác suất với B.

Tương đương với công thức trên, khi A độc lập với B, ta có:

P(B | A) = P(B) (4.11)

(người đọc có thể tự chứng minh hai cơng thức này bằng cách sử dụng định nghĩa xác suất điều kiện).

Công thức cuối cho thấy sự độc lập xác suất có tính đối xứng: nếu A độc lập xác suất với B thì ngược lại ta có B độc lập xác suất với A. Từ hai cơng thức trên cũng có thể nhận thấy từ hai xác suất

P(A) và P(B), ta có thể tính được tồn bộ xác suất đồng thời của hai biến ngẫu nhiên A và B như sau: P (A, B) = P(AB)=¿P(A) P(B) (4.12)

P (A, ¬B) = P(A) P(¬B) = P(A) (1− P(B)) (4.13)

P (¬A, B) = P(¬A) P(B) = (1−P(A)) P(B) (4.14)

P (¬A, ¬B) = P(¬A) P(¬B) = (1−P(A)) (1− P(B)) (4.15)Như vậy, thay vì cần biết 4 xác suất đồng thời, nay ta chỉ cần biết 2 xác suất. Nhận xét này cho Như vậy, thay vì cần biết 4 xác suất đồng thời, nay ta chỉ cần biết 2 xác suất. Nhận xét này cho thấy tính độc lập xác suất cho phép biểu diễn rút gọn bảng xác suất đồng thời, làm cơ sở cho việc suy diễn trong những bài toán suy diễn xác suất với nhiều biến ngẫu nhiên.

4.2.5. Độc lập xác suất có điều kiện

Ở trên ta đã xét trường hợp độc lập xác suất không điều kiện. Mở rộng cho trường hợp xác suất điều kiện, ta nói rằng A độc lập có điều kiện với B khi biết C nếu:

P (A | B, C) = P (A | C) hoặc P (B | C) P(A,C) = P (B | C)

khi đó ta có:

P(A, B | C) = P (A | C) P(B | C) (4.16) Ý nghĩa: nếu đã biết giá trị của C thì việc biết giá trị của B khơng cho ta thêm thơng tin về A. Ví dụ: giả sử ký hiệu A là sự kiện sinh viên đi học muộn, B là sự kiện sinh viên mặc áo mưa, C là trời mưa. Thông thường, nếu quan sát thấy sinh viên mặc áo mưa (B = true) thì xác suất có sinh viên đi học muộn sẽ tăng lên (do đường bị ngập, phương tiện di chuyển chậm hơn), tức là P(A|B) ≠ P(A). Tuy nhiên, nếu ta đã biết trời mưa (C= true) và biết xác suất đi học muộn tăng lên, thì việc nhìn thấy sinh viên mặc áo mưa không làm tăng tiếp đổi xác suất sinh viên đi học muộn nữa.

Tức là: P(A| ,B, C)=P(A|C).

4.3.5. Định lý hay quy tắc Bayes Định lý hay quy tắc Bayes Định lý hay quy tắc Bayes

P(A|B)=P(B|A)P(A) P(B) (4.17)

Chứng minh:

Theo định nghĩa: P(A|B) = P(A∧B)/P(B) hay P(AB)=P(A∨B)P(B) (1)

Tương tự, ta có: P(BA)=P(B∨A)P(A) (2) Từ tính gIao hốn của phép “∧ tức là:(AB=BA) →P(AB)=P(BA)→(1)=(2) hay:

P(A|B)P(B)=P(B|A)P(A)→P(A|B)=P(B|A)P(A) P(B)

Vì 2 vế của cơng thức Bayes đều tính xác suất điều kiện cả. Cần gì phải tráo đổi giữa các biến hỏi và biến điều kiện?

Quy tắc Bayes đóng vai trị quan trọng trong suy diễn xác suất. Thơng thường, bài tốn suy diễn địi hỏi tính P(A|B). Tuy nhiên, trong đại đa số các trường hợp, việc tính P(B|A) có thể sử dụng rất ít các phép tính và do đó dễ dàng hơn so với tính P(A|B). Khi đó, quy tắc Bayes cho phép ta quy việc tính P(A|B) về tính P (B|A).

Ví dụ minh họa ý nghĩa của định lý Bayes:

Giả sử cần tính xác suất một người bị cúm khi biết người đó đau đầu, tức là tính P(cúm|đau đầu).

Để tính xác suất này, cần xác định có bao nhiêu người bị đau đầu trong một cộng đồng dân cư, sau đó đếm xem có bao nhiêu người trong số người đau đầu bị cúm. Rõ ràng việc thống kê những người đau đầu tương đối khó khăn do khơng phải ai đau đầu cũng do cúm và cũng thông báo cho cơ sở y tế. Ngược lại, để tính P(đau đầu|cúm), ta cần đếm số người bị cúm trong số những người đau đầu tức là tính P(cúm|đau

đầu). Việc này được thực hiện tương đối dễ dàng hơn với số ca (trường hợp) chắc chắn sẽ ít hơn rất nhiều.

Sau đây, ta xem xét ví dụ sử dụng quy tắc Bayes cho suy diễn.

4.3. Thuật toán Bayes và ứng dụng cho dự báo

4.3.1. Bài toán

Input : cho bảng dữ liệu học chơi Tennis

Bảng 4.2. Bảng dữ liệu học chơi Tennis

A= A1 A2 A3 A4 BDa Da

Một phần của tài liệu BÀI GIẢNG HỌC MÁY Ngành Khoa học Máy tính (Trang 50 - 53)

Tải bản đầy đủ (PDF)

(138 trang)