Trường hợp các đặc trưng A1: Outlook,…, A4: Windy không độc lập với nhau thì các cơng thức (6) và (7) khơng dùng được Muốn tính các trường hợp đó, một trong

Một phần của tài liệu BÀI GIẢNG HỌC MÁY Ngành Khoa học Máy tính (Trang 56 - 57)

III. Bài tập và thí nghiệm chương

4) Trường hợp các đặc trưng A1: Outlook,…, A4: Windy không độc lập với nhau thì các cơng thức (6) và (7) khơng dùng được Muốn tính các trường hợp đó, một trong

thì các cơng thức (6) và (7) khơng dùng được. Muốn tính các trường hợp đó, một trong các phương pháp là tính xác suất có điều kiện và sử dụng mạng Bayes (phần tiếp theo), hoặc sử dụng cơng thức đầy đủ của xác suất có điều kiện (nếu có dữ liệu)

2.5. Mạng Bayes (xem tài liệu [6])

Bài tập và thí nghiệm chương 4

1. Giả sử có hai phương pháp xét nghiệm A và B độc lập với nhau và cho phép phát hiện cùng một loại virus. Phương pháp A cho phép phát hiện 95% trường hợp nhiễm virus thật nhưng lại cho kết quả dương tính đối với 10% số người khơng có virus. Phương pháp B chỉ phát hiện được 90% trường hợp nhiễm virus thật nhưng chỉ cho kết quả dương tính sai với 5% số người khơng nhiễm virus. Biết rằng xác suất nhiễm virus trong cộng đồng dân cư là 1%. Giả sử một người xét nghiệm bằng một trong hai phương pháp trên và có kết quả dương tính với virus. Trong trường hợp sử dụng phương pháp nào thì kết quả đáng tin cậy hơn (xác suất người đó nhiễm virus thật cao hơn)? Trình bầy phương pháp tính xác suất cụ thể cho câu trả lời.

2. Nam báo cáo cô giáo đã làm bài tập nhưng quên vở ở nhà. Từ kinh nghiệm giảng dậy của mình, cơ giáo biết rằng chỉ 1% số sinh viên đã làm bài tập quên vở và báo cáo với cô giáo như vậy. Trong khi đó, một nửa số sinh viên chưa làm bài tập sẽ báo cáo quên vở. Thống kê cũng cho thấy số sinh viên làm bài tập chiếm 90% sinh viên cả lớp. Hãy tính xác suất Nam nói thật.

3. Hãy chứng minh công thức P(X, Y|Z)=P(X|Z)P(Y|Z) tương đương với mỗi công thức sau

P(X |Y, Z)=P(X |Z) và P(Y|X, Z)=P(Y|Z).

4. Hãy sử dụng phần mềm WEKA, chọn chức năng phân lớp, với tập dữ liệu « Weather », thử nghiệm, báo cáo, đanh giá độ chính xác, in kết quả. Ghi chú: tiêu chí đánh giá phân lớp dùng thuật toán Bayes, trong WEKA ; gọi là thuật tốn Naive Bayes. Trong khi đó mạng Bayes gọi là Bayes Net. Các tiêu chí đánh giá độ chính xác phân lớp của Thuật toán phan Bayes, dùng ma trận nhầm lẫn (Cofusion Matrix), giống các thuật toán cây quyết định với các chỉ tiêu : Accuracy, Recall, Precision,

Một phần của tài liệu BÀI GIẢNG HỌC MÁY Ngành Khoa học Máy tính (Trang 56 - 57)

Tải bản đầy đủ (PDF)

(138 trang)