MỘT SỐ NỘI DUNG, BÀI TẬP ÔN TẬP MÔN HỌC CÔNG NGHỆ TRI THỨC & ỨNG DỤNG Phần I. Quản lý tri thức A. Biểu diễn tri thức 1. Dùng logic vị từ để biểu diễn những câu bên dưới, cho biết một số vị từ như: S(x) : x đã học bài để thi. W(x) : x đã làm bài thi tốt. B(x, y) : x đã làm bài thi tốt hơn y a. Có một số sinh viên không học bài để thi nhưng đã làm bài tốt. b. Tất cả những sinh viên đã học bài thi tốt hơn những sinh viên không học bài. c. Có một số sinh viên thi tốt hơn những người còn lại. d. Sinh viên thi tốt nhất là người đã học bài. 2. Dùng logic vị từ để biểu diễn những câu sau: a. Tất cả mọi người đều có một mẹ. b. Cô (gì) là chị em của bố (mẹ). 3. Chuyển phát biểu sau về hình thức mệnh đề ∀x. (∃y. R(x, y)) ↔ Q(x) 4. Chọn phương pháp biểu diễn tri thức phù hợp với bài toán sau: Bình thích ăn trái cây. Táo là một loại trái cây. Con người sẽ ăn cái gì họ thích ăn. Vậy Bình có ăn Táo không? Nước giải khát đóng chai có nhiều đường. Những người ăn kiêng không nên ăn/uống những loại thức ăn có nhiều đường. Tâm là một người ăn kiêng. Coca Cola là một loại nước giải khát đóng chai Vây Tâm có nên uống Coca Cola không? 5. Bạn hãy cho một số ví dụ thực tế mà khó biểu diễn và thao tác bằng logic vị từ. Hãy cho biết phương pháp biểu diễn nào thích hợp với ví dụ bạn đã đưa ra. 6. Hãy xây dựng một mạng ngữ nghĩa để xác định một trong các yếu tố vật lý như: vận tốc, quãng đường, thời gian, gia tốc, … khi đã biết một hoặc nhiều yếu tố khác (đối với một dạng bài toán cụ thể). Chẳng hạn trong chuyển động đều, khi ta biết vận tốc và thời gian ta sẽ tính được quãng đường di chuyển được. 7. Bạn nhận xét gì về phát biểu sau: “Nói chung, phần lớn tri thức, nếu có thể được biểu diễn bằng mạng ngữ nghĩa thì đều có thể được biểu diễn bằng luật”. 8. Hãy chọn một vấn đề thuộc lĩnh vực mà bạn quan tâm có thể giải quyết theo tiếp cận của Công nghệ tri thức. Đưa ra cách biểu diễn tri thức và suy diễn trên các hệ cơ sở tir thức đã xác định. B. Tối ưu hóa một CSTT luật dẫn 1. Cho tập luật R như sau R = { r1: A, M → N; r2: B, N → C; r3: A, M → B; r4: A → P; r5: D → M ; r6: B, N → M ; r7: P, C → A ; r8: D, O → A } a. Tối ưu tập luật R: loại bỏ những luật thừa trong R b. Sau khi loại bỏ luật thừa hãy kiểm tra phát hiện có hay không mâu thuẫn, và vòng lặp suy diễn khi thêm các luật sau: (1) N → D (2) D, O → N 2. Trình bày và cho ví dụ vấn đề mâu thuẫn trong cơ sở tri thức dạng luật. Nêu một phương pháp để phát hiện mâu thuẫn trong cơ sở tri thức dạng luật. (Tham khảo đề thi cao học khoa CNTT- trường ĐHKHTN) 3. Cho một cơ sở tri thức r1: A, B → C r2: C, D → E r3: F, B → G r4: A, E → H r5: F → E r6: B, E → G Với các sự kiện B đúng, D, đúng. Hãy trình bày quá trình lập luận tiến và lập luận lùi để biết G đúng hay sai. Phần II. Hệ Cơ sở tri thức mờ 1. Xem lại bài toán máy bơm nước. 2. Dựa vào bài toán máy bơm nước anh chị có thể xây dựng một bài tương tự như máy giặt, máy micro-wave(lò viba), … Phần III. Máy học & Khám phá tri thức A. Phương pháp học dựa trên cây định danh 1. Xem lại bài toán: xây dựng cây định danh từ tập dữ liệu quan sát được để rút ra những luật giúp cho việc kết luận một người như thế nào khi đi tắm biển sẽ bị cháy nắng hay không cháy nắng. 2. Ví dụ: Cho bảng quan sát sau đây, hãy xây dựng một cây định danh và rút ra các luật từ bảng quan sát này. STT TT1 TT2 TT3 Kết luận 1 D A F W 2 D A G W 3 E A F W 4 E A G W 5 D B F W 6 D B G W 7 E B F W 8 D C F Y 9 D C G Y 10 E C F Y 11 E C G Y 12 E B G Y 3. Sử dụng cây định danh để tìm các luật phân lớp từ bảng quyết định sau đây: (Tham khảo đề thi cao học khoa CNTT- trường ĐHKHTN) # TRỜI ÁPSUẤT GIÓ KẾTQUẢ 1 Trong Cao Bắc Không mưa 2 Mây Cao Nam Mưa 3 Mây Trung Bình Bắc Mưa 4 Trong Thấp Bắc Không mưa 5 Mây Thấp Bắc Mưa 6 Mây Cao Bắc Mưa 7 Mây Thấp Nam Không mưa 8 Trong Cao Nam Không mưa 2. Sử dụng cây định danh để tìm các luật phân lớp từ bảng dữ liệu sau: # Độ cứng Độ ẩm Độ pH Kết quả 1 Trung bình Thấp Cao Xấu 2 Cao Cao Cao Tốt 3 Cao Thấp Trung bình Tốt 4 Trung bình Thấp Thấp Xấu 5 Cao Thấp Thấp Tốt 6 Cao Thấp Cao Tốt 7 Cao Cao Thấp Xấu 8 Trung bình Cao Cao Xấu 9 Cao Trung bình Trung bình ??? Dùng các luật phân lớp để xác định lớp của #9 B. Mạng neural nhân tạo: Xem lại ví dụ trong bài giảng về việc xác định phân loài của “cây Iris” 1. Mạng Perceptron 2. Mạng lan truyền ngược C. Bài toán tìm luật kết hợp: 1. Xem lại ví dụ trong bài giảng a. Ví dụ 1: Dựa vào độ tuổi và tình trạng gia đình để rút ra kết luận về số xe hơi mà một người sở hữu. b. Ví dụ 2: Dựa vào các hóa đơn bán hàng rút ra được một người khi đi mua hàng A thì cũng thường mua hàng B (Bài toán “nước ngọt, sữa, khăn giấy…”). 2. Cho tập các hóa đơn O = {o1, o2, o3, o4, o5}, mỗi hóa đơn chứa các mặt hàng như sau: o1 = {i1, i3, i4}; o2 = {i1, i3, i4}; o3 = {i3, i5}; o4 = {i4, i5}; o5 = {i2, i3, i5} Cho ngưỡng phổ biến tối thiểu minsupp = 0,4. Hãy 2.1 Tìm các tập phổ biến tối đại theo ngưỡng minsupp = 0,4 2.2 Tìm tất cả các luật kết hợp có độ phổ biến tối thiểu là 0,4 và độ tin cậy tối thiểu là 0,8 (Tham khảo đề thi cao học khoa CNTT- trường ĐHKHTN) . MỘT SỐ NỘI DUNG, BÀI TẬP ÔN TẬP MÔN HỌC CÔNG NGHỆ TRI THỨC & ỨNG DỤNG Phần I. Quản lý tri thức A. Biểu diễn tri thức 1. Dùng logic vị từ để biểu diễn những câu. x đã học bài để thi. W(x) : x đã làm bài thi tốt. B(x, y) : x đã làm bài thi tốt hơn y a. Có một số sinh viên không học bài để thi nhưng đã làm bài tốt. b. Tất cả những sinh viên đã học bài thi. quyết theo tiếp cận của Công nghệ tri thức. Đưa ra cách biểu diễn tri thức và suy diễn trên các hệ cơ sở tir thức đã xác định. B. Tối ưu hóa một CSTT luật dẫn 1. Cho tập luật R như sau R = {