1. Trang chủ
  2. » Tất cả

Bài giảng môn học hệ chuyên gia

138 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN HỆ THỐNG THÔNG TIN -o0o BÀI GIẢNG MÔN HỌC HỆ CHUYÊN GIA HỆ ĐẠI HỌC CHÍNH QUY NĂM 2021 MỤC LỤC CHƯƠNG GIỚI THIỆU VỀ HỆ CHUYÊN GIA 1.1.Giới thiệu chung 1.1.1 Hệ chuyên gia? 1.1.2 Sự phát triển công nghệ hệ chuyên gia 11 1.1.3 Các lĩnh vực ứng dụng hệ chuyên gia 12 1.2 Cấu trúc hệ chuyên gia 12 1.3 Các đặc tính hệ chuyên gia .16 1.3.1 Tách tri thức khỏi điều khiển .16 1.3.2 Tri thức chuyên gia 17 1.3.3 Tập trung nguồn chuyên gia 17 1.3.4 Lập luận kí hiệu .18 1.3.5 Lập luận may rủi 18 1.3.6 Lập luận khơng xác 19 1.3.7 Khả giải vấn đề 19 1.3.8 Độ phức tạp vừa phải vấn đề 19 1.3.9 Chấp nhận sai lầm 20 1.4 Công nghệ tri thức 20 1.5 Nhóm người tham gia xây dựng hệ chuyên gia 21 1.5.1 Chuyên gia lĩnh vực 21 1.5.2 Kĩ sư tri thức 23 1.5.3 Người sử dụng 25 CHƯƠNG THỂ HIỆN TRI THỨC 27 2.1 Các loại tri thức 27 2.1.1 Giới thiệu tri thức 27 2.1.2 Các dạng tri thức 28 2.2 Các kỹ thuật thể tri thức 29 2.2.1 Thể tri thức cặp ba đối tượng- thuộc tính- giá trị 29 2.2.2 Thể kiện không chắn 31 2.2.3 Thể tri thức nhờ luật 33 2.2.4 Thể tri thức bảng đen 38 2.2.5 Thể tri thức nhờ mạng ngữ nghĩa 40 2.2.6 Thể tri thức thông qua khung .42 2.2.7 Thể tri thức thông qua logic mệnh đề 47 2.3 Các luật hệ chuyên gia 52 CHƯƠNG CÁC KỸ THUẬT SUY LUẬN 56 3.1 Lập luận 56 3.1.1 Lập luận theo cách suy diễn 56 3.1.2 Lập luận quy nạp 56 3.1.3 Lập luận đoán 57 3.1.4 Lập luận tương tự, loại suy 57 3.1.5 Lập luận theo lẽ thường 58 3.1.6 Lập luận không đơn điệu .58 3.2 Suy luận 59 3.2.1 Modus ponens modus tollens 60 3.2.2 Giải vấn đề 61 3.2.3 Giải vấn đề cách tự nhiên .63 3.3 Suy luận tiến 63 3.4 Suy luận lùi 67 3.5 Hướng dẫn xây dựng hệ chuyên gia với tri thức máy tính 69 CHƯƠNG LÝ THUYẾT CHẮC CHẮN 72 4.1 Tổng quan lý thuyết chắn 72 4.1.1 Lập luận khơng xác MYCIN 72 4.1.2 Thể dấu hiệu không chắn 73 4.1.3 Thể luật không chắn .73 4.1.4 Suy luận không chắn 73 4.1.5 Tổ hợp dấu hiệu từ nhiều nguồn 74 4.1.6 Độ tin cậy thực 74 4.1.7 Cơ sở lí thuyết chắn 75 4.2 Nhân tố chắn khía cạnh sác xuất 77 4.2.1 Dấu hiệu không chắn 77 4.2.2 Lan truyền chắn luật có giả thiết đơn 78 4.2.3 Lan truyền chắn luật có nhiều giả thiết 79 4.2.4 Lan truyền chắn luật có kết luận .79 4.2.5 Lan truyền chắn luật phức hợp 82 4.3 Ví dụ tổng hợp 82 CHƯƠNG LẬP LUẬN BẰNG LOGIC MỜ 84 5.1 Tổng quan logic mờ 84 5.1.1 Các biến ngôn ngữ 85 5.1.2 Tập mờ 86 5.2 Thiết lập thể tập mờ 87 5.2.1 Thiết lập tập mờ 87 5.2.2 Thể mờ 88 5.3 Gia tử 89 5.3.1 Tập trung(rất) 89 5.3.2 Co giãn (một chút) 89 5.3.3 Nhấn mạnh (thực là) .90 5.3.4 Mạnh mẽ (rất rất) 90 5.4 Các phép toán tập mờ 90 5.4.1 Phép giao 90 5.4.2 Phép hợp 91 5.4.3 Phép bù (phủ định) 91 5.4.4 Các tập mờ dẫn xuất khác 91 5.5 Suy diễn mờ 92 5.5.1 Nhân ma trận vectơ mờ 93 5.5.2 Các ý tưởng suy diễn mờ 93 5.5.3 Suy diễn max-min 94 5.5.4 Suy diễn tích cực đại 96 5.6 Các luật nhiều giả thiết 97 5.6.1 Việc làm rõ, giải mờ 98 5.6.2 Nhóm luật mờ 98 CHƯƠNG MẠNG TÍNH TỐN 101 6.1 Giới thiệu mạng tính tốn 101 6.1.1 Các quan hệ .101 6.1.2 Mạng tính tốn ký hiệu 103 6.2 Vấn đề mạng tính tốn 104 6.3 Giải vấn đề 106 6.3.1 Tính giải tốn 106 6.3.2 Thuật tốn tính bao đóng 108 6.3.3 Thuật tốn tìm lời giải 109 6.3.4 Thuật tốn tìm lời giải tốt 111 6.3.5 Ví dụ 113 6.3.6 Lời giải tối ưu toán .115 6.3.7 Kiểm định giả thiết cho toán 115 6.4 Ứng dụng phản ứng hoá học 119 CHƯƠNG HỆ HỌC 124 7.1 Học 124 7.1.1 Mở đầu .124 7.1.2 Các hình thức học 125 7.2 Cây định danh 126 7.2.1 Thí dụ giới thực thu gọn 126 Recommended for you Document continues below Individual Kinh tế vi mô 100% (3) Từ vựng nâng cao - Lecture notes Kinh tế vi mô 100% (2) SACH Beginner LIFE-U1-10-đã chuyển đổi 38 Kinh tế vi mô 100% (2) Market Leader 3rd-Pre CB 175 Kinh tế vi mô 100% (1) 7.2.2 Phân loại đối tượng theo thuộc tính 128 7.2.3 Độ lộn xộn tập hợp .129 7.2.4 Chuyển sang luật 131 7.3 Thuật giải học quy nạp ILA 135 7.3.1 Xác định liệu 135 7.3.2 Thuật giải ILA 136 7.3.3 Mô tả thuật giải ILA 136 7.3.4 Đánh giá thuật giải 138 CHƯƠNG GIỚI THIỆU VỀ HỆ CHUYÊN GIA 1.1 Giới thiệu chung Nhiều ngành cần có máy móc trợ giúp cơng việc thường ngày sản xuất lâu dài người ta thấy máy móc đóng góp nhiều việc tăng suất Lịch sử phát triển xã hội loại người cho thấy hiệu sử dụng việc sử dụng máy móc cơng cụ Khi người có trí tuệ họ địi hỏi thiết bị tự động có khả xử lý tình thu nhận kiến thức người Nhiều tổ chức sử dụng thiết bị phần mềm việc định việc tổ chức huy động tri thức chuyên gia Ngoài việc nghiên cứu máy giúp người hiểu rõ cách lập luận Tuy có nhiều quan điểm vai trò người máy người ta khơng phủ nhận vai trị trợ giúp máy đặc biệt máy thông minh Theo thời gian ngày nhu cầu máy thông minh cấp thiết Khoảng đầu năm 1800 người ta trình diễn máy chơi cờ làm kích thích người nghiên cứu máy thông minh Năm 1934 C Babbage thiết kế máy tính Ơng đề nghị phát triển máy để chơi cờ để thi đua lành mạnh với người Năm 1950 mong ước máy thông minh cịn giấc mơ cơng nghệ cho phép máy tính phát triển Các máy tính có khả xử lý liệu nhiên việc lập luận người Khi quan niệm máy tính lên người ta đưa tri thức vào tốn giải máy tính Các kiện, luật cấu trúc mã hoá thành kí hiệu Các ngơn ngữ lập trình LISP, PROLOG cho phép mã hoá truy nhập thơng tin dạng kí hiệu Người ta bắt đầu nhằm vào việc phát triển chương trình diễn tả hành vi thông minh trang bị phương tri thức, phương pháp tìm kiếm ngơn ngữ xử lý kí hiệu 1.1.1 Hệ chuyên gia? Theo E Feigenbaum: “Hệ chuyên gia (Expert System) chương trình máy tính thơng minh sử dụng tri thức (knowledge) thủ tục suy luận (inference procedures) để giải tốn tương đối khó khăn địi hỏi chuyên gia giải được” Hệ chuyên gia hệ thống tin học mơ (emulates) lực đoán (decision) hành động (making abilily) chuyên gia (con người) Hệ chuyên gia lĩnh vực ứng dụng trí tuệ nhân tạo (Artificial Intelligence) hình Artificial Intelligence Robotic Speech Vision Artificial Neural Systems Natural Language Expert System Understanding Hình 1.1 Một số lĩnh vực ứng dụng trí tuệ nhân tạo Hệ chuyên gia sử dụng tri thức chuyên gia để giải vấn đề (bài toán) khác thuộc lĩnh vực Tri thức (knowledge) hệ chuyên gia phản ánh tinh thơng tích tụ từ sách vở, tạp chí, từ chuyên gia hay nhà bác học Các thuật ngữ hệ chuyên gia, hệ thống dựa tri thức (knowledge-based system) hay hệ chuyên gia dựa tri thức (knowledge-based expert system) thường có nghĩa Một hệ chuyên gia gồm ba thành phần sở tri thức (knowledge base), máy suy diễn hay môtơ suy diễn (inference engine), hệ thống giao tiếp với người sử dụng (user interface) Cơ sở tri thức chứa tri thức để từ đó, máy suy diễn tạo câu trả lời cho người sử dụng qua hệ thống giao tiếp Người sử dụng (user) cung cấp kiện (facts) biết, có thật hay thơng tin có ích cho hệ chun gia, nhận câu trả lời lời khuyên hay gợi ý đắn (expertise) Hoạt động hệ chuyên gia dựa tri thức minh họa sau : Người sử dụng (User) Hệ thống giao tiếp (User interface) Cơ sở tri thức (Knowledge Base) Máy suy (Inference Engine) diễn Hình 1.2 Hoạt động hệ chuyên gia Mỗi hệ chuyên gia đặc trưng cho lĩnh vực vấn đề (problem domain) đó, y học, tài chính, khoa học hay cơng nghệ, v.v , mà cho lĩnh vực vấn đề Tri thức chuyên gia để giải vấn đề đặc trưng gọi lĩnh vực tri thức (knowledge domain) Lĩnh vực vấn đề (Problem Domain) Lĩnh vực tri thức (Knowledge Domain) Hình 1.3 Quan hệ lĩnh vực vấn đề lĩnh vực tri thức Ví dụ : hệ chuyên gia lĩnh vực y học để phát bệnh lây nhiễm có nhiều tri thức số triệu chứng lây bệnh, lĩnh vực tri thức y học bao gồm bệnh, triệu chứng chữa trị Chú ý lĩnh vực tri thức hoàn toàn nằm lĩnh vực vấn đề Phần bên lĩnh vực tri thức nói lên khơng phải tri thức cho tất vấn đề Tùy theo yêu cầu người sử dụng mà có nhiều cách nhìn nhận khác hệ chuyên gia Loại người sử dụng Vấn đề đặt Người quản trị Tơi dùng để làm ? 10 ZnS  ZnO  ZnCl2 Ví dụ 4: Hồn thành phương trình phản ứng sau đây: Mg + H2SO đ Fe(OH)3 + H2 SO4 đ K2 CO3 + H 2SO đ Ba(NO3 ) + H 2SO đ Ví dụ 5: Viết phương trình phản ứng theo sơ đồ sau: FeS + ?  FeCl2 + ? CuSO4 + ?  ? + Na2 SO4 Ví dụ 6: Từ muối NaCl nước (H2O) ta điều chế axit clohidric (HCl) NaOH không? CHƯƠNG HỆ HỌC 7.1 Học 7.1.1 Mở đầu Các chương trước có thảo luận biểu diễn tri thức kỹ thuật suy diễn Trong trường hợp giả định có sẵn tri thức biểu diễn tường minh tri thức Tuy nhiều tinh huống, khơng có sẵn tri thức như: - Kỹ sư phần mềm cần thu nhận tri thức từ chuyên gia lĩnh vực 124 - Cần biết luật mơ tả lĩnh vực cụ thể Bài tốn khơng biểu diễn tường minh theo luật, kiện hay quan hệ Do cần phát triển hệ thống học từ tập ví dụ Có hai tiếp cận cho hệ thống học học từ ký hiệu học từ liệu số Học từ ký hiệu bao gồm việc hình thức học, sửa chữa luật tường minh, kiện quan hệ Học từ liệu số áp dụng cho hệ thống mơ hình dạng số liên quan đến kỹ thuật nhằm tối ưu tham số Học theo dạng số bao gồm mạng neural nhân tạo, thuật giải di truyền, toán tối ưu truyền thống Các kỹ thuật học theo số không tạo CSTT tường minh 7.1.2 Các hình thức học Có thể phân chia loại học sau: a Học vẹt Hệ tiếp nhận khẳng định định Khi hệ tạo định không đúng, hệ đưa luật hay quan hệ mà hệ sử dụng Hình thức học vẹt nhằm cho phép chuyên gia cung cấp tri thức theo kiểu tương tác b Học cách dẫn Thay đưa luật cụ thể cần áp dụng vào tình cho trước, hệ thống cung cấp dẫn tổng quát Ví dụ: "gas bị thoát từ van thay vỡ thoỏt từ ống dẫn" Hệ thống phải tự đề cách biến đổi từ trừu tượng đến luật khả dụng c Học qui nạp Hệ thống cung cấp tập ví dụ kết luận rút từ ví dụ Hệ liên tục lọc luật quan hệ nhằm xử lý vớ dụ d Học tương tự Hệ thống cung cấp đáp ứng cho tác vụ tương tự khơng giống Hệ thống cần làm thích ứng đáp ứng trước nhằm tạo luật có khả áp dụng cho tình e Học dựa trờn giải thớch Hệ thống phân tích tập lời giải ví dụ (và kết quả) nhằm ấn định khả sai tạo giải thích dùng để hướng dẫn cách giải tốn tương lai 125 f Học dựa tình Bấy hệ thống lập luận lưu trữ với kết cho dù hay sai Khi gặp tình mới, hệ thống làm thích nghi hành vi lưu trữ với tình g Khám phá hay học khơng giám sát Thay có mục tiêu tường minh, hệ khám phá liên tục tìm kiếm mẫu quan hệ liệu nhập Các ví dụ học khơng giám sát bao gồm gom cụm liệu, học để nhận dạng đặc tính cạnh từ điểm ảnh 7.2 Cây định danh Cây định danh công cụ phổ biến nhiều dạng ứng dụng, với chế rút trích luật nhân xác định mẫu liệu 7.2.1 Thí dụ giới thực thu gọn Tưởng tượng có liệu toán đánh giá độ rám nắng nơi nghỉ mát Có người vui ngăm đen, có người rát rộp da Dữ liệu quan sát nhóm người ghi lại theo bảng sau TT Tên người Hoa Lan Xuân Hạ Thu Đông Mơ Đào Màu tóc Chiều cao Cân nặng Đen Đen Râm Đen Bạc Râm Râm Đen Tầm thước Cao Thấp Thấp Tầm thước Cao Tầm thước Thấp Nhẹ Vừa phải Vừa phải Vừa phải Nặng Nặng Nặng Nhẹ Dùng thuốc? Khơng Có Có Khơng Khơng Khơng Khơng Có Kết Bị rám Không Không Bị rám Bị rám Không Không Không Bảng 8.1 Số liệu quan sát tượng rám nắng Nếu có ba liệu khác màu tóc, cân nặng, chiều cao người ta dùng thuốc khơng có 3*3*3*2 = 54 tổ hợp Một người chọn xác suất khớp với mẫu 8/54 = 0.15 Xác suất cao thực tế nhiều thuộc tính nhiều giá trị khác mà thuộc tính nhận Do so sánh thuộc tính đối tượng chưa biết với thuộc tính đối tượng thống kê khơng xác Một số nhận xét việc giải toán này: - Người ta xử lý liệu khơng gian đặc tính, khơng thuộc tính quan trọng khó tìm thấy đối tượng khớp 126 - Cú thể dùng không gian hệ để lập thuộc tính liên quan thuộc tính khơng liên quan Tuy nhiên thường khơng tìm thấy lý thuyết phục để tin mơ hình phân loại cú thể diễn tả tổ hợp giá trị tập thuộc tính Mặt khác mẫu bị nhiễu, khơng thực xác giới thực - Người ta dùng thủ tục phân loại xác mẫu Khi thủ tục học mẫu với số lượng mẫu "khá đủ", thủ tục nhận đối tượng chưa biết Hình 8.1 Cây định danh (Người có tên ghi đậm người bị rám nắng ) Một cách phù hợp cho phép thực thủ tục thử nghiệm thuộc tính xếp thử nghiệm định danh Do định danh thuộc loại định, đặc tả đặc tả định Định nghĩa 8.1: Cây định danh (Identification tree) Cây định danh định, tập kết luận thiết lập ngầm định danh sách biết Cây định danh dùng để xác định người bị rám nắng với kiểm tra màu tóc Nếu thấy tóc đen người ta kiểm tra có dùng thuốc khơng? Ngược lại, tóc bạc hay râm, người ta khơng cần kiểm tra Nói chung việc chọn tiến hành loại kiểm tra phụ thuộc vào kết lần kiểm tra trước Xem ví dụ thể hình 8.1 Mỗi đối tượng đưa vào định danh xuống theo nhánh cây, tùy theo giá trị thuộc tính Cây định danh hỡnh vẽ cú thể phõn loại người sở liệu "rám nắng" vỡ người ứng với nút định danh Nút dùng cho hay nhiều người Trong hình cho thấy người bị rám nắng đánh dấu tên in đậm Người ta đưa cây, có nút ứng với người, khơng liên quan gỡ đến thuộc tính rám nắng Liệu dùng phân loại khơng? 127 So sánh định danh tổng quát, người ta thấy thứ định danh, liên quan đến rám nắng nhiều thứ hai Cây định danh tỏ biết màu túc phần lộ ỏnh nắng liờn quan trực tiếp đến tính rám nắng Làm chương trỡnh húa để đến kết luận mà khơng cần biết trước màu tóc việc dùng thuốc liên quan đến đặc tính da? Một giải đáp phát biểu Occam Phát biểu Occam dùng cho định danh: Thế giới vốn đơn giản Do định danh gồm mẫu thích hợp để định danh đối tượng chưa biết cách xác Theo phát biểu này, định danh nhỏ sau nên phù hợp 7.2.2 Phân loại đối tượng theo thuộc tính Nếu ta tìm kiếm định danh nhỏ cần có nhiều thử nghiệm thực khụng thực tế Chính mà nên dừng lại thủ tục xây dựng định danh nhỏ, khơng phải nhỏ Người ta chọn thử nghiệm cho phép chia sở liệu mẫu thành tập Trong nhiều mẫu chung loại Đối với tập có nhiều loại mẫu, dùng thử nghiệm khác để chia đối tượng không đồng thành tập gồm đối tượng đồng Xét ví dụ thể hình 8.2 Cơ sở liệu "rám nắng" chia nhỏ theo bốn thử nghiệm ứng với bốn thuộc tính: Thử nghiệm theo cân nặng tồi người ta đánh giá thử nghiệm theo tập đồng nhất, có tính chất rám nắng Sau dùng thử nghiệm này, mẫu rám nắng nằm tập Thử nghiệm theo chiều cao tốt Có hai người tập đồng Hai tập có lẫn người rám không rám nắng Thử nghiệm việc dùng thuốc thu ba đối tượng tập đồng gồm người không rám nắng Thử nghiệm thao màu tóc tốt Trong tập đồng rám nắng có người Thu, tập đồng khơng rám nắng có ba người Đơng, Mơ Xuân 128 Hình 8.2 Bốn cách phân chia sở liệu theo bốn thuộc tính khác Theo thử nghiệm người ta sử dụng trước tiên thử nghiệm màu tóc Thử nghiệm có tập khơng đồng ứng với màu tóc, lẫn lộn người rám nắng không rám nắng Bốn người Hoa, Lan, Hạ Đào chia nhỏ Hình 8.3 Ba cách phân chia bốn người thuộc tập không đồng Sau lần chia người ta nhận thấy ba cách chia, cách chia theo việc dùng thuốc cho phép tách bốn đối tượng thành hai tập đồng 7.2.3 Độ lộn xộn tập hợp Đối với sở liệu thực, thử nghiệm cho tập đồng Với sở liệu người ta cần đo mức độ lộn xộn liệu, hay độ không đồng tập sinh Công thức lý thuyết thông tin độ lộn xộn trung bình: 129 Trong nb số mẫu nhánh b, nt tổng số mẫu, nbc số mẫu nhánh b lớp c Thực chất người ta quan tâm đến số mẫu cuối nhánh Yêu cầu nb nbc cao thử nghiệm sinh tập không đồng nhất, thấp thử nghiệm sinh tập hồn tồn thống Độ lộn xộn tính bằng: Dù công thức chưa cho thấy "sự lộn xộn", người ta dùng để đo thơng tin Để thấy khía cạnh quan tâm, giả sử có tập gồm phần tử hai lớp A B Nếu số phần tử hai lớp cân bằng, độ lộn xộn giá trị cực đại độ lộn xộn tính theo: -1/2log2 1/2 - 1/2log2 1/2 = 1/2 + /2 = Mặt khác phần tử thuộc A, B, độ lộn xộn -1log2 - 0log20 = Độ lộn xộn tập hoàn toàn thống nhất, tập hồn tồn khơng đồng Độ đo lộn xộn có giá trị từ đến Bằng công cụ này, người ta tính độ lộn xộn trung bình tập cuối nhánh sau lần thử nghiệm Độ lộn xộn trung bình= độ lộn xộn tập nhánh b Trong thí dụ trước, thử nghiệm màu tóc chia sở liệu thành ba phần Tập tóc đen có hai người rám nắng hai người khơng rám nắng Tập tóc bạc có người rám nắng Trong tập tóc râm, ba người khơng rám Độ lộn xộn trung bình tính cho kết 0.5 4/8(-2/4log 2/4 - 2/4 log2 2/4) + 1/8*0 + 3/8*0 = 0.5 Thực tính tốn tương tự: Thử nghiệm theo Màu tóc Chiều cao Cân nặng Dùng thuốc 130 Độ lộn xộn 0.50 0.69 0.94 0.61 Bảng 8.2 Lựa chọn cách phân chia sở liệu theo độ đo lộn xộn Do thử nghiệm theo màu tóc gây lộn xộn nhất, người ta dùng làm thử nghiệm Tương tự, sau làm thử nghiệm người ta làm thử nghiệm việc dùng thuốc, tính tốn: Thử nghiệm theo Chiều cao Cân nặng Dùng thuốc Độ lộn xộn 0.5 1.0 0.0 Bảng 8.3 Lựa chọn Vậy để tạo định danh, người ta dùng thủ tục SINH trình bày sau: Thủ tục SINH dùng định danh: Cho đến nút ghi tên phần tử tập mẫu đồng nhất, thực hiện: Chọn nút ứng với tập mẫu không đồng Thay nút nút thử nghiệm cho phép chia tập không đồng thành tập khơng đồng nhất, dựa theo tính tốn độ lộn xộn 7.2.4 Chuyển sang luật Một dựng định danh, muốn chuyển tri thức sang dạng luật đơn giản Người ta theo nhánh cây, từ gốc đến nút lá, lấy thử nghiệm làm giả thiết phân loại nút làm kết luận Ví dụ: Các tri thức thí dụ rám nắng nghỉ mát phần viết thành luật: IF Tóc đen Người dùng thuốc THEN Khơng IF Người tóc đen Không dùng thuốc THEN Họ bị rám nắng IF Người tóc bạc THEN Bị rám nắng 131 IF Người tóc râm THEN Khơng a Lược bỏ giả thiết không cần thiết luật Sau thu luật chuyển từ định danh, bỏ luật không cần thiết để đơn giản tập luật Người ta kiểm tra giả thiết bỏ mà không thay đổi tác dụng luật mẫu Ví dụ: Xét luật luật trên: IF Tóc đen Người dùng thuốc THEN Khơng Giả thiết có hai phần Nếu bỏ phần đầu, điều kiện "dùng thuốc" Theo mẫu, người dùng thuốc có Lan, Xuân Đào Không trái với phần kết luận cả, tức không bị rám nắng Do người ta bỏ phần giả thiết đầu, thu được: IF Người dùng thuốc THEN Khơng Để suy luận dễ dàng người ta thường đưa bảng ngẫu nhiên Sở dĩ gọi kết tùy thuộc vào thuộc tính Loại người Khơng Bị rám Người có tóc đen Người tóc khơng đen Bảng 8.4 Bảng ngẫu nhiên theo loại tóc người dùng thuốc Trong bảng người ta thấy số người dùng thuốc có tóc đen, khơng đen số người bị rám nắng, không rám Bảng cho thấy tri thức màu tóc khơng định đến việc họ bị rám nắng Quay lại luật bỏ phần giả thiết thứ hai "dùng thuốc", người ta thấy số bốn người tóc đen Hoa, Lan, Hạ Đào, có hai người dùng thuốc mà bị rám nắng Còn bảng ngẫu nhiêu cho biết: Dùng thuốc? Cú dựng Khụng dựng Không Bị rám Bảng 8.5 Bảng ngẫu nhiên theo việc dùng thuốc người tóc đen 132 Như việc dùng thuốc có tác dụng người tóc đen Các mẫu người tóc đen khơng rám nắng họ dùng thuốc Bởi ý định bỏ giả thiết khơng thực Ví dụ: Luật thứ hai tập luật: IF Người tóc den Khơng dùng thuốc THEN Họ bị rám nắng Tương tự ví dụ trên, người ta dự tính bỏ giả thiết đầu hai giả thiết Bảng ngẫu nhiên cho thấy: Loại người Người có tóc đen Người tóc khơng đen Khơng Bị rám Bảng 8.6 Bảng ngẫu nhiên theo loại tóc người không dùng thuốc Như giả thiết quan trọng Thiếu người ta khơng thể đảm bảo việc khớp để kết luận không bị rám nắng Nếu xét tiếp giả thiết lại, số bốn người tóc đen có hai bị rám hai không Bảng ngẫu nhiên cho thấy: Dùng thuốc? Có dùng Khơng dùng Khơng Bị rám Bảng 8.7 Bảng ngẫu nhiên theo việc dùng thuốc người tóc đen Nội dung bảng cho thấy bỏ giả thiết Luật khơng cần đơn giản Ví dụ: Xét hai luật cịn lại Chúng có giả thiết Việc bỏ giả thiết không Các bảng ngẫu nhiên cho tri thức b Lược bỏ luật thừa Phần đơn giản hóa luật riêng rẽ Nhìn tổng thể, chúng cần tính giản Các luật không cần thiết cần bỏ Quả thật có luật số bốn luật thu bị bỏ Ví dụ: Bốn luật thu gồm có: 133 IF Người tóc đen khơng dùng thuốc THEN Họ bị rám nắng IF Người dùng thuốc THEN Khơng IF Người tóc bạc THEN Bị rám nắng IF Người tóc râm THEN Khơng Hai luật có kết luận "rám nắng" hai luật khẳng định "khơng cả" Người ta thay hai luật khẳng định "rám nắng" luật Gọi luật mặc định Luật mặc định luật dùng khơng có luật Do có hai kết luận, có hai khả luật mặc định: IF Khơng có luật THEN Người bị rám nắng IF Khơng có luật THEN Khơng Chắc chắn dùng hai luật được! Cả hai luật ứng với hai luật khác Cần chọn luật mặc định luật quét kết luận chung tập mẫu, tức "khơng cả" Thí dụ chọn: IF Người tóc đen Khơng dùng thuốc THEN Họ bị rám nắng IF Người tóc bạc THEN Bị rám nắng IF Khơng có luật THEN Khơng Một cách khác chọn luật mặc định không dựa vào số mẫu thu được, mà dựa vào số giả thiết luật, người ta có tập luật sau: IF Người dùng thuốc 134 THEN Khơng IF Người tóc râm THEN Khơng IF Khơng có luật THEN Người bị rám nắng Tóm lại, để chuyển định danh tập luật, thực thủ tục tên CAT sau: Dùng thủ tục CAT cho phép tạo nên luật từ định danh: Tạo luật từ nhánh gốc - định danh Đơn giản hóa luật cách khử giả thiết khơng có tác dụng kết luận luật Thay luật có chung kết luận luật mặc định Luật kích hoạt khơng có luật hoạt động Khi có nhiều khả năng, dùng phép may rủi để chọn luật mặc định 7.3 Thuật giải học quy nạp ILA Thuật giải ILA (Inductive Learning Algorithm) dùng để xác định luật phân loại cho tập hợp mẫu học Thuật giải thực theo chế lặp, để tìm luật riêng đại diện cho tập mẫu lớp Sau xác định luật, ILA loại bỏ mẫu liên quan khỏi tập mẫu, đồng thời thêm luật vào tập luật Kết có danh sách có thứ tự luật không định Các ưu điểm thuật giải trình bày sau: - Dạng luật phù hợp cho việc khảo sát liệu, mô tả lớp cách đơn giản để dễ phân biệt với lớp khác - Tập luật thứ tự, riêng biệt – cho phép quan tâm đến luật thời điểm Khác với việc xử lý luật theo phương pháp định, vốn phức tạp trường hợp nút trở nên lớn 7.3.1 Xác định liệu Tập mẫu liệt kê bảng, với dũng tương ứng mẫu, cột thể thuộc tính mẫu Tập mẫu có m mẫu, mẫu gồm k thuộc tính, có thuộc tính định Tổng số n giá trị thuộc tính số lớp tập mẫu Tập luật R cá giá trị khởi tạo f 135 Tất cột bảng ban đầu chưa đánh dấu (kiểm tra) 7.3.2 Thuật giải ILA Bước 1: Chia bảng m mẫu ban đầu thành n bảng Mỗi bảng ứng với giá trị thuộc tính phân lớp tập tập mẫu (* thực bước đến cho bảng con*) Bước 2: Khởi tạo đếm kết hợp thuộc tính j, j=1 Bước 3: Với bảng khảo sát, phân chia danh sách thuộc tính theo tổ hợp phân biệt, tổ hợp ứng với j thuộc tính phân biệt Bước 4: Với tổ hợp thuộc tính, tính số lượng giá trị thuộc tính xuất theo tổ hợp thuộc tính dịng chưa đánh dấu bảng xét (mà đồng thời không xuất với tổ hợp thuộc tính bảng cịn lại) Gọi tổ hợp (trong bảng con) có số lần xuất nhiều tổ hợp lớn Bước 5: Nếu tổ hợp lớn f, tăng j lên quay lại bước Bước 6: Đánh dấu dòng thoả tổ hợp lớn bảng xử lý theo lớp Bước 7: Thêm luật vào tập luật R, với vế trái tập thuộc tính tổ hợp lớn (kết hợp thuộc tính tốn tử AND) vế phải là giá trị thuộc tính định tương ứng Bước 8: Nếu tất dịng đánh dấu phân lớp, tiếp tục thực từ bước cho bảng lại Ngược lại (nếu chưa đánh dấu hết dịng) quay lại bước Nếu tất bảng xét kết thúc, kết thu tập luật cần tìm 7.3.3 Mơ tả thuật giải ILA ILA thuật giải đơn giản rút trích luật dẫn từ tập mẫu Mỗi mẫu mô tả dạng tập xác định thuộc tính, thuộc tính ứng với vài giá trị Để minh họa thuật giải ILA, sử dụng tập mẫu cho bảng 7.8, gồm có mẫu (m=7), thuộc tính (k=3), thuộc tính định (phân lớp) có hai giá trị {yes, no} (n=2) Trong ví dụ này, "Size", "Color" "Shape" thuộc tính với nhóm giá trị {small, medium, large}, {red, blue, green}, {brick, wedge, sphere, pillar} 136 Mẫu số Size medium small small large large large large Color blue red red red green red green Shape brick wedge sphere wedge pillar pillar sphere Decision yes no yes no yes no yes Bảng 8.8 Tập mẫu học cho toán phân lớp đối tượng Do n=2, bước ta chia tập mẫu thành hai bảng bảng 7.9 Bảng Mẫu số cũ/ 1 Bảng Mẫu số cũ/ Size Color Shape Decision medium small large large blue red green green brick sphere pillar sphere yes yes yes yes Size Color Shape Decision small large large red red red wedge wedge pillar no no no Bảng 8.9 Chia thành hai bảng theo thuộc tính Decision Áp dụng bước thuật giải vào bảng thứ bảng 7.9 Với j=1, danh sách tổ hợp thuộc tính gồm có {Size}, {Color}, {Shape} Với tổ hợp {Size}, giá trị thuộc tính "medium" xuất bảng thứ khơng có bảng thứ hai, giá trị tổ hợp lớn "medium" Bởi giá trị thuộc tính "small" "large" xuất hai bảng con, nên không xét bước Với tổ hợp {Size}, giá trị thuộc tính "medium" 1, ta xét tiếp cho tổ hợp {Color} giá trị tổ hợp lớn 2, ứng với thuộc tính "green", cịn thuộc tính "blue" Tương tự vậy, với tổ hợp {Shape}, ta có "brick" xuất lần, "sphere" hai lần Đến cuối bước 4, ta có tổ hợp {Color} với thuộc tính "green" {Shape} với thuộc tính "sphere" có số lần xuất lớn Thuật toán mặc định chọn trường hợp thứ để xác định luật tổ hợp lớn Dũng đánh dấu phân lớp, ta có luật dẫn sau: Rule 1: IF color green THEN decision yes Ta tiếp tục thực từ bước đến cho mẫu lại (chưa đánh dấu) bảng (tức dòng 2) Áp dụng tương tự trên, ta thấy giá trị thuộc tính 137 "medium" {Size}, "blue" "Color", "brick" "sphere" {Shape} xuất lần Bởi số lần xuất giống nhau, thuật giải áp dụng luật mặc định chọn trường hợp Ta có thêm luật dẫn sau: Rule 2: IF size medium THEN decision yes Đánh dấu cho dũng bảng thứ Tiếp tục áp dụng bước đến dòng lại (tức dịng 2) Giá trị thuộc tính "sphere" {Shape} xuất lần, ta có luật dẫn thứ ba: Rule 3: IF shape sphere THEN decision yes Dòng đánh dấu Như vậy, tất dịng bảng đánh dấu, ta chuyển qua xử lý tiếp bảng Thuộc tính "wedge" {Shape} xuất hai lần dòng bảng Đánh dấu dòng với luật dẫn thứ tư sau: Rule 4: IF shape wedge THEN decision no Với dòng lại (tức dòng 3) bảng 2, ta có thuộc tính {Size} với giá trị "large" có xuất bảng Do đó, theo thuật giải, ta loại bỏ trường hợp Tương tự cho giá trị "red" {Color} "pillar" {Shape} Khi đó, ILA tăng j lờn 1, khởi tạo tổ hợp thuộc tính {Size Color}, {Size Shape}, {Color Shape} Các tổ hợp thứ thứ ba thỏa mãn điều kiện không xuất bảng với cặp thuộc tính có dịng Theo luật mặc định, ta chọn luật theo trường hợp thứ Đánh dấu dũng này, ta có thêm luật dẫn thứ 5: Rule 5: IF size large AND color red THEN decision no Bởi lúc tất dịng bảng hai đầu đánh dấu phân lớp, đồng thời khơng cịn bảng chưa xét, thuật giải kết thúc 7.3.4 Đánh giá thuật giải Số lượng luật thu xác định mức độ thành cơng thuật giải Đây mục đích tốn phân lớp thơng qua tập mẫu học Một vấn đề để đánh giá hệ học quy nạp khả hệ thống phân lớp mẫu đưa vào sau Thuật giải ILA đánh giá mạnh hai thuật giải tiếng phương pháp học quy nạp trước ID3 AQ, thử nghiệm trờn số tập mẫu Balloons, Balance, Tic-tac-toe (lấy từ Kho Dữ liệu Máy học Giả thuyết - Đại học California Irvine) 138 ... đến thời gian chuyên gia Do mà nhìn chung hệ chuyên gia cần đến tính sẵn sàng chuyên gia - Tính hợp tác 22 Thái độ hợp tác chuyên gia yếu tố sống thành công đề án hệ chuyên gia Nếu chuyên gia cảm... THIỆU VỀ HỆ CHUYÊN GIA 1.1.Giới thiệu chung 1.1.1 Hệ chuyên gia? 1.1.2 Sự phát triển công nghệ hệ chuyên gia 11 1.1.3 Các lĩnh vực ứng dụng hệ chuyên gia ... đặt hệ chuyên gia Các tri thức chuyên gia tổ chức dạng mà hệ chuyên gia tham chiếu thuận tiện Cụ thể tri thức phương pháp giải cấu trúc theo dạng mà hệ chuyên gia dùng để giải vấn đề chuyên gia

Ngày đăng: 04/01/2023, 22:09

Xem thêm:

w