Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 37 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
37
Dung lượng
1,36 MB
Nội dung
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA: CÔNG NGHỆ THÔNG TIN ĐỀ CƯƠNG BÀI TẬP LỚN MÔN: HỆ CHUYÊN GIA ĐỀ TÀI: XÂY DỰNG HỆ THỐNG DỰ BÁO THỜI TIẾT DỰA TRÊN THUẬT TOÁN ID3 Giáo viên hướng dẫn: ThS Trần Hùng Cường Thành viên: Nguyễn Quang Hiển Nguyễn Văn Tùng Anh Lớp: 202010503121002 Nhóm: 16 Hà Nội – 2020 MỤC LỤC CHƯƠNG 1: TỔNG QUAN HỆ CHUYÊN GIA 1.1 Khái niệm hệ chuyên gia 1.2 Cấu trúc hệ chuyên gia 1.3 Đặc trưng ưu điểm hệ chuyên gia 1.3.1 Đặc trưng 1.3.2 Ưu điểm .6 1.4 Ứng dụng hệ chuyên gia CHƯƠNG 2: CÂY QUYẾT ĐỊNH ID3 2.1 Cây định 2.2 Thuật toán ID3 2.2.1 Entrophy đo tính khiết tập liệu 2.2.2 Độ lợi thông tin Gain 2.3 Ví dụ minh hoạ 10 CHƯƠNG 3: XÂY DỰNG ỨNG DỤNG .18 3.1 Giới thiệu toán 18 3.2 Cơ sở liệu 18 3.2.1 Các thuộc tính sử dụng để dự báo thời tiết 18 3.2.1 Dữ liệu thu thập .19 3.2.3 Hệ sở tri thức dùng để sinh định 26 3.2.4 Tập luật thu .28 3.2 Xây dựng hệ thống 29 3.2.1 Môi trường xây dựng .29 3.2.2 Xây dựng chương trình 29 3.2.3 Giao diện ứng dụng 34 KẾT LUẬN 35 TÀI LIỆU THAM KHẢO .36 CHƯƠNG 1: TỔNG QUAN HỆ CHUYÊN GIA 1.1 Khái niệm hệ chuyên gia Hệ chuyên gia hệ thống chương trình máy tính chứa thơng tin, tri thức q trình suy luận lĩnh vực cụ thể để giải vấn đề khó hóc búa địi hỏi tinh thông đầy đủ chuyên gia người giải pháp họ Nói cách khác hệ chuyên gia dựa tri thức chuyên gia người giỏi lĩnh vực quan tâm Tri thức hệ chuyên gia bao gồm kiện luật Các kiện cấu thành số nhiều thông tin, thu thập rộng rãi, công khai đồng tình chuyên gia người lĩnh vực Các luật biểu thị đốn chun mơn chuyên gia lĩnh vực Mức độ hiệu hệ chuyên gia phụ thuộc vào kích thước chất lượng sở tri thức mà hệ có Mỗi hệ chuyên gia đặc trưng cho lĩnh vực vấn đề đó, y học, tài chính, khoa học hay cơng nghệ, vv…, mà cho lĩnh vực vấn đề Hoạt động hệ chuyên gia dựa tri thức minh họa sau: 1.2 Cấu trúc hệ chuyên gia Một hệ chuyên gia kiểu mẫu gồm thành phần sau: Giao diện người, máy: Thực giao tiếp hệ chuyên gia người sử dụng Nhận thông tin từ người dùng (các câu hỏi, yêu cầu lĩnh vực) đưa lời khuyên, câu trả lời, giải thích lĩnh vực Bộ giải thích: Giải thích hoạt động hệ có yêu cầu người sử dụng Bộ thu nạp tri thức: Làm nhiệm vụ thu nhận tri thức từ chuyên gia người, từ kỹ sư tri thức người sử dụng thông qua câu hỏi yêu cầu họ, sau lưu trữ vào sở tri thức Cơ sở tri thức: Lưu trữ, biểu diễn tri thức lĩnh vực mà hệ đảm nhận, làm sở cho hoạt động hệ Cơ sở tri thức bao gồm kiện luật Mô tơ suy diễn: Làm nhiệm vụ sử lý điều khiển tri thức biểu diễn sở tri thức nhằm đáp ứng câu hỏi, yêu cầu người sử dụng Hệ quản trị sở tri thức thực chất quản lý điều khiển công việc Bộ thu nạp tri thức, Bộ giải thích, Mơ tơ suy diễn Nó phải đảm bảo yêu cầu: Giảm dư thừa tri thức, liệu Tính quán phi mâu thuẫn tri thức Tính tồn vẹn an tồn Giải vấn đề cạnh tranh Chuyển đổi tri thức Ngôn ngữ xử lý tri thức 1.3 Đặc trưng ưu điểm hệ chuyên gia 1.3.1 Đặc trưng Tách tri thức khỏi điều khiển: sở tri thức mô tơ suy diễn độc lập với Điều giúp việc phát triển, bảo trì thuận lợi Có tri thức chuyên gia: bao gồm tri thức lĩnh vực kỹ giải toán chuyên gia Tập trung nguồn chuyên gia: hệ chun gia khơng giải tốn nằm ngồi lĩnh vực Lập luận dựa ký hiệu: hệ chuyên gia biểu diễn tri thức dạng ký hiệu Có thể sử dụng với nhiều dạng tri thức khác Lập luận may rủi Khả giải vấn đề bị hạn chế Chấp nhận sai lầm 1.3.2 Ưu điểm Phổ cập: Là sản phẩm chuyên gia, phát triển không ngừng với hiệu sử dụng phủ nhận Giảm giá thành Giảm rủi ro: Giúp người tránh rủi ro môi trường nguy hiểm Tính thường trực: Bất kể lúc khai thác sử dụng Trong người mệt mỏi, nghỉ ngơi hay vắng mặt Đa lĩnh vực: Chuyên gia nhiều lĩnh vực khác khai thác đồng thời thời gian sử dụng Độ tin cậy 1.4 Ứng dụng hệ chuyên gia Hiện nay, hàng ngàn hệ chuyên gia xây dựng báo cáo thường xuyên tạp chí, sách báo hội thảo khoa học Ngồi cịn hệ chun gia sử dụng công ty, tổ chức quân mà khơng cơng bố lý bảo mật Dưới số lĩnh vực ứng dụng diện rộng hệ chuyên gia: Lĩnh vực Cấu hình Chẩn đoán Truyền đạt Kiểm tra Lập kế hoạch Dự đoán Chữa trị Ứng dụng Tập hợp thích đáng thành phần hệ thống theo cách ri Lập luận dựa chứng quan sát Dạy học kiểu thơng minh cho sinh viên học hỏi theo So sánh liệu thu thập với chuyên môn để đánh giá hiệu Lập kế hoạch theo u cầu Dự đốn hậu từ tình xảy Chữa trị định cụ thể CHƯƠNG 2: CÂY QUYẾT ĐỊNH ID3 2.1 Cây định Trong lý thuyết định, định đồ thị định hậu (bao gồm rủi ro hao phí tài nguyên) Cây định sử dụng để xây dựng kế hoạch nhằm đặt mục tiêu mong muốn Các định dùng để hỗ trợ trinh định Cây định dạng đặc biệt cấu trúc 2.2 Thuật toán ID3 Thuật toán ID3 phát triển Quinlan công bố vào cuối thập niên 70 kỷ 20 Sau đó, thuật tốn ID3 giới thiệu trình bày mục Inductrion on decision trees, machine learning năm 1986 ID3 xem cải tiến CLS với khả lựa chọn thuộc tính tốt để tiếp tục triển khai bước ID3 xây dựng định từ xuống (top – down) 2.2.1 Entrophy đo tính khiết tập liệu Được dùng để đo tính tập liệu Entropy tập S tính theo cơng thức tổng qt: Trong Pi tỷ lệ mẫu thuộc lớp i tập S mẫu kiểm tra Các trường hợp đặc biệt: TH1: Nếu tất mẫu thành viên tập S thuộc lớp Entropy(S) = TH2: Nếu tập S có số mẫu phân bố vào lớp Entropy(S) = Các trường hợp cịn lại < Entropy(S) < 2.2.2 Độ lợi thông tin Gain Độ lợi thông tin (Gain) đại lượng dùng để đo tính hiệu thuộc tính lựa chọn cho việc phân lớp Đại lượng thông qua hai giá trị Information Entropy Cho tập liệu S gồm có n thuộc tính Ai (i = 1, 2, …n) Giá trị Information thuộc tính Ai ký hiệu Information(Ai) xác định cơng thức: Giá trị Gain thuộc tính A tập S ký hiệu Gain(S, A) tính theo cơng thức sau: Trong đó: S tập hợp ban đầu với thuộc tính A Các giá trị v tương ứng giá trị thuộc tính A Sv tập hợp tập S mà có thuộc tính A mang giá trị v |Sv| số phần tử tập Sv |S| số phần từ tập S 2.3 Ví dụ minh hoạ Chúng ta xét tốn phân loại xem có tập thể dục ứng với thời tiết khơng Giải thuật ID3 học định từ tập hợp ví dụ sau: 46 24 cao nhẹ nhiều mát mẻ 47 19 thấp nhẹ mát mẻ 48 trung bình mạnh nhiều lạnh 49 27 cao mạnh nhiều mát mẻ 50 32 thấp mạnh nắng nóng 51 24 trung bình mạnh nhiều mưa 52 33 cao mạnh nhiều mát mẻ 53 22 trung bình mạnh nhiều mưa 54 10 trung bình nhẹ mát mẻ 55 23 cao nhẹ nhiều mát mẻ 56 12 cao mạnh lạnh 57 35 trung bình nhẹ nắng nóng 58 33 trung bình nhẹ nhiều mưa 59 34 cao mạnh mát mẻ 60 thấp mạnh nhiều lạnh 22 61 25 trung bình nhẹ nhiều mát mẻ 62 cao mạnh nhiều lạnh 63 cao nhẹ mát mẻ 64 36 thấp nhẹ nhiều nắng nóng 65 35 thấp mạnh nhiều nắng nóng 66 11 cao mạnh nhiều lạnh 67 22 trung bình nhẹ mát mẻ 68 24 cao mạnh mát mẻ 69 36 cao mạnh nhiều mưa 70 14 thấp mạnh nhiều lạnh 71 trung bình mạnh lạnh 72 36 trung bình mạnh nắng nóng 73 39 thấp nhiều nắng nóng 74 34 trung bình mạnh nhiều mưa 75 35 trung bình nhẹ nhiều mưa nhẹ 23 76 25 cao nhẹ nhiều mát mẻ 77 24 trung bình nhẹ nhiều mát mẻ 78 24 trung bình nhẹ mát mẻ 79 18 cao mạnh nhiều lạnh 80 28 cao mạnh mát mẻ 81 24 trung bình mạnh mát mẻ 82 15 cao mạnh nhiều lạnh 83 34 thấp nhẹ nắng nóng 84 36 thấp mạnh nắng nóng 85 37 thấp nhẹ nhiều nắng nóng 86 21 cao nhẹ mát mẻ 87 24 cao nhẹ nhiều mát mẻ 88 15 cao mạnh nhiều lạnh 89 12 trung bình mạnh lạnh 90 29 trung bình nhẹ mát mẻ 24 91 27 cao mạnh nhiều mưa 92 30 thấp mạnh nhiều nắng nóng 93 34 thấp nhẹ nắng nóng 94 17 trung bình mạnh nhiều lạnh 95 14 thấp mạnh lạnh 96 19 cao nhẹ mát mẻ 97 35 cao mạnh nhiều mát mẻ 98 34 thấp mạnh nắng nóng 99 33 thấp nhẹ nhiều nắng nóng 100 17 cao nhẹ mát mẻ 3.2.3 Hệ sở tri thức dùng để sinh định Giả sử, ta quy ước: 25 Nhiệt độ Giá trị >= 30˚C Cao >=20 ˚C =40% = km/h < 10km/h Nhẹ Ta hệ sở tri thức dùng để sinh định sau đây: Stt Nhiệt độ Độ ẩm Sức gió Mây Thời tiết cao mạnh x mát mẻ cao 26 cao cao nhẹ x nắng nóng cao trung bình x nhiều mưa cao trung bình x nắng nắng cao thấp x x nắng nóng trung bình x mạnh nhiều mưa trung bình cao nhẹ nhiều mát mẻ trung bình trung bình nhẹ nhiều mát mẻ trung bình thấp mạnh mát mẻ 10 trung bình cao nhẹ mát mẻ 11 trung bình trung bình mạnh mát mẻ 12 thấp cao mạnh x lạnh 13 thấp thấp mạnh x lạnh 14 thấp trung bình mạnh x lạnh 27 15 thấp x nhẹ nhiều lạnh 16 thấp x nhẹ mát mẻ 3.2.4 Tập luật thu Sau xử lý liệu dựa giải thuật ID3, ta thu tập luật sau đây: R1: if (Nhiệt độ = cao) and (Độ ẩm = cao) and (Gió = mạnh) then Thời tiết = mát mẻ R2: if (Nhiệt độ = cao) and (Độ ẩm = cao) and (Gió = nhẹ) then Thời tiết = nắng nóng R3: if (Nhiệt độ = cao) and (Độ ẩm = trung bình) and (Mây = nhiều) then Thời tiết = mưa R4: if (Nhiệt độ = cao) and (Độ ẩm = trung bình) and (Mây = ít) then Thời tiết = nắng nóng R4: if (Nhiệt độ = cao) and (Độ ẩm = thấp) then Thời tiết = nắng R5: if (Nhiệt độ = trung bình) and (Mây = nhiều) and (Sức gió = mạnh) then Thời tiết = mưa R6: if (Nhiệt độ = trung bình) and (Mây = nhiều) and (Sức gió = nhẹ) then Thời tiết = mát mẻ R7: if (Nhiệt độ = trung bình) and (Mây = ít) then Thời tiết = mát mẻ R8: if (Nhiệt độ = thấp) and (Gió = mạnh) then Thời tiết = lạnh R9: if (Nhiệt độ = thấp) and (Gió = nhẹ) and (Mây = nhiều) then Thời tiết = lạnh R10: if (Nhiệt độ = thấp) and (Gió = nhẹ) and (Mây = ít) then Thời tiết = mát mẻ 28 3.2 Xây dựng hệ thống 3.2.1 Môi trường xây dựng Hệ điều hành: Windows Phân loại ứng dụng: Web application Giải thuật: ID3 Ngôn ngữ cài đặt: HTML, CSS, Javascript 3.2.2 Xây dựng chương trình Hàm tính Entropy: Source Code: 29 Hàm tính Gain: 30 Source code: 31 Hàm lựa chọn thuộc tính tốt nhất: Lựa chọn thuộc tính có Gain cao làm thuộc tính tốt Source code: Thuật giải ID3: void ID3(tập_ví_dụ, tập_thuộc_tính) { If (mọi ví dụ tập_ví_dụ nằm lớp) then Return nút gắn nhãn lớp đó; Else{ If (tập_thuộc_tính rỗng) then Return nút gắn nhãn tuyển tất lớp tập_ví_dụ; Else { Chọn thuộc tính P, lấy làm gốc cho tại; Xố P khỏi tập_thuộc_tính; Với giá trị V P { Tạo nhánh gắn nhãn V; 32 Đặt vào phân_vùng v, ví dụ tập_ví_dụ có giá trị V thuộc tính P; Gọi ID3(phân_vùng, tập_thuộc_tính), gắn kết vào nhánh V; } } } } Source code: 33 3.2.3 Giao diện ứng dụng Hình 3.1 – Giao diện ứng dụng Hình 3.2 – Minh hoạ cho dự báo Hình 3.3 – Minh hoạ cho dự báo 34 KẾT LUẬN Việc thiết kế chương trình dự báo thời tiết ứng dụng giải thuật ID3 phù hợp với thể nhu cầu người mục tiêu chương trình hướng đến, để từ ta tham khảo lấy thêm ý kiến từ chuyên gia để giúp việc dự đoán hiệu xác 35 TÀI LIỆU THAM KHẢO Giáo trình Hệ Chuyên Gia : Trần Hùng Cường, Trần Thanh Hùng, NXB Khoa Học Kỹ Thuật https://www.youtube.com/watch?v=vo_OhWn8iqU https://www.youtube.com/watch?v=Qkl6DDSZzUk https://voer.edu.vn/m/tiep-can-ky-hieu-giai-thuat-quy-nap-cay-quyetdinh-id3/cb4f35f8 http://baigiang.violet.vn/present/show/entry_id/9630902 36 ... 3: XÂY DỰNG ỨNG DỤNG 17 3.1 Giới thiệu toán Bài toán: Xây dựng hệ thống dự báo thời tiết dựa thuật giải ID3 Sử dụng định giải toán Từ hệ sở chi thức cho sử dụng ID3 để tạo luật dùng để dự báo. .. vực: Chuyên gia nhiều lĩnh vực khác khai thác đồng thời thời gian sử dụng Độ tin cậy 1.4 Ứng dụng hệ chuyên gia Hiện nay, hàng ngàn hệ chuyên gia xây dựng báo cáo thường xuyên tạp chí, sách báo. .. tri thức chuyên gia: bao gồm tri thức lĩnh vực kỹ giải toán chuyên gia Tập trung nguồn chuyên gia: hệ chuyên gia không giải tốn nằm ngồi lĩnh vực Lập luận dựa ký hiệu: hệ chuyên gia biểu