1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài tập nhóm hệ cơ sở tri thức đề tài hệ học

31 1K 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 31
Dung lượng 552,51 KB

Nội dung

Bài tập nhóm hệ cơ sở tri thức đề tài hệ học

TRƯỜNG ĐẠI HỌC NHA TRANG KHOA CÔNG NGHỆ THÔNG TIN * BÀI TẬP NHÓM HỆ CƠ SỞ TRI THỨC Đề tài: HỆ HỌC Giảng viên hướng dẫn: Bùi Đức Dương Sinh viên thực hiện: Lớp: 52CNTT Năm 2013 Tống Đức Nam – 52131893 Nguyễn Thị Ngọc – 52131898 Trần Thị Trầm – 52131924 Nguyễn Thị Ánh Trúc – 52131927 Trần Thị Như Ý – 52131944 Bài tập nhóm - Học phần Hệ cơ sở tri thức MỤC LỤC LỜI GIỚI THIỆU Từ khi các hệ cơ sở trí thức ra đời cho đến nay, người ta không ngừng thực hiện các công trình nghiên cứu để đưa tư tưởng nghiên cứu cùng với máy tính ứng dụng vào giải quyết các công việc trong thực tiễn đời sống. Một trong những nguyên nhân làm cho các hệ cơ sở tri thức phổ biến trong thời đại hiện nay là việc làm cho máy tính trở nên thông minh hơn, nói cụ thể hơn là người ta tìm cách tạo ra các chương trình thông minh hơn có khả năng giải quyết các vấn đề thực tế như cách giải quyết của con người. việc học chương trình máy tính ngày càng biến hóa và phát triển thích ứng với môi trường và yêu cầu phức tạp của xã hội hiện nay. Bài báo cáo sau đây về hệ học trong hệ cơ sở tri thức, đó là việc học bằng phương pháp xây dựng cây định danh. Bài toán được đặt ra là từ một mẫu cơ sở dữ liệu có sẳn, máy tính có thể phát hiện ra tính quy luật trong mẫu dữ liệu đó bằng phương pháp xây dựng cây định danh và nhờ đó giúp con người đưa ra các quyết định nhanh chóng và chuẩn xác. Trong một bài toán của hệ học, đầu vào là một tập dữ liệu huấn luyện bao gồm các mẫu dữ liệu. Mỗi mẫu dữ liệu bao gồm một tập giá trị ứng với các thuộc tính. Tập thuộc tính được chia làm hai phần: thuộc tính quan sát và thuộc tính kết quả. Mục tiêu của học máy là tìm một ánh xạ từ thuộc tính quan sát vào thuộc tính kết quả (tìm moi quan hệ giữa thuộc tính quan sát và thuộc tính kết quả) ứng với tập dữ liệu huấn luyện. Ánh xạ này sẽ được áp dụng lên những mẫu quan sát mới để rút ra kết quả tương ứng. Công việc của từng thành viên STT Thành viên Nội dung được phân công Tỷ lệ 1 Tống Đức Nam Demo + Ứng dụng 20% 2 Nguyễn Thị Ngọc Độ bất định + Ứng dụng 20% 3 Trần Thị Trầm ILA + Ứng dụng 20% 4 Nguyễn Thị Ánh Trúc Các hình thức học + nơron + Ứng dụng 20% 2 Hệ học 2 Bài tập nhóm - Học phần Hệ cơ sở tri thức 5 Trần Thị Như Ý Cây định danh + Quinlan + Ứng dụng 20% Cộng 100% Danh mục các hình Danh mục các bảng PHẦN I. LÝ THUYẾT I. HỆ HỌC: Thuật ngữ "học" là tiếp thu tri thức. Có hai tiếp cận cho hệ thống học: – Học từ ký hiệu: bao gồm việc hình thức hóa, sửa chữa các luật tường minh, sự kiện và các quan hệ. – Học từ dữ liệu số: được áp dụng cho những hệ thống được mô hình dưới dạng số liên quan đến các kỹ thuật nhằm tối ưu các tham số. Học theo dạng số bao gồm mạng Neural nhân t ạo, thuật giải di truyền, bài toán tối ưu truyền thống. Các kỹ thuật học theo số không tạo ra CSTT tường minh. Quá trình học diễn ra dưới nhiều hình thức như: 3 Hệ học 3 Bài tập nhóm - Học phần Hệ cơ sở tri thức 1. Học vẹt: Hệ tiếp nhận các khẳng định của các quyết định đúng. Khi hệ tạo ra một quyết định không đúng, hệ sẽ đưa ra các luật hay quan hệ đúng mà hệ đã sử dụng. Hình thức học vẹt nhằm cho phép chuyên gia cung cấp tri thức theo kiểu tương tác. 2. Học bằng cách chỉ dẫn: Thay vì đưa ra một luật cụ thể cần áp dụng vào tình huống cho trước, hệ thống sẽ được cung cấp bằng các chỉ dẫn tổng quát. Ví dụ: "gas hầu như bị thoát ra từ van thay vì thoát ra từ ống dẫn". Hệ thống phải tự mình đề ra cách biến đổi từ trừu tượng đến các luật khả dụng. 3. Học bằng qui nạp: Hệ thống được cung cấp một tập các ví dụ và kết luận được rút ra từ từng ví dụ. Hệ liên tục lọc các luật và quan hệ nhằm xử lý từng ví dụ mới. 4. Học bằng tương tự: Hệ thống được cung cấp đáp ứng đúng cho các tác vụ tương tự nhưng không giống nhau. Hệ thống cần làm thích ứng đáp ứng trước đó nhằm tạo ra một luật mới có khả năng áp dụng cho tình huống mới. 5. Học dựa trên giải thích: Hệ thống phân tích tập các lời giải ví dụ (và kết quả) nhằm ấn định khả năng đúng hoặc sai và tạo ra các giải thích dùng để hướng dẫn cách giải bài toán trong tương lai. 6. Học dựa trên tình huống: Bất kỳ tính huống nào được hệ thống lập luận đều được lưu trữ cùng với kết quả cho dù đúng hay sai. Khi gặp tình huống mới, hệ thống sẽ làm thích nghi hành vi đã lưu trữ với tình huống mới. 7. Khám phá hay học không giám sát: Thay vì có mục tiêu tường minh, hệ khám phá liên tục tìm kiếm các mẫu và quan hệ trong dữ liệu nhập. Các ví dụ về học không giám sát bao gồm gom cụm dữ liệu, học để nhận dạng các đặc tính cơ bản như cạnh từ các điểm ảnh. Ví dụ: - Hệ MYCIN. - Mạng Neural nhân tạo: Mạng neuron sử dụng một hình thức học có sự hướng dẫn. - Thuật toán học Quinland. - Bài toán nhận dạng. 4 Hệ học 4 Bài tập nhóm - Học phần Hệ cơ sở tri thức - Máy chơi cờ carô, cờ tướng II. CÂY ĐỊNH DANH: Cây định danh là cây mà nếu ta đi từ nút gốc đến các lá ta sẽ có một quyết định hay một quy luật dựa vào các Thuộc tính trên đường đi từ gốc đến lá, như vậy mỗi đường đi từ nút gốc đến nút lá sẽ cho ra một quyết định hay một quy luật. Vì vậy người ta còn gọi cây định danh là cây quyết định. Bảng dữ liệu cây định danh luật. Bài toán học bằng phương pháp xây dựng cây định danh được phân tích và khai thác qua các bước sau đây, dựa vào bảng dữ liệu ở bảng số 1 ở phần đặt vấn đề. Người ta dựa vào ý tưởng tiếp cận hình học là phân chia không gian bài toán tạo thành một cây định danh sau đó xây dựng các phương pháp học dựa trên cây định danh đó. Cây định danh được xây dựng bằng cách tìm các quy luật của dữ liệu. Ta xét ngẫu nhiên qua từng thuộc tính rồi phân nhóm kết quả theo từng giá trị của Thuộc tính Tên Vỏ Màu Bên trong Kích thước Độc A Có gai Nâu Cứng Lớn Không B Có gai Xanh Cứng Lớn Không C Nhẵn Đỏ Mềm Lớn Có D Có gai Xanh Mềm Lớn Không E Có gai Đỏ Cứng Nhỏ Không F Nhẵn Đỏ Cứng Nhỏ Không G Nhẵn Nâu Cứng Nhỏ Không H Có gai Xanh Mềm Nhỏ Có I Nhẵn Xanh Cứng Nhỏ Có J Có gai Đỏ Cứng Lớn Không 5 Hệ học Thử Xây dựng 5 Bài tập nhóm - Học phần Hệ cơ sở tri thức K Nhẵn Nâu Mềm Lớn Không L Nhẵn Xanh Mềm Nhỏ Có M Có gai Đỏ Mềm Nhỏ Không N Nhẵn Đỏ Cứng Lớn Có O Nhẵn Đỏ Cứng Nhỏ Không P Có gai xanh Cứng Nhỏ Có Hình 1. Bảng 1Bảng số liệu Cây có độc hay không Ta có kết quả Hình 2. Hình 1Cây định danh có độc hay không III. THUẬT TOÁN QUINLAN: Là thuật toán học theo quy nạp dùng luật, đa mục tiêu. - Do Quinlan đưa ra năm 1979. - Ý tưởng: Chọn Thuộc tính quan trọng nhất để tạo cây quyết định. - Thuộc tính quan trọng nhất là Thuộc tính phân loại Bảng quan sát thành các bảng con sao cho từ mỗi bảng con này dễphân tích để tìm quy luật chung. 1. Thuật toán: Với mỗi Thuộc tính dẫn xuất A còn có thể sử dụng để phân hoạch thì ta tính: 6 Hệ học 6 Bài tập nhóm - Học phần Hệ cơ sở tri thức xây dựng các vector VA(j) = (T(j, r 1 ), T(j, r 2 ), …, T(j, r n ), ) Trong đó - r1, r2, …, rn là các giá trị Thuộc tính mục tiêu. - Thuộc tính A là Thuộc tính dẫn xuất. - T(j,r 1 )=T Aij /T Aj T Aij : tổng số phần tử trong phân hoạch có Thuộc tính A là j và Thuộc tính mục tiêu là r i . T Aj : tổng số phần tử trong phân hoạch có Thuộc tính A là j. - T(j,r1)+T(j,r2)+…+T(j,rn)=1 Vector đơn vị nếu nó có duy nhất một thành phần có giá trị 1 và những thành phần khác có giá trị 0. - Thuộc tính được chọn để phân hoạch là Thuộc tính cá nhiều vector đơn vị nhất. 2. Ví dụ: Tên Vỏ Màu Bên trong Kích thước Độc A Có gai Nâu Cứng Lớn Không B Có gai Xanh Cứng Lớn Không C Nhẵn Đỏ Mềm Lớn Có D Có gai Xanh Mềm Lớn Không E Có gai Đỏ Cứng Nhỏ Không F Nhẵn Đỏ Cứng Nhỏ Không G Nhẵn Nâu Cứng Nhỏ Không H Có gai Xanh Mềm Nhỏ Có I Nhẵn Xanh Cứng Nhỏ Có J Có gai Đỏ Cứng Lớn Không K Nhẵn Nâu Mềm Lớn Không L Nhẵn Xanh Mềm Nhỏ Có M Có gai Đỏ Mềm Nhỏ Không N Nhẵn Đỏ Cứng Lớn Có 7 Hệ học 7 Bài tập nhóm - Học phần Hệ cơ sở tri thức O Nhẵn Đỏ Cứng Nhỏ Không P Có gai xanh Cứng Nhỏ Có Hình 3. Bảng 2Bảng số liệu cây có độc hay không Thuộc tính Vỏ (2 giá trị): V Vỏ (Có gai) = (T(Có gai/Độc),T(Có gai/Không độc)) = (2/8;6/8) = (1/4;3/4); V Vỏ (Nhẵn) = (T(Nhẵn/Độc),T(Nhẵn/Không độc)) = (4/8;4/8) = (1/2;1/2); Số vectơ đơn vị : 0 Thuộc tính Màu (3 giá trị): V Màu (Nâu) = (T(Nâu/Độc),T(Nâu/Không độc)) = (0/3;3/3) = (0;1); V Màu (Xanh) = (T(Xanh/Độc),T(Xanh/Không độc)) = (4/6;2/6) = (2/3;1/3); V Màu (Đỏ) = (T(Đỏ/Độc),T(Đỏ/Không độc)) = (2/7;5/7); Số vectơ đơn vị : 1 Thuộc tính Bên trong (2 giá trị): V Bên trong (Cứng) = (T(Cứng/Độc),T(Cứng/Không độc)) = (3/10;7/10); V Bên trong (Mềm) = (T(Mềm/Độc),T(Mềm/Không độc)) = (3/6;3/6) = (1/2;1/2); Số vectơ đơn vị : 0 Thuộc tính Kích thước (2 giá trị): V Kích thước (Lớn) = (T(Lớn/Độc),T(Lớn/Không độc)) = (2/7;5/7); V Kích thước (Nhỏ) = (T(Nhỏ/Độc),T(Nhỏ/Không độc)) = (4/9;5/9); Số vectơ đơn vị : 0 Chọn Thuộc tính Màu làm Thuộc tính phân hoạch. 8 Hệ học 8 Bài tập nhóm - Học phần Hệ cơ sở tri thức Hình 4. Hình 2Cây định danh thuộc tính Màu ♦ Bảng theo Thuộc tính màu xanh: Màu Tên Vỏ Bên trong Kích thước Độc Xanh B Có gai Cứng Lớn Không Xanh D Có gai Mềm Lớn Không Xanh H Có gai Mềm Nhỏ Có Xanh I Nhẵn Cứng Nhỏ Có Xanh L Nhẵn Mềm Nhỏ Có Xanh P Có gai Cứng Nhỏ Có Hình 5. Hình 6. Bảng 3Bảng theo thuộc tính Màu Xanh Thuộc tính Vỏ (2 giá trị): V Vỏ (Có gai) = (T(Có gai/Độc),T(Có gai/Không độc)) = (2/4;2/4) = (1/2;1/2); V Vỏ (Nhẵn) = (T(Nhẵn/Độc),T(Nhẵn/Không độc)) = (2/2;0/2) = (1;0); Số vectơ đơn vị : 1 Thuộc tính Bên trong (2 giá trị): V Bên trong (Cứng) = (T(Cứng /Độc),T(Cứng /Không độc)) = (2/3;1/3); V Bên trong (Mềm) = (T(Mềm/Độc),T(Mềm/Không độc)) = (2/3;1/3) Số vectơ đơn vị : 0 Thuộc tính Kích thước (2 giá trị): V Kích thước (Lớn) = (T(Lớn/Độc),T(Lớn/Không độc)) = (0/2;2/2) = (0;1); 9 Hệ học 9 Bài tập nhóm - Học phần Hệ cơ sở tri thức V Kích thước (Nhỏ) = (T(Nhỏ/Độc),T(Nhỏ/Không độc)) = (4/4;0/4) = (1;0); Số vectơ đơn vị : 2 Chọn Thuộc tính Kích thước làm Thuộc tính phân hoạch: Hình 7. Hình 3Cây định danh thuộc tính Màu và Kích thước 1 ♦ Bảng Thuộc tính màu đỏ: Màu Tên Vỏ Bên trong Kích thước Độc Đỏ C Nhẵn Mềm Lớn Có Đỏ E Có gai Cứng Nhỏ Không Đỏ F Nhẵn Cứng Nhỏ Không Đỏ J Có gai Cứng Lớn Không Đỏ M Có gai Mềm Nhỏ Không Đỏ N Nhẵn Cứng Lớn Có Đỏ O Nhẵn Cứng Nhỏ Không Hình 8. Bảng 4Bảng theo thuộc tính Màu Đỏ Thuộc tính Vỏ (2 giá trị): V Vỏ (Có gai) = (T(Có gai/Độc),T(Có gai/Không độc)) = (2/4;2/4) = (1/2;1/2); V Vỏ (Nhẵn) = (T(Nhẵn/Độc),T(Nhẵn/Không độc)) = (0/3;3/3) = (0;1); Số vectơ đơn vị : 1 Thuộc tính Bên trong (2 giá trị): 10 Hệ học 10 [...]... khác - Ứng dụng cây định danh để dự đoán chỉ số nhóm nợ hỗ trợ quản lý rủi ro tín - dụng Ứng dụng thuật toán cây định danh vào việc hỗ trợ quyết định nhập sách trong cửa hàng sách 30 30 Hệ học Bài tập nhóm - Học phần Hệ cơ sở tri thức PHẦN II CHƯƠNG TRÌNH MINH HỌATÀI LIỆU THAM KHẢO 1 Giáo trình hệ cơ sở tri thức _ Bùi Đức Dương 2 Giáo trình các hệ cơ sở tri thức _ GS.TSKH.Hoàng Kiếm, TS Đỗ Phúc, TS.Đỗ... độ học và là lượng gia tăng trọng số tại thời điểm t Có ba thể lọai học trong các mạng neuron nhân tạo đó là học giám sát, học củng cố và học không giám sát - Học giám sát: cho tập dữ liệu vào ra mong muốn, quá trình học cập nhật các trọng số kết nối giữa các phần tử xử lý trong mạng sao cho ngõ ra that sự của mạng xấp xỉ với ngõ ra mong muốn của mạng 26 26 Hệ học Bài tập nhóm - Học phần Hệ cơ sở tri. .. Hình 10Cây định danh đầy đủ 18 18 Hệ học Bài tập nhóm - Học phần Hệ cơ sở tri thức V THUẬT TOÁN ILA Thuật giải ILA được dùng để xác định các luật phân loại cho tập hợp và các mẫu học Thuật giải này được thực hiện cơ chế lặp, để tìm luật riêng đại diện cho tập mẫu cùng lớp Sau khi xác định được luật ILA bỏ các tập mẫu liên quan khỏi tập mẫu, đồng thời thêm luật mới này vào tập luật Kết quả có được là một... 11 11 Hệ học Bài tập nhóm - Học phần Hệ cơ sở tri thức Thuộc tính Bên trong (2 giá trị): VBên trong(Cứng) = (T(Cứng/Độc),T(Cứng/Không độc)) = (1/2;1/2); VBên trong (Mềm) = (T(Mềm/Độc),T(Mềm/Không độc)) = (1/1;0/1) = (1;0); Số vectơ đơn vị : 1 Chọn Thuộc tính Vỏ làm Thuộc tính phân hoạch: Hình 11 Hình 5Cây định danh thuộc tính Màu, Kích thước, Vỏ Cây định danh kết quả: 12 12 Hệ học Bài tập nhóm - Học. .. Nhẵn Bên trong Mềm 17 Độc Có 17 Hệ học Bài tập nhóm - Học phần Hệ cơ sở tri thức N J Nhẵn Có gai Cứng Cứng Có không Hình 19 Bảng 9Bảng theo thuộc tính Màu Đỏ, Kích thước Lớn - - Thuộc tính Vỏ (2 giá trị) Tập Có gai: 0/1 bị Độc ; 1/1 Không bị độc Tập Nhẵn: 2/2 bị Độc ; 0/2 Không bị độc  E (Vỏ) = Thuộc tính Bên trong (2 giá trị) Tập Mềm: 1/1 bị Độc ; 0/1 Không bị độc Tập Cứng: 1/2 bị Độc ; 1/2 Không... thuật giải Đây chính là mục đích chính của bài toán phân lớp thông qua một tập mẫu học VI MÔ HÌNH MẠNG NEURON NHÂN TẠO: 1) Tổng quan về mạng neuron nhân tạo : Trái với mô hình học máy trên cơ sở tri thức, mô hình học máy nhờ mạng neuron nhân tạo đó là mô hình học bằng cách mô phỏng lại cấu trúc và nguyên lý làm việc của hệ neuron sinh học con người Hệ neuron sinh học con người được thừa nhận có khỏang... Lớp vào nối với các phần tử cảm 24 24 Hệ học Bài tập nhóm - Học phần Hệ cơ sở tri thức biến như tai, mắt, miệng, mũi, da vân vân, lớp ra nối với các phần tử cơ bắp như chân, tay vân vân và các lớp ẩn chứa các đơn vị xử lý xử các thông tin nhận được từ lớp vào và gởi quyết định đến lớp ra để điều khiển các phần tử cơ bắp như chân và tay vân vân Mỗi neuron sinh học có nhiều ngõ vào và một ngõ ra và ngõ... Nhẵn Bên trong Mềm 16 Kích thước Lớn Độc Có 16 Hệ học Bài tập nhóm - Học phần Hệ cơ sở tri thức E F J M N O Đỏ Đỏ Đỏ Đỏ Đỏ Đỏ Có gai Nhẵn Có gai Có gai Nhẵn Nhẵn Cứng Cứng Cứng Mềm Cứng Cứng Nhỏ Nhỏ Lớn Nhỏ Lớn Nhỏ Không Không Không Không Có Có Hình 17 Bảng 8Bảng theo thuộc tính Màu Đỏ - Thuộc tính Vỏ (2 giá trị) Tập Có gai: 0/3 bị Độc ; 3/3 Không bị độc Tập Nhẵn: 2/4 bị Độc ; 2/4 Không bị độc  E (Vỏ)... xuất Y có giá trị b nbc : tổng số phần tử có thuộc tính dẫn xuất Y có giá trị b và Thuộc tính 13 13 Hệ học Bài tập nhóm - Học phần Hệ cơ sở tri thức mục tiêu có giá trị c Dù công thức chưa cho thấy sự lộn xộn nhưng người ta dùng nó để đo độ thông tin Để thấy được các khía cạnh quan tâm, giả sử có một tập gồm các phần tử của 2 lớp A và B Nếu số phần tử của 2 lớp là cân bằng thì độ bất định là 1 và giá... thước: (2 giá trị) Tập Lớn: 2/7 bị Độc ; 5/7 Không bị độc Tập Nhỏ: 4/9 bị Độc ; 5/9 Không bị độc  E (Kích thước) = = 0,377 + 0,557 = 0,934 Vậy ta chọn Thuộc tính Màu làm Thuộc tính phân hoạch Hình 14 Hình 7Cây định danh Màu theo độ bất định Ta rút ra được luật : - Nếu Màu của quả là Nâu thì sẽ Không bị độc Từ sơ đồ trên ta có 2 bảng: 15 15 Hệ học Bài tập nhóm - Học phần Hệ cơ sở tri thức Bảng 1: Tên . truyền, bài toán tối ưu truyền thống. Các kỹ thuật học theo số không tạo ra CSTT tường minh. Quá trình học diễn ra dưới nhiều hình thức như: 3 Hệ học 3 Bài tập nhóm - Học phần Hệ cơ sở tri thức 1. Học. TRƯỜNG ĐẠI HỌC NHA TRANG KHOA CÔNG NGHỆ THÔNG TIN * BÀI TẬP NHÓM HỆ CƠ SỞ TRI THỨC Đề tài: HỆ HỌC Giảng viên hướng dẫn: Bùi Đức Dương Sinh viên. đủ 18 Hệ học 18 Bài tập nhóm - Học phần Hệ cơ sở tri thức V. THUẬT TOÁN ILA Thuật giải ILA được dùng để xác định các luật phân loại cho tập hợp và các mẫu học. Thuật giải này được thực hiện cơ chế

Ngày đăng: 23/10/2014, 07:31

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w