1. Trang chủ
  2. » Thể loại khác

PHÂN LỚP MIỀN XÁC ĐỊNH THUỘC TÍNH TRONG BÀI TOÁN KHAI PHÁ DỮ LIỆU MỜ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

10 2 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Nội dung

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG PHÙNG THỊ NGA PHÂN LỚP MIỀN XÁC ĐỊNH THUỘC TÍNH TRONG BÀI TỐN KHAI PHÁ DỮ LIỆU MỜ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG PHÙNG THỊ NGA PHÂN LỚP MIỀN XÁC ĐỊNH THUỘC TÍNH TRONG BÀI TOÁN KHAI PHÁ DỮ LIỆU MỜ Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học: TS TRẦN THÁI SƠN THÁI NGUYÊN - 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ i LỜI CAM ĐOAN Tơi xin cam đoan cơng trình nghiên cứu riêng dƣới hƣớng dẫn trực tiếp Ts Trần Thái Sơn Mọi trích dẫn sử dụng báo cáo đƣợc ghi rõ nguồn tài liệu tham khảo theo qui định Mọi chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tơi xin chịu hồn tồn trách nhiệm Thái Ngun, ngày … tháng … năm 2014 Tác giả Phùng Thị Nga Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ ii LỜI CẢM ƠN Luận văn đƣợc viết dƣới hƣớng dẫn tận tình nghiêm khắc TS Trần Thái Sơn Lời đầu tiên, tác giả xin bày tỏ lịng kính trọng biết ơn sâu sắc tới thầy Xin chân thành gửi lời cảm ơn tới thầy đóng góp q báu q trình nghiên cứu nhƣ thời gian hoàn thành luận văn Tác giả xin chân thành gửi lời cảm ơn đến Phòng Đào tạo sau đại học tạo điều kiện thuận lợi trình học tập, nghiên cứu hoàn thành luận văn, đảm bảo tiến độ Cuối cùng, tác giả xin chân thành cảm ơn thành viên gia đình, ngƣời ln dành cho tác giả tình cảm nồng ấm sẻ chia lúc khó khăn sống, ln động viên giúp đỡ tác giả q trình nghiên cứu Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT iv DANH MỤC CÁC HÌNH v MỞ ĐẦU CHƢƠNG KHAI PHÁ TRI THỨC VỚI HỆ LUẬT MỜ 1.1 Khai phá tri thức từ sở liệu với hệ luật mờ .4 1.2 Khai phá tri thức theo cách tiếp cận lý thuyết tập mờ 1.2.1 Kiến thức sở tập mờ 1.2.2 Khai phá tri thức với thông tin mờ .6 1.3 Khai phá tri thức theo cách tiếp cận lý thuyết Đại số gia tử .12 1.3.1 Kiến thức sở ĐSGT 12 1.3.2 Khai phá tri thức với thông tin mờ theo cách tiếp cận ĐSGT 15 CHƢƠNG BÀI TOÁN PHÂN CHIA MIỀN XÁC ĐỊNH THUỘC TÍNH 22 2.1 Bài tốn phân chia miền xác định thuộc tính .22 2.2 Các phƣơng pháp giải toán phân chia miền xác định thuộc tính 27 2.2.1 Phƣơng pháp tiền định 27 2.2.2 Tối ƣu hóa hàm thuộc MF (Membership functions) 28 CHƢƠNG ĐẠI SỐ GIA TỬ, CÁCH TIẾP CẬN MỚI CHO BÀI TOÁN PHÂN LỚP MIỀN XÁC ĐỊNH THUỘC TÍNH 41 3.1 Giải toán phân chia miền xác định thuộc tính sử dụng khoảng tính mờ giá trị định lƣợng ngữ nghĩa 41 3.2 Thuật toán giải toán phân chia miền xác định thuộc tính theo cách tiếp cận ĐSGT .41 KẾT LUẬN 49 TÀI LIỆU THAM KHẢO 49 PHỤ LỤC: CHƢƠNG TRÌNH TỐI ƢU HÓA THAM SỐ TẬP MỜ .52 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ iv DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Các ký hiệu AX Đại số gia tử tuyến tính AX Đại số gia tử tuyến tính đầy đủ A X2 Đại số gia tử µ(h), fm(x) Độ đo tính mờ gia tử h hạng từ xυ Giá trị định lƣợng theo điểm giá trị ngôn ngữ µA(v) Hàm định lƣợng giá trị ngôn ngữ A (đo độ thuộc v) sm(x,y) Hàm xác định mức độ gần hai hạng từ x y ℑ Khoảng tính mờ giá trị ngơn ngữ Xk Tập hạng từ có độ dài k X(k) Tập hạng từ có độ dài khơng q k Ik Hệ khoảng tính mờ mức k giá trị ngơn ngữ I(k) Hệ khoảng tính mờ từ mức đến mức k giá trị ngôn ngữ Tg Khoảng tƣơng tự bậc g giá trị ngôn ngữ S(k) Hệ khoảng tƣơng tự mức k giá trị ngôn ngữ Các chữ viết tắt CSDL Cơ sở liệu ĐSGT Đại số gia tử ĐS2GT Đại số gia tử ĐLNN Định lƣợng ngữ nghĩa RB Rule-Base FB Fuzzy Base HAFRG Hedge Algebras based Fuzzy Rules Generation Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ v MOGA Thuật giải di truyền đa đối tƣợng NST Nhiễm sắc thể DANH MỤC CÁC HÌNH Hình 1.1 Độ đo tính mờ biến TRUTH 17 Hình 1.2 Khoảng tính mờ hạng từ biến TRUTH 20 Hình 2.1 Lƣới phân hoạch mờ miền thuộc tính 25 Hình 2.2 Phƣơng pháp phân hoạch mờ scatter-partitio 27 Hình 2.3 Tập MF thuộc tính Ij 30 Hình 2.4 Hai dạng khơng thích hợp MF 30 Hình 3.1 Tập hàm thuộc cho thuộc tính AGE 46 Hình 3.2 Tập hàm thuộc cho thuốc tính Hours 47 Hình 3.3 Tập hàm thuộc cho thuốc tính IncFam 47 Hình 3.4 Tập hàm thuộc cho thuốc tính IncHead 48 Hình 3.5 Tập hàm thuộc cho thuốc tính MARCHWGT 48 DANH MỤC BẢNG BIỂU Bảng 2.1: Dữ liệu mờ từ liệu bảng 36 Bảng 2.2: Cơ sở liệu 36 Bảng 3.1 Cơ sở liệu 44 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ MỞ ĐẦU Lý chọn đề tài Trong lĩnh vực khai phá liệu, khó khăn thƣờng gặp hệ thống phải xử lý khối lƣợng thơng tin lớn, địi hỏi phải có thuật toán hữu hiệu để khai thác tri thức ngầm chứa khối thơng tin to lớn Một toán đặt lĩnh vực nghiên cứu cho trƣớc Cơ sở liệu (thƣờng CSDL số, tức giá trị CSDL số thực), từ đó, phƣơng pháp xử lý định, rút hệ tri thức phản ánh quy luật chứa CSDL số Các quy luật biểu diễn dƣới dạng hệ luật IF X is A and Y is B THEN Z is C, X, Y, Z biến mờ (thƣờng biến ngôn ngữ), A, B, C giá trị biến ngôn ngữ (thƣờng tập mờ) Thí dụ luật IF đường xa tốc độ di chuyển trung bình THEN thời gian đến đích lâu Để sinh luật nhƣ vậy, ta phải chuyển hóa miền giá trị thuộc tính “khoảng cách”, “tốc độ”, “thời gian” thành miền mờ, hay nói cách khác phân chia miền giá trị thành miền mờ cho bƣớc xử lý Chẳng hạn, chia miền giá trị thuộc tính độ dài (có giá trị min, max tƣơng ứng chẳng hạn 0km, 200km) thành miền mờ “gần” (0km- 50km), “trung bình” (51km-100km), “xa” (100km-200km) Trong lý thuyết tập mờ, miền mờ nhƣ đƣợc coi tập mờ ứng với hàm thuộc (MF- membership function) nhằm xác định độ “thuộc” giá trị biến vào tập mờ cho Khi đó, giá trị thuộc tính CSDL ứng với tập giá trị hàm thuộc ứng với với tập mờ thuộc tính Và ta xây dựng hệ luật mờ dựa việc xử lý tập giá trị độ thuộc thay xử lý thân giá trị ban đầu CSDL Việc xây dựng MF phân chia miền xác định thuộc tính bƣớc nhƣng quan trọng quy trình xây dựng hệ luật mờ có sở phân chia hợp lý miền xác định thuộc tính ta có tập mờ ngơn ngữ phản ánh Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ tƣơng đối xác ngữ nghĩa định tính nhãn ngơn ngữ dùng hệ luật đƣợc xây dựng tiếp theo.Phƣơng pháp tiếp cận theo lý thuyết tập mờ cho ta cách xử lý liệu mềm dẻo, nhanh chóng so với phƣơng pháp xử lý số cổ điển Tuy vậy, nhiều vấn đề đặt nhƣ việc phân chia miền mờ cho hợp lý, xây dựng đƣợc hàm thuộc nhanh chóng, phù hợp cách xử lý hàm thuộc để giữ đƣợc ngữ nghĩa gắn với chúng Đại số gia tử (ĐSGT) đời dựa cấu trúc thứ tự tốt tập giá trị ngơn ngữ biến ngơn ngữ khắc phục phần điểm yếu Luận văn đặt mục tiêu sử dụng cách tiếp cận ĐSGT việc xác định MF tối ƣu phân chia miền mờ cho thuộc tính CSDL, để xây dựng đƣợc hệ luật mờ tốt bƣớc nhằm giải toán quan tâm lĩnh vực khai phá liệu hay điều khiển mờ Đƣợc đồng ý trƣờng Đại học Công nghệ thông tin Truyền thông với hƣớng dẫn Thầy giáo em xin mạnh dạn nhận đề tài: “Phân lớp miền xác định thuộc tính toán khai phá liệu mờ” làm đề tài luận văn Đối tƣợng phạm vi nghiên cứu Đối tƣợng nghiên cứu luận văn sở liệu đầu vào dùng để khai phá liệu Lý thuyết tập mờ đại số gia tử đƣợc nghiên cứu nhƣ công cụ để giải toán đặt Hƣớng nghiên cứu đề tài Luận văn nghiên cứu phƣơng pháp giải tốn phân lớp miền xác định thuộc tính tác giả nƣớc nhƣ giới, ƣu, khuyết điểm phƣơng pháp có nghiên cứu cách giải toán theo cách tiếp cận Đại số gia tử, sử dụng giá trị định lƣợng ngữ nghĩa giá trị biến ngôn ngữ, phân chia miền thuộc tính tiến hành khai phá liệu Phƣơng pháp nghiên cứu Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ Tìm hiểu lý thuyết tập mờ, dạng tập mờ, tìm hiểu cách biểu diễn tập giá trị chân lý ngôn ngữ cho tập mờ Tìm hiểu mối quan hệ dạng biểu diễn tập mờ với hàm định lƣợng ngữ nghĩa đại số gia tử, tìm hiểu cách thức chuyển đổi giá trị chân lý ngôn ngữ thành giá trị số Phân tích, đối sánh, liệt kê, nghiên cứu tài liệu, tổng hợp kết nhà nghiên cứu liên quan đến lĩnh vực nghiên cứu Ý nghĩa khoa học Bài toán phân chia miền xác định thuộc tính nói chung đóng vai trị quan trọng trình khai phá liệu có ý nghĩa ứng dụng rộng lớn, đặc biệt loại tốn liên quan đến thơng tin mờ ngƣời thƣờng định thơng qua thơng tin mờ ngôn ngữ Cho đến phƣơng pháp giải toán chủ yếu dựa tập mờ Giải toán phân chia miền xác định thuộc tính theo cách tiếp cận Đại số gia tử cho ta phƣơng pháp tƣơng đối đơn giản nhƣng hữu hiệu cách mà Đại số gia tử nói riêng lý thuyết tập mờ nói chung sử dụng Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

Ngày đăng: 01/12/2022, 23:00

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN