1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu sâu hơn về t chuẩn có ngưỡng và bước đầu ứng dụng vào khai phá dữ liệu

90 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 90
Dung lượng 781,4 KB

Nội dung

Nghiên cứu sâu t-chuẩn có ngưỡng bước đầu ứng dụng vào khai phá liệu LỜI CẢM ƠN Đầu tiên, em xin chân thành cảm ơn thày giáo Bùi Công Cường giúp đỡ em nhiều q trình tìm kiếm tài liệu hồn thành báo cáo Sự bảo tận tình thày suốt trình từ ý tưởng ban đầu báo cáo hoàn thành trợ giúp lớn em Sau đó, em xin chân thành cảm ơn thày, cô giáo giảng dạy em, đặc biệt thày, cô giáo khoa Toán Tin ứng dụng, trường Đại học Bách Khoa Hà Nội Những kiến thức thu nhận từ thày, cô hỗ trợ em nhiều q trình hồn thành báo cáo Em xin cảm ơn bạn học lớp Toán Tin-KSTN K45, Đại học Bách Khoa Hà Nội, anh chị bạn thuộc Seminar Lý thuyết mờ Mạng Nơron, đóng góp người giúp em hồn chỉnh báo cáo Cuối cùng, em xin gửi lời cảm ơn tới cha mẹ, chị gái em, cổ vũ động viên người động lực lớn giúp em hồn thành báo cáo Em xin phép sử dụng cụm từ “chúng tôi” báo cáo bao gồm em nguời Nghiên cứu sâu t-chuẩn có ngưỡng bước đầu ứng dụng vào khai phá liệu MỤC LỤC GIỚI THIỆU .4 TỐN TỬ MỜ CĨ NGƯỠNG 2.1 Toán tử mờ 2.1.1 Phủ định 2.1.2 T-chuẩn 2.1.3 T-đối chuẩn 10 2.1.4 Kéo theo 10 2.2 Toán tử mờ có ngưỡng 11 2.2.1 t-chuẩn có ngưỡng 11 2.2.2 Đẳng cấu t-chuẩn có ngưỡng 19 2.2.3 t-đối chuẩn có ngưỡng ba De Morgan có ngưỡng .23 2.2.4 Kéo theo có ngưỡng .27 2.2.5 Các toán tử mờ tham số 29 2.3 Kết luận 38 LUẬT KẾT HỢP MỜ .39 3.1 Giới thiệu .39 3.2 Mơ tả tốn 44 3.2.1 Thuộc tính sở liệu 44 3.2.2 Từ 44 3.2.3 Mệnh đề 45 3.2.4 Luật kết hợp 47 3.2.5 t-chuẩn có ngưỡng độ ủng hộ 49 3.3 Không gian tìm kiếm .50 3.3.1 Tìm mệnh đề 50 3.3.2 Tìm luật 52 3.4 Thuật toán 53 3.4.1 Tìm mệnh đề 53 3.4.2 Tìm luật kết hợp 56 3.5 Vấn đề mờ hoá liệu 57 3.5.1 Bài toán phân cụm liệu phân cụm mờ 58 3.5.2 Thuật toán FCM 60 3.5.3 Phương pháp chia 62 3.6 Kết luận 63 Phụ lục A Các tốn tử mờ có ngưỡng tham số 64 Phụ lục B Chương trình Fuzzy Rules Miner 77 Các Module chương trình 77 1.1 mdiMain 77 1.2 frmFuzzySetFinder 77 1.3 frmDataMiner 78 Cấu trúc file liệu 79 Nghiên cứu sâu t-chuẩn có ngưỡng bước đầu ứng dụng vào khai phá liệu 2.1 .CFF 79 2.2 .QDF 79 2.3 .FDF 79 2.4 .TF 79 2.5 .PF 80 2.6 .RF 80 Cơ sở liệu chạy thử nghiệm .80 3.1 Mô tả .80 3.2 Kết 80 TÀI LIỆU THAM KHẢO 82 Nghiên cứu sâu t-chuẩn có ngưỡng bước đầu ứng dụng vào khai phá liệu GIỚI THIỆU Khái niệm t-chuẩn có ngưỡng Dubois, Prade giới thiệu [14], sau Iancu xem xét cách đầy đủ [31] Sau đó, số kết lớp tốn tử mờ có ngưỡng, t-chuẩn, t-đối chuẩn, kéo theo xem xét [9-13] Cũng giống tốn tử mờ, tốn tử mờ có ngưỡng có phạm vi ứng dụng rộng lớn tử điều khiển học, trí tuệ nhân tạo, đặc biệt vấn đề hệ suy diễn khai phá liệu Tìm kiếm luật kết hợp hướng nghiên cứu quan trọng khai phá liệu [38] Bài tốn tìm luật kết hợp boolean giới thiệu lần [2] Ví dụ cho luật sau: “90% số người mua bơ sữa mua bánh mì” Đã có nhiều thuật tốn đưa nhằm giải toán này, Apriori [3], FP-growth [27,23], Eclat [1]… Bài toán luật kết hợp lượng hoá nêu [40] Lấy ví dụ, luật kết hợp lượng hoá cho sở liệu với ba thuộc tính “ → ” Thuật Nghiên cứu sâu t-chuẩn có ngưỡng bước đầu ứng dụng vào khai phá liệu toán đưa [40] phân hoạch miền giá trị thuộc tính thành khoảng sau kết hợp khoảng rời lời giải toán Thao tác thực chất chuyển toán luật kết hợp lượng hoá toán luật kết hợp boolean Mặc dù phương pháp phân hoạch liệu giải số tốn tìm luật kết hợp sở liệu lượng hố Tuy nhiên, có số vấn đề phát sinh [35] Đó vấn đề mát thơng tin có nhiều giá trị tập trung xung quanh biên khoảng Việc chia giá trị gần vào khoảng khác dẫn tới việc thông tin phân tích sau Một phương pháp tiếp cận khác chia miền liệu thành vùng có chồng lên Khi đó, phần tử nằm gần biên thuộc nhiều khoảng, giải phần vấn đề mát thông tin lân cận biên Tuy nhiên, tiếp cận có phần bất hợp lý việc phần tử gần biên có vai trị quan trọng việc mô tả đặc trưng khoảng giống phần tử gần trung tâm Tất vấn đề chủ yếu xuất phát từ việc sử dụng biên rõ ràng để chia khoảng Từ đó, [35] đề nghị sử dụng tiếp cận mờ Tập mờ cung cấp thay đổi uyển chuyển vùng liệu, vấn đề xuất phát từ biên rõ loại bỏ Trong [35], luật kết hợp mờ có dạng, “Nếu X A Y B”, “X A” gọi phần tiền tố luật, “Y B” gọi phần hệ luật X Y tập thuộc tính sở liệu, A B tập từ mô tả X Y tương ứng Báo cáo tập trung nghiên cứu sâu tốn tử mờ có ngưỡng, đồng thời xem xét khía cạnh ứng dụng vào tốn luật kết hợp mờ Chương báo cáo tập trung vào nghiên cứu sâu tốn tử mờ có ngưỡng, mơ tả khái niệm lớp tốn tử mờ có ngưỡng đồng dạng, cặp hàm sinh lớp tốn tử mờ có ngưỡng đồng dạng Chương báo cáo mô tả Nghiên cứu sâu t-chuẩn có ngưỡng bước đầu ứng dụng vào khai phá liệu toán luật kết hợp mờ, vấn đề mờ hóa liệu đầu vào, đồng thời xem xét ứng dụng tchuẩn có ngưỡng vào việc toán luật kết hợp mờ Phần phụ lục cuối báo cáo cung cấp lớp tốn tử mờ có ngưỡng có tham số, mơ tả chương trình Fuzzy Rules Miner cài đặt thuật toán F-Apriori, cấu trúc file liệu đầu vào kết chạy thử nghiệm chương trình Nghiên cứu sâu t-chuẩn có ngưỡng bước đầu ứng dụng vào khai phá liệu TỐN TỬ MỜ CĨ NGƯỠNG Sự đời cơng nghệ tính tốn mờ xuất phát từ giới thiệu tập mờ Zadeh năm 1965 [41] Hiện nay, nói, cơng nghệ tính tốn mờ lĩnh vực nghiên cứu phát triển mạnh mẽ nhất, đánh dấu đời hàng loạt phương pháp kỹ thuật ứng dụng nhiều lĩnh vực khác Việc tích hợp kỹ thuật lơgíc mờ với phương pháp phân tích khác ngày diễn mạnh mẽ Lơgíc mờ ứng dụng rộng rãi để giải nhiều toán khoa học ứng dụng Những lĩnh vực kể vận trù học, hỗ trợ định, điều khiển, nhận dạng mẫu, kinh tế, quản lý, xã hội học, mơ hình thống kê, máy học, thiết kế khí, chế tạo, phân lớp, suy luận, thu nhận thông tin, quản lý sở liệu, chẩn đoán y tế, hệ sở tri thức Đặc biệt, lĩnh vực xử lý tri thức, cơng nghệ tính tốn mờ tỏ vơ hiệu Do tri thức thường người thường biểu diễn thể ngôn ngữ, câu hỏi, phát biểu giới xét Vấn đề việc xử lý tri thức không việc liên kết tri thức, phát biểu giới xét, mà việc đánh giá đắn chúng Lơgíc hình thức cổ điển Nghiên cứu sâu t-chuẩn có ngưỡng bước đầu ứng dụng vào khai phá liệu cho phép đánh giá phát biểu giới đúng, sai Tuy nhiên, thực tế, đánh giá phát biểu có sai khó khơng muốn nói phi thực tế Lấy ví dụ: tri thức dạng “Áp suất cao”, “Thể tích nhỏ”, “Quả táo đỏ”, việc xác định cách xác trị chân lý chúng không hay khó khăn từ “cao”, “nhỏ”, hay “đỏ” hồn tồn có tính chất mờ hồ Từ đó, Zadeh mở rộng lơgíc mệnh đề thành lơgíc mờ, đó, mệnh đề P gán cho trị chân lý υ(P), giá trị đoạn [0,1], biểu diễn mức độ đắn mệnh đề Hay Để tiến hành thao tác lơgíc mệnh đề, cần phải có phép tốn lơgíc mờ Đó phép toán t-chuẩn tương ứng với phép hội, t-đối chuẩn ứng với phép tuyển, phép kéo theo mờ Bên cạnh đó, ngưỡng khái niệm tự nhiên toán giới thực Những suy luận có sử dụng ngưỡng hay gặp đời sống Lấy ví dụ, cơng tác chẩn đốn bệnh nhân Nếu số thông số đầu vào đạt giá trị ngưỡng, dạng nhiệt độ 41 oC, nhịp tim 150, … hiển nhiên phải có suy luận khác với giá trị chưa đạt giá trị ngưỡng Chương tập trung vào việc nghiên cứu tốn tử mờ có ngưỡng sử dụng làm cơng cụ cho q trình trích rút luật mờ Mở đầu nghiên cứu tốn tử mờ có ngưỡng t-chuẩn có ngưỡng Khái niệm t-chuẩn có ngưỡng Dubois, Prade giới thiệu [14], sau Iancu xem xét cách đầy đủ [31] Sau đó, số kết lớp toán tử mờ có ngưỡng t-chuẩn, t-đối chuẩn, kéo theo xem xét [9-13] Chương nhắc lại khái niệm tốn tử mờ, tốn tử mờ có ngưỡng, lớp tốn tử mờ có ngưỡng đồng dạng Đồng thời, tiến hành xem xét số tính chất đại số lớp Phần cuối chương xem xét giải tích lớp toán tử mờ tham số nhằm làm tiền đề cho việc tạo tốn tử mờ có ngưỡng tham số Nghiên cứu sâu t-chuẩn có ngưỡng bước đầu ứng dụng vào khai phá liệu Trước hết, bắt đầu việc tìm hiểu tốn tử mờ số tính chất đặc trưng chúng 2.1 Toán tử mờ Toán tử mờ phép tốn lơgíc mờ, nghĩa phép tốn giá trị lơgíc mệnh đề Như thế, cách tổng quát, phép tốn đoạn [0,1] tốn tử mờ Trong phần tìm nhắc lại định nghĩa số tính chất phép tốn lơgíc bản, phép phủ định, phép hội hay t-norm, phép tuyển hay t-conorm 2.1.1 Phủ định Định nghĩa 2.1.1[28] i) Hàm n : [0,1] → [0,1] gọi hàm phủ định không tăng đồng thời n(0) = n(1) = ii) Một hàm phủ định gọi phủ định chặt giảm chặt iii) Một hàm phủ định gọi phủ định mạnh phủ định chặt, đồng thời n(n(x)) = x với x ∈ [0,1] Định lý 2.1.1[28] n phép phủ định chặt tồn f thuộc Aut(J) cho n(x) = f-1(1-f(x)) Ở đây, ta ý η = - x hàm phủ định chặt, biểu diễn n định lý viết thành n(x) = f -1(η(f(x))) f gọi hàm sinh n, n biểu diễn dạng ηf 2.1.2 T-chuẩn Định nghĩa 2.1.2[28] Một hàm T : [0,1]×[0,1] → [0,1] gọi t-chuẩn (tương ứng với phép hội lơgíc mệnh đề), có tính giao hốn, kết hợp, đơn điệu không giảm theo biến, đồng thời T(x,1) = x với x ∈ [0,1] i) Một t-chuẩn gọi liên tục liên tục theo biến Nghiên cứu sâu t-chuẩn có ngưỡng bước đầu ứng dụng vào khai phá liệu ii) Một t-chuẩn gọi t-chuẩn Archimedean liên tục, đồng thời: T(x,x) < x với x ∈ (0,1) iii) Một t-chuẩn gọi t-chuẩn chặt Archimedean, đồng thời: khơng tồn x, y ∈ (0,1) cho T(x,y) = iv) Một t-chuẩn gọi t-chuẩn nilpotent Archimedean, đồng thời: tồn x, y ∈ (0,1) cho T(x,y) = 2.1.3 T-đối chuẩn Định nghĩa 2.1.3[28] Một hàm S : [0,1]×[0,1] → [0,1] gọi t-đối chuẩn (tương ứng với phép tuyển) có tính giao hốn, kết hợp, đơn điệu không giảm theo biến, đồng thời S(0,x) = x với x ∈ [0,1] Kết sau cho ta thấy mối tương quan t-chuẩn t-đối chuẩn Định lý 2.1.2[28] S t-đối chuẩn tồn t-chuẩn T phủ định mạnh n cho S(x,y) = n(T(n(x),n(y))) với x,y ∈ [0,1] Cặp (T,S) gọi đối ngẫu qua phủ định mạnh n Bộ ba (T,n,S) gọi ba De Morgan Một t-đối chuẩn gọi liên tục, Archimedean, chặt, nilpotent đối ngẫu liên tục, Archimedean, chặt, nilpotent tương ứng 2.1.4 Kéo theo Định nghĩa 2.1.4[19] Một hàm I: [0,1]×[0,1]→[0,1] hàm kéo theo thoả tính chất sau: i) I(x,y) ≥ I(u,y) x ≤ u ii) I(x,y) ≥ I(x,v) y ≥ v iii) I(0,x) = iv) I(x,1) = 10

Ngày đăng: 21/06/2023, 19:45

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] A.Amir, R.Feldman, and R.Kashi. A New and Versatile Method for Association Generation. Information Systems, 2:333-347, 1997 Sách, tạp chí
Tiêu đề: Information Systems
[2] R.Argawal, T.Imielinski and A.Swami. Mining Association Rules Between Sets of Item in Large Databases. In P.Buneman and S.Jajodia, editors Proceeding of the 1993 ACM SIGMOD International Conference on Management of Data, volume 22(2) of SIGMOD Record, pages 207-216.ACM Press, 1993 Sách, tạp chí
Tiêu đề: Proceeding of the 1993 ACM SIGMOD International Conference onManagement of Data", volume 22(2) of "SIGMOD Record
[6] S.Brin and L.Page. The Anatomy of a Large-scale Hypertextual Web Search Engine. In Proceeding of the Seventh International World-Wide-Web Conference, volume 30 (1-7) of Computer Networks, pages 107-117. Elsevier Science, 1998 Sách, tạp chí
Tiêu đề: Proceeding of the Seventh International World-Wide-WebConference", volume 30 (1-7) of "Computer Networks
[7] N.Cercone, T.Y.Lin, and X.Wu, editors. Proceeding of the 2001 IEEE International Conference on Data Mining. IEEE Computer Society, 2001 Sách, tạp chí
Tiêu đề: Proceeding of the 2001 IEEEInternational Conference on Data Mining
[10] B.C. Cuong, L.B.Long, P.V.Loi and D.T.Hieu. Some properties of t-norms with threshold. Proceedings of the second Vietnam-Japan Symposium on Fuzzy Systems and Applications, VJFUZZY’2001, 28-33, 2001 Sách, tạp chí
Tiêu đề: Proceedings of the second Vietnam-Japan Symposium onFuzzy Systems and Applications, VJFUZZY’2001
[11] Bui Cong Cuong, Nguyen Hoang Phuong, Ho Khanh Le, Bui Truong Son and Koichi Yamada. Fuzzy Inference Methods Employing T-norm with threshold and Their Implementation. Journal of Advanced Computational Inteligence and Intelligence Informatics , vol.7, n.3, 2003,362-369 Sách, tạp chí
Tiêu đề: Journal of Advanced Computational Inteligenceand Intelligence Informatics
[14] D.Dubois and H.Prade New results about properties and semantics of fuzzy set-theoretic operators. In Fuzzy Sets: Theory and Applications to Policy Analysis and Information Systems, P.P.Wang and S.K.Chang, editors, Plenum Sách, tạp chí
Tiêu đề: Fuzzy Sets: Theory and Applications to PolicyAnalysis and Information Systems
[15] L.Dehaspe and H.Toivonen. Discovery of Relational Association Rules. In S.Dzeroski and N.Lavrac, editors, Relational Data Mining, pages 189-212.Springer, 2001 Sách, tạp chí
Tiêu đề: Relational Data Mining
[18] U.M Fayyad, G.Piatetsky-Shapiro, P.Smyth, and R.Uthurusamy, editors.Advances in Knowledge Discovery and Data Mining. MIT Press, 1996 Sách, tạp chí
Tiêu đề: Advances in Knowledge Discovery and Data Mining
[19] Janos Fodor and Marc Roubens. Fuzzy Preference Modelling and Multicriteria Decision Support. Kluwer Academic Publishers, 1994 Sách, tạp chí
Tiêu đề: Fuzzy Preference Modelling and MulticriteriaDecision Support
[22] B.Goethals. Efficient Frequent Pattern Mining. PhD thesis, University Limburg, 2002 Sách, tạp chí
Tiêu đề: Efficient Frequent Pattern Mining
[24] D.Hand, H.Mannila, and P.Smyth. Principle of Data Mining. MIT Press, 2001 Sách, tạp chí
Tiêu đề: Principle of Data Mining
[25] D.Hand, D.Keim, and R.T.Ng, editors. Proceeding of the Eight ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM Press, 2002 Sách, tạp chí
Tiêu đề: Proceeding of the Eight ACM SIGKDDInternational Conference on Knowledge Discovery and Data Mining
[26] J.Han and M.Kamber. Data Mining: Concepts and Techniques. Morgan Kaufmann, 2001 Sách, tạp chí
Tiêu đề: Data Mining: Concepts and Techniques
[27] J.Han, J.Pei and Y.Yin. Mining Frequent Parterns without Candidate Generation. In W.Chen, J.F.Naughton, and P.A.Bernstein, editors.Proceedings of the 2000 ACM SIGMOD International Cinference on Management of Data, volume 29(2) of SIGMOD Record, pages 1-12. ACM Press, 2000 Sách, tạp chí
Tiêu đề: Proceedings of the 2000 ACM SIGMOD International Cinference onManagement of Data", volume 29(2) of "SIGMOD Record
[28] Hung T. Nguyen and Elbert A. Walker. A first Course in Fuzzy Logic, Second Edition. Chaman&amp;Hall/CRC, NewYork, 2000 Sách, tạp chí
Tiêu đề: A first Course in Fuzzy Logic, SecondEdition
[29] T.Imielinski and H.Mannila. A Database Perspective on Knowledge Discovery. Communications of the ACM, 29 (11):58-64, 1996 Sách, tạp chí
Tiêu đề: Communications of the ACM
[31] Ion Iancu. T-norms with thresholds. Fuzzy Sets and Systems, vol. 85, 1997, 83- 92 Sách, tạp chí
Tiêu đề: Fuzzy Sets and Systems
[38] G.Piatesky-Sshapiro and W.J.Frawley. Knowledge Discovery in Databases.AAA1 Press/The MIT Press, Menlo Park, California, 1991 Sách, tạp chí
Tiêu đề: Knowledge Discovery in Databases
[39] Enrique H Ruspini, Piero P Bonissone and Witold Pedrycz, editors. Handbook of Fuzzy Computation. Institute of Physics Publishing Bristol and Philadelphia, 1998 Sách, tạp chí
Tiêu đề: Handbookof Fuzzy Computation

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w