1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khai phá luật kết hợp mờ dựa trên đại số gia tử

75 322 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • 1.1. Lý thuyết chung về tập mờ

    • Là người khởi xướng cho lý thuyết tập mờ, L. A. Zadeh đã có rất nhiều nghiên cứu mở đường cho sự phát triển và ứng dụng [14]. Ý tưởng nổi bật của Zadeh là từ những khái niệm trừu tượng về ngữ nghĩa của thông tin mờ, không chắc chắn như trẻ-già, nhanh-chậm, cao-thấp,… ông đã tìm cách biểu diễn chúng bằng một khái niệm toán học, được gọi là tập mờ và được định nghĩa như sau.

    • Định nghĩa 1. [14] Cho một tập vũ trụ U với các phần tử ký hiệu bởi x, U={x}. Một tập mờ A trên U là tập được đặc trưng bởi một hàm A(x) mà nó liên kết mỗi phần tử xU với một số thực trong đoạn [0,1]. Giá trị hàm A(x) biểu diễn mức độ thuộc của x trong A. A(x) là một ánh xạ từ U vào [0,1] và được gọi là hàm thuộc của tập mờ A.

    • Như vậy, giá trị hàm A(x) càng gần tới 1 thì mức độ thuộc của x trong A càng cao. Khi A là một tập hợp kinh điển, hàm thuộc của nó, A(x), chỉ nhận 2 giá trị 1 hoặc 0, tương ứng với x có nằm trong A hay không. Rõ ràng, tập mờ là sự mở rộng của khái niệm tập hợp kinh điển. Các khái niệm, phép toán trong lý thuyết tập kinh điển cũng được mở rộng cho các tập mờ.

    • Họ tất cả các tập mờ trên miền cơ sở U là không gian các hàm từ U vào đoạn [0,1], tức là = {A : U[0,1]}, một không gian tương đối giàu về cấu trúc tính toán mà nhiều nhà nghiên cứu đã sử dụng cho việc mô phỏng các phương pháp suy luận của con người.

    • Chúng ta có thể biểu diễn tập mờ bằng các cách sau, tùy theo tập U là hữu hạn, đếm được hay vô hạn liên tục:

    • - Trường hợp U hữu hạn, U={ui : 1 i  n}, ta có thể viết

    • - Trường hợp U vô hạn đếm được, U={ui : i=1,2,… }, ta viết

    • - Trường hợp U vô hạn liên tục, U=[a,b], ta viết

    • Sau đây ta định nghĩa một số khái niệm đặc trưng liên quan đến tập mờ.

    • Định nghĩa 2. [1] Cho một tập mờ A trên tập vũ trụ U và [0,1]. Tập lát cắt  của A là một tập kinh điển, ký hiệu A, được xác định như sau :

    • A = {u  U : A(u)}.

    • Tập A còn gọi là tập mức  của A.

    • Định nghĩa 3. [1] Cho một tập mờ A trên tập vũ trụ U,

    • i) Giá của tập mờ A, ký hiệu support(A), là tập con của U trên đó A(u)0, tức là support(A) = {u  U : A(u)0}.

    • ii) Độ cao của tập mờ A, ký hiệu high(A), là cận trên đúng của hàm thuộc A(u) trên U, tức là high(A) = sup{A(u) : uU}.

    • iii) A được gọi là tập mờ chuẩn nếu high(A)=1. Ngược lại gọi là tập mờ dưới chuẩn.

    • iv) Lõi của tập mờ A, ký hiệu core(A), là một tập con của U được xác định như sau:

    • Định nghĩa 4. [1] Cho một tập mờ A trên tập vũ trụ U,

    • i) Lực lượng vô hướng hay bản số của tập mờ A, ký hiệu count(A), được xác định là:

    • ii) Lực lượng mờ hay bản số mờ của tập mờ A, ký hiệu card(A), là một tập mờ trên tập các số nguyên không âm N, được xác định như sau:

    • Ví dụ 1. Cho tập vũ trụ chỉ tuổi tính chẵn năm U={u : 0 u 120}, A là một tập mờ chỉ tuổi già (old) được xác định bởi hàm thuộc sau (hình 1):

    • Khi đó tập mức =0.5 của A là A0.5 = {u : 66 u 120} ;

    • support(A) = {u : 61 u 120} ; high(A) = 1.01-1; core(A) = {120}.

    • Tiếp theo chúng ta định nghĩa một số phép toán cơ bản trên tập mờ, các phép này làm cơ sở cho việc phát triển lôgíc mờ sau này.

    • Định nghĩa 5. [1,14] Cho hai tập mờ A và B trên tập nền U có hàm thuộc tương ứng là A và B, ba phép toán cơ bản là hợp, giao của hai tập mờ và lấy phần bù của tập mờ A là một tập mờ C, được viết là

    • C = A  B, hoặc C = A  B, hoặc C = A~ với hàm thuộc được xác định như sau:

    • AB(u) = max(A(u), B(u)), u  U,

    • AB(u) = min(A(u), B(u)), u  U,

    • A~(u) = 1- A(u), u  U.

    • Hay viết ở dạng thu gọn là

    • AB(u) = A(u)  B(u)),

    • AB(u) = A(u)  B(u)).

    • Ví dụ 2. [1] Xét tập nền U = {1,2,3,4,5,6,8,9,10,11} là tập các giá trị trong thang điểm 10 đánh giá kết quả học tập của học sinh. Hai tập mờ G và K tương ứng là hai khái niệm mờ về năng lực học giỏi và học kém, với hàm thuộc được cho dưới dạng bảng như sau:

    • Ta có kết quả của các phép toán trên hai tập mờ này với hàm thuộc thể hiện trong bảng sau:

    • Một lớp đặc biệt các tập mờ là lớp các quan hệ mờ, chúng là các tập mờ trên không gian tích Đề-các các miền cơ sở. Như tên gọi, quan hệ mờ mô tả mối quan hệ mờ giữa các đối tượng trong miền cơ sở. Về mặt hình thức chúng ta định nghĩa quan hệ mờ như sau.

    • Định nghĩa 6. [1] Cho U là tích Đề-Các của n miền cơ sở Ui, i=1, ,…, n. Khi đó mỗi một tập mờ trên U được gọi là một quan hệ mờ n-ngôi và được kí hiệu là R, gọi là tên của quan hệ đó, và nó được biểu thị bằng công thức sau:

    • Trong đó (u1,…,un) là hàm thuộc của tập mờ R. Dấu  biểu diễn hình thức của hàm thuộc, có thể một trong ba trường hợp là hữu hạn hoặc đếm được hoặc liên tục.

    • Quan hệ mờ cũng có các phép tính cơ bản như trên tập mờ vì bản thân nó cũng là tập mờ. Ngoài ra, quan hệ mờ có những phép tính đặc thù riêng mà trên tập mờ không có, đó là phép hợp thành dưới đây.

    • Định nghĩa 7. [1] Cho R là một quan hệ mờ trên UV và S là quan hệ mờ trên VW. Khi đó, phép hợp thành của hai quan hệ này là một quan hệ trên UW, được ký hiệu là RS và được định nghĩa như sau:

    • RS = vV [R(u,v)S(v,w)]/(u,w)

    • Trong đó  là một phép tính 2 ngôi trong [0,1] có tính giao hoán, kết hợp và phân phối đối với phép max . Nếu  là phép min , thì ta có phép hợp thành max-min, nếu  là phép nhân số học thì ta có phép hợp thành max-product.

    • Ví dụ 3. Cho U = {u1, u2, u3}, V = {v1, v2} và W = {w1, w2}, với quan hệ mờ R trên UV và S trên VW được cho hàm thuộc dưới dạng ma trận

    • khi đó phép hợp thành max-min là ,

    • và max-product là .

    • Phép hợp thành các quan hệ mờ đóng vai trò quan trọng trong quá trình lập luận xấp xỉ sau này.

    • Trong hầu hết các ứng dụng, tri thức được biểu diễn dưới dạng luật “if-then” và mỗi luật được xem như một quan hệ mờ

    • Chúng ta thấy rằng lý thuyết tập mờ với mục tiêu mô hình hóa toán học ngữ nghĩa của các khái niệm mờ và, hơn nữa, mô hình hóa cách lập luận của con người. Tuy nhiên, những vấn đề này thuộc loại có cấu trúc yếu, khó có thể có một cấu trúc toán duy nhất mô hình hóa trọn vẹn những vấn đề đó

  • 1.2. Lôgic mờ

    • Cùng với khái niệm biến ngôn ngữ, L. A. Zadeh đã phát triển lôgic mờ mà các giá trị chân lý nhận trong T(Truth) = {true, very true, more false, possible false, very very false,…}, tập các giá trị của biến ngôn ngữ Truth. Khi đó, một mệnh đề dạng “X is A”, với A là một khái niệm mờ, sẽ có giá trị chân lý thuộc T(Truth) và được biểu thị bởi một tập mờ có hàm thuộc A trên không gian tham chiếu U.

    • Lý thuyết tập mờ là cơ sở toán học cho việc phát triển các phương pháp mô phỏng lập luận của con người. Về nguyên tắc, vấn đề tư duy, lập luận của con người rất phức tạp và do đó không thể sử dụng một cấu trúc toán học duy nhất để mô phỏng. Vì vậy, mục tiêu của chúng ta là càng xây dựng được nhiều cấu trúc đại số các tập mờ càng tốt để linh hoạt trong tiếp cận các vần đề ứng dụng. Ở đây, chúng ta sẽ định nghĩa một họ các cặp đối ngẫu t-norm và t-conorm cùng với phép phủ định làm cơ sở cho lôgic mờ và lập luận xấp xỉ.

    • Định nghĩa 8 [1] Một hàm 2-biến T : [0,1][0,1]  [0,1] được gọi là phép t-norm nếu nó thỏa các tính chất sau với a,a’,b,c [0,1]:

    • Ngoài ra, một số tính chất khác cần đòi hỏi phải có trong nhiều ứng dụng đối với phép t-norm bao gồm:

    • Định nghĩa 9 [1] Một hàm 2-biến S : [0,1][0,1]  [0,1] được gọi là phép t-conorm nếu nó thỏa các tính chất sau với a,a’,b,c [0,1]:

    • Như vậy, chỉ có hai tính chất điều kiện biên và giới nội làm nên sự khác biệt giữa hai họ phép tính t-norm và t-conorm.

    • Chúng ta cũng có thể mở rộng định nghĩa cho phép t-norm và t-conorm này đối với trường hợp nhiều biến vào, tức là Tex : [0,1]n  [0,1] và Sex : [0,1]n  [0,1], bằng cách áp dụng liến tiếp các phép t-norm và t-conorm ở trên.

    • Định nghĩa 10 [1] Hàm N : [0,1]  [0,1] được gọi là phép phủ định (negation) nếu nó thỏa các tính chất sau với a,a’ [0,1]:

    • Ví dụ 4: Các phép t-norm, t-conorm và phép phủ định hay được sử dụng như:

    • Định nghĩa 11 [1] Ba phép tính t-norm T, t-conorm S và phép phủ định N được gọi là một hệ đối ngẫu (T,S,N) nếu chúng thỏa điều kiện sau:

    • Việc áp dụng các phép t-norm, t-conorm và phép phủ định cho việc tính toán các toán tử hội, tuyển và phủ định trong lôgic mờ làm tăng tính mềm dẻo trong ứng dụng. Thực vậy, khi hai mệnh đề “X is A” và “X is B” có giá trị chân lý được biểu thị bởi hai hàm thuộc tương ứng A và B trên không gian tham chiếu U và V thì mệnh đề mờ “X is A and B” có hàm thuộc biểu thị giá trị chân lý là AB = T(A,B), với T là một ­t-norm nào đó. Tương tự, mệnh đề “X is A or B” có hàm thuộc là AB = S(A,B) và mệnh đề “X is not A” có hàm thuộc là ~A = N(A), ở đây S là một t-conorm và N là một phép phủ định được chọn nào đó.

    • Các mệnh đề mờ cùng với giá trị chân lý của chúng là những đối tượng nghiên cứu chính của lôgíc mờ. Trong đó, một dạng mệnh đề mờ thường biểu diễn cho tri thức dạng luật trong lập luận xấp xỉ và ứng dụng, đó là mệnh đề mờ có điều kiện dạng “If X is A then Y is B” và được biểu diễn bằng toán tử kéo theo mờ.

    • Ở đây, một cách tổng quát, chúng ta đưa ra một số tính chất cho một phép kéo theo mờ.

    • Định nghĩa 12 [1] Phép kéo theo là một hàm số I : [0,1]2  [0,1] có các tính chất sau:

    • Rõ ràng mệnh đề điều kiện ở dạng “If X is A then Y is B” thể hiện mối quan hệ giữa hai khái niệm mờ A và B. Vì vậy, chúng cảm sinh một quan hệ mờ R thể hiện bởi một tập mờ trên không gian tích Đề-Các UV được xác định bởi hàm thuộc thông qua một phép kéo theo được chọn.

    • Ví dụ 5. Một số dạng phép kéo theo thường dùng

    • I(x,y) = S(N(x),y), hoặc

    • I(x,y) = S(N(x),T(x,y)), hoặc

    • I(x,y) = S(T(N(x),N(y)),y), với T, S và N là các phép

    • t-norm, t-conorm và phép phủ định.

    • I(x,y) = 1-x+x.y

    • I(x,y) = min{1, 1-x+y}.

    • Định lý sau đây cho chúng ta xem xét liệu phép kéo theo như thế nào sẽ thỏa mãn tất cả các tính chất trong định nghĩa 12.

    • Định lý 1. [1] Một hàm 2-biến I : [0,1]2  [0,1] thỏa các tính chất từ i) đến ix) trong định nghĩa 12 nếu và chỉ nếu có tồn tại một hàm liên tục đơn điệu tăng thực sự f : [0,1]  [0,+) sao cho f(0) = 0 và

    • I(x,y) = f-1(f(1)-f(x)+f(y)), với x,y  [0,1], và

    • N(x) = f-1(f(1)-f(x)), với x [0,1].

    • Tuy nhiên, bản chất ngữ nghĩa của phép kéo theo mờ trong lập luận của con người rất phức tạp, khó có một hệ tiên đề chung cho mọi tình huống. Vì vậy, các tính chất ở định nghĩa 12 không bắt buộc mọi phép kéo theo mờ đều phải thỏa mãn. Hơn nữa, cũng không có quyền đặt ra các yêu cầu về một tính chất nào đó khác mà một phép kéo theo cần phải có. Chỉ có ứng dụng thực tiễn là tiêu chuẩn cuối cùng chứng minh tính phù hợp của một định nghĩa phép kéo theo mờ.

  • 1.3. Biến ngôn ngữ

    • Định nghĩa 13. [14] Biến ngôn ngữ là một bộ năm (X,T(X),U,R,M), trong đó X là tên biến, T(X) là tập các giá trị ngôn ngữ của biến X, U là không gian tham chiếu hay còn gọi là miền cơ sở của biến X, R là một quy tắc ký pháp sinh các giá trị ngôn ngữ cho T(X), M là quy tắc gán ngữ nghĩa biểu thị bằng tập mờ trên U cho các từ ngôn ngữ trong T(X).

    • Ví dụ 6 Cho X là biến ngôn ngữ có tên AGE, miền tham chiếu của X là U=[0,120]. Tập các giá trị ngôn ngữ T(AGE)={very old, old, possible old, less old, less young, quite young, more young,…}. Chẳng hạn với giá trị ngôn ngữ old, quy tắc gán ngữ nghĩa M cho old bằng tập mờ cho bởi ví dụ 1

    • M(old) = {(u,old(u)) : u[0,120]}.

    • Chúng ta thấy rằng một biến ngôn ngữ được cấu trúc theo hướng mà trong đó có hai quy tắc cơ bản. Thứ nhất là quy tắc cú pháp, qui định cách thức để sinh các giá trị ngôn ngữ. Thứ hai là quy tắc ngữ nghĩa, qui định thủ tục tính toán ngữ nghĩa của các giá trị ngôn ngữ. Ngoài các giá trị sinh nguyên thủy, các giá trị ngôn ngữ có thể gồm các từ liên kết như and, or, not,… và các gia tử ngôn ngữ như very, possible, less, quite, more,….Zadeh cũng nêu ra một vài thí dụ về cách sinh ra các hàm thuộc từ các hàm thuộc đã có như nếu A là nhãn ngôn ngữ mờ có hàm thuộc là μA thì veryA có hàm thuộc là (μA)2 còn lessA có hàm thuộc là căn bặc hai của μA...

    • Trong thực tế có nhiều biến ngôn ngữ khác nhau về giá trị sinh nguyên thủy, tuy nhiên cấu trúc miền giá trị của chúng tồn tại một “đẳng cấu” sai khác nhau bởi giá trị sinh nguyên thủy này. Đây gọi là tính phổ quát của biến ngôn ngữ.

    • Khác với giá trị nguyên thủy của các biến ngôn ngữ phụ thuộc vào ngữ cảnh, ngữ nghĩa của các gia tử và các từ liên kết hoàn toàn độc lập với ngữ cảnh. Đây là tính độc lập ngữ cảnh của gia tử và liên kết.

    • Chúng ta thấy rằng lý thuyết tập mờ với mục tiêu mô hình hóa toán học ngữ nghĩa của các khái niệm mờ và hơn nữa mô hình hóa cách lập luận của con người. Tuy nhiên, những vấn đề này thuộc loại có cấu trúc yếu, khó có thể có một cấu trúc toán duy nhất mô hình hóa trọn vẹn những vấn đề đó.

  • 1.4. Một số khái niệm cơ bản về Đại số gia tử

  • 2.1. Bài toán kinh điển dẫn đến việc khai phá luật kết hợp

  • 2.2. Khai phá luật kết hợp mờ:

  • 3.1. Ứng dụng đại số gia tử trong khai phá dữ liệu.

  • *Ví dụ minh họa:

  • 3.2 .Bài toán

  • 3.3. Xác định đầu vào, đầu ra của bài toán

  • [6] Lê Xuân Vinh (2006), Luận án tiến sĩ: Về một cơ sở đại số và logic cho lập luận xấp xỉ và ứng dụng, Viện Công nghệ thông tin – Viện khoa học và công nghệ Việt Nam.

    • Mã nguồn chương trình:

Nội dung

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ THỊ BÍCH THẢO KHAI PHÁ LUẬT KẾT HỢP MỜ DỰA TRÊN ĐẠI SỐ GIA TỬ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2013 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ THỊ BÍCH THẢO KHAI PHÁ LUẬT KẾT HỢP MỜ DỰA TRÊN ĐẠI SỐ GIA TỬ Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC TS.Trần Thái Sơn Thái Nguyên - 2012 LỜI CAM ĐOAN Tên : Lê Thị Bích Thảo Sinh ngày 02 tháng năm 1983 Học viên cao học lớp: K9B- trường Đại học CNTT&TT Thái Nguyên Xin cam đoan : Đề tài luận văn“Khai phá luật kết hợp mờ dựa đại số gia tử” TS.Trần Thái Sơn hướng dẫn công trình nghiên cứu riêng Tất tài liệu tham khảo có nguồn gốc, xuất xứ rõ ràng Tôi xin cam đoan tất nội dung luận văn nội dung đề cương yêu cầu thầy giáo hướng dẫn Nếu sai xin hoàn toàn chịu trách nhiệm trước Hội đồng khoa học trước pháp luật Thái Nguyên, tháng 01 năm 2013 Người cam đoan Lê Thị Bích Thảo LỜI CẢM ƠN Trong trình làm luận văn vừa qua, giúp đỡ bảo nhiệt tình TS Trần Thái Sơn – Viện Công nghệ thông tin – Viện khoa học Việt Nam, luận văn hoàn thành Mặc dù cố gắng không ngừng với tận tâm thầy hướng dẫn thời gian khả hạn chế nên luận văn khó tránh khỏi thiếu sót Để hoàn thành luận văn này, em xin bày tỏ lòng biết ơn sâu sắc đến TS Trần Thái Sơn – Người thầy tận tình giúp đỡ em suốt trình làm luận văn Em xin bày tỏ lòng biết ơn đến ban lãnh đạo thầy giáo, cô giáo Trường Đại học Công Nghệ Thông Tin & Truyền Thông Đại Học Thái Nguyên giúp đỡ, tạo điều kiện tốt cho em học tập thực luận văn Thái Nguyên, tháng 01 năm 2013 Tác giả Lê Thị Bích Thảo i MỤC LỤC LỜI CAM ĐOAN .iii LỜI CẢM ƠN iv DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ii DANH MỤC CÁC HÌNH ẢNH iii iii PHẦN MỞ ĐẦU Chương LÝ THUYẾT CHUNG VỀTẬP MỜ VÀLÝTHUYÊT ́ ĐAỊ SỐGIA TỬ 1.1 Lýthuyêt́ chung tập mờ 1.2 Lôgic mờ 1.3 Biến ngôn ngữ 13 1.4 Một số khái niệm Đại số gia tử 15 1.4.1 Đại số gia tử 16 1.4.2 Định nghĩa đại số gia tử 17 Chương 31 LUẬT KẾT HỢP TRONG KHAI PHÁ DỮ LIỆU 31 2.1 Bài toán kinh điển dẫn đến việc khai phá luật kết hợp 31 2.2 Khai phá luật kết hợp mờ: 36 Chương 38 ỨNG DUNG ̣ ĐAỊ SỐGIA TỬ GIAỈ BAÌ TOAN ́ KHAI PHÁDỮLIÊU ̣ .38 3.1 Ưng ́ dung ̣ đaị sốgia tử khai phádữliêu ̣ 38 3.1.1.Tiếp cận Đại số gia tử khai phá liệu: 38 3.1.2.Thuật toán trích xuất luật kết hợp từ sở liệu: 40 *Ví dụ minh họa: 42 3.1.3.Thuật toán giải toán khai phá luật kết hợp mờ dựa đại số gia tử .48 3.2 Bài toán 48 3.3 Xác định đầu vào, đầu toán 49 3.3.1 Thuật toán giải .49 3.3.2.Chương trình thử nghiệm .49 3.3.3 Cài đặt chương trình 49 3.3.4.Giao diện chương trình 50 KẾT LUẬN .52 TÀI LIÊU THAM KHẢO 53 PHẦN PHỤ LỤC .55 ii DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT Các kí hiệu, chữ viết tắt ĐSGT α β AX, AT AX W Ý nghĩa Đại số gia tử Tổng độ đo tính mờ gia tử âm Tổng độ tính mờ gia tử dương Đại số gia tử Đại số gia tử tuyến tính đầy đủ Phần tử trung hòa đại số gia tử iii DANH MỤC CÁC HÌNH ẢNH Hình Hình Hình Hình Hình Hình Mô tả Đồ thị biểu diễn hàm thuộc tập mờ già (old) Biểu diễn Độ đo tính mờ biến TRUTH Giao diện chương trình Kết thực chương trình thử nghiệm PHẦN MỞ ĐẦU Trong năm gần đây, việc nắm bắt thông tin coi sở hoạt động sản xuất, kinh doanh Cá nhân tổ chức thu thập hiểu thông tin, hành động dựa thông tin kết xuất từ thông tin có đạt thành công hoạt động Chính lý đó, việc tạo thông tin, tổ chức lưu trữ khai thác ngày trở nên quan trọng gia tăng không ngừng Sự tăng trưởng vượt bậc sở liệu (CSDL) sống như: thương mại, quản lý khoa học làm nảy sinh thúc đẩy phát triển kỹ thuật thu thập, lưu trữ, phân tích khai phá liệu… không phép toán đơn giản thông thường như: phép đếm, thống kê… mà đòi hỏi cách xử lý thông minh hơn, hiệu Từ nhà quản lý có thông tin có ích để tác động lại trình sản xuất, kinh doanh mình… tri thức Các kỹ thuật cho phép ta khai thác tri thức hữu dụng từ CSDL (lớn) gọi kỹ thuật khai phá liệu (DM – Data Mining) Khai phá luật kết hợp nội dung quan trọng khai phá liệu Luận văn trình bày số vấn đề phát tri thức, khai phá liệu, tập trung vào vấn đề khai phá luật kết hợp ứng dụng lý thuyết Đại số gia tử khai phá luật kết hợp CSDL Khai phá liệu, cụ thể trích xuất luật kết hợp từ sở liệu, có xuất phát điểm từ toán nghiên cứu số liệu bán hàng siêu thị Ở toán này, số liệu biểu diễn dạng bảng hai chiều, cột thể loại mặt hàng (item), hàng thể giao dịch (transactions) tiến hành, số cho thấy mặt hàng mua, số điều ngược lại Từ bảng liệu lớn này, người ta mong muốn rút quy luật giúp cho quản lý, kiểu "Nếu người mua bánh mỳ bơ, khả người mua giăm cao" Luật có dạng gọi luật kết hợp hướng nghiên cứu quan trọng lĩnh vực khai phá liệu Về sau, người ta thấy không đầy đủ xem xét sở liệu bao gồm phần tử Chẳng hạn, CSDL nhân quan có mục tuổi, thu nhập có giá trị miền số thực rộng Để trích xuất luật kết hợp, phương pháp thường sử dụng chuyển số liệu CSDL cho CSDL chứa giá trị 0, áp dụng kết có Thí dụ, mục "tuổi", chia miền "trẻ", "trung niên" "già" với miền giá trị tương ứng [0,35], [36,55], [56,80] giá trị CSDL ban đầu rơi vào miền giá trị ta ghi cho vị trí tương ứng CSDL chuyển đổi, ngược lại gán giá trị Phương pháp đơn giản mặt thực thi gây băn khoăn ranh giới cứng mà người ta đưa tiến hành chuyển đổi Chẳng hạn hai người tuổi 35 36 gần mặt tuổi tác lại thuộc hai lớp khác "trẻ" "trung niên", dẫn tới việc đưa luật kết hợp thiếu tính xác Và người ta sử dụng cách tiếp cận mờ để khắc phục điều này, theo đó, giá trị CSDL ban đầu không chuyển đổi giá trị mà chuyển tập giá trị thực thuộc đoạn [0,1], độ thuộc giá trị cho vào tập mờ xác định trước Thí dụ, người tuổi 35 ví dụ trên, CSDL chuyển đổi nhận tập giá trị (trẻ, 0,8), (trung niên, 0,6), (già, 0,1) Phương pháp này, dẫn tới việc xử lý phức tạp dễ chấp nhận mặt trực quan nhiều nhà nghiên cứu quan tâm Mặc dù vậy, theo ý chúng tôi, phương pháp trích xuất luật kết hợp mờ có số điểm yếu cần khắc phục Đó phụ thuộc chủ quan lớn vào việc lựa chọn hàm thuộc cho tập mờ dẫn đến việc xử lý vừa phức tạp vừa thiếu xác Trong báo trình bày việc giải toán trích xuất luật kết hợp mờ theo cách tiếp cận Đại số gia tử, giá trị độ thuộc mờ nhận thông qua giá trị định lượng ngữ nghĩa, xác định dựa kết nghiên cứu lý thuyết ĐSGT có từ trước Luận văn có bố cục sau: Chương 1: Lý thuyết chung về tập mờ và lý thuyết đại số gia tử Trong chương trình bày kiến thức lý thuyết tập mờ, và một số khái niệm bản về đại số gia tử Chương 2: Khai phá luật kết hợp mờ dựa đại số gia tử Trong chương trình bày luật kết hợp mờ, thuật toán khai phá luật kết hợp mờ dựa đại số gia tử Chương : Ứng dụng ĐSGT giải toán khai phá liệu Trong chương trình bày toán, thuật toán cách giải toán khái phá luật kết hợp mờ dựa đại số gia tử cách sử dụng giá trị định lượng ngữ nghĩa hạng từ đại số gia tử 54 Method of Approximate Reasoning in Medical Expert Systems”, Tạp chí Tin học Điều khiển, Tập18,(3),Tr 237-252 [10] Van Hung Le, Cat Ho Nguyen, Fei Liu, Semantics and Aggregation of Linguistic Information Based on Hedge Algebras, The Third International Conference on Knowledge, Information and Creativity Support Systems, KICSS 2008, Hanoi, Vietnam, Dec 22-23, 2008, 128135 [11] Van Nam Huynh, Cat Ho Nguyen, Yoshiteru Nakamori, MEDM in General Multi-granular Hierarchical Linguistic Contexts Based on The 2-Tuples Linguistic Model, In Proc of IEEE Int Conf on Granular Computing, pages 482–487, 2005 [12] F Herrera and L Martinez, A Model Based on Linguistic 2-Tuples for Dealing with Multigranular Hierachical Linguistic Contexts in MultiExpert Decision-Making, IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS, Vol.31, No.2 (2001), 227-234 [13] M Delgado, F Herrera, E Herrera-Viedma, L Martinez (1998), “Combining numerical and linguistic information in group decision making Journal of Information Sciences 107”, tr 177-194 [14] Didier Dubois, Henri Prade (2000), Fuzzy Sets and Fuzzy InformationGranulation Theory: Key selected papers by Lotfi A Zadeh: Da Ruan and Chongfu Huang (Eds.), Beijing Normal University Press, Beijing, 2000, 360pp., ISBN 7-303-05326-1 55 PHẦN PHỤ LỤC Mã nguồn chương trình: import javax.swing.DefaultListModel; import javax.swing.table.DefaultTableModel; import javax.swing.table.JTableHeader; import javax.swing.table.TableColumn; import javax.swing.table.TableColumnModel; /* * To change this template, choose Tools | Templates * and open the template in the editor */ /* * Luatkethop.java * * Created on Jul 25, 2012, 9:44:13 PM */ /** * * @author Admin */ public class Luatkethop extends javax.swing.JFrame { HAAssociationRules ascRules = new HAAssociationRules(); /** Creates new form Luatkethop */ 56 public Luatkethop() { initComponents(); } /** This method is called from within the constructor to * initialize the form * WARNING: Do NOT modify this code The content of this method is * always regenerated by the Form Editor */ @SuppressWarnings("unchecked") // //GENBEGIN:initComponents private void initComponents() { tblData = new javax.swing.JScrollPane(); jTable1 = new javax.swing.JTable(); jButton1 = new javax.swing.JButton(); jButton2 = new javax.swing.JButton(); jLabel1 = new javax.swing.JLabel(); jLabel2 = new javax.swing.JLabel(); jtfSH = new javax.swing.JTextField(); jtfSC = new javax.swing.JTextField(); jButton4 = new javax.swing.JButton(); jtfConfTheta = new javax.swing.JTextField(); jLabel3 = new javax.swing.JLabel(); jtfSuppTheta = new javax.swing.JTextField(); jLabel4 = new javax.swing.JLabel(); 57 jButton5 = new javax.swing.JButton(); jScrollPane1 = new javax.swing.JScrollPane(); lstItemset = new javax.swing.JList(); jScrollPane2 = new javax.swing.JScrollPane(); lstRules = new javax.swing.JList(); jButton3 = new javax.swing.JButton(); setDefaultCloseOperation(javax.swing.WindowConstants.EXIT_ON_C LOSE); setTitle("Khai phá luật kết hợp"); jTable1.setModel(new javax.swing.table.DefaultTableModel( new Object [][] { {null, null, null, null}, {null, null, null, null}, {null, null, null, null}, {null, null, null, null} }, new String [] { "Title 1", "Title 2", "Title 3", "Title 4" } )); tblData.setViewportView(jTable1); jButton1.setText("Lấy liệu mặc định"); jButton1.addActionListener(new java.awt.event.ActionListener() { 58 public void actionPerformed(java.awt.event.ActionEvent evt) { jButton1ActionPerformed(evt); } }); jButton2.setText("Lấy liệu ngẫu nhiên"); jButton2.addActionListener(new java.awt.event.ActionListener() { public void actionPerformed(java.awt.event.ActionEvent evt) { jButton2ActionPerformed(evt); } }); jLabel1.setText("Nhập số hàng:"); jLabel2.setText("Nhập số cột:"); jButton4.setText("Sinh tập phổ biến"); jButton4.addActionListener(new java.awt.event.ActionListener() { public void actionPerformed(java.awt.event.ActionEvent evt) { jButton4ActionPerformed(evt); } }); jtfConfTheta.setText("0.9"); jLabel3.setText("Nhập độ tin cậy"); 59 jtfSuppTheta.setText("0.5"); jLabel4.setText("Nhập độ hỗ trợ"); jButton5.setText("Sinh tập luật kết hợp"); jButton5.addActionListener(new java.awt.event.ActionListener() { public void actionPerformed(java.awt.event.ActionEvent evt) { jButton5ActionPerformed(evt); } }); jScrollPane1.setViewportView(lstItemset); jScrollPane2.setViewportView(lstRules); jButton3.setText("Nhập tay"); jButton3.addActionListener(new java.awt.event.ActionListener() { public void actionPerformed(java.awt.event.ActionEvent evt) { jButton3ActionPerformed(evt); } }); javax.swing.GroupLayout layout = new javax.swing.GroupLayout(getContentPane()); getContentPane().setLayout(layout); layout.setHorizontalGroup( 60 layout.createParallelGroup(javax.swing.GroupLayout.Alignment.LEAD ING) addGroup(layout.createSequentialGroup() addContainerGap() addGroup(layout.createParallelGroup(javax.swing.GroupLayout.Align ment.LEADING) addComponent(tblData, javax.swing.GroupLayout.DEFAULT_SIZE, 765, Short.MAX_VALUE) addGroup(layout.createSequentialGroup() addComponent(jButton1) addGap(90, 90, 90) addComponent(jLabel1) addPreferredGap(javax.swing.LayoutStyle.ComponentPlacement.REL ATED) addComponent(jtfSH, javax.swing.GroupLayout.DEFAULT_SIZE, 67, Short.MAX_VALUE) addGap(18, 18, 18) addComponent(jLabel2) addPreferredGap(javax.swing.LayoutStyle.ComponentPlacement.REL ATED) addComponent(jtfSC, javax.swing.GroupLayout.DEFAULT_SIZE, 68, Short.MAX_VALUE) addGap(18, 18, 18) 61 addComponent(jButton3) addGap(18, 18, 18) addComponent(jButton2)) addGroup(layout.createSequentialGroup() addGroup(layout.createParallelGroup(javax.swing.GroupLayout.Align ment.LEADING) addGroup(layout.createSequentialGroup() addComponent(jLabel4) addPreferredGap(javax.swing.LayoutStyle.ComponentPlacement.REL ATED) addComponent(jtfSuppTheta, javax.swing.GroupLayout.PREFERRED_SIZE, 58, javax.swing.GroupLayout.PREFERRED_SIZE) addGap(18, 18, 18) addComponent(jButton4)) addComponent(jScrollPane1, javax.swing.GroupLayout.PREFERRED_SIZE, 373, javax.swing.GroupLayout.PREFERRED_SIZE)) addGap(18, 18, 18) addGroup(layout.createParallelGroup(javax.swing.GroupLayout.Align ment.TRAILING) addGroup(layout.createSequentialGroup() addComponent(jLabel3) 62 addPreferredGap(javax.swing.LayoutStyle.ComponentPlacement.REL ATED) addComponent(jtfConfTheta, javax.swing.GroupLayout.PREFERRED_SIZE, 65, javax.swing.GroupLayout.PREFERRED_SIZE) addGap(18, 18, 18) addComponent(jButton5)) addComponent(jScrollPane2, javax.swing.GroupLayout.PREFERRED_SIZE, 374, javax.swing.GroupLayout.PREFERRED_SIZE)))) addContainerGap()) ); layout.setVerticalGroup( layout.createParallelGroup(javax.swing.GroupLayout.Alignment.LEAD ING) addGroup(layout.createSequentialGroup() addGap(11, 11, 11) addGroup(layout.createParallelGroup(javax.swing.GroupLayout.Align ment.BASELINE) addComponent(jButton1) addComponent(jButton2) addComponent(jButton3) addComponent(jLabel1) addComponent(jLabel2) 63 addComponent(jtfSH, javax.swing.GroupLayout.PREFERRED_SIZE, javax.swing.GroupLayout.DEFAULT_SIZE, javax.swing.GroupLayout.PREFERRED_SIZE) addComponent(jtfSC, javax.swing.GroupLayout.PREFERRED_SIZE, javax.swing.GroupLayout.DEFAULT_SIZE, javax.swing.GroupLayout.PREFERRED_SIZE)) addPreferredGap(javax.swing.LayoutStyle.ComponentPlacement.REL ATED) addComponent(tblData, javax.swing.GroupLayout.PREFERRED_SIZE, 248, javax.swing.GroupLayout.PREFERRED_SIZE) addGap(18, 18, 18) addGroup(layout.createParallelGroup(javax.swing.GroupLayout.Align ment.BASELINE) addComponent(jLabel4) addComponent(jtfSuppTheta, javax.swing.GroupLayout.PREFERRED_SIZE, javax.swing.GroupLayout.DEFAULT_SIZE, javax.swing.GroupLayout.PREFERRED_SIZE) addComponent(jButton4) addComponent(jLabel3) addComponent(jtfConfTheta, javax.swing.GroupLayout.PREFERRED_SIZE, javax.swing.GroupLayout.DEFAULT_SIZE, javax.swing.GroupLayout.PREFERRED_SIZE) addComponent(jButton5)) 64 addPreferredGap(javax.swing.LayoutStyle.ComponentPlacement.UNR ELATED) addGroup(layout.createParallelGroup(javax.swing.GroupLayout.Align ment.LEADING) addComponent(jScrollPane2, javax.swing.GroupLayout.DEFAULT_SIZE, 182, Short.MAX_VALUE) addComponent(jScrollPane1, javax.swing.GroupLayout.DEFAULT_SIZE, 182, Short.MAX_VALUE)) addContainerGap()) ); pack(); }// //GEN-END:initComponents private void jButton1ActionPerformed(java.awt.event.ActionEvent evt) {//GEN-FIRST:event_jButton1ActionPerformed // TODO add your handling code here: ascRules.initDefault(); jtfSH.setText(""+ascRules.data.mSize); jtfSC.setText(""+ascRules.data.mNumAttr); showData(true); }//GEN-LAST:event_jButton1ActionPerformed 65 private void jButton2ActionPerformed(java.awt.event.ActionEvent evt) {//GEN-FIRST:event_jButton2ActionPerformed // TODO add your handling code here: ascRules.initRandom(Integer.parseInt(jtfSH.getText()), Integer.parseInt(jtfSC.getText())); showData(true); }//GEN-LAST:event_jButton2ActionPerformed private void jButton4ActionPerformed(java.awt.event.ActionEvent evt) {//GEN-FIRST:event_jButton4ActionPerformed // TODO add your handling code here: ascRules.generateLargeItemset(Float.parseFloat(jtfSuppTheta.getText())); DefaultListModel lm = new DefaultListModel(); lm.addElement("Số tập phổ biến sinh #"+ascRules.largeItemsets.size()); for(int i=0;i[...]... trúc logic đa trị tựa trên đoạn [0, 1] là cơ sở để xây dựng và 20 phát triển logic mờ và lập luận mờ Vì vậy sự “tương đồng” dựa trên định lý trên chứng tỏ thêm giá trị của cách tiếp cận đại số này Các kết quả mở rộng đối với các toán tử sup, inf, gọi là đại số gia tử mở rộng đối xứng, đồng thời mịn hoá đại số gia tử, đưa thêm các toán tử hoặc, và liên kết các gia tử tạo thành các gia tử mới Nhưng vấn đề... là đồng nghĩa và chỉ còn một đại diện trong đại số gia tử Giả thiết này biến đại số gia tử thành một tập sắp xếp thứ tự tuyến tính 1.4.2.3 Các hàm đo Định nghĩa 1.1.2.3.1 (Hàm đo trên đại số gia tử) : Cho đại số gia tử mở rộng đối xứng (T, G, H, ≤), f: T→[0, 1] là một hàm đo trên T nếu thoả mãn: (1)∀t∈T: f(t) ∈ [0, 1], f(g+) = 1, f(g-) = 0; trong đó: g+, g- ∈ G, là các phần tử sinh dương và âm (2)∀x,... thì f-1(a)≤f-1(b) Mỗi đại số gia tử đối xứng đều định nghĩa được hàm đo và hàm ngược của nó vì sự đồng cấu giữa đại số gia tử với miền [0, 1] Việc giả thiết các gia tử trong tập H đều sánh được với nhau giúp cho định nghĩa hàm đo dễ dàng hơn Thông qua hàm đo ta có thể phần nào so sánh được mức độ ngữ nghĩa giữa các phần tử của các đại số gia tử khác nhau Ví dụ, từ hai đại số gia tử chiều_cao và cân_nặng... gọi là phần tử sinh âm ký hiệu là f và ta có f < t (Trong ví dụ trên, t tương ứng với true là dương, còn f tương ứng với false là âm) 1.4.2 Định nghĩa đại số gia tử Một cấu trúc đại số AT = (T, G, H, ≤) với H được phân hoạch thành H+ và H- các gia tử ngược nhau được gọi là một đại số gia tử nếu nó thỏa mãn các tiên đề sau: (1) Mỗi gia tử hoặc là dương hoặc là âm đối với bất kỳ một gia tử nào khác,... thì các phương pháp lập luận xây dựng trên đó đem lại những lợi ích gì? Thông qua lý thuyết về đại số gia tử ta có thể thấy rằng tập các giá trị của một biến ngôn ngữ (biến mà giá trị của nó được lấy trong miền ngôn ngữ) là một cấu trúc đại số đủ mạnh để tính toán Lý thuyết đại số gia tử đã cố gắng nhúng tập ngôn ngữ vào một cấu trúc đại số thích hợp và tìm cách xem chúng như là một đại số để tiên đề... là âm) Đặc biệt phần đối nghịch của w được định nghĩa chính là w Phần tử đối nghịch của x được ký hiệu là –x với chỉ số nếu cần thiết Nhìn chung một phần tử có thể có nhiều phần tử đối nghịch Nếu mỗi phần tử của T chỉ có duy nhất một phần tử đối nghịch thì AT được gọi là đại số gia tử đối xứng 1.4.2.1 Một số tính chất của đại số gia tử Định lý sau cho thấy tính thứ tự ngữ nghĩa của các hạng từ trong... 1.4.2.2 Các đại lượng đo trên đại số gia tử Theo định lý 5 tồn tại một đẳng cấu giữa một đại số gia tử mở rộng đối xứng và cấu trúc logic đa trị tựa trên miền [0, 1] Chính điều này cho phép ta thiết lập một hàm đo trên đại số gia tử chuyển một giá trị của đại số gia tử mở rộng đối xứng (lớp các đại số gia tử được quan tâm ở luận văn này) thành một giá trị trong miền [0, 1] Để xây dựng hàm đo, ta giả thiết... “không nặng lắm” Với hàm đo, ta đã có thể định lượng được các phần tử trong cùng một đại số gia tử mở rộng đối xứng, để trên cơ sở đó định nghĩa khoảng cách biểu thị mức độ khác biệt giữa hai giá trị này Định nghĩa 1.4.2.3.3.Cho đại số gia tử mở rộng đối xứng (T, G, H, ≤), f là một hàm đo trên T, thì khoảng cách giữa hai giá trị của đại số gia tử được định nghĩa bằng: D(x, y) = |f(x) - f(y)| Hàm tương tự... những lý do đó có thể xem mỗi một đại số gia tử đối xứng là một cơ sở đại số cho một logic các giá trị ngôn ngữ Định lý tiếp theo nói về mối quan hệ với miền [0, 1] Định lý 5 Nếu tập các toán tử (gia tử) H+ và H- có quan hệ thứ tự sắp xếp tuyến tính thì có tồn tại một đẳng cấu � từ đại số gia tử đối xứng AT = (T, G, H, -, ∪, ∩, ⇒, ≤) vào cấu trúc logic đa trị tựa trên đoạn [0, 1] sao cho: (1) Bảo toàn... thuộc của tập mờ R Dấu ∫ biểu diễn hình thức của hàm thuộc, có thể một trong ba trường hợp là hữu hạn hoặc đếm được hoặc liên tục Quan hệ mờ cũng có các phép tính cơ bản như trên tập mờ vì bản thân nó cũng là tập mờ Ngoài ra, quan hệ mờ có những phép tính đặc thù riêng mà trên tập mờ không có, đó là phép hợp thành dưới đây Định nghĩa 7 [1] Cho R là một quan hệ mờ trên U×V và S là quan hệ mờ trên V×W Khi ... β AX, AT AX W Ý nghĩa Đại số gia tử Tổng độ đo tính mờ gia tử âm Tổng độ tính mờ gia tử dương Đại số gia tử Đại số gia tử tuyến tính đầy đủ Phần tử trung hòa đại số gia tử iii DANH MỤC CÁC HÌNH... thức, khai phá liệu, tập trung vào vấn đề khai phá luật kết hợp ứng dụng lý thuyết Đại số gia tử khai phá luật kết hợp CSDL Khai phá liệu, cụ thể trích xuất luật kết hợp từ sở liệu, có xuất phát điểm... coi đồng nghĩa đại diện đại số gia tử Giả thiết biến đại số gia tử thành tập xếp thứ tự tuyến tính 1.4.2.3 Các hàm đo Định nghĩa 1.1.2.3.1 (Hàm đo đại số gia tử) : Cho đại số gia tử mở rộng đối

Ngày đăng: 09/12/2016, 22:16

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w