1. Trang chủ
  2. » Luận Văn - Báo Cáo

LUẬN án TIẾN sĩ NGÀNH máy TÍNH một số PHƯƠNG PHÁP xử lý TRUY vấn mới TRÊN cơ sở dữ LIỆU HƯỚNG đối TƯỢNG mờ

152 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Một Số Phương Pháp Xử Lý Truy Vấn Mới Trên Cơ Sở Dữ Liệu Hướng Đối Tượng Mờ
Tác giả Nguyễn Tấn Thuận
Người hướng dẫn GS.TS. Đoàn Văn Ban, TS. Trương Ngọc Châu
Trường học Viện Hàn Lâm Khoa Học Và Công Nghệ Việt Nam
Chuyên ngành Hệ thống thông tin
Thể loại luận án
Năm xuất bản 2021
Thành phố Hà Nội
Định dạng
Số trang 152
Dung lượng 1,02 MB

Cấu trúc

  • 1.1 Giớithiệubài toán (17)
  • 1.2 Cácnghiêncứuliênquan (18)
    • 1.2.1 Các môhình CSDLHĐTmờ (18)
    • 1.2.2 Tiền xửlýdữliệu (đốisánh vàgomcụm)chomôhìnhCSDLHĐTmờ (20)
    • 1.2.3 Xửlývàtốiưuhóatruyvấn mờ (20)
  • 1.3 Cácvấn đềnghiên cứuvàgiảipháp (21)
    • 1.3.1 Biểu diễnthôngtinkhônghoànhảotrong môhình kháiniệmdữliệu mờ (21)
    • 1.3.2 Mô hìnhhóa UMLcủadữliệu mờ (23)
    • 1.3.3 Lớpmờ (24)
    • 1.3.4 Giátrịthuộctính mờ (27)
    • 1.3.5 Biểudiễncácgiátrịthuộctínhmơ hồchođốitượng mờ (28)
    • 1.3.6 Quan hệtổng quáthóa mờ (31)
    • 1.3.7 Quanhệkếttập mờ (0)
    • 1.3.8 Quanhệkếthợp mờ (39)
    • 1.3.9 Quan hệphụthuộcmờ (42)
    • 1.3.10 Ánh xạ mô hình dữ liệu UML mờ vào mô hình cơ sở dữ liệu hướng đốitượngmờ (44)
      • 1.3.10.1 Môhình cơsở dữliệuhướngđốitượng mờ(FOODB) (44)
      • 1.3.10.2 Chuyểnđổibiểuđồlớp UML mờ (45)
      • 1.3.10.3 Chuyểnđổicáclớp (45)
      • 1.3.10.4 Chuyểnđổiquanhệkếttập (48)
      • 1.3.10.5 Chuyểnđổiquanhệkếthợp (49)
      • 1.3.10.6 Chuyểnđổicácquanhệphụthuộc (51)
    • 1.3.11 TruyvấnmờFOQL (52)
  • 1.4 Giảiphápchobàitoán (52)
  • 1.5 Kếtluậnchương1 (53)
  • 2.1 Xửlýtruyvấn mờdựavào độđotươngtự (55)
    • 2.1.1 Sosánhtínhtươngtựcủahai đối tượng mờ (55)
      • 2.1.1.1 Độđotương tựvàphitương tự (56)
      • 2.1.1.2 Độđongữnghĩacủadữ liệu mờ (57)
      • 2.1.1.3 Sosánhhaiđối tượngdựavàođộđotươngtựmờ (58)
    • 2.1.2 Thuật toánxửlý truyvấndựavàođộđotươngtự (0)
  • 2.2 Xửlýtruyvấnmờdựavào kỹthuậtgomcụmdữliệuvàphânkhoảngmờ (80)
    • 2.2.1 Phươngphápgomcụmdữliệu bằngthuậttoánEM (80)
      • 2.2.1.1 MôhìnhGaussianMixtureModel (80)
      • 2.2.1.2 Thuậttoán EM (81)
      • 2.2.1.3 Thuật toán gom cụm cải tiến EMC sử dụng mô hình thống kê hỗnhợpGMM (0)
      • 2.2.1.4 ĐánhgiáthuậttoánEMC dựatrênLogLikelihood (91)
      • 2.2.1.5 Đánh giá thuật toán EMC bằng phương pháp phân tích sự khác biệtgiữacácnhóm (91)
    • 2.2.2 Phân cáckhoảngmờ (94)
      • 2.2.2.1 Xácđịnhtâm (94)
      • 2.2.2.2 Xác địnhcáckhoảng (95)
    • 2.2.3 Xử lýtruyvấndựa trên các khoảngmở (96)
    • 2.2.4 Thuật toánxử lý truyvấntrêncáccụm (0)
  • 2.3 Xửlýtruyvấndựavàođạisốgiatử (101)
  • 2.4 Đánhgiáthựcnghiệm (102)
  • 2.5 Kếtluậnchương2 (103)
  • 3.1 Cácphéptoán đạisốtrongcơsởdữliệu hướngđốitượngmờ (106)
    • 3.1.1 Đạisốđốitượng (106)
    • 3.1.2 Đạikếthợp mờ (106)
    • 3.1.3 Mô hìnhđại sốkếthợpcácđốitượng mờ (106)
    • 3.1.4 Cácphéptoánđại sốkếthợpmờ (107)
      • 3.1.4.1 Tích mờ× (109)
      • 3.1.4.2 Kết nối mờ⋈ (0)
      • 3.1.4.3 Phéphợpmờ𝖴 (110)
      • 3.1.4.4 Phéptrừmờ≃ (110)
      • 3.1.4.5 Phépgiaomờ∩ (112)
      • 3.1.4.6 Phépchiamờ÷ (112)
    • 3.1.5 Cácphéptoánmởrộng (113)
      • 3.1.5.1 Phépchiếu mờ𝜫 (0)
      • 3.1.5.2 Phépchọnmờ (113)
  • 3.2 Ngôn ngữtruyvấnmờFOQL (114)
    • 3.2.1 TruyvấnmờFOQL (114)
    • 3.2.2 Môhìnhlớp mờ (114)
    • 3.2.3 Cấutrúccâutruyvấnmờ (116)
    • 3.2.4 Phươngphápxử lýtruyvấnmờ (116)
      • 3.2.4.1 Cácbước củaphươngpháp (116)
      • 3.2.4.2 Quytrìnhxử lýtruyvấnmờ (118)
      • 3.2.4.3 Câytruyvấnvàđồthịtruyvấn (118)
  • 3.3 Tốiưuhóatruyvấnmờ (122)
    • 3.3.1 Cácphépbiếnđổitươngđương (122)
      • 3.3.1.1 Tối ưuhóakếhoạch thực thi truyvấn (0)
      • 3.3.1.2 Khônggiantìmkiếmvàcácluậtchuyểnđổi (0)
      • 3.3.1.3 Thuậttoántốiưuhóatruyvấnmờ (125)
      • 3.3.1.4 Đánhgiáthựcnghiệm (129)
  • 3.4 Kếtluậnchương3 (130)

Nội dung

Giớithiệubài toán

Hệ thống thông tin đã cách mạng hóa cách thức lưu trữ và xử lý thông tin đadạng, phức tạp Kết quả là, khối lượng thông tin đã tăng lên đáng kể dẫn đến quá tảithông tin Do đó, việc phân tích lượng lớn dữ liệu có sẵn và đưa ra các quyết địnhquảnlýphùhợptrởnênkhókhăn.Trongthựctế,hệthốngthôngtinchủyếusửdụngCSDLquanh ệ[12],[14],[34]-[38],hoặcCSDLhướngđốitượng[39]-

[42]đểlưutrữcáctậphợpdữliệunày.CảhaimôhìnhCSDLquanhệvàCSDLhướngđốitượngcókhảnă ngđủđểxửlýđốitượngphứctạpnhưngbịhạnchếđốivớicácđạidiệndữliệukhôngchínhxáchoặckh ôngchắcchắn.Mộtvấnđềkhác,sửdụngmôhìnhquanhệ, hướng đối tượng đang gặp phải nhiều hạn chế của việc mô tả và xử lý các thôngtinkhôngchắcchắn,khôngđầyđủ,theođólàmộtquytrìnhtruyvấnkhôngphùhợpchoviệcraq uyếtđịnh.Thêmvàođó,cáchệthốngnàychỉcóthểxửlýdữliệu"cứng"(chínhxácvàxácđịnh)trongtựnhi ên.Tuynhiên,nhiềuứngdụngtrongthếgiớithựcluôn liên quan đến dữ liệu "mềm" (mơ hồ và không chính xác) Do đó, việc nghiêncứuứngdụngcơsởdữliệumờvàxửlýtruyvấnđểgiảiquyếtnhững hạnchếcủacơsởdữliệuquanhệ/hướngđốitượngrõtrongviệcxửlývàlưutrữcácthôngtinkhôngchắcc hắn,khôngđầyđủtrởthànhmộtchủđềnghiêncứuquantrọngđượcnhiềunhàkhoahọc tậptrungnghiêncứu[2],[17],[30],[43] -[68].

Hơn nữa, cuộc cách mạng công nghiệp lần thứ tư, hay còn gọi là “Công nghiệp 4.0”(I4.0) được giới thiệu bởi Hamburg 2013 [102], đang được thực hiện trong nhữngnăm gần đây và tiếp theo dự kiến sẽ thay đổi sâu sắc các quy trình sản xuất và chếtạotrongtươnglai,dẫnđếncácnhàmáythôngminhvàmôitrườngcôngnghiệpđượcnối mạng sẽ được hưởng lợi từ các nguyên tắc thiết kế của công nghệ này: khả năngtương tác, ảo hóa, phân quyền, điều khiển và giao tiếp phân tán, khả năng thời gianthực,địnhhướngdịchvụ,bảotrìnhanhchóngvàdễdàngchiphíthấp[103].Vềcôngnghệ hiện đại, Công nghiệp 4.0 gắn liền với việc ứng dụng và xử lý dữ liệu thôngminhtrongcáclĩnhvực:hệthốngthầnkinhnhântạo,Internetcôngnghiệp,giảiphápđámmâyvà dịchvụphitậptrung,cũngnhưxửlývàkhaithácdữliệulớn.Cáccôngtrìnhc ủ a K l a u s -

Lawrence Wichmann, Boris Eisenbart và Kilian Gericke [105] dành cho nhữngnghiên cứu này về công nghệ xử lý dữ liệu lớn theo thời gian thực Bên cạnh đó, cácdịch vụ tư vấn trực tuyến cũng đã xuất hiện trên các ứng dụng web thông qua côngcụtưvấntựđộngchatbot[106], [107]bằngcáchứngdụngtrítuệnhântạovàdữliệuđám mây nhằm cung cấp thông tin cho khách hàng Hay như, robot có thể giao tiếpvớiconngườibằngngônngữtựnhiên[108].Quađótacóthểnhậnthấyrằngtiềnxửlý dữ liệu là một bước rất quan trọng trong việc giải quyết xử lý truy vấn CSDL vànhư vậy cơ sở dữ liệu hướng đối tượng mờ cũng cần có các bước tiền xử lý dữ liệunhưvậy.Trongluậnánnày,tácgiảtậptrungnghiêncứu,pháttriểncácphươngphápxửlýtruyvấn,cácphéptoánđạisốđốitượngmờ,ngônngữtruyvấnmờvàcácthuậttoán tiền xử lý dữ liệu Nhằm đảm bảo cho hệ thống CSDL HĐT mờ hoàn thiện hơntrongcáccơchếvận hành,xử lýdữ liệu mờ.

Cácnghiêncứuliênquan

Các môhình CSDLHĐTmờ

1) MôhìnhcơsởdữliệuhướngđốitượngmờđãđượcđềxuấtbởiM.Umanovà các cộng sự

[22], trong đó giá trị của thuộc tính đối tượng là các giá trịmờvớimộthệsốchắcchắn,vàmộtngônngữthaotácdữliệutrênmôhìnhnàylàSQL.

2) MôhìnhCSDLhướngđốitượngmờvàkhôngchắcchắnđượcđềxuấtbởiGyseghem và Caluwe [23], đặc tả tính mờ và không chắc chắn bằng cáchsử dụng lần lượt các tập mờ và phân bố khả năng Hành vi và cấu trúc củađối tượng có thể được định nghĩa không đầy đủ, từ đó cho phép đặc tả đượccác thể hiện của các đối tượng một cách tự nhiên như trong thế giới thực.Thừa kế bộ phận, thừa kế có điều kiện và đa thừa kế cũng được giới thiệutrong môhìnhnày.

[21] bằng cách mở rộng mô hình đối tượng dựa trên đồ thị.Mứcđộmờđượcbiểudiễnbởicáctừchỉ mức độ,chẳnghạnnhư{không, rất lưu loát, lưu loát, trung bình, cao, rất cao, hoàn toàn}, kết hợp với thểhiện mối quan hệ giữa các đối tượng với một lớp Các khái niệm lớp mờ,phâncấplớpmờvàcácphéptoánđượcđịnhnghĩadựatrênđồthịđểchọn,duyệt CSDL hướng đối tượng mờ được sử dụng để biểu diễn và xử lý cácthôngtinmờ.

4) Dựatrênquanhệtươngtự,phạmvicủacácgiátrịthuộctínhđượcsửdụngđểbiểudiễntậ pcácgiátrịchophépcủamộtthuộctínhtrongmộtlớpđượctrìnhbàytrong[24].Độthuộc thànhviêncủađốitượngthuộcvàomộtlớpđượctínhdựatrênmức độbaohàmcácgiátrịthuộctínhcủađốitượngvàtrong các phạm vi giá trị thuộc tính của lớp Phân cấp lớp mạnh hay yếuđượcxácđịnhdựavàosựtăngđềuhaygiảmđềutheođộthuộcthành viêncủamộtlớpconvàotronglớpchacủanó.

5) Dựavàolýthuyếtkhảnăng,tínhmơhồđượcbiểudiễntrongphâncấplớp,các miền mờ của các thuộc tính lớp con được xác định bằng cách thu hẹpmiền của các thuộc tính của lớp cha, mức độ bao hàm của lớp con tronglớpchađượcxácđịnhdựatrênmứcđộbaohàmcácmiềnmờcủacácthuộctính của lớp cha đối với các miền mờ của các thuộc tính của lớp con [25].Cũng dựa trên phân bố khả năng, trong [26] một số khái niệm chính trongCSDLhướngđốitượngchẳnghạnđốitượng,cácmốiquanhệđốitượng/lớp, lớp con/lớp cha và đa thừa kế được đưa ra trong môi trườngthôngtinmờ.

6) MôhìnhdựatrênlýthuyếtxácsuấtđầutiêndonhómtácgiảKornatzkyvàShimony đề xuất năm 1994 [27] Trong mô hình này, lớp được định nghĩanhư một tập các thuộc tính mà giá trị của chúng có thể kết hợp với mộtphân bố xác suất Lược đồ được định nghĩa như một tập các lớp có phâncấp kết hợp với xác suất có điều kiện để một đối tượng của một lớp thuộcvề lớp con của nó Các tác giả cũng đã phát triển một ngôn ngữ truy vấnđểthaotácchọncácđốitượngthỏamộtxácsuấtđượckếthợpvớicáctruyvấn.Bênc ạnhđómộtmôhìnhmớivềxácsuấtđãđượcđềxuất[28]nhằmmôtảmộtdiễndịchxác suấtcủacácquanhệtrêncácgiátrịtậpmờvàmộtđạisốchocácbộbaxácsuấtmờđượcn ghiêncứuvàđịnhnghĩa mộtcáchhìnhthức.

Tiền xửlýdữliệu (đốisánh vàgomcụm)chomôhìnhCSDLHĐTmờ

[29] tách được các cụm đối tượng dựa trên phân loại mẫu, trong đó nhãncụmgánchomỗiđốitượngđượcbiểudiễnbằngmộttậphợpcácđặctrưngmờ. GNP là một trong những thuật toán tiến hóa và khám phá các quy tắcmờ từ cơ sở dữ liệu hướng đối tượng mờ Việc tối ưu hóa các cụm đượcthựchiệnđểcácđốitượngcóđộtươngtựcaođượcđưavàocùngmộtcụm.

2) Nhằm mục đích phân biệt các đối tượng trong cơ sở dữ liệu hướng đốitượng mờ, L Yan và Z M Ma [30] sử dụng độ đo ngữ nghĩa của dữ liệumờ, để so sánh một cách tổng quát hơn các đối tượng và lớp với kiểu dữliệu mờ.

3) Mộttrongnhữngvấnđềquantrọngnhấttrongcơsởdữliệumờlàlàmthếnàođểquảnl ýsựxuất hiệncủasựmơhồ,khôngchínhxácvàkhôngchắcchắn Các phương pháp đánh giá tính tương tự là cần thiết để tìm các đốitượnggầnvớicácđốitượngmờđãchokháchoặcđượcsửdụngtrongmộttruy vấn mơ hồ của người dùng Các phương pháp như vậy cũng có thểđược sử dụng trong cơ sở dữ liệu mờ hoặc thậm chí mô hình cơ sở dữ liệuquan hệ cổ điển Y Bashon và các cộng sự [31] đề xuất phương pháp tínhtoán tính tương tự để so sánh hai đối tượng mờ thông qua các thuộc tínhmờbằngcáchsửdụngđộđokhoảngcáchEuclide.Sosánhđượcthựchiệnchohaitrư ờnghợp:cảhaithuộctínhlàmờhoặcmộtthuộctínhrõvớimộtthuộctínhmờ.

4) Y Bashon và các cộng sự [4] phát triển phép đo độ tương tự dựa trên môhìnhđốisánhTverskyvàápdụngnótrêncáctậpmờbằngcáchsửdụnglýthuyết tập mờ và các phép toán của chúng Mô hình này cung cấp mộtphươngpháp sosánh cácđốitượngcónộidung mơhồ/ mờ.

Xửlývàtốiưuhóatruyvấn mờ

1) S.NavàS.Park[32]đềxuấtmôhìnhdữliệuhướngđốitượngmờmới(F-model) và định nghĩa đại số kết hợp mờ mở rộng (FA-algebra) F- modelhỗtrợcáclớpmờvàliênkếtmờgiữacácđốitượngmờ.BằngđạisốFA mở rộng dựa trên các kết hợp mờ, truy vấn mờ được đề xuất nhằm xử lýcácgiá trịmờvàngônngữ giatử.

2) P.K.PanigrahivàA.Goswami[19]thiếtkếđạisốđốitượngdựatrêncáckhía cạnh kiểu và tập hợp của lớp Một khuôn mẫu được nêu ra để thựchiệncácphéptoánlýthuyếttậphợp,cụthểlàphéphợp,phépgiaovàphéphiệu dựa trên trên cấu trúc lớp Các phép toán thiết lập trên thành viên củalớp tương ứng chứa các đối tượng mờ được phát triển bằng cách sử dụnggiátrịchânlýcủa đốitượngvànhậndạngđối tượng.

Cácvấn đềnghiên cứuvàgiảipháp

Biểu diễnthôngtinkhônghoànhảotrong môhình kháiniệmdữliệu mờ

Mụctiêucủacơsởdữliệumờlàchủyếuxửlýthôngtinkhônghoànhảotrongcơsởdữliệu.Cácloạith ôngtinkhông hoànhảođược phân biếtnhư sau[23]:

 Sựkhôngnhấtquán:làmộtloạingữnghĩathể hiệnkhảnăngsungđộtkhixétmột số khía cạnh của thế giới thực không thể biểu diễn được nhiều hơn mộtlầntrongcơsởdữ liệu (khiđộtuổicủamộtngườiđượclưutrữlà34và37);

 Tính không chính xác: có liên quan đến nội dung của giá trị thuộc tính và cónghĩa là lựa chọn phải được thực hiện từ một phạm vi (khoảng thời gian hoặctậphợp)đãcho(tuổicủamộtngườilàtậphợp{17,18,19,20}hoặcchiềucaonằmtrong khoảng[1.00 -1.95]);

 Sựmơhồ:giốngnhưsựthiếuchínhxácnhưngthườngđượcthểhiệnbằngcácgiátrịngônn gữ(tuổicủamộtngười là“trẻ”);

 Tínhkhôngchắcchắn:Sựkhôngchắcchắnđềcậpđếnviệcthiếuthôngtinvềcácsựkiệnc ủathếgiớithực,đểxácđịnhmộtphátbiểuBoolean(cóthểđúnghaysai).

 Sự không rõ ràng: có nghĩa là một số yếu tố của mô hình thiếu sự hoàn chỉnhvềmặtngữnghĩadẫn đếnmộtsốcáchgiảithíchcóthểkhácnhau.

Nói chung, một số loại thông tin không hoàn hảo khác nhau có thể cùng tồntạiđốivớicùngmộtphầnthôngtin.Khôngchínhxác,khôngchắcchắnvàmơhồlàbalo ạithôngtinkhônghoànhảochínhvàcóthểđượcmôhìnhhóabằngcáctậpmờ[69]vàlýthu yếtkhảnăng[5].Nhiềucáchtiếpcậnhiệntạiđốivớitínhkhôngchínhxácvàkhôngchắcch ắndựatrênlýthuyếttậpmờ[70],[71].

Cho𝑈={𝑢 1 ,𝑢 2 ,…,𝑢 𝑛 }là mộttập hợp vàFlàmột tập con củaU.Một phầntửu củaUcóthuộcFhaykhông, cóthểmô tảbởimột hàmthuộc𝜇 𝐹 :

{0,1}màcóthểnhậngiátrịtrongkhoảng[0;1]. Định nghĩa 1.1: ChoUlà một vũ trụ các đối tượng (sau đây gọi tắt là vũ trụ), mộttậpmờF tr ên U x á cđị nhb ở i hàm thuộc𝜇 𝐹 :𝑈→ [ 0 ; 1],gá n c h o mỗi ph ầ n tửu c ủ a U mộtđộthuộc𝜇 𝐹 (𝑢) ểđể chỉđộthuộccủauvàotậpmờF.TậpmờFđượcbiểudiễndướidạng:

 F (u )đượcx e m nh ư đ ộ đ o k h ản ă n g m à m ộ t b i ế nX n h ậ ng i á t r ịu,m ộ t g i á tr ị mờđượcbiểudiễnbằngphânbốkhảnăng𝜋 𝑋[ 5 ] nhưsau:

Trongđó,𝜋 𝑋 (𝑢 𝑖 ),𝑢 𝑖∈ 𝑈 biểuthịkhảnăngmàXnhậngiátrị𝑢 𝑖 Cho X ,Flần lượtlàbiểudiễnph ânbốkhảnăngvàtậpmờchomộtgiátrịmờ,khiđó X  F Địnhnghĩa1.2:TậpmờFđượcgọi làchuẩnnếutồntạiítnhất mộtphầntử𝑢∈𝑈 saocho𝜇 𝐹 (𝑢)=1.

Ví dụ 1.1:ChoUlà tập các tuổi 37 tuổi, 39 tuổi, 41 tuổi, 43 tuổi và 45 tuổi Một giátrị mờ tuổi “Trung niên” có thể được mô tả bởi tập mờFlà tập hợp các tuổi “Trungniên”như sau:

Lý thuyết tập hợp mờ lần đầu tiên được áp dụng cho một số khái niệm cơ bảnER ở Zvieli và Chen [6] Đề xuất này đã giới thiệu tập hợp kiểu thực thể mờ, tậphợp kiểu quan hệ mờ và tập thuộc tính mờ của các kiểu thực thể (hoặc kiểu quanhệ),tạothànhbamứcmờsauđâytrongmôhìnhER.

 Mức1(Mứclượcđồ):Lớpthuộcvềmôhìnhdữliệuhaythuộctínhđịnhnghĩalớpthuộcvềlớ p vớiđộthuộc nằmtrong[0; 1].

 Mức 2 (Mức thể hiện lớp):Tính mờ liên quan đến một số thể hiện là các thểhiện của lớp, mặc dù cấu trúc dữ liệu định nghĩa lớp là rõ nhưng các thể hiệncủalớpthuộc vềlớpvớiđộthuộcnằmtrong[0;1].

 Mức3(Mứcthuộctính):Liênquanđếngiátrịcácthuộctínhcủathểhiệnlớp.Mộtthuộctín htronglớpxácđịnhmộtmiềngiátrị,khimiềngiátrịnàylàmộttậpconmờhaytậpcáctậpc onmờthìgiátrịthuộc tínhlàmờ.

Ví dụ 1.2: Xét các giá trị thành viên cho các kiểu thực thể, kiểu quan hệ và thuộctính.

Giả sử rằng ta có một mô hình ER về một thư viện bao gồm hai loại thực thể“Sách”,“Cửahàngsách”vàcómốiquanhệ“Muatừ”giữahailoạithựcthểnày.Môhìnhgiảđịnhrằn g“Cửahàngsách”làmộtloạithựcthểmờvớicấpthànhviênlà0.6.Sau đó, “Mua từ” là một kiểu quan hệ mờ với cấp thành viên là 0.6 Ngoài ra,

Sáchcóthểchứathuộctính“Kíchthước”ngoàicácthuộctínhID,Tênsách,Tácgiả,ISBN,Nhàxuấtbản,v.v.và“Kíchthước” làmộtthuộctính mờvớicấpthànhviênlà0.4.

Mô hìnhhóa UMLcủadữliệu mờ

PhầnnàymởrộngtừbiểuđồlớpUMLđểbiểudiễnthôngtinmờ[3].Vìcáccấutrúccủa UML chứa lớp và các mối quan hệ, nên việc mở rộng các cấu trúc này được tiếnhànhdựatrêncáctậpmờ.Vớimụcđíchnày, đềxuất[3]đãmôtảchínhthứcvềbiểuđồlớpUML.

Biểu đồlớp UML làmột bộ𝐷 = ( 𝐶 , 𝐴 , 𝑅 , 𝑂 , 𝑀 , 𝑆 ) , trongđ ó C l à t ậ p h ữ u h ạ n các lớp, A là tập hữu hạn các thuộc tính, R là tập các mối quan hệ, O là một tập cácđối tượng, M là một tập các phương thức và S là một tập các ràng buộc.Phần mụcnày tập trung vào các lớp, thuộc tính, mối quan hệ và đối tượng, từ đó đề xuất môhìnhsơđồ lớ p U M L n h ư sau:𝐷 =(𝐶, 𝐴,𝑅,𝑂),trongđó𝐶 = {𝑐 1 ,𝑐 2 ,…,𝑐 𝑘 },𝐴 {𝑎 1 ,𝑎 2 ,…,𝑎 𝑙 },𝑅={𝑟 1 ,𝑟 2 ,…,𝑟 𝑚 }và𝑂={ 𝑜 1 ,𝑜 2 ,…,𝑜 𝑛 } Ta có:

 R⊆C× C là mộtquanhệnhịnguyên đạidiện chotổngquáthóa,tập hợp,liênkếthoặc phụthuộc.

 Vớic i ∈C(1≤i≤k ),A(c i ) ại diện chođể mộttập các thuộctính củac i Rõ ràngA(c i )⊆{a 1 ,a 2 ,…,a l }, tứclàA(c i )⊆A.

 Đốivớia j ∈A(1≤j≤l),a j (c i )biểuthịthuộctínha j củac i Trongngữcảnhcủac i để ãcho,a j đểư ợ csửdụngthayvìa j (c i ).

 Vớic i ∈C(1≤i≤k),O(c i )cónghĩalàtậpcácđốitượngmàc i chứa.Ởđây,O (c i )⊆ {o 1 ,o 2 ,…,o n },t ức l à ,O (c i )⊆O.Đố iv ớ io p ∈O(1≤p≤n) vàa j∈ A (1 ≤ j ≤ l), o p (c i )b i ể u t h ị o p ố i để t ư ợ n g c ủ ac i vào p( a j (c i ))b i ể uthịgiátrịcủađốitượngoptrênthuộctínha j Trongngữcảnhc ủac i ã để cho,o p ược để sửdụngthayvìo p (c i )vào p (a j ) ượcđể sửdụngthayvìo p( a j (c i )). ĐểlưutrữthôngtinmờtrongbiểuđồlớpUML,môhìnhbiểuđồlớpUMLphải được mở rộng bằng cách sử dụng tập mờ và logic mờ Về mặt hình thức, một sơ đồlớpUMLmờlàmộtbộ𝐷̃=(𝐶̃,𝐴̃,𝑅̃,𝑂̃),trongđó𝐶̃làtậpcáclớpmờ,𝐴̃làtậpcácthuộctínhmờ,𝑅̃làtậpcácmốiquanhệmờ,và𝑂̃làtậpcácđốitượngmờ.

Lớpmờ

Vềmặtlýthuyết, mộtlớpcóthểđượcxemxét từhaiquanđiểmkhácnhau: a) Một lớp mở rộng (kế thừa), trong đó lớp được xác định bởi danh sách các đốitượng. b) Một lớp nguyên [3], trong đó lớp được xác định bởi một tập các thuộc tínhvàcácgiátrịcó thểchấpnhận.

Mộtlớpconđượcxácđịnhtừlớpchacủanóbằngcơchếkếthừavàđâycóthểđượccoilàtrườngh ợpđặcbiệtcủa(b)ởtrên.Cácđốitượngcócùngthuộctínhđượcnhóm thành các lớp Giả sử rằng một số đối tượng mờ có các thuộc tính tương tự vàmột lớp được định nghĩa bởi các đối tượng này Các đối tượng này thuộc về lớp cóđộthuộcthànhviênlà[0;1],làmchonótrởthànhmộtlớpmờ.Ngoàira,đốivớimộtlớp nguyên, miền của thuộc tính lớp có thể mờ Do đó, một số đối tượng có thể cócácgiátrịmờtrênthuộctínhnày,làmcholớptươngứngtrởthànhmộtlớpmờ.Cuốicùng, một lớpđượctạorabởi mộtlớp mờbằngphươngphápđặcbiệthóa,hoặcmột lớpđượctạorabởimộtsốlớp(trongđóítnhấtmộtlớp mờ)bằngphươngpháptổngquáthóa.

TheoZvielivàChen[6],mộtlớpcóbamứcđộmờ𝐷̃= (𝐶̃,𝐴̃,𝑅̃,𝑂̃) a) Mức độ mờ đầu tiên đánh giá mức độ mà lớp thuộc về mô hình dữ liệu cũngnhưmứcđộmờgiátrịthuộctínhcủalớp.Tạithờiđiểmnày,tacómộttậpmờcác lớp𝐶̃và𝑐 𝑖 là lớp của𝐶̃với mức thành viên𝜇 𝐶̃ (𝑐 𝑖 ), đi cùng với nó làmộttập mờ gồm các thuộc tính A (𝑐 𝑖 ) và𝑎 𝑗 (𝑐 𝑖 )là thuộc tính của A (𝑐 𝑖 ) với mứcthànhviên𝜇 𝐴̃ (𝑎 𝑗 (𝑐 𝑖 )). b) Mức độ mờ thứ hai đánh giá mức độ mà một số đối tượng thuộc về một lớp.Một đối tượng là mờ nếu nó chứa ít nhất một giá trị thuộc tính mờ Khi đó,mộtđốitượngnhưvậy𝑜 𝑝 (𝑐 𝑖 )làđốitượngcủalớp𝑂(𝑐 𝑖 )vớimứcthànhviên

𝜇 𝑂̃ (𝑜𝑝(𝑐 𝑖 )). c) Mức độ mờ thứ ba là các giá trị thuộc tính của các đối tượng của lớp. Mộtthuộctínhtrong mộtlớpđượcxácđịnhmột miềngiátrị.Khimiềnnàylà mộttậpconmờhoặcmộttậpcủamộttậpconmờ,giátrịcủamộtđốitượngtrên thuộctính, chẳnghạn𝑜 𝑝(𝑎 𝑗 (𝑐 𝑖) ),𝑣ớ𝑖1≤𝑝 ≤𝑛,làmộtmiềnmờđượcbiểu diễn bằng phân bố khả năng{(𝑣 1 , 𝜋(𝑣 1 )), (𝑣 2 ,𝜋(𝑣 2 )), … , (𝑣 𝑞 ,𝜋 ( 𝑣 𝑞 ))}. Ởđây,𝜋 (𝑣 𝑠 ),𝑣ớ𝑖1≤𝑠 ≤𝑞 biểu thị khảnăngcủa𝑜 𝑝 (𝑎 𝑗 (𝑐 𝑖) )cógiátrị𝑣 𝑠

BamứcđộmờtronglớptạothànhnềntảngcủabiểuđồlớpUMLmờ,vìvậy độổnđịnhcủachúnglàrấtquantrọng.Xétmứcđộmờđầutiên.Đốivớitậpmờ𝐶̃củacáclớpvàbấ tkỳlớp𝑐 𝑖, 𝑣ớ𝑖1≤𝑖≤𝑘,bậcmà𝑐 𝑖thuộc 𝐶̃là𝜇 𝐶̃ (𝑐 𝑖) ,𝑣ớ𝑖0≤

𝜇 𝐶̃ (𝑐 𝑖 )=1,𝑐 𝑖thuộc 𝐶̃ Tạithời điểm này,𝐶̃là một tập hợp các lớp rõ Ngoài ra, đểốivớilớp𝑐 𝑖, 𝑣ớ𝑖1≤𝑖≤𝑘vàthuộc tính𝑎 𝑗 (𝑐 𝑖) ,𝑣ớ𝑖1≤𝑗 ≤𝑙 của𝑐 𝑖, mứcđộ𝑎 𝑗t h u ộ c

𝜇 𝐴̃(𝑎 𝑗 (𝑐 𝑖) )=1trongmôitrườngthôngtintruyềnthống(khôngcósựchínhxáchoặckhông chắc chắn nào cả) Tình huống trước chỉ ra rằng𝑎𝑗không phải là thuộc tínhcủa𝑐 𝑖, trongkhitìnhhuốngsauchỉrarằng𝑎 𝑗p h ả i làthuộctínhcủa𝑐 𝑖 Xétmứcđộ mờthứhai.Đốivớilớp𝑐 𝑖, 𝑣ớ𝑖1≤𝑖 ≤𝑘 v àmộtđốitượng𝑜 𝑝 (𝑐 𝑖 ),𝑣ớ𝑖1≤𝑝 ≤𝑛 của𝑐 𝑖 ,mứcđ ộ𝑜 𝑝 thuộc𝑂(𝑐 𝑖 )là𝜇 𝑂̃ (𝑜𝑝(𝑐 𝑖 )),𝑣ớ𝑖0≤𝜇 𝑂̃ (𝑜𝑝(𝑐 𝑖 ))≤1.Sauđ ó , trongmôitrườngthôngtintruyềnthống,𝜇 𝑂̃ (𝑜 𝑝 (𝑐 𝑖 ))=0hoặc𝜇 𝑂̃ (𝑜 𝑝 (𝑐 𝑖 ))=1,cónghĩa là𝑜𝑝khôngphải là đối tượng của𝑐𝑖hoặc𝑜𝑝phải là ối tượng của để 𝑐 𝑖 , tươngứng Cuối cùng, xét mức độ mờ thứ ba Giá trị thuộc tính của đối tượng𝑜 𝑝 (𝑎 𝑗 (𝑐 𝑖 )) ược biểuđể diễn bằng phân bố khả năng{𝜋(𝑣 1 )/𝑣 1 , 𝜋(𝑣 2 )/𝑣 2 , … , 𝜋(𝑣 𝑞 )/𝑣 𝑞 } Khảnăng𝑜 𝑝 (𝑎 𝑗 (𝑐 𝑖 ))có giá trị so với𝑣 𝑠 ,

𝜋(𝑣 𝑠 )=1.K ế t q u ả l à { ( 𝑣 1 ,𝜋(𝑣 1 )),(𝑣 2 ,𝜋 (𝑣 2 )),…,(𝑣 𝑞 ,𝜋 ( 𝑣 𝑞 ))} ư ợ cđể r ú t g ọ n thành một tập rõ và𝑜 𝑝 (𝑎 𝑗 (𝑐 𝑖 ))nhận một giá trị thuộc tính rõ Tóm lại, biểu đồ lớpUMLtruyềnthốngchỉđơngiảnlàmộttrườnghợpđặcbiệtcủabiểuđồlớpUMLmờ.Vìnólàmộtph ầnmởrộngcủabiểuđồlớpUMLtruyềnthống,nênbiểuđồlớpUMLmờvớibamứcđộmờcóthểgiảm xuốngsơđồtruyềnthốngtrongtrườnghợpkhông có thông tin không chính xác và không chắc chắn Do đó, việc mở rộng ba mức độmờchocáclớp làphùhợp.

1 Mứcthứnhất,tứclàmộtthuộctínhhoặcmộtlớpcómứcthànhviên,thìthuộctính hoặc tên lớp phải được khai báo bởi một cặp từWITH mem DEGREE,trong đó 0 ≤ mem ≤ 1, được sử dụng để biểu thị mức độ mà thuộc tính thuộcvềlớphoặc lớpthuộc vềmôhìnhdữ liệu[23],[72].

Ví dụ 1.3:lớp “ Nhân viên WITH 0.6 DEGREE ” và thuộc tính “Mã nhânviên WITH 0.8 DEGREE ” có mức độ mờ thứ nhất Nói chung, một thuộctính hoặc lớp sẽ không được khai báo khi mức thành viên của nó là 0. Ngoàira,“WITH1.0DEGREE”cóthểbịbỏquakhimứcthànhviêncủamộtthuộctínhhoặc lớplà1 Lưuýrằngcácgiátrịthuộctínhcóthểmờ.

2 Đối với mức độ mờ thứ hai, mức thành viên mà một đối tượng thuộc về lớp.Với mục đích này, một thuộc tính bổ sung có ký tự là𝜇được đưa vào lớp đểthể hiện mức thành viên của đối tượng thuộc lớp với miền [0; 1] Một lớp cómứcđộmờthứhaiđược biểuthịbằnghìnhchữ nhậtvớiđườngnétđứtnét.

3 Đểmôhìnhhóamứcđộmờthứba,từkhóaFUZZYđượckhaibáotrướctênthuộctính. Hình 1.2 cho thấy lớp nhân viên trẻ là mờ Ở đây, thuộc tính Năm sinh có thểnhận các giá trị mờ; cụ thể miền của nó là mờ Không rõ liệu lớp Nhân viên trẻ cóthuộc tính Vợ/Chồng hay không, nhưng ta biết rằng các nhân viên trẻ có vợ hoặcchồng có khả năng nằm ở khoảng giữa, chẳng hạn 0.5 Do đó, thuộc tính Vợ/ChồngkhôngchắcchắnthuộcvềlớpNhânviêntrẻ.Lớpnàycóđộ mờởcấp độthứnhấtvàsử dụng "với mức thành viên 0.5" để mô tả độ mờ trong định nghĩa lớp Ngoài ra,chúng ta không thể xác định liệu một đối tượng có phải là một thể hiện của lớp haykhôngvìlớpnàymờ. Dođó,mộtthuộctính(μ) được) đượcbổsungvàolớp.

Họtên FUZZYNgàysinh Vợ/ChồngWITH0.5DEGREE μ) được

Giátrịthuộctính mờ

Chúng ta xem hai giá trị không chính xác và không rõ ràng như là các giá trị mờ.Mỗi giá trị rõ ràng và chính xác có thể được mở rộng thêm các giá trị mờ Chúng taxácđịnhbaloạikhácnhaucủacácgiátrịmờ.

0, 𝑛ế𝑢𝑥≠𝑎 Giá trị không chắc chắn𝑎được xác định trong khoảng có chứa ít nhất hai phần tử,vàhàmđặttrưngđượcbiểudiễnnhư sau.

0, 𝑛ế𝑢𝑥∉𝑎Một giá trị mơ hồ thuộc vũ trụ U được xác định bởi một tập mờ và được đặc trưngbởi hàm như:0 ≤ 𝜇 𝑎 (𝑥)≤ 1 𝑣ớ𝑖 ∀ 𝑥 ∈ 𝑈, để mô tả ngữ nghĩa cho thuộc tính củađốitượnglànhữnggiátrịmơhồ.

Biểudiễncácgiátrịthuộctínhmơ hồchođốitượng mờ

Trong mục này, mức mờ được giới thiệu ở các mức khác nhau Điểm chung cho tấtcả các đề xuất [74], [109], [110] này là sự hỗ trợ của mức mờ ở cấp thuộc tính. Nộidungdướiđâyđềxuấtmộttậphợpcáckiểudữliệuphongphúdànhchoviệcmôhìnhhóa các loại thông tin không hoàn hảo khác nhau Để tạo điều kiện cho thao tác dữliệu và tính toán hiệu quả, các loại giá trị thuộc tính khác nhau được thể hiện thốngnhấtthôngquaphânphốikhảnăng.

Cáctácgiả[109],[74]liệtkêbốncấpđộđểthựchiệnthôngtinkhônghoànhảotrongcơ sở dữ liệu: Mức hệ thống cơ sở dữ liệu, mức cơ sở dữ liệu, mức siêu dữ liệu, vàmứccơsởmôhình:

2 Mức cơ sở dữ liệu: Ở mức này biểu diễn cách lưu trữ thông tin không hoànhảo Điều này liên quan đến tất cả các giá trị thuộc tính và định nghĩa mức độcủacácmốiquanhệ/lớpmờkhácnhau[109].

3 Mức siêu dữ liệu: Mức này liên quan đến mục đích của các mối quan hệ / lớpmờ.Lưuýrằngmứcnàyđược gọilàsiêudữ liệutrong[109].

4 Mức cơ sở mô hình: Mức này thuộc nhóm các hàm được định nghĩa để tínhtoán mức thành viên và các hàm này được liên kết với các loại dữ liệu khácnhaunhằmđảmbảochomứcnàybiểudiễndạngphânbốkhảnăng [74].

Như đã nhấn mạnh ở trên, cách tiếp cận chi tiết sau đây đã được triển khai trong môhình cơ sở dữ liệu quan hệ đối tượng nhưng nó đủ chung để thực hiện trong các môhìnhcơsởdữliệukhác,đặcbiệtlàđốivớicácmôhìnhcơsởdữliệuquanhệ,hướngđốitượng. Để lưu trữ nét đặt trưng của tất cả các thuộc tính, chúng được định nghĩa một mốiquanhệmeta,đượcgọi làATTRIBUTES, ởcấpsiêudữliệu vớicácthuộctính sau:

 Attribute-id: Xác định duy nhất mỗi thuộc tính được định nghĩa ở cấp cơ sởdữ liệu, là khóa chính của mối quan hệ meta ATTRIBUTES Lưu ý rằng đểphân biệt các thuộc tính khóa trong quan hệ này với các thuộc tính khác bằngdấugạchchân.

 Attribute-name: Lưu tên của thuộc tính Đối với cơ sở dữ liệu cổ điển, cùngmột lớp/quan hệ mờ không thể có hai thuộc tính có cùng tên nhưng cùng tênthuộctínhcóthểxuấthiệntrongcácquanhệ/lớp mờkhácnhau.

 Defined-in:Biểudiễnmốiquanhệ/lớp mờtheothuộctính.

 Data- type:Dạngthuộctínhđagiátrịlưutrữloạithuộctínhcóthểnhậnbấtkỳmộttrongcácphầnt ửcủadanhsách.Đốivớicácthuộctínhrõ,thuộctínhnàyhoạtđộngnhưcáccơsởdữliệuthô ngthường(nócóthểlấycácgiátrịcủacáckiểu dữ liệu như integer, real, float, v.v.) Đối với các thuộc tính mờ dựa vàokiểudữ liệulưutrữchínhkiểudữliệumờvàkiểudữliệurõcơbản.

Bảng1.1 QuanhệmetaATTRIBUTES attr-id attribute-name defined-in data-type attr-15 tênsao STAR {string} attr-16 kiểudữliệucủasao STAR {symbolic} attr-17 tuổi STAR {linguisticlabel,integer} attr-18 độsáng STAR {linguisticlabel,real} attr-19 vịtrí STAR {linguisticlabel,real} attr-20 trọnglượng STAR {interval,real} attr-77 lĩnhvựcnghiêncứu SCIENTIST {scalar} attr-80 tuổi SCIENTIST {linguisticlabel,integer}

Bảng 1.1 biểu diễn một số thuộc tính được liên kết với lớp mờ STAR và lớpSCIENTISTđược giớithiệutrong[110].

Trong thực tế, chúng được định nghĩa một phép đo phổ biến với thuộc tính đa giá trịlưu trữ tất cả các tham số cần thiết Mối quan hệ meta này, được biểu thị bởiPARAMETERS, chứa một dòng cho mỗi giá trị ngôn ngữ xuất hiện trong miền củabấtkỳthuộctínhloạidữliệungônngữnào(hoặcdanhsáchcácgiátrịchophépbiểudiễndữ liệudạngbiểu tượng).Baloạithuộctínhcódạngnhưsau:

 Label:Lưutrữmộtnhãnngônngữthuộcvềmiềnthuộctính.Đốivớicáckiểudữliệubiểut ượng,thuộc tínhnàycógiátrịlà“nill”.

 Parameters: Thuộc tính đa giá trị được sử dụng để lưu trữ các tham số cầnthiết để tạo phân phối khả năng của nhãn ngôn ngữ Các thuộc tính không cóthamsố,sẽkhông được tínhtrong quanhệmetaPARAMETERS.

Bảng1.2.MốiquanhệmetacủaPARAMETERS attribute-id label parameters attr-15 nill {saomới,saobăng} attr-17 rấttrẻ {0.0,0.0,0.5,1} attr-17 trẻ {0.8,1.7,2,2.5} attr-17 già {2.3,5,10, 15} attr-17 rấtgià {12,17,50, 60}

Quan hệ meta PARAMETERS cũng cho phép tạo ra miền của các kiểu dữ liệu ngônngữhoặcbiểutượng.Vìvậychỉcầnnhómlạitấtcảcácnhãnngônngữcócùngthuộctínhidtrongqua nhệmetaPARAMETERS.Vídụ,miềncủathuộctínhattr-17ởbảng

1.2 trên là {rất trẻ, trẻ, già, rất già} Miền của kiểu dữ liệu biểu tượng là danh sáchcácngôn ngữ trongthuộc tínhtham số.

Các giá trị thuộc tính có thể rõ, mờ hoặc cả hai được xác định thông qua các quanhệ/lớpmờ.Hệthốngcơsởdữliệuphảichophépngườidùngchèncácgiátrịcủabấtkỳ kiểu dữ liệu nào phù hợp với định nghĩa của thuộc tính Ở mức độ xác định củaquan hệ/lớp mờ, mỗi thuộc tính mờ được ánh xạ thành một tổ hợp mới bao gồm bathuộctínhthànhphần:

Các giá trị thuộc tính được lưu trữ ở mức cơ sở dữ liệu cùng với mức độ định nghĩacủa các mối quan hệ/lớp của chúng Như đã đề cập ở trên, để tạo thuận lợi cho thaotác dữ liệu và tính toán hiệu quả, các loại giá trị thuộc tính khác nhau được thể hiệnthống nhất thông qua phân phối khả năng Tuy nhiên, các bản phân phối này khôngđượclưutrữrõràngtrongcơsởdữliệumàđượctạotựđộngtrongquátrìnhxửlýdữliệu và xử lý truy vấn bằng các hàm cụ thể được liên kết với các loại dữ liệu khácnhau.

Các giá trị thuộc tính có thể rõ, mờ hoặc cả hai Điều này chỉ cần được chỉ ra trongmục đích xác định các mối quan hệ/lớp mờ dựa trên các thuộc tính Hệ thống cơ sởdữ liệu sẽ cho phép người dùng chèn các giá trị của bất kỳ loại dữ liệu nào phù hợpvớiđịnhnghĩacủathuộctính.Ởphạmvicủamốiquanhệ/lớpmờ,mỗithuộctínhmờ được ánh xạ thành một tổ hợp mới bao gồm các thành phần của ba thuộc tính nhưsau:

 Parameters: thuộc tính đa giá trị được sử dụng để lưu trữ các tham số đượcliên kết với giá trị thuộc tính được sử dụng để tạo phân phối khả năng data-typeđược sử dụng cả ở phạm vi và mục đích cho phép người dùng chèn giátrịcủacác loạidữ liệu khácnhau,cóthểcósốlượngthamsốkhácnhau. Điều này sẽ cung cấp nhiều khả năng hơn cho người dùng Tuy nhiên, các loại dữliệu khác nhau được định nghĩa ở cấp độ phạm vi phải phù hợp với định nghĩa chínhthức của thuộc tính ở cấp độ mục đích Chẳng hạn, định nghĩa chính thức của thuộctính có thể là phân phối khả năng dựa trên hình thang với bốn tham số nhưng ngườidùng có thể đưa ra một giá trị rõ (không có tham số nào), một khoảng (chỉ có haitham số) hoặc giá trị gần đúng (với chỉ ba tham số) Lưu ý rằng kiểu dữ liệu thuộctínhởmức độkhôngphảilàmộtkiểuđagiátrị.

Quan hệtổng quáthóa mờ

Kế thừa là một cơ chế quan trọng trong mô hình dữ liệu hướng đối tượng cho phépmột lớp được gọi là lớp con kế thừa các thuộc tính và phương thức từ một lớp khácđược gọi là lớp cha Kết quả là, kế thừa cho phép định nghĩa các lớp cha và lớp con, và các lớp được tổ chức theo phân cấp kế thừa trong đó các định nghĩa về thuộc tínhvàphươngthứcđượckếthừagiữacáclớp.Bởivìmộtlớpconlàmộtchuyênbiệthóacủa lớp cha, bất kỳ một đối tượng nào thuộc lớp con phải thuộc về lớp cha Đặc tínhnày có thể được sử dụng để xác định xem hai lớp có mối quan hệ là cha/con (trongquan hệ kế thừa lớp cha gọi lớp tổng quát hóa, lớp con gọi là lớp chi tiết hóa) haykhông.

TrongmôhìnhdữliệuUMLmờ,cáclớpcóthểmờ.Mộtlớpđượctạoratừmộtlớp mờ bằng phương pháp kế thừa có thể mờ Một lớp là lớp con của một lớp khácvới mức thành viên [0; 1], thì mối quan hệ lớp con/lớp cha là mờ Ngoài ra, một lớpcó thể là một lớp mờ có mức thành viên dẫn đến đối tượng được tạo ra từ lớp này là(mờ).Thôngquangưỡngcủacácđốitượngtacóthểxácđịnhmốiquanhệcha/con. Đềxuấtcủanhómtácgiả[3]đãpháttriểnphươngphápsaunhằmxácđịnhmốiquanhệlớpcon/ lớpcha. a) Đối với bất kỳ đối tượng (mờ) nào, mức thành viên mà nó thuộc về lớp conlớnhơnhoặc bằng mộtngưỡngnhấtđịnhvà b) Mức thành viên mà nó thuộc về lớp con nhỏ hơn hoặc bằng mức thành viênmànóthuộc vềlớpcha.

Các đối tượng sẽ đạt mức thành viên ở mức tối thiểu khi các đối tượng này thuộcvề lớp con trong quan hệ kế thừa Ở đây, ngưỡng đã cho được sử dụng để đặt độ tincậy mà hai lớp có mối quan hệ lớp con/lớp cha với mức thành viên Nói chung, hailoại đối tượng của lớp con có thể được xác định: các đối tượng có mức thành viênnhỏ hơn ngưỡng đã cho và đối tượng có mức thành viên lớn hơn hoặc bằng ngưỡngđã cho Với ngưỡng đã cho, hai lớp có mối quan hệ lớp con/lớp cha miễn là các đốitượng sau có mức thành viên nhỏ hơn hoặc bằng mức thành viên mà chúng thuộc vềlớp cha Nếu ngưỡng không được đặt, thì hai lớp không có mối quan hệ lớp con/lớpchakhitồntạimộtđốitượngcủalớpconcómứcthànhviênlớnhơnmứcthànhviênmànóthuộ cvề lớpcha,ngaycảkhimứcthànhviênnàylàrấtnhỏ.

Cho𝑐 ′ và𝑐 ′′ làcáclớp(mờ)với𝛽làngưỡngchotrước.Tanóirằng𝑐 ′′ làmộtlớpconcủa𝑐

𝑐𝘍𝘍 (𝑜)≥𝛽(𝜇 𝑐 𝘍𝘍(𝑜)) Ởđây,olà đốitượngcủa𝑐 ′ và𝑐 ′′ ,𝜇 𝑐 𝘍(𝑜) và𝜇 𝑐 𝘍𝘍(𝑜) lầnlượtlàcácmứcthànhviêncủađốitượngothuộclớp𝑐 ′ và𝑐 ′′ Tuynhiên,lưuýrằngtrongmốiquanhệtổngquátmờnóitrên,chúngtagiảđịnhrằng các lớp𝑐 ′ và𝑐 ′

′chỉ có mức mờ thứ hai Các lớp𝑐 ′ hoặc𝑐 ′′ có thể là các lớp cómức thành viên, cụ thể là với cấp độ mờ thứ nhất Giả sử rằng ta có hai lớp𝑐 ′ và𝑐 ′′ ,nhưsau:

1 2 𝑛 degree_𝑐 ′′ ,degree_𝑐 ′′ , ,vàdegree_𝑐 ′′ Khiđó,tacómốiquanhệsau:

1 2 𝑛 Đối với mối quan hệ lớp cha/lớp con, rõ ràng với nhiều lớp con, một đối tượngphải thuộc lớp cha nếu nó thuộc về một lớp con, nhưng một đối tượng thuộc lớp chacó thể thuộc hoặc không thuộc các lớp con Xét các lớp “Bệnh nhân”, “Bệnh nhânngoại trú” và “Nội trú”, trong đó “Bệnh nhân ngoại trú” và “Nội trú” là hai lớp concủa lớp “Bệnh nhân” Giả sử rằng đối tượng “Lê Văn A” là một đối tượng của lớpcon“Nộitrú”.Rõràng,“LêVănA”phảilàmộtđốitượngcủasiêulớp“Bệnhnhân”.Giả sử rằng

“Lê Văn A” là một đối tượng của lớp cha “Bệnh nhân” nhưng khôngthuộc lớp con “Ngoại trú”, điều này ngụ ý rằng trong mối quan hệ lớp cha/lớp con,mức thành viên mà một đối tượng thuộc các lớp con không lớn hơn mức thành viêncủađối tượng thuộc về các lớp cha Do đó, trong mối quan hệ lớp cha/lớp con vớinhiều lớp con mờ, mức thành viên mà một đối tượng thuộc về bất kỳ lớp con nàokhông lớn hơn mức thành viên mà đối tượng này thuộc về lớp cha Theo đó, toán tửmaxđược sử dụng ởtrên.

Cho𝑐 ′ và𝑐 ′′ là các lớp (mờ) và mức thành viên mà𝑐′ ′ là lớp con của𝑐 ′ đểược ký hiệulà𝜇 (𝑐 ′ ,𝑐 ′′ ).Vớimộtngưỡngnhấtđịnh𝛽,tanóirằng𝑐 ′′ l àmộtlớpconcủa𝑐 ′ n ế u

𝜇(𝑐 ′ ,𝑐 ′′ )≥ 𝛽 Ởđây𝜇 (𝑐 ′ ,𝑐 ′′ ) ượ cđể sửdụngđểđánhgiámứcđộbaohàmcủa𝑐 ′′ đểố ivới𝑐 ′ theomứcđộbaohàmcủacácmiềnthuộctínhcủa𝑐 ′′ đểốivớicácmiềnthuộctínhcủa

Nghĩa là𝑐 ′′ là lớp con của𝑐 ′ nếu mức ộ bao gồm của𝑐để ′ so với𝑐 ′′ lớn hơn hoặcbằng ngưỡng đã cho, các mức thành viên của𝑐 ′ và𝑐 ′′ đểều lớn hơn hoặc bằng ngưỡngđãcho,vàmứcthànhviêncủa𝑐 ′ lớnhơnhoặcbằngmứcthànhviêncủa𝑐 ′′

Mức độ bao gồm của một lớp con (mờ) đối với lớp cha (mờ) có thể được tính theomứcđộbaogồmcủacácmiềnthuộctínhcủalớpconđốivớicácmiềnthuộctínhcủalớp cha cũng như trọng số của các thuộc tính Các phương pháp được sử dụng đểđánh giá mức độ bao hàm của các miền thuộc tính mờ và để đánh giá thêm mức độbaohàmcủamộtlớpconđốivớilớpchađãđượcphát triểntrong [73].

Mộtvấnđềquantrọngtrongphâncấplớpcon/lớpchalàtínhđakếthừacủamộtlớp.Mối quan hệ tổng quát hóa mờ với đa kế thừa của lớp có thể được biểu diễn bằngphéphộihoặctuyển.

Gọi𝑐 ′ ,𝑐 1và 𝑐2là các lớp mờ với mức mờ thứ hai và𝛽là một ngưỡng chotrước Ta nói rằng𝑐 ′ là một lớp con của𝑐1và𝑐2và ược biểu diễn bằng mối quan hệđể phép hội nếu.(∀𝑜)(∀𝑐) (𝑐∈ {𝑐 1 ,𝑐 2 }𝖠𝛽≤𝜇 𝑐 𝘍(𝑜)≤𝜇 𝑐 (𝑜)).

Nếu thay vì sử dụng mức độ bao gồm của các đối tượng vào lớp, ta sử dụng mức độbao gồm của một lớp đối với lớp khác để xác định mối quan hệ giữa lớp con mờ vàlớpcha,côngthứctrênđược địnhnghĩalạinhưsau:

Giả sử rằng𝑐 ′ ,𝑐1và𝑐2ở trên cũng có thể có mức mờ ầu tiên, với các mứcđể thànhviêntương ứng làdegrees_𝑐 ′ , degrees_𝑐1v à d e g r e e s _𝑐 2 Ta có

Nếuchúngtasửdụngmứcđộbaogồmcủamộtlớpđốivớimộtlớpkhácđểxácđịnhmối quan hệ giữa các lớp con mờ và lớp cha, công thức trên được định nghĩa lại nhưsau:

Trong trường hợp một lớp có nhiều kế thừa, sự mơ hồ nảy sinh khi nhiều lớpchacócácthuộctínhchungvàlớpconkhôngkhaibáorõrangcácthuộctínhcủalớpchađược kếthừa.

Giả sử rằng thuộc tính𝑎 𝑖trong 𝑐 1 , ký hiệu là𝑎 𝑖 (𝑐 1 ), giống với thuộc tính𝑎 𝑖trong 𝑐 2 , ký hiệu là𝑎 𝑖 (𝑐 2 ) Nếu𝑎 𝑖 (𝑐 1 )và𝑎 𝑖 (𝑐 2 )có cùng một miền, thì không cóxung đột trong phân cấp đa kế thừa và c kế thừa thuộc tính𝑎𝑖trực tiếp Tuy nhiên,xung đột xảy ra nếu𝑎 𝑖 (𝑐 1 )và𝑎 𝑖 (𝑐 2 )có các miền khác nhau Tại thời đểiểm này, việclớpckếthừa𝑎 𝑖 (𝑐 1 )hay𝑎 𝑖 (𝑐 2 )phụthuộcvàolớpnàolàtrội[73],vớilớpckếthừa

𝑎 𝑖t ừ lớpchatrộihơn.Lưuýrằngtronghệthốngphâncấpđathừakếmờ,lớpconcócácmứckhácnhau đốivớicáclớpchakhácnhau,điềunàykhácvớitìnhhuốngtrongcơsởdữ liệuhướngđốitượngcổđiển.

Xét mối quan hệ tổng quát mờ với một diễn giải không chính xác Gọi𝑐

′,𝑐1và𝑐2làcáclớpmờvớimứcmờthứhaivà𝛽làmộtngưỡngchotrước.Đềxuất[3]nóirằng

Nếu, thay vì sử dụng mức độ bao gồm của các đối tượng vào lớp, chúng ta sử dụngmức độ bao gồm của một lớp đối với lớp khác để xác định mối quan hệ giữa lớp conmờvàcáclớpchacủanó,côngthứctrênđượcđịnhnghĩalạinhư sau:

Giả sử rằng𝑐 ′ ,𝑐 1và 𝑐2ở trên cũng có thể có mức mờ ầu tiên với các mức để thànhviêntươngứng làdegrees_𝑐 ′ , degrees_𝑐1v à d e g r e e s _𝑐 2 Ta có

Nếutasửdụngmứcđộbaogồmcủamộtlớpđốivớimộtlớpkhácđểxácđịnhmốiquan hệ giữa lớp con mờ và lớp cha, công thức trên được định nghĩa lại như sau:(𝜇(𝑐 1 ,𝑐 ′ )≥𝛽 𝖠𝛽≤ 𝑑𝑒𝑔𝑟𝑒𝑒_𝑐

≤𝑑𝑒𝑔𝑟𝑒𝑒_𝑐 ′ ≤ 𝑑 𝑒 𝑔 𝑟 𝑒 𝑒 _ 𝑐 2 )Mũi tên hình tam giác đứt nét được sử dụng để biểu diễn tổng quát mờ như trongHình1.3 Ở đây, các lớp Nhân viên trẻ, Nhân viên trung niên và Nhân viên già đềuthểhiệnmứcmờthứhai,cónghĩalàcáclớpcómộtsốđốitượngthuộcvềcáclớpcómứcthànhviê n.Balớpnàycóthểđược tổngquátthànhlớpNhânviên.

Nhân viên già Nhân viên trung niên

Làmột dạng đặcbiệt củaliênkết mô hình hóamốiquanhệtoànthể-bộphận (whole

-part)giữa đối tượngtoànthểvàcácbộphận của nó.

Mô tả mối quan hệ giữa một đối tượng lớn hơn được tạo ra từ những đối tượng nhỏhơn.Mộtloạiquanhệđặcbiệtnàylàquanhệ“có”,nócónghĩalàmộtđốitượngtổngthểcó nhữngđốitượngthànhphần.

Ví dụ 1.4:Một vận động viên có quan hệ tới một đội với ý nghĩa là một phần tử củađội, tuy nhiên vận động viên này cũng có thể thành viên của một đội khác, trườnghợpnàygọilàsựchiasẻ.Dođó,nếumộtđộibịhủybỏ,thìkhôngnhấtthiếtphảihũybỏvậnđộngvi ênnày Kếttậplàmốiquanhệ“làmộtphần”(“isapart-of”).

′′ ′′ olên𝑐 𝑖 ư ợ c để kýhiệulà𝑜↓ 𝑐 𝘍𝘍 ,biểudiễnmộtthểhiệncủa𝑐 𝑖 Khiđó,tacó(𝑜↓ 𝑐 𝘍𝘍 )∈

Ví dụ 1.5:Quan hệ kết tập Xe được kết tập theo các hạng bộ phận cấu thành Độngcơ,

Nội thất và Khung xe Đối với một ví dụ về ô tô (chẳng hạn như “Honda CR-VEX”), phép chiếu của nó trên Động cơ là phiên bản động cơ (giả sử “In-Line 4-Cylinder”)và ta có𝐻𝑜𝑛𝑑𝑎 𝐶𝑅 −𝑉𝐸𝑋↓ 𝐸𝑛𝑔𝑖𝑛𝑒= 𝐼𝑛 −𝐿𝑖𝑛𝑒4−𝐶𝑦𝑙𝑖𝑛𝑑𝑒𝑟.

Quanhệkếthợp mờ

Mối quan hệ kết hợp được định nghĩa là mối quan hệ cấu trúc nhị phân giữa hai lớpliên kết chúng, được chỉ định bằng các đối tượng của một lớp kết nối với các đốitượngcủa lớpkhác.

Mối quan hệ kết hợp là hai chiều hoặc một chiều Mối quan hệ kết hợp đượcxác định trên cơ sở các lớp, không phải trên cơ sở các đối tượng của các lớp Tấtnhiên, đối với một phạm vi nhất định, mỗi cặp đối tượng trong các lớp tương ứng cócùngmốiquanhệkếthợp.

Ví dụ 1.6:Trong một sân bay, các lớp Chuyến bay và Tàu bay có mối quan hệ kếthợpvớitênliênkếtđược chỉđịnhlàtàubay.

Cácliênkếtcủalớpmờtạothành mốiquanhệkếthợpmờ.Đốivới cáclớp mờcómứcmờthứhai,cácđốitượngcủalớpthuộcvềcáclớpđãchocómứcthànhviên.Dođó,cóthểkhô ngbiếtchắcchắnliệuhailớpthuộccáclớpliênkếtcómốiquanhệkết hợp nhất định hay không, mặc dù mối quan hệ kết hợp chắc chắn tồn tại giữa hailớpnày.

Ví dụ 1.7:Các lớp Lái xe trẻ và Xe mới có mối quan hệ kết hợp mờ với tên liên kếtlái xe Ở đây, đối tượng của Lái xe trẻ và đối tượng Xe mới có mối quan hệ liên kếtvới mứcthànhviên.

Về mặt hình thức, cho𝑐 ′ và𝑐 ′′ là hai lớp có ộ mờ mức hai Đối tượng𝑜để ′ của𝑐 ′ làmột đối tượng có mức thành viên𝜇 𝑐 𝘍 (𝑜 ′ ), và đối tượng𝑜 ′′ của𝑐 ′′ l à ố i t ư ợ n g c óđể mức thành viên𝜇 𝑐 𝘍𝘍 (𝑜 ′′ ) Giả sử rằng mối quan hệ kết hợp giữa𝑐 ′ và𝑐 ′′ đểư ợ c k ýhiệulà𝑎𝑠𝑠𝑐(𝑐 ′ ,𝑐 ′′ ).Nhưvậy,mốiquanhệkếthợpgiữa𝑜 ′ v à 𝑜 ′′ ,đượckýhiệulà 𝑎𝑠𝑠𝑐(𝑜 ′ ,𝑜 ′′ ),cómứcthànhviênđượctínhnhưsau

Lưuýrằngmứcthànhviên𝜇 (𝑎𝑠𝑠𝑐(𝑜 𝘍 ,𝑜 𝘍𝘍 )) đểư ợ cxácđịnhcho𝑜 ′ và𝑜 ′′ ,khôngcho

𝑐 ′ và𝑐 ′′ Nóicáchkhác,mứcthànhviênmà𝑜 ′ và𝑜 ′′ cómốiquanhệkếthợplà

𝜇 (𝑎𝑠𝑠𝑐(𝑜 𝘍 ,𝑜 𝘍𝘍 )) Đối với một cặp đối tượng thuộc hai lớp nhưng không phải là𝑜 ′ và𝑜 ′′ ,mức liên kết mà cặp đối tượng có mối quan hệ kết hợp có thể khác với𝜇 (𝑎𝑠𝑠𝑐(𝑜 𝘍 ,𝑜 𝘍𝘍 )) Nếu mức thành viên nhỏ thì cặp đối tượng trong trường hợp này không có liên kếtkiểuquanhệkếthợp.

Một lưu ý nữa mối quan hệ kết hợp có thể được xác định một cách mơ hồ(Nhữngngườithíchthểthao)vàmốiquanhệkếthợptồntạitronghailớpliênkếtvớimức thành viên Khác với quan hệ kết hợp mờ ở mức đối tượng của lớp ở trên, quanhệkếthợpmờởđâylàởmứclớp.Mứcmờtrongmốiquanhệkếthợpnàyđượcthiếtkế,địnhnghĩac ụthểngaycảkhicáclớptương ứnglàrõ.

Vídụ1.8:Trongthiếtkếsơbộcủamộtchiếcôtô,giảsửrằngđầuđĩaDVDcóthểđược lắp hoặc không được lắp vào ô tô ở giai đoạn này và khả năng đầu đĩa DVD sẽđược lắp vào ô tô là 0.6 Gọi𝑐 ′ và𝑐 ′′ là hai lớp rõ và𝑎𝑠𝑠𝑐(𝑐 ′ , 𝑐

′′)là mối quan hệ kếthợpvớimứcthànhviêndegree_assc,đượckýhiệulà𝑎𝑠𝑠𝑐(𝑐 ′ , 𝑐 ′

′)WITHdegree_asscDEGREE.Tạithờiđiểmnày,mứcthànhviêncủacácđốitượng𝑜 ′ thuộc

𝜇 (𝑎𝑠𝑠𝑐(𝑐 𝘍 ,𝑐 𝘍𝘍 )) = 𝑑 𝑒 𝑔 𝑟 𝑒 𝑒 _ 𝑎 𝑠 𝑠 𝑐 𝑣à 𝜇 (𝑎𝑠𝑠𝑐(𝑜 𝘍 ,𝑜 𝘍𝘍 )) = 𝑑 𝑒 𝑔 𝑟 𝑒 𝑒 _ 𝑎 𝑠 𝑠 𝑐 Ở đây,𝜇 (𝑎𝑠𝑠𝑐(𝑐 𝘍 , 𝑐 𝘍𝘍 )) được sử dụng để biểu thị mức thành viên mà𝑐 ′ và𝑐 ′′ có mốiquanhệkếthợp,và𝜇 (𝑎𝑠𝑠𝑐(𝑜 𝘍 ,𝑜 𝘍𝘍 )) đểượcsửdụngđểbiểuthịmứcthànhviênmà𝑜 ′ và

Nếuquanhệkếthợpcủacáclớpkhôngđượcđịnhnghĩathìcáclớpđócómứcmờthứ nhất với mức thành viên Về mặt hình thức, đặt𝑐 ′ và𝑐 ′′ là hai lớp chỉ có mức mờthứ nhất, được ký hiệu là𝑐

WITHH degree_asscDEGREEE Ởđây,degree_asscđượctính bằng

𝑑𝑒𝑔𝑟𝑒𝑒_𝑎𝑠𝑠𝑐= 𝑚 𝑖 𝑛 ( 𝑑 𝑒 𝑔 𝑟 𝑒 𝑒 _ 𝑐 ′ ,𝑑𝑒𝑔𝑟𝑒𝑒_𝑐 ′′ ). a Càiđặt WITH0.6DEGREE ĐầuDVDtiêntiến b Cài đặt c CàiđặtW I T H 0.6DEGREE

Hình1.5:Mốiquanhệkếthợpmờ Đốivớibấtkỳtrườnghợp𝑜 ′ nà ocủa𝑐 ′ vàbấtkỳtrườnghợp𝑜 ′′ nà ocủa𝑐 ′′ ,

Cuốicùng,xéttìnhhuốngmàcáclớpthểhiệnmứcmờthứnhấtvàthứhai.Mộtmặt, hai lớp có mối quan hệ kết hợp mờ ở cấp lớp Mặt khác, các đối tượng của hailớpnàycóthểcómốiquanhệkếthợpmờởcấpđộthểhiệnlớp.Gọi𝑐 ′ và𝑐 ′

′làhailớpcómứcmờthứnhất,đượckýhiệulà𝑐 ′ WITHdegree_𝑐 ′ DEGREEvà𝑐 ′′ WITHdegree_𝑐 ′

′D E G R E E.Ngoàira,đốitượng𝑜 ′ c ủ a 𝑐 ′ c ómứcthànhviên𝜇 𝑐 𝘍( 𝑜 ′ ),và đốitượng𝑜 ′′ c ủ a 𝑐 ′′ c ómứcthànhviên𝜇 𝑐 𝘍𝘍( 𝑜 ′′ ).

Cặp từWITHmemDEGREE(0 ≤ mem ≤ 1) sau tên liên kết của một quan hệ kếthợp biểu thị mối quan hệ kết hợp với mức thành viên Sử dụng một dòng kép có đầumũi tên để biểu thị mối quan hệ liên kết mà các thể hiện lớp được liên kết với nhau.Hình 1.5 cho thấy hai loại mờ trong các mối quan hệ kết hợp mờ Trong (a), các lớp“Đầu đĩa DVD tiên tiến” và “Xe hơi” có mối quan hệ liên kết cài đặt với mức thànhviên0.6.Ngoàira,cóthểđầuDVDchắcchắnsẽđượclắptrênxe.Trongtrườnghợpnày,khảnă ngđầuDVDsẽđượclắptrênôtôlà1.0,vàcáclớp”Đầu DVDtiêntiến”và “Xe hơi” có mối quan hệ liên kết cài đặt với mức thành viên 1.0 Như được trìnhbày trong (b), ở cấp độ của các đối tượng, các đối tượng của các lớp “Đầu DVD tiêntiến” và “Xe hơi” có thể có hoặc không cài đặt mối quan hệ kết hợp Trong (c), hailoại mốiquanhệkếthợpmờtrong(a)và(b)phátsinhđồngthời.

Quan hệphụthuộcmờ

Sự phụ thuộc biểu thị mối quan hệ giữa nhà cung cấp / khách hàng giữa các phần tửcủa mô hình, trong đó việc chỉnh sửa thông tin nhà cung cấp có thể ảnh hưởng đếncác phần tử mô hình khách hàng Điều đó có nghĩa là khách hàng không hoàn thànhnếu không có nhà cung cấp Mối quan hệ phụ thuộc khác với mối quan hệ kết hợp ởchỗ nó chỉ mang tính đơn hướng Mối quan hệ phụ thuộc giữa lớp nhà cung cấp vàlớpkháchhàngđượcthiếtlậptrêncơsởcáclớp,khôngphảitrêncơsởcácđốitượngcủacáclớp.Mối quanhệphụthuộcchỉliênquanđếnchínhcáclớpvàkhôngyêucầucác đối tượng Mỗi cặp đối tượng mà mỗi đối tượng thuộc lớp đó thể hiện mối quanhệphụthuộc.

Vídụ1.9:Lớpnhàcungcấpvàlớpkháchcómốiquanhệphụthuộc. Đối với các lớp mờ có mức mờ thứ hai, mối quan hệ phụ thuộc không bị ảnh hưởngbởi các lớp mờ như vậy vì mối quan hệ phụ thuộc được xác định ở mức của các lớp Tuy nhiên, các đối tượng lớp thuộc về các lớp đã cho có mức thành viên Do đó, haiđối tượng của lớp thuộc các lớp liên quan có thể có mối quan hệ phụ thuộc với mứcthành viên Lưu ý rằng mức thành viên ở đây chỉ dành cho các đối tượng của lớp,khôngdànhchocáclớp.

Giốngnhưmốiquanhệkếthợpmờởtrên,mốiquanhệphụthuộcgiữacáclớpcó thể là một mối quan hệ mờ với mức thành viên ở cấp độ các lớp Giả sử rằng lớpnhàcungcấpvàlớpkháchhànglàmờvớimứcmờthứnhất.Mứcthànhviêncủalớp

NhânviênDependent WITH0.85 DEGREE NhânviênWITH0.85DEGREE kháchhàngđượcxácđịnhbởilớpnhàcungcấpnhưmứckhảthicủalớpnhàcungcấp. ĐốivớilớpnhàcungcấpNhânviên WITH0.85DEGREE.

Ví dụ 1.10:Lớp khách hàng Dependent Nhân viên phải là Dependent Nhân viênWITH

0.85 DEGREE Mối quan hệ phụ thuộc giữa Nhân viên và nhân viên nên mờvớimứcthànhviên0.85.Lưuýrằngđộmờcủamốiquanhệphụthuộcgiữacáclớp,nếukhôngđượ cđưaramộtcáchrõràng,đượcngầmđịnhbởiđộmờthứnhấtcủalớpnhà cung cấp Vì độ mờ của mối quan hệ phụ thuộc được biểu thị ngầm định bằngmức mờ thứ nhất của lớp nhà cung cấp, nên một đường đứt nét có đầu mũi tên đượcsửdụngđểbiểuthịđộmờtrongmốiquanhệphụthuộc.Hình1.6chothấymốiquanhệkếthợp mờ ởcấpđộcác lớp.

Ví dụ 1.11:Sử dụng một số ký hiệu được giới thiệu ở trên, mục này giới thiệu mộtmôhìnhdữliệuUMLmờcủamộtxưởngtrongHình1.7.Trongvídụnày,mộtPhânxưởng đơn giản được tổng quát hóa bởi hai lớp, Trang thiết bị và Công nhân.LớpTrangthiếtbịlàmộtlớpchavớiTrangthiếtbịmớivàTrangthiếtbịcũlàhailớpconmờ (chúng có thể có các thể hiện mờ) Tương tự, lớp Công nhân có ba lớp con mờ:Côngnhântrẻ,CôngnhântrungniênvàCôngnhângià.CáclớpCôngnhânvàThiết bị cũ có mối quan hệ kết hợp mờ ở cả cấp độ đầu tiên và cấp độ thứ hai LớpCôngnhân có bốn thuộc tính, với Id, Họ tên và Công nhân chính nhận các giá trị rõ vàthuộc tính năm sinh nhận một giá trị mờ Ngoài ra, lớp Trang thiết bị có bốn thuộctính, với Id, Tên trang thiết bị và Vị trí nhận các giá trị rõ và Điều kiện thuộc tínhnhận mộtgiátrịmờ.

Ánh xạ mô hình dữ liệu UML mờ vào mô hình cơ sở dữ liệu hướng đốitượngmờ

Ma và cộng sự [73] đã phát triển một mô hình cơ sở dữ liệu hướng đối tượng mờ(FOODB)trongđócáclớpcóthểmờ.

Theo đó, trong FOODB, một đối tượng thuộc về một lớp có mức thành viên là[0;

1] và một lớp là kiểu con của một lớp khác có mức [0; 1] Trong FOODB, đặc tảcủa một lớp bao gồm định nghĩa các mối quan hệ là một (ISA), các thuộc tính vàphươngthức.Mộtsốđịnhnghĩabổsunglàcầnthiếtđểchỉđịnh một lớpmờ. Đầu tiên, trọng số phải được gán cho các thuộc tính của lớp Ngoài các thuộc tínhchung này, một thuộc tính mới được thêm vào lớp để chỉ ra mức thành viên mà mộtđối tượng thuộc về lớp Nếu một lớp là một lớp con mờ, thì các lớp cha và mức màlớpconcủa cáclớpchaphảiđược địnhnghĩa trongđặc tảcủa lớp.

CLASS class nameWITH DEGREE OFdegree

INHERITS supertype_1nameWITH DEGREE OFdegree_1

INHERITS supertype_knameWITH DEGREE OFdegree_k

Attribute_1name:[FUZZY]DOMAINdom_1:TYPEOF type_1WITH DEGREE

Attribute_m name: [FUZZY]DOMAIN dom_m:TYPE

OF type_m WITHDEGREE OF degree_m

Thông tin mờ có thể được mô hình hóa trong mô hình dữ liệu UML và mô hình dữliệuhướngđốitượngbằngcáchsửdụngmôhìnhdữliệuUMLmờvàFOODB.Phầnnàynghiên cứuánhxạcủamôhìnhdữliệuUMLmờvàolượcđồFOODB.

Nói chung, các lớp trong mô hình dữ liệu UML tương ứng với các lớp trong lược đồcơsởdữ liệuhướngđốitượng.

CácthuộctínhtrongmộtlớpcủamôhìnhdữliệuUMLtươngứngvớicácthuộctính lớp của lược đồ OODB Sự tổng quát hóa trong UML phù hợp chặt chẽ với cấutrúc lớp con/lớp cha và các phép biến đổi Vì vậy, việc chuyển đổi giữa UML vàFOODBđược thực hiệndễdàng.

TrongmôhìnhdữliệuUMLmờ,lớpvàtổngquáthóacóthểmờ.Tuântheocácquytắcchuyểnđổ itươngtựnhưtrên,đềxuất[3]đãgiớithiệucáchtiếpcậnhiệuquảtrongviệcchuyểnđổi môhìnhdữ liệuUMLmờthànhmôhìnhFOODB.

Các lớp trong mô hình dữ liệu UML thường tương ứng với các lớp trong lược đồ cơsởdữliệuhướngđốitượngvàcácthuộctínhcủacáclớptrongmôhìnhdữliệuUMLtươngứngvớicác thuộctínhcủacáclớptronglượcđồcơsởdữliệuhướngđốitượng.NếucáclớptrongmôhìnhdữliệuUM Llàlớpconhoặclớpchatronglượcđồcơsởdữ liệu hướng đối tượng, cấu trúc phân cấp kế thừa của các lớp được tạo ra bởi cáclớpUMLnàyphảiđược địnhnghĩa. Để chuyển đổi từ mô hình dữ liệu UML mờ sang lược đồ cơ sở dữ liệu hướngđối tượng mờ, trước tiên ta xem các lớp trong mô hình dữ liệu UML không phải làlớp con cũng không phải là lớp cha Sau đó, ta có thể phân biệt bốn loại lớp cơ bảntrong môhìnhUMLmờnhư sau. a) Cáclớpkhôngphảilàlớp mờ; b) Cáclớpchỉcóđộmờở cấpđộthứba; c) Cáclớpcóđộmờchỉở cấpđộthứhai; d) Cáclớpchỉcóđộmờở cấpđộđầu tiên.

Khi chuyển đổi các lớp của mô hình dữ liệu UML mờ thành các lớp của lượcđồ cơ sở dữ liệu hướng đối tượng mờ, việc chuyển đổi các lớp có ba mức mờ, ta cầnchú ý các trường hợp sau: Đối với các lớp trong trường hợp (b), các thuộc tính nhậngiátrịmờcókiểugiátrịmờđượckýhiệulàFUZZYTYPEOF.Đốivớicáclớptrongtrường hợp (c), một thuộc tính bổ sung ký hiệu là pD nên được thêm vào mỗi lớp đểbiểu thị khả năng các đối tượng của lớp Đối với các lớp trong trường hợp (d), cáclớp hay các thuộc tính của chúng có thể được liên kết với các mức thành viên. Đồngthời, các lớp và thuộc tính đã biến đổi trong lược đồ cơ sở dữ liệu hướng đối tượngmờ được liên kết với các mức thành viên, nếu có Mức thành viên được sử dụng đểchỉ ra khả năng lớp được tạo thuộc về lược đồ cơ sở dữ liệu hoặc các thuộc tính củalớpđược tạothuộc vềlớpđó. Dựa trên ba kiểu cơ bản của lớp mờ ở trên (tức là trường hợp (b), (c), (d)), mộtsốkiểukếthợpcủalớpmờcóthểđượccàiđặt.Đốivớicáclớpcóđộmờởcảcấpbavà cấp hai (ký hiệu là (e)), phép biến đổi của chúng là sự kết hợp đơn giản của cácphép biến đổi trên trong trường hợp (b) và (c) Đối với các lớp có độ mờ ở cả cấp bavà cấp một (ký hiệu là (f)), phép biến đổi của chúng là sự kết hợp đơn giản của cácphépbiếnđổitrêntrongtrườnghợp(b)và(d).Đốivớicáclớpcóđộmờởcảcấphaivà cấp một (ký hiệu là (g)), phép biến đổi của chúng là sự kết hợp đơn giản của cácphép biến đổi trên trong trường hợp (c) và (d) Đối với các lớp có độ mờ ở cả ba cấp(ký hiệu là (h)), phép biến đổi của chúng là sự kết hợp đơn giản của các phép biếnđổitrêntrongcáctrườnghợp(b),(c),và(d).

Hình1.8thựchiệnviệcchuyểnđổicủacáclớptrongmôhìnhdữliệuUMLmờsanglượcđồcơsởdữli ệuhướngđốitượngmờ.Đểđơngiảnhóa,mộtsốthànhphầntrongđịnhnghĩalớpcủalượcđồhướngđố itượngmờnhưDOMAIN,WEIGHT,METHODSvàCONSTRAINTSkhông đượccàiđặt. Đốitáctốt

Vịtrí :TYPEOFString Địa vị:FUZZYTYPE OF

Hình 1.8: Chuyển đổi các lớptrongUML mờ sang lược đồ cơ sở dữ liệu hướng đốitượngmờ

Giả sử rằng các lớp của mô hình dữ liệu UML mờ là các lớp cha có thể thuộcbất kỳ kiểu lớp nào được cài đặt trong trường hợp (a) - (h) ở trên Việc chuyển đổicác lớp như vậy thành các lớp của lược đồ cơ sở dữ liệu hướng đối tượng mờ cũnggiống như việc chuyển đổi các lớp của mô hình dữ liệu UML mờ đã cho ở trên. CáclớpcủamôhìnhdữliệuUMLmờlàcáclớpconvàcóthểthuộcbấtkỳkiểunào(a)

- (h)cóthểđượcchuyểnđổithànhcáclớpcủalượcđồcơsởdữliệuhướngđốitượngmờ theo các nguyên tắc tương tự của phép biến đổi lớp đã cho ở trên Tuy nhiên,trong lược đồ cơ sở dữ liệu hướng đối tượng mờ, phân cấp kế thừa của các lớp đượctạora(lớpcon)phảiđược địnhnghĩađầyđủ. Hình 1.9 cho thấy sự chuyển đổi của các lớp con trong mô hình dữ liệu UML mờsanglược đồcơsởdữ liệuhướngđốitượngmờ.

Mã:TYPEOF String Trọnglượng:TYPEOF Number

Hình 1.9: Chuyển đổi các lớp con trong UML mờ sang lược đồ cơ sở dữ liệu hướngđốitượngmờ

Tậphợpxácđịnhmốiquanhệtoànbộgiữacácbộphậncấuthànhvàtổngthểlàmộtlớpđạidiệnchotổn gthể.TrongmôhìnhdữliệuUMLmờ,tậphợp(mờ)cóthểđượcchuyểnđổithành mộtlớptronglượcđồcơsở dữliệuhướngđốitượngmờ,đượcgọilà lớp tổng hợp, theo sự biến đổi của các lớp đã cho ở trên Ngoài ra, mỗi phần cấuthành,làmộtlớp(mờ),cóthểđượcchuyểnđổithànhmộtlớptronglượcđồcơsởdữliệu hướng đối tượng mờ, được gọi là lớp thành phần Lưu ý rằng các thuộc tính củalớp tổng hợp bao gồm tất cả các thuộc tính từ lớp tổng hợp cũng như tất cả các lớpthànhphầndướidạngthuộc tínhlớpphức tạp.

Hình 1.10 cho thấy sự chuyển đổi các tập hợp trong mô hình dữ liệu UML mờsanglược đồcơsởdữ liệuhướngđốitượngmờ.

END CLASSSinh viên trẻINHERITtuổi trẻATTRIBUTES

Khung xe Động cơ cũ

CLASSXeô tô cũ ATTRIBUTES Độngcơcũ ĐầuCDWITH0.4DEGREE Khungxe

Hình 1.10 Chuyển đổi các tập hợp trong UML mờ sang lược đồ cơ sở dữ liệuhướngđốitượngmờ

QuanhệkếthợptrongmôhìnhdữliệuUMLđượcchuyểnđổithànhquanhệkếthợptronglượcđồđốitư ợng,môtảcácthuộctínhtrongmộtlớpkếthợpthamchiếutườngminhđếnmộtlớpkhác.Trongmôhình dữliệuUMLmờ,cóthểphânbiệtbaloạikếthợpcơbản,như sau: a) Cáckếthợpkhôngcóbấtkỳđộmờnào; b) Cáckếthợpchỉcóđộmờởcấp độthứhai; c) Cáckếthợpchỉcóđộmờởcấpđộđầu tiên.

Cho lớp c1và lớp c2được liên kết với nhau bằng mối quan hệ kết hợp R, trong đó Rcóthểlàmốiquanhệmột-một,một-nhiềuhoặcnhiều-nhiều.Ngoàira,giảsửrằngc1và c2có các thuộc tính k1và k2, tương ứng với các giá trị dùng định danh đối tượng.Sauđó,theoquátrìnhbiếnđổicủacáclớpđãchoởtrên,c1vàc2cóthểđượcchuyểnthànhcáclớpt ronglượcđồcơsởdữliệuhướngđốitượngmờ.Tuynhiên,ảnhhưởngcủa R đến sự kết hợp của c 2 (hoặc c1) với c1(hoặc c2) phải được xem xét khi c1(hoặcc2)đượcchuyểnthànhmộtlớpcủalượcđồcơsởdữliệuhướngđốitượngmờ.Ởđây, k2(hoặc k1) được thêm vào lớp c1(hoặc c2) và xem như một khóa ngoại, giống nhưcơ sở dữ liệu quan hệ Nếu ràng buộc của cardinality là quan hệ một-một, thì R làquan hệ một-một từ c1đến c2, k2là thuộc tính đơn trị trong c1và k1là thuộc tính đơngiá trị trong c2 Tuy nhiên, nếu R là quan hệ một-nhiều từ c1đến c2, thì k2là thuộctính đa trị trong c1và k1là thuộc tính đơn trị trong c2 Rõ ràng, k2là thuộc tính đa trịtrong c và k1là thuộc tính đa trị trong c2nếu R là một quan hệ nhiều-nhiều từ c1đếnc2. ĐốivớimốiquanhệRtrongtrườnghợp(b),khảnăngmộtđốitượngcómốiquanhệthuộc về R nên được ánh xạ thành khả năng một đối tượng thuộc về c1hoặc c2 Dođó, các thuộc tính bổ sung biểu thị khả năng các thể hiện của lớp thuộc về lớp tươngứng nên được thêm vào c1và c2tương ứng Đối với mối quan hệ R trong trường hợp(c), tức là, các mối quan hệ với mức thành viên, k2trong c1và k1trong c2phải là cácthuộc tính có mức thành viên, cho biết khả năng khóa ngoại được bao gồm trong lớpđãtạo.

Tiếp theo các phép biến đổi ở trên trong trường hợp (b) và (c), không khó để xử lýmốiquanhệRtrongtrườnghợpcácliênkếtcóđộmờcảởcấpđộđầutiênvàcấpđộthứhai,vớiphépb iếnđổiđượcthựchiệnnhưmộttổhợpđơngiảncủacácphépbiếnđổitrongtrườnghợp(b)và(c). Hình1.11 thểhiện sựchuyểnđổicủacácquanhệkếthợp.

Lưuýrằngchúngtachỉxétmộtliênkếtcôlập(mờ)trongphépbiếnđổicủaliênkết.Cónghĩalà,chúng tagiảđịnhrằngkhôngcólớpnàotronghailớpliênkếtđượcliênkết với các lớp khác ngoài mối quan hệ kết hợp đã cho Tuy nhiên, trong các ứngdụngthực,cóthểmộtlớpcóthểđượcliên kết vớinhiều hơnmộtlớp.

Ví dụ 1.12:Các lớp Người trẻ và Xe mới được kết nối bằng mối quan hệ liên kếtnhư, trong khi Xe mới và Nhà sản xuất được kết nối với mối quan hệ liên kết đượcthực hiện Lớp Xe Mới là một lớp hội liên kết với lớp Người Trẻ và cũng có một hộikhác Về mặt hình thức, để các lớp c1và c2được kết nối với mối quan hệ kết hợp R12và các lớp c2và c3được kết nối với mối quan hệ kết hợp R23 Giả sử rằng ngoài lớpc2, các lớp c1và c3không được kết nối với bất kỳ lớp nào khác Cũng giả sử rằng c1,c2và c3có các thuộc tính k1, k2và k3tương ứng, các giá trị của chúng dùng để nhậndạngđốitượng.Sauđó,c1vàc3đượcchuyểnthànhlớpc1vớimộtthuộctínhbổsungk2v àlớpc3v ớ i mộtthuộctínhbổsungk2,tươngứng,tronglượcđồcơsởdữliệu

C 1 hướngđốitượngmờ.Tuynhiên,c2đ ư ợ cchuyểnthànhlớpc2v ớ ihaithuộctínhbổsungk1v àk3t r o n glược đồcơsởdữliệuhướngđốitượngmờ.

ATTRIBUTES k 2 : k 1 WITHμDEGREE:DOMAINset values

Hình 1.11: Chuyển đổi các liên kết trong UML mờ sang lược đồ cơ sở dữ liệuhướngđốitượngmờ 1.3.10.6 Chuyểnđổicácquanhệphụthuộc

Trong mối quan hệ phụ thuộc mờ, lớp khách hàng phụ thuộc mờ vào lớp nhà cungcấp.Cómộtsốkỹthuậtchungđểbiếnđổimốiquanhệphụthuộc(mờ).Kỹthuậtthứnhấtlàbànvề lớpđộclập,trongđócáclớpkháchhàngvànhàcungcấpđượcchuyểnđổibằngcáchsửdụngcácphươn gphápchuyểnđổicủacáclớpđãchoởtrênvàmốiquan hệ phụ thuộc được nêu trong các lớp được chuyển đổi như một loại ràng buộc.Kỹ thuật thứ hai là bàn về mối quan hệ kết tập trong đó lớp khách hàng được coi làmột phần cấu thành của lớp nhà cung cấp và được chuyển thành thuộc tính lớp phứccủalớpkếttập.Ởđây,lớpkếttậpđượcchuyểnđổitừlớpnhàcungcấptheocáccáchtiếpcậnchuyển đổicủacáckếttậpđãchoởtrên.Kỹthuậtcuốicùnglàbànvềsựkết

1 hợp trong đó các lớp khách hàng và nhà cung cấp được chuyển đổi tương tự nhaubằngcáchsửdụngcácphươngpháptiếpcậnchuyểnđổicủacáckếthợpđượcđưaraởtrênvớim ộtsự khácbiệtnhỏđượclưuýdướiđây.

Gọi các lớp c1và c2là các lớp nhà cung cấp và lớp khách hàng Giả sử rằng các giátrị của thuộc tính k1trong c1và thuộc tính k2trong c2đóng vai trò là định danh đốitượng. Sau đó, c1và c2có thể được chuyển đổi thành các lớp trong lược đồ cơ sở dữliệu hướng đối tượng mờ Tuy nhiên, sự phụ thuộc của c2vào c1phải được xem xétkhi c2được chuyển thành một lớp của lược đồ cơ sở dữ liệu hướng đối tượng mờ Ởđây, k1được thêm vào lớp𝑐′ ược tạo từ lớp cđể 2 Lưu ý rằng khác với phép biến đổikếthợp,k2k h ô n g đ ư ợ cthêmvàolớp𝑐′ ư ợ cđể tạotừ c1.

TruyvấnmờFOQL

Trong đó, là một điều kiện mờ và tất cả các ngưỡng là dãy sốthuộc[0; 1] Bằng cách sử dụng FOQL như vậy, người ta có thể có được các đốitượng này thuộc về lớp dưới ngưỡng nhất định và cũng đáp ứng các điều kiện truyvấn dưới ngưỡng cho cùng một điều kiện Lưu ý rằng các mụcTHOLDthresholdngưỡng có thể được bỏ qua Trong trường hợp này mặc định của ngưỡng chính xáclà1.

Giảiphápchobàitoán

Việc ứng dụng toán học mờ vào các mô hình cơ sở dữ liệu nói chung và mô hìnhCSDL HĐT nói riêng là rất cần thiết để xử lý thông tin không chắc chắn, mơ hồ,haykhôngrõ ràng.Luậnánđềxuấtbagiảiphápsau:

- Tiền xử lý dữ liệu: Nhằm tăng tính hiệu quả cho quá trình lưu trữ và xử lý dữ liệu,luận án đề xuất phương pháp gom cụm và so sánh tính tương tự giữa hai đối tượng.Bên cạnhđó,luậnánđềxuấtthuậttoánphâncụmEMC đượccảitiếndựatrênthuật toán Expectation Maximization (EM) bằng cách bổ sung bước (C) vào thuật toán đểtăng độ mềm dẻo và giảm tối ưu hóa cục bộ và tăng tối ưu hóa toàn cục trong quátrình phân cụm Kết quả của thuật toán gom cụm EMC được tiếp tục xử lý mờ hóadữliệubằngphươngphápphânkhoảngmờ.

-Xửlýtruyvấnmờ:Thôngquacáckếtquảtừtiềnxửlýdữliệu,luậnánđềxuấtmộtsốphươngphá pxửlýtruyvấnmờ mớidựavàođộđotươngtựvàgomcụmdữ liệu

- Đề xuất đại số kết hợp mờ mới: luận án tập trung định nghĩa các phép toán kết hợpmờ như (Phép chọn mờ, phép nối mờ, phép chiếu mờ, phép chia mờ, phép trừ mờ,phép hợp mờ và phép giao mờ làm cơ sở cho việc xây dựng đại số truy vấn mờ chomôhìnhcơsởdữliệuhướngđốitượngmờ.Luậnánđềxuấtkiếntrúcxửlývàtốiưuhóa truy vấn mờ Cụ thể, luận án phát triển thuật toán heuristic tối ưu hóa đại số đốitượngmờdựatrêncácquytắccủaphépbiếnđổitươngđương.Phântíchtrênmộtsốthửnghiệ msửdụngthuậttoánđềxuấtchothấyhiệusuấtxửlýtruyvấntốthơn,điềunàychứngtỏsựnângcao hiệuquảcủaphươngphápđãđềxuất.

Kếtluậnchương1

Mô hình theo cách tiếp cận lý thuyết xác suất, mô hình theo cáchtiếp cận lý thuyết tập mờ, mô hình theo cách tiếp cận lý thuyết khả năng, mô hìnhtheo cách tiếp cận quan hệ tương tự, và mô hình theo cách tiếp cận đại số gia tử Dođặc thù sự phân bố của dữ liệu mà mỗi mô hình có những ưu điểm khác nhau.

Tuynhiên,cácmôhìnhnàyđềucùngchungmụcđíchđólàxửlývàlưutrữcácthôngtinkhông chắc chắn, không đầy đủ mà các hệ quản trị cơ sở dữ liệu truyền thống quanhệ/hướngđốitượngkhôngthựchiệnđược.Trongmụcnày,tậptrungnghiêncứucácđiểm tương đồng của các mô hình này chẳng hạn như chúng cùng thực hiện việc lưutrữ và khai thác dữ liệu mờ theo hai hướng, đó là: mở rộng ngữ nghĩa của dữ liệu đểkhai thác dữ liệu rõ với yếu tố mờ và mở rộng miền trị thuộc tính để biểu diễn đượcdữliệumờ.

Hướng mở rộng ngữ nghĩa, dữ liệu vẫn được lưu trữ như mô hình hướng đối tượng,dữ liệu tại các thuộc tính của các đối tượng vẫn là dữ liệu rõ nhưng cho phép khaithác dữ liệuvớingữ nghĩarộnghơn(cóyếutốmờ).

Hướng mở rộng miền trị thuộc tính là cách mở rộng tổng quát hơn, phản ánh đúngbản chất của vấn đề, nó cho phép bổ sung thêm các cú pháp trong biểu diễn dữ liệunhằmbiểudiễnđượcdữliệumờ.Vớicáchmởrộngnày,ngoàiviệcđưavàohệthốngký hiệu còn phải xây dựng được cơ sở logic cho việc lập luận trên các ký hiệu để xửlý,khaithácđược dữ liệu.

Các mô hình trên đều dựa vào mô hình dữ liệu đối tượng chuẩn ODMG, đồng thờikết hợp ngôn ngữ mô hình hóa UML để biểu diễn trực quan hóa cho các khái niệmmờ như: Mức lược đồ mờ, mức thể hiện lớp mờ, mức thuộc tính mờ Bên cạnh đócác khái niệm mờ cũng đã được áp dụng vào các mối quan hệ như: Tổng quát hóamờ, kết tập mờ, kết hợp mờ và phụ thuộc mờ Các biểu diễn này nhằm mục đích môhình hóa dưới các góc nhìn về mô hình hóa logic và vật lý để từ đó luận án đề xuấtcác phép toán đại số đối tượng mờ cho câu truy vấn và các phương pháp xử lý truyvấn dựa vào các khả năng của thuộc tính có thể biểu diễn các giá trị mờ nhằm thựchiện việc xử lý và trích rút dữ liệu/thông tin không chắc chắn, không đầy đủ trênFOODBsẽđượctrìnhbàycụthểtrongchương2và3.

Chương 2 CÁC PHƯƠNG PHÁP XỬ LÝ TRUY VẤN MỜ DỰA

Các chức năng cơ bản của các hệ cơ sở dữ liệu (CSDL) truyền thống và hướng đốitượnglà:tạolậpcơsởdữliệu,cậpnhậtdữliệu,tìmkiếmvàkếtxuất thôngtin,kiểmsoát,điềukhiểnvàtruycậpvàoCSDL.CáchệCSDLnàycòncócácbướctiềnxửlý nhằm tăng tính hiệu quả trong quá trình thao tác và trích rút dữ liệu như: so sánhtính tương tự, gom cụm, tối ưu hóa Do đó, mô hình cơ sở dữ liệu hướng đối tượngmờcũngcầnphảithựchiệncácbướctiềnxửlýnhưvậy.Môhìnhcơsởdữliệuhướngđốitượng mờrấtphứctạpvìcácđốitượnglưutrữvàxửlýcóthểlàmờhoặcrõphụthuộc vào kiểu thuộc tính và giá trị của thuộc tính đó là không chắc chắn, khôngchính xác, mơ hồ, và có các mối quan hệ giữa các đối tượng là mờ[21],[74]-[77].Chính vì sự phức tạp của mô hình này mà cần phải có các hướng tiếp cận riêng chomộttậphợpcủaquátrìnhtiềnxửlýdữliệuchotruyvấnmờ.Chươngnày,giớithiệuphươngphá ptruyvấndữliệumớidựavàođộđotươngtự(SIM,SEMvàDIS)nhằmtrích rút thông tin thỏa mãn các điều kiện về mức độ tương tự giữa các đối tượng cógiá trị thuộc tính mờ hoặc rõ Đề xuất thuật toán xử lý truy vấn dựa vào thuật toángomcụmdữliệucảitiếnEMCvàphânvùngmờ.Thuậttoánxửlýcâutruyvấnthôngqua việc thực hiện trích chọn dữ liệu trực tiếp trên một số phân vùng mờ được gomcụmsẽchokếtquảnhanhhơnvàhiệuquảhơn. Cáckếtquảchínhđượctrìnhbàytrongchươngnàyliênquanđếnsosánhtínhtươngtự, gum cụm dữ liệu và xây dựng vùng mờ được công bố trong các bài báo [CT1],[CT3],[CT6].

Xửlýtruyvấn mờdựavào độđotươngtự

Sosánhtínhtươngtựcủahai đối tượng mờ

Cho một cơ sở dữ liệu D chứa n đối tượng trong không gian k chiều trong đó𝑜 𝑖là đốitượngthứ ithuộcD,

2.1.1.1 Độđotươngtựvàphi tươngtự Để phân cụm và trích rút dữ liệu từ các hệ thống CSDL, người ta dựa trên độ đotương tự của chúng Đây là các hàm để đo sự giống nhau giữa các cặp đối tượng,thông thường các hàm này hoặc là để tính độ tương tự (Similar) hoặc là tính độ phitươngtự(Dissimilar)giữacácđốitượng.

Tất cả các độ đo dưới đây được xác định trong không gian metric [78], [79]. Nghĩalà,mộttậpX(cácphầntửcủanócóthểlànhữngđốitượngbấtkỳ),cácđốitượngdữliệu trong cơ sở dữ liệuDnhư đã đề cập ở trên được gọi là một không gian metricnếu:

 Vớimỗi cặp phầntửo 1 ,o 2 ∈X,xác định đượckhoảngcáchd(o 1 ,o 2 ) giữao1vào2, thỏamãnmột trong cáctính chấtsau:

Hàmd(o 1 , o 2 )được gọi là một metric của không gian Các phần tử của X được gọilàcác điểmcủakhônggiannày.

Saukhichuẩnhóa,độđophitương tự củahaiđốitượngdữliệuo1 ,o2 (trongđó

𝑎 𝑗là giá trị thuộc tính thứ j của hai đối tượng𝑜 1 , 𝑜2) được xác định bằng một trongcácmetrickhoảngcáchsau:

Có nhiều cách khác nhau để tính độ tương tự giữa các thuộc tính tỉ lệ Một trongnhững số đó là sử dụng công thức tính logarit cho mỗi thuộc tính Hoặc loại bỏ đơnvị đo của các thuộc tính dữ liệu bằng cách chuẩn hóa chúng, hoặc gán trọng số chomỗi thuộc tính giá trị trung bình độ lệch chuẩn Với mỗi thuộc tính dữ liệu đã đượcgán trọngsố tương ứng𝑤 𝑗 , 𝑣ớ𝑖 1 ≤ 𝑗 ≤ 𝑘, độ tương đồng dữ liệu được xác định nhưsau:

Ngữ nghĩa của một dữ liệu mờ (được giới thiệu trong chương 1) đại diện bởi phânphốikhảnăngtươngứngvớikhônggianngữnghĩa.Cácmốiquanhệngữnghĩagiữahaidữliệu mờsauđóđượcmôtảbởicácmốiquanhệgiữacáckhônggianngữnghĩacủachúng.Mứcđộbaohàmn gữnghĩađượcsửdụngđểđolườngkhảnăngbaohàmngữnghĩavàngữ nghĩatươngđươngcủadữ liệumờ[73],[80]. Địnhnghĩa2.1:Chotậpvũtrụ𝑈={𝑢1,𝑢2,…,𝑢𝑛} ,VớihaidữliệumờAv à

Bđược định nghĩa trên miền U dựa trên khả năng phân bố và𝜋𝐴(𝑢𝑖), 𝑢𝑖∈ 𝑈, chứngtỏkhảnăng𝑢 𝑖là đúng Kýhiệu𝑆𝐼𝐷(𝜋 𝐴 ,𝜋 𝐵 )và ượcđể xác địnhnhưsau:

Theo định nghĩa trên, các khái niệm về mức độ tương đương có thể được rút ra nhưsau. Định nghĩa2.2:Cho𝜋𝐴v à 𝜋 𝐵 làhai dữ liệumờvà𝑆𝐼𝐷(𝜋𝐴,𝜋 𝐵 )làmức độ𝜋𝐴 baohàm ngữnghĩacủa𝜋 𝐵 SE(𝜋 𝐴 ,𝜋 𝐵 ) ượcđể xácđịnhnhưsau.

𝑆𝐸(𝜋 𝐴 ,𝜋 𝐵 ) = min(𝑆𝐼𝐷(𝜋 𝐴 ,𝜋 𝐵 ), 𝑆𝐼𝐷(𝜋 𝐵, 𝜋 𝐴 )) (2.2) Mức độ bao gồm ngữ nghĩa của hai dữ liệu mờ được đưa ra dựa trên phân bốkhảnăng [26].

Bằng cách sử dụng các định nghĩa ở trên, ta có thể đánh giá mức độ tương tựngữnghĩacủacácthuộctínhcógiátrịmờ.

2.1.1.3 Sosánhhaiđốitượng dựavàođộđotươngtựmờ Độ đo tương tự được biết đến rộng rãi [31] và thường được sử dụng để so sánh cácđối tượng rõ (có các thuộc tính chính xác), nhưng nó vẫn còn khó khăn để đánh giávàđịnhlượngđốivớicácloạidữliệubiểudiễnthôngtinkhôngchắcchắn,khôngrõràng, mờ Đánh giá mức độ hai đối tượng trong một câu lệnh truy vấn là tương tựhoặc tương thích là một yếu tố thiết yếu Do đó, việc đánh giá sự giống nhau đã trởnên quan trọng trong việc phát triển hệ thống phân loại, truy xuất thông tin và quyếtđịnh. Đểsosánhcácđốitượng,cóbaloạidữliệusauđâycóthểđượcxemxét:số(cao175cm ),phânloại(màu:trắng,đen)vàcácthuộctínhcógiátrịmờ(tuổi:trẻ,trungniên,già).Tron gmụcnày,loạithuộctínhthứbađượcgiảiquyếttheochiềusâu Vì vậy, các thuộc tính của một đối tượng bất kỳ có thể được phân loại như sau:Thuộctínhvới cácgiátrịrõ(hoặcsố).Mỗi thuộctính cómộtmiềncơ bản đượcxácđịnh𝑈⊆ℝthườnglàmộttậphợpcógiớihạn.

Thuộc tính mờ (hoặc thuộc tính có giá trị mờ) Mỗi giá trị thuộc tính là một tập hợpcác nhãn ngôn ngữ, được mô tả bởi một tập hợp𝐹(𝑈)={𝐴|𝐴 ⊆ 𝑈 }được xác địnhtrênmiềncơbảnU.Mỗitậpconmờ𝐴∈𝐹 (𝑈) ư ợ cđể đặctrưngbởihàmthànhviên

Hầu hết các phép đo khoảng cách và tương tự được định nghĩa cho dữ liệu sốvàcómộtsốphầnmởrộngchodữliệuphânloại[81],[82].Tuynhiên,đôikhicóthểcó thêm thông tin ngữ nghĩa về miền Tính toán với các từ (xử lý cả thuộc tính số vàkýhiệu)đốivớicácmiềnphứctạpthôngthườngđượcxửlýbằngcáchthêmmộtkhíacạnhtự nhiênhơnvàodữ liệucủamiềnnày[83].

Các đối tượng không giống nhau trong các ví dụ dưới đây được biểu diễn dưới dạngcác điểm tọa độ trong không gian và khoảng cách theo hệ mét giữa các điểm tươngứng Thông thường khoảng cách Euclide được sử dụng để xác định sự không giốngnhau giữa hai khái niệm hoặc đối tượng Tuy nhiên, tác giả đề xuất sử dụng khoảngcáchEuclideápdụngchocáctậpmờ,thayvìchỉchocácđiểmtrongmộtkhônggian.Độnglựcđ ểnghiêncứutínhtươngtựgiữacácđốitượngmờđượcxuấtpháttừvídụsau.

Ví dụ 2.1: Một sinh viên đang tìm cách đặt phòng và muốn so sánh các phòng hiệncó để chọn phòng phù hợp nhất Mỗi phòng đều được mô tả bởi chất lượng, giá cả,và khoảng cách đến Viện hàn lâm khoa học Việt Nam (VAST) Giả sử rằng, đã tìmthấy hai phòng như mô tả trong hình 2.1, và "Làm thế nào có thể so sánh hai phòngnày?".

Nhưtronghình2.1,việcmôtảhaiphònglàmơhồ,vìcácthuộctínhcủachúngđượcbiểudiễnbằngcách sửdụngcácgiátrịngônngữ[84]vàcácgiátrịsố.Nóicáchkhác,Phòng1vàPhòng2làcácđốitượngmờcủal ớpPhòng(cónghĩalà,ítnhấtmộtthuộctínhcủachúngcógiátrịmờ).Cầnphảinhấtquántrongviệcđịn hdạnghaybiểudiễngiátrịmờ.Khicáctậpmờmôtảcácgiátrịngônngữcủamộtmiềncụthểvàcáchàmt hànhviêncủachúngđượcxácđịnh,cácđốitượngđượcsosánhmộtcáchchínhxáchơn.

Trước khi giới thiệu phép đo tương tự để so sánh hai đối tượng mờ (hai phòng nhưmô tảtronghình2.1),chúngtacóthể:

2 Xác định ngữ nghĩa của các nhãn ngôn ngữ bằng cách sử dụng các tập mờ (hoặccácthuậtngữmờđượcđặctrưngbởicáchàmthànhviên)đượcxâydựngtrêncáctên miềncơbản.

4 Tổnghợphoặctínhtoánmứctrungbìnhtrêntấtcảcácđiểmtươngđồngđểđưaraquyết địnhcuốicùngvềmứcđộtương tự củahaiđốitượng(phòng).

 TrườnghợpII:sosánh mộtthuộc tínhrõ với mộtthuộctính mờvàngượclại.

Trong phần này, để giải quyết cho trường hợp I chúng ta so sánh các đối tượng cócác thuộc tính mờ Ban đầu, xác định sự tương tự của hai đối tượng mờ thông quathuộctínhmờvàsauđótínhtoánsựgiốngnhautổngthểgiữahaiđốitượngmờbằngcách sử dụng hai công thức (2.9) và (2.10) Hình 2.2 minh họa cách tính tương tựgiữahai đốitượngmờ. Định nghĩa 2.4: Cho hai đối tượng𝑜 1 𝑣à 𝑜2các tập các tập thuộc tính tương ứngnhưsau𝑎𝑡 𝑂 1 = {𝑎 1 ,𝑎 1 ,…, 𝑎 𝑛 }và𝑎𝑡 𝑂 2 = {𝑏 1 ,𝑏 1 ,…, 𝑏 𝑛 } Tínhtươngtự𝑆:𝑎𝑡 𝑂 1 ×

𝑎𝑡 𝑂 2→ [0;1]giữahaithuộctínhtương ứngvới𝑎 𝑗 ,𝑏 𝑗 ược ịnh để để nghĩanhư sau:

Trongđóklà mứcđộ thuộccủathuộctính thứj,𝑎 𝑗𝑣 à 𝑏 𝑗l à thuộctínhthứj vớij=1,2,…, n, n làsố thuộc tính và độ đo khoảng cách metricdđược biểu diễn bằng ánhxạ⊕ 𝑗 :

𝑑(𝑎 𝑗 ,𝑏 𝑗 )=⊕ 𝑗 (𝑑𝑖𝑠(𝐴 1𝑗 ,𝐵 1𝑗 ),𝑑𝑖𝑠(𝐴 2𝑗 ,𝐵 2𝑗 ),…,𝑑𝑖𝑠(𝐴 𝑚 𝑗 𝑗 ,𝐵 𝑚 𝑗 𝑗 )) (2.4) trongđó𝐴 𝑚 𝑗 𝑗 ,𝐵 𝑚 𝑗 𝑗giá trịthuộctínhtươngứngcủa𝑎 𝑗𝑣à 𝑏 𝑗 ,với𝑚 𝑗là sốlượngcáctập mờđạidiệnchogiátrịcủathuộctínhthứ j trênmiềncơ bản𝑈 𝑗 ⊕ 𝑗c ó thểđược xácđịnhbằngcáchtổngchotấtcảbìnhphươngkhoảngcáchEuclidecủatậpconmờchia cho sốtậpmờ𝑚 𝑗 :

Khoảng cách𝑑𝑖𝑠: 𝐹(𝑈 𝑗 ) × 𝐹(𝑈 𝑗 ) →[0; 1]mô tả sự khác biệt giữa các tập mờ và nócóthểđượcxácđịnhtronghaitrườnghợpsau: a) Nếu thuộc tính𝑎 𝑗 và𝑏 𝑗 là các giá trị ngôn ngữ và ngữ nghĩa của chúng đểượcxácđịnhbằngcáchsửdụngcáctậpmờđượcthểhiệnbởicùngmộthàmthànhviên (𝜇 𝐴 𝑖𝑗 (𝑥)= 𝜇 𝐵 𝑖𝑗 (𝑥)với mọi𝑥 ∈ 𝑈 𝑗 , ví dụ so sánh hai phòng học (xemHình2.4trongvídụ2.1),sauđó:

𝑑𝑖𝑠(𝐴 𝑖𝑗 ,𝐵 𝑖𝑗 )= | 𝜇 𝐴 𝑖𝑗 (𝑥)−𝜇 𝐴 𝑖𝑗 (𝑦)|;vớimọi𝑥 , 𝑦∈ 𝑈 𝑗 (2.6) b) Nếu các thuộc tính𝑎 𝑗 , và𝑏 𝑗 là các giá trị ngôn ngữ ược biểu diễn bằngđể cáchàm thành viên khác nhau tương ứng với𝜇 𝐴 𝑖𝑗 (𝑥),𝜇 𝐵 𝑖𝑗 (𝑥), xem ví dụ 2.2 sosánhhaiphònghọc(Hình 2.6),tacó:

(2.7)Định nghĩa ộ tương tự ược ề xuất trong phương trình (2.3) cho phép ta xác ịnhđể để để để mức độ của các thuộc tính của hai đối tượng là tương tự nhau Tham số𝑘 𝑗trong phương trình (2.3) được sử dụng để điều chỉnh độ tương tự bằng cách điều chỉnh sựđóng góp của khoảng cáchdtrong phép đo tương tự Kết quả là,𝑘𝑗có thể ược tính để theokhoảngcáchdthôngqua ứngdụngcủangườidùnghoặccóthểđượcướctính.

Hình2.2:Tínhtoánsựgiốngnhaugiữahaiđốitượngmờ… 𝑜1và𝑜2 Độ đo tươngtự𝑆𝑖𝑚(𝑜 1 ,𝑜 2 )giữahaiđối tượngmờ𝑜 1v à 𝑜 2l à :

𝑆𝑖𝑚(𝑜 1 ,𝑜 2 )=⊕(𝑆(𝑎 1 ,𝑏 1 ),𝑆(𝑎 2 ,𝑏 2 ),…,𝑆(𝑎 𝑛 ,𝑏 𝑛 )) (2.8) trong đóánhxạ⊕ 𝑗 :[0,1]𝑛→ [0,1]làtoántửgộp,chẳnghạnnhưbìnhquân trọngsốhoặchàmtốithiểu:

(2.10)Mệnh ề 2.1:để Độ tươngtự𝑆𝑖𝑚(𝑜 1 , 𝑜 2 )của hai đối tượng mờ𝑜 1và 𝑜 2(như trongphươngtrình2.9,2.10)thỏamãncáctínhchấtsau: a) Tính phảnxạ:𝑆𝑖𝑚(𝑜 1 ,𝑜 1 )=1,vớimọiđốitượng𝑜 1 b) Tínhtươngtự:

Sựgiốngnhaugiữahaiđốitượngkhácnhau𝑜1và𝑜2phảinhỏhơnmứctươngtựgi ữa đốitượng𝑜 1 vàchínhnó:𝑆𝑖𝑚(𝑜 1 ,𝑜 2 )≤

1+𝑘 𝑗 𝑑(𝑎 𝑗 ,𝑎 𝑗 ) 1+𝑘 𝑗 (0) 𝑗 𝑗 𝑗 𝑗 kéotheo𝑆(𝑎 𝑗 ,𝑏 𝑗 )

Ngày đăng: 06/12/2022, 22:51

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w