Dự thảo tóm tắt Luận án Tiến sĩ Toán học: Nghiên cứu một số quy trình gộp thông tin bằng từ và ứng dụng

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	27
Dung lượng	414,79 KB

Nội dung

Mục tiêu tổng quát của luận án là đề xuất khái niệm từ trực cảm và ứng dụng trong bài toán ra quyết định với thông tin cho bằng từ có yếu tố trực cảm. Đề xuất độ tương tự từ, độ tương tự véc-tơ từ và ứng dụng vào bài toán phân lớp thông tin. Đề xuất độ tương tự giá trị mờ trực cảm, độ tương tự véc-tơ mờ trực cảm và ứng dụng vào phân lớp thông tin.

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN _ Phạm Hồng Phong NGHIÊN CỨU MỘT SỐ QUY TRÌNH GỘP THƠNG TIN BẰNG TỪ VÀ ỨNG DỤNG Chuyên ngành: Cơ sở Toán học cho Tin học Mã số: 62.46.01.10 DỰ THẢO TÓM TẮT LUẬN ÁN TIẾN SĨ TỐN HỌC Hà Nội - 2017 Cơng trình hoàn thành tại: nhiên, ĐHQG Hà Nội Trường Đại học Khoa học Tự Người hướng dẫn khoa học: PGS TSKH Bùi Công Cường PGS TS Đỗ Trung Tuấn Phản biện: Phản biện: Phản biện: Luận án bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận án tiến sĩ họp vào hồi ngày tháng năm 20 Có thể tìm hiểu luận án tại: - Thư viện Quốc gia Việt Nam - Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội Mở đầu Sơ lược tính tốn với từ Thơng thường, đánh giá đối tượng đó, người ta hay quan tâm đến tiêu định lượng (chỉ tiêu lượng hóa) Bên cạnh tiêu định lượng, ta cần quan tâm đến tiêu định tính Trong nhiều tình huống, việc quy đổi tiêu định tính sang định lượng khơng hợp lý Khi đó, cách tiếp cận khoa học, khách quan, tương đối dễ thực để cố vấn, chuyên gia phát biểu từ dùng ngơn ngữ thơng thường Ví dụ, độ may rủi dự án chuyên gia đánh giá từ tập đây: S = hầu_như_không, rất_thấp, thấp, trung_bình, cao, khá_cao, rất_cao (1) Tính tốn tập S (1) gọi Tính tốn với từ (CW) CW, lần đầu Zadeh đưa vào năm 1973, q trình tính tốn với đối tượng từ mệnh đề ngơn ngữ tự nhiên Mục đích CW thu hẹp khác cách lập luận người phương pháp tính tốn truyền thống Trên giới, có nhiều hướng để thực CW Người ta hay dùng tập từ dùng để đánh giá S = s0 , s1 , , s g , số phần tử S thường số lẻ, si (i = 0, , g) ký hiệu cho giá trị từ biến ngôn ngữ Sau số tiếp cận: dựa thứ tự từ L A Zadeh, Outline of a new approach to the analysis of complex systems and decision processes, IEEE Transactions on Systems, Man and Cybernetics SMC-3(1), 28-44 L A Zadeh, The concept of a linguistic variable and its application to approximate reasoning – I, Information Information Sciences 8, 199-249, 1975 (Yager, 1981), dựa Nguyên lý Suy rộng (Herrera, 2000), dựa số từ (Herrera 2000), dựa cặp ngôn ngữ (Herrera, 2000) dựa từ mở rộng (Xu, 2004) Cho tới nay, CW tiếp tục nghiên cứu ứng dụng nhiều lĩnh vực định, tìm kiếm thơng tin, xếp hạng giáo dục, Mục đích luận án Đề xuất khái niệm từ trực cảm ứng dụng tốn định với thơng tin cho từ có yếu tố trực cảm Đề xuất độ tương tự từ, độ tương tự véc-tơ từ ứng dụng vào tốn phân lớp thơng tin Đề xuất độ tương tự giá trị mờ trực cảm, độ tương tự véc-tơ mờ trực cảm ứng dụng vào phân lớp thông tin Cấu trúc luận án Chương trình bày tổng quan lý thuyết mờ tính tốn với từ, sở lý thuyết phục vụ cho chương sau Chương 2, đóng góp thứ luận án, đề xuất khái niệm từ trực cảm ứng dụng toán định tập thể Trong Chương 3, nghiên cứu sinh đề xuất số độ đo ứng dụng vào toán phân lớp Chương Tổng quan lý thuyết mờ tính tốn với từ 1.1 Sơ lược lý thuyết mờ mờ trực cảm 1.1.1 Tập mờ biến ngôn ngữ Năm 1965, Zadeh đưa khái niệm tập mờ (fuzzy set) Định nghĩa 1.1 Cho tập X = ∅ Tập mờ A X định nghĩa hàm µ A : X → [0, 1] Họ tất tập mờ X ký hiệu F ( X ) Định nghĩa 1.2 Biến ngơn ngữ năm có dạng ( L, T ( L) , X, G, M ): L tên biến ngôn ngữ; T ( L) tập giá trị từ biến ngôn ngữ; X không gian nền, gồm tất giá trị số biến ngôn ngữ; G quy tắc cho phép sinh từ T ( L); M luật ngữ nghĩa, cho tương ứng từ s T ( L) vào tập mờ X Theo Zadeh, biến ngơn ngữ biến mà giá trị số mà từ hay câu ngôn ngữ tự nhiên Nói chung, từ hay câu khơng L A Zadeh, Fuzzy sets, Information and Control 8, 338-353, 1965 A Zadeh, The concept of a linguistic variable and its application to approximate reasoning – I, Information Information Sciences 8, 199-249, 1975 L rõ ràng số, nhiên lại gần với cách mà người hiểu giải thích giới thực 1.1.2 Tập mờ trực cảm giá trị mờ trực cảm Năm 1986, Atanassov khái quát tập mờ Zadeh thành tập mờ trực cảm Định nghĩa 1.3 Cho X = ∅, tập mờ trực cảm A X định nghĩa hàm thuộc µ A : X → [0, 1] hàm không thuộc νA : X → [0, 1] cho ≤ µ A ( x ) + νA ( x ) ≤ với x ∈ X Tập hợp tất tập mờ trực cảm X ký hiệu IF ( X ) Với x ∈ X, đại lượng µ A ( x ), νA ( x ) π A ( x ) = − µ A ( x ) − νA ( x ) gọi độ thuộc, độ không thuộc độ lưỡng lự x vào tập A Theo định nghĩa tập mờ trực cảm thì, quan hệ phần tử x ∈ X với tập mờ trực cảm A đặc trưng cặp (µ A ( x ) , νA ( x )) Mỗi cặp Xu gọi giá trị mờ trực cảm (intuitionistic fuzzy value, IFv) Định nghĩa 1.4 Cặp số α = (µα , να ) gọi giá trị mờ trực cảm µα , να ∈ [0, 1] µα + να ≤ (1.1) Tập hợp tất giá trị mờ trực cảm ký hiệu θ 1.2 1.2.1 Tốn tử gộp thơng tin cho từ Gộp dựa thứ tự từ Ta ký hiệu tập từ liên quan đến biến ngôn ngữ T S Trên S có sẵn quan hệ thứ tự thông thường Các từ đánh số cho thứ tự K T Atanassov, Intuitionistic fuzzy sets, Fuzzy Sets and Systems 20, 87-96, 1986 S Xu, Intuitionistic fuzzy aggregation operators, IEEE Transactions on Fuzzy Systems 15, 1179-1187, 2007 Z số thứ tự theo ý nghĩa thông thường từ Nếu chọn tập số {0, 1, , g} tập từ S có dạng S = s0 , s1 , , s g Yager (1981-1998) định nghĩa phép toán S (phép phủ định, max, trung vị) Dựa phép toán bản, người ta định nghĩa nhiều phép gộp cho từ S 1.2.2 Gộp dựa Nguyên lý Suy rộng Hướng nghiên cứu xuất công bố Bonissone Decker (1986), Bordogna Passi (1993), Chang Chen (1994), Chen (1997), Degani Bortolan (1988), Delgado cộng (1993), Lee (1996), Đây tiếp cận sử dụng Nguyên lý Suy rộng, gồm khai khâu: • Mỗi từ đồng với số mờ Các số mờ gộp nhờ hàm F˜ với F˜ hàm suy rộng từ hàm rõ F theo Nguyên lý Suy rộng; • Trong đa số trường hợp, số mờ nhận bước trước không tương ứng với từ S Để giải vấn đề này, người ta sử dụng hàm app1 (·) để xấp xỉ số mờ với từ Quá trình gộp Herrera Martínez (2000) mơ tả sau: F˜ app (·) Sn −→ F (R) −→ S 1.2.3 (1.2) Gộp dựa số từ Quá trình gộp có sử dụng tốn tử gộp dựa số từ Herrera (2000) mô tả đây: c app (·) Sn −→ [0, g] −→ {0, 1, , g} −→ S, (1.3) • c tốn tử gộp số từ, cho tương ứng n số với số thực thuộc đoạn [0, g]; • app2 (·) phép xấp xỉ, cho tương ứng số thực thuộc đoạn [0, g] với số nguyên thuộc tập {0, 1, , g}, số nguyên ứng với từ S 1.2.4 Gộp dựa biểu diễn theo cặp ngơn ngữ Herrera Martínez (2000) đề xuất biểu diễn theo cặp ngôn ngữ (linguistic 2-tuples) Theo thơng tin cho từ biểu diễn cặp có dạng (si , ), với si ∈ S từ số hệ số sai khác (symbolic translation), dùng để đo khác thông tin ngôn ngữ từ si 1.2.5 Gộp từ với số liên tục Xu (2004) mở rộng tập từ rời rạc với số đối xứng S = s− n , , s0 , , s n 2 ¯ (tập từ gốc) thành tập từ với số liên tục S = { sα | α ∈ [−q, q]} (tập từ ¯ sα ∈ S mở rộng) với q > n số tự nhiên đủ lớn.Với sα ∈ S, ta nói sα từ gốc, ngược lại ta nói sα từ ảo Với cải tiến này, thông tin bảo tồn q trình gộp 1.2.6 Gộp thơng tin cho từ có yếu tố trực cảm Thơng tin cho từ có yếu tố trực cảm bao gồm hai yếu tố: từ trực cảm Ta quan tâm đến hai khái niệm đề xuất năm gần đây: giá trị ngôn ngữ trực cảm (ILV) số ngôn ngữ trực cảm (ILN) Định nghĩa 1.5 Mỗi giá trị ngôn ngữ trực cảm cặp có dạng Γ = (si , ) , s j , δ , đó, (si , ), s j , δ cặp ngôn ngữ thỏa mãn (si , ) ≤ neg s j , δ Ký hiệu Π tập hợp tất giá trị ngôn ngữ trực cảm Y Zhang, H X Ma, B H Liu, J Liu, Group decision making with 2-tuple intuitionistic fuzzy linguistic preference relations, Soft Computing 16, 1439-1446, 2012 J Q Wang and H B Li, Multi-criteria decision-making method based on aggregation operators for intuitionistic linguistic fuzzy numbers, Control and Decision 25 (10), 1571-1574, 1584, 2010 Zhang đề xuất tốn tử trung bình số học (ILV − AA) tốn tử trung bình số học có trọng số cho giá trị ngơn ngữ trực cảm (ILV − WAA) để giải toán định tập thể với đánh giá giá trị ngôn ngữ trực cảm Định nghĩa 1.6 Một số ngơn ngữ trực cảm có dạng α = sθ (α) , µ (α) , ν (α) , sθ (α) ∈ S¯ từ, µ (α) ∈ [0, 1] ν (α) ∈ [0, 1] độ thuộc độ không thuộc vào từ sθ (α) đối tượng cần đánh giá, µ (α) ν (α) thỏa mãn điều kiện µ (α) + ν (α) ≤ Tập hợp tất số ngôn ngữ trực cảm ký hiệu Ω Wang đề xuất tốn tử gộp cho số ngơn ngữ trực cảm tốn tử trung bình số học có trọng số (ILN − WAA), tốn tử OWA (ILN − OWA) toán tử gộp lai (ILN − HA) Dựa vào toán tử ILN − WAA ILN − HA, Wang (2014) phát triển tiếp cận cho tốn định tập thể, đánh giá số ngôn ngữ trực cảm 1.2.7 Ra định với thông tin cho từ Liên quan trực tiếp đến nội dung luận án quy trình định Zhang (2012) Wang (2014) Quy trình mà Zhang giải tình sau: • Xét X = { x1 , , xm } tập phương án D = d1 , , d p tập chuyên gia Giả sử e = e1 , , e p véc-tơ trọng số chun gia; • Độ ưa thích chuyên gia dk phương án xi so với phương án x j cho giá trị ngôn ngữ trực cảm Γijk Ma trận Pk = Γijk m×m gọi ma trận định cho chuyên gia dk ; • Vấn đề đặt làm để chọn hay vài phương án tốt Quy trình 1.1 Quy trình gồm bước sau: Sử dụng toán tử trung bình số học có trọng số ILV − WAA, gộp ma trận Pk = Γijk m×m , thu ma trận P = Γij m×m ; Đánh giá cuối phương án xi thu cách sử dụng tốn tử trung bình ILV − AA Γij ; Chọn hay vài phương án tốt Wang quan tâm đến tình huống, so với tình Zhang, có thêm xuất tiêu chí Ngồi ra, đánh giá số ngơn ngữ trực cảm (ILN) thay giá trị ngơn ngữ trực cảm (ILV) Cụ thể: • Gọi X = { x1 , , xm } tập phương án, C = {c1 , , cn } tập tiêu chí D = d1 , , d p tập chuyên gia Giả sử véc-tơ trọng số tiêu chí chuyên gia w = (w1 , , wn ) e = e1 , , e p ; • Mỗi chuyên gia dk đưa đánh giá phương án xi theo tiêu chí c j ILN αijk ∈ Ω Ma trận Rk = αijk m×n gọi ma trận định chuyên gia dk ; • Ta cần xếp để chọn hay vài phương án tốt Quy trình 1.2 Quy trình gồm bước sau Xác định đánh giá tổng hợp αik chuyên gia ek phương án xi nhờ toán tử ILN − WAA; p Gộp giá trị α1i , , αi toán tử ILN − HA để thu đánh giá tập thể chuyên gia, αi , phương án xi ; Lựa chọn hay vài phương án tốt 2.2 2.2.1 Toán tử gộp từ trực cảm Giá trị lớn giá trị nhỏ từ trực cảm Định nghĩa 2.2 [CT 2] Giá trị lớn nhất, max, giá trị nhỏ nhất, min, ILL ( a˜ , , a˜ n ) S¯ định nghĩa sau: max ( a1 , , an ) = b˜ , ( a1 , , an ) = b˜ n , với b˜ j phần tử lớn thứ j a˜ i 2.2.2 Trung vị từ trực cảm Định nghĩa 2.3 [CT 6] Xét ( a˜ , , a˜ n ) ILL S Giả sử b˜ , , b˜ n hoán vị ( a˜ , , a˜ n ) thỏa mãn b˜ ≥ b˜ ≥ · · · ≥ b˜ n Trung vị: trung vị ( a˜ , , a˜ n ), ký hiệu ILL − MED ( a˜ , , a˜ n ), định nghĩa bởi:   b˜ n ILL − MED ( a˜ , , a˜ n ) = b˜ n+1 n chẵn n lẻ Trung vị có trọng số: xét ((w1 , a˜ ) , , (wn , a˜ n )), w = (w1 , , wn ) véc-tơ trọng số với wi ∈ [0, 1] trọng số a˜ i (i = 1, , n) Ta xếp ((w1 , a˜ ) , , (wn , a˜ n )) thành u1 , b˜ , , un , b˜ n cho b˜ j phần tử lớn thứ j a˜ i u j = wi b˜ j = a˜ i Ký i hiệu Ti = ∑ u j (i = 1, , n) Trung vị có trọng số từ trực cảm j =1 ký hiệu ILL − WMED định nghĩa sau: ILL − WMED ((w1 , a˜ ) , , (wn , a˜ n )) = b˜ k Trong đó, k số nguyên dương nhỏ mà Tk ≥ 0.5 11 2.2.3 Tổ hợp lồi từ trực cảm Định nghĩa 2.4 Với a˜ , a˜ ∈ S ILL, giả sử s˜i = ( a˜ , a˜ ) s˜j = max ( a˜ , a˜ ) Tổ hợp lồi a˜ a˜ với véc-tơ trọng số w = (w1 , w2 ), ký hiệu C {wi , a˜ i , i = 1, 2}, định nghĩa sau: C {wi , a˜ i , i = 1, 2} = s˜k Trong đó, k = i + round [w1 ( j − i )] với round phép làm trịn thơng thường Để cho tiện, ta dùng C {w1 , w2 , a˜ , a˜ } thay cho C {wi , a˜ i , i = 1, 2} Định nghĩa 2.5 Với n ≥ 2, tổ hợp lồi a˜ , , a˜ n ∈ S với véc-tơ trọng số w = (w1 , , wn ) ký hiệu Cn {wk , a˜ k , k = 1, , n} định nghĩa sau: • n = 2: C2 {wi , a˜ i , i = 1, 2} = C {wi , a˜ i , i = 1, 2}; • n > 2: Cn {wk , a˜ k , k = 1, 2, , n} = C w1 , − w1 , b˜ , Cn−1 wh ˜ , b , h = 2, , n − w1 h Trong đó, b j phần tử lớn thứ j Để cho tiện, tùy trường hợp, ta sử dụng ký hiệu Cn {w1 , , wn , a˜ , , a˜ n } thay cho Cn {wi , a˜ i , i = 1, , n} 2.2.4 Toán tử OWA cho từ trực cảm Dựa vào tổ hợp lồi, ta định nghĩa toán tử OWA cho ILL Định nghĩa 2.6 Toán tử OWA cho ILL S với véc-tơ trọng số w = (w1 , , wn ), ký hiệu ILL − OWA1 , định nghĩa đây: ILL − OWA1w ( a˜ , , a˜ n ) = Cn {wk , a˜ k , k = 1, , n} , với ( a˜ , , a˜ n ) ∈ Sn 12 2.2.5 Các toán tử gộp cho từ trực cảm mở rộng Để định nghĩa phép gộp cho ILL mở rộng (gọi tắt ILL), ta dựa hai phép toán Định nghĩa 2.7 sau ¯ ta định nghĩa: Định nghĩa 2.7 [CT 7] Với α˜ = s x , sy , β˜ = (su , sv ) ∈ S, Phép cộng hai ILL: α˜ ⊕ β˜ = s x+u , sy+v ; Phép nhân ILL với số thực: λα˜ = sλx , sλy , với λ ∈ [0, 1] Định nghĩa 2.8 [CT 7] Trung bình số học cho ILL ánh xạ ILL − AA : ¯ định nghĩa sau: S¯ n → S, ILL − AA (α˜ , , α˜ n ) = (α˜ ⊕ · · · ⊕ α˜ n ) n Định nghĩa 2.9 Tốn tử trung bình số học có trọng số cho ILL ánh xạ ILL − WAA : S¯ n → S¯ định nghĩa bởi: ILL − WAAw (α˜ , , α˜ n ) = w1 α˜ ⊕ · · · ⊕ wn α˜ n Trong đó, w = (w1 , , wn ) véc-tơ trọng số Định nghĩa 2.10 Toán tử OWA cho ILL mở rộng ánh xạ ILL − OWA2 : S¯ n → S¯ định nghĩa sau: ILL − OWA2w (α˜ , , α˜ n ) = w1 β˜ ⊕ · · · ⊕ wn β˜ n Trong đó, w = (w1 , , wn ) véc-tơ trọng số β˜ j phần tử lớn thứ j α˜ i (i = 1, , n) Định nghĩa 2.11 Toán tử gộp lai cho cho ILL với véc-tơ trọng số toán tử ω = (ω1 , , ωn ) ánh xạ ILL − HA : S¯ n → S¯ định nghĩa ILL − HAw,ω (α˜ , , α˜ n ) = ω1 β˜ ⊕ · · · ⊕ ωn β˜ n (2.1) Trong đó, β˜ j phần tử lớn thứ j (nw1 α˜ , , nwn α˜ n ) Ở đây, w = (w1 , , wn ) véc-tơ trọng số (α˜ , , α˜ n ) 13 2.2.6 Ứng dụng toán tử gộp cho từ trực cảm vào toán định Dựa vào toán tử gộp cho từ trực cảm (ILL), đề xuất hai quy trình giải tốn định với thơng tin cho từ có yếu tố trực cảm Quy trình 2.1 [CT 6] Quy trình gồm bước sau: Sử dụng toán tử ILL − WAA để gộp ma trận P˜ k = α˜ ijk 1, , p, thu ma trận P = α˜ ij m×m m×m ,k = P ý kiến tổng hợp tập hợp chuyên gia phương án Mỗi α˜ ij xác định sau: p α˜ ij = ILL − WAAe α˜ 1ij , , α˜ ij , i, j = 1, , m (2.2) Dùng toán tử ILL − AA, xác định α˜ i ∈ S¯ đánh giá tổng hợp phương án xi : α˜ i = ILL − AA (α˜ i1 , , α˜ im ) , i = 1, , m (2.3) Sử dụng quan hệ thứ tự cho ILL, xếp α˜ i (i = 1, , m) để chọn vài phương án tốt Quy trình 2.2 [CT 7] Quy trình có ba bước sau: Gộp đánh giá phương án xi tồn tiêu chí: k k α˜ ik = ILL − WAAw α˜ i1 , , α˜ in , i = 1, , m, k = 1, , p; (2.4) Tổng hợp đánh giá cuối phương án: p α˜ i = ILL − HAe,v α˜ 1i , , α˜ i , i = 1, , m, (2.5) với v = v1 , , v p véc-tơ trọng số toán tử ILL − HA; Xác định điểm độ chắn α˜ i (i = 1, , m) thứ tự phương án Phương án xi1 gọi tốt phương án xi2 , ký hiệu xi1 > xi2 , α˜ i1 > α˜ i2 , với i1 , i2 = 1, , m) 14 2.3 So sánh từ trực cảm với giá trị ngôn ngữ trực cảm số ngôn ngữ trực cảm 2.3.1 2.3.1.1 So sánh phương diện lý thuyết Từ trực cảm giá trị ngôn ngữ trực cảm ¯ Để nghiên cứu mối quan hệ ILV ILL, ta xét ánh xạ ∆: ¯ : Π → S, ¯ ∆ ¯ cho tương ứng giá trị ngôn ngữ trực cảm Γ = (si , ) , s j , δ ∆ (2.6) với từ trực cảm α˜ = si+ , s j+δ Định lý 2.1 Ký hiệu Γ α˜ đánh giá cuối phương án x ¯ ( Γ ) qua Quy trình 1.1 2.1 Khi đó, ta có α˜ = ∆ Hệ 2.1 sau khẳng định hai Quy trình 1.1 2.1 tương đương Hệ 2.1 Với hai phương án xi x j , ta có Γi ≤ Γ j ⇔ α˜ i ≤ α˜ j , với Γi (tương ứng, Γ j ) đánh giá cuối xi (tương ứng, x j ) Quy trình 1.1, α˜ i (tương ứng, α˜ j ) đánh giá cuối xi (tương ứng, x j ) theo Quy trình 2.1 (i, j = 1, , m) 2.3.1.2 Từ trực cảm số ngôn ngữ trực cảm Định nghĩa 2.12 Xét α, β ∈ Ω hai ILN α β gọi tương đương, ký hiệu α ∼ β, chúng có điểm độ chắn, tức là, h (α) = h ( β) H (α) = H ( β) Để tìm hiểu quan hệ tập ILN ILL, ta xét ánh xạ: ¯ [ α ] → sµ(α)θ (α) , sν(α)θ (α) ∇ : Ω/ ∼ → S, 15 (2.7) Định lý 2.2 Với phương án x, ký hiệu α α˜ đánh giá cuối x qua Quy trình 1.2 2.2, ta có α˜ = ∇ ([α]) Hệ 2.2 Với hai phương án xi x j , ta có αi ≤ α j ⇔ α˜ i ≤ α˜ j , với αi (tương ứng, α j ) đánh giá cuối xi (tương ứng, x j ) Quy trình 1.2, α˜ i (tương ứng, α˜ j ) đánh giá cuối xi (tương ứng, x j ) theo Quy trình 2.2 (i, j = 1, , m) 2.3.2 So sánh phương diện thực hành Các quy trình so sánh với quy trình sử dụng giá trị ngôn ngữ trực cảm số ngôn ngữ trực cảm Thực nghiệm ưu điểm nhãn ngôn ngữ trực cảm 16 Chương Một số độ tương tự ứng dụng vào tốn phân lớp thơng tin Chương đề xuất số độ đo tương tự ứng dụng vào toán phân lớp Các thuật toán thử nghiệm liệu Car Evaluation , Mushroom IRIS 3.1 3.1.1 Độ tương tự từ, độ tương tự véc-tơ từ ứng dụng Độ tương tự từ Xét tập từ có nhãn rời rạc S = s0 , s1 , , s g với quan hệ thứ tự quan hệ thứ tự số nhãn Định nghĩa 3.1 Ánh xạ sim : S × S → [0, 1] gọi độ tương tự từ thỏa mãn điều kiện sau: A1 Đối xứng: sim si , s j = sim s j , si , với si , s j ∈ S; A2 Phản xạ: sim si , s j = ⇔ si = s j , với si , s j ∈ S; A3 Đơn điệu: si ≤ s j ≤ sk sim si , s j ≥ sim (si , sk ) sim s j , sk ≥ sim (si , sk ), với si , s j , sk ∈ S M Bohanec’s Data, 1997 (http://archive.ics.uci.edu/ml/machine-learningdatabases/car/car.data) J Schlimmer’s Data, 1987 (http://archive.ics.uci.edu/ml/machine-learningdatabases/mushroom/agaricus-lepiota.data) R A Fisher’s Data, 1988 (http://archive.ics.uci.edu/ml/machine-learningdatabases/iris/iris.data) 17 Định nghĩa 3.2 Xét tập từ S = s0 , s1 , , s g Với si , s j ∈ S, ta định nghĩa: sim1 si , s j = g−|i − j| ; g sim2 si , s j = min(i,j) , max(i,j) sim3 si , s j = − với quy ước 1−exp − 1−exp(−1) 1−exp sim4 si , s j = − |i − j | g | − √ 0 = 1; ; √ i− j √ g | 1−exp(−1) Định lý 3.1 Các ánh xạ sim1 , sim2 , sim3 sim4 Định nghĩa 3.2 độ tương tự từ 3.1.2 Độ tương tự véc-tơ từ Định nghĩa 3.3 Một véc-tơ từ với độ dài n có dạng V = (v1 , , ), đó, vt thuộc tập từ St = s0t , , stgt (t = 1, , n) Ta ký hiệu S tập hợp tất véc-tơ cho từ có độ dài n Với U, V ∈ S, U = (u1 , , un ), V = (v1 , , ), U gọi nhỏ V, ký hiệu U ≤ V, ut ≤ vt , với t = 1, , n Định nghĩa 3.4 Ánh xạ SIM : S × S → [0, 1] gọi độ tương tự véc-tơ từ thỏa mãn điều kiện: B1 Đối xứng: SIM (U, V ) = SIM (V, U ), với U, V ∈ S; B2 Phản xạ: SIM (U, V ) = ⇔ U = V, với U, V ∈ S; B3 Đơn điệu: U ≤ V ≤ T SIM (U, V ) ≥ SIM (U, T ) SIM (V, T ) ≥ SIM (U, T ), với U, V, T ∈ S Định nghĩa 3.5 Với U = (u1 , , un ), V = (v1 , , ) ∈ S, sim độ tương tự từ w = (w1 , , wn ) véc-tơ trọng số Ta định nghĩa: 18 Độ tương tự toàn phương U V: n ∑ wt (sim (ut , vt ))2 SIMQ (U, V ) = ; (3.1) t =1 Độ tương tự số học U V: n SIM A (U, V ) = ∑ wt sim (ut , vt ); (3.2) t =1 Độ tương tự hình học U V (quy ước 00 = 1): n SIMG (U, V ) = ∏ (sim (ut , vt ))wt ; (3.3) t =1 Độ tương tự điều hòa U V (quy ước wt n SIM H (U, V ) = wt ∑ sim (ut , vt ) t =1 = 0): −1 (3.4) Định lý 3.2 Nếu wt > với t = 1, , n SIMQ , SIM A , SIMG , SIM H độ tương tự véc-tơ từ 3.1.3 Ứng dụng cho toán phân lớp với thông tin cho từ Xét liệu D mà mẫu có (n + 1) thuộc tính Mỗi thuộc tính At nhận giá trị tập từ tương ứng St = (t) (t) s , , s gt , t = 1, , (n + 1) Thuộc tính thứ (n + 1) đóng vai trị thuộc tính phân lớp, xác định dựa giá trị n thuộc tính trước Thuật tốn 3.1 (Thuật tốn LCA) Xét D ⊂ D tập huấn luyện, gồm m phần tử Với I ∗ ∈ D ∗ = D \ D , ký hiệu V ∗ = x1∗ , , xn∗ véc-tơ chứa giá trị n thuộc tính I ∗ Gọi y∗ giá trị thuộc tính thứ (n + 1) I ∗ Ta ước lượng y∗ sau 19 Với Ij ∈ D , giả sử Vj véc-tơ chứa giá trị n thuộc tính Ij Độ tương tự I ∗ Ij gán độ tương tự hai véc-tơ V ∗ Vj : SIM I ∗ , Ij = SIM V ∗ , Vj , j = 1, , m Trong đó, SIM độ tương tự véc-tơ cho từ, chọn từ Công thức 3.1-3.4 (Trang 19) Trong D xác định k mẫu gần với I ∗ nhất, giả sử mẫu Ij ∈ D (j = 1, , k, ≤ k ≤ m) theo độ tương tự chọn bước trước k số tự nhiên thay đổi, xác định nhờ thực nghiệm Gộp giá trị thuộc tính thứ (n + 1) mẫu Ij (j = 1, , k) tốn tử trung bình số học có trọng số cho từ mở rộng (Định nghĩa , Trang 20): y¯ = sα¯ = LWA2 (y1 , yk ) Trong đó, y j giá trị thuộc tính thứ (n + 1) Ij ω = (ω1 , , ωk ) véc-tơ trọng số, xác định ωj = SIM I ∗ , Ij k (3.5) , j = 1, , k ∑ SIM I ∗ , Ij j =1 ( n +1) Ước lượng giá trị thuộc tính thứ (n + 1) K: y∗ = sl , với l = round (α¯ ) 3.2 3.2.1 Độ tương tự giá trị mờ trực cảm, độ tương tự véc-tơ mờ trực cảm ứng dụng Độ tương tự giá trị mờ trực cảm Xét θ tập hợp tất giá trị mờ trực cảm 20 Định nghĩa 3.6 Ánh xạ sim : θ × θ → [0, 1] gọi mà độ tương tự giá trị mờ trực cảm điều kiện sau thỏa mãn: C1 Đối xứng: sim (u, v) = sim (v, u) với u, v ∈ θ; C2 Phản xạ: sim (u, v) = ⇔ u = v với u, v ∈ θ; C3 Đơn điệu: Nếu u ≤ v ≤ w sim (u, v) ≥ sim (u, w) sim (v, w) ≥ sim (u, w) với u, v, w ∈ θ Trong đó, u ≤ v nghĩa µu ≤ µv γu ≥ γv Định nghĩa 3.7 Với u, v ∈ θ, ta định nghĩa (|µu − µv | + |γu − γv |) ; (3.6) (µu , µv ) + (γu , γv ) ; max (µu , µv ) + max (γu , γv ) (3.7) sim1 (u, v) = − sim2 (u, v) = sim3 (u, v) = − sim4 (u, v) = − − exp − 21 (|µu − µv | + |γu − γv |) − exp − 12 Trong định nghĩa sim2 ta quy ước − exp (−1) √ √ √ √ µ u − µ v + γu − γv − exp (−1) 0 (3.8) ; (3.9) =1 Định lý 3.3 Các ánh xạ Định nghĩa 3.7 độ tương tự giá trị mờ trực cảm 3.2.2 Độ tương tự véc-tơ mờ trực cảm Xét Θ tập hợp tất véc-tơ mờ trực cảm có độ dài K Với U, V ∈ Θ, U = (u1 , , uK ), V = (v1 , , vK ), U ≤ V nghĩa u ≤ v với = 1, , K Định nghĩa 3.8 Ánh xạ SIM : Θ × Θ → [0, 1] gọi độ tương tự véc-tơ mờ trực cảm điều kiện sau thỏa mãn: 21 D1 Đối xứng: SIM (U, V ) = SIM (V, U ) với U, V ∈ Θ; D2 Phản xạ: SIM (U, V ) = ⇔ U = V với U, V ∈ Θ; D3 Đơn điệu: Nếu U ≤ V ≤ T SIM (U, V ) ≥ SIM (U, T ) SIM (V, T ) ≥ SIM (U, T ) với U, V, T ∈ Θ Định nghĩa 3.9 Với U, V ∈ Θ, sim độ tương tự giá trị mờ trực cảm w = (w1 , , wK ) véc-tơ trọng số, ta định nghĩa: Độ tương tự toàn phương U V: K ∑ w (sim (u , v ))2 SIMQ (U, V ) = ; (3.10) =1 Độ tương tự số học U V: K ∑ w sim (u , v ); SIM A (U, V ) = (3.11) =1 Độ tương tự hình học U V (với quy ước 00 = 1): K SIMG (U, V ) = ∏ (sim (u , v ))w ; (3.12) =1 Độ tương tự điều hòa U V(với quy ước K w ∑ sim (u , v ) =1 SIM H (U, V ) = Định lý 3.4 Nếu w > với w = 0): −1 (3.13) = 1, , K SIMQ , SIM A , SIMG SIM H độ tương tự véc-tơ mờ trực cảm 3.2.3 Ứng dụng cho toán phân lớp Thuật toán 3.2 (Thuật toán IFVSM) Thuật toán có bước tương tự LCA Tuy nhiên, độ tương tự thay sau: 22 • Thay độ tương tự từ độ tương tự véc-tơ mờ trực cảm; • Thay độ tương tự véc-tơ cho từ độ tương tự ma trận mờ trực cảm 3.3 Thực nghiệm Trong phần này, thuật toán LCA IFVSM áp dụng để phân lớp liệu Car Evaluation, Mushroom IRIS (hoa Diên Vĩ) (đã dẫn) Kết so sánh với thuật toán NFS (Soumadip Ghosh’s Neuro-fuzzy system, 2014) , RBFNN (Radial Basis Function Neural Network, 1996) ANFIS (Adaptive Neuro-fuzzy Inference System, 1997) Thực nghiệm thuật tốn LCA thích hợp để phân lớp liệu với thuộc tính rời rạc (kể có thứ tự chưa có thứ tự), đồng thời cho kết tương đối tốt với liệu liên tục IFVSM thực cải tiến LCA, cho kết tốt toán phân lớp liệu liên tục Ngoài việc sử dụng độ tương tự toán phân lớp, tác giả luận án quan tâm đến trường hợp đặc biệt phân lớp: chẩn đoán y khoa [CT 2-3] Do đặc thù toán, phân lớp bệnh nhân (chính quan hệ bệnh nhân bệnh) xác định thơng qua quan hệ bệnh nhân-triệu chứng quan hệ triệu chứng-bệnh Đây vấn đề tiếp tục nghiên cứu S Ghosh, S Biswas, D.Sarkar, P P Sarkar, A novel Neuro-fuzzy classification technique for data mining, Egyptian Informatics Journal 15, 129-147, 2014 K J Hunt , R Haas, R Murray-Smith, Extending the functional equivalence of radial basis function networks and fuzzy inference systems, IEEE Trans Neural Networks (3), 776-781, 1996 J SR Jang , CT Sun , E Mizutani, Neuro-fuzzy and soft computing: a computational approach to learning and machine intelligence, USA: Prentice Hall, 333-393, 1997 23 KẾT LUẬN Dưới kết luận án Nghiên cứu quy trình gộp thơng tin cho từ, có yếu tố trực cảm Trong phần này, tác giả luận án đề xuất khái niệm từ trực cảm (intuitionistic linguistic label, ILL) Các toán tử gộp ILL cung cấp sở lý thuyết cho toán định với thơng tin từ, có yếu tố trực cảm biểu diễn dạng ILL Khi so sánh ILL với biểu diễn thông tin cho từ, có yếu tố trực cảm giá trị ngơn ngữ trực cảm (intuitionistic fuzzy linguistic value, ILV) số ngôn ngữ trực cảm (intuitionistic linguistic number, ILN), ta thấy: • Thứ nhất, khái niệm ILL tương đương với ILV ILN Điều có nghĩa là, tốn định, thay ILV hay ILN, ta hồn tồn dùng ILL; • Thứ hai, toán định, sử dụng ILL cho kết hoàn toàn tương tự thời gian ngắn so với ILV hay ILN Đề xuất độ tương tự từ véc-tơ cho từ Các khái niệm sử dụng để xây dựng thuật tốn LCA (linguistic classification algorithm) giúp phân loại thơng tin cho từ LCA thực nghiệm liệu rời rạc có thứ tự liệu rời rạc chưa có thứ tự Đưa độ tương tự giá trị mờ trực cảm véc-tơ mờ trực cảm Thuật toán IFVSM (Intuitionistic Fuzzy Vector Similarity Measure Based Classification Algorithm) đề xuất ứng dụng tốn phân lớp với thơng tin liên tục 24 DANH MỤC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN CT B C Cuong, P H Phong, New composition of intuitionistic fuzzy relations, Advances in Intelligent Systems and Computing 244, 123-136, 2014 (Proceedings of the Fifth International Conference KSE 2013, Springer) CT B C Cuong, P H Phong, Max - composition of linguistic intuitionistic fuzzy relations and application in medical diagnosis, VNU Journal of Science: Computer Science and Communication Engineering 30 (4), 57-65, 2014 CT D T Tuan, P H Phong, R T Ngan, Linguistic Approach in Medical Diagnosis, Proceedings of the Eighth International Conference on Knowledge and Systems Engineering, 37-42, 2016 (IEEE) CT L H Son, P H Phong, On the performance evaluation of intuitionistic vector similarity measures for medical diagnosis, Journal of Intelligent and Fuzzy Systems 31 (3), 1597-1608, 2016 (SCIE) CT P H Phong, B C Cuong, Some intuitionistic linguistic aggregation operators, Journal of Computer Science and Cybernetics 30 (3), 216-226, 2014 CT P H Phong, B C Cuong, Symbolic computational models for intuitionistic linguistic information, Journal of Computer Science and Cybernetics 32 (1), 30-44, 2016 CT P H Phong, B C Cuong, L T T Thuy, Intuitionistic linguistic label: an equivalent form of intuitionistic linguistic number, Proceedings of the 3rd National Foundation for Science and Technology Development Conference on Information and Computer Science, 119-124, 2016 (IEEE) CT P H Phong, B C Cuong, Multi-criteria Group Decision Making with Picture Linguistic Numbers, VNU Journal of Science: Computer Science and Communication Engineering 32 (3), 38-51, 2016 CT P H Phong, L H Son, Linguistic vector similarity measures and applications to linguistic information classification, International Journal of Intelligent Systems 32 (1), 67-81, 2017 (SCIE) ... trọng số (α˜ , , α˜ n ) 13 2.2.6 Ứng dụng toán tử gộp cho từ trực cảm vào toán định Dựa vào toán tử gộp cho từ trực cảm (ILL), đề xuất hai quy trình giải tốn định với thơng tin cho từ có yếu... (2), 221-237, 2016 Chương Từ trực cảm gộp từ trực cảm Chương đề xuất khái niệm từ trực cảm (ILL), phép toán bản, toán tử gộp ứng dụng toán định với đầu vào thông tin cho từ có yếu tố trực cảm Nội... thơng tin, xếp hạng giáo dục, Mục đích luận án Đề xuất khái niệm từ trực cảm ứng dụng toán định với thơng tin cho từ có yếu tố trực cảm Đề xuất độ tương tự từ, độ tương tự véc-tơ từ ứng dụng vào

Ngày đăng: 20/05/2021, 12:46