Tóm tắt ngôn ngữ theo phương pháp tiếp cận của Yager

Một phần của tài liệu Truy vấn thống kê cơ sở dữ liệu một cách mềm dẻo dựa trên logic mờ (Trang 41 - 46)

Mặc dù trƣớc kia thuật ngữ ngôn ngữ đã đƣợc sử dụng trong quá trình truy vấn, nhƣng kể từ khi truy vấn ngôn ngữ đƣợc sử dụng trong các bản tóm tắt thì các thuật ngữ ngôn ngữ học đã trở thành các giá trị thuộc tính trong truy vấn tóm tắt, và các câu truy vấn cũng nhƣ câu trả lời chỉ chứa các điều khoản ngôn ngữ.

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

Các điều khoản ngôn ngữ đƣợc sử dụng để xây dựng hệ thống phân cấp tóm tắt, các thuật toán lợi dụng các cấu trúc phân cấp của tóm tắt. Khi thực hiện một truy vấn nó sẽ tiến hành kiểm tra các bản tóm tắt hàng đầu của hệ thống phân cấp để biết có hay không câu trả lời cho một truy vấn thay vì phải kiểm tra các thuộc tính trong toàn bộ mối quan hệ nhƣ những truy vấn khác.

Theo phƣơng pháp tiếp cận với tóm tắt ngôn ngữ CSDL của Yager [6], về mặt cơ bản thì:

- V là chất lƣợng (thuộc tính) đƣợc quan tâm.

Ví dụ: thuộc tính “tiền lƣơng” trong CSDL công nhân.

- Y = {Y1... Yn} là một tập các đối tƣợng mà V biểu hiện. Do đó V (yi) là những giá trị về chất lƣợng V cho đối tƣợng yi.

- D = { V (y),...., V (yn)} là một tập hợp các dữ liệu. Một bản tóm tắt ngôn ngữ của một tập dữ liệu bao gồm: + S: một tóm tắt.

+ Q: số lƣợng trong hợp đồng. + T: mức độ sự thật của bản tóm tắt Ví dụ: T (hầu hết các nhân viên trẻ) = 0.7

Giả sử, cho một tập dữ liệu D, với bất kỳ tóm tắt S và số lƣợng bất kỳ trong hợp đồng Q, các biện pháp giả định của sự thật sẽ cho biết sự thật của bản tuyên bố rằng Q mục dữ liệu đáp ứng các tóm tắt S.

Dƣới đây là một số nhận xét về hình thức của các yếu tố cơ bản của một bản tóm tắt, tức là các tóm tắt, số lƣợng trong hợp đồng, và làm thế nào để tính toán mức độ sự thật của bản tóm tắt.

a) Hình thức của tóm tắt

Từ ngôn ngữ tự nhiên của con ngƣời, giả định rằng S là một biểu hiện ngôn ngữ ngữ nghĩa địa diện bởi một tập mờ. Ví dụ tập mờ “trẻ” với một hàm thành

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

viên S = {1, 2,...,90}, xét trƣờng hợp hàm thành viên có tuổi từ 1 đến 35 năm là chắc chắn “trẻ”, vậy lớp các thành viên bằng 1; Hàm thành viên có độ tuổi từ 50 năm trở lên là chắc chắn “không còn trẻ”, tức là lớp của hàm thành viên bằng 0; Và độ tuổi từ 35 đến 50 năm thì lớp của thành viên là từ 1 đến 0. Điều này cho thấy trong thực tế tập mờ tƣơng ứng của nó là chủ quan, và có thể đƣợc xác định trƣớc hoặc đƣa ra theo gợi ý của ngƣời sử dụng.

b) Số lƣợng trong hợp đồng

Số lƣợng trong hợp đồng Q, là một dấu hiệu cho thấy đề xuất về mức độ dữ liệu đáp ứng các tóm tắt.

Về cơ bản có hai loại số lƣợng ngôn ngữ trong hợp đồng đƣợc sử dụng: - Số lƣợng tuyệt đối (ví dụ: nhiều hơn hoặc ít hơn 100, nhiều,...). - Số lƣợng tƣơng đối (ví dụ: một vài; nhiều hoặc ít hơn một nửa; hầu

nhƣ tất cả...).

Các biểu thức ngôn ngữ trên còn gọi là ngôn ngữ mờ lƣợng hóa, có thể xử lý bằng logic mờ.

Đối với các tóm tắt mờ nó có thể đƣợc xác định từ trƣớc hoặc đƣa ra từ gợi ý của ngƣời sử dụng.

c) Tính sự thật của một bản tóm tắt ngôn ngữ

Về cơ bản việc tính toán sự thật của một bản tóm tắt ngôn ngữ tƣơng đƣơng với việc tính toán giá trị thật của một tuyên bố ngôn ngữ định lƣợng (ví dụ “hầu hết các nhân viên đều còn trẻ”). Điều này có thể thực hiện bởi hai kỹ thuật: sử dụng các tính toán của các báo cáo ngôn ngữ định lƣợng, hoặc toán tử OWA cho một cuộc khảo sát.

Một đề xuất ngôn ngữ định lƣợng đƣợc minh chứng bằng “hầu hết các chyên gia đều bị thuyết phục” đƣợc viết là: “Qy’s là F”, trong đó:

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

+ Y = {y}: là một tập hợp các đối tƣợng (ví dụ: chuyên gia). + F: là thuộc tính (ví dụ: thuyết phục)

Giá trị B có thể đƣợc thêm vào để tăng hiệu quả “QBy’s là F”.

Ví dụ [6]: “hầu hết (Q) của giá trị (B) các chuyên gia (y’s) đều bị thuyết phục (F)”. Vấn đề là phải tìm ra sự thật “Qy’s là F”, hay sự thật “QBy’s là F”

tƣơng ứng sẽ biết đƣợc sự thật (y là F), y Y đƣợc thực hiện ở đây sử dụng logic mờ dựa trên tính toán của các ngôn ngữ mệnh đề định lƣợng. F và B là tập mờ trong Y, và ngôn ngữ định lƣợng Q đƣợc giả định là một tập mờ nằm trong khoảng [0, 1]. Ví dụ: (1) Theo Zadeh Sự thật (Qy’s là F) = (2) Sự thật (QBy’s là F)= Một toán tử OWA có kích thƣớc p là một ánh xạ F: [0, 1]p [0,1] nếu kết hợp với F là một vecto trọng số. W = [W1, .... Wp]T, Wi [0, 1], W1 + . . . . + Wp = 1, và F (x1; . . . ; xp) = w1b1 + .... + wpbp = WTB (4) Nơi mà bi là phần tử thứ i lớn nhất trong x1, . . . , xp; B = [b1, . . , bp].

Toán tử OWA có thể đƣợc tìm thấy từ các hàm thành viên của Q.

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

(5) Các toán tử OWA có thể tạo nên mô hình một dãy rộng của tập hợp các toán tử (bao gồm cả lƣợng hóa ngôn ngữ), từ w1 = …. = wp-1 và wp = 1 tƣơng ứng với “tất cả”, để w1 và w2 = 1 = …. = wp = 0 tƣơng ứng với “ít nhất một”, thông qua tất cả các tình huống trung gian.

Một vấn đề rất quan trọng có liên quan đến các toán tử OWA cho các dữ liệu quan trọng. Giả sử chúng ta có A = [a1,…., ap] và một vectơ của tầm quan trọng V = [v1, …, vp], nhƣ vậy vi [0, 1] là tầm quan trọng của ai, i = 1, …., p, v1 + …..+ vp = 1. Theo phƣơng pháp tiếp của Yager’s (4) trở thành:

Với uk là tầm quan trọng của bk, tức k là yếu tố lớn nhất của A.

Các toán tử OWA cung cấp một mảng rộng các phƣơng tiện để tập hợp dựa trên lƣợng hóa khác nhau, ở cả hai phƣơng diện sắc nét và mờ, mặc dù nó có thể đƣa ra những công thức tính toán phức tạp hơn tƣơng ứng trong những trƣờng hợp tóm tắt CSDL lớn. Trong quá trình thực hiện, ngƣời sử dụng có thể lựa chọn giữa cách tính toán dựa trên toán tử OWA hoặc tính toán cổ điển theo Zadeh.

Một trong số các phƣơng pháp tiếp cận tóm tắt ngôn ngữ của CSDL đã từng đƣợc giới thiệu bởi Yager, Kacpzyk, và Zadro là bằng cách liên hệ nhiều loại hình tóm tắt ngôn ngữ truy vấn mờ chúng ta có thể đi đến một hệ thống các hình thức nguyên mẫu (Protoforms). Nhiều nhận xét gần đây cho thấy Protoforms rất quan trong trong việc chính thức hóa các lý luận của con ngƣời và tăng khả năng khấu trừ cho các công cụ tìm kiếm.

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

Một phần của tài liệu Truy vấn thống kê cơ sở dữ liệu một cách mềm dẻo dựa trên logic mờ (Trang 41 - 46)

Tải bản đầy đủ (PDF)

(75 trang)