Protoforms – Một phƣơng pháp xây dựng thống kê mềm dẻo

Một phần của tài liệu Truy vấn thống kê cơ sở dữ liệu một cách mềm dẻo dựa trên logic mờ (Trang 46 - 49)

Theo Zadeh, Protoforms là một hƣớng tiếp cận lấy nguyên mẫu làm trung tâm để tăng khả năng khấu trừ cho công cụ truy vấn [9].

Các công cụ truy vấn đƣợc mở rộng và phát triển để cho phép truy vấn mờ các yếu tố: “đơn giản” (ví dụ: lƣơng cao); “hợp chất” (ví dụ: lƣơng cao và tuổi trẻ); “hợp chất với lƣợng hóa” (ví dụ: hầu hết {lƣơng cao, tuổi còn trẻ, trình độ cao hơn trung bình}), việc này diễn ra thông qua giao diện của một truy vấn mờ với ngƣời dùng. Nhƣng vấn đề đƣợc đặt ra là: làm thế nào để mở rộng cú pháp và ngữ nghĩa của truy vấn, và làm thế nào để có thể cung cấp một cách dễ dàng các thao tác, các điều khoản cho ngƣời sử dụng.

Ngôn ngữ FQUERY đƣợc đề xuất để giải quyết những vấn đề nêu trên. FQUERY cho phép truy cập đƣợc nhúng trong môi trƣờng Access bản địa nhƣ một cách thêm vào. Tất cả các mã và dữ liệu đƣợc đƣa vào một tập tin CSDL, một thƣ viện, đƣợc cài đặt bở ngƣời sử dụng. Các định nghĩa, các thuộc tính, các giá trị mờ.... đƣợc duy trì trong một từ điển (một tập hợp các bảng thông thƣờng), và một cơ chế để đƣa vào các truy vấn đƣợc cung cấp bởi QBE, Sheet. Ngôn ngữ học đƣợc biểu diễn trong một truy vấn nhƣ các thông số, việc chuyển đổi truy vấn đƣợc thực hiện để giải thích tính thích hợp của nó trong quá trình thực hiện truy vấn.

Rõ ràng các truy vấn mờ trực tiếp tƣơng ứng với các tóm tắt. Nhƣ vậy, nguồn gốc của một bản tóm tắt ngôn ngữ có thể đƣợc tiến hành theo một trong các cách nhƣ sau:

- Ngƣời dùng trình bày một tập hợp các bản tóm tắt ngôn ngữ bằng cách sử dụng các truy vấn mờ.

- Hệ thống lấy hồ sơ từ CSDL và tính toán giá trị của mỗi tóm tắt. - Lựa chọn bản tóm tắt ngôn ngữ thích hợp nhất.

Việc sử dụng các truy vấn mờ là rất phù hợp, bởi vì chúng ta có thể xác định lại các tóm tắt trong từng truy vấn mờ.

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

Việc sử dụng Protoform là rất phù hợp cho các truy vấn dạng nhƣ: - Hầu hết R’s là S

- Hầu hết BR’s là S

Trong đó: + R có nghĩa là “hồ sơ”. + B là bộ lọc.

+ S là một truy vấn.

Protoforms đƣợc dùng có thể tạo thành một hệ thống phân cấp. Ví dụ trong trƣờng hợp thay thế “hầu hết” bằng một ngôn ngữ lƣợng hóa Q, chúng ta có:

- QR’s là S - QBR’s là S

Về cơ bản các hình thức sẽ trừu tƣợng hơn khi tƣơng ứng với từng trƣờng hợp giả định, ở đây chúng ta có hai trƣờng hợp giả định: (1) giả định protoforms hoàn toàn trừu tƣợng, hoặc (2) giả định tất cả các yếu tố của một protoforms đƣợc cho ở mức thấp nhất của sự trừu tƣợng nhƣ các điều khoản ngôn ngữ cụ thể. Trong trƣờng hợp (1) dữ liệu tóm tắt sẽ vô cùng tốn thời gian, trƣờng hợp (2) ngƣời dùng phải lựa chọn một gợi ý tốt để máy tổng hợp, nhƣng những đánh giá đƣợc đƣa ra bởi ngƣời sử dụng là khá đơn giản, tƣơng đƣơng với các câu trả lời của một truy vấn mờ. Trƣờng hợp thứ hai đề cập đến summari-zation đƣợc gọi là các truy vấn đặc biệt. Điều này đƣợc minh họa trong bảng 1, trình bày năm loại tóm tắt cơ bản, mỗi loại tƣơng ứng với thân protoform của một hình thức trừu tƣợng.

Trong bảng 1, Sstructure biểu diễn các thuộc tính và các mối liên hệ của nó trong bản tóm tắt, Svalue biểu diễn một bản tóm tắt tìm kiếm.

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

Type Given Sought Remarks

1 S Q Tóm tắt đơn giản thông qua các truy vấn toán học 2 SB Q Tóm tắt điều kiện thông qua các truy vấn toán học 3 Q Sstructure Svalue Tóm tắt giá trị đơn giản theo định hƣớng

4 Q Sstructure B Svalue Tóm tắt giá trị có điều kiện định hƣớng 5 Nothing SBQ Luật mờ chung

Trong đó, bản tóm tắt loại 1 có thể dễ dàng đƣa ra bởi một phần mở rộng của truy vấn mờ nhƣ trong FQUERY. Một bản tóm tắt loại 2 là một phần mở rộng đơn giản của loại 1 bằng cách thêm một bộ lọc mờ. Tóm tắt loại 3 đòi hỏi nhiều nỗ lực hơn nữa. Mục tiêu chính của nó là xác định các giá trị đặc trƣng của một thuộc tính. Loại 4 có thể đƣa ra giá trị điển hình cho một số, một tập hợp con của các hàng. Bản tóm tắt loại 5 đại diện cho các hình thức tổng quát nhất, cụ thể là: luật mờ mô tả sự phụ thuộc giữa các giá trị cụ thể với các thuộc tính cụ thể. Tóm tắt loại 1 và loại 3 đã đƣợc thực hiện nhƣ một phần mở rộng FQUERY cho Access. Tóm tắt loại 5 đề xuất hai phƣơng pháp tiếp cận: Thứ nhất, một tập hợp con các tóm tắt sản xuất có thể khai thác đƣợc các điểm tƣơng đồng của luật kết hợp và cách sử dụng có hiệu quả các thuật toán của nó. Thứ hai các thuật toán di truyền có thể đƣợc sử dụng để tìm kiếm các khoảng trống trong bản tóm tắt.

Trong các tuyên bố trƣớc đây Zadeh đã xác nhận khái niệm về Protoform, nhƣ là một công cụ truy vấn mạnh mẽ, vì chúng ta có thể xây dựng nhiều loại khác nhau của bản tóm tắt ngôn ngữ một cách thống nhât, và đƣa ra một cách phổ quát và thống nhất để xử lý tóm tắt ngôn ngữ.

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

Một phần của tài liệu Truy vấn thống kê cơ sở dữ liệu một cách mềm dẻo dựa trên logic mờ (Trang 46 - 49)