Một số ngôn ngữ truy vấn CSDL mềm dẻo [7]

Một phần của tài liệu Truy vấn thống kê cơ sở dữ liệu một cách mềm dẻo dựa trên logic mờ (Trang 34 - 37)

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

SQLf là ngôn ngữ truy vấn đƣợc đề xuất bởi Bosc và Pivert (1994) [11], là một phần mở rộng của SQL nhằm “đƣa các vị ngữ mờ vào SQL bất cứ nơi nào có thể”. Việc mở rộng cả về cú pháp và ngữ nghĩa của SQL đƣợc thực hiện, vì vậy mà hầu hết các yếu tố của một truy vấn có thể đƣợc thực hiện trong lĩnh vực mờ. Những yếu tố này bao gồm: các toán tử, các hàm tập hợp, các từ bổ nghĩa (nhƣ: thực sự, nhiều hơn, ít hơn, rất...), lƣợng từ (nhƣ: hầu hết, một tá...) cũng nhƣ các điều khoản đƣợc mô tả chung (nhƣ: trẻ, đƣợc trả lƣơng cao..).

Ví dụ: “Chọn 10 phòng ban từ nhóm NHÂN VIÊN bởi phòng ban hầu hết nhân viên (tuổi = trẻ) đều đƣợc trả lƣơng cao”. Những từ đƣợc in đậm là những từ khóa tiêu chuẩn trong SQL, nhân viên và tuổi tác là các thuộc tính từ một mối quan hệ có tên là EMPLOYEE. Các truy vấn chọn 10 phòng ban có sự hài lòng tốt nhất với điều kiện “hầu hết các nhân viên trẻ và đƣợc trả lƣơng cao”.

b) FQUERY

FQUERY là sự tích hợp truy vấn mềm dẻo vào một hệ thống quản lý CSDL hiện có, cụ thể là Microsoft Access. Hệ thống cho phép truy vấn với các vị từ mơ hồ, không rõ ràng đƣợc thể hiện thông qua tập mờ. Truy vấn có thể chứa phép lƣợng hóa ngôn ngữ và kèm theo mức độ quan trong khác nhau đối với các thuộc tính.

FQUERY sử dụng tập mờ trong các phƣơng diện thiếu chính xác và thực hiện việc mở rộng cú pháp và ngữ nghĩa của SQL. Giá trị ngôn ngữ và phép lƣợng hóa đƣợc biểu diễn nhƣ là tập mờ. Về mặt ngữ nghĩa, các truy vấn đƣợc xem nhƣ là một tập mờ, kết quả của tập mờ là sự kết hợp giữa giá trị ngôn ngữ và phép lƣợng hóa. Mỗi bản ghi đƣợc lựa chọn bởi một truy vấn SQL cổ điển, và nó đƣa ra bản ghi tƣơng ứng với các truy vấn, với một mức độ hài lòng đƣợc sử dụng trong một bƣớc xếp hạng.

c) SummarySQL

Đƣợc phát triển bởi Rasmussen và Yager (1997) [12], SummarySQL là một ngôn ngữ truy vấn mờ, có xu hƣớng tích hợp tóm tắt vào một truy vấn mờ.

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

Ngôn ngữ này có thể đánh giá mức độ sự thật của một bản tóm tắt từ dự đoán của ngƣời dùng. Nó cũng có thể sử dụng bản tóm tắt nhƣ một vị ngữ mờ trong truy vấn mờ.

Một bản tóm tắt CSDL thể hiện kiến thức trong một tuyên bố dƣới dạng “đối tƣợng Q trong DB là S” hoặc “đối tƣợng QR trong DB là S”. Trong đó:

- DB là viết tắt của CSDL. - Q là một ngôn ngữ lƣợng hóa. - R và S là bản tóm tắt.

Ví dụ có thể nói: “Hầu hết mọi ngƣời trong DB là cao”, hoặc “Hầu hết mọi ngƣời cao lớn trong DB là nặng”.

Vị ngữ (tức là tóm tắt) và các điều kiện về ngôn ngữ là tập mờ trong biểu thức đại diện cho điều kiện lựa chọn. Biểu thức đƣợc đánh giá cho mỗi bộ và các giá trị liên quan đƣợc sử dụng sau này để có đƣợc một giá trị chân lý cho bản tóm tắt.

SummarySQL đƣợc dùng để xác định xem, hoặc đến mức độ nào một tuyên bố là đúng. Nó cũng có thể đƣợc sử dụng để tìm kiếm các luật mờ.

d) FSQL

Ngôn ngữ FQSL là một phần mở rộng của SQL, trong đó tất cả các biểu thức SQL là hợp lệ. SQL đƣợc mở rộng nhằm hỗ trợ câu lệnh truy vấn mềm dẻo với các toán tử mờ, hằng số mờ, đại lƣợng mờ, các kiểu dữ liệu mờ và nhiều cấu trúc mờ khác. Để thực hiện, Medina et al đã xây dựng cơ sở siêu tri thức mờ, FMB là tập hợp các bảng. FMB chứa tất cả các thông tin cần thiết để quản lý các thuộc tính mờ. Việc xây dựng FMB yêu cầu cần phải hiểu đƣợc cách thức tổ chức bên trong nó và các nhãn ngữ nghĩa của mỗi thuộc tính mờ theo cách biểu diễn hình thang. Số lƣợng các nhãn ngữ nghĩa phụ thuộc vào từng thuộc tính mờ.

Ví dụ: Hãy cho tìm cho tôi những ngƣời có mái tóc dài (tối thiểu ở mức 0.5), và họ có thể cao hơn nhãn $Cao (ở mức tối thiểu là 0.8).

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

SELECT * FROM Nguoi

WHERE Tocdai FEQ $Dai THOLD 0.5 AND Chieucao FGT $Cao THOLD 0.8

Trong đó: THOLD là điều kiện. Hai hằng số Tocdai và Chieucao đƣợc thay thế bằng nhãn $Dai và $Cao.

FSQL đƣợc ghi nhận ở hai khía cạnh. Thứ nhất, sự đa dạng của các cấu trúc mềm dẻo sẵn có, thứ hai, nó là một trong số rất ít, phần mở rộng mờ của SQL đƣợc thực hiện trên một hệ thống quản lý CSDL hiện có.

Việc sử dụng lý thuyết tập mờ trong truy vấn mềm dẻo đã cung cấp một khuôn khổ chính thức để xử lý những bài toán, những thông tin mơ hồ của ngôn ngữ tự nhiên. Tuy nhiên để việc tìm kiếm dữ liệu mềm dẻo và linh hoạt hơn, ngƣời ta đã mở rộng truy vấn bằng cách đƣa vào nó một lƣợng ngôn ngữ tự nhiên nhƣ: “hầu hết”, “khoảng”, “một vài”…. Những từ nhƣ thế còn gọi là

lƣợng từ.

Một phần của tài liệu Truy vấn thống kê cơ sở dữ liệu một cách mềm dẻo dựa trên logic mờ (Trang 34 - 37)