Cơ sở dữ liệu quan hệ

Một phần của tài liệu Truy vấn thống kê cơ sở dữ liệu một cách mềm dẻo dựa trên logic mờ (Trang 31 - 33)

Trong trƣờng hợp CSDL quan hệ cổ điển, ta có một tập các quan hệ mà mỗi quan hệ là một tập các r-bộ ti = (di1, di2, …, dir).

Cách đƣa lý thuyết mờ vào CSDL đơn giả nhất là sử dụng độ thuộc trong trƣờng hợp di1, di2, …, dir là các tập một phần tử của các miền tƣơng ứng D1, D2,…, Dr. Một trong số những thuộc tính của quan hệ phải là độ thuộc. Thí dụ với bộ ti = (di1, di2, di3,), trong đó D1 là tập hợp các tên khách sạn, D2 là tập hợp các vùng địa lý mà khách sạn gắn với, di3 là một hệ số nằm trong đoạn [0,1] chỉ mức độ di1 thuộc vào di2.

Một cách khác xem rằng những thành phần di1, di2,…., dỉ là những phân phối khả năng trên các miền D1, D2,…, Dr.

Một trong các cách tích hợp mờ vào CSDL đƣợc nghiên cứu rộng rãi xem mỗi thành phần dik là một tập con khác rỗng của Dk, chứ không phải là một phần tử của Dk (l≤k≤r), Dk có thể là tập hữu hạn hoặc vô hạn. Cấu trúc này dẫn đến việc định nghĩa một quan hệ tƣơng tự Sk trên mỗi tập xác định hữu hạn nhƣ là một tập mờ trên tập giá Dk x Dk. Ngƣỡng tƣơng tự trên miền Dk đƣợc định nghĩa bởi: s (Dk) = miniminx dik, y djk Sk (x.y) và dùng để kết hợp các r-bộ, chẳng hạn nhƣ trong phép chiếu để chỉ giữ lại một số thuộc tính. Một thể hiện của bộ ti là

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

một r-bộ (a1, a2,…, ar) trong đó ak là một phần tử của dIk ( k, l≤k≤r). Qua đó cho phép đƣa ra một khái niệm tổng quát về sự dƣ thừa: một quan hệ đƣợc gọi là dƣ thừa nếu tồn tại 2 r-bộ có cùng một thể hiện.

Cũng có thể coi rằng mỗi thành phần di1, di2,…., dir của ti là một tập con mờ của D1, D2,…, Dr. Chẳng hạn, nếu ti = (di1, di2), với D1 là tập các khách sạn, và D2 là tập các vùng địa lý, di2 có thể là một tập mờ dạng {0.8/bãi biển, 0.2/trung tâm thành phố}.

Ngƣời ta cũng có thể xét trƣờng hợp CSDL thông thƣờng, không có dữ liệu mờ nhƣng câu truy vấn thì mềm dẻo, có thể không chính xác. Một câu truy vấn đƣợc thể hiện dƣới dạng kết hợp của những thuộc tính có thể biểu diễn mờ. Mức độ mỗi bộ thỏa mãn câu truy vấn đƣợc xác định và ngƣời ta chỉ chọn những bộ có độ thỏa mãn lớn hơn một ngƣỡng 1 cho trƣớc nào đó. Nhƣ vậy có thể sắp xếp các bộ đƣợc chọn theo độ thỏa mãn đã tính đƣợc. Một mở rộng của ngôn ngữ SQL cho phép xử lý các câu truy vấn nhƣ vậy.

Những từ nhấn (còn gọi là gia tử ngôn ngữ) có thể đƣợc sử dụng để thay đổi những mô tả trong truy vấn, thí dụ ngƣời ta tìm những khách sạn “tƣơng đối rẻ và ở xung quanh trung tâm thành phố”. Những lƣợng từ mờ cũng đƣợc dùng trong truy vấn chẳng hạn nhƣ “những khách sạn mà phần lớn các phòng có phòng tắm”.

Xây dựng một hệ thống có tính tƣơng tác dự trên biểu diễn mờ của các giá trị thuộc tính cho phép gợi ý ngƣời sử dụng chỉnh sửa câu hỏi trong trƣờng hợp câu hỏi ban đầu của họ không có kết quả. [5].

Chƣơng này hệ thống lại kiến thức căn bản về CSDL, mô hình CSDL quan hệ và một số phƣơng pháp truy vấn CSDL trên mô hình quan hệ thƣờng đƣợc dùng trong các quá trình truy vấn dữ liệu thông thƣờng. Tuy nhiên vấn đề đặt ra là, những phƣơng pháp truy vấn truyền thống đó không thích hợp trong việc xử lý những thông tin mơ hồ, không rõ ràng… Đã có rất nhiều công trình nghiên cứu đề xuất các phƣơng pháp tiếp cận ứng dụng lý thuyết tập mờ vào các truy

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

vấn CSDL mờ để giải quyết những bài toán dạng mờ nêu trên. Và phƣơng pháp truy vấn thống kê mềm dẻo đƣợc trình bày ở chƣơng 2 là một trong số những phƣơng pháp giúp cho quá trình truy vấn CSDL mờ trở nên mềm dẻo, linh hoạt và mang tính tự nhiên hơn.

CHƢƠNG 2 MỘT PHƢƠNG PHÁP TRUY VẤN THỐNG KÊ MỀM DẺO

Ngôn ngữ truy vấn trong CSDL mờ đã có nhiều ngƣời quan tâm nghiên cứu và thu đƣợc những kết quả khác nhau. Các cách xử lý truy vấn dựa trên cơ sở lý thuyết tập mờ, hầu hết các phƣơng pháp tiếp cận đã đƣợc đề xuất đều mong muốn xây dựng một ngôn ngữ truy vấn có thao tác linh hoạt, mềm dẻo với dữ liệu mờ bằng cách tập trung xây dựng các hàm thuộc, từ đó tùy theo ngữ nghĩa của dữ liệu để chọn các ngƣỡng phù hợp khi thao tác dữ liệu.

Trong chƣơng này trình bày một trong những phƣơng pháp truy vấn mềm dẻo dựa trên logic mờ và các câu hỏi dữ liệu mờ theo hai cách tiếp cận sau: Cách tiếp cận mà truy vấn đƣợc thực hiện nhƣ một bản tóm tắt cơ sở dữ liệu ngôn ngữ, và chỉ ra rằng các câu hỏi mờ liên quan đến tổng hợp ngôn ngữ nhƣ thế nào [6]. Và cách tiếp cận thứ hai đề xuất một cơ chế truy vấn cho ngƣời dùng có thể khai thác hiệu quả các cấu trúc thứ bậc của một bản tóm tắt [7]

Một phần của tài liệu Truy vấn thống kê cơ sở dữ liệu một cách mềm dẻo dựa trên logic mờ (Trang 31 - 33)