Cơ sở dữ liệu mờ

Các hệ CSDL kinh điển, phổ biến nhất là các hệ CSDL quan hệ, hầu nhƣ không có khả năng biểu diễn và xử lý có hiệu quả các thông tin không chính xác và không chắc chắn. Chẳng hạn với câu hỏi “Hãy cho biết họ tên các nhân viên

trẻ tuổi và có lương khá cao” một hệ quản trị CSDL kinh điển dƣờng nhƣ không

có cách gì để cho một câu trả lời thỏa đáng.

Mặt khác, chúng ta luôn phải đối mặt với một thực tế là sự hiểu biết của con ngƣời về thế giới thực thƣờng là không hoàn hảo và do đó việc duy trì tính toàn vẹn của CSDL luôn là một thách thức. Trong tình huống đó, để duy trì tính toàn vẹn của CSDL, có hai giải pháp:

- Giải pháp 1: Hoặc là ta giới hạn mô hình ở phần thế giới thực tại đó có đƣợc thông tin hoàn hảo. Điều đó có nghĩa, trong mô hình dữ liệu quan hệ chẳng hạn, các bộ ứng dụng với các nhân viên không có đủ thông tin sẽ hoàn toàn bị loại.

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

- Giải pháp 2: Hoặc là phát triển các mô hình dữ liệu cho phép biểu diễn, thao tác và xử lý các thông tin không hoàn hảo, đầy đủ.

Giải sử thông tin có đƣợc về tuổi của một nhân viên là không chính xác, chỉ biết là trong khoảng từ 30 đến 40. Nếu mô hình dữ liệu có khả năng đặc tả và thao tác trên các khoảng thì loại thông tin không hoàn hảo đó có thể nắm bắt trong một CSDL có duy trì tính toàn vẹn của nó.

Giải pháp thứ hai cho phép mở rộng các ứng dụng CSDL, phần lớn các hệ CSDL đều gắn kết với các mô hình CSDL có ít nhất một số đặc điểm nắm bắt thông tin không hoàn hảo, trong đó đặc điểm chung nhất là khả năng lƣu trữ “các giá trị null”.

Những nghiên cứu đầu tiên về CSDL mờ đã đƣợc bắt đầu từ những năm 70 của thế kỷ trƣớc, xung quanh cơ sở dữ liệu quan hệ và tìm kiếm văn bản. Muộn hơn, những nghiên cứu liên quan đến xử lý dữ liệu không chính xác, không chắc chắn trong CSDL hƣớng đối tƣợng và CSDL suy diễn cũng đã đƣợc tiến hành. Thế nhƣng hầu nhƣ không có các triển khai công nghiệp trong lĩnh vực quan trọng này.

Có rất 5 cách tiếp cận cho vấn đề biểu diễn dữ liệu mờ, dƣới đây là 2 trong số 5 cách tiếp cận đấy [5].

- Tiếp cận dựa trên quan hệ mờ xem xét tình huống trong đó một bộ có thể thuộc một quan hệ với một độ thuộc lấy giá trị trong [0, 1] (Kerre, Chen 95]

Cụ thể một quan hệ mờ R D1 x D2 x … x Dn đƣợc đặc trung bởi hàm thuộc µr: D1 x D2 x … x Dn  [0, 1] còn một bộ của r có dạng (a1, a2, …, an, µr(a1, a2, …, an)), trong đó ai Di; i= 1, 2, …, n.

- Tiếp cận dựa trên sự tƣơng tự [Buckles, Petry 82a] giải quyết với sự không chính xác trong giá trị thuộc tính cũng nhƣ giữa các phần tử của miền trị. Sự khác nhau giữa một quan hệ thông thƣờng với một quan hệ r trong mô hình này là:

Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/

r 2D1 x 2D2 x … x 2Dn , trong đó 2D1 là tập lũy thừa của D1. Nhƣ vậy một bộ t r có dạng:

t = (d1, d2¸…, dn) trong đó d1 D1 và d1 ≠ . Ngoài ra, trên mỗi Di có xác định một quan hệ tƣơng tự si

si : Di x Di  [0, 1]

Có tính phản xạ (si (x, x) = 1), đối xứng (si(x, y) = si(y, x)) và max – min bắc cầu

si(x, z) = maxy Di min( si(x, y), (si(y, z)) [T1 - bắc cầu] hoặc max – bắc cầu: si(x, z) = maxy Di ( si(x, y)* si(y, z)) [T2 - bắc cầu]

Cơ sở dữ liệu quan hệ

Khái niệm truy vấn mềm dẻo