0
Tải bản đầy đủ (.pdf) (70 trang)

Cơ sở dữ liệu quan hệ

Một phần của tài liệu TÓM TẮT DỮ LIỆU QUAN HỆ SỬ DỤNG PHƯƠNG PHÁP PHÂN CỤM BÁN GIÁM SÁT DỰA TRÊN GIẢI THUẬT DI TRUYỀN (Trang 41 -42 )

Dữ liệu được lưu trữ trong một cơ sở dữ liệu quan hệ bao gồm nhiều bảng. Một cơ sở dữ liệu quan hệ là một cơ sở dữ liệu bao gồm một tập hợp các bảng T1, ..., Tn và một tập các mối quan hệ R1, ..., Rm. Mỗi bảng Ti bao gồm các cột và các hàng, các cột đại diện cho một các thuộc tính, attr (T) = A1, ..., Ak, và các hàng đại diện cho các bản ghi trong bảng. Do đó, Ti.Aj biểu thị thuộc tính thứ j, Aj ∈ attr (Ti). Mỗi thuộc tính có tên miền riêng.

Định nghĩa 3.1: Miền của thuộc tính Ti.Aj ký hiệu là D (Ti.Aj) được là các thiết lập của tất cả các giá trị khác nhau được gán cho thuộc tính Aj trong bảng Ti.

Định nghĩa 3.2: Khóa chính của bảng Ti, ký hiệu là Ti.ID, có giá trị duy nhất cho mỗi hàng trong bảng.

Định nghĩa 3.3: Khóa ngoại của bảng Tj tham chiếu tới bảng Ti , ký hiệu là Tj.TiID, nhận giá trị từ D (Ti.Aj).

Các quan hệ R1, ..., Rm mô tả mối liên hệ giữa các bảng trong cơ sở dữ liệu quan hệ. Mỗi bảng Ti có thể có một trong ba kiểu liên kết với bảng Tj. Đó là các quan hệ: 1:1, 1:n và m:n

Hình 3.3: Một tập dữ liệu trong cơ sở dữ liệu quan hệ với hai mối quan hệ 1:n

Bảng đích Bảng tham

chiếu Bảng đích

Các nhóm mẫu

Định nghĩa 3.4: Bảng đích T là một bảng bao gồm một tập các bộ dữ liệu mà mỗi bộ đại diện cho một đối tượng đơn duy nhất.

Định nghĩa 3.5: Bảng tham chiếu NT là một bảng trong đó một số bộ dữ liệu liên kết với một đối tượng duy nhất trong bảng đích.

Trong hình 3.3, bảng T1 là bảng đích còn bảng T2 và T3 là bảng tham chiếu. Các bản ghi được lưu trong các bảng tham chiếu tương ứng với một bản ghi riêng được lưu trữ trong bảng đích có thể được biểu diễn như là vectơ của các mẫu. Kết quả là, dựa trên mô hình không gian vector [17], một bản ghi duy nhất được lưu trữ trong bảng tham chiếu có thể được biểu diễn như một vector của các mẫu.

Nói cách khác, một bản ghi riêng biệt được lưu trong bảng đích được liên kết với một số bản ghi được lưu trữ trong bảng tham chiếu có thể được biểu diễn như một nhóm các mẫu, tức là các mẫu và tần suất của chúng. Các nhóm mẫu được định nghĩa như sau.

Định nghĩa 3.6: Trong một nhóm các mẫu đại diện, mỗi bản ghi đích được lưu trong bảng tham chiếu NT được đại diện bởi tập các mẫu và tần số các mẫu.

Định nghĩa 3.7: Tóm dữ liệu được lưu trong nhiều bảng có quan hệ một-nhiều được định nghĩa như sau:

Một bảng đích T

Các bản ghi trong bảng đích là RT

Mộtbảng tham chiếu NT

Các bản ghi trong bảng tham chiếu là RNT

Trong đó, một hoặc nhiều bản ghi RNT được liên kết với một bản ghi đích RT, quá trình tóm tắt dữ liệu cho tất cả các bản ghi RNT trong bảng NT được định nghĩa như là một quá trình nối thêm dữ liệu vào bảng T ít nhất một trường giá trị cho RNT được liên kết với mỗi RT trong bảng T. Khi đó, dữ liệu được tóm tắt từ các bảng là cơ sở cho việc phân cụm các bản ghi đích.

Một phần của tài liệu TÓM TẮT DỮ LIỆU QUAN HỆ SỬ DỤNG PHƯƠNG PHÁP PHÂN CỤM BÁN GIÁM SÁT DỰA TRÊN GIẢI THUẬT DI TRUYỀN (Trang 41 -42 )

×