2. Cấu trúc luận văn
2.3. Phân đoạn dọc
2.3.1. Giới thiệu
Theo [1, 2, 5], phân đoạn dọc một quan hệ tổng thể là việc chia các thuộc tính của nó thành các nhóm. Điều này là hữu ích trong các CSDL phân tán, khi mà mỗi nhóm các thuộc tính có thể chứa dữ liệu có chung những thuộc tính địa lý.
Việc phân đoạn là đúng đắn nếu như mỗi thuộc tính của quan hệ tổng thể được ánh xạ thành thuộc tính của ít nhất một đoạn con, và phải đảm bảo điều kiện là quan hệ tổng thể được xây dựng lại từ các phân đoạn mà nó chia ra bằng các phép kết nối.
Phân rã theo chiều dọc quan hệ tổng thể R thành các quan hệ Ri: Ri = chiếu của quan hệ R trên các thuộc tính Ai, …, Aj. Quan hệ ban đầu được khôi phục nhờ các phép kết nối tự nhiên.
Bài toán được phát biểu trong mô hình dữ liệu quan hê ̣. Giả sử có cơ sở dữ liệu {R1, …, Rn}. Việc phân đoạn dọc được tiến hành trên mọi quan hệ Ri.
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn
Sau phân đoạn dọc, cơ sở dữ liệu mới sẽ gồm nhiều bảng dữ liệu nhỏ, ứng với các Ri.
Bài toán phân đoạn dọc được phát biểu trong bài năm 1984 [10].
Tuy nhiên việc phân đoạn đối với Ri là như nhau với mọi i, nên có thể xét bài toán rút gọn, tức phân đoạn dọc với quan hê ̣ R.
Theo [10], giả sử có quan hệ R(A1, …, An), phân đoạn dọc yêu cầu tách R thành các Rj, chẳng hạn R(A1, …, A8) được tách ra R1 (A1, …, A4), Rp (A5, …, A8), tức tách theo các thuộc tính của bảng quan hệ. Điều kiện của việc tách phải là (i) khôi phục được bảng R ban đầu, mà không mất thông tin; (ii) đáp ứng nhu cầu truy cập R của các quá trình trong hệ thống cơ sở dữ liệu, tức đáp ứng các nhu cầu truy cập của các giao tác Tp đến các thuộc tính, hay cột, Ai.
Hình 2.3. Minh họa tách bảng
Khi có thuộc tính khóa trong bảng, thuộc tính này cần nằm trong các quan hệ nhỏ, để bảo đảm khôi phục bảng quan hê ̣ ban đầu, mà không mất thông tin, nhờ phép nối của đại số quan hệ.