BTVN
I. CÁC PHÉP TOÁN CỦA ĐẠI SỐ QUAN HỆ.
1. Phép chọn (SELECT)
Phép chọn được sử dụng để chọn một tập hợp các bộ thoả mãn điều kiện chọn
từ một quan hệ. Ta có thể xem phép chọn như một bộ lọc, nó chỉ giữ lại các bộ
thoả mãn điều kiện đặt ra.
Phép chọn được ký hiệu là:
σ< điều kiện chọn>( R)
trong đó ký hiệu σ được dùng để ký hiêu phép chọn, còn điều kiện chọn là một
biểu thức lôgic được chỉ ra trên các thuộc tính của R. Phép chọn có tính chất
giao hoán và có thể kết hợp nhiều phép chọn bằng AND.
2. Phép chiếu (PROJECT)
Phép chiếu là phép toán chọn một số cột của bảng. Nếu chúng ta chỉ quan tâm
đến một số thuộc tính của quan hệ, chúng ta dùng phép chiếu để chiếu lên các
thuộc tính đó.
Phép chiếu được ký hiệu là:
π<danh sách các thuộc tính>( R)
trong đó π là ký hiệu dùng để biểu diễn phép chiếu và <danh sách các thuộc
tính> là một danh sách con các thuộc tính của quanhệ R. Phép chiếu không có
tính chất giao hoán.
3. Phép hợp:
Hợp của hai quanhệ R và S, được ký hiệu là R ∪ S cho kết quả là một quan hệ
chứa tất cả các bộ có trong R hoặc ở trong S hoặc ở trong cả hai. Các bộ trùng
lặp bị loại bỏ.
4. Phép giao:
Giao của hai quanhệ R và S , được ký hiệu là R ∩ S, cho kết quả là một quan
hệ chứa tất các các bộ có trong cả hai quanhệ R và S.
5. Phép trừ quan hệ:
Phép trừ quanhệ R và S, được ký hiệu là R - S, cho kết quả là một quan hệ
chứa tất cả các bộ có trong R nhưng không có trong S.
6. Phép nối:
1
Phép nối được ký hiệu là ⨝ và được dùng để kết hợp các bộ có liên hệ với
nhau từ hai quanhệ thành một bộ. Dạng tổng quát của phép nối trên hai quan
hệ R(A1, A2, …, An) và S(B1, B2, …, Bm) là
R ⨝ S < Điều kiện nối>
Kết quả của phép nối là một quanhệ Q(A1, A2, …, An, B1, B2, …, Bm) có
n+m thuộc tính. Mỗi bộ của Q là một sự kết nối giữa một bộ của R và một bộ
của S khi chúng thoả mãn điều kiện nối. Phép nối được sử dụng để kết hợp các
dữ liệu từ nhiều quanhệ sao cho các thông tin có liên hệ với nhau có thể được
biểu diễn trong một bảng. Đôi khi phép nối được áp dụng nối một bảng với
chính nó. Chúng ta có thể áp dụng phép nối tự nhiên và nối bằng để nối nhiều
bảng với nhau. Nếu ta nối n bảng với nhau thì phải chỉ ra n-1 điều kiện nối.
7. Phép chia
Phép chia có lợi cho một loại truy vấn đặc biệt đôi khi có các ứng dụng trong
cơ sở dữ liệu. Phép chia được áp dụng cho hai quanhệ R(Z) và S(X) và được
ký hiệu là R(Z) ÷ S(X), trong đó X ⊂ Z.
II. PHÂNTÁN CƠ SỞ DỮ LIỆU:
1. Khi nào cần phântán CSDL?
- Khi CSDL quá lớn
- Dung lượng lưu trữ bị giới hạn
- Yêu cầu của thực tế.
2. Khái niệm CSDLphân tán
CSDL phântán (Distributed DB) là CSDL có những tiêu chí sau:
- Đã được chuẩn hóa
- Được chia tách thành nhiều phần (mảnh : fragment) có quanhệ logic với
nhau. Mỗi phần được tổ chức trong một CSDL vật lý, đặt trên các nút khác
nhau của hệ thông máy tính, sao cho việc truy xuất dữ liệu trong các phần này
là “ trong suốt “ với người (phía ) sử dụng.
2
3. Các phương pháp chia tách CSDL
3.1 Chia tách ngang
- Là phương pháp chia tách quanhệ R gồm các thuộc tính K,A,B,C,D và các
bộ dữ liệu r
1
,…,r
n
thành các quanhệ : R
1
gồm các thuộc tính K,A,B,C,D
và r
1
,…,r
n
; R
2
gồm các thuộc tính K,A,B,C,D và r
i+1
,…,r
j
;…; R
k
gồm các
thuộc tính K,A,B,C,D và r
j+1
,…, r
n
.
- Các quanhệ sau khi chia tách bằng phương pháp này sẽ có số thuộc tính
không đổi , còn các bản ghi là các tập con không giao nhau từ tập dữ liệu
ban đầu.
VD:
3.2 Chia tách dọc
- Là phương pháp chia tách quanhệ R với các thuộc tính K,A,B,C,D thành
các quanhệ R
1
, R
2
, …, R
n
sao cho thuộc tính của mỗi quanhệ sao khi chia
tách là những tập con không giao nhau ngoài thuộc tính khóa của tập thuộc
tính ban đầu.
VD: R {K,A,B,C,D} → R
1
{K,A,B} và R
2
{K,C,D}
- Tính chất : mối quanhệ sau khi chia tách có số bản ghi không đổi nhưng số
thuộc tính ít hơn quanhệ ban đầu.
<!> Đối với phương pháp chia tách ngang, khi chia tách ngang một bảng đứng
ở phía 1 của quanhệ đồng thời phải chia tách ngang các bảng đứng ở phía
nhiều.
VD: R {K,A,B,C,D} → R
1
{K,A,B} và R
2
{K,C,D}
3
R
1
K A B C D
r
1
:
:
:
r
i
R K A B C D
r
1
:
:
:
r
n
R
2
K A B C D
r
i
:
:
:
r
n
3.3 Chia tách hỗn hợp ( vừa dọc vừa ngang)
- Dọc – Ngang.
- Ngang - Dọc.
4. Tính chính xác của việc chia tách
4.1 Tính bảo toàn
T : R → R
1
, R
2
, …, R
n
Bảo toàn
⇔
, r
i
trong đó a là thuộc tính , r
∈
R
→ a
i
, r
i
∈
R
j
( j=
n,1
)
4.2 Không trùng lặp
T : R → R
1
, R
2
, …, R
n
Không trùng lặp
⇔
r
x
∈
R và r
x
∈
R
i
: (r
x
∉
R
j
, j
≠
i )
4.3 Tính tái thiết
T : R → R
1
, R
2
, …, R
n
Có tính tái thiết
⇔
∃
toán tử O : O (R
1
, R
2
, …, R
n
) = R
4
R K A B C D
n
R
2
K C D
n
. cho hai quan hệ R(Z) và S(X) và được
ký hiệu là R(Z) ÷ S(X), trong đó X ⊂ Z.
II. PHÂN TÁN CƠ SỞ DỮ LIỆU:
1. Khi nào cần phân tán CSDL?
- Khi CSDL quá lớn
-. trữ bị giới hạn
- Yêu cầu của thực tế.
2. Khái niệm CSDL phân tán
CSDL phân tán (Distributed DB) là CSDL có những tiêu chí sau:
- Đã được chuẩn hóa
- Được