Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
399,62 KB
Nội dung
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
TRẦN VĂN SẢN
NGHIÊN CỨU,SOSÁNHCÁCPHƯƠNGPHÁP
PHÂN RÃ,DỊCHCHUYỂNSƠĐỒQUANHỆ
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: : 60.48.01
TÓM TẮT LUẬN VĂN THẠC SỸ KĨ THUẬT
HÀ NỘI – 2012
1
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học : PGS-TS Nguyễn Bá Tường
Phản biện 1: PGS-TS Đặng Văn Chuyết
Phản biện 2: PGS-TS Đỗ Năng Toàn
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận
văn thạc sĩ tại Học viện Công nghệ Bưu chính Viễn
thông
Vào lúc: giờ 10h10 ngày.20 tháng 01 năm 2013
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính
Viễn thông
2
i. MỞ ĐẦU
i.1. Giới thiệu đề tài
Trong quản lý các cơ sở dữ liệu (CSDL), phụ thuộc
dữ liệu được hiểu là những mệnh đề mô tả các ràng buộc
mà dữ liệu phải đáp ứng trong thực tế. Nhờ có những mô
tả phụ thuộc này mà hệquản trị cơ sở dữ liệu có thể quản
lý tốt được chất lượng dữ liệu. Lý thuyết về các phụ
thuộc dữ liệu đóng vai trò quan trọng trong việc mô tả
thế giới thực, phản ánh ngữ nghĩa dữ liệu trong cơ sở dữ
liệu. Phụ thuộc dữ liệu được Codd, tác giả của mô hình
dữ liệu quanhệ đặt nền móng từ những năm 70 với khái
niệm phụ thuộc hàm. Sau đó một loạt tác giả khác tiếp
tục phát triển các dạng phụ thuộc bậc cao, phụ thuộc mờ
cũng như xây dựng cáchệ tiên đề cho các lớp phụ thuộc -
tức là đặt cơ sở lý thuyết về phụ thuộc dữ liệu.
Một điều khá tự nhiên là ngay từ những ngày đầu
phát triển lý thuyết thiết kế cơ sở dữ liệu, logic đã được
chọn như một ngôn ngữ hữu hiệu để đặc tả phụ thuộc dữ
liệu, do đó, trong sốcác loại hình phụ thuộc dữ liệu rất đa
dạng được đề xuất và phát triển sau này, các phụ thuộc
3
logic luôn luôn là trọng tâm chú ý của các nhóm nghiên
cứu.
Đề tài này tập trung vào tìm hiểu và nghiên cứu
khái niệm các phép phânrã, phép dịchchuyểnsơđồ
quan hệ, đưa chúng về dạng thu gọn và nhận được các
biểu diễn quan trọng cho bao đóng, khóa và phản khoá.
Các kết quả thu được sử dụng trong quá trình thiết kế các
cơ sở dữ liệu.
Một nhận xét tự nhiên là nếu kích thước của sơđồ
quan hệ càng nhỏ thì các thuật toán càng phát huy hiệu
quả hơn. Một số hướng nghiên cứu tinh giản cácsơđồ cơ
sở dữ liệu được thực hiện thông qua các phép biến đổi
tương đương, chẳng hạn đưa tập phụ thuộc hàm về dạng
thu gọn hoặc thu gọn tự nhiên, dạng không dư, dạng tối
ưu … đã được công bố.
Để giải quyết vấn đề trên ta dùng phép “phân rã”,
tức là tách sơđồquanhệ trên thành cácsơđồquanhệ
con với mong muốn cácsơđồquanhệ con mới này sẽ
đạt dạng chuẩn cao hơn sơđồquanhệ ban đầu. Như vậy
4
sẽ giảm (hay không còn) các thông tin bị dư thừa trong
các quanhệ mới.
Mục đích của phép phân rã đó là nhằm loại bỏ các
file dữ liệu dư thừa và loại bỏ các dị thường: không nhất
quán, dị thường khi thêm dòng, dị thường khi xóa dòng
của quan hệ, khi thực hiện phép cập nhật (sửa, thêm,
xóa).
Trong phép dịchchuyểnsơđồquan hệ. Bản chất
của kỹ thuật này là loại bỏ khỏi sơđồquanhệ ban đầu
một số thuộc tính không quan trọng theo nghĩa chúng
không làm ảnh hưởng đến kết quả tính toán các đối tượng
đang quan tâm như bao đóng, khóa, Mặc dù sơđồquan
hệ thu được qua phép thu gọn không tương đương với sơ
đồ quanhệ ban đầu, nhưng ta có thể thu được các đối
tượng cần tìm bằng những phép toán đơn giản như loại
bỏ hoặc thêm một số thuộc tính. Điều lý thú là sau khi
loại bỏ một số thuộc tính thì một số phụ thuộc hàm sẽ
được loại bỏ theo, vì chúng trở thành các phụ thuộc hàm
tầm thường (có vế trái chứa về phải) hoặc mang thông tin
tiền định (đó là các phụ thuộc hàm dạng Ø→X).
5
i.2. Nội dung của đề tài, các vấn đề cần giải
quyết
Mục tiêu của luận văn là tìm hiểu kỹ thuật thu gọn
sơ đồquanhệ dựa trên “phương phápphân rã sơđồ
quan hệ” và “phương phápdịchchuyểnsơđồquan
hệ”.
- Sử dụng một số thuật ngữ như dịch chuyển, phân
rã, chiếu của cácsơđồquanhệ để làm sáng tỏ khái niệm
thu gọn sơđồquanhệ là nội dung chính của luận văn.
Vấn đề cần quan tâm là phânrã,dịchchuyển SĐQH
có đảm bảo tái thiết được sơđồquanhệ hay không, quá
trình phânrã,dịchchuyển có làm mất thông tin không?
Các đối tượng chúng ta sẽ phânrã,dịchchuyển là
các sơđồquanhệ W thông qua phép phânrã,dịch
chuyển sơđồquanhệ theo một tập thuộc tính U. Khảo
sát sự phụ thuộc của phép phânrã,dịchchuyển thông
qua các tính chất của tập thuộc tính U. Khảo sát hai dạng
biểu diễn khóa của lược đồquanhệ qua phép phânrã,
6
dịch chuyển. Xây dựng một hệ trình minh họa mô phỏng
kết quả thực tế và đánh giá các kết quả lý thuyết.
i.3. Phươngphápnghiên cứu
1. Tiếp cận chủ yếu để giải quyết các vấn đề đặt ra
trong phạm vi đề tài là tiên đề hóa. Cáchệ tiên đề được
xây dựng trên cơ sở một hệ suy dẫn hình thức với các
tính chất cơ bản về các đối tượng cơ sở và các mối liên
hệ giữa chúng. Cơ sở toán học của cáchệ tiên đề là định
lý về tính xác đáng và đầy đủ cùng với các định lý về
điều kiện cần và đủ cho cáchệ tiên đề tương đương.
2. Tiếp cận hình thức vận dụng chủ yếu cácphương
pháp và các cấu trúc của toán học rời rạc (bao gồm cả
logic hình thức), kết hợp với cácphươngpháp đối sánh,
mô hình hóa, tối ưu và quy hoạch rời rạc.
3. Kết hợp chặt chẽ giữa lý thuyết và thực hành, sử
dụng và phát triển cácphần mềm nói chung và cácphần
mềm toán học nói riêng để kiểm định và thể hiện các kết
quả lý thuyết.
i.4. Phạm vi ứng dụng
7
Các kết quả thu được có thể vận dụng cho các quy
trình thiết kế các cơ sở dữ liệu dùng trong cáchệ thống
thông tin, cụ thể là:
Bảo toàn phụ thuộc hàm, không mất mát thông tin,
loại bỏ dư thừa dữ liệu. Đây là các tiêu chuẩn cơ bản của
hệ thống thông tin. Với các CSDL lớn và phức tạp có
nhiều thuộc tính, chúng ta phải dùng cácphươngpháp
biến đổi SĐQH để đưa chúng về dạng tối ưu, đáp ứng
được các tiêu chuẩn trên.
Về lý thuyết, luận văn tập trung vào các kết quả sau
đây:
- Khái niệm cơ sở lý thuyết của mô hình quan hệ.
- Khái niệm về phép phân rã sơđồquan hệ.
- Khái niệm về phép dịchchuyểnsơđồquan hệ.
- Phát biểu và chứng minh cácphươngphápphân rã
dọc sơđồquan hệ, phân rã có nối không tổn thất, phân rã
bảo toàn phụ thuộc, phân rã thành các dạng chuyển
BCNF.
- Phát biểu và chứng minh công thức tính bao đóng
qua phép dịchchuyển lược đồquan hệ,
8
- Phân tích thuật toán Chase kiểm tra việc phân rã
có nối không tổn thất không, kiểm tra phân rã có bảo
toàn phụ thuộc không, thuật toán phân rã thành dạng
chuẩn BCNF.
- Phân tích thuật toán dịchchuyển SĐQH,
Về thực hành luận văn sẽ cài đặt chương trình ứng
dụng nhằm mục đích mô phỏng kết quả nghiên cứu được
của học viên.
Nội dung :
Chương 1
CƠ SỞ LÝ THUYẾT CỦA MÔ HÌNH QUANHỆ
Chương 1 Giới thiệu về mô hình dữ liệu quanhệ là
một mô hình được sử dụng rộng rãi trong đời sống xã hội
của mọi tổ chức, cơ quan, xí nghiệp bởi tính do tính trực
quan, kiến trúc đơn giản và có cơ sở toán học chặt chẽ
của nó. Mô hình quanhệ biểu thị dữ liệu trong một
CSDL như một tập cácquan hệ, có thể coi như là một
bảng giá trị gồm các hàng và các cột. Mỗi hàng trong
bảng là một tập các giá trị có liên quan với nhau, các giá
9
trị này biểu thị một sự kiện tương ứng với một thực thể
hay một mối quanhệ trong thế giới thực. Trong chương
này chúng ta sẽ nêu một số khái niệm cơ bản về quanhệ
và cơ sởquan hệ.
1.1.Khái niệm về quanhệ
Cho U={A
1
,A
2
, ,A
n
} là một tập hữu hạn, không
rỗng các thuộc tính. Mỗi thuộc tính A
i
có một miền giá
trị là D(A
i
).
1.2. Các phép toán đại sốquan hệ.
Trên cácquanhệ ta có thể thực hiện các phép toán tập
hợp như hợp, giao, hiệu, các phép toán đó người ta
thường gọi là các phép toán đại sốquan hệ,
1.2.1. Phép hợp
1.2.1. Phép giao
1.2.3. Phép trừ
1.2.3. Phép chiếu
1.2.5. Tích Descartes
1.2.6. Phép chọn
1.2.7. Phép chia
[...]... 3N FBCN F 4N F Hình 1.1: Sơđồ biểu thị mối liên hệ của các lớp chuẩn 15 Chương 2 CÁCPHƯƠNGPHÁPPHÂN RÃ SƠĐỒQUANHỆ Chương này giới thiệu các phép phân rã sơđồquanhệ , tức là tách sơđồquanhệ trên thành cácsơđồquanhệ con với mong muốn cácsơđồquanhệ con mới này sẽ đạt dạng chuẩn cao hơn sơđồquanhệ ban đầu Các đối tượng chúng ta sẽ phân rã là cácsơđồquanhệ W= trong đó U={A1,... có nối không tổn thất nếu phép phân rã thỏa mãn cả 3 điều kiện trên Chương 3 PHÉP DỊCH CHUYỂN, PHÉP CHIẾU SƠĐỒQUAN HỆ, NHẬN XÉT, SOSÁNHPHƯƠNGPHÁPPHÂN RÃ VÀ DỊCHCHUYỂNSƠĐỒQUANHỆ Chương 3 trình bày một kỹ thuật thu gọn sơđồquanhệ (SĐQH) được gọi là phép dịchchuyểnsơđồquanhệ Bản chất của kỹ thuật này là loại bỏ khỏi SĐQH ban đầu một số thuộc tính không quan trọng theo nghĩa chúng không... Nhận xét, so sánhphươngphápphân rã và dịchchuyển SĐQH 24 3.3.1 Một vài nhận xét đối với các phươngphápphân rã: Khi phân rã SĐQH ta nên phân rã thành bao nhiêu sơđồ con? và trong mỗi sơđồ con nên lấy những thuộc tính nào? phụ thuộc hàm nào thì tốt? Đây là vấn đề lý thuyết mà em chưa tìm được câu trả lời chắc chắn 3.32 Một vài nhận xét đối với phươngphápdịch chuyển: Đối với phép dịchchuyển M,... thuộc tính M U Ta nói sơđồquanhệ W2 nhận được từ sơđồquanhệ W1 qua phép dịchchuyển theo tập thuộc tính M, nếu sau khi loại bỏ mọi xuất hiện của các thuộc tính của M trong sơđồ W1 thì thu được sơđồ W2 19 Nếu sau khi thực hiện phép dịchchuyển theo M cho SĐQH W1 ta thu được SĐQH W2 thì ta viết W2 = W1\M Thao tác loại bỏ M được thực hiện trên sơđồ W1 = để thu được sơđồ W2= như sau:... hạn không rỗng các thuộc tính, F là tập phụ thuộc hàm trên U Phân rã W thực chất là phân rã U và kéo theo nó là phân rã F 2.1 Phân rã dọc sơsơđồquanhệ W= Định nghĩa : Phân rã dọc W = là phân chia W = thành W1 = , W2 = , .,Wk=, ký hiệu: W| ->{W1, W2, , Wk} trong đó Fi Ui(F+) và U = k Ui i 1 2.2 .Các phươngphápphân rã dọc sơđồquanhệ 16 2.2.1 Phân rã W=... phép dịchchuyển ta nên lấy tập M như thế nào? Vì sau phép dịchchuyển M của SĐQH W1 ta nhận được SĐQH W2 và trong W2 có thể có những PTH kiểu X Đây cũng là dạng PTH em không hiểu Dạng PTH này có trong thực tế không? Tuy nhiên theo yêu cầu của Thầy hướng dẫn nội dung chính luận văn của em Nghiêncứu, so sánhcácphươngpháp dịch chuyển và phân rã sơđồquanhệ Sau đây ta có bảng nhận xét so sánh. .. thông tin tiền định (đó là các PTH dạng Ø→X) Các phép dịchchuyển SĐQH được phát triển cho lớp các phụ thuộc logic đầu tiên là phụ thuộc hàm cho ta một số kết quả lý thú về biểu diễn bao đóng, khóa, phản khóa cùng một số dấu hiệu cần và đủ để nhận biết các đặc trưng tương quan giữa các đối tượng nói trên 3.1 Phép dịchchuyểnsơđồquanhệ 3.1.1 Định nghĩa Cho hai sơđồquanhệ W1 = , W2 = ... bảng nhận xét sosánh sau: 1 Bảng 3.1 Bảng so sánhcácphươngpháp dịch chuyển và phân rã SĐQH Bảo Bảo toàn Sốsơđồ con toàn phụ thuộc tập hàm F thuộc Có nối Các PTH Fi sau khi thực không sau khi thực thực hiện hiện phép tổn thất hiện phép phép toán có toán có nghĩa là 2NF toán có là là BCNF toán tính U 1 Phân rã Có tổng quát 2 Phân rã có nối không tổn Có Sơđồ sau khi không? Không bắt buộc Không bắt... dữ liệu vào (của SĐQH W1) Sau khi thực hiện thủ tục G = F\M nếu: G chứa các PTH tầm thường (dạng XY, X Y) thì ta loại các PTH này khỏi G G chứa các PTH trùng lặp thì ta bớt các PTH này 3.1.2 Thuật toán dịchchuyểnsơđồquanhệ 20 3.1.3 Bổ đề về siêu khoá trong phép dịchchuyển SĐQH Bổ đề : Bổ đề về siêu khóa trong phép dịchchuyển SĐQH Cho hai SĐQH W1 = , W2 = và XU Biết W2=W1\X Khi... là siêu khoá của W2 thì Z là siêu khoá của W1 3.1.4 Dịchchuyểnsơđồquanhệ về dạng cân bằng 3.1.4.1 Định nghĩa sơđồ cân bằng SĐQH W = được gọi là cân bằng nếu tập PTH F trong W thoả 4 tính chất sau: 1 Hợp các vế trái, các vế phải của các PTH trong F đúng bằng tập thuộc tính U: LS(F) = RS(F) = U 21 2 F không chứa các PTH tầm thường, tức là các PTH có vế trái chứa vế phải: X,YU: XY (XYF) . phép phân rã sơ đồ quan hệ.
- Khái niệm về phép dịch chuyển sơ đồ quan hệ.
- Phát biểu và chứng minh các phương pháp phân rã
dọc sơ đồ quan hệ, phân. này giới thiệu các phép phân rã sơ đồ
quan hệ , tức là tách sơ đồ quan hệ trên thành các sơ đồ
quan hệ con với mong muốn các sơ đồ quan hệ con mới
này