Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 65 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
65
Dung lượng
1,07 MB
Nội dung
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ĐẠI HỌC THÁI NG UYÊ N KHO A CÔNG NGH Ệ T HÔ NG TI N ___________________________________ V Ũ T R Í D Ũ N G ỨNG DỤNGPHÉPDỊCHCHUYỂNLƯỢCĐỒQUANHỆTRONGCƠSỞDỮLIỆULUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Thái Nguyên - 2009 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN ____________________________ V Ũ T R Í DŨ N G ỨNG DỤNGPHÉPDỊCHCHUYỂNLƯỢCĐỒQUANHỆTRONGCƠSỞDỮLIỆUCHUYÊN NGÀNH : KHOA HỌC MÁY TÍNH MÃ SỐ : 60 48 35 01 LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN Người hướng dẫn khoa học PGS. TSKH. NGUYỄN XUÂN HUY Thái Nguyên - 2009 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn MỤC LỤC LỜI NÓI ĐẦU 1 CHƢƠNG 1. TỔNG QUAN VỀ ĐỀ TÀI VÀ CÁC KHÁI NIỆM CƠSỞ 4 1.1. TỔNG QUAN VỀ ĐỀ TÀI 4 1.1.1. Giới thiệu đề tài. 4 1.1.2. Nội dung của đề tài, các vấn đề cần giải quyết. 4 1.1.3. Phƣơng pháp nghiên cứu. 5 1.1.4. Phạm vi ứng dụng. 5 1.1.5. Kết quả đạt đƣợc. 5 1.2. CÁC KHÁI NIỆM CƠSỞ 6 1.2.1. Quan hệ, thuộc tính, bộ. 7 1.2.2. Đại sốquan hệ. 10 1.2.3. Phụ thuộc hàm, Hệ tiên đề Armstrong, Lƣợc đồquan hệ. 13 1.2.4. Bao đóng của tập thuộc tính. 18 1.2.5. Phủ của tập phụ thuộc hàm 21 1.2.6. Khóa của lƣợc đồquan hệ. 27 1.2.7. Chuẩn hoá LĐQH trên cơsở phụ thuộc hàm. 31 CHƢƠNG 2. PHÉPDỊCHCHUYỂN LƢỢC ĐỒQUANHỆ 36 2.1. Phépdịchchuyển LĐQH. 37 2.2. Thuật toán dịchchuyển LĐQH. 38 2.3. Định lý cơ bản của phépdịchchuyển LĐQH. 39 2.4. Dạng biểu diễn thứ nhất của khóa 43 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 2.5. Dạng biểu diễn thứ hai của khóa 45 2.6. Kết luận 50 CHƢƠNG 3. CÀI ĐẶT CHƢƠNG TRÌNH 51 3.1. Giới thiệu. 51 3.2. Các chức năng của chƣơng trình. 51 3.3. Một số giao diện của chƣơng trình. 52 3.4. Các thí dụ. 54 DANH MỤC BÀI BÁO, CÔNG TRÌNH NCKH 57 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 58 TÀI LIỆU THAM KHẢO 60 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn DANH MỤC CÁC KÝ HIỆU, VIẾT TẮT 1NF 1 st normal form - dạng chuẩn 1 2NF 2 nd normal form - dạng chuẩn 2 3NF 3 rd normal form - dạng chuẩn 3 CSDL Cơsởdữliệu LĐQH Lƣợc đồquanhệ PTH phụ thuộc hàm FD phụ thuộc hàm ╞ suy dẫn theo tiên đề (theo logic) ├ suy dẫn theo quanhệ khác với mọi thuộc là con chứa giao (của 2 tập thuộc tính) hợp (của 2 tập thuộc tính) X + bao đóng của tập thuộc tính X tƣơng đƣơng ≢ không tƣơng đƣơng \ phép trừ logic Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn _______________________________________________________ Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 1 LỜI NÓI ĐẦU Trongquản lý các cơsởdữliệu (CSDL), phụ thuộc dữliệu được hiểu là những mệnh đề mô tả các ràng buộc mà dữliệu phải đáp ứng trong thực tế. Nhờ có những mô tả phụ thuộc này mà hệquản trị cơsởdữliệucó thể quản lý tốt được chất lượng dữ liệu. Lý thuyết về các phụ thuộc dữliệu đóng vai trò quantrọngtrong việc mô tả thế giới thực, phản ánh ngữ nghĩa dữliệutrongcơsởdữ liệu. Phụ thuộc dữliệu được Codd, tác giả của mô hình dữliệuquanhệ đặt nền móng từ những năm 70 với khái niệm phụ thuộc hàm. Sau đó một loạt tác giả khác tiếp tục phát triển các dạng phụ thuộc bậc cao, phụ thuộc mờ cũng như xây dựng các hệ tiên đề cho các lớp phụ thuộc - tức là đặt cơsở lý thuyết về phụ thuộc dữ liệu. Một điều khá tự nhiên là ngay từ những ngày đầu phát triển lý thuyết thiết kế cơsởdữ liệu, logic đã được chọn như một ngôn ngữ hữu hiệu để đặc tả phụ thuộc dữ liệu, do đó, trongsố các loại hình phụ thuộc dữliệu rất đa dạng được đề xuất và phát triển sau này, các phụ thuộc logic luôn luôn là trọng tâm chú ý của các nhóm nghiên cứu. Đề tài này tập trung vào tìm hiểu và nghiên cứu khái niệm chuyểndịchlượcđồquan hệ, đưa chúng về dạng thu gọn và nhận được các biểu diễn quantrọng cho bao đóng, khóa và phản khoá. Các kết quả thu được sử dụngtrong quá trình thiết kế các cơsởdữ liệu. Nội dung đề tài được cấu trúc như sau: Chương 1 giới thiệu về đề tài và các khái niệm chung về mô hình quanhệ với trọng tâm là các khái niệm hình thức của mô hình quan hệ, trongđó vận dụng chủ yếu các cấu trúc rời rạc. Phụ thuộc hàm (PTH) là lớp phụ thuộc đầu tiên của phụ thuộc logic và đồng thời cũng là lớp phụ thuộc kinh điển theo nghĩa, được Codd, tác giả của mô hình dữliệuquan hệ, đề xuất sớm nhất và được sử dụng như một công cụ thiết kế các cơsởdữliệu chuẩn hóa. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn _______________________________________________________ Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 2 Chương 2 trình bày một kỹ thuật thu gọn lượcđồquanhệ (LĐQH) được gọi là phépdịchchuyểnlượcđồquan hệ. Bản chất của kỹ thuật này là loại bỏ khỏi LĐQH ban đầu một số thuộc tính không quantrọng theo nghĩa chúng không làm ảnh hưởng đến kết quả tính toán các đối tượng đang được quan tâm như bao đóng, khóa, phản khóa Mặc dù LĐQH thu được qua phépdịchchuyển không tương đương với LĐQH ban đầu, nhưng ta có thể thu được các đối tượng cần tìm bằng những phép toán đơn giản như loại bỏ hoặc thêm một số thuộc tính. Điều lý thú là sau khi loại bỏ một số thuộc tính thì một số PTH sẽ được loại bỏ theo vì chúng trở thành các PTH tầm thường (có vế trái chứa về phải) hoặc mang thông tin tiền định (đó là các PTH dạng X). Các phépdịchchuyển LĐQH được phát triển cho lớp các phụ thuộc logic đầu tiên là phụ thuộc hàm cho ta một số kết quả lý thú về biểu diễn bao đóng, khóa, phản khóa cùng một số dấu hiệu cần và đủ để nhận biết các đặc trưng tương quan giữa các đối tượng nói trên. Chương 3 cài đặt chương trình mô phỏng ứng dụngphépdịchchuyểnlượcđồquanhệ vào thiết kế cơsởdữliệu cùng với một số thí dụ. Phần cuối của luận văn là kết luận và hướng phát triển và các tài liệu tham khảo. Em xin bày tỏ lòng chân thành cảm ơn PGS TSKH Nguyễn Xuân Huy - người Thầy đã tận tình hướng dẫn, giúp đỡ em hoàn thành luận văn này. Em xin chân thành cảm ơn Khoa Công nghệ thông tin - Đại học Thái Ngyên đã tạo điều kiện về tinh thần cũng như cơsở vật chất để em được học tập, nâng cao kiến thức và thực hiện luận văn tốt nghiệp. Em xin chân thành cảm ơn các Thầy, Cô giáo ở Viện Công nghệ thông tin - Viện Khoa học và Công nghệ Việt Nam, các Thầy, Cô giáo ở Khoa Công nghệ thông tin - Đại học Thái Nguyên đã nhiệt tình giảng dạy, hướng dẫn và cung cấp cho em những kiến thức vô cùng quí báu, để em có điều kiện nâng cao kiến thức và hiểu biết của mình trong lĩnh vực công nghệ thông tin. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn _______________________________________________________ Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 3 Em cũng xin chân thành cảm ơn Ban lãnh đạo Liên đoàn Lao động tỉnh Hà Nam, Ban giám hiệu Trường trung cấp nghề Kinh tế - Kỹ thuật Hà Nam, gia đình, người thân và bạn bè đã tạo điều kiện thuận lợi, động viên và giúp đỡ em trong suốt thời gian học tập, nghiên cứu và làm luận văn tốt nghiệp. Học viên Vũ Trí DũngSố hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn _______________________________________________________ Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 4 CHƯƠNG 1 TỔNG QUAN VỀ ĐỀ TÀI VÀ CÁC KHÁI NIỆM CƠSỞ 1.1. TỔNG QUAN VỀ ĐỀ TÀI 1.1.1. Giới thiệu đề tài Trongquản lý các cơsởdữliệu lớn và phức tạp đòi hỏi nhiều thuật toán hữu hiệu để tính toán các đối tượng như bao đóng, khóa, phủ Một số thuật toán tốt theo nghĩa độ phức tạp tính toán giới hạn ở các hàm tuyến tính hoặc đa thức theo chiều dài dữliệu vào đã được công bố như thuật toán tính bao đóng của tập thuộc tính, thuật toán tìm một khóa, thuật toán xác định thành viên hay thuật toán xác định phụ thuộc hàm suy dẫn, thuật toán tìm giao các khóa, thuật toán xác định một lượcđồquanhệcó một khóa duy nhất… [1, 2, 8]. Một nhận xét tự nhiên là nếu kích thước của lượcđồquanhệ càng nhỏ thì các thuật toán càng phát huy hiệu quả hơn. Một số hướng nghiên cứu tinh giản các lượcđồcơsởdữliệu được thực hiện thông qua các phép biến đổi tương đương, chẳng hạn đưa tập phụ thuộc hàm về dạng thu gọn hoặc thu gọn tự nhiên, dạng không dư, dạng tối ưu (chứa ít ký hiệu nhất)… đã được công bố [3, 5, 6, 7]. Trongphépdịchchuyểnlượcđồquan hệ. Bản chất của kỹ thuật này là loại bỏ khỏi lượcđồquanhệ ban đầu một số thuộc tính không quantrọng theo nghĩa chúng không làm ảnh hưởng đến kết quả tính toán các đối tượng đang quan tâm như bao đóng, khóa, Mặc dùlượcđồquanhệ thu được qua phép thu gọn không tương đương với lượcđồquanhệ ban đầu, nhưng ta có thể thu được các đối tượng cần tìm bằng những phép toán đơn giản như loại bỏ hoặc thêm một số thuộc tính. Điều lý thú là sau khi loại bỏ một số thuộc tính thì một số phụ thuộc hàm sẽ được loại bỏ theo, vì chúng trở thành các phụ thuộc hàm tầm thường (có vế trái chứa về phải) hoặc mang thông tin tiền định (đó là các phụ thuộc hàm dạng X). Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn _______________________________________________________ Vũ Trí Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 5 1.1.2. Nội dung của đề tài, các vấn đề cần giải quyết Luận văn tập trung tìm hiểu và cải tiến các kỹ thuật và thuật toán thu gọn lượcđồquanhệ p thông qua phépdịchchuyểnlượcđồquanhệ theo một tập thuộc tính X. Khảo sát sự phụ thuộc của phépdịchchuyển thông qua các tính chất của tập thuộc tính X. Khảo sát hai dạng biểu diễn khóa của lượcđồquanhệ qua phépdịch chuyển. Xây dựng một hệ trình minh họa và đánh giá các kết quả lý thuyết. 1.1.3. Phương pháp nghiên cứu 1. Tiếp cận chủ yếu để giải quyết các vấn đề đặt ra trong phạm vi đề tài là tiên đề hóa. Các hệ tiên đề được xây dựng trên cơsở một hệ suy dẫn hình thức với các tính chất cơ bản về các đối tượng cơsở và các mối liên hệ giữa chúng. Cơsở toán học của các hệ tiên đề là định lý về tính xác đáng và đầy đủ cùng với các định lý về điều kiện cần và đủ cho các hệ tiên đề tương đương. 2. Tiếp cận hình thức vận dụng chủ yếu các phương pháp và các cấu trúc của toán học rời rạc (bao gồm cả logic hình thức), kết hợp với các phương pháp đối sánh, mô hình hóa, tối ưu và quy hoạch rời rạc. 3. Kết hợp chặt chẽ giữa lý thuyết và thực hành, sử dụng và phát triển các phần mềm nói chung và các phần mềm toán học nói riêng để kiểm định và thể hiện các kết quả lý thuyết. 1.1.4. Phạm vi ứng dụng Các kết quả thu được có thể vận dụng cho các quy trình thiết kế các cơsởdữliệuquanhệdùngtrong các hệ thống thông tin, cụ thể là: - Tính bao đóng của các tập thuộc tính, - Tìm khóa của các lượcđồquan hệ. - Chuẩn hoá LĐQH [...]... giới thiệu định nghĩa về quan hệ, thuộc tính và bộ Phần thứ hai giới thiệu về đại sốquanhệ như một ngôn ngữ truy nhập dữ liệutrong các cơsởdữliệuquanhệ Phần thứ ba mô tả phụ thuộc hàm như một công cụ toán học trợ giúp cho việc biểu đạt ngữ nghĩa dữliệu và đảm bảo tính nhất quán của dữ liệutrongcơsởdữ liệu, phụ thuộc hàm là lớp phụ thuộc đầu tiên của phụ thuộc logic và đồng thời cũng là lớp... khoá Về thực hành luận văn sẽ cài đặt các kết quả lý thuyết dưới dạng chương trình bao gồm các chức năng sau: Nạp và cập nhật dữ liệu: thuộc tính và các phụ thuộc hàm Tính bao đóng Tìm các khóa của lược đồquanhệ Chuẩn hoá LĐQH 1.2 CÁC KHÁI NIỆM CƠSỞTrong các mô hình dữliệu thì mô hình dữliệuquanhệ được sử dụng rộng rãi hơn cả do tính trực quan, kiến trúc đơn giản và cócơsở toán học chặt... S(U), ký hiệu RS, hoặc R&S cho ta quanhệ chứa các bộ xuất hiện đồng thời trong cả hai quanhệ thành phần, P(U) = R S ={ t | tR, tS } Các phép toán hợp, trừ và giao đựơc gọi là các phép toán tập hợp trên các quanhệ (tương thích) Phép chia Định nghĩa Cho hai quanhệ R(U) và S(V) thỏa V U Đặt M = U\V Phép chia quanhệ R cho quanhệ S, ký hiệu R:S, cho ta quanhệ P(M) = R : S = { t.M | t R, (t.M)*S... hình dữliệuquanhệ đề xuất sớm nhất và được sử dụng như một công cụ thiết kế các cơsởdữliệu chuẩn hóa Các tính chất của phụ thuộc hàm và các hệ tiên đề cho phụ thuộc hàm được mô tả đầy đủ, trongđóhệ tiên đề Armstrong được sử dụng nhiều hơn cả Một trong những khái niệm quantrọng của phụ thuộc hàm là bao đóng của tập thuộc tính và các tính chất cơ bản của phép toán lấy bao đóng được trình bày trong. .. Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 9 http://www.lrc-tnu.edu.vn 1.2.2 Đại sốquanhệ Đại sốquanhệ được xây dựng trên tập các quanhệ với các phép toán cơsở là chọn, chiếu, kết nối tự nhiên, chia, hợp, giao và trừ Mục này sử dụng các ký pháp theo tài liệu [7] Phép chọn (phép lọc) Định nghĩa Cho quanhệ R(U) và biểu thức điều kiện (còn gọi là biểu thức lọc hay biểu thức chọn) e Phép chọn... tích Descartes, trongđó mỗi bộ của quanhệ R sẽ được ghép với mọi bộ của quanhệ S Phép cộng (hợp) Định nghĩa Phép hợp (theo lý thuyết tập hợp hoặc nối dọc) hai quanhệ tương thích R(U) và S(U), ký hiệu RS, hoặc R+S, cho ta quanhệ chứa các bộ của mỗi quanhệ thành phần, P(U) = R S = { t | tR tS } Phép trừ Định nghĩa Phép trừ (theo lý thuyết tập hợp hoặc lấy phần riêng) hai quanhệ tương thích... Dũng, Luận văn Thạc sĩ Công nghệ thông tin, Trang 10 http://www.lrc-tnu.edu.vn (ii) Lược bớt các dòng giống nhau trong bảng kết quả: chỉ giữ lại một dòng trongsố các dòng giống nhau Phép kết nối tự nhiên Định nghĩa Cho hai quanhệ R(U) và S(V) Đặt M = UV Phép kết nối (tự nhiên) hai quanhệ R(U) và S(V), ký hiệu RS, cho ta quanhệ chứa các bộ được dán từ các bộ u của quanhệ R với mỗi bộ v của quan hệ. ..1.1.5 Kết quả đạt được Về lý thuyết, luận văn tập trung vào các kết quả sau đây: - Khái niệm về phép dịchchuyểnlượcđồquan hệ, - Phát biểu và chứng minh công thức tính bao đóng qua phép dịchchuyểnlượcđồquan hệ, - Phát biểu và chứng minh kết quả về dạng biểu diễn khóa thứ nhất, - Phát biểu và chứng minh kết quả về dạng... t trongquanhệ R(U) và với mỗi quanhệ S(V) ta ký hiệu tS là phép dán bộ t với quanhệ S tS cho ta quanhệ P(UV) = { tv | vS } Thí dụ Cho U = ABC, V = BD, t(U) = (a,b,c), v(V) = (b,d) Ta có r(UV) = t * v = (a,b,c,d) là một bộ trên tập thuộc tính UV = ABCD Cho thêm quanhệ S(BD) S (B D) b d x d b e Khi đó t*S cho ta quanhệ P(ABCD) sau đây P (A B C D) a b c d a b c e Số hóa bởi Trung tâm Học liệu. .. nhất trong thuộc tính cột A của quanhệ R MinR, A: cho giá trị nhỏ nhất trong thuộc tính cột A của quanhệ R Nếu trong biểu thức quanhệcó chứa các hàm tiện ích thì các hàm này được thực hiện sớm nhất trong ngữ cảnh cho phép Thí dụ Biểu thức quanhệ P = SR(A > Avg(S,A))[AB] sẽ được thực hiện theo trật tự sau đây: 1 Tính hàm c = Avg(S,A) 2 Thực hiện phép chọn P1 = R(A > c) 3 Thực hiện phép chiếu . ỨNG DỤNG PHÉP DỊCH CHUYỂN LƯỢC ĐỒ QUAN HỆ TRONG CƠ SỞ DỮ LIỆU LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Thái Nguyên - 2009 Số hóa bởi Trung tâm Học liệu. Khóa của lƣợc đồ quan hệ. 27 1.2.7. Chuẩn hoá LĐQH trên cơ sở phụ thuộc hàm. 31 CHƢƠNG 2. PHÉP DỊCH CHUYỂN LƢỢC ĐỒ QUAN HỆ 36 2.1. Phép dịch chuyển LĐQH. 37 2.2. Thuật toán dịch chuyển LĐQH trong các cơ sở dữ liệu quan hệ. Phần thứ ba mô tả phụ thuộc hàm như một công cụ toán học trợ giúp cho việc biểu đạt ngữ nghĩa dữ liệu và đảm bảo tính nhất quán của dữ liệu trong cơ sở dữ liệu,