Gộp nhóm các giá trị lặp của các thuộc tính trong các mảnh của cơ sơ dữ liệu phân tán

81 272 0
Gộp nhóm các giá trị lặp của các thuộc tính trong các mảnh của cơ sơ dữ liệu phân tán

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG - Nguyễn Anh Dũng GỘP NHÓM CÁC GIÁ TRỊ LẶP CỦA CÁC THUỘC TÍNH TRONG CÁC MẢNH CỦA CƠ SỞ DỮ LIỆU PHÂN TÁN Luận văn thạc sĩ khoa học máy tính Thái Nguyên - 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG - Nguyễn Anh Dũng GỘP NHÓM CÁC GIÁ TRỊ LẶP CỦA CÁC THUỘC TÍNH TRONG CÁC MẢNH CỦA CƠ SỞ DỮ LIỆU PHÂN TÁN Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH GV hƣớng dẫn: PGS NCVC TS Lê Huy Thập Thái Nguyên - 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ i LỜI CAM ĐOAN Tôi xin cam đoan công trình nghiên cứu tôi, đƣợc xây dựng từ số liệu kết thực tiễn học tập trƣờng Đại học Công nghệ thông tin Truyền thông Thái Nguyên ứng dụng dựa số liệu UBND huyện Đan Phƣợng, chƣa đƣợc công bố hay xuất công trình khác Thái Nguyên, tháng 10 năm 2015 Tác giả Nguyễn Anh Dũng Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ ii LỜI CẢM ƠN Trƣớc tiên xin đƣợc cảm ơn thầy PGS NCVC TS Lê Huy Thập, ngƣời trực tiếp giảng dạy ngƣời hƣớng dẫn thực luận văn Tôi xin bày tỏ lòng biết ơn đến thầy, cô giáo Viện Công nghệ thông tin Khoa Công nghệ thông tin - Đại học Thái Nguyên tận tình giảng dạy tạo điều kiện thuận lợi cho suốt trình học tập Tôi xin cảm ơn lãnh đạo Phòng Văn hóa Thông tin huyện Đan Phƣợng, anh chị đồng nghiệp tạo điều kiện cho tham gia hoàn thành khóa học Tôi xin cảm ơn bạn tôi, ngƣời bên cạnh động viên, giúp đỡ đóng góp nhiều ý kiến thiết thực trình học tập thực luận văn Cuối chân thành cảm ơn thành viên gia đình tôi, yêu thƣơng, dìu dắt công việc sống Thái Nguyên, tháng 10 năm 2015 Sinh viên thực Nguyễn Anh Dũng Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC BẢNG BIỂU v DANH MỤC HÌNH vii DANH MỤC CÁC CHỮ VIẾT TẮT viii BẢNG DANH MỤC CÁC KÍ HIỆU ix LỜI NÓI ĐẦU CHƢƠNG 1: CƠ SỞ LÝ THUYẾT 1.1 Logic 1.1.1 Mệnh đề phép toán mệnh đề 1.1.2 Các phép toán mệnh đề 1.1.3 Các luật logic 1.2 Cơ sở liệu phân tán 1.2.1 Phân mảnh ngang 12 1.2.2 Phân mảnh dọc 16 1.2.3 Phân mảnh hỗn hợp 17 CHƢƠNG 2: CÁC THUẬT TOÁN PHÂN MẢNH THEO CÁC GIÁ TRỊ LẶP CỦA CÁC THUỘC TÍNH TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN 18 2.1 Miền giá trị thuộc tính khái niệm giá trị lặp thuộc tính 18 2.1.2 Các giá trị lặp miền giá trị thuộc tính 18 2.2 Các thuật toán phân mảnh theo giá trị lặp thuộc tính 21 2.2.1 Thuật toán phân mảnh dọc 21 2.2.2 Thuật toán phân mảnh ngang theo giá trị lặp gộp nhóm theo tiêu chuẩn giữ lại mảnh ngang 42 2.2.3 Thuật toán phân mảnh hỗn hợp theo giá tri lặp 48 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ iv 2.2.4 Thuật toán tính size mảnh 50 2.3 Gắn nhãn cho mảnh hỗn hợp…………………………………… ……51 2.4 Kết luận chƣơng 51 CHƢƠNG 3: ỨNG DỤNG QUẢN LÝ VẤN ĐỀ KINH DOANH TẠI HUYỆN ĐAN PHƢỢNG .52 3.1 Thiết kế sở liệu quan hệ kinh doanh huyện Đan Phƣợng 52 3.2 Mệnh đề phân mảnh giá trị lặp lại thuộc tính theo tiêu chí địa điểm, hộ kinh doanh, loại hình kinh doanh, … 55 3.3 Gộp nhóm giá trị lặp thuộc tính mảnh ngang 64 3.4 Kết luận chƣơng 67 KẾT LUẬN .68 HƢỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 69 TÀI LIỆU THAM KHẢO 70 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ v DANH MỤC BẢNG BIỂU Bảng 1.1: Bảng tổng hợp giá trị chân trị phép toán Bảng 1.2: Bảng quan hệ PROJ 10 Bảng 1.3: Quan hệ đƣợc phân mảnh dọc PROJ1 11 Bảng 1.4: Quan hệ đƣợc phân mảnh dọc PROJ2 11 Bảng 1.5: Quan hệ đƣợc phân mảnh ngang với BUGGET ≤ 200 11 Bảng 1.6: Quan hệ đƣợc phân mảnh ngang với BUGGET > 200 12 Bảng 2.1 Quan hệ PhanNhiem 19 Bảng 2.1.1 Miền giá trị khóa 19 Bảng 2.1.2 Giá trị lặp ChucVu: Giám đốc .20 Bảng 2.1.3 Giá trị lặp ChucVu: Phân tích thiết kế 20 Bảng 2.1 Giá trị lặp ChucVu: Kỹ sƣ 20 Bảng 2.1.5 Giá trị lặp ThoiGianLV: 24 20 Bảng 2.1.6 Giá trị lặp ThoiGianLV: 48 20 Bảng 2.1.7 Giá trị lặp (ChucVu , ThoiGianLV) 21 Bảng 2.2.1 Mảnh dọc theo ThoiGianLV 21 Bảng 2.2.2 Mảnh dọc theo ChucVu 22 Bảng 2.2.3 Mảnh dọc theo ThoiGianLV 23 Bảng 2.2.4 Mảnh dọc theo ChucVu 24 Bảng 2.2.5 Toàn quan hệ PhanNhiem 24 Bảng 2.2.5’ Toàn quan hệ PhanNhiem 43 Bảng 2.2.6 Quan hệ PhanNhiem 45 Bảng 2.2.7 Các mảnh ngang M21 .47 Bảng 2.2.8 Quan hệ PhanNhiem 47 Bảng 2.2.9 Mảnh ngang M11 47 Bảng 2.2.10 Quan hệ PhanNhiem 48 Bảng 2.2.11 Mảnh ngang M12 48 Bảng 3.1: Dữ liệu bảng Dang_Ky_KD 52 Bảng 3.2: Bảng kết mảnh H1 .56 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ vi Bảng 3.3: Bảng kết mảnh H2 .57 Bảng 3.4: Bảng kết mảnh H3 .58 Bảng 3.5: Bảng kết mảnh H4 .59 Bảng 3.6: Bảng kết mảnh H5 .61 Bảng 3.7: Bảng kết mảnh H6 .62 Bảng 3.8: Bảng kết mảnh H7 .63 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ vii DANH MỤC HÌNH Hình 1.1:Mô tả mối quan hệ quan hệ đƣờng nối………… 14 Hình 1.2: Phân đoạn hỗn hợp …………………………………………… 17 Hình 2.1: Ma trận mẫu giá trị sử dụng thuộc tính……………………… 26 Hình 2.2: Ma trận liên đới thuộc tính…………………………………… 29 Hình 2.3: Tính toán ma trận liên đới CA…………………….…………… 35 Hình 2.4: Định vị điểm tách………………………….……………… 37 Hình 3.1: Giao diện ban đầu chƣơng trình …………………………… 64 Hình 3.2: Giao diện sau trình chọn button “chonDB” ……………… 65 Hình 3.3: Giao diện sau chọn lựa xong bảng quan hệ ………………… 65 Hình 3.4: Giao diện trình chọn thuộc tính lặp ……………………… 66 Hình 3.5: Kết trình phân mảnh ngang …………………………… 67 Hình 3.6: Giao diện liệu mảnh ngang ………………………… 67 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ viii DANH MỤC CÁC CHỮ VIẾT TẮT CSDL Cở sở liệu CSDLPT Cở sở liệu phân tán SQL Structured Query Language (Ngôn ngữ truy vấn có cấu trúc) Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 56 tiêu chí cho trình phân mảnh: Một số tiêu chí định số lƣợng mảnh nhƣ sau:  Các ràng buộc số lƣợng liệu có giá trị lặp lại thuộc yếu tố định số lƣợng mảnh có  Thuộc tính đƣợc chọn để tiến hành phân mảnh Thông thƣờng, thuộc tính khóa đồng thời tồn nhiều giá trị lặp lại đƣợc lựa chọn làm thuộc tính phân mảnh ngang  Xây dựng mệnh đề phân mảnh ngang cho tiêu chí đƣợc chọn Các mệnh đề phân mảnh ngang giá trị lặp lại đƣợc xây dựng ví dụ 3.1 dƣới đây: Ví dụ 3.1: Cho bảng quan hệ Dang_Ky_KD nhƣ bảng 3.1 Ta tiến hành phân mảnh ngang cho thuộc tính theo thuộc tính địa ngành nghề kinh doanh nhƣ sau: Các bảng quan hệ thể mệnh đề phân mảnh ngang cho thuộc tính địa chỉ: H1 = Dia_chi =” Tân hội” AND card(H1)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H1 đƣợc thể bảng 3.2 nhƣ sau: Bảng 3.2: Bảng kết mảnh H1 MaNguoiK TenNguoiK DiaCh D MaKD1 MaKD6 MaKD7 D i So_GP Cụm 13 - Tân 03E800195 Hội Nguyễn Viết Đại Đan Phƣợng – Hà Nội Cụm 13 - Tân 01S800174 Hội Nguyễn Vỹ Sơn Đan Phƣợng Hà Nội Cụm Nguyễn Xuân 03E800217 Tân Hội Dân - Đan Phƣợng - Số hóa Trung tâm Học liệu - ĐHTN NgayCa CoQuanCa NganhNgh p p e 19/2/2009 Phòng TC- KH Đại lý Internet 10/7/2013 Phòng TC-KH Karaoke 27/1/2010 Phòng TC- KH Buôn bán, sửa chữa điện thoại http://www.lrc-tnu.edu.vn/ 57 MaKD23 MaKD24 MaKD25 MaKD26 Nguyễn Đình Thái Nguyễn Văn Định Ngô Thế Tâm Đông Quốc Khánh Hà Nội Cụm – Tân HộiĐan Phƣợng Hà Nội Cụm 2Tân HộiĐan Phƣợng Hà Nội Cụm – Tân HộiĐan Phƣợng Hà Nội Cụm – Tân HộiĐan Phƣợng Hà Nội 03E800219 03E800260 03E800219 03E800249 13/7/2009 Phòng TC-KH Karaoke 11/6/2010 Phòng TC-KH Karaoke 13/7/2009 Phòng TC-KH Karaoke 02/3/2010 Phòng TC-KH Buôn bán, sửa chữa điện thoại H2 = Dia_chi =” Tân Lập” AND card(H2)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H2 đƣợc thể bảng 3.3 nhƣ sau: Bảng 3.3: Bảng kết mảnh H2 MaNguoiK TenNguoiK DiaCh D MaKD4 MaKD27 MaKD28 MaKD29 D Nguyễn Khắc Nãi Nguyễn Công Yên Bùi Thị Phóng Trần Ngọc Anh i Cụm - Tân Lập Đan Phƣợng - Hà Nội Cụm - Tân Lập Đan Phƣợng - Hà Nội Cụm - Tân Lập Đan Phƣợng - Hà Nội Cụm -Tân Lập - Số hóa Trung tâm Học liệu - ĐHTN So_GP 03E800219 03E800164 01S800169 NgayCa CoQuanCa NganhNgh p p e 13/7/2009 Phòng TC-KH Karaoke Buôn bán, 6/6/2008 Phòng TC- KH sửa chữa điện thoại Buôn bán, 25/5/2013 Phòng TC- KH sửa chữa điện thoại 01S800152 06/11/201 Phòng TC- KH Buôn bán, sửa chữa điện http://www.lrc-tnu.edu.vn/ 58 MaKD30 Nguyễn Văn Đƣợc Đan Phƣợng - Hà Nội Cụm 12 Tân Lập Đan Phƣợng - Hà Nội thoại 03E800089 Buôn bán, 25/4/206 Phòng TC-KH sửa chữa điện thoại H3 = Dia_chi =” Thọ Xuân” AND card(H3)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H3 đƣợc thể bảng 3.4 nhƣ sau: Bảng 3.4: Bảng kết mảnh H3 MaNguoiK TenNguoiK DiaCh D MaKD14 MaKD15 MaKD16 MaKD17 MaKD18 D Trần Minh Quân Đào Ngọc Quân Trần Giang Nam Nguyễn Trung Dũng Hoàng Ngọc Hùng i Cụm – Thọ XuânĐan Phƣợng - Hà Nội Cụm – Thọ XuânĐan Phƣợng - Hà Nội Cụm – Thọ XuânĐan Phƣợng - Hà Nội Cụm – Thọ XuânĐan Phƣợng - Hà Nội Cụm – Thọ xuânĐan Phƣợng - Hà Nội Số hóa Trung tâm Học liệu - ĐHTN So_GP NgayCa CoQuanCa NganhNgh p p e 01S800107 09/12/201 Phòng TC - Đại lý KH Internet 01S800107 09/12/201 Phòng TC - Đại lý KH Internet 30/9/2009 Phòng TC- KH 03E800229 03E800254 26/12/200 01S800165 10/4/2013 Phòng TC- KH Phòng TC- KH Đại lý Internet Đại lý Internet Karaoke http://www.lrc-tnu.edu.vn/ 59 MaKD19 Trần Thị Loan MaKD20 Trần Thị Huế MaKD21 Đào Thị Hiên Cụm – Thọ XuânĐan Phƣợng - Hà Nội Cụm – Thọ XuânĐan Phƣợng - Hà Nội Cụm – Thọ XuânĐan Phƣợng - Hà Nội 018001366 10/7/2012 01S800030 07/01/201 1 01S800108 09/12/201 Phòng TC- KH Karaoke Phòng TC- KH Karaoke Phòng TC- KH Đại lý Internet Các bảng quan hệ thể mệnh đề phân mảnh ngang cho thuộc tính ngành nghề kinh doanh: H4 = Nganh_KD =” Đại lý Internet” AND card(H4)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H4 đƣợc thể bảng 3.5 nhƣ sau: Bảng 3.5: Bảng kết mảnh H4 MaNguoiK TenNguoiK DiaCh D D MaKD1 Nguyễn Viết Đại MaKD2 Nguyễn Văn Thịnh MaKD3 Nguyễn Tiến Ninh i Cụm 13 Tân Hội Đan Phƣợng - Hà Nội Tiên Tân Hồng Hà Đan Phƣợng - Hà Nội Cụm - Thọ An Đan Phƣợng - Hà Số hóa Trung tâm Học liệu - ĐHTN So_GP NgayCa CoQuanCa NganhNgh p p e 03E800195 19/2/2009 Phòng TC- KH Đại lý Internet 03E800116 29/10/200 Phòng TC- KH Đại lý Internet 03E800217 27/1/2010 Phòng TC- KH Đại lý Internet http://www.lrc-tnu.edu.vn/ 60 MaKD10 MaKD11 MaKD12 Nguyễn Thị Huyền Phạm Tuấn Cƣờng Phạm Mạnh Thắng MaKD13 Đào Kiên Định MaKD14 Trần Minh Quân MaKD15 Đào Ngọc Quân MaKD16 Trần Giang Nam MaKD17 Nguyễn Trung Dũng Nội Ích Vinh – Phƣơng Đình Đan Phƣợng – Hà Nội La ThạchPhƣơng ĐìnhĐan Phƣợng – Hà Nội Ích Vịnh – Phƣơng ĐìnhĐan Phƣợng – Hà Nội Ích Vịnh – Phƣơng ĐìnhĐan Phƣợng – Hà Nội Cụm – Thọ XuânĐan Phƣợng - Hà Nội Cụm – Thọ XuânĐan Phƣợng - Hà Nội Cụm – Thọ XuânĐan Phƣợng - Hà Nội Cụm – Thọ Xuân- Số hóa Trung tâm Học liệu - ĐHTN 01S800120 23/3/2012 01S800117 20/02/201 01S800075 30/6/2011 Phòng TC- KH Phòng TC- KH Phòng TC- KH Đại lý Internet Đại lý Internet Đại lý Internet Đại lý 01S800172 07/06/201 01S800107 09/12/201 Phòng TC KH Đại lý Internet 01S800107 09/12/201 Phòng TC KH Đại lý Internet 03E800229 30/9/2009 Phòng TC- KH Đại lý Internet 03E800254 26/12/200 Phòng TC- KH Phòng TC- KH Internet Đại lý Internet http://www.lrc-tnu.edu.vn/ 61 MaKD21 Đào Thị Hiên Đan Phƣợng - Hà Nội Cụm – Thọ XuânĐan Phƣợng Hà Nội 01S800108 09/12/201 Phòng TC- KH Đại lý Internet H5 = Nganh_KD=” Karaoke” AND card(H5)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H5 đƣợc thể bảng 3.6 nhƣ sau: Bảng 3.6: Bảng kết mảnh H5 MaNguoiK TenNguoiK DiaCh D MaKD4 MaKD5 MaKD6 MaKD18 MaKD19 D Nguyễn Khắc Nãi Nguyễn Minh Châu Nguyễn Vỹ Sơn Hoàng Ngọc Hùng Trần Thị Loan i Cụm - Tân Lập Đan Phƣợng - Hà Nội Phố Tây Sơn Thị trấn Phùng Đan Phƣợng – Hà Nội Cụm 13 Tân Hội Đan Phƣợng - Hà Nội Cụm – Thọ xuânĐan Phƣợng - Hà Nội Cụm – Thọ XuânĐan Phƣợng - Hà Số hóa Trung tâm Học liệu - ĐHTN So_GP 03E800219 NgayCa CoQuanCa NganhNgh p p e 13/7/2009 Phòng TC-KH Karaoke Phòng TC-KH Karaoke 10/7/2013 Phòng TC-KH Karaoke 10/4/2013 Phòng TC- KH Karaoke 10/7/2012 Phòng TC- KH Karaoke 03E800254 26/12/200 6 01S800174 01S800165 018001366 http://www.lrc-tnu.edu.vn/ 62 MaKD20 MaKD22 MaKD23 MaKD24 MaKD25 Trần Thị Huế Nguyễn Đức Trƣờng Nguyễn Đình Thái Nguyễn Văn Định Ngô Thế Tâm Nội Cụm - Thọ Xuân Đan Phƣợng - Hà Nội Cụm – Thọ AnĐan Phƣợng - Hà Nội Cụm - Tân Hội Đan Phƣợng - Hà Nội Cụm 2Tân Hội Đan Phƣợng - Hà Nội Cụm - Tân Hội Đan Phƣợng - Hà Nội 01S800030 07/01/201 1 03E800251 03E800219 03E800260 03E800219 Phòng TC- KH Karaoke 16/3/2010 Phòng TC- KH Karaoke 13/7/2009 Phòng TC-KH Karaoke 11/6/2010 Phòng TC-KH Karaoke 13/7/2009 Phòng TC-KH Karaoke H6 = Nganh_KD=” buôn bán sửa chữa điện thoại” AND card(H6)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H6 đƣợc thể bảng 3.7 nhƣ sau: Bảng 3.7: Bảng kết mảnh H6 Số giấ y STT Họ tên Địa phép đăng ký kinh doanh MaKD7 MaKD8 MaKD9 Ngày tháng năm cấ p Nguyễn Xuân Dân Cụm - Tân Hội - Đan Phƣợng - Hà Nội 03E800217 Nguyễn Quang Đoài Khê – Đan Phƣợng - Đan Phƣợng - Hà Nội 03E800050 29/10/200 Tháp Thƣợng Song Phƣợng - 03D800141 16/3/2006 Huy Nguyễn Đăng Số hóa Trung tâm Học liệu - ĐHTN 27/1/2010 Cơ quan cấ p PhòngTC-KH Ngành nghề kinh doanh Buôn bán, sửa chữa điện thoại Buôn bán, PhòngTC-KH sửa chữa điện thoại PhòngTC-KH Buôn bán, http://www.lrc-tnu.edu.vn/ 63 Đạt MaKD26 MaKD27 MaKD28 MaKD29 MaKD30 Đông Quốc Khánh Nguyễn Công Yên Bùi Thị Phóng Trần Ngọc Anh Nguyễn Văn Đƣợc Đan Phƣợng - Hà Nội Cụm – Tân HộiĐan Phƣợng - Hà Nội 03E800249 Cụm – Tân LậpĐan Phƣợng - Hà Nội 03E800164 Cụm – Tân LậpĐan Phƣợng - Hà Nội Cụm – Tân LậpĐan Phƣợng - Hà Nội Cụm 12 – Tân Lập- Đan Phƣợng - Hà Nội sửa chữa điện thoại 7 Buôn bán, 02/3/2010 PhòngTC-KH sửa chữa điện thoại Buôn bán, 6/6/2008 PhòngTC-KH sửa chữa điện thoại Buôn bán, 01S8001693 25/5/2013 PhòngTC-KH sửa chữa điện thoại 01S8001527 03E800089 06/11/201 Buôn bán, PhòngTC-KH sửa chữa điện thoại Buôn bán, 25/4/206 PhòngTC-KH sửa chữa điện thoại Các bảng quan hệ thể mệnh đề phân mảnh ngang cho thuộc tính ngành nghề kinh doanh thuộc tính địa chỉ: H7=Dia_chi =” Thọ Xuân” AND Nganh_KD =” Đại lý Internet” AND card(H3)>=2 (Dang_Ky_KD) Bảng kết thể cho mảnh H7 đƣợc thể bảng 3.8 nhƣ sau: Bảng 3.8: Bảng kết mảnh H7 STT Họ tên MaKD14 Trần Minh Quân MaKD15 Đào Ngọc Quân MaKD16 Trần Giang Nam MaKD17 Nguyễn Trung Dũng MaKD21 Đào Thị Hiên Địa Cụm – Thọ Xuân- Đan Phƣợng - Hà Nội Cụm – Thọ Xuân- Đan Phƣợng - Hà Nội Cụm – Thọ Xuân- Đan Phƣợng - Hà Nội Cụm – Thọ Xuân- Đan Phƣợng - Hà Nội Cụm – Thọ Xuân- Đan Phƣợng - Hà Nội Số hóa Trung tâm Học liệu - ĐHTN Số giấ y phép đăng ký kinh doanh Ngày tháng năm cấ p Cơ quan cấ p Ngành nghề kinh doanh 01S800107 09/12/201 PhòngTC-KH Đại lý Internet 01S800107 09/12/201 PhòngTC-KH Đại lý Internet 03E800229 30/9/2009 PhòngTC-KH Đại lý Internet 03E800254 26/12/200 PhòngTC-KH Đại lý Internet 01S800108 09/12/201 PhòngTC-KH Đại lý Internet http://www.lrc-tnu.edu.vn/ 64 3.3 Gộp nhóm giá trị lặp thuộc tính mảnh ngang Sau trình thực ví dụ tìm tập tất mệnh đề phân mảnh ngang có thỏa mãn điều kiện phân mảnh ta tiến hành thực nghiệm với chƣơng trình Chƣơng trình thử nghiệm đƣợc thực môi trƣờng visual studio 2013 SQL 2008 Giao diện ban đầu chƣơng trình đƣợc thể hình 3.1: Hình 3.1: Giao diện ban đầu chƣơng trình Giao diện chƣơng trình đƣợc chia thành phần nhƣ sau: - Phần chọn hiển thị liệu sở liệu đầu vào - Phần thực phân mảnh với số lƣợng giá trị lặp lại hiển thị - Phần gán định danh cho mảnh tìm đƣợc Sau đó, bƣớc ta cần tiến hành chọn sở liệu muốn phân mảnh giá trị lặp lại Để thực trình này, ta tiến hành chọn vào button “chonDB” Sau chọn button ta thu đƣợc giao diện đƣợc thể hình 3.2: Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 65 Hình 3.2: Giao diện sau trình chọn button “chonDB” Trong bảng “ChonDB” ta tiến hành chọn sở liệu bảng quan hệ muốn tiến hành phân mảnh Trong chƣơng trình này, tiến hành phân mảnh cho bảng quan hệ đơn lẻ Để tiến hành cho bảng quan hệ khác sở liệu ta tiến hành chạy lần lƣợt bảng quan hệ Sau chọn đƣợc bảng quan hệ, chƣơng trình hiển thị liệu bảng đƣợc chọn hình (hình 3.3) Hình 3.3: Giao diện sau chọn lựa xong bảng quan hệ Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 66 Sau trình chọn lựa bảng quan hệ, chƣơng trình cho phép ta lựa chọn thuộc tính khóa mà ta muốn tiến hành phân mảnh ngang giá trị lặp Giao diện trình chọn thuộc tính đƣợc thể qua hình 3.4: Hình 3.4: Giao diện trình chọn thuộc tính lặp Sau chọn tập thuộc tính ta tiến hành điền giá trị ràng buộc số lƣợng ghi có giá trị lặp lại nhỏ (mặc định 3) Sau đó, chọn button “Thực phân mảnh” để tiến hành phân mảnh ngang Kết thu đƣợc tập mảnh ngang định danh chúng đƣợc thể hình 3.5: Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 67 Hình 3.5: Kết trình phân mảnh ngang Sau đó, ta lựa chọn hiển thị bảng liệu mảnh liệu (hình 3.6) Hình 3.6: Giao diện liệu mảnh ngang 3.4 Kết luận chƣơng Trong chƣơng này, luân văn trình bày trình tiến thành ứng dụng lý thuyết chƣơng vào toán ứng dụng thực tế huyện Đan Phƣợng Chƣơng trình bày số vấn đề sau: - Thiết kế xây dựng sở liệu quan hệ kinh doanh huyện Đan Phƣợng - Đƣa mệnh đề giá trị lặp thuộc tính với tiêu chí xác định cho toán phân mảnh hỗn hợp - Tiến hành gộp nhóm gán nhãn tƣơng ứng cho liệu đƣợc phân mảnh - Các giao diện toán đƣợc thể tròng phần Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 68 KẾT LUẬN Với kiến thức lĩnh vực sở liệu phân tán nhiều hạn chế, luận văn tìm hiểu đƣợc số vấn đề đƣợc đặt từ hệ thống sở liệu phân tán Tuy nhiên, luận văn giải đƣợc số vấn đề sau: - Chƣơng 1: Luận văn trình bày kiến thức mệnh đề logic mệnh đề - Chƣơng 2: Luận văn tiến hành tìm hiểu nội dung liên quan đến giá trị lặp lại thuộc tính nhƣ định nghĩa, miền giá trị chúng Đồng thời tìm hiểu vấn đề mệnh đề phân mảnh, tiêu chuẩn gộp nhóm giữ lại nhóm nhƣ tiến hành gán nhãn cho giá trị thu đƣợc - Chƣơng 3: Luận văn tiến hành cài đặt thực nghiệm chƣơng trình ứng dụng thực tế sở liệu kinh doanh huyện Đan Phƣợng Chƣơng trình bày bƣớc từ trình khảo sát đến xây dựng sở liệu thử nghiệm cuối giao diện kết sau trình thử nghiệm Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 69 HƢỚNG PHÁT TRIỂN CỦA ĐỀ TÀI - Tiến hành thử nghiệm hệ thống với sở liệu khác đƣa đánh giá cụ thể - Tiến hành cài đặt thêm chức đánh giá trình phân mảnh - Cấp phát mảnh đƣợc phân mảnh đến nút mạng Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 70 TÀI LIỆU THAM KHẢO [1] Đoàn Văn Ban, Nguyễn Mậu Hân (2006), Xử lý song song phân tán, NXB Khoa học kỹ thuật [2] Đỗ Xuân Lôi (1996), Cấu trúc liệu giải thuật, NXB Khoa học Kỹ thuật [3] Lê Huy Thập (2010), Cơ sở lý thuyết song song, NXB Thông tin truyền thông [4]Lê Huy Thập (2008), Giáo trình Kỹ thuất lập trình, Tập 1, NXB Khoa học tự nhiên công nghệ [5]Lê Tiến Vƣơng (2000), Nhập môn CSDL quan hệ, NXB Thống Kê [6]Barry Wlkingson, Michael Allen (1999), Parallel Programming, Technique and Applications Using Netwworked Workstations and Parallel Computers, Prentice Hall New Jersey [7]Japan Information Processing Development Corporation, Central Academy of Information Technology (1978), Internal Design And Programming [8]Kenneth H.Rosen, Toán rời rạc ứng dụng tin học, NXB Khoa học Kỹ thuật [9]Seyed H Roo (1999), Parallel processing and Parallel Algorithms, Theory and Coputation [10]Robert Sedgewick (2001), Cẩm nang thuật toán Vol.1 and vol.2, NXB Khoa học Kỹ thuật [11]M.Tamer Ozsu, Patrick Valduriez (1999), Nguyên lý hệ liệu phân tán, Trần Đức Quang biên dịch, NXB Thống kê Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ [...]... miền giá trị của khóa K Di = Dom(Ai) là miền giá trị của thuộc tính Ai ( i  1, n ) 2.1.2 Các giá trị lặp trong miền giá trị của thuộc tính Định nghĩa giá trị lặp Cho quan hệ R(Key, A1,A2, ,An), trong đó Key là tập thuộc tính khóa có miền giá trị DK; A = {Aj} là tập các thuộc tính không khoá có miền giá trị tương ứng Dj (j = 1, ,n) Nếu giá trị x xuất hiện nhiều lần trong miền giá trị của thuộc tính Dj... lấy các giá trị lặp Các mảnh có giá trị lặp lại với kích cỡ đủ lớn sẽ làm giảm chi phí khi truy cập/truy xuất, giảm chi phí lƣu trữ, tăng tốc độ xử lý dữ liệu và giảm chi phí truyền thông 2 Đối tƣợng và phạm vi nghiên cứu Cơ sở dữ liệu phân tán, các loại mảnh và phƣơng pháp phân mảnh trong CSDL phân tán 3 Hƣớng nghiên cứu của đề tài Phân mảnh các giá trị lặp của các thuộc tính bằng phƣơng pháp phân mảnh. .. lá và các mảnh trung gian là đầy đủ Tƣơng tự, có thể kiểm tra tính tách biệt của chiến lƣợc phân mảnh hỗn hợp Tính tách biệt đƣợc đảm bảo khi các mảnh lá và mảnh trung gian cũng tách biệt Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 18 CHƢƠNG 2: CÁC THUẬT TOÁN PHÂN MẢNH THEO CÁC GIÁ TRỊ LẶP CỦA CÁC THUỘC TÍNH TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN Một mảnh ngang, dọc hay hỗn hợp đều là các quan... trên bằng cách đƣa ra các thuật toán để tách các bản ghi và các thuộc tính có các giá trị lặp lại với kích cỡ đủ lớn Việc tách ở đây thực sự là việc phân mảnh “hỗn hợp” các quan hệ trong cơ sở dữ liệu phân tán Mảnh có các giá trị lặp lại với kích cỡ đủ lớn đƣợc gán bí danh, phần còn lại cũng chính là các mảnh Khi cần cập nhật, chỉ cần tái thiết lại mảnh ban đầu từ các mảnh đã phân rã và tham chiếu... phải chứng minh 1.2 Cơ sở dữ liệu phân tán CSDL phân tán (Distributed Database System – DDBS) là một tập hợp dữ liệu có liên đới logic và đƣợc phân bố trên các nút của một mạng máy tính Phần lớn các hệ cơ sở dữ liệu phân tán đƣợc thiết kế theo hƣớng từ trên xuống (Top-Down) Thiết kế phân mảnh dữ liệu là công việc đầu tiên phải thực hiện Mục đích của việc phân mảnh dữ liệu là tạo ra các đơn vị cấp phát... iii/ Giá trị lặp đa miền thuộc tính : (ChucVu , ThoiGianLV) Bảng 2.1.7 Giá trị lặp (ChucVu , ThoiGianLV) Bộ t MaNV MaDuAn ChucVu ThoiGianLV t2 NV2 DA1 Phân tích và thiết kế 24 t3 NV2 DA2 Phân tích và thiết kế 24 2.2 Các thuật toán phân mảnh theo các giá trị lặp của các thuộc tính 2.2.1 Thuật toán phân mảnh dọc Phân mảnh dọc một quan hệ R sinh ra các mảnh V1, V2,…, Vd Mỗi mảnh con chứa một tập con thuộc. .. Nghiên cứu kỹ các kiến thức, chủ đề có liên quan đến đề tài Nắm vững các các thuật toán 6 Ý nghĩa khoa học của đề tài Luận văn giúp cho việc tìm mảnh các dữ liệu trùng nhau, phân mảnh và gán nhãn cho chúng nhằm tăng tốc độ truy nhập, giảm chi phí lƣu trữ và truyền trên mạng truyền dẫn - Chƣơng 1: Cơ sở lý thuyết - Chƣơng 2: Gộp nhóm các giá trị lặp của các thuộc tính trong cơ sở dữ liệu phân tán - Chƣơng... đƣợc phân mảnh ngang với BUGGET > 200 PNO PNAME BUDGET P3 Thƣ ký 250 P4 Giám đốc 310 Các quy tắc phân mảnh Ta phải tuân thủ ba qui tắc khi phân mảnh cơ sở dữ liệu quan hệ 1 Tính đầy đủ: Quan hệ R đƣợc phân rã thành các mảnh R 1, R2…Rn, thì mỗi mục dữ liệu có trong quan hệ R sẽ đƣợc chứa trong ít nhất một mảnh R i (i=1, ,n) Quy tắc này đảm bảo cho các mục dữ liệu trong R đƣợc ánh xạ hoàn toàn vào các mảnh. .. khác nhau 3 Tính tách biệt: Nếu quan hệ R đƣợc phân rã ngang thành các mảnh R i, i=1, n và mụcdữ liệu di nằm trong một mảnh Ri thì nó sẽ không nằm trong mảnh Rk, (k≠j) Quy tắc này đảm bảo các mảnh phân rã rời nhau Trong trƣờng hợp phân mảnh dọc, khóa chính của quan hệ phải đƣợc lập lại trong tất cả các mảnh Vì vậy tính tách biệt trong phân mảnh dọc đƣợc hiểu không liên quan gì đến khóa chính của quan... con của một quan hệ hay của một số quan hệ (trong phép hợp, trong phép nối,…) tham gia vào câu vấn tin, vì vậy ta sẽ gọi chung là quan hệ 2.1 Miền giá trị thuộc tính và khái niệm giá trị lặp của thuộc tính 2.1.1 Miền giá trị của thuộc tính Cho lƣợc đồ quan hệ R(K, A1,A2,…,An), trong đó K là khóa chính còn A1,A2,…,An là các thuộc tính không khóa Ký hiệu D = (Dk, D1, D2, …, Dn) Với DK = Dom(K) là miền giá ... 2: CÁC THUẬT TOÁN PHÂN MẢNH THEO CÁC GIÁ TRỊ LẶP CỦA CÁC THUỘC TÍNH TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN 18 2.1 Miền giá trị thuộc tính khái niệm giá trị lặp thuộc tính 18 2.1.2 Các giá trị lặp. .. Nguyễn Anh Dũng GỘP NHÓM CÁC GIÁ TRỊ LẶP CỦA CÁC THUỘC TÍNH TRONG CÁC MẢNH CỦA CƠ SỞ DỮ LIỆU PHÂN TÁN Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH GV hƣớng... miền giá trị thuộc tính 18 2.2 Các thuật toán phân mảnh theo giá trị lặp thuộc tính 21 2.2.1 Thuật toán phân mảnh dọc 21 2.2.2 Thuật toán phân mảnh ngang theo giá trị lặp gộp nhóm

Ngày đăng: 23/12/2015, 16:07

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan