Tối ưu hóa truy vấn trên cơ sở dữ liệu phân tán

26 225 0
Tối ưu hóa truy vấn trên cơ sở dữ liệu phân tán

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Header Page of 126 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN VĂN DŨNG TỐI ƯU HÓA TRUY VẤN TRÊN CƠ SỞ DỮ LIỆU PHÂN TÁN Chuyên ngành : Khoa học máy tính Mã số : 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2012 Footer Page of 126 Header Page of 126 Công trình hoàn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TSKH TRẦN QUỐC CHIẾN Phản biện : PGS.TS PHAN HUY KHÁNH Phản biện : GS.TS NGUYỄN THANH THỦY Luận văn bảo vệ Hội đồng chấm Luận văn tốt nghiệp thạc sĩ kỹ thuật họp Đại học Đà Nẵng vào ngày tháng năm 2012 Có thể tìm hiểu luận văn tại: - Trung tâm Thông tin - Học liệu, Đại học Đà Nẵng; - Trung tâm Học liệu, Đại học Đà Nẵng; Footer Page of 126 Header Page of 126 MỞ ĐẦU Lý chọn đề tài Khi thực thi truy vấn, có nhiều phương án mà hệ thống sở liệu (CSDL) cho phép xử lý sản sinh câu trả lời Các phương án có kết cuối tương đương kết tính toán khác chi phí thực hiện, lựa chọn phương án để có tổng chi phí thực nhỏ nhất? Khi truy vấn sở trình học hay thử nghiệm với liệu nhỏ không quan tâm nhiều đến vấn đề này, liệu lên tới cỡ triệu ghi vấn đề thời gian trả kết truy vấn lại vấn đề lớn cần có giải pháp hiệu Với sở liệu ngày đồ sộ, lưu trữ phân tán việc vấn tin vấn đề thường xuyên, để tạo hoạch định thực thi vấn tin nhằm hạ thấp tối đa chi phí việc tối ưu câu vấn tin vấn đề mà phải quan tâm Từ nhận thấy vấn đề tối ưu hoá truy vấn phân tán cấp thiết hệ quản trị CSDL Mục đích nghiên cứu Đề tài phân tích, tổng hợp, bình luận trình bày cách có hệ thống nghiên cứu sở liệu quan hệ, hệ tin học phân tán, cách thiết kế sở liệu phân tán, sở ứng dụng truy vấn để đưa phương pháp thiết kế, tối ưu chọn lọc chiến lược thực thi truy vấn hiệu Đối tƣợng phạm vi nghiên cứu Tối ưu hóa truy vấn CSDL phân tán có ý nghĩa to lớn việc cải thiện tốc độ truy xuất, tìm kiếm thông tin, có nhiều phương án để đưa kết nghiên cứu phương án tốn chi phí vấn đề nhiều người quan tâm Footer Page of 126 Header Page of 126 Đối tượng nghiên cứu câu truy vấn SQL cho CSDL tập trung, tối ưu hóa câu truy vấn để sinh mảnh vị trí khác nhằm tối ưu hóa chi phí thực Đối tượng nghiên cứu thuộc phạm vi nghiên cứu lý thuyết tối ưu hóa, ứng dụng lĩnh vực giáo dục, đào tạo chủ yếu Phƣơng pháp nghiên cứu Phương pháp nghiên cứu tài liệu, nghiên lý thuyết truy vấn, chi phí trình truy vấn, có xây dựng ứng dụng mô yêu cầu vấn đề cần nghiên cứu Ý nghĩa khoa học thực tiễn đề tài Việc tối ưu hóa truy vấn sở liệu phân tán giúp cho việc nghiên cứu, khai thác ứng dụng hệ thống phân tán, chủ yếu qua môi trường mạng thuận lợi phát triển Bố cục luận văn Toàn nội dung luận văn chia thành chương sau: Chƣơng Cơ sở lý thuyết Chương trình bày nội dung lý thuyết hệ quản trị sở liệu, mô hình sở liệu, ngôn ngữ đại số quan hệ số khái niệm hệ tin học phân tán Chƣơng Thiết kế tối ƣu hóa truy vấn phân tán Chương trình bày nội dung lý thuyết để thiết kế sở liệu phân tán mục tiêu, chiến lược số vấn đề thiết kế, phân mảnh, cấp phát cho mảnh Đồng thời chương trình bày nguyên tắc tối ưu hóa, mô hình thuật toán tối ưu hóa Footer Page of 126 Header Page of 126 Chƣơng Xây dựng hệ thống quản lý nhân viên Chương xây dựng hệ thống quản lý nhân viên, từ đưa ứng dụng truy vấn để xác định việc phân mảnh, cấp phát phân mảnh thành lập liệu phân tán, quyền truy cập vào sở liệu CHƢƠNG CƠ SỞ LÝ THUYẾT 1.1 HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU 1.1.1 Cơ sở liệu 1.1.2 Hệ quản trị CSDL - Hệ quản trị CSDL hệ thống phần mềm có chức tạo lập quản trị CSDL cập nhật, thêm, sửa, xóa, xếp, tìm kiếm, thống kê quản lý truy cập người sử dụng đến sở liệu - Hệ quản trị CSDL phân tán hệ thống phần mềm, cho phép quản lý hệ CSDL phân tán làm cho việc phân tán trở nên vô hình người sử dụng 1.1.3 Mô hình liệu quan hệ 1.1.4 Ngôn ngữ đại số quan hệ 1.1.4.1 Phép hợp (Union) 1.1.4.2 Phép giao (Intersection) 1.1.4.3 Phép hiệu (Minus) 1.1.4.4 Phép chiếu (Projection) Cho quan hệ r xác định tập thuộc tính U={A1,A2, ,An} Tập thuộc tính X U Phép chiếu quan hệ r lên tập thuộc tính X, Footer Page of 126 Header Page of 126 ký hiệu x(r) kết quan hệ xác định tập thuộc tính X gồm lấy từ quan hệ r có giá trị tập thuộc tính X Biểu diễn hình thức phép chiếu sau: x(r)={t[X]| t r} Nhận xét: phép chiếu thực chất phép loại bỏ số cột quan hệ giữ lại cột lại quan hệ 1.1.4.5 Phép tích Đề (Descartes) Cho quan hệ r xác định tập thuộc tính U={A1,A2, ,An} quan hệ s xác định tập thuộc tính V={B1,B2, ,Bm} Tích Đề hai quan hệ r s, ký hiệu r s quan hệ xác định tập thuộc tính U V ={ A1,A2, ,An, B1,B2, ,Bm) biểu diễn sau: r s = {(t,u)| t r u s} 1.1.4.6 Phép chọn (Selection) Cho quan hệ r xác định tập thuộc tính U={A1,A2, ,An} Phép chọn từ quan hệ r t thỏa mãn biểu thức chọn F quan hệ xác định U biểu diễn hình thức sau: F(r)={t| t r F(t) đúng} Trong đó, F(t) hiểu giá trị cuả thuộc tính xuất biểu thức s t trả giá trị 1.1.4.7 Phép kết nối (Join) 1.2 HỆ PHÂN TÁN 1.2.1 Đặc trƣng hệ phân tán - Hệ tin học phân tán hệ không chia sẻ nhớ đồng hồ Footer Page of 126 Header Page of 126 - Phân tán hóa trình xử lý thực công việc trạm xa - Thời hạn truyền thông tin hệ không giống nhau, thông điệp bị trình chuyển tải, thông điệp truyền kép hệ thống rơi vào cố - Một trạm bị cố không ảnh hưởng đến hệ thống, công việc phân cho trạm khác 1.2.2 Tính chất hệ phân tán 1.2.2.1 Tính suốt 1.2.2.2 Tính hiệu 1.2.2.3 Tính mềm dẻo 1.2.2.4 Tính phù hợp 1.2.2.5 Tính bền vững 1.2.2.6 Tính mở 1.2.2.7 Tính song song 1.2.3 Các điểm mạnh hệ tin học phân tán - Cơ chế tí nh toán phân tán hỗ trợ truy cập các dữ liệu được lưu ở nhiều nơi - Nhờ chế nhân bản nên người dùng chỉ cần truy cập cục bộ lấy thông tin từ trung tâm xa - Nếu không truy cập liệu vị trí , có thể thử ở nơi khác - Dữ liệu phân tán đòi hỏi phải được nhân bản và đồng bộ hóa cao thông qua các mối liên kết mạng , điều làm cho việc quản trị giám sát phức tạp Footer Page of 126 Header Page of 126 - Hệ phân tán được xây dựng giao thức TCP /IP và kỹ thuật Web cùng với các ứng dụng trung gian (middleware) thúc đẩy việc tính toán phân tán 1.2.4 Các mô hình ứng dụng Phân tán 1.2.4.1 Phân tán mạng cục 1.2.4.2 Phân tán mạng diện rộng CHƢƠNG THIẾT KẾ VÀ TỐI ƢU HÓA TRUY VẤN PHÂN TÁN 2.1 THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN Thiết kế hệ thống phân tán cần phải chọn vị trí đặt liệu chương trình mạng máy tính Đối với hệ quản trị CSDL phân tán, việc phân tán ứng dụng đòi hỏi hai điều: phân tán hệ quản trị CSDL phân tán chương trình ứng dụng chạy hệ quản trị 2.1.1 Các mục tiêu thiết kế phân tán liệu − Tính cục xử lý − Tính sẵn sàng độ tin cậy liệu phân tán − Điều phối tải làm việc − Các chi phí lưu trữ khả lưu trữ có sẵn Footer Page of 126 Header Page of 126 2.1.2 Các chiến lƣợc thiết kế 2.1.2.1 Quá trình thiết kế từ xuống (top-down) Phân tích yêu cầu Yêu cầu hệ thống Thiết kế khái niệm Từ người dùng Thiết kế khung nhìn Tổng hợp khung nhìn Lược đồ khái niệm toàn cục Thông tin truy xuất Định nghĩa lược đồ Thiết kế phân tán Từ người dùng Lược đồ khái niệm cục Thiết kế vật lý Lược đồ vật lý Phản hồi Theo dõi Bảo trì Hình 1.1 Quá trình thiết kế Top-Down Footer Page of 126 Phản hồi Header Page 10 of 126 Thiết kế khung nhìn có nhiệm vụ định nghĩa giao diện cho người sử dụng cuối Thiết kế khái niệm trình xem xét tổng thể nhằm xác định loại thực thể mối liên hệ thực thể Lược đồ khái niệm toàn cục thông tin kiểm mẫu truy xuất thu thiết kế khung nhìn đầu vào cho bước thiết kế phân tán Mục tiêu giai đoạn thiết kế lược đồ khái niệm cục cách phân tán thực thể cho vị trí hệ thống phân tán Thiết kế phân tán gồm có hai bước: phân mảnh cấp phát Bước cuối thiết kế vật lý, bước ánh xạ lược đồ khái niệm cục sang thiết bị lưu trữ vật lý có sẵn vị trí tương ứng Đầu vào cho trình lược đồ khái niệm cục va thông tin kiểu mẫu truy xuất mảnh 2.1.2.2 Quá trình thiết kế từ lên Quá trình thích hợp với CSDL thiết kế từ đầu Tuy nhiên hay gặp thực tế có sẵn số CSDL, nhiệm vụ thiết kế phải tích hợp chúng thành CSDL 2.1.3 Các vấn đề thiết kế phân tán 2.1.3.1 Các lý phân mảnh − Trước tiên, khung nhìn ứng dụng thường tập quan hệ; − Thứ hai ứng dụng có khung nhìn định nghĩa quan hệ cho trước lại nằm vị trí khác có hai cách chọn lựa với đơn vị phân tán toàn quan hệ, quan hệ không nhân mà lưu vị trí Footer Page 10 of 126 Header Page 12 of 126 10 2.1.3.6 Các yêu cầu thông tin Các thông tin cần cho thiết kế phân tán phân chia thành bốn loại: thông tin CSDL, thông tin ứng dụng, thông tin mạng thông tin hệ thống máy tính 2.1.4 Phƣơng pháp phân mảnh Thiết kế phân mảnh bao gồm công việc nhóm trường hợp phân mảnh ngang hay nhóm thuộc tính trường hợp phân đoạn dọc có đặc tính theo quan điểm cấp phát 2.1.4.1 Phân mảnh ngang Phân mảnh ngang chia quan hệ theo Vì mảnh tập quan hệ Có hai loại phân mảnh ngang: phân mảnh ngang nguyên thuỷ phân mảng ngang dẫn xuất 2.1.4.2 Phân mảnh dọc Một phân mảnh dọc cho quan hệ r sinh mảnh r1, r2, , rn, mảnh chứa tập thuộc tính R khoá r Mục đích phân mảnh dọc phân hoạch quan hệ thành tập quan hệ nhỏ để nhiều ứng dụng chạy quan hệ 2.1.4.2 Phân mảnh hỗn hợp − Phân mảnh ngang cho mảnh phân chia theo chiều dọc − Phân mảnh dọc cho mảnh phân chia theo chiều ngang 2.1.5 Cấp phát cho mảnh Trong công việc cấp phát cho mảnh, quan trọng phân biệt thiết kế cấp phát cho mảnh dư thừa hay không dư thừa, cách dễ hướng “phù hợp nhất”: tiêu chuẩn vị trí kết hợp với khả cấp phát cho mảnh Footer Page 12 of 126 Header Page 13 of 126 11 2.2 TỐI ƢU HÓA TRUY VẤN 2.2.1 Nguyên tắc tối ƣu hoá − Ưu tiên thực phép chiếu chọn; − Trước phải thực phép tích Đề các, tìm chiến lược truy nhập tốt vào CSDL; − Thực phép kết nối cân chi phí rẻ nhiều so với chi phí thực phép tích Đề các; − Nhóm phép toán chọn chiếu liên tiếp thành phép toán nhất; − Nhóm phép tích chiếu liên tiếp thành phép toán Trong thi thực phép tích giới hạn chi phí thực phép chiếu; − Tìm biểu thức chung biểu thức; − Đánh giá sơ trước thực truy vấn 2.2.2 Tối ƣu hoá biểu thức đại số quan hệ 2.2.2.1 Biểu thức quan hệ Biểu thức quan hệ biểu thức mà toán hạng quan hệ CSDL phép toán phép toán đại số quan hệ Mỗi biểu thức quan hệ thông thường truy vấn người sử dụng 2.2.2.2 Biến đổi biểu thức quan hệ Hai biểu thức đại số quan hệ gọi tương đương mô hình liệu bất kỳ, hai biểu thức tạo hai quan hệ có tập liệu giống Footer Page 13 of 126 Header Page 14 of 126 12 2.2.2.3 Các quy tắc tương đương Hai bỉểu thức tương đương thay biểu thức dạng thứ biểu thức dạng thứ hai, ngược lại ta thay biểu thức dạng thứ hai biểu thức dạng thứ hai biểu thức tạo kết giống hệ CSDL Các quy tắc sau sử dụng để biến đổi biểu thức tương đương với 2.2.3 Mô hình tối ƣu hóa môi trƣờng phân tán 2.2.3.1 Mô hình tối ưu hóa môi trường tập trung Câu truy vấn pháp Kiểm tra ngữ pháp Kiểm tra hợp lệ Truy vấn SQL hợp lệ Truy vấn đại số quan hệ vấn đại số quan hệ tối ưu hoạch thực Tạo sinh mã Footer Page 14 of 126 Truy vấn ngữ Dịch truy vấn Tối ưu hóa đại số quan hệ Chọn chiến lược tối ưu Mã truy vấn Truy Kế Header Page 15 of 126 13 2.2.3.2 Mô hình tối ưu hóa môi trường phân tán Vấn tin dạng phép tính quan hệ phân tán PHÂN RÃ VẤN TIN Lược đồ toàn cục Vấn tin dạng đại số quan hệ phân tán CỤC BỘ HÓA DỮ LIỆU Lược đồ mảnh Vấn tin theo mảnh TỐI ƯU HÓA TOÀN CỤC Số liệu mảnh Vấn tin theo mảnh tối ƣu TỐI ƯU HÓA CỤC BỘ Lược đồ cục Vấn tin cục tối ƣu Hình 2.1 Mô hình tối ƣu hóa truy vấn phân tán 2.2.4 Chi phí Total cost= CPU cost + I/O cost + communication cost CPU cost= unit instruction cost * no.of instructions I/O cost = unit disk I/O cost * no of disk I/Os communication cost = message initiation + transmission Trong đó: Footer Page 15 of 126 Header Page 16 of 126 14 Total cost : Tổng chi phí CPU cost : Chi phí CPU communication cost : Chi phí truyền thông unit instruction cost : Chi phí đơn vị lệnh no.of instructions : Số câu lệnh unit disk I/O cost : Chi phí đơn vị vào no of disk I/Os : Kích thước truy xuất vào message initiation : Khởi tạo thông điệp transmission : Truyền thông đĩa 2.2.5 Các thuật toán 2.2.5.1 Thuật toán D-Ingres Hàm mục tiêu thuật toán làm giảm thiểu cho phí tổ hợp thời gian truyền tin thời gian đáp ứng, nhiên hai mục tiêu xung khắc với nhau, thuật toán tối ưu hóa vấn tin bỏ qua chi phí truyền liệu đến vị trí nhận kết Thuật toán tận dụng phân mảnh đơn giản xét phân mảnh ngang Đầu vào cho thuật toán xử lý vấn tin câu vấn tin diễn tả phép tính quan hệ (ở dạng chuẩn hội) thông tin lược đồ (kiểu mạng, vị trí kích thước mảnh) 2.2.5.2 Thuật toán System R* Đầu vào cho thuật toán câu vấn tin cục hóa diễn tả vấn tin, vị trí quan hệ số liệu thống kê chúng Footer Page 16 of 126 Header Page 17 of 126 15 Đầu chiến lược có chi phí nhỏ 2.2.5.3 Thuật toán SDD-1 Đầu vào cho thuật toán gồm có đồ thị vấn tin m vị trí quan hệ số liệu thống kê quan hệ Sau hoàn tất xử lý cục ban đầu, giải pháp khả thi ban đầu chọn ra, lịch biểu thực thi toàn cục (global execution schedule) có chứa tát truyền thông vị trí Kết có từ việc tính chi phí thấp CHƢƠNG XÂY DỰNG HỆ THỐNG QUẢN LÝ NHÂN VIÊN 3.1 PHÁT BIỂU BÀI TOÁN Để áp dụng lý thuyết nghiên cứu áp dụng vào việc Tin học hoá quản lý hành Nhà nước Sở Khoa học Công nghệ Bình Định, chọn hướng phát triển quản lý nhân 3.2 PHÂN TÍCH HỆ THỐNG CSDL 3.2.1 Các đối tƣợng tham gia vào hệ thống Ban giám đốc; Phòng Tổ chức; Phòng Tài vụ; Các Trung tâm trực thuộc; Cán bộ, nhân viên 3.2.2 Yêu cầu chức hệ thống − Cập nhật hồ sơ nhân viên; − Cập nhật biến động trình công tác nhân viên; − Phân tích báo cáo tình hình nhân sự; − Tìm kiếm, tra cứu thông tin nhân theo tiêu chí đó; − Phân cấp hệ thống Footer Page 17 of 126 Header Page 18 of 126 16 3.2.3 Xây dựng thực thể quan hệ thực thể 3.2.4 Mô hình sở liệu quan hệ Hình 3.13 Mô hình quan hệ 3.2.5 Phát biểu, phân tích ứng dụng 3.2.5.1 Ví dụ Xét câu truy vấn sau: “ Hãy cho biết Ngày vào quan nhân viên có mã 24” Câu SQL sau: SELECT FROM NgayVaoCCQ NHANVIEN Footer Page 18 of 126 Header Page 19 of 126 WHERE 17 (MaNV = '24') Biểu thức đại số quan hệ: NgayVaoCQ( MaNV = '24'(NHANVIEN)) 3.2.5.2 Ví dụ Xét câu truy vấn sau: “ Hãy cho biết tên nhân viên giữ chức vụ Phó Phòng?” Câu SQL sau: SELECT NHANVIEN.HoTenNV FROM QTCHUCVU, NHANVIEN WHERE (QTCHUCVU.MaCV = 'PP') AND (QTCHUCVU.DangGiuChuc = ‘TRUE’)AND (QTCHUCVU.MaNV = NHANVIEN.MaNV) Biểu thức đại số quan hệ sau: HoTenNV( (MaCV = 'PP') (DangGiuChuc='TRUE') (QTCHUCVU.MaNV = NHANVIEN.MaNV) (QTCHUCVU*NHANVIEN)) Trước tiên tính tích Đề-các hai quan hệ QTCHUCVU NHANVIEN, sau chọn thỏa mãn điều kiện (MaCV = 'PP') (DangGiuChuc='TRUE') (QTCHUCVU.MaNV = NHANVIEN.MaNV) cuối sử dụng phép chiếu để lấy HoTenNV Áp dụng phép biến đổi tương đương (phép giao hoán phép chọn phép Đề các), có biểu thức đại số quan hệ cho câu truy vấn mới: HoTenNV( (MaCV = 'PP') (DangGiuChuc='TRUE') (QTCHUCVU)NHANVIEN) Với câu truy vấn loại bỏ đáng kể không thỏa mãn yêu cầu tích Đề-các, mà chọn theo yêu Footer Page 19 of 126 Header Page 20 of 126 18 cầu sau nối tự nhiên với quan hệ NHANVIEN Câu truy vấn tối ưu sau: SELECT FROM NHANVIEN.HoTenNV QTCHUCVU INNER JOIN NHANVIEN ON QTCHUCVU.MaNV = NHANVIEN.MaNV WHERE (QTCHUCVU.MaCV = 'PP')AND (QTCHUCVU.DangGiuChuc = 'TRUE') 3.2.5.3 Ví dụ Cho biết Họ tên nhân viên có phụ cấp chức vụ 0.3? Câu truy vấn SQL sau: SELECT NHANVIEN.HoTenNV FROM NHANVIEN, QTCHUCVU, CHUCVU WHERE(CHUCVU.PCCV= 0.3) AND (QTCHUCVU.DangGiuChuc = ‘TRUE’) AND (CHUCVU.MaCV = QTCHUCVU.MaCV) AND (QTCHUCVU.MaNV = NHANVIEN.MaNV) Với câu truy vấn trên, mệnh đề WHERE dạng chuyển hội (CHUCVU.PCCV= 0.3) AND (QTCHUCVU.DangGiuChuc = ‘TRUE’) AND (CHUCVU.MaCV = QTCHUCVU.MaCV) AND (QTCHUCVU.MaNV = NHANVIEN.MaNV) Hệ thống thực tích Đề-Các quan hệ NHANVIEN, QTCHUCVU, CHUCVU sau chọn thỏa mãn điều kiện Biểu thức đại số quan hệ sau: Footer Page 20 of 126 Header Page 21 of 126 HoTenNV( (PCCV = 0.3) 19 (DangGiuChuc=‟TRUE‟) (CHUCVU.MaCV=QTCHUCVU.MaCV) (QTCHUCVU.MaNV =NHANVIEN.MaNV) ((CHUCVU* QTCHUCVU)*NHANVIEN)) Cũng thực phép biến đổi tương đương, có biểu thức đại số quan hệ sau: HoTenNV( MaNV( MaCV,MaNV( PCCV = 0.3(CHUCVU) DangGiuChuc = „TRUE‟ QTCHUCVU)NHANVIEN)) SELECT NHANVIEN.HoTenNV FROM NHANVIEN INNER JOIN QTCHUCVU ON NHANVIEN.MaNV = QTCHUCVU.MaNV INNER JOIN CHUCVU ON QTCHUCVU.MaCV = CHUCVU.MaCV WHERE (CHUCVU.PCCV = 0.3) AND (QTCHUCVU.DangGiuChuc = ‘TRUE’) 3.2.6 Mô hình CSDL phân tán Quá trình tạo mảnh nhiều vị trí khác nhau, dựa vào: − Khi tần suất truy vấn liệu nhiều nhóm người dùng xác định đâu nơi truy cập nhiều, liệu sử dụng nhiều đó, có sở để phân bố − Thao tác CSDL Ví dụ xét ứng dụng truy vấn sau: SELECT NHANVIEN.HoTenNV FROM NHANVIEN, QTCHUCVU Footer Page 21 of 126 Header Page 22 of 126 WHERE 20 NHANVIEN.MaNV = QTCHUCVU.MaNV) AND (QTCHUCVU.MaCV=’PP’)AND (QTCHUCVU.DangGiuChuc=’TRUE’) Biểu thức tương đương đại số quan hệ: HoTenNV(NHANVIEN (MaCV =‟PP‟)AND(DangGiuChuc=‟TRUE‟)(QTCHUCVU)) Giả sử quan hệ NHANVIEN QTCHUCVU phân mảnh: QTCHUCVU1 = MaNV 100(QTCHUCVU) NHANVIEN1 = MaNV 100(NHANVIEN) Các mảnh QTCHUCVU1, QTCHUCVU2, NHANVIEN1, NHANVIEN2 phân bố vị trí trí tương ứng 1, 2, Mảnh Kết (KQ) phân bố vị trí Ta có chiến lược 1: KQ = NV‟1 NV‟1 NV‟1=CT‟1NHANVIEN1 NV‟2 NV‟2 NV‟2=CT‟2NHANVIEN2 CT‟1 CT‟1= (MaCV =‟PP‟) AND (DangGiuChuc=‟TRUE‟) (QTCHUCVU1) CT‟2 CT‟2= (MaCV =‟PP‟) AND (DangGiuChuc=‟TRUE‟) Hình 3.14 Mô hình chiến lƣợc Footer Page 22 of 126 (QTCHUCVU2) Header Page 23 of 126 21 Chiến lược 2: quan hệ KQ tính toán sau di chuyển mảnh vị trí 5, cụ thể sau: KQ = (NHANVIEN1 (DangGiuChuc=‟TRUE‟) NHANVIEN2) (QTCHUCVU1 (MaCV =‟PP‟) AND QTCHUCVU2) Giả sử: Thao tác truy xuất bộ, ký hiệu tupacc đơn vị Thao tác truyền bộ, ký hiệu tuptrans 10 đơn vị Quan hệ NHANVIEN có 1000 Quan hệ QTCHUCVU có 400 Hiện có 20 trưởng khoa vị Chi phí (đơn vị) chiến lược sau: (1) Tạo CT' cần: (10+10)*tupacc = 20 (2) Truyền CT' NHANVIEN cần: (10+10)*tuptrans= 200 (3) Tạo NV' cần: (10+10)*tupacc*2 = (4) Truyền NV' đến vị trí KQ cần: (10+10)*tuptrans= Tổng chi phí 40 200 460 Chi phí (đơn vị) chiến lược sau: (1) Truyền NHANVIEN đến KQ: 1000*tuptrans = (2) Truyền QTCHUCVU đến KQ: 400*tuptrans= 4000 (3) Tạo CT' cần: 400*tupacc = 400 (4) Nối NHANVIEN CT' cần: 1000*20*tupacc= Tổng chi phí Footer Page 23 of 126 10000 20000 34400 Header Page 24 of 126 22 Đánh giá kết quả: việc di chuyển tất KQ tính toán tốn chi phí cao Từ đó, chọn chiến lược để thực Xác định yêu cầu thiết kế hệ thống quản lý nhân viên: − Thông tin cập nhật nhanh nhất; − Trả lời yêu cầu truy vấn khoảng thời gian ngắn nhất; − Quá trình tạo báo cáo nhanh, kỳ hạn Thông tin báo cáo xác − Giá để xây dựng hệ thống nhỏ 3.2.7 Lựa chọn vị trí đặt CSDL phân nhóm ngƣời sử dụng Đánh giá vị trí đặt sở liệu theo số tiêu chuẩn cho vị trí đặt sở liệu tiện lợi nhất: − Tần xuất sử dụng sở liệu; − Số lần liên kết đến sở liệu; − Các tham chiếu đến sở liệu để cập nhật, đọc hay thay đổi Dựa tiêu chuẩn tính chất hệ thống thông tin quản lý nhân viên lựa chọn hệ thống theo hai nhóm tương đương với hai sở liệu sau: Cơ sở liệu 1: nhóm người cập nhật thông tin vào hệ thống Cơ sở liệu nhóm đặt vị trí nhóm làm việc Do yêu cầu công việc, nhóm lấy số phần thông tin theo quyền Cơ sở liệu trung tâm: gồm có nhóm lãnh đạo (ban giám đốc), nhóm cán nhân viên Sơ đồ mô tả cách kết nối thông tin sở liệu Footer Page 24 of 126 Header Page 25 of 126 23 Cơ sở liệu n Cơ sở liệu Nhóm làm việc Nhóm làm việc Nhóm Hành chính, Tổ chức Cơ sở liệu Bản sở liệu n Cơ sở liệu trung tâm Nhóm làm việc Ban giám đốc Nhóm cán bộ, nhân viên Hình 3.15 Mô hình sở liệu phân tán Trong sở liệu, thực thể sở liệu bảng liệu vật lý bảng vật lý hệ sở liệu quản lý ngôn ngữ SQL chương trình quản lý việc cập nhật sở liệu theo quyền Đánh giá kết thực hiện: Từ sở liệu tập trung, thông qua câu lệnh SQL, dựa vào tần xuất truy cập sở liệu để thực phân mảnh, ứng dụng truy cập vào mảnh để nâng cao hiệu sử dụng câu truy vấn Với mảnh ấy, thực cấp phát để tạo sở liệu nhiều nơi, phục vụ cho nhiều đối tượng tham gia vào hệ thống, kết tối ưu hóa giảm chi phí truy vấn thời gian thực hiện, chi phí truyền liệu Footer Page 25 of 126 Header Page 26 of 126 24 KẾT LUẬN Những kết nghiên cứu luận văn cho phép rút kết luận sau: Về mặt nghiên cứu lý thuyết: việc thiết kế sở liệu phân tán trình tối ưu hóa câu truy vấn phát triển từ hệ tập trung, việc phân tán quan hệ thường chia chúng thành nhiều mảnh nhỏ để đặt vị trí thường xuyên sử dụng mảnh đó, mảnh sau chia cấp phát vị trí khác Vấn đề để giảm thấp chi phí truy xuất, chi phí truyền thông, chi phí CPU đến mức thấp mà đảm bảo kết tương đương Luận văn giới thiệu thuật toán xử lý vấn tin D-Ingress, System R* SDD1 Về mặt ứng dụng: áp dụng kỹ thuật tối ưu hóa phân tán vào thiết kế hệ thống quản lý nhân viên Sở Khoa học Công nghệ Bình Định Hạn chế luận văn dừng lại mức độ mô tả, nghiên cứu lý thuyết thiết kế, tối ưu hóa đưa mô hình ứng dụng chưa đạt ứng dụng cao Trong thời gian tới, hướng phát triển đề tài tập trung làm rõ phân tán liệu xây dựng ứng dụng phân tán cải tiến thuật toán để đạt kết cao Footer Page 26 of 126 ... ứng dụng truy vấn để xác định việc phân mảnh, cấp phát phân mảnh thành lập liệu phân tán, quyền truy cập vào sở liệu CHƢƠNG CƠ SỞ LÝ THUYẾT 1.1 HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU 1.1.1 Cơ sở liệu 1.1.2... 1.2.4.1 Phân tán mạng cục 1.2.4.2 Phân tán mạng diện rộng CHƢƠNG THIẾT KẾ VÀ TỐI ƢU HÓA TRUY VẤN PHÂN TÁN 2.1 THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN Thiết kế hệ thống phân tán cần phải chọn vị trí đặt liệu. .. phân tán, cách thiết kế sở liệu phân tán, sở ứng dụng truy vấn để đưa phương pháp thiết kế, tối ưu chọn lọc chiến lược thực thi truy vấn hiệu Đối tƣợng phạm vi nghiên cứu Tối ưu hóa truy vấn CSDL

Ngày đăng: 07/05/2017, 08:32

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan