Cơ sở dữ liệu phân tán và tối ưu hoá vấn tin

12 364 0
Cơ sở dữ liệu phân tán và tối ưu hoá vấn tin

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ Nguyễn Quang Thảo Cơ sở liệu phân tán tối ƣu hoá vấn tin Luận văn Thạc sĩ Công nghệ thông tin Hà Nội - 2006 MỤC LỤC LỜI NÓI ĐẦU Chƣơng KHÁI QUÁT VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 1.1 Cơ sở liệu quan hệ 1.2 Các dạng chuẩn 1.3 Ngôn ngữ liệu quan hệ [4] 10 1.4 Hệ sở liệu phân tán [4] Error! Bookmark not defined 1.4.1 Các khái niệm CSDL PT Error! Bookmark not defined 1.4.2 Các mục tiêu hệ quản trị CSDL PT Error! Bookmark not defined 1.4.3 Kiến trúc hệ quản trị CSDL PT Error! Bookmark not defined 1.4.4 Phân mảnh, nhân cấp phát liệu Error! Bookmark not defined Chƣơng MỘT SỐ NGUYÊN LÝ CHUNG CỦA TỐI ƢU HÓA TRUY VẤN Error! Bookmark not defined 2.1 Mục tiêu toán xử lý truy vấn [4] Error! Bookmark not defined 2.2 Độ phức tạp phép toán đại số quan hệ Error! Bookmark not defined 2.3 Mô tả xử lý truy vấn Error! Bookmark not defined 2.4 Phân rã truy vấn định vị liệu Error! Bookmark not defined 2.4.1 Phân rã truy vấn Error! Bookmark not defined 2.4.2 Định vị liệu Error! Bookmark not defined 2.5 Tối ƣu hóa truy vấn phân tán Error! Bookmark not defined 2.5.1 Tối ƣu hóa truy vấn Error! Bookmark not defined 2.5.2 Tối ƣu hóa truy vấn môi trƣờng tập trung Error! Bookmark not defined 2.5.3 Các thuật toán tối ƣu hóa truy vấn môi trƣờng phân tán Error! Bookmark not defined Chƣơng MỘT SỐ ĐỀ XUẤT KHÁC VỀ XỬ LÝ PHÉP NỐI TRONG CÁC HỆ CSDL Error! Bookmark not defined 3.1 Ứng dụng lý thuyết đồ thị tối ƣu hóa truy xuất CSDL để thực phép nối [9] Error! Bookmark not defined 3.1.1 Sử dụng mục để thực phép nối Error! Bookmark not defined 3.1.2 Mô hình đồ thị kết nối trang Error! Bookmark not defined 3.1.3 Xác định cận kích thƣớc nhớ đệm Error! Bookmark not defined 3.1.4 Các Heuristic để làm giảm lƣợng nhớ đệm cần thiết Error! Bookmark not defined 3.1.5 Lƣợc đồ nhớ đệm dựa sở lƣu trữ toàn trang Error! Bookmark not defined 3.1.6 Xác định kích thƣớc nhớ đệm để thực truy xuất cho trang Error! Bookmark not defined 3.2 Một số phƣơng án tiếp cận xử lý nối phân tán khác Error! Bookmark not defined 3 3.2.1 Sử dụng thông tin phụ thuộc vị trí (placement dependency) để thực nối [7] Error! Bookmark not defined 3.2.2 Thuật toán phân mảnh nhân [7] Error! Bookmark not defined 3.2.3 Thuật toán qui hoạch băm [7] Error! Bookmark not defined 3.2.4 Xử lý truy vấn chuỗi [7] Error! Bookmark not defined 3.2.5 Tăng tốc xử lý truy vấn nhờ AHYPERF [12] Error! Bookmark not defined KẾT LUẬN Error! Bookmark not defined TÀI LIỆU THAM KHẢO 11 DANH MỤC CÁC HÌNH VẼ Hình 1 CSDL trung tâm mạng Error! Bookmark not defined Hình Môi trƣờng hệ CSDL PT Error! Bookmark not defined Hình Kiến trúc tham chiếu CSDL PT Error! Bookmark not defined Hình Các thành phần hệ quản trị CSDL PT Error! Bookmark not defined Hình Các kiểu phân mảnh Error! Bookmark not defined Hình Các quan hệ đƣợc chuẩn hóa Error! Bookmark not defined Hình Phân mảnh ngang nguyên thủy cho quan hệ DUAN Error! Bookmark not defined Hình Phân mảng dọc cho quan hệ DUAN Error! Bookmark not defined Hình Các chiến lƣợc thực thi Error! Bookmark not defined Hình 2 Lƣợc đồ tổng quát xử lý truy vấn phân tán Error! Bookmark not defined Hình Các đồ thị quan hệ Error! Bookmark not defined Hình Đồ thị truy vấn không liên thông Error! Bookmark not defined Hình Thí dụ truy vấn Error! Bookmark not defined Hình Cây truy vấn tƣơng đƣơng Error! Bookmark not defined Hình Cây truy vấn đƣợc viết lại Error! Bookmark not defined Hình Cây truy vấn sau thay Error! Bookmark not defined Hình Rút gọn phân mảnh ngang (với phép chọn) Error! Bookmark not defined Hình 10 Rút gọn cho phân mảnh ngang (với phép nối) Error! Bookmark not defined Hình 11 Rút gọn cho phân mảnh dọc Error! Bookmark not defined Hình 12 Rút gọn cho phân mảnh gián tiếp Error! Bookmark not defined Hình 13 Rút gọn cho phân mảnh hỗn hợp Error! Bookmark not defined Hình 14 Quá trình tối ƣu hóa truy vấn Error! Bookmark not defined Hình 15 Các nối tƣơng đƣơng Error! Bookmark not defined Hình 16 Hai hình thái nối Error! Bookmark not defined Hình 17 Hành động tối ƣu hóa áp dụng chiến lƣợc đơn định Error! Bookmark not defined Hình 18 Hành động tối ƣu hóa áp dụng chiến lƣợc ngẫu nhiên Error! Bookmark not defined Hình 19 Thí dụ truyền liệu cho truy vấn Error! Bookmark not defined Hình 20 Đồ thị nối câu truy vấn q1 Error! Bookmark not defined Hình 21 Các thứ tự nối khác Error! Bookmark not defined Hình 22 Truyền toán hạng phép toán hai Error! Bookmark not defined Hình 23 Đồ thị nối câu truy vấn phân tán Error! Bookmark not defined Hình 24 Biến đổi câu truy vấn có chu trình Error! Bookmark not defined Hình 25 Truy vấn mẫu số liệu thống kê Error! Bookmark not defined 5 Hình Quan hệ với tham gia nối Error! Bookmark not defined Hình Hai dãy truy xuất trang liệu hình 3.1 Error! Bookmark not defined Hình 3 Đồ thị kết nối trang CSDL hình 3.1 Error! Bookmark not defined Hình Quan hệ kích thƣớc tập trang hệ số chọn Error! Bookmark not defined Hình Một đồ thị kết nối trang tổng quát Error! Bookmark not defined Hình Giá trị lát cắt biểu diễn lƣợng nhớ đệm cần thiết Error! Bookmark not defined Hình Kích thƣớc thƣớc nhớ đệm heuristic Error! Bookmark not defined Hình Kích thƣớc trung bình danh sách tìm Error! Bookmark not defined Hình Đồ thị kết nối trang đồ thị không chu trình tƣơng ứng Error! Bookmark not defined Hình 10 Đồ thị kết nối trang Error! Bookmark not defined Hình 11 Đồ thị không chu trình thu đƣợc từ hình 3.10 Error! Bookmark not defined Hình 12 Hai quan hệ đƣợc phân mảnh Error! Bookmark not defined Hình 13 Cấu hình trƣớc xử lý nối Error! Bookmark not defined Hình 14 Một ví dụ phân mảnh trạm Error! Bookmark not defined Hình 15 Mô tả cách tạo cho Error! Bookmark not defined Hình 16 Tính toán chi phí từ dƣới – lên Error! Bookmark not defined Hình 17 PERF R S Error! Bookmark not defined Hình 18 Mô tả quan hệ Error! Bookmark not defined 6 LỜI NÓI ĐẦU Cơ sở liệu (CSDL) lĩnh vực đƣợc quan tâm nhiều công nghệ thông tin Ra đời từ năm 60 đến nay, xuất nhiều hệ quản trị CSDL, có nhiều ứng dụng khoa học kỹ thuật nhƣ ngành kinh tế khác Việc nghiên cứu CSDL phát triển ngày phong phú, đa dạng Từ năm 70, mô hình liệu quan hệ E.F Codd đƣa tạo sở vững cho vấn đề nghiên cứu CSDL Với ƣu điểm tính cấu trúc, khả hình thức hóa phong phú, CSDL quan hệ dễ dàng mô hệ thống thông tin đa dạng thực tiễn, làm tăng khả xử lý, quản trị, khai thác liệu, thông tin Trên thực tế nhiều hệ quản trị CSDL thƣơng mại, xây dựng mô hình quan hệ, đƣợc lƣu hành, sử dụng rộng rãi thị trƣờng nhƣ:DBASE, ORACLE, MS SQL… Cho đến có hàng loạt vấn đề CSDL đƣợc nghiên cứu, giải Với mục đích tìm hiểu để nâng cao khả ứng dụng của hệ CSDL, luận văn tập trung vào việc nghiên cứu vấn đề “tối ƣu hóa câu truy vấn CSDL phân tán” CSDL phân tán nói riêng hệ phân tán nói chung lĩnh vực nghiên cứu không mới, nhƣng gần với phát triển nhanh chóng mạnh mẽ công nghệ truyền thông, mạng Internet đặc biệt xu phát triển thƣơng mại điện tử, CSDL phân tán trở thành lãnh vực thu hút nhiều quan tâm nhà nghiên cứu nhƣ nhà sản xuất phần mềm Nhƣ ta biết, thành công ngày tăng công nghệ CSDL quan hệ việc xử lý liệu phần tính dễ dùng khả khai thác, tìm kiếm liệu ngôn ngữ phi thủ tục (nhƣ SQL), cải thiện đáng kể công việc phát triển ứng dụng khả sáng tạo ngƣời dùng Các ngôn ngữ phi thủ tục CSDL quan hệ cho phép diễn tả câu truy vấn phức tạp cách xác đơn giản Đặc biệt để có đƣợc câu trả lời cho câu truy vấn ngƣời sử dụng không cần phải xác định xác trình tự tiến hành thao tác/phép toán câu truy vấn Trình tự đƣợc xử lý Bộ xử lý truy vấn (query processor) hệ quản trị CSDL, toán xử lý truy vấn hay tối ƣu hóa truy vấn Tối ƣu hóa truy vấn việc xác định chiến lƣợc thực truy vấn cho cực tiểu hóa đƣợc hàm chi phí Đây toán khó, đặc biệt môi trƣờng phân tán toán thuộc lớp NP-Hard Để tránh chi phí tối ƣu hóa lớn cách tiếp cận dùng heuristic đƣợc sử dụng để đạt đƣợc chiến lƣợc thực thi gần tối ƣu Các yếu tố cần đƣợc xem xét giải toán là: phân tán liệu, chi phí xử lý cục bộ, chi phí truyền… Các yếu tố định đến việc cực tiểu hàm chi phí có nhiều, nhƣng yếu tố quan trọng trình tự thực tối ƣu phép nối, việc chọn sao, mảnh phải truy xuất, nhƣ việc chọn trạm thực việc sử dụng giải thuật truy xuất liệu cục phân tán Với nét trên, nội dung luận văn trình bày nguyên lý chung, kỹ thuật, thuật toán liên quan đến vấn đề tối ƣu hóa truy vấn số phƣơng án đề xuất cho việc giải toán tối ƣu Luận văn đƣợc chia làm phần: Chƣơng 1: KHÁI QUÁT VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN - Chƣơng trình bày kiến thức hệ CSDL phân tán, kiến trúc tham chiếu, kiểu phân mảnh, mức suốt phân tán Chƣơng 2: MỘT SỐ NGUYÊN LÝ CHUNG CỦA TỐI ƢU HÓA CÂU TRUY VẤN - Chƣơng trình bày nguyên lý chung tối ƣu hóa truy vấn CSDL nói chung CSDL phân tán nói riêng Trong chƣơng có trình bày số thuật toán kinh điển để tối ƣu hóa câu truy vấn đƣợc sử dụng hệ CSDL quan hệ nhƣ INGRES, SYSTEM R… Chƣơng 3: Chƣơng MỘT SỐ ĐỀ XUẤT KHÁC VỀ XỬ LÝ PHÉP NỐI TRONG CÁC HỆ CSDL - Chƣơng trình bày số đề xuất cải tiến, kỹ thuật xử lý truy vấn dựa việc xử lý nối có nhận xét, đánh giá so sánh 8 Chƣơng KHÁI QUÁT VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN Chƣơng trình bày cách khái quát kiến thức sở mô hình quan hệ (lƣợc đồ quan hệ, ngôn ngữ liệu quan hệ…), hệ CSDL phân tán (các kiến trúc, đặc trƣng, vấn đề CSDL phân tán…)[4] Chƣơng cung cấp kiến thức sở cho chƣơng sau 1.1 Cơ sở liệu quan hệ Cơ sở liệu (CSDL) tập hợp liệu có cấu trúc, liên quan đến tƣợng thực tế mà cố gắng mô hình hóa chúng CSDL quan hệ loại CSDL đƣợc cấu trúc theo dạng bảng (table) Về hình thức quan hệ (relation) tập tích Descartes nhiều miền trị (domain) xác định tập thuộc tính (attributes) Một quan hệ r xác định tập thuộc tính   {A1 , A2 , An } , : r  Dom( A1 )  Dom( A2 )   Dom( An ) Mỗi hàng quan hệ đƣợc gọi (tuple), nhƣ quan hệ r tập hợp n-bộ có dạng: r  {( a1 , a2 , , an ) |  Dom( Ai ), với i  1,2, n} Trong Dom( Ai ) miền giá trị thuộc tính Ai Số thuộc tính quan hệ gọi bậc quan hệ Quan hệ r bị thay đổi theo thời gian việc thực phép toán cập nhật r (thêm vào, loại bỏ, sửa đổi bộ) Lƣợc đồ quan hệ (relation scheme) Một lƣợc đồ quan hệ R cặp có thứ tự R  , F  ,  tập hữu hạn thuộc tính quan hệ, F tập điều kiện thuộc tính (F gọi tập ràng buộc toàn vẹn) Một ràng buộc tập thuộc tính { A1 , A2 , , An } tính chất tập tất quan hệ xác định tập thuộc tính 9 Còn nói đến lƣợc đồ quan hệ, tập trung vào khía cạnh mô tả cấu trúc quan hệ mà không quan tâm đến cụ thể, ta dùng ký hiệu: R( A1 , A2 , , An ) Với R tên quan hệ, A1 , A2 , , An danh sách tên thuộc tính Thể quan hệ Với lƣợc đồ quan hệ R, theo thời gian, nhiều quan hệ có cấu trúc ràng buộc toàn vẹn đƣợc mô tả lƣợc đồ Mỗi quan hệ nhƣ đƣợc gọi thể lƣợc đồ R Lƣợc đồ quan hệ mô tả cấu trúc quan hệ Tại thời điểm lƣợc đồ quan hệ có thể quan hệ cụ thể Khóa lƣợc đồ quan hệ tập thuộc tính không rỗng nhỏ cho giá trị thuộc tính khóa cho phép xác định quan hệ Các thuộc tính có mặt khóa gọi thuộc tính khóa Một tập có chứa khóa đƣợc gọi siêu khóa (supperkey) Ta định nghĩa cách hình thức nhƣ sau: Cho lƣợc đồ quan hệ R  , F  , K   , K đƣợc gọi khóa lƣợc đồ quan hệ R thỏa mãn điều kiện sau: i Bất kỳ hai khác t1 , t  r , r thể R, có t1[ K ]  t [ K ] ii Không tồn K '  K thỏa mãn điều kiện Tập K siêu khóa thỏa mãn điều kiện (i) 1.2 Các dạng chuẩn Chuẩn hóa – trình bƣớc thay tập quan hệ cho tập quan hệ có cấu trúc ngày đơn giản chuẩn tắc [Tsichritzis and Lochovsky, 1977] Mục đích chuẩn hóa loại bỏ bất thƣờng quan hệ Quan hệ đƣợc chuẩn hóa quan hệ miền thuộc tính chứa giá trị nguyên tố (atomic), tức không phân nhỏ đƣợc giá trị quan hệ nguyên tố Theo lý thuyết ban đầu Codd đƣa có dạng chuẩn quan hệ: 10 Về sau Boyce Codd định nghĩa phiên sửa đổi dạng 3NF, thƣờng đƣợc gọi dạng chuẩn Boyce-Codd (BCNF) Tiếp sau dạng chuẩn 4NF [Fagin, 1977] chuẩn 5NF [Fagin, 1979] Yêu cầu chuẩn hóa không làm mát thông tin thay quan hệ quan hệ khác Nếu nối quan hệ kết để tạo thành quan hệ ban đầu, trình phân rã đƣợc gọi phân rã không thông tin Một yêu cầu khác trình chuẩn hóa bảo toàn phụ thuộc (dependency preservation) Phân rã đƣợc gọi bảo toàn phụ thuộc hợp phụ thuộc hàm quan hệ đƣợc phân rã tƣơng đƣơng với bao đóng (closure) phụ thuộc hàm quan hệ ban đầu Định nghĩa dạng chuẩn 1NF Một lƣợc đồ quan hệ R đƣợc gọi dạng chuẩn 1NF toàn miền có mặt R chứa giá trị nguyên tố [2] Định nghĩa dạng chuẩn 2NF Lƣợc đồ quan hệ R dạng chuẩn 2NF dạng chuẩn 1NF thuộc tính không khóa R phụ thuộc hàm đầy đủ vào khóa [2] Định nghĩa dạng chuẩn 3NF Lƣợc đồ quan hệ R dạng chuẩn 3NF dạng chuẩn 1NF thuộc tính không khóa R không phụ thuộc hàm bắc cầu vào khóa [2] Định nghĩa dạng chuẩn BCNF Lƣợc đồ quan hệ với tập phụ thuộc hàm đƣợc gọi dạng chuẩn BCNF X  A thỏa R, A X X siêu khóa R [2] 11 Định nghĩa phụ thuộc hàm đầy đủ Cho lƣợc đồ quan hệ R với tập thuộc tính   {A1 , A2 , An } , X Y hai tập thuộc tính khác X   Y   Y phụ thuộc hàm đầy đủ vào X Y phụ thuộc hàm vào X nhƣng không phụ thuộc vào tập thực X [2] 1.3 Ngôn ngữ liệu quan hệ [4] Các ngôn ngữ thao tác liệu (DML) đƣợc phát triển cho mô hình quan hệ (đƣợc gọi ngôn ngữ truy vấn – query language) đƣợc chia thành hai nhóm bản.: ngôn ngữ dựa đại số quan hệ (relational algebra) ngôn ngữ dựa phép tính quan hệ Khác biệt chúng cách thức ngƣời sử dụng đƣa câu truy vấn Đại số quan hệ thuộc loại thủ tục (procedural), ngƣời dùng cần phải đặc tả, nhờ số toán tử, xem làm để thu đƣợc kết Ngƣợc lại phép tính quan hệ thuộc loại phi thủ tục (nonpropcedural), ngƣời sử dụng cần đặc tả mối liên hệ cần phải bảo đảm kết Cả hai đƣợc Codd đƣa tƣơng đƣơng khả diễn tả Đại số quan hệ đƣợc sử dụng nhiều nghiên cứu CSDL phân tán mức thấp tƣơng ứng trực tiếp với chƣơng trình đƣợc trao đổi mạng Về phép tính quan hệ đƣợc dịch thành đại số quan hệ Đại số quan hệ sở quan trọng việc tối ƣu hóa truy vấn, sau trình bày số phép toán quan hệ Đại số quan hệ có tập hợp phép toán quan hệ Mỗi toán tử nhận hai quan hệ làm toán hạng cho quan hệ (quan hệ kết quả), đến lƣợt lại sử dụng làm toán hạng cho toán tử khác Các phép toán cho phép vấn tin cập nhật CSDL quan hệ Có năm phép toán năm phép khác đƣợc định nghĩa theo năm phép toán Đó phép chọn (selection), chiếu (projection), hợp (union), trừ (set difference), tích Descartes Hai phép toán thuộc loại ngôi, ba phép toán sau thuộc loại hai Các phép toán bổ sung là: giao (intersection), nối  (  -join), nối tự nhiên (natural join), nối nửa (semi join) phép chia (division) [4] Trong toán hạng phép toán hai phải khả hợp 12 TÀI LIỆU THAM KHẢO [1] Nguyễn Bá Tƣờng (2001), CƠ SỞ DỮ LIỆU Lý thuyết thực hành, NXB Khoa học kỹ thuật [2] Lê Tiến Vƣơng (1996), Nhập môn CƠ SỞ DỮ LIỆU QUAN HỆ, NXB Khoa học kỹ thuật [3] Hồ Thuần, Hồ Cẩm Hà (2004, 2005), Các hệ CƠ SỞ DỮ LIỆU lý thuyết thực hành, tập 1,2, NXB Giáo dục [4] Jeffrey D Ulman, biên dịch Trần Đức Quang (2002), Nguyên lý hệ CƠ SỞ DỮ LIỆU CƠ SỞ TRI THỨC, tập I II, NXB Thống kê [5]Kenneth H Rosen, ngƣời dịch: Phạm Văn Thiều, Đặng Hữu Thịnh (1998), Toán rời rạc Ứng dụng tin học, NXB Khoa học kỹ thuật [6] M Tamer Ozsu, Patrick Valduriez, biên dịch Trần Đức Quang (1999), Nguyên lý hệ CƠ SỞ DỮ LIỆU phân tán, tập I, NXB Thống kê [7] Clement T.Yu, Weiyi Meng (1998), Principles of Database Query Processing for Advanced Applications, Morgan Kaufmann Publishers, Inc [8] Ramez Elmasri, Shamkant Navathe (2002), Fundamentals of Database Systems, 3rd Edition [9] Sakti Pramanik, David Ittiner (1985), Use of Graph-Theoretic Models for Optimal Relational Database Accesses to Perform Join, pages 57-76 , ACM Transaction on Database Systems [10] Zhe Li, Kenneth A Ross (1994), Better Semijoin Using Tuple Bit-Vectors, Technical Report No CUCS-010-94 [11] Zhe Li, Kenneth A Ross (1995), PERF Join: An Alternative To Two-way Semijoin And Bloomjoin, Department of Computer Science, Columbia University, New York [12] Ramzi A Haraty, Roula C.Fany (2001), Query Acceleration in Distributed Database Systems, Colombian Journal of Computation Volume 2, Number [...]... join), nối nửa (semi join) và phép chia (division) [4] Trong đó toán hạng của phép toán hai ngôi phải khả hợp 12 TÀI LIỆU THAM KHẢO [1] Nguyễn Bá Tƣờng (2001), CƠ SỞ DỮ LIỆU Lý thuyết và thực hành, NXB Khoa học và kỹ thuật [2] Lê Tiến Vƣơng (1996), Nhập môn CƠ SỞ DỮ LIỆU QUAN HỆ, NXB Khoa học và kỹ thuật [3] Hồ Thuần, Hồ Cẩm Hà (2004, 2005), Các hệ CƠ SỞ DỮ LIỆU lý thuyết và thực hành, tập 1,2, NXB... Ulman, biên dịch Trần Đức Quang (2002), Nguyên lý các hệ CƠ SỞ DỮ LIỆU và CƠ SỞ TRI THỨC, tập I và II, NXB Thống kê [5]Kenneth H Rosen, ngƣời dịch: Phạm Văn Thiều, Đặng Hữu Thịnh (1998), Toán rời rạc Ứng dụng trong tin học, NXB Khoa học và kỹ thuật [6] M Tamer Ozsu, Patrick Valduriez, biên dịch Trần Đức Quang (1999), Nguyên lý các hệ CƠ SỞ DỮ LIỆU phân tán, tập I, NXB Thống kê [7] Clement T.Yu, Weiyi Meng... {A1 , A2 , An } , X và Y là hai tập thuộc tính khác nhau X   và Y   Y là phụ thuộc hàm đầy đủ vào X nếu Y là phụ thuộc hàm vào X nhƣng không phụ thuộc vào bất kỳ một tập con thực sự nào của X [2] 1.3 Ngôn ngữ dữ liệu quan hệ [4] Các ngôn ngữ thao tác dữ liệu (DML) đƣợc phát triển cho mô hình quan hệ (đƣợc gọi là ngôn ngữ truy vấn – query language) đƣợc chia thành hai nhóm cơ bản.: các ngôn ngữ... quả Cả hai đều đƣợc Codd đƣa ra và đều tƣơng đƣơng về khả năng diễn tả Đại số quan hệ đƣợc sử dụng nhiều hơn trong các nghiên cứu về CSDL phân tán vì nó ở mức thấp hơn và tƣơng ứng trực tiếp hơn với chƣơng trình đƣợc trao đổi trên mạng Về cơ bản thì phép tính quan hệ có thể đƣợc dịch thành đại số quan hệ Đại số quan hệ là cơ sở quan trọng trong việc tối ƣu hóa truy vấn, sau đây sẽ trình bày một số... hai quan hệ làm toán hạng và cho ra một quan hệ mới (quan hệ kết quả), đến lƣợt nó lại có thể sử dụng làm toán hạng cho một toán tử khác Các phép toán này cho phép vấn tin và cập nhật CSDL quan hệ Có năm phép toán cơ bản và năm phép khác có thể đƣợc định nghĩa theo năm phép toán cơ bản này Đó là các phép chọn (selection), chiếu (projection), hợp (union), trừ (set difference), và tích Descartes Hai phép... quan hệ (đƣợc gọi là ngôn ngữ truy vấn – query language) đƣợc chia thành hai nhóm cơ bản.: các ngôn ngữ dựa trên đại số quan hệ (relational algebra) và các ngôn ngữ dựa trên phép tính quan hệ Khác biệt giữa chúng là cách thức ngƣời sử dụng đƣa ra câu truy vấn Đại số quan hệ thuộc loại thủ tục (procedural), trong đó ngƣời dùng cần phải đặc tả, nhờ một số toán tử, xem làm thế nào để thu đƣợc kết quả Ngƣợc... Database Query Processing for Advanced Applications, Morgan Kaufmann Publishers, Inc [8] Ramez Elmasri, Shamkant Navathe (2002), Fundamentals of Database Systems, 3rd Edition [9] Sakti Pramanik, David Ittiner (1985), Use of Graph-Theoretic Models for Optimal Relational Database Accesses to Perform Join, pages 57-76 , ACM Transaction on Database Systems [10] Zhe Li, Kenneth A Ross (1994), Better Semijoin

Ngày đăng: 11/11/2016, 22:56

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan