1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Bài tập lớn Cơ sở dữ liệu phân tán: tối ưu hóa truy vấn

23 81 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 23
Dung lượng 1,09 MB

Nội dung

Nhóm Đào Thế Quốc Hồng Cơng Thiện Hồng Văn Tú Nguyễn Thị Hồng Duyên Đào Thị Thanh Đinh Vũ Long Lê Trần Quang Huy Nguyễn Xuân Bách Nguyễn Thế Anh Nguyễn Văn Duy Đỗ Mạnh Hùng B18DCCN497 B18DCCN637 B18DCCN548 B18DCCN116 B18DCCN600 B18DCCN339 B18DCCN266 B18DCCN048 B18DCCN026 B18DCCN111 B18DCCN252 LOGO Chủ đề: Tối ưu hóa truy vấn Định nghĩa Phân loại Tính hiệu quả việc tối ưu hoá truy vấn Các phương pháp tối ưu hoá truy vấn Các kỹ thuật tối ưu hoá truy vấn Các bước tối ưu hoá csdl tập trung www.themegallery.com LOGO - Truy vấn biểu thức biểu diễn ngơn ngữ thích hợp dùng để xác định phần liệu chứa sở liệu quan hệ - Một truy vấn có thể biểu diễn toán tử Ch̃i phép tốn đại sớ quan hệ sẽ thực từ nút đến nút gốc để tạo kết quả truy vấn *Ví dụ www.themegallery.com LOGO 1.Định nghĩa - Trong hệ sở dữ liệu phân tán, tối ưu hoá truy vấn nhằm mục đích lựa chọn giải pháp tốt nhất toàn bộ các giải pháp truy vấn có thể thực hiện - Một phương pháp tối ưu hoá truy vấn có hiệu quả là tìm kiếm tập các giải pháp, dự đoán chi phí của chúng sau đó lựa chọn giải pháp có chi phí nhỏ nhất www.themegallery.com LOGO Tối ưu hóa truy vấn tĩnh Phân Loại Tối ưu hóa truy vấn động Phương pháp truy vấn hỗn hợp LOGO Phân Loại Tới ưu hóa truy vấn tĩnh • Việc tối ưu hoá truy vấn tĩnh được thực hiện tại thời điểm biên dịch truy vấn • Trước thực hiện truy vấn, kích thước của các quan hệ trung gian không được biết trước LOGO Phân Loại Tối ưu hóa truy vấn động - Việc tối ưu hoá truy vấn động tiến hành vào thời gian thực truy vấn - Việc lựa chọn thao tác tốt nhất cho tối ưu hoá truy vấn dựa thơng tin xác kết thao tác thực trước LOGO Phân Loại * Ưu điểm: - Kích thước thực quan hệ trung gian phù hợp cho xứ lý truy vấn Vì giảm thiểu xác x́t việc lựa chọn giải pháp tồi * Nhược điểm: - Các thao tác tối ưu hố có chi phí cao Lặp lại nhiều lần cho thao tác LOGO Phân Loại Phương pháp truy vấn hỗn hợp • Phương pháp tối ưu hố truy vấn hỗn hợp có ưu điểm tối ưu hoá truy vấn tĩnh, tránh vấn đề tạo đánh giá khơng xác gây • Về phương pháp tĩnh trình truy vấn động diễn LOGO Tính hiệu • Tính hiệu việc tối ưu hố truy vấn dựa số liệu thống kê sở liệu • Tối ưu hố truy vấn động cần đến số liệu thông kê nhằm chọn thao tác cần phải thực trước tiên • Tối ưu hoá truy vấn tĩnh cần đến số liệu thông kê nhằm chọn thao tác cần phải thực trước tiên • Các số liệu thống kê dành cho việc tối ưu hố truy vấn có liên quan đến mảnh, lực lượng kích thước mảnh, kích thước số lượng giá trị phân biệt thuộc tính • Độ xác số liệu thống kê phụ thuộc vào việc cập nhật theo chu kỳ www.themegallery.com LOGO Các phương pháp tới ưu hoá truy vấn • Việc tối ưu hóa truy vấn có tầm ảnh hưởng quan trọng đến mức độ hiệu sở • Các phương pháp tối ưu hóa truy vấn: Phương pháp : Tối ưu hóa chi phí - Chi phí thời gian CPU thực truy vấn - Chi phí lưu giữ kết trung gian - Chi phí trao đổi nhớ nhớ Phương pháp : Tối ưu hóa Heuristic - Biến đổi biểu thức đại số quan hệ - Biến đổi thứ tự thực phép toán biểu thức đại số quan hệ LOGO Các phương pháp tối ưu hoá truy vấn So sánh phương pháp: • Nhìn chung, phương pháp Heuristic tăng hiệu làm việc hầu hết truy vấn • Phép tối ưu hóa chi phí với ước tính từ thống kê phù hợp số trường hợp truy vấn cụ thể • Để tối ưu hóa truy vấn, thực tế, người thường sử dụng kết hợp phương pháp với www.themegallery.com LOGO Các kỹ thuật tối ưu hoá truy vấn Kỹ thuật tới ưu hóa chi phí: • Liệt kê kế hoạch truy vấn có tiềm tốt nhất • Áp dụng phép biến đổi để tạo tất kế hoạch khả thi • Tính tốn giá dựa giá mẫu • Chọn kế hoạch với giá nhất www.themegallery.com LOGO Các kỹ thuật tối ưu hoá truy vấn Kỹ tḥt tới ưu hóa Heuristic • Đầu tiên cần thực phép toán làm giảm kích thước kết trung gian • Đẩy phép chọn phép chiếu xuống thực sớm nhất • Nhóm dãy phép chọn chiếu: • Kết hợp phép chọn tích Đề thành phép kết nối • Tìm biểu thức chung biểu thức đại số quan hệ để đánh giá lần • Ước lượng chi phí lựa chọn thứ tự thực www.themegallery.com LOGO Các kỹ tḥt tới ưu hoá truy vấn • Một số phép biến đổi có ích việc tối ưu hóa truy vấn Các phép biến đổi tương đương www.themegallery.com LOGO Các kỹ thuật tối ưu hoá truy vấn Các phép biến đổi tương đương www.themegallery.com LOGO Các kỹ thuật tối ưu hoá truy vấn Các phép biến đổi tương đương www.themegallery.com LOGO Ví dụ tới ưu hoá truy vấn a - Câu truy vấn chưa tối ưu b, c, d - Câu truy vấn tối ưu www.themegallery.com LOGO Các bước tối ưu hoá csdl tập trung Bước 1: Kiểm tra ngữ pháp VD: Xét truy vấn Q1: SELECT ten FRPM truong; Truy vấn sai cú pháp (FROM not FRPM) Bước 2: Kiểm tra sự hợp lệ Kiểm tra tồn hợp lệ đối tượng liệu VD: Xét truy vấn Q2: SELECT ten FROM truong1; Truy vấn có bảng truong1 không tồn tại csdl Xét truy vấn Q3: SELECT matruong FROM truong WHERE matruong = ‘a’; Truy vấn không hợp lệ vì matruong phải kiểu integer www.themegallery.com LOGO Các bước tối ưu hoá csdl tập trung Bước 3: Dịch truy vấn - Trong bước này, hệ quản trị liệu sẽ biến đổi truy vấn hợp lệ thành dạng biểu diễn bên hệ thống mức thấp mà nó có thể sử dụng - Thông thường ta thường sử dụng đại số quan hệ vì nó dễ dàng biến đổi thành tác vụ của hệ thống VD: Xét truy vấn Q4: SELECT DISTINCT tentruong FROM truong WHERE matruong = ‘236’ Truy vấn sẽ biến đổi thành biểu thức đại số quan hệ sau: www.themegallery.com LOGO Các bước tối ưu hoá csdl tập trung Bước 4: Tối ưu hoá biểu thức đại số quan hệ www.themegallery.com LOGO Các bước tối ưu hoá csdl tập trung Bước 5: Chọn chiến lược truy xuất - Hệ quản trị liệu sử dụng thông số kích thước bảng, mục,… để xác định cách xử lý truy vấn - Hệ quản trị liệu đánh giá để chọn kế hoạch có chi phí nhất (thời gian xử lý vùng nhớ trung gian nhỏ nhất) - Thông số đánh giá chi phí: số lần loại truy xuất đĩa, kích thước vùng nhớ, thời gian thực Bước 6: Tạo sinh mã code Ở bước này, kế hoạch thực truy vấn cuối bước mã hoá thực www.themegallery.com LOGO Thank you! LOGO ... www.themegallery.com LOGO Tối ưu hóa truy vấn tĩnh Phân Loại Tối ưu hóa truy vấn động Phương pháp truy vấn hỗn hợp LOGO Phân Loại Tới ưu hóa truy vấn tĩnh • Việc tối ưu hoá truy vấn tĩnh được thực... phương pháp tới ưu hoá truy vấn • Việc tối ưu hóa truy vấn có tầm ảnh hưởng quan trọng đến mức độ hiệu sở • Các phương pháp tối ưu hóa truy vấn: Phương pháp : Tối ưu hóa chi phí - Chi phí... việc tối ưu hoá truy vấn dựa số liệu thống kê sở liệu • Tối ưu hố truy vấn động cần đến số liệu thông kê nhằm chọn thao tác cần phải thực trước tiên • Tối ưu hoá truy vấn tĩnh cần đến số liệu

Ngày đăng: 16/02/2022, 16:05

TỪ KHÓA LIÊN QUAN

w