Một số thuật toán tối ưu hóa truy vấn trong cơ sở dữ liệu phân tán (Luận văn thạc sĩ)Một số thuật toán tối ưu hóa truy vấn trong cơ sở dữ liệu phân tán (Luận văn thạc sĩ)Một số thuật toán tối ưu hóa truy vấn trong cơ sở dữ liệu phân tán (Luận văn thạc sĩ)Một số thuật toán tối ưu hóa truy vấn trong cơ sở dữ liệu phân tán (Luận văn thạc sĩ)Một số thuật toán tối ưu hóa truy vấn trong cơ sở dữ liệu phân tán (Luận văn thạc sĩ)Một số thuật toán tối ưu hóa truy vấn trong cơ sở dữ liệu phân tán (Luận văn thạc sĩ)Một số thuật toán tối ưu hóa truy vấn trong cơ sở dữ liệu phân tán (Luận văn thạc sĩ)Một số thuật toán tối ưu hóa truy vấn trong cơ sở dữ liệu phân tán (Luận văn thạc sĩ)Một số thuật toán tối ưu hóa truy vấn trong cơ sở dữ liệu phân tán (Luận văn thạc sĩ)Một số thuật toán tối ưu hóa truy vấn trong cơ sở dữ liệu phân tán (Luận văn thạc sĩ)
Trang 1ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ
TRUYỀN THÔNG
VŨ ĐỨC MẠNH
MỘT SỐ THUẬT TOÁN TỐI ƯU HÓA TRUY
VẤN TRONG
CƠ SỞ DỮ LIỆU PHÂN TÁN
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY
TÍNH
Thái Nguyên - 2016
Trang 2Số hóa bởi Trung tâm Học liệu – ĐHTN
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ
TRUYỀN THÔNG
VŨ ĐỨC MẠNH
MỘT SỐ THUẬT TOÁN TỐI ƯU HÓA TRUY
VẤN TRONG
CƠ SỞ DỮ LIỆU PHÂN TÁN
CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH
Mã số: 60480101
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS TS ĐOÀN VĂN BAN
Thái Nguyên - 2016
Trang 3MỞ ĐẦU
Sở Giáo dục và Đào tạo (GD&ĐT) tỉnh Yên Bái hiện đang quản lý trực tiếp 9 phòng Giáo dục và Đào tạo, 24 trường Trung học phổ thông, 6 trung tâm, 2 trường chuyên nghiệp, với đội ngũ cán bộ quản lý, giáo viên và nhân viên lên tới hàng trăm nghìn người Hiện nay tất cả các đơn vị trên đều đang sử dụng mạng internet
Do trong một năm học, việc thống kê tình hình nhân sự của Sở GD&ĐT đối với các đơn vị được thực hiện cố định theo định kì đầu, giữa và cuối năm học, mà dữ liệu về nhân sự luôn thay đổi, nên khó khăn trong việc cập nhật dữ liệu thường xuyên nên mô hình cơ sở tập trung sẽ gặp khó khăn về vấn đề máy chủ, băng thông đường truyền, tính sẵn sàng của hệ thống
Xuất phát từ thực tế nhu cầu công việc, tôi nhận thấy có thể ứng dụng cơ sở dữ liệu phân tán để giải quyết những khó khăn ở trên; chính vì vậy tôi chọn nghiên cứu đề tài "Một số thuật toán tối ưu hóa truy vấn trong cơ sở dữ liệu phân tán” làm luận văn tốt nghiệp
Luận văn gồm có 3 chương: Chương 1 trình bày khái quát về cơ
sở dữ liệu phân tán, tìm hiểu các phương pháp thiết kế cơ sở dữ liệu phân tán, tập trung nghiên cứu các kỹ thuật phân mảnh: phân mảnh ngang, phân mảnh dọc và phân mảnh hỗn hợp Chương 2 trình bày chi tiết các bước trong quy trình xử lý câu truy vấn; trình bày các thuật toán tối ưu hóa câu truy vấn cơ sở dữ liệu phân tán như: INGRES phân tán, R*, DP-ACO Chương 3 cài đặt thực nghiệm 2 thuật toán INGRES phân tán và R* và đưa ra nhận xét đánh giá
Trang 4Số hóa bởi Trung tâm Học liệu – ĐHTN
Chương 1 KHÁI QUÁT VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN
1.1 Cơ sở dữ liệu phân tán
1.1.1 Khái niệm cơ sở dữ liệu phân tán
Một cơ sở dữ liệu (CSDL) phân tán là một tập dữ liệu có quan
hệ logic với nhau, được phân bố trên các máy tính của một mạng máy tính [1]
1.1.2 Hệ quản trị cơ sở dữ liệu phân tán
Hệ quản trị CSDL phân tán (DDBMS) là một hệ thống phần mềm cho phép quản lý các CSDL phân tán (tạo lập và điều khiển các truy nhập cho các hệ CSDL phân tán) và làm cho việc phân tán trở nên trong suốt với người sử dụng [1]
1.1.3 Ưu điểm của cơ sở dữ liệu phân tán
- Cho phép quản lý dữ liệu theo nhiều mức trong suốt
- Tăng độ tin cậy và khả năng sẵn sàng
- Cải thiện hiệu năng
- Tổ chức dữ liệu phân tán kinh tế hơn so với tổ chức dữ liệu tập trung
- Dễ dàng mở rộng
1.1.4 Nhược điểm của cơ sở dữ liệu phân tán
- Độ phức tạp thiết kế và cài đặt hệ thống tăng
- Tăng chi phí
- Bảo mật khó khăn
- Kiểm soát tính toàn vẹn khó khăn hơn
1.2 Đặc điểm của cơ sở dữ liệu phân tán
1.2.1 Chia sẻ tài nguyên
Việc chia sẻ tài nguyên của hệ phân tán được thực hiện thông qua mạng truyền thông
Trang 51.2.2 Tính mở
Tính mở của hệ phân tán được xem xét theo mức độ bổ sung vào các dịch vụ dùng chung tài nguyên mà không phá hỏng hay nhân đôi các dịch vụ đang tồn tại
1.2.3 Khả năng song song
Hệ phân tán hoạt động trên một mạng truyền thông có nhiều máy tính, mỗi máy có thể có một hay nhiều CPU Trong cùng một thời điểm nếu có N tiến trình cùng tồn tại, ta nói chúng thực hiện đồng thời Việc thực hiện tiến trình có thể theo cơ chế song (nhiều CPU)
1.2.4 Khả năng mở rộng
Khả năng mở rộng được đặc trưng bởi tính không thay đổi phần mềm hệ thống và phần mềm ứng dụng khi hệ thống được mở rộng Điều này chỉ đạt được mức độ nào đó với hệ phân tán hiện tại Yêu cầu việc mở rộng không chỉ là sự mở rộng về phần cứng, về mạng
mà nó trải trên các khía cạnh khi thiết kế hệ phân tán
1.2.5 Khả năng thứ lỗi
Việc thiết kế khả năng thứ lỗi của các hệ thống máy tính dựa trên hai giải pháp: Dùng khả năng thay thế để đảm bảo sự hoạt động liên tục và hiệu quả; Dùng các chương trình hồi phục khi xảy ra sự cố
1.2.6 Tính trong suốt
Tính trong suốt của một hệ phân tán được hiểu như là việc che khuất đi các thành phần riêng biệt của hệ đối với người sử dụng và những người lập trình ứng dụng, bao gồm: Tính trong suốt về vị trí,
về việc sử dụng, về việc phân chia, về sự trùng lặp
1.2.7 Đảm bảo tin cậy và nhất quán
Sự bí mật của dữ liệu phải được bảo vệ, các chức năng khôi phục hư hỏng phải được đảm bảo Ngoài ra, yêu cầu của hệ thống về tính nhất quán cũng rất quan trọng trong thể hiện: không được có mâu thuẫn trong nội dung dữ liệu
Trang 6Số hóa bởi Trung tâm Học liệu – ĐHTN
1.3 Các đặc trƣng trong suốt của cơ sở dữ liệu phân tán
1.3.1 Trong suốt phân tán
1.3.2 Trong suốt giao dịch
1.3.3 Trong suốt thất bại
1.3.4 Trong suốt thao tác
1.3.5 Trong suốt về tính không thuần nhất
1.4 Kiến trúc cơ bản của cơ sở dữ liệu phân tán
Mô hình kiến trúc CSDL phân tán gồm: Lược đồ tổng thể, lược
đồ phân mảnh, lược đồ định vị và lược đồ ánh xạ cục bộ
1.5 Các kĩ thuật xây dựng cơ sở dữ liệu phân tán
Có 3 chiến lược phân tán dữ liệu cơ bản: Sao lặp dữ liệu, phân mảnh dữ liệu và phương pháp hỗn hợp
Sao lặp dữ liệu: CSDL được nhân thành nhiều bản từng phần
hoặc đầy đủ và được đặt ở nhiều trạm trên mạng
Phân mảnh dữ liệu: CSDL được chia thành các mảnh nhỏ
liên kết với nhau (không trùng lặp) Mỗi phần dữ liệu được đưa đến các trạm thích hợp để sử dụng
Phương pháp hỗn hợp: CSDL được chia thành nhiều phần:
quan trọng và không quan trọng Phần ít quan trọng được lưu trữ một
nơi, phần quan trọng được lưu trữ ở nhiều nơi khác nhau
1.5.1 Phân mảnh dữ liệu
Sự phân mảnh là chia dữ liệu trong các bảng dữ liệu thành các bộ hoặc các bảng dữ liệu con Có ba kiểu phân mảnh một quan hệ tổng thể: Phân mảnh ngang, phân mảnh dọc, phân mảnh hỗn hợp [1] Một sự phân mảnh là đúng đắn nếu tuân thủ 3 quy tắc sau: Tính đầy đủ; tính phục hồi; tính tách biệt
1.5.1.1 Phương pháp phân mảnh ngang
Phân mảnh ngang là chia quan hệ thành nhiều các nhóm bộ Kết quả của quá trình phân mảnh ngang là các quan hệ con, số lượng quan
hệ con phụ thuộc vào điều kiện ràng buộc của các thuộc tính Các bộ
Trang 7trong các quan hệ con là tách biệt nhau Phân mảnh ngang thực chất là phép chọn quan hệ thỏa mãn một biểu thức điều kiện cho trước
Có hai loại phân mảnh ngang: Phân mảnh ngang nguyên thủy và phân mảnh ngang dẫn xuất
a Phân mảnh ngang nguyên thủy
Phân mảnh ngang nguyên thuỷ được định nghĩa bằng một phép toán chọn trên các quan hệ đích của một lược đồ của CSDL Vì thế, cho biết quan hệ R, các mảnh ngang của R là các Ri: Ri = σFi (R),
1 ≤ i ≤ n Trong đó, Fi là biểu thức đại số quan hệ hội sơ cấp có dạng chuẩn hội
b Phân mảnh ngang dẫn xuất
Phân mảnh ngang dẫn xuất là sự phân chia một quan hệ ban đầu thành các quan hệ thứ hai khác mà các quan hệ đó liên hệ với quan
hệ ban đầu bằng một khoá ngoài Điều này như là liên hệ dữ liệu giữa quan hệ ban đầu và quan hệ thứ hai được phân mảnh trong cùng một cách
1.5.1.2 Phương pháp phân mảnh dọc
Phân mảnh dọc cho một quan hệ R sinh ra các mảnh R1, R2, ,
Rr, mỗi mảnh chứa một tập con thuộc tính của R và khoá của R
Một phân mảnh dọc là đúng đắn nếu thỏa mãn ba quy tắc sau:
- Tính đầy đủ: Nếu một thuộc tính xuất hiện trong một quan hệ tổng thể thì nó cũng phải xuất hiện trong một mảnh dọc nào đó
- Tính phục hồi: Cần phải thêm vào mỗi mảnh khoá chính, do đó việc xây dựng lại được là nhờ vào phép kết nối các mảnh dọc theo các thuộc tính chung
- Tính tách biệt: Ít nhất khoá phải được lặp lại trên tất cả các mảnh để đảm bảo cho phép xây dựng lại, nên ở đây không thể xem là rời nhau hoàn toàn được
Trang 8Số hóa bởi Trung tâm Học liệu – ĐHTN
b Không có nhân bản dữ liệu: Mỗi phân mảnh chỉ được lưu
trữ trên một trạm, phương án này còn được gọi là định vị không
dư thừa dữ liệu
c Nhân bản dữ liệu từng phần: Một vài phân mảnh có thể được
tạo bản sao và có thể một số phân mảnh sẽ không có bản sao
Trang 9Chương 2 TỐI ƯU HÓA TRUY VẤN CƠ SỞ DỮ LIỆU PHÂN TÁN 2.1 Vấn đề tối ưu hóa xử lý truy vấn
2.1.1 Bài toán xử lý truy vấn
Chức năng chính của bộ xử lý truy vấn là chuyển đổi một truy vấn mức cao (phép tính quan hệ) sang một truy vấn tương đương (đại
số quan hệ) Quá trình chuyển đổi cùng cho một kết quả như nhau [4]
Có hai phương pháp tối ưu cơ bản: Phương pháp biến đổi một câu truy vấn mức cao thành câu truy vấn tương đương ở mức thấp hơn dưới dạng biểu thức đại số quan hệ và phương pháp chọn lựa trong số các câu truy vấn dạng biểu thức đại số quan hệ tương đương một biểu thức có chi phí thời gian thực hiện và chi phí sử dụng tài nguyên là ít nhất
Tối ưu hóa truy vấn là một vấn đề quan trọng trong việc xử lý truy vấn Có nhiều phép biến đổi một truy vấn mức cao trên CSDL phân tán thành nhiều giải pháp thực hiện dưới dạng ngôn ngữ mức thấp, nhưng trong đó chỉ có một giải pháp thực hiện có hiệu quả, tối
ưu về chi phí sử dụng tài nguyên của mạng, bao gồm chi phí sử dụng
bộ nhớ, thời gian xử lý và thời gian truyền dữ liệu
Trong môi trường CSDL phân tán, chỉ số đánh giá tối ưu hóa truy vấn có thể dựa vào tổng chi phí giảm thiểu sử dụng bộ nhớ, chi phí thời gian cần thiết khi thực hiện các thao tác vào/ra dữ liệu trong
bộ nhớ và chi phí cần thiết để trao đổi dữ liệu giữa các bên tham gia vào trong quá trình xử lý truy vấn Chi phí truyền thông là một trong các nhân tố quan trọng, được quan tâm trong CSDL phân tán
2.1.2 Các quy tắc biến đổi cây đại số quan hệ
2.1.2.1 Tính chất giao hoán của các phép toán hai ngôi 2.1.2.2 Tính kết hợp của các phép toán hai ngôi
Trang 10Số hóa bởi Trung tâm Học liệu – ĐHTN
2.1.2.3 Tính lũy đẳng của các phép toán đơn ngôi
2.1.2.4 Giao hoán phép chọn với phép chiếu
2.1.2.5 Giao hoán phép chọn với các phép toán hai ngôi
2.1.2.6 Giao hoán phép chiếu với phép toán hai ngôi
2.2 Quá trình xử lý truy vấn
Quá trình xử lý truy vấn bao gồm 4 tầng: phân rã truy vấn, cục
bộ hóa dữ liệu, tối ưu hóa toàn cục và tối ưu hóa cục bộ [2]
2.2.1 Phân rã truy vấn
Phân rã truy vấn là giai đoạn đầu tiên của quá trình xử lý câu truy vấn, thực hiện việc biến đổi câu truy vấn ở dạng ngôn ngữ bậc cao thành câu truy vấn ngôn ngữ bậc thấp thực thi cho kết quả tương đương Phân rã truy vấn có thể xem như bốn bước liên tiếp nhau: Chuẩn hoá, phân tích, loại bỏ dư thừa, viết lại câu truy vấn
2.2.1.1 Chuẩn hóa: Các câu truy vấn bằng các phép tính quan hệ
được viết lại dưới dạng chuẩn tắc thích hợp cho các bước tiếp theo
Sự chuẩn hóa một câu truy vấn bao gồm đặt các lượng tử và lượng tử hóa truy vấn bằng cách áp dụng độ ưu tiên các toán tử logic
2.2.1.2 Phân tích: Câu truy vấn đã chuẩn hóa được phân tích về
mặt ngữ nghĩa nhằm loại bỏ các câu truy vấn sai càng sớm càng tốt Tìm ra truy vấn sai chỉ tồn tại với một tập con các phép tính quan hệ Thông thường sử dụng một loại đồ thị để nắm bắt ngữ nghĩa của câu truy vấn
2.2.1.3 Loại bỏ dư thừa: Câu truy vấn đúng được đơn giản hóa
bằng cách loại bỏ các phụ thuộc dư thừa Truy vấn dư thừa chỉ xuất hiện khi một truy vấn là kết quả của việc biến đổi hệ thống được áp dụng cho truy vấn của người sử dụng
2.2.1.4 Viết lại câu truy vấn: Câu truy vấn phép tính quan hệ
được xây dựng lại dưới dạng truy vấn đại số quan hệ bằng các quy tắc biến đổi
Trang 112.2.2 Cục bộ hóa dữ liệu phân tán
Cục bộ hóa dữ liệu chịu trách nhiệm dịch câu truy vấn đại số trên quan hệ toàn cục sang câu truy vấn đại số quan hệ trên các mảnh vật lý Cục bộ hóa có sử dụng các thông tin được lưu trong một lược
đồ phân mảnh
Tầng này xác định xem những mảnh nào cần cho câu truy vấn
và biến đổi câu truy vấn phân tán thành câu truy vấn trên các mảnh Tạo ra câu truy vấn trên mảnh được thực hiện qua hai bước:
- Truy vấn phân tán được ánh xạ thành truy vấn trên mảnh bằng cách thay thế mỗi quan hệ phân tán bằng chương trình xây dựng lại
có chứa các phép toán đại số quan hệ thao tác trên mảnh
- Truy vấn trên mảnh được đơn giản hoá và xây dựng lại để tạo
ra một truy vấn khác tốt hơn Quá trình đơn giản hoá và xây dựng lại
có thể được thực hiện theo những quy tắc được sử dụng trong tầng phân rã
2.2.2.1 Rút gọn cho phân mảnh ngang nguyên thủy
Để giảm các thao tác truy vấn trên quan hệ đã được phân mảnh ngang, trước hết phải xác định rõ cần thao tác trên mảnh nào và sau
đó xây dựng lại cây con, xem xét loại bỏ các quan hệ rỗng Phân mảnh ngang sẽ được sử dụng để làm đơn giản hóa các phép chọn và phép kết nối
Rút gọn phép chọn: Chọn trên các mảnh có lượng từ mâu thuẫn
với lượng từ hoá của quy tắc phân mảnh sẽ sinh ra quan hệ rỗng, ta loại bỏ chúng
Rút gọn với phép kết nối: Phép kết nối thực hiện trên các phân
mảnh ngang có thể đơn giản khi kết nối dựa theo các thuộc tính kết nối, bằng cách phân phối kết nối trên các hợp và sau đó loại bỏ các kết nối không tác dụng Việc phân phối các kết nối trên phép hợp
Trang 12Số hóa bởi Trung tâm Học liệu – ĐHTN
được phát biểu như sau: ( R1 R2) S = (R1 S) (R2 S) Trong đó, Ri là các mảnh của R và S là một quan hệ
2.2.2.2 Rút gọn cho phân mảnh ngang dẫn xuất
Phân mảnh ngang dẫn xuất là một cách để phân phối hai quan
hệ mà nhờ đó có thể cải thiện khả năng xử lý các điểm giao nhau giữa phép chọn và phép nối
Nếu quan hệ R phải phân mảnh dẫn xuất theo quan hệ S, các mảnh của R và S giống nhau ở thuộc tính kết nối sẽ nằm cùng vị trí Ngoài ra, S có thể được phân mảnh theo vị từ chọn
2.2.2.3 Rút gọn cho phân mảnh dọc
Phân mảnh dọc phân tán một quan hệ dựa trên các thuộc tính chiếu Vì vậy, phép kết nối sẽ là phép toán tái xây dựng các phân mảnh dọc Chương trình cục bộ hoá cho một quan hệ phân mảnh dọc bao gồm các kết nối của các mảnh theo thuộc tính chung Cũng như phân mảnh ngang, các câu truy vấn trên các mảnh dọc được rút gọn bằng cách xác định các quan hệ trung gian vô dụng và loại bỏ các cây con đã sinh ra chúng
2.2.2.4 Rút gọn cho phân mảnh hỗn hợp
Câu truy vấn trên các mảnh hỗn hợp có thể được rút gọn bằng cách tổ hợp các quy tắc tương ứng đã được dùng trong các phân mảnh ngang nguyên thuỷ, phân mảnh dọc, phân mảnh ngang dẫn xuất Quy tắc:
1/ Loại bỏ các quan hệ rỗng được tạo ra bởi các phép toán chọn mâu thuẫn nahu trên các mảnh ngang
2/ Loại bỏ các quan hệ vô dụng được tạo ra bởi các phép chiếu trên các mảnh dọc
3/ Phân phối các kết nối cho các phép hợp nhằm cô lập và loại
bỏ các kết nối vô dụng
Trang 132.2.3 Tối ưu hóa toàn cục
Bước này sẽ xác định thứ tự thực thi truy vấn các mảnh, trạm nào hiệu quả để truyền dữ liệu, nơi mà từng phần của câu truy vấn sẽ được thực thi
2.2.4 Tối ưu hóa cục bộ
Khi các truy vấn con được gửi đến một trạm cụ thể, nó sẽ được thực thi và tối ưu cục bộ trên trạm đó sử dụng các kỹ thuật tối ưu hóa tập trung
2.3 Tối ƣu hóa truy vấn phân tán
Mục tiêu của tối ưu hóa truy vấn là làm sao tìm ra một chiến lược gần tối ưu để thực thi câu truy vấn
2.3.1 Không gian tìm kiếm
Đối với một câu truy vấn đã cho, không gian tìm kiếm có thể được định nghĩa như một tập các cây toán tử tương đương, có được bằng cách áp dụng các quy tắc biến đổi
2.3.2 Chiến lược tìm kiếm
Có hai chiến lược cơ bản:
- Chiến lược xác định (Deterministic Strategy): Chiến lược này tiến hành bằng cách xây dựng các kế hoạch, bắt đầu từ các quan hệ
cơ sở, sau đó nối thêm một hoặc nhiều quan hệ ở mỗi bước cho đến khi thu được mọi kế hoạch khả hữu Có hai cách: Theo chiều rộng - xây dựng tất cả các kế hoạch có thể trước khi chọn kế hoạch tốt nhất (Quy hoạch động (Dynamic Programming)), theo chiều sâu – chỉ xây dựng một kế hoạch (Greedy)
- Chiến lược ngẫu nhiên (Randomized Strategy): Tiến hành tìm kiếm giải pháp tối ưu xung quanh một số điểm cụ thể Chiến lược này không đảm bảo kế hoạch tối ưu nhưng tránh chi phí cao trong tối
ưu hóa về bộ nhớ và thời gian thực hiện Chiến lược này áp dụng tốt
Trang 14Số hóa bởi Trung tâm Học liệu – ĐHTN
hơn với câu truy vấn có 5 - 6 quan hệ trở lên Hai kỹ thuật tiêu biểu
là Interative Improvement và Simulated Annealing [4]
2.3.3 Mô hình chi phí
Mô hình chi phí của bộ tối ưu hóa gồm có các hàm chi phí để dự đoán chi phí của các toán tử, số liệu thống kê, dữ liệu cơ sở và các công thức để ước lượng kích thước các kết quả trung gian
Total_cost: Tổng thời gian;
TCPU: Thời gian của một lệnh CPU;
TI/O: Thời gian cho một thao tác truy xuất/nhập đĩa;
TMSG: Thời gian cố định của việc khởi hoạt và nhận một thông báo;
TTR: Thời gian cần để truyền một đơn vị dữ liệu từ trạm này tới trạm khác, ta xem CTR là hằng số;
#insts, #I/Os, #msgsm, #byte: Tương ứng là tổng trên các trạm của tất cả các số lệnh CPU, số lần truy xuất/ nhập đĩa, số thông báo, kích thước của tất cả các thông báo
- Thời gian trả lời của câu truy:
+ T MSG * seq_#msgs + T TR * seq_#bytes
Trong đó: seq_#x (x có thể là các lệnh CPU, I/O, các thông báo, các byte) là số lớn nhất của x phải được thực hiện tuần tự đối với sự thực thi của câu truy vấn
Số liệu thống kê CSDL
Tác nhân chính ảnh hưởng đến hiệu quả hoạt động của một chiến