Hiệu năng và tính mở rộng

Một phần của tài liệu Cơ sở dữ liệu XML trong tổ chức quản lý ngân hàng câu hỏi theo tiêu chuẩn QTI (Trang 56)

Trong phần này các tác giả đã đưa ra một số kết quả thực nghiệm để ước lượng được hiệu quả của các chỉ số eXist và xử lý truy vấn. Ở phần này có sự so sánh với eXist, và Xindice của Apache và một máy truy vấn XPath ngoài dựa trên cách duyệt cây cổ truyền. Trong lần thí nghiệm thứ 2 các tác giả xử lý cùng tập các truy vấn đó nhưng với lượng dữ liệu tăng để kiểm tra tính thay đổi của eXist.

Tập dữ liệu XML với kích thước 39.15MB chứa 5000 tài liệu lấy từ một cơ

sở dữ liệu phim. Từng tài liệu miêu tả một bộ phim bao gồm tiêu đề, thể loại, xếp loại, danh tiếng và bố cục đầy đủ, một bản tóm tắt cốt truyện và lời bình của các nhà phê bình. Kích thước tài liệu khác nhau từ 500bytes đến 50KB phụ thuộc vào số các và lời bình. Thí nghiệm được chạy trên PC với bộ xử lý AMD Athlon 4, 1400MZ và bộ nhớ 256 MB chạy Mandrake Linux 8.2 và Java Development Kit 1.4 của Sun.

Các tác giả công thức hóa các truy vấn cho các tài liệu được chọn ngẫu nhiên. Ví dụ, yêu cầu thông tin tiêu đề của tất cả các phim miền tây hoặc các phim có các diễn viên hoặc các đặc điểm nào đó.

Máy Jaxen Xpath được chọn để thể hiện một máy truy vấn dựa vào việc duyệt cây từ trên xuống theo cách duyệt truyền thống. Jaxen chạy trên đỉnh của thực thi DOM kiên cố của eXist. Thêm vào đó, các tác giả xử lý cùng tập truy vấn với một bản NXD, Xindice của Apache. Bởi vì Xindice đòi hỏi tạo chỉ số

bằng tay, các tác giảđịnh nghĩa một chỉ số trên các phẩn tử tham chiểu bởi các truy vấn của mình. Các khách hàng thử nghiệm sử dụng XML:DB API để truy cập tới Xindice cũng như tới eXist.

Mỗi truy vấn trong tập hợp được lặp lại 10 cho từng lần kiểm thử chạy cho phép B+- Tree phân trang bộ đệm cho hiệu quả. Điều này tương ứng với các phép chuẩn hóa CSDL, máy chủ CSDL có thể chạy trong khoảng thời gian lâu hơn với rất nhiều người dùng thực hiện các truy vấn tương tự nhau với khía cạnh các tập tài liệu vào và các phép chọn thuộc tính phần tử. Xindice và eXist sử dụng cùng cơ sở mã B+- Tree. Chạy trên đỉnh DOM kiên cố của eXist, Jaxen tận dụng các cơ chế bộđệm trang

Như đã miêu tảở trên, eXist không tạo một chỉ số trên phần tử và giá trị

thuộc tính. Đối với một lần chạy thử thứ hai, chúng tôi đã thay thế toàn bộ các biểu thức so sánh chính khác bằng các biểu thức tìm kiếm fulltext tương ứng. Ví dụ, biểu thức //movie[.//credit=’Gable, Clark’] được công thức hóa lại như sau //movie[near(.//credit, ‘Gable, Clark’)].

Thời gian thực thi truy vấn trung bình cho các truy vấn chọn lọc được thể

hiện trong bảng dưới đây. Thời gian thực thi đối với các tập kết quả lấy được không được tính. Chúng cũng tương tự với các các tiếp cận dựa trên eXist. Các kết quả lấy ra phụ thuộc vào hiệu năng của sắp xếp của eXist, cái này không có kết nối tới máy truy vấn.

Các kết quả của các tác giả thể hiện rằng máy truy vấn của eXist thực hiện tốt hơn so với các máy khác.

Các kết quả của Xindice cho thấy rằng các phép chọn trên trục tổ tiên (dùng ký tự //) không được hỗ trợ tốt trong việc thực thi XPath của họ. Ngược lại thì eXist điều khiển các kiểu biểu thức này rất hiệu quả.

Trong lần thử nghiệm thứ hai, tập 5000 tài liệu được tách thành 10 tập con. Để kiểm tra tính mở rộng các tác giả đã đưa thêm vào trong CSDL một tập con cho từng lần kiểm thử tuần tự và ma trận hiệu năng tính được cho eXist với XPath chuẩn và các tập truy vấn XPath mở rộng. Do kích thước dữ liệu XML còn thô được xử lý bởi từng vòng kiểm thử tăng từ 5MB cho tập hợp đầu tiên tới 39.15MB cho 10 tập hợp.

Như lần kiểm thử trước, từng truy vấn được lập lại 10 lần. Thời gian thực thi truy vấn trung bình cho tập các truy vấn được thể hiện ở hình dưới đây. Các tác giảđã quan sát đối với tất cả các tập truy vấn mà thời gian thực thi trung bình tăng tuyến tính với việc tăng kích thước dữ liệu nguồn. Do đó lần kiểm thử này thể hiện độ mở rộng tuyến tính của kiến trúc truy vấn, lưu trữ và đánh chỉ số của eXist.

Hình 3.6: Thời gian thực thi truy vấn trung bình theo dung lượng dữ liệu

Ngoài việc cung cấp tài liệu chi tiết hướng dẫn cho người dùng cũng như

những nhà phát triển sử dụng sản phẩm của mình thì các nhà phát triển eXist còn thường xuyên cập nhật và hoàn thiện theo phản ảnh nhận được. Các tài liệu được các nhà phát triển eXist cung cấp hỗ trợ cho người sử dụng theo mọi khía cạnh: từ người sử dụng sản phẩm thông thường cho đến những nhà phát triển muốn tùy biến eXist cho phù hợp hơn với nhu cầu công việc và tài nguyên của của mình.

Một phần của tài liệu Cơ sở dữ liệu XML trong tổ chức quản lý ngân hàng câu hỏi theo tiêu chuẩn QTI (Trang 56)