Nhu cầu phân đoạn dữ liệu

Một phần của tài liệu Thuật toán tụ năng lượng BEA (bond energy algorithm) trong thiết kế cơ sở dữ liệu phân tán tuyển sinh trung học phổ thông tỉnh thái nguyên (Trang 37 - 38)

2. Cấu trúc luận văn

2.1.2.Nhu cầu phân đoạn dữ liệu

Trong thiết kế cơ sở dữ liệu phân tán, việc phân đoạn dữ liệu là vô cùng quan trọng vì các lý do sau đây:

Dữ liệu được lưu theo dạng bảng hai chiều, chiều ngang và chiều dọc, các thao tác trên cơ sở dữ liệu thực chất là thao tác trên các bảng dữ liệu. Nếu không phân đoạn dữ liệu, các truy vấn và xử lý sẽ phải quét toàn bộ dữ liệu trên bảng để đưa ra được một kết quả đúng. Nếu dữ liệu bảng rất lớn thì việc xử lý và truy vấn sẽ rất lâu.

Hình 2.2. Phân đoạn dữ liệu

Việc phân đoạn dữ liệu giúp cho quá trình truy vấn và xử lý dữ liệu nhanh hơn, vì khi đó bảng dữ liệu được phân thành nhiều mảnh, mỗi mảnh

Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn

được xử lý như một đơn vị dữ liệu. Sẽ cho phép thực hiện các giao dịch đồng thời. Các xử lý không phải quét toàn bộ dữ liệu của bảng mà chỉ cần quét trên các mảnh dữ liệu đúng với điều kiện truy vấn. Đồng thời việc phân đoạn các quan hệ cũng cho phép thực hiện song song một câu truy vấn bằng cách chia nó thành một tập các truy vấn con thực hiện trên các mảnh. Vì vậy việc phân đoạn sẽ làm tăng mức hoạt động đồng thời và tăng lưu lượng hoạt động của hệ thống.

Tuy nhiên việc phân đoạn dữ liệu không được tối ưu hoàn toàn mà nó có một số hạn chế như sau:

1. Nếu ứng dụng có các khung nhìn được định nghĩa trên nhiều mảnh dữ liệu khác nhau sẽ làm giảm hiệu suất hoạt động của hệ thống, làm tăng truy xuất dữ liệu đến các mảnh và tăng chi phí kết nối các mảnh.

2. Việc kiểm soát ngữ nghĩa và tính toàn vẹn sẽ khó khăn hơn.

Một phần của tài liệu Thuật toán tụ năng lượng BEA (bond energy algorithm) trong thiết kế cơ sở dữ liệu phân tán tuyển sinh trung học phổ thông tỉnh thái nguyên (Trang 37 - 38)