Chƣơng 1 Tìm hiểu về các hệ cơ sở dữ liệu phân tán
1.4 Các yếu tố phức tạp
Các vấn đề gặp phải trong các hệ CSDL sẽ phức tạp hơn trong các môi trường phân tán, dù rằng các nguyên tắc cơ bản đều như nhau. Hơn nữa, tính chất phức tạp này còn làm nảy sinh nhiều vấn đề mới, do ảnh hưởng bởi ba yếu tố chính.
Trước tiên là trong môi trường phân tán, dữ liệu có thể được nhân bản. Một CSDL phân tán có thể được thiết kế để toàn bộ CSDL hoặc các phần của nó được lưu tại các vị trí khác nhau trong một mạng máy tính. Vấn đề không phải ở chỗ là mọi vị trí trong mạng đều chứa CSDL; điều quan trọng là CSDL nằm tại nhiều vị trí. Nhân bản các mục dữ liệu chủ yếu là để tăng độ tin cậy và hiệu quả hoạt động. Như thế các hệ CSDL phân tán phải chịu trách nhiệm chọn ra một bản sao của dữ liệu được yêu cầu khi có truy xuất, và bảo đảm rộng tác dụng cập nhật được phản ánh trên tất cả các bản sao của mục dữ liệu đó.
Điểm thứ hai là nếu một số vị trí gặp sự cố (thí dụ do rối loạn hoạt động của phần cứng hoặc phần mềm) hoặc nếu một số đường truyền bị hỏng (làm hệ thống mất liên lạc với một số vị trí) trong lúc một thao tác cập nhật đang được tiến hành
thì hệ thống phải bảo đảm rằng các tác dụng đó sẽ có ở trên dữ liệu ở những vị trí bị mất liên lạc sau khi hệ thống đã khôi phục lại hoạt động.
Điểm thứ ba là bởi vì mỗi vị trí không thể có được thông tin tức thời về các hoạt động đang diễn ra tại những vị trí khác, việc đồng bộ hóa các giao dịch trên nhiều vị trí sẽ khó khăn hơn so với hệ thống tập trung.
Những khó khăn này đã chỉ ra một số vấn đề cần giải quyết trong các hệ quản trị CSDL phân tán và được thảo luận ở bên dưới.
Tính phức tạp
Các vấn đề của hệ CSDL phân tán cố nhiên là phức tạp hơn so với các hệ tập trung vì chúng không những có cả những vấn đề của môi trường tập trung mà còn có cả hàng loạt những vấn đề mới chưa được giải quyết.
Chi phí
Các hệ phân tán đòi hỏi phải có thêm các thiết bị mới (thiết bị truyền thông, …) và như thế làm tăng chi phí phần cứng. Tuy nhiên xu hướng giảm giá thành của thiết bị làm cho điều này trở thành một yếu tố ít quan trọng. Phần chi phí đáng kể nằm ở chỗ nó cần phải có các phần mềm và phương pháp truyền thông phức tạp hơn nhằm giải quyết một số vấn đề về kỹ thuật. Việc phát triển các kỹ thuật công nghệ phần mềm (các chương trình phát hiện và gỡ rối phân tán) rất có ích về phương diện này.
Có lẽ thành phần chi phí quan trọng nhất là chi phí về nhân lực. Khi các thiết bị máy tính được xây dựng ở nhiều vị trí khác nhau, chúng đòi hỏi phải có con người điều hành và quản lý. Kết quả là phải tăng thêm nhân sự cho các hoạt động xử lý dữ liệu. Vì thế chúng ta cần phải phân tích cẩn thận giữa việc tăng lợi nhuận do thông tin được sử dụng hiệu quả và kịp thời với chi phí về nhân sự.
Phân tán quyền điều khiển
Điểm này đã được nêu ra trước đây như một ưu điểm của các hệ CSDL phân tán. Việc điều khiển phân tán có thể trở thành một gánh nặng nếu không có những chiến lược phù hợp để giải quyết chúng.
Tính an ninh (bảo mật)
Một trong những lợi ích chính của các CSDL tập trung là chúng bảo đảm kiểm soát được các truy xuất dữ liệu. An ninh dễ dàng kiểm soát được ở vị trí trung tâm
CSDL phân tán, môi trường mạng kèm theo sẽ có các yêu cầu an ninh của riêng chúng. Chúng ta đã từng thấy nhiều vấn đề nghiêm trọng khi phải bảo đảm an ninh trên các mạng máy tính. Vì thế về bản chất, vấn đề an ninh trong các hệ CSDL phân tán rõ ràng là phức tạp hơn so với các hệ tập trung.