VII. Các mô hình phân tán dữ liệu trong Oracle
2. Phơng pháp phân tán Partition
a. Định nghĩa:
Phơng pháp phân tán Partition thực hiện phân chia bảng dữ liệu của quan hệ tổng thể thành các bảng dữ liệu độc lập nhng có cấu trúc giống hệt nhau, sau đó định vị chúng vào các vị trí thích hợp.
CSDL 1 CSDL ... CSDL 3 database link database link database link Trung tâm CSDL 2 database link
Hình 4.III: Mô hình phân tán dữ liệu Partition
Nh vậy phơng pháp Partiton sử dụng kỹ thuật phân đoạn ngang cơ sở trong quá trình phân tán dữ liệu. Các CSDL từ xa kết nối với nhau thông qua database link.
Các khái niệm về vị trí chủ và vị trí ảnh trong phơng pháp này đợc đề cập đến: Thông thờng các CSDL đợc định vị tại các vị trí ( trong thực tế thờng là các chi nhánh ), trung tâm sẽ tổng hợp CSDL tại các chi nhánh qua các Snapshot. Nh vậy, các chi nhánh thờng đóng vai trò là vị trí chủ và trung tâm là vị trí ảnh. Cũng có dữ liệu chỉ đợc cập nhật tại vị trí trung tâm, các chi nhánh muốn tra cứu sẽ qua Snapshot. Khi đó trung tâm đóng vai trò là vị trí chủ còn các chi nhánh đóng vai trò là vị trí ảnh.
Mỗi vị trí có một CSDL độc lập nhng không giống nh ở phơng pháp phân tán hoàn toàn. Trong phơng pháp này mỗi khi cần tổng hợp báo cáo thông tin về một loại dữ liệu nào đó thì tại vị trí trung tâm, theo định kỳ dữ liệu sẽ đợc làm tơi toàn bộ, phản ánh đúng tình trạng dữ liệu tại các vị trí. Sau đó mới bắt đầu công việc tổng hợp báo cáo các thông tin theo yêu cầu.
Quá trình làm tơi dữ liệu thờng sử dụng phơng pháp làm tơi nhanh (Chỉ cập nhật các thay đổi ) do đó lợng dữ liệu truyền đi hạn chế hơn nên có thể truyền trực tiếp hoặc qua đờng điện thoại.
Để đảm bảo cho các dữ liệu đợc an toàn, tại trung tâm phải có ít nhất hai máy chủ trong đó một máy sẽ hoạt động theo chế độ dự phòng.
Thực trạng của Công ty WSC:
WSC có 4 chi nhánh ( Sài Gòn, Gia Định, Thủ Đức, Chợ Lớn) đợc phân bố trên phạm vi rộng. Mỗi chi nhánh đều có nhiệm vụ quản lý Khách hàng trong khu vực của chi nhánh:
+ Chi nhánh Sài Gòn: Quản lý Khách hàng trong khu vực Sài Gòn. + Chi nhánh Gia Định: Quản lý Khách hàng trong khu vực Gia Định. + Chi nhánh Thủ Đức: Quản lý Khách hàng trong khu vực Thủ Đức. + Chi nhánh Chợ Lớn: Quản lý Khách hàng trong khu vực Chợ Lớn. Ngoài ra Công ty WSC còn có một hệ thống mạng tơng đối hiện đại. Phân tích các đặc điểm dữ liệu về Khách hàng:
Công ty WSC phải quản lý một lợng Khách Hàng lớn trên diện rộng. Nh vậy để tạo ra các điều kiện thuận lợi trong công tác quản lý thì ngoài giải pháp phân vùng chắc chắn không còn giải pháp nào khác.
Lựa chọn giải pháp phân tán dữ liệu:
+ Chọn phơng pháp phân tán hoàn toàn: Dữ liệu về Khách Hàng tập chung ở một chi nhánh là không thể phù hợp cho công tác quản lý gây khó khăn không những cho Công ty mà còn cho cả Khách Hàng vì khoảng cách quá xa. Mặt khác nó làm ảnh hởng đến các ứng dụng khác ( tính hoá đơn ... ) của toàn bộ hệ thống vì những ứng dụng đó cũng cần có các thông tin chính xác về Khách Hàng. Và còn rất nhiều các khó khăn khác nếu dữ liệu đợc phân tán theo phơng pháp hoàn toàn.
+ Chọn phơng pháp phân tán sử dụng các replication: Chỉ trung tâm mới đợc cập nhật trực tiếp vào CSDL còn các chi nhánh chỉ đợc “ tra cứu “ CSDL qua các Snapshot. Nh vậy các chi nhánh không thực hiện một thao tác nào đối với CSDL, quá trình xử lý đều tập chung ở trung tâm. Nh vậy giải pháp này cũng sẽ gặp phải những khó khăn tơng tự nh giải pháp phân tán hoàn toàn.
+ Chọn phơng pháp phân tán Partition: Đây chính là giải pháp phù hợp cho bài toán này, các Khách Hàng sẽ đợc quản lý trực tiếp tại chi nhánh thuộc chính khu vực của Khách Hàng ( Khách Hàng ở Sài Gòn, Gia Định, Chợ Lớn, Thủ Đức sẽ do các chi nhánh tơng ứng Sài Gòn, Gia Định, Chợ Lớn, Thủ Đức quản lý), các ứng dụng khác nh tính hoá đơn cũng đợc thực hiện tơng ứng với
từng Khách Hàng trong khu vực. Trung tâm là nơi lu trữ các dữ liệu của riêng nó và ảnh dữ liệu (Snapshot) của tất cả các vị trí phục vụ công tác quản lý và tổng hợp báo cáo...
Nh vậy dữ liệu về Khách Hàng đợc các chi nhánh lu trữ trong các bảng có cấu trúc tơng tự nh nhau ( cùng có các thuộc tính: Mã Khách Hàng, tên Khách Hàng, địa chỉ, ... ) chỉ các thông tin đợc cập nhật thật sự vào các bảng tại các chi nhánh là khác nhau.
Trong các phần sau sẽ trình bày cụ thể cách thực hiện giải pháp trên trong ứng dụng của WSC.
c. Các u điểm của phơng pháp Partition: +Tránh insert một hàng sai vị trí.
+ Cho phép thực hiện nhanh hơn các thao tác: Lấy dữ liệu, sửa, tạo index... tại từng Partition do đó giảm đợc thời gian xử lý dữ liệu.
d. Các nhợc điểm của phơng pháp Partition:
+ Thực hiện phân chia dữ liệu tơng đối phức tạp.
e. Các ứng dụng phù hợp:
+ứng dụng có lợng dữ liệu lớn.
+ Các ứng dụng có phạm vi địa lý tơng đối rộng.
+ Các dữ liệu bị ràng buộc bởi một số điều kiện khách quan.