L 2.3.1, Cấu trúc biểu diễn dữ liệu phãỉí cấp
(1) Cff sở dữ liệu phân tán thuần nhầ
Cơ sở dữ liệu phân tán thuần nhất là loại cơ sờ dữ liệu được thiết kế bằng cách chia nhỏ cơ sở dữ liệu phân tản đĩ thành nhiều cơ sở dữ liệu địa phương. Các cơ sở dữ liệu địa phương được định vị tại một frạm và đều được quản trị bằng một hệ quản frị. => thực hiện ừên cùng một hệ điều hành.
(2). C ơ s ở d ữ liệu phãn tán khơng thuần nhất
Cơ sở dữ liệu phân tán khơng tluiần nhất là loại CO' sở dừ liệu đưọc thiết kế bàng cách hợp nhất nhiều cơ sở dữ liệu địa phưona hiện đà cĩ và đang hoạt động thành một cơ sỏ‘ dCr liệu phân tán duy nhất. Các c ơ sĩ’ dữ liệu địa plurong cĩ thế đuọc quản trị bàng các hệ quản trị ccr sị’ dữ liệu khác nhau và hệ điều hành khác nhau.
H ìrìh 2.5. Thi ết kế c ơ s ở d ữ liệu p h â n t á n k h ơ n g t h u ầ n nhất.
2 ,1 .3 . C á c đ ặ c đ iểm ch ín h của c ơ sỏ’ d ữ liệu p h â n tán
(1) Chia sẻ iàỉ nguyên
Việc chia sẻ tài nguyên cùa hệ phán tán đưọc thực hiện thịng qua mạng truyền thơng. Đe chia sẻ tài nguyên một cách cĩ hiệu quả thì mỗi tài nguyên cần đưọc quán lý bởi một chương trình cĩ giao diện truyền thơng, các tài nguyên cĩ thể được truy cập, cập nhật một cách tin cậy và nhất quán. Quản lý tài nguyên ở đây là lập kế hoạch dự phịng, đặt tên cho các lĩp tài
n g u y ê n , c h o p h é p tài n g u y ê n đ ư ợc truy cập lừ nơi này đến n a i k h á c, ánh x ạ lẻn tài n g u y ê n v à o
địa chỉ truyền t h ơ n g , ...
(2) Tính m ở
Tính mở của hệ thống máy tính là dề dàng mcy rộng phần cứng (thêm các thiết bị ngoại vi, bộ nhớ, các giao diện truyền thơng ...) và các phần mềm (các mỏ hình hệ điều hành, các giao thức truyền tin, các dịch vụ chung tài nguyên...).
Một hệ phân tán cĩ lính mở là hệ cĩ thề đirọc tạo ra từ nhiều loại phần cứng và phần mềm CLÌa nhiều nhà cung cắp khác nhau vĩi điều kiện là các thành phần nàv phải theo một tiêu chuẩn chung.
Tính m ở của hệ phân tán được xem như là mức độ bổ sung các dịch vụ dùng chung tài nguyên mà khơng phá hỏng hay nhân đỏi các dịch vụ đang tồn tại. Tính mĩ' đưọc hồn thiện
b ằ n g c ách xá c đị nh h a y p hâ n định rõ các giao diện ch ín h c ú a m ộ t h ệ và làm c h o nĩ t ư ơ n g thích
với các nhà phát triển phần mềm.
Tính mở của hệ phân tán dựa trên việc cung cấp cơ chế truyền thơng giữa các tiến trình và cơng khai các giao diện dùng đé truy cập các tài nguyên chung.
ịĩ) Khả năng song song
Hệ phân tán hoạt đ ộn g trên một mạng truyền thơng cĩ nhiều máy tính, mỗi máy cĩ thể cĩ ỉ hay ỉihiều CPU. Trong c ùng m ộ t th ị i điểm nếu cĩ N tiến trinh cùng tồn tại, ta nĩi chúng thực hiện đồng thời. Việc th ự c hiện tiến trình theo C0‘ chế phân chia thời ííian (một CPU) hay song song (nhiều CPU).
Khả năng làm việc song song trong hệ phân tán được thực hiện do hai tình huống sau: Nhiều ngưịi sử dụng đồng thời ra các lệnh hay các tương tác với các chương trinh ứng dụng.
Nhiều tiến trinh Server chạy đồng thời, mỗi tiến trình đáp ứng các yêu cầu từ các tiến trinh Client khác.
(4) Khả năng m ở rộng
Hệ phân tán cĩ khả năng hoạt động tốt và hiệu quả ở nhiều mức khác nhau. Một hệ phân tán nhỏ nhất cĩ thề hoạt động chỉ cần hai trạm làm việc và một File Server. Các hệ lớn hơn tới hàng nghin máy tính.
Khả nàng m ở rộng được đặc trưng bởi tính khơng thay đồi phần mềm hệ thống và phần, mềm ứng dụng khi hệ được mỏ' rộng. Điều này chi đạt được mức độ nào đĩ với hệ phân tán hiện tại. Yêu cầu mờ rộng khơng chi là sự mở' rộng về phần cứng, về mạng mà nĩ trải trên các khía cạnh khi thiết kế hệ phân tán.
(5) Khả năng th ứ ỉồi
Việc thiết kế khả năng thứ lồi của các hệ thống máy tính dựa trên hai giải pháp cơ bản sau:
- Dùng khả năng thay thế để đảm bảo sự hoạt động liên tục và hiệu quả. - Dùng các c h ưo ng trinh hồi phục khi xảy ra sự cố.
Xây dựng một hệ thống cĩ thể khắc phục sir cố theo cách thứ nhất thi người ta nối hai máy tính với nhau để thực hiện cùng một chương trình, một trong hai máy chạy ờ chế độ Standby (khơng tải hay chờ). Giải pháp này tốn kém vi phải nhân đơi phần cứng cúa hệ thống. Một giải pháp để giảm phí tồn là các Server riêng lé được cung cấp các ứng dụng quan trọng để cĩ thể thay thế nhau khi cĩ sự cố xuất hiện. Khi khơng cĩ các sự cố các Server hoạt động bình thuờng, khi cĩ sự cố trên một Server nào đĩ, các ứng dụng Clien tự chuyển hướng sang các Server cịn lại.
Cách hai thì các phần mềm hồi phục được thiết kế sao cho trạng thái dũ’ liệu hiện thời (trạng thái trước khi xảy ra sự cố) cĩ thể được khơi phục khi lỗi được phát hiện.
Các hệ phân tán cung cấp khả nãng sẵn sàng cao để đối phĩ với các sai hỏng phần cứng.
(6) Tính trong suốt
Tính trong suốt cùa một hệ phân tán được hiếu như là việc che khuất đi các thành phần riêng biệt của hệ đối với người sứ dụng và nhĩrng người lập trinh ứng dụng.
Tíĩỉh trong suổí về vị tri\ Người sử dụng khơiig cần biết vị trí vật lý của dừ liệu. Người sử dụng cĩ quyền truy cập tới đến cơ sở dữ liệu nằm bất kỳ tại vị trí nào. Các thao tác lấy, cập nhật dũ' liệu tại một điểm d ừ liệu ờ xa được tự động thực hiện bỏ’i hệ thống tại điểm đưa ra yêu cầu, người sử dụng khơng cần biết đến sự phân tán của c ơ sở dữ liệu trẻn mạng.
Tính ìn m g s u ổ í trorìg việc sưchm^'. V iệc chuyền đổi CLÌa một phần hay tồn bộ cơ sở dừ
liệu do thay đổi về tổ chức hay quản lý, khơng ảnh hưỏng tĩi thao tác ngirịi su dụng.
Tính trong suổt cua việc phúĩì chia: Nếu dữ liệu được phản chia do tãng tải, nỏ khơng
đ ư ợ c ảnh h ư ở n g tới .người sử dụng.
Tính trong suốt của s ự trùng ìặp\ Nếu dũ' liệu trùng lặp để giảm chi phí truyền thơnụ
với CO' s ở dữ liệu h o ặ c n âng c a o độ tin cậy, n g ư ị i s ử d ụ n g k h ơ n g cần biết đến đ iề u đ ĩ [1 ].
(7) Đảm hảo tin cậv vờ nhẩi lỊỉián
Hệ thống yêu cầu độ tin cậy cao: sự bí mật cua dừ liệu phai đưọc bao vệ, các chức nãnụ khơi phục hư hỏng phải đưọc đảm bảo. Ngồi ra yêu cầu của hệ thống về tính nhất quán cũng
rất q ua n t r ọ n g t r o n g t h ể hiện: k h ơ n g đ ư ợ c cĩ mâu t hu ẫn t r o n g nội d u n g d ữ liệu. K hi c ác t h u ộ c
tính dữ liệu là khác nhau thì các thao tác vẫn phải nhất quán [I].
2 .1 .4 . X ử lý d ữ liệu ph ân tán
- Đ ịnh nghĩa: x ừ lý dCr liệu phân tán là một số các hộ phận xử lý tự vận hành (khơng nhắt thiết phải cùng chủng loại) được liên kết bởi một mạng máy tính và hiệp đồng thực hiện các nhiệm vụ mà chúng được phân cơng. “Các bộ phận xử lý’' muốn nĩi đến trong định nghĩa này là các thiết bị tính tốn cĩ thể chạy được một chương trinh trên chính nĩ.
- N h ữ n g gì đirợc p h â n tán: Trong hệ cơ sỏ‘ du' liệu phân tán cĩ các thành phần sau được phân tán:
(1). Thiết bị xử lý: Thiél bị \ ử lý phản tán ngầm định thoa màn phân tán vì các bộ phận
c ủ a m ạ n g m á y tính đ ư ợc phân bố tại c á c vị trí địa lý k h á c nhau.
(2). Chức năng: Nhiều chức năng cíia hệ thống cĩ thể chuyển giao cho nhiều bộ phận khác nhau.
(3). Dữ liệu: Dữ liệu được dùiig bời một số ứng dụng khác nhau cĩ thể đưọc phân bố tại các vị trí khác nhau.
(4). Quyền điều khiển: Một số cơng việc trong hệ thống được phân cấp chia quyền theo chức năng.