Cơ sở dữ liệu phân tán nói riêng và các hệ phân tán nói chung là một lĩnh vực nghiên cứu không mới, nhưng gần đây, do sự phát triển nhanh chóng của công nghệ truyền thông và sự bành trướ
Trang 1ĐẠI HỌC ĐÀ NANG TRƯỜNG ĐẠI HỌC SƯ PHAM
O00
HE PHAN TAN TEN DE TAI: XAY DUNG GIAI THUAT CHO PHEP, KHI VAN HANH HE, VAN
DAM BAO GAN BO DU LIEU
Thành viên thực hiện : Nguyễn Thị Thùy (21CNTT2)
: Van Anh Thu (21CNTT2) : Ngõ Hoàng Anh (2ICNT T2)
: Bui Thi An Binh (21CNTT1) : Lê Nguyễn Hải Tiến (21CNTT2) Giảng viên hướng dẫn : TS Dang Hung Vi
Trang 2MỤC LỤC
CHƯƠNG II: SỰ GẮN BÓ THÔNG TIN TRONG CƠ SỞ DỮ LIỆU PHẦN TÁN 11
2.1 Khái niệm về gắn bó thông tin và các cơ chế trong hệ phân tán - 5c c5 sec 11 2.1.1 Khái niệm 11 2.2 Cơ chế trong cơ sở dữ liệu phân tán wit 2.3 Hướng phát triển Top-down và Botton-up csdl phân tán 13
CHƯƠNG 3: CÁC THUẬT TOAN DAM BAO SU GAN BO THONG TIN TRONG CO SO DU’
CHƯƠNG 4: TẬP TRUNG GIẢI QUYẾT BÀI TOÁN ĐA SERVER s-55 255cc sec 17
4.2 Phát biểu nguyên lý nhiều bản sao 17
4.3.2 Giải quyết bài toán 18
4.3.3 Vấn đề cần giải quyết cho bài toán đỗ xe à.s ác HH T111 1xx 19
Trang 3Bang: 5 Bốn thực thê của hệ tin hoc phân tán - 12 222221022112 11 1121211151 1111 21x rey 7
Bảng: 6 Cách truy cập CSDL phân tán trực tiẾp 5c 2E 11 21 5 2 HH ra 9 Bảng: 7 Cách truy xuất CSDL phân tán gián tiẾp - 5c c1 E122111 12t errrre, 10 Bảng: 8 Mô phỏng bãi đỒ xe S1 TT HH 1x HH 1212211 ngang 18 Bang: 9 Thong tin phat ổI - c0 2221212121211 121 1115111211211 1111118112115 1111111811 k che 20
Bang: 10 Trật tự các thông điệp gửi đến từ các trạm s-scs nnnnnn Hee 20
Bảng: 1l Quy tẮC c2 HH HH HH nh n1 HH nga 21
Trang 4MỞ ĐẦU
Trong những năm gần đây, những thành tựu về Khoa học - Công nghệ
phát triển mạnh mẽ đã làm thay đổi bộ mặt của xã hội nước ta Đặc biệt là sự phát triển
vượt bậc trong lĩnh vực Công nghệ thông tin Cơ sở dữ liệu phân tán nói riêng và các hệ phân tán nói chung là một lĩnh vực nghiên cứu không mới, nhưng gần đây, do sự phát triển nhanh chóng của công nghệ truyền thông và sự bành trướng mạnh mẽ của mạng Internet cùng với xu thế toàn cầu hóa trong mọi lĩnh
vực, đặc biệt là về thương mại, cơ sở dữ liệu phân tán đã trở thành một lĩnh vực thu hút
nhiều sự quan tâm của các nhà nghiên cứu lý thuyết lẫn các nhà sản xuất phần mềm Trên thực tế, một xu hướng kỹ thuật mới ra đời - xu hướng phân tán các thành phân tạo nên hệ tin hoc theo hướng tiếp cận nơi sử dụng và sản xuất thông tin Song để khai thác có hiệu quả toàn hệ, vấn đề quan trọng hàng đầu cần phải tính đến là các tài nguyên nói chung, đặc biệt là tài nguyên thông tin nói riêng và chiến lược khai thác, sử dụng chúng một cách tối ưu nhất
Một ví dụ điển hình được đưa ra đối với hệ tin hoc phân tán đó là việc quán lý các tài
khoản của một ngân hàng Mỗi một người mở tài khoản tại ngân hàng sẽ được lưu trữ trong một bản ghi của CSDL Chủ tài khoản có thể ở bất kì nơi nào trong cả nước cũng có thể truy cập vào tài khoản của mình thông qua mã số tài khoản Giả sử hai người cùng nhau mở một tài khoản trong ngân hàng, lúc này đây hai người ở hai ngân hàng khác nhau cùng (ruy cập vào tài khoản chung của họ Một người truy cập vào dé rút tiền còn người kia truy cập vào đề xem sô tiền còn lại của mình Nếu 2 công việc này xảy ra dong thời cùng một lúc thi van dé gi sẽ xảy ra? Vấn đề sai lệch thông tin cho người muốn truy cập để xem số tiền còn lại là điều đương nhiên Ngăn chặn khuyết điểm này người ta đưa ra hàng loạt các phương pháp, thuật toan dé dam bao khi trao đôi thông tin van dam bao tinh gan bo (nhat quan) trong vấn đề cập nhập thông tin cũng như truy vấn thông tin, trong đó vấn đề về sự gắn bó thông tin trong cơ sở dữ liệu phân tán là một trong những van dé co bản
Trang 5CHUONG I: TONG QUAN CO SO DU LIEU PHAN TAN 1 GIOL THIEU VE CO SO DU LIEU PHAN TAN
1.1 Giới thiệu Công nghệ về các hệ cơ sở dữ liệu phân tán (distributed database system, DDBS) là sự hợp nhất của hai hướng tiếp cận đối với quá trình xử lý dữ liệu: Công nghệ cơ sở dữ
liệu và công nghệ mạng máy tính Các hệ cơ sở dữ liệu chuyên từ mô thức xử lý dữ liệu,
trong đó mỗi ứng dụng định nghĩa và duy trì đữ liệu của riêng chúng sang mô thức quản lý và xử lý dữ liệu tập trung Hướng đi này dẫn đến tính độc lập dữ liệu, nghĩa là các ứng dụng được “miễn nhiệm” đối với những thay đổi về tổ chức lôgíc hoặc vật ly của dữ liệu và ngược lại
Mô tả đữliệu | ĐÀ TẠPTIN 3
Bảng: 1 Xử lý tập tin truyền thông
Một trong những động lực thúc đây việc sử dụng hệ cơ sở dữ liệu là nhu cầu tích
hợp các dữ liệu hoạt tác của một xí nghiệp và cho phép truy xuất tập trung, nhờ vậy có thê điều khiên được các truy xuất đến dữ liệu, còn công nghệ mạng đi ngược lại với mọi no lye tập trung hóa Nhìn thoáng qua, chúng ta khó hình dung ra làm cách nảo tiếp cận
hai hướng trái ngược nhau dé cho ra một công nghệ mạnh mẽ và nhiều hứa hẹn hơn so
với từng công nghệ riêng lẻ Mẫu chốt của vấn đề là cần phải hiểu rằng, mục tiêu quan trọng nhất của công nghệ cơ sở dữ liệu là sự tích hợp không phải sự tập trung hóa, cũng cần phải hiểu rằng hai thuật ngữ có được điều này không dẫn đến điều kia Và vẫn có thê
Trang 6tích hợp mà không cần tập trung hóa Đây chính là mục tiêu của công nghệ cơ sở dữ liệu
phân tán CHƯƠNG TRÌNH I
1.2 Định nghĩa cơ sở dữ liệu phân tán
Chúng ta có thể định nghĩa một cơ sở dữ liệu phân tán là một tập nhiều cơ sở đữ liệu có liên đới logíc và được phân bố trên một mạng máy tính Vậy hệ quản trị cơ sở dữ liệu
phân tán được định nghĩa là một hệ thống phần mềm cho phép quản trị các hệ cơ sở dữ liệu phân tán và làm cho việc phân tán trở nên “vô hình” đối với người sử dụng Hai thuật ngữ quan trọng trong định nghĩa này là “liên đới lôgic` và “phân bố trên một mạng máy tính”
Một hệ cơ sở dữ liệu phân tán (distributed database system, viét tắt là DDBS) không
phải là một “tập các tập tin” lưu riêng lẻ tại mỗi nút của một mạng máy tính Để tạo ra một hệ cơ sở dữ liệu phân tán, các tập tin không những có lién doi logic ma chung con phải có cấu trúc và được truy xuất qua một giao diện chung
Ngoài ra, một hệ cơ sở dữ liệu phân tán không phải là hệ thống trong đó dù có sự
hiện diện của một mạng máy tính, cơ sở dữ liệu chỉ nằm tại một nút của mạng Trong
trường hợp này, vấn đề quản trị cơ sở dữ liệu không khác với việc quản trị cơ sở dữ liệu trong hệ tập trung Cơ sở dữ liệu này được quản lý tập trung tại một hệ thông máy tính (trạm 2 trong hình dưới) và tất cả mọi yêu cầu đều chuyên đến vị trí đó Điều cần xem xét
là độ chậm trễ khi truyền dữ liệu Hiển nhiên là sự tồn tại của một mạng máy tính hoặc một tập các tập tin không đủ để tạo ra một hệ cơ sở dữ liệu phân tán Điều chúng ta quan tâm là một môi trường trong đó dữ liệu được phân tán trên một số vị trí
Trang 7liệu
Bảng: 4 Miôi trường của hệ CSÙL phân tán Trong hệ thông cơ sở dữ liệu phân tán, cơ sở dữ liệu chứa trong vài máy tính Các máy tính liên lạc với nhau qua nhiều phương tiện truyền thông, như bus tốc độ cao hay đường điện thoại Chúng không chia sẻ bộ nhớ chính, cũng không dùng chung đồng hồ
Các bộ xử lý trong hệ thông phân tán có kích cỡ và chức năng khác nhau Chúng có thê gồm các bộ vi xử lý, trạm làm việc, máy tính mini, hay các máy tính lớn vạn năng
Trang 8Những bộ xử lý này được gọi tên là các ứrợm, núi, máy tính và cả những tên tùy theo ngữ cảnh riêng
Trong hệ thống cơ sở dữ liệu phân tán gồm nhiều trạm, mỗi trạm có thê khai thác
các giao thức truy nhập dữ liệu trên nhiều trạm khác Sự khác nhau chính giữa hệ thống
cơ sở dữ liệu phân tán và tập trung là: trong hệ thống tập trung, dữ liệu lưu trữ tại chỗ, còn phân tán thì không
Bang: 5 Bốn thực thể của hệ tin học phân tán
1.4 Đặc điểm cơ bản của hệ phân tán
tài dùng chung tài nguyên Một tiền trình trên một trạm nào đó có thê
Trang 9nguyên yêu cầu được cung cấp tài nguyên dung chung ở một trạm khác
2 Liên lạc Khi hệ thông đã được mặc nôi với nhau, các thực thê của hệ có thê
trao đối thông tin cho nhau
3 Tin cay
Một trạm của hệ bị sự cổ không làm cho toàn hệ bị ảnh hưởng, mà
ngược lại, công việc của trạm đó được phân cho các trạm khác đảm nhiệm Ngoài ra, trạm bị sự cô có thể được tự động phục hồi lại các trạng thái trước khi bị sự cô hay trạng thái ban đầu của nó
1.5 Mô hình hệ cơ sở dữ liệu phân tán Hệ quản trị cơ sở dữ liệu phân tán cung cấp công cụ như tạo lập và quản lý cơ sở dữ liệu phân tán Phân tích đặc điểm của hệ thống quản trị cơ sở dữ liệu phân tán như dưới đây đề phân biệt hệ thống phát triển theo kiểu thương mại có sẵn và kiêu mẫu phân tán Hệ thống phát triển theo kiêu thương mại có sẵn được phát triển bởi những người cung cấp hệ cơ sở dữ liệu tập trung Hệ cơ sở dữ liệu tập trung mở rộng bằng cách thêm vào những phần bô xung qua cách cung cấp thêm đường truyền và điều khiển giữa các hệ quản trị cơ sở dữ liệu tập trung cài đặt ở những điểm khác nhau trên mạng máy tính Những phần mềm cần thiết cho việc xây dựng cơ sở dữ liệu phân tán là:
- Phan quan ly co sé dir ligu ( Database Management - DB ) - Phan truyén théng dé liéu (Data Communication - DC ) - Tw dién di ligu được mở rộng để thê hiện thông tin về phân tán dữ liệu trong
mang may tinh (Data Dictionary - DD) - Phan co sé dé ligu phan tan (Distributed Database DDB)
M6 hinh cac thanh phan của hệ quản tri co sở dữ liệu phát triển theo kiểu thương mại
(Truy cập từ xa trực tiếp)
Trang 10
Bảng: 6 Cách truy cập CSDL phân tán trực tiếp
Những dịch vụ hệ quản trị cơ sở dữ liệu cung cấp:
Cách thức truy cập dữ liệu từ xa: bằng chương trình ứng dụng — Lựa chọn một cấp độ trong suốt phân tán thích hợp: cho phép mở rộng hệ thống theo nhiều cách khác nhau theo từng hoàn cảnh (phải cân nhắc giữa cấp độ trong suốt phân tán và phân chia công việc thực hiện để công việc quán trị hệ thông đơn giản hơn)
— Quản trị và điều khiển cơ sở dữ liệu bao gồm công cụ quản lý cơ sở dữ liệu, tập hợp thông tin về các thao tác trên cơ sở dữ liệu và cung cấp thông tin tổng thể về ñle dữ liệu đặt ở các nơi trong hệ thống
— Điều khiến tương tranh và điều khiến hồi phục dữ liệu của giao tác phân tán
Trang 11Cách thức truy cập cơ sở dữ liệu từ xa qua chương trình ứng dụng theo hai cách cơ bản: Truy cập từ xa trực tiếp và gián tiếp Mô hình truy cập từ xa qua phương thức cơ sở của
hệ quản trị cơ sở dữ liệu
10
Trang 12CHUONG II: SU GAN BO THONG TIN TRONG CO SO DU LIEU PHAN TAN 2.1 Khái niệm về gắn bó thông tin và các cơ chế trong hệ phân tán
2.1.1 Khái niệm Các đôi tượng khác nhau của hệ thông không phải là các đối tượng độc lập nhau, chúng quan hệ với nhau bởi tập hợp các quan hệ gọi là các ràng buộc toàn vẹn Các ràng
buộc này thể hiện sâu sắc các đặc tính riêng biệt của hệ Trạng thái của hệ thoả mãn một tập các ràng buộc toàn vẹn gọi là rạng thái sắn bỏ
Một cơ sở dữ liệu nào đó được gọi là găn bó, nêu nó thỏa mãn một tập các ràng buộc vệ toàn vẹn ngữ nghĩa
T Gan b6 Trước khi cập nhật (thay đôi)
Không gắn bó Trong khi cập nhật (thay đôi)
Gắn bó Sau khi cập nhật (thay đổi) 2.2 Cơ chế trong cơ sở dữ liệu phân tán
Đề đảm bảo các giao dịch trên tôn trọng sự gắn bó thông tin thì người ta đưa ra các phương pháp, cơ chế để đảm bảo khi giao dịch vẫn có sự gắn bó thông tin toàn vẹn dữ
liệu trên cơ sở dữ liệu phân tán là:
Cơ chế then cài:
o Then cài loại trừ tương hỗ o_ Then cài lựa chọn các đối tượng
11
Trang 13o_ Giao dịch hai pha
- Hé qua cua tính không chắc chắn trên trạng thía của hệ : Bây giờ ta tưởng tượng rằng các đôi tượng được phân tán trên nhiều trạm khác nhau và được nối với nhau thông qua hệ thống viễn thông và rằng các tiến trình diễn ra trên các trạm khác nhau Hệ thống viễn thông cho phép các tiến trình trên các trạm khác nhau có thể trao đổi các thông điệp với nhau Ta giả định rằng các tiến trình và các phương tiện truyền thông là các đối tượng có thê rơi vào sự cô
Các đối tượng thay đổi hay tham chiếu trong quá trình thực hiện cùng một giao
ST | Phải thực hiện
T 1 Giao dịch T bắt buộc phải thực hiện một cách trọn vẹn
2 Nếu có sự cổ xảy ra thì phải quay lại điểm xuất phát
12
Trang 14Muôn thực hiện những điêu vừa nêu ở trên, người ta đòi hỏi giao dịch phải có các
đặc tính toàn vẹn như sau:
1 Nếu một tiến trình bị sự cố trước khi kết thúc T nhưng lại sau các thao tác
thay đôi cần thiết của T, trạng thái của hệ là gắn bó
2 Nếu một tiến trình bị sự cố trước khi diễn ra các thay đổi của T, trạng thái
của hệ là gắn bó 3 Nếu một tiến trình bị sự cố giữa các thay đôi của T, trạng thái của hệ là
không gắn bó
2.3 Hướng phát triển Top-down và Botton-up csdl phân tán Trong hướng thiết kế Top- down, bắt đầu bởi việc thiết kế sơ đồ tổng thẻ, tiếp tục thiết kế
đoạn csdÏ và sau đó cấp phát các đoạn anfy cho các vị trí, tạo hình ảnh vật lí của dữ liệu
Hoàn thành hướng này qua việc thực hiện thiết kế vật lí dữ liệu để cấp phát cho dữ liệu Dùng thiết kế Botton-up khi csdl phân tán được phát triển qua việc liên kết csdl đã có san Thy tế, trong trường hợp này sơ đò toàn thể được tạo ra bởi sự thỏa hiệp giữa các
loại mô tả dữ liệu có săn
13