1. Trang chủ
  2. » Luận Văn - Báo Cáo

XÂY DỰNG ỨNG DỤNG PHÂN MẢNH DỌC HỖ TRỢ THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN

32 729 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 32
Dung lượng 1 MB

Nội dung

- Khả năng sẵn sàng của hệ thống cao bởi vì khi có lỗi ở một nơi nào đó trong hệ thống thì không cản trở hoạt động của chương trình ứng dụng.Nói chung, nguyên nhân đối lập với tính dư th

Trang 1

Trường Đại Học Công Nghệ Thông Tin

BÁO CÁO CHUYÊN ĐỀ

CƠ SỞ DỮ LIỆU NÂNG CAO

ĐỀ TÀI:

XÂY DỰNG ỨNG DỤNG PHÂN MẢNH DỌC HỖ TRỢ THIẾT KẾ CƠ SỞ DỮ

Trang 2

LỜI CÁM ƠN



Trong suốt thời gian qua học tại trường Đại Học Công Nghệ Thông Tin với sự giúp đỡ và sự nhiệt tình giảng dạy của quý thầy nhất là trong thời gian thực hiện đề tài, nên bài khóa luận kết thúc môn của em đã được hoàn thành đúng thời gian quy định

Em xin gửi lời cảm ơn chân thành nhất tới thầy giáo hướng dẫn PGS

TS Đỗ Phúc đã tận tình hướng dẫn, giúp đỡ, tạo điều kiện để em hoàn thành khóa luận này

Vì thời gian có hạn nên bài viết không thể hoàn thành mỹ mãn và sẽ có thiếu xót mong các bạn và thầy cô thông cảm và gửi lời góp ý

Chân thành cám ơn!

Trịnh Duy Sâm

MỤC LỤC

Trang 3

LỜI CÁM ƠN 1

MỤC LỤC 1

PHẦN I CƠ SỞ DỮ LIỆU PHÂN TÁN 4

I CÁC KHÁI NIỆM CƠ BẢN 4

1 CƠ SỞ DỮ LIỆU: 4

2 CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ CƠ SỞ DỮ LIỆU TẬP TRUNG: 5

II CƠ SỞ DỮ LIỆU PHÂN TÁN: 7

1 KHÁI NIỆM VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN: 7

a) Khái niệm 7

b) Ví dụ minh hoạ : 7

c) Lợi điểm của Cơ sở dữ liệu phân tán : 8

III HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU PHÂN TÁN : 9

a) Khái niệm HQT-CSDL phân tán 9

b) Chức năng của HQT-CSDL 9

c) Ưu và nhược điểm của hệ CSDL phân tán : 11

d) Các mức phân tán 12

PHẦN II THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN 13

a) Sơ đồ tổng thể (Globle Schema): 14

c) Phân mảnh hỗn hợp 22

PHẦN III XÂY DỰNG PHẦN MỀM HỖ TRỢ THIẾT KẾ PHÂN MẢNH DỌC24 1) Giới thiệu: 24

2 1 Cách nhập dữ liệu: 29

2.2 Thực hiện thuật toán phân mảnh dọc: 29

2.3 Nhập lại ma trận Use và Access khác 29

KẾT LUẬN 30

TÀI LIỆU THAM KHẢO 31

Trang 4

LỜI GIỚI THIỆU



Cơ sở dữ liệu phân tán là mơ hình lưu trữ dữ liệu rất quan trọng trong các hệ thống thơng tin lớn và ngày càng phát triển Hiện nay, CSDL phân tán được ứng dụng trong hầu hết các hệ thống thơng tin trong các lĩnh vực như ngân hàng, thương mại, giáo dục, doanh nghiệp …

Đặc trưng chính của CSDL phân tán là cĩ rất nhiều các thao tác truy cập tới một hoặc nhiều vị trí khác nhau trên mạng để trao đổi dữ liệu Do vậy, khung nhìn hoặc đơn vị truy suất của các ứng dụng khơng phải là tồn bộ các ứng dụng mà thường là một mảnh Việc phân rã một quan hệ thành nhiều mảnh, mỗi mảnh được xử lý như một đơn vị, sẽ cho phép thực hiện được nhiều giao dịch đồng thời Việc phân mảnh các quan hệ sẽ cho phép thực hiện song song

Vì vậy trong khĩa luận mơn học này em nghiên cứu và tìm hiểu nội dung “Xây

dựng ứng dụng phân mảnh dọc hỗ trợ thiết kế cơ sở dữ liệu phân tán”.

Bài khĩa luận của em được chia thành 3 phần:

- Phần I Cơ sở dữ liệu phân tán

- Phần II Thiết kế cơ sở dữ liệu phân tán

- Phần III Xây dựng phần mềm hỗ trợ thiết kế phân mảnh dọc

Trang 5

PHẦN I CƠ SỞ DỮ LIỆU PHÂN TÁN

Mỗi cơ sở dữ liệu cần có chương trình quản lý, xắp xếp, duy trì dữ liệu gọi là hệ quản trị cơ sở dữ liệu (DBMS - Database Management System) Hệ quản trị cơ sở dữ liệu được coi là bộ diễn dịch ngôn ngữ bậc cao để dịch các công việc người sử dụng thao tác trên dữ liệu mà người dùng không cần quan tâm đến thuật toán

Về mặt kiến trúc, cơ sở dữ liệu được phân chia thành các mức khác nhau Một cơ

sở dữ liệu cơ bản có ba phần chính là mức vật lý, mức khái niệm và mức thể hiện Tuy nhiên với cơ sở dữ liệu cấp cao thì có thể có nhiều mức phân hoá hơn

Mức vật lý: là mức thấp nhất của kiến trúc hệ cơ sở dữ liệu, ở mức này dữ liệu

được tổ chức dưới nhiều cấp khác nhau như bản ghi, file

Mức khái niệm: là sự biểu diễn trừu tượng của cơ sở dữ liệu vật lý và có thể nói

mức vật lý là sự cài đặt cụ thể của cơ sở dữ liệu ở mức khái niệm

Mức thể hiện: khi cơ sở dữ liệu được thiết kế, những gì thể hiện (giao diện,

chương trình quản lý, bảng ) gần gũi với người sử dụng với cơ sở dữ liệu ở mức khái niệm gọi là khung nhìn Như vậy sự khác nhau giữa khung nhìn và mức khái niệm không lớn

Mô hình phổ biến nhất của cơ sở dữ liệu là mô hình quan hệ: trong mô hinh quan

hệ xét tập con của tích Decard của các miền D (Domain) với miền là một tập các giá trị Gọi D1, D2, D3, Dn là n miền Tích Decard của các miền D1× D2× D3× ×Dn là tập tất cả n bộ (v1,v2,v3 ,vn) sao cho vi ∈ Di với i=1, ,n Mỗi hàng của quan hệ là một bộ (tuples) Quan hệ là tập con của tích Decard D1× D2× D3× ×Dn gọi là quan

hệ n ngôi Khi đó mỗi bộ có n thành phần ( n cột ), mỗi cột của quan hệ gọi là thuộc tính

Trang 6

2 CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ CƠ SỞ DỮ LIỆU TẬP TRUNG:

Cơ sở dữ liệu tập trung cùng với cơ sở dữ liệu không qua thiết kế hình thành trước khi có cơ sở dữ liệu phân tán Hai hình thức này phát triển trên cơ sở tự phát và

hệ thống tập trung Như vậy hai hình thức này không đáp ứng được yêu cầu tổ chức

và công việc trên phạm vi lớn

Cơ sở dữ liệu phân tán được thiết kế khác cơ sở dữ liệu tập trung Do đó cần đối sánh các đặc trưng của cơ sở dữ liêu phân tán với cơ sở dữ liệu tập trung để thấy được lợi ích của cơ sở dữ liệu phân tán Đặc trưng mô tả cơ sở dữ liệu tập trung là điều khiển tập trung, độc lập dữ liệu, giảm bớt dư thừa, cơ cấu vật lý phức tạp đối với khả năng truy cập, toàn vẹn, hồi phục, điều khiển tương tranh, biệt lập và an toàn dữ liệu

Điều khiển tập trung: Điều khiển tập trung các nguồn thông tin của công việc hay

tổ chức Có người quản trị đảm bảo an toàn dữ liệu

Trong cơ sở dữ liệu phân tán: không đề cập đến vấn đề điều khiển tập trung Người quản trị cơ sở dữ liệu chung phân quyền cho người quản trị cơ sở dữ liệu địa phương

Độc lập dữ liệu: là một trong những nhân tố tác động đến cấu trúc cơ sở dữ liệu

để tổ chức dữ liệu chuyển cho chương trình ứng dụng Tiện lợi chính của độc lập dữ liệu là các chương trình ứng dụng không bị ảnh hưởng khi thay đổi cấu trúc vật lý của

dữ liệu Trong cơ sở dữ liệu phân tán, độc lập dữ liệu có tầm quan trọng cũng như trong cơ sở dữ liệu truyền thống Khái niệm cơ sở dữ liệu trong suốt mô tả hoạt động chương trình trên cơ sở dữ liệu phân tán được viết như làm việc trên cơ sở dữ liệu tập trung Hay nói cách khác tính đúng đắn của chương trình không bị ảnh hưởng bởi việc

di chuyển dữ liệu từ nơi này sang nơi khác trong mạng máy tính Tuy nhiên tốc độ làm việc bị ảnh hưởng do có thời gian di chuyển dữ liệu

Giảm dư thừa dữ liệu: Trong cơ sở dữ liệu tập trung, tính dư thừa hạn chế được càng nhiều càng tốt vì:

- Dữ liệu không đồng nhất khi có vài bản sao của cùng cơ sở dữ liệu logic; để tránh được nhược điểm này giải pháp là chỉ có một bản sao duy nhất

- Giảm không gian lưu trữ Giảm dư thừa có nghĩa là cho phép nhiều ứng dụng cùng truy cập đến một cơ sở dữ liệu mà không cần đến nhiều bản sao ở những nơi chương trình ứng dụng cần

Trong cơ sở dữ liệu truyền thống tính dư thừa dữ liệu cũng cần quan tâm vì:

- Tính cục bộ của chương trình ứng dụng sẽ tăng nếu dữ liệu đặt ở mọi nơi mà chương trình ứng dụng cần

Trang 7

- Khả năng sẵn sàng của hệ thống cao bởi vì khi có lỗi ở một nơi nào đó trong hệ thống thì không cản trở hoạt động của chương trình ứng dụng.

Nói chung, nguyên nhân đối lập với tính dư thừa đưa ra trong môi trường truyền thống vẫn còn đúng cho hệ thống phân tán và vì vậy công việc định giá mức độ tốt của tính dư thừa đòi hỏi định giá lại công việc lựa chọn mức độ dư thừa dữ liệu

Cơ sở dữ liệu phân tán khắc phục được hai nhược điểm này vì dữ liệu được chia

ra thành nhiều phần nhỏ và chỉ có một bản sao logic tổng thể duy nhất để tiện cho việc truy cập dữ liệu

Cấu trúc vật lý và khả năng truy cập: người sử dụng truy cập đến cơ sở dữ liệu

tập trung phải thông qua cấu trúc truy cập phức tạp: định vị cơ sở dữ liệu, thiết lập đường truyền

Trong cơ sở dữ liệu phân tán, cấu trúc truy cập phức tạp không phải là công cụ chính để truy cập hiệu quả đến cơ sở dữ liệu Hiệu quả có nghĩa là thời gian tìm kiếm

và chuyển dữ liệu nhỏ nhất, chi phí truyền thông thấp nhất

Mỗi cách thức truy cập cơ sở dữ liệu phân tán viết bởi người lập trình hoặc tạo ra bởi một bộ tối ưu Công việc viết ra một cách thức truy cập cơ sở dữ liệu phân tán cũng giống như viết chương trình duyệt trong cơ sở dữ liệu tập trung Công việc mà chương trình duyệt này làm là xác định xem có thể truy cập đến được bao nhiêu cơ sở

dữ liệu

Tính toàn vẹn, hồi phục và điều khiển tương tranh: Mặc dù trong cơ sở dữ liệu,

tính toàn vẹn, hồi phục và điều khiển đồng thời liên quan nhiều vấn đề liên quan lẫn nhau Mở rộng hơn vấn đề này là việc cung cấp các giao tác Giao tác là đơn vị cơ bản của việc thực hiện: giao tác cụ thể là bó công việc được thực hiện toàn bộ hoặc không được thực hiện

Trong cơ sở dữ liệu phân tán, vấn đề điều khiển giao tác tự trị có ý nghĩa quan trọng: hệ thống điều phối phải chuyển đổi các quỹ thời gian cho các giao tác liên tiếp Như vậy giao tác tự trị là phương tiện đạt được sự toàn vẹn trong cơ sở dữ liệu Có hai mối nguy hiểm của giao tác tự trị là lỗi và tương tranh

Tính biệt lập và an toàn: trong cơ sở dữ liệu truyền thống, người quản trị hệ thống

có quyền điều khiển tập trung, người sử dụng có chắc chắn được phân quyền mới truy cập vào được dữ liệu Điểm quan trọng là trong cách tiếp cận cơ sở dữ liệu tập trung, không cần thủ tục điều khiển chuyên biệt

Trong cơ sở dữ liệu phân tán, những người quản trị địa phương cũng phải giải quyết vấn đề tương tự như người quản trị cơ sở dữ liệu truyền thống

Tuy nhiên, hai vấn đề đặc biệt sau đây của cơ sở dữ liệu phân tán có ý nghĩa quan trọng khi đề cập đến:

Trang 8

- Thứ nhất trong cơ sở dữ liệu phõn tỏn với cấp độ tự trị cao ở mỗi điểm, người cú dữ liệu địa phương sẽ cảm thấy an toàn hơn vỡ họ cú thể tự bảo vệ dữ liệu của mỡnh thay

vỡ phụ thuộc vào người quản trị hệ thống tập trung

- Thứ hai, vấn đề an toàn thực chất với hệ thống phõn tỏn khụng giống như cỏc hệ thống thụng thường khỏc mà cũn liờn quan đến mạng truyền thụng

Như vậy trong cơ sở dữ liệu phõn tỏn vấn đề an toàn cơ sở dữ liệu phức tạp hơn và đũi hỏi nhiều kỹ thuật bảo vệ Nguyờn nhõn gõy ra là hệ thống này cú tớnh mở và nhiều người dựng trong cựng hệ thống sử dụng nhiều cơ sở dữ liệu

II CƠ SỞ DỮ LIỆU PHÂN TÁN:

1 KHÁI NIỆM VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN:

a) Khỏi niệm

Một CSDL phõn tỏn (Distributed Database) là một tập hợp dữ liệu, mà về

mặt logic tập hợp này thuộc cựng một hệ thống, nhưng về mặt vật lý dữ liệu đú được trải trờn cỏc vị trớ khỏc nhau của một mạng mỏy tớnh Cú 2 điểm quan trọng nờu ra trong định nghĩa :

+ Phõn tỏn: Dữ liệu khụng cư trỳ trờn một vị trớ mà được phõn bố rộng khắp

trờn nhiều mỏy tớnh đặt tại nhiều vị trớ khỏc nhau, đõy là điểm phõn biệt CSDL phõn tỏn với CSDL tập trung

+ Tương quan logic :

Dữ liệu trong hệ phõn tỏn cú một số thuộc tớnh ràng buộc chỳng với nhau Cỏc file dữ liệu được lưu trữ tại nhiều vị trớ khỏc nhau, điều này thường thấy

trong cỏc ứng dụng mà hệ thống sẽ phõn quyền truy nhập dữ liệu trong mụi trường mạng Hệ thống mạng thụng tin cho phộp người dựng chia sẻ dữ liệu, vỡ vậy người dựng hoặc ứg dụng ở vị trớ A đều cú thể truy cập hay cập nhật dữ liệu tại vị trớ B nào đú

Cỏc vị trớ của một CSDL phõn tỏn cú thể trải rộng trờn một khu vực lớn (toàn

thế giới) hoặc một phạm vi hẹp (toà nhà)

Cũng như vậy, mỏy tớnh ở cỏc vị trớ

phõn tỏn cú thể là bất cứ loại nào, từ mỏy vi

tớnh đến cỏc mỏy tớnh lớn

b) Vớ dụ minh hoạ :

Với một ngõn hàng cú ba chi nhỏnh đặt tại

cỏc vị trớ khỏc nhau Tại mỗi chi nhỏnh cú

một mỏy tớnh điều khiển một số mỏy tớnh

khỏc và CSDL thống kờ của chi nhỏnh đú

Mỗi mỏy tớnh với CSDL thống kờ của mỗi

nhỏnh được đặt ở một vị trớ của CSDL phõn

tỏn Cỏc mỏy tớnh được nối với nhau bởi

một mạng truyền thụng Cỏc nỳt trong một

CSDL 11 T T T T

Termin al

Máy tính 3

Máy tính 2

T T T T

T T T T

CSD L2

CSD L3

Termin al

Mạng T

thông

Máy tính 1

Một CSDL phân tán trên một mạng phân tán

địa lý

Trang 9

mạng phân tán một mặt xử lý thông tin tại vị trí mà nó quản lý, mặt khác nó cũng tham gia vào xử lý các yêu cầu về thông tin cần truy cập qua nhiều địa điểm Ví dụ việc lên danh sách tất cả các nhân viên của công ty Yêu cầu này đòi hỏi tất cả các máy tính ở các chi nhánh của công ty đều phải hoạt động để cung cấp thông tin

c) Lợi điểm của Cơ sở dữ liệu phân tán :

Có nhiều nguyên nhân để phát triển cơ sở dữ liệu phân tán nhưng tựu trung lại chỉ gồm những điểm sau đây:

Lợi điểm về tổ chức và tính kinh tế: tổ chức phân tán nhiều chi nhánh và dùng cơ sở

dữ liệu phân tán phù hợp với các tổ chức kiểu này Với vai trò là động lực thúc đẩy kinh tế thương mại phát triển rộng hơn, thì việc phát triển các trung tâm máy tính phân tán ở nhiều vị trí trở thành nhu cầu cần thiết

Tận dụng những cơ sở dữ liệu sẵn có: Hình thành cơ sở dữ liệu phân tán từ các cơ

sở dữ liệu tập trung có sẵn ở các vị trí địa phương

Thuận lợi cho nhu cầu phát triển: Xu hướng dùng cơ sở dữ liệu phân tán sẽ cung

cấp khả năng phát triển thuận lợi hơn và giảm được xung đột về chức năng giữa các đơn vị đã tồn tại và giảm được xung đột giữa các chương trình ứng dụng khi truy cập đến cơ sở dữ liệu Với hướng tập trung hoá, nhu cầu phát triển trong tương lai sẽ gặp khó khăn

Giảm chi phí truyền thông: Trong cơ sở dữ liệu phân tán chương trình ứng dụng đặt ở

địa phương có thể giảm bớt được chi phí truyền thông khi thực hiện bằng cách khai thác cơ sở dữ liệu tại chỗ

Tăng số công việc thực hiện: Hệ cơ sở dữ liệu phân tán có thể tăng số lượng công

việc thực hiện qua áp dụng nguyên lý xử lý song song với hệ thống xử lý đa nhiệm Tuy nhiên cơ sở dữ liệu phân tán cũng có tiện lợi trong việc phân tán dữ liệu như tạo

ra các chương trình ứng dụng phụ thuộc vào tiêu chuẩn mở rộng vị trí làm cho các nơi

xử lý có thể hỗ trợ lẫn nhau Do đó tránh được hiện tượng tắc nghẽn cổ chai trong mạng truyền thông hoặc trong các dịch vụ thông thường của toàn bộ hệ thống

Tính dễ hiểu và sẵn sàng: Hướng phát triển cơ sở dữ liệu phân tán cũng nhằm đạt

được tính dễ hiểu và tính sẵn sàng cao hơn Tuy nhiên để đạt được mục tiêu này không phải là dễ làm và đòi hỏi sử dụng kỹ thuật phức tạp Khả năng xử lý tự trị của các điểm làm việc khác nhau không đảm bảo tính dễ sử dụng

Hai nguyên nhân về mặt kỹ thuật đáp ứng cho sự phát triển hệ cơ sở dữ liệu phân tán: -Công nghệ tạo ra máy tính nhỏ và nền tảng phần cứng có khả năng phục vụ xây dựng

hệ thống thông tin phân tán

-Kỹ thuật thiết kế hệ cơ sở dữ liệu phân tán được phát triển vững chắc dựa trên hai kỹ thuật thiết kế chính là Top-down và Bottom-up từ những năm thập kỷ 60

Kỹ thuật thiết kế cơ sở dữ liệu phân tán phức tạp nhưng hệ cơ sở dữ liệu phân tán cũng cần thiết cho xu hướng phát triển kinh tế hiện nay

Trang 10

III.HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU PHÂN TÁN :

a) Khái niệm HQT-CSDL phân tán.

Hệ quản trị cơ sở dữ liệu phân tán là phần mềm có chức năng quản trị cơ sở dữ liệu phân tán và thực hiện các thao tác trong suốt đến người sử dụng

b) Chức năng của HQT-CSDL.

- Nhận, phân tích cú pháp của truy vấn

- Chuyển đổi truy vấn SQL thành biểu thức đại số quan hệ

- Tối ưu hóa truy vấn để có cách truy cập hiệu quả nhất Tức là tối ưu hóa các phép toán đại số quan hệ để có được thời gian xử lý nhanh nhất

- Phải có các giao diện nhập xuất dữ liệu

- Định dạng dữ liệu phù hợp với định nghĩa của nó

- Cung cấp các chức năng cho người quản trị CSDL

Hệ quản trị cơ sở dữ liệu phân tán cung cấp công cụ như tạo lập và quản lý

cơ sở dữ liệu phân tán Phân tích đặc điểm của hệ thống quản trị cơ sở dữ liệu phân tán như dưới đây để phân biệt hệ thống phát triển theo kiểu thương mại

có sẵn và kiểu mẫu phân tán.

Hệ thống phát triển theo kiểu thương mại có sẵn được phát triển bởi những

người cung cấp hệ cơ sở dữ liệu tập trung Hệ cơ sở dữ liệu tập trung mở rộng bằng cách thêm vào những phần bổ xung qua cách cung cấp thêm đường truyền

và điều khiển giữa các hệ quản trị cơ sở dữ liệu tập trung cài đặt ở những điểm khác nhau trên mạng máy tính Những phần mềm cần thiết cho việc xây dựng

cơ sở dữ liệu phân tán là:

Phần quản lý cơ sở dữ liệu ( Database Management - DB ).

Phần truyền thông dữ liệu (Data Communication - DC ).

Từ điển dữ liệu được mở rộng để thể hiện thông tin về phân tán dữ liệu trong mạng máy tính (Data Dictionary - DD).

Phần cơ sở dữ liệu phân tán (Distributed Database DDB).

Trang 11

Truy cập cơ sở

dữ liệu Phương thức truy cập

dữ liệu

Hệ quản trị

cơ sở dữ liệu 1

Kết quả

Cơ sở dữ liệu 2

Chương trình ứng

dụng

Hệ quản trị cơ sở dữ liệu 2

Mô hình các thành phần của hệ quản trị cơ sở dữ liệu phát triển theo kiểu thương mại (Truy cập từ xa trực tiếp)

Những dịch vụ hệ quản trị cơ sở dữ liệu cung cấp:

- Cách thức truy cập dữ liệu từ xa: bằng chương trình ứng dụng.

- Lựa chọn một cấp độ trong suốt phân tán thích hợp: cho phép mở rộng hệ thống theo nhiều cách khác nhau theo từng hoàn cảnh (phải cân nhắc giữa cấp

độ trong suốt phân tán và phân chia công việc thực hiện để công việc quản trị hệ thống đơn giản hơn).

- Quản trị và điều khiển cơ sở dữ liệu bao gồm công cụ quản lý cơ sở dữ liệu, tập hợp thông tin về các thao tác trên cơ sở dữ liệu và cung cấp thông tin tổng thể về file dữ liệu đặt ở các nơi trong hệ thống.

- Điều khiển tương tranh và điều khiển hồi phục dữ liệu của giao tác phân tán.

Cách thức truy cập cơ sở dữ liệu từ xa qua chương trình ứng dụng theo hai cách cơ bản: Truy cập từ xa trực tiếp và gián tiếp

DB DC DDB

DD

DD DDB

DB DC

Cơ sở dữ liệu địa phương 1

Cơ sở dữ liệu Địa phương 2

Trang 12

Mô hình truy cập từ xa qua phương thức cơ sở của hệ quản trị cơ sở dữ liệu

Theo mô hình trực tiếp trên, chương trình ứng dụng đưa ra yêu cầu truy cập đến cơ sở dữ liệu từ xa, yêu cầu này được hệ quản trị cơ sở dữ liệu tự động tìm nơi đặt dữ liệu và thực hiện yêu cầu tại điểm đó Kết quả được trả lại cho chương trình ứng dụng Đơn vị chuyển đổi giữa hai hệ quả trị cơ sở dữ liệu là phương thức truy cập cơ sở dữ liệu và kết quả nhận được (thông qua việc thực hiện phương thức truy cập này) Với cách thức truy cập từ xa như vậy cấp độ trong suốt phân tán được xây dựng bằng cách tạo ra tên file toàn bộ để đánh địa chỉ thích hợp cho những điểm lưu trữ dữ liệu ở xa.

Mô hình dưới đây mô tả cách thức truy cập phức tạp hơn (truy cập gián tiếp):

Theo mô hình truy cập này, chương trình ứng dụng thực hiện yêu cầu qua chương trình phụ ở điểm khác Chương trình phụ này được người lập trình ứng dụng viết để truy cập từ xa đến cơ sở dữ liệu và trả về kết quả của chương trình ứng dụng yêu cầu.

Hệ quản trị cơ sở dữ liệu phân tán cung cấp cả hai kiểu truy cập bỏi vì mỗi cách truy cập đều có ưu điểm của nó.

c) Ưu và nhược điểm của hệ CSDL phân tán :

Đối tượng chủ yếu của hệ phân tán là cung cấp các dịch vụ truy cập dữ liệu và trình diễn dữ liệu cho người sử dụng ở mọi nơi khác nhau Để đáp ứng được điều này,

hệ thống phân tán phải được thiết kế về phần cứng lẫn phần mềm thích hợp với vị trí địa lý và yêu cầu của người sử dụng Cũng từ đó, chúng ta có thể thấy những ưu và nhược điểm của hệ thống phân tán như sau :

- Ưu điểm :

+ Đáp ứng nhanh hầu hết các ứng dụng sử dụng dữ liệu tại các trạm

+ Tăng cường các đơn thể ứng dụng và CSDL mà không làm cản trở người sử dụng hiện tại

Hệ quản trị cơ

sở dữ liệu 2

Kết quả

Trang 13

+ Kiểm soát dữ liệu địa phương theo hướng hoàn thiện sự tích hợp và quản trị

dữ liệu từ xa

+ Tăng cường khả năng của hệ thống liên quan đến sự dư thừa dữ liệu

- Nhược điểm :

+ Phần mềm đắt và phức tạp

+ Phải xử lý mọi thay đổi thông báo trong mọi địa điểm

+ Khó kiểm soát tính toàn vẹn dữ liệu với nhiều bản sao dữ liệu được phân bố khắp mọi nơi

+ Đáp ứng chậm nhu cầu của các trạm trong trường hợp các phần mềm ứng dụng không được phân bố phù hợp với việc sử dụng chung

d) Các mức phân tán.

Mức tập trung.

Toàn bộ cơ sở dữ liệu được đặt ở một nơi và tất cả các yêu cầu của người dùng đều được xử lý tại nơi lưu trữ CSDL

Ưu điểm: Việc quản lý tương đối dễ dàng

Nhược điểm: Máy lưu trữ cơ sở dữ liệu phải có cấu hình đủ mạnh

Mức dữ liệu ở một nơi, xử lý ở nhiều nơi.

Giả sử một máy tính nào đó trong mạng phát ra yêu cầu về dữ liệu thì yêu cầu

đó được gửi về Server Sau đó dữ liệu này được chuyển từ Server đến máy tính đó để

xử lý dữ liệu

Ưu điểm: Đáp ứng dữ liệu nhanh, máy lưu trữ dữ liệu không cần phải có cấu hình mạnh

Nhược điểm: Tăng lưu lượng trên đường truyền dữ liệu

Mức dữ liệu ở nhiều nơi và xử lý ở nhiều nơi.

Chia cơ sở dữ liệu DB ban đầu thành các đoạn dữ liệu con (DB1, DB2, …, DBi,

…, DBn) được lưu trữ ở các máy tính, tại các địa điểm khác nhau Khi máy tính thứ i

có yêu cầu về dữ liệu thì quá trình diễn ra như sau:

Tìm kiếm xem các dữ liệu đang được lưu trữ trên máy nào

- Xử lý dữ liệu ngay tại nơi tìm được

- Sau khi xử lý xong sẽ chuyển kết quả xử lý đó về máy thứ i có yêu cầu ban đầu

Ưu điểm: Xử lý công việc nhanh

Nhược điểm: Rất khó khăn cho việc quản trị dữ liệu

Trang 14

PHẦN II THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN

Các khía cạnh của bài toán

- Thiết kế từ trên xuống (Top- down)

- Thiết kế từ dưới lên (Buttom-up)

2) Kiến trúc cơ bản của một cơ sở dữ liệu phân tán

Sơ đồ toàn cục (Global Schema)

Sơ đồ phân mảnh (Fragmentation

Schema)

Sơ đồ định vị (Allocation Schema)

Các

sơ đồ độc lập vị trí

Sơ đồ ánh xạ địa phương 1

( Local mapping Schema 1)

Hệ quản trị CSDL tại vị trí n

( DBMS n) )

CSDL địa phương 1 (Local Database 1)

CSDL địa phương n (Local Database n)

Trang 15

3) Kiến trúc tham khảo dành cho CSDL phân tán

a) Sơ đồ tổng thể (Globle Schema):

• Xác định tất cả các dữ liệu sẽ được lưu trữ trong cơ sở dữ liệu phân tán cũng như các

dữ liệu không được phân tán ở các trạm trong hệ thống

• Sơ đồ tổng thể được định nghĩa theo cách như trong CSDL tập trung

• Trong mô hình quan hệ, sơ đồ tổng thể bao gồm định nghĩa của tập các quan hệ tổng

thể (Globle relation)

b) Sơ đồ phân mảnh (fragment schema):

- Mỗi quan hệ tổng thể có thể chia thành một vài phần không giao nhau gọi là mảnh (fragment)

- Có nhiều cách khác nhau để thực hiện việc phân chia này

- Sơ đồ phân mảnh mô tả các ánh xạ giữa các quan hệ tổng thể và các mảnh được định nghĩa trong sơ đồ phân mảnh (fragmentation Schema),

- Các mảnh được mô tả bằng tên của quan hệ tổng thể cùng với chỉ mục mảnh Chẳng hạn, Ri được hiểu là mảnh thứ i của quan hệ R

=> Phân mảnh dữ liệu là phân sơ đồ tổng thể định vị dữ liệu.

c Sơ đồ định vị (allocation schema):

- Các mảnh là các phần logic của một quan hệ tổng thể được định vị vật lý trên một hay nhiều trạm

- Sơ đồ định vị xác định đoạn dữ liệu nào được định vị tại trạm nào trên mạng Một đoạn dữ

liệu có thể nằm trên nhiều trạm

- Tất cả các đoạn được liên kết với cùng một quan hệ tổng thể R và được định vị tại cùng một trạm j cấu thành ảnh vật lý quan hệ tổng thể R tại trạm j

- Do đó ta có thể ánh xạ một-một giữa một ảnh vật lý và một cặp (quan hệ tổng thể, trạm)

- Các ảnh vật lý có thể chỉ ra bằng tên của một quan hệ tổng thể và một chỉ mục trạm

- Ký hiệu Ri để chỉ đoạn thứ i của quan hệ tổng thể R

- Ký hiệu Rj để chỉ ảnh vật lý của quan hệ tổng thể R tại trạm j

- Tương tự như vậy, bản sao của đoạn i thuộc quan hệ R tại trạm j được ký hiệu là Rij

d Sơ đồ ánh xạ địa phương (Local mapping schema):

-Thực hiện ánh xạ các ảnh vật lý lên các đối tượng được thực hiện bởi hệ quản trị cơ sở dữ liệu địa phương

-Tất cả các đoạn của một quan hệ tổng thể trên cùng một trạm tạo ra một ảnh vật lý

Trang 16

Ba yếu tố được suy ra từ kiểu kiến trúc này là:

a Tách rời khái niệm phân đoạn dữ liệu với khái niệm định vị dữ liệu

-Phân đoạn dữ liệu, bao gồm những công việc mà người lập trình ứng dụng làm việc với

quan hệ tổng thể, phân chia quan hệ tổng thể thành các đoạn

-Thông qua tính trong suốt phân đoạn (fragmentation transparency) người lập trình sẽ nhìn

thấy được những đoạn dữ liệu bị phân chia như thế nào

-Định vị dữ liệu lại liên quan đến các công việc của người sử dụng và người lập trình ứng

dụng tại trên các đoạn dữ liệu được định vị tại các trạm

-Thông qua tính trong suốt vị trí (location transparency) người lập trình sẽ biết được vị trí

của các đoạn dữ liệu trên các trạm

b Biết được dữ liệu dư thừa

• Người lập trình ứng dụng có thể biết được dư thừa dữ liệu ở các trạm

• Trên hình vẽ trên, chúng ta thấy rằng hai ảnh vật lý R2 và R3 có trùng lặp dữ liệu Do

đó các đoạn dữ liệu trùng nhau có thể tránh được khi xây dựng các khối ảnh vật lý

c Độc lập với các DBMS địa phương

Tính chất này còn được gọi là trong suốt ánh xạ địa phương (local mapping transparency),

cho phép chúng ta khảo sát các vấn đề về quản lý CSDL phân tán mà không cần phải hiểu rõ

mô hình dữ liệu của DBMS địa phương đang sử dụng

Ba yếu tố này tương ứng với ba mức trong suốt tương ứng

4) Các đặc điểm chính của hệ phân tán : (Tính chia sẽ, tính mỡ, khả năng song song, khả năng

mở rộng, khả năng thứ lỗi, độ tin cậy và nhất quán, tính trong suốt)

a) Chia sẻ tài nguyên

• Được thực hiện qua mạng truyền thông

• Mỗi tài nguyên cần phải được quản lý bởi một chương trình có giao diện truyền thông

• Các tài nguyên có thể được truy nhập, cập nhật một cách tin cậy và nhất quán

Quản lý tài nguyên bao gồm:

• Lập kế hoạch dự phòng

• Đặt tên cho các lớp tài nguyên

• Cho phép tài nguyên được truy nhập từ nơi này đến nơi khác

• Ánh xạ tên tài nguyên vào địa chỉ truyền thông

- Tính mở được hoàn thiện bằng cách xác định hay phân định rõ các giao diện chính của một

hệ và làm cho nó tương thích với các nhà phát triển phần mềm

- Tính mở của hệ phân tán dựa trên việc cung cấp cơ chế truyền thông giữa các tiến trình và công khai các giao diện dùng để truy nhập các tài nguyên chung

c) Khả năng song song

- Hệ phân tán hoạt động trên một mạng truyền thông có nhiều máy tính, mỗi máy có thể có một hay nhiều CPU

- Có thể thực hiện nhiều tiến trình trong cùng một thời điểm Việc thực hiện tiến trình theo cơ chế phân chia thời gian (một CPU) hay (nhiều CPU)

Khả năng làm việc song song trong hệ phân tán được thể hiện qua hai tình huống sau:

- Nhiều người sử dụng đồng thời đưa ra các lệnh hay các tương tác với các chương trình ứng dụng

- Nhiều tiến trình Server chạy đồng thời, mỗi tiến trình phải đáp ứng yêu cầu từ các Clients

Ngày đăng: 10/04/2015, 13:22

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w