1. Trang chủ
  2. » Luận Văn - Báo Cáo

Quản lý điểm sinh viên trường đại học Hùng Vương

35 575 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 35
Dung lượng 512,5 KB

Nội dung

lớn, công nghệ thông tin là trợ thủ đắc lực trong lĩnh vực này và đặc biệt với các nhà quản lý giúp họ đưa ra những quyết định đúng đắn trong công việc.Sau quá trình nghiên cứu, tìm hiểu

Trang 1

MỤC LỤC

MỤC LỤC 1

LỜI MỞ ĐẦU 2

BẢNG DANH MỤC CÁC TỪ VIẾT TẮT: 4

BẢNG DANH MỤC CÁC BẢNG: 5

BẢNG DANH MỤC CÁC HÌNH VẼ: 6

CHƯƠNG I GIỚI THIỆU CƠ SỞ DỮ LIỆU PHÂN TÁN 7

1.1 Cơ sở dữ liệu 7

1.2 Cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung 8

1.2.1 Cơ sở dữ liệu tập trung 8

1.2.2 Cơ sở dữ liệu phân tán 9

1.3 Khái niệm về cơ sở dữ liệu phân tán 10

1.3.1 Khái niệm 10

1.3.2 Các đặc điểm chính của cơ sở dữ liệu phân tán 10

1.3.2.1 Chia sẻ tài nguyên .10

1.4 Ưu nhược điểm của cơ sở dữ liệu phân tán 11

1.4.1 Ưu điểm của CSDL phân tán 11

1.4.2 Nhược điểm của CSDL phân tán 12

1.5 Hệ quản trị cơ sở dữ liệu phân tán 12

1.5.1 Khái niệm 12

1.5.2 Các loại cơ sở dữ liệu phân tán 12

1.6 Các mức trong suốt của cơ sở dữ liệu phân tán 12

1.6.1 Trong suốt phân đoạn (FRAGMENTATION TRANSPARENCY) 13

1.6.2 Tính trong suốt về vị trí (LOCATION TRANSPARENCY) .13

1.6.3 Trong suốt ánh xạ (LOCAL MAPPINGTRANSPARENCY) 13

1.6.4 Trong suốt nhân bản (REPLICATION TRANSPARENCY) 13

1.7 Kiến trúc cơ sở dữ liệu phân tán 13

CHƯƠNG II: THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN 15

2.1 Các bước thiết kế cơ sở dữ liệu 15

2.1.1 Thiết kế CSDL tập trung .15

2.1.2 Thiết kế CSDL phân tán .15

2.2 Hướng tiếp cận cơ sở dữ liệu 16

2.2.1 Hướng Top-down 16

2.2.2 Hướng Bottom-up 16

2.3 Các vấn đề thiết kế 16

2.3.1 Lý do phân đoạn 16

2.3.2 Các quy tắc phân đoạn đúng đắn 17

2.3.3 Phân mảnh ngang 17

2.3.4 Phân mảnh dọc 18

2.3.5 Phân mảnh hỗn hợp 18

CHƯƠNG III GIỚI THIỆU VỀ ORACLE 18

3.1 Khả năng quản trị cơ sở dữ liệu phân tán của oracle 18

3.1.1 Hệ thống cơ sở dữ liệu phân tán đồng nhất 18

3.1.2 Hệ thống cơ sở dữ liệu phân tán không đồng nhất 19

3.1.3 Kiến trúc client/server 19

3.2 Thiết kế cơ sở dữ liệu phân tán trong oracle 19

3.2.1 Phân tán dữ liệu trong oracle 19

3.2.2 Snapshot 20

3.2.3 Dabase link 20

3.2.4 Các tên CSDL toàn cục trong các liên kết CSDL 21

CHƯƠNG IV: XÂY DỰNG HỆ CƠ SỞ DỮ LIỆU PHÂN TÁN ỨNG DỤNG TRONG BÀI TOÁN QUẢN LÝ SINH VIÊN TRƯỜNG ĐẠI HỌC HÙNG VƯƠNG 21

1

Trang 2

4.1 Cơ sở thực tế 21

4.2 Phát biểu bài toán 22

4.2.1 Cơ sở lý luận 22

4.2.2 Phân tích bài toán 23

4.3 Phân tích thực thể 23

4.3.1 Thực thể khoa 23

4.3.2 Thực thể lớp 23

4.3.3 Thực thể môn học 23

4.3.4 Thực thể sinh viên 23

4.3.5 Thực thể kết quả 24

4.4 Thiết kế cơ sở dữ liệu phân tán cho hệ thống quản ly sinh viên 25

4.4.1 Thiết kế sơ đồ tổng thể của hệ thống 25

4.4.2 Thiết kế phân mảnh 26

4.5 Thiết kế định vị 27

4.5.1 Sơ đồ định vị 27

4.5.2 Thiết kế sơ đồ ánh xạ địa phương 27

4.6 Thiết kế vật lý tại các trạm 28

4.7 Quản trị cơ sở dữ liệu phân tán cho hệ thống quản lý điểm sinh viên trường ĐH Hùng Vương 30

4.7.1 Xác định hệ thống mạng cho hệ thống 30

4.7.2 Mô hình cơ sở dữ liệu Client/Server 30

4.8 Hệ thống quản lý điểm sinh viên trong oracle 31

4.8.1 Phân tán dữ liệu trong hệ thống quản lý điểm sinh viên trong oracle 31

4.8.2 Sao bản (snapshot) 31

4.8.3 Database link 32

4.9 Thiết kế giao diện 32

4.9.1 Form thông tin sinh viên 32

4.9.2 Form thông tin lớp 33

4.9.3 Form thông tin môn học 33

4.9.4 Form danh sách kết quả 33

4.9.5 Form tra cứu điểm thi của sinh viên 33

KẾT LUẬN 34

TÀI LIỆU THAM KHẢO 35

LỜI MỞ ĐẦU

Ngày nay ngành công nghệ thông tin không còn xa lạ với cuộc sống con người nữa Nó góp phần quan trọng và đã trở thành công cụ đắc lực cho các hoạt động của con người và trong đời sống xã hội

Với sự phát triển nhanh chóng của công nghệ truyền thông và sự bành trướng mạnh mẽ của mạng Internet, cùng với xu thế toàn cầu hoá trong mọi lĩnh vực, đặc biệt là về thương mại, đã làm nảy sinh nhiều ứng dụng mới trong đó phải quản lý những đối tượng có cấu trúc phức tạp (văn bản, âm thanh, hình ảnh

và các chương trình, các mô phỏng ) vậy ngành “quản lý” là một trong các lĩnh vực mà công nghệ thông tin thâm nhập vào sâu và thu được nhiều thành tựu to

Trang 3

lớn, công nghệ thông tin là trợ thủ đắc lực trong lĩnh vực này và đặc biệt với các nhà quản lý giúp họ đưa ra những quyết định đúng đắn trong công việc.

Sau quá trình nghiên cứu, tìm hiểu nhóm em đã quyết định tìm hiểu về “ Thiết kế cơ sở dữ liệu phân tán ứng dụng trong quản lý điểm sinh viên trường Đại học Hùng Vương” làm đề tài nghiên cứu khoa học Ứng dụng được xây dựng trên cơ sở dữ liệu Oracle Nhằm thực hiện chức năng giải quyết các vấn đề sau: Quản lý điểm sinh viên: cập nhập, tính toán, tra cứu điểm của sinh viên, Thống kê báo cáo kết quả

1 Lý do chọn đề tài

Xuất phát từ thực tiễn do trường Đại học Hùng Vương có hai cơ sở nằm ở hai địa điểm khác nhau nên rất thích hợp cho việc ứng dụng hệ quản trị cơ sở dữ liệu phân tán để tiện lợi cho việc quản lý và kiểm tra

Nhóm em đã quyết định xây dựng phần mềm “Quản lý điểm sinh viên trường đại học Hùng Vương” Nhằm giải quyết các vấn đề và yêu cầu được đặt ra nâng cao hiệu quả quản lý, góp phần nâng cao hiệu quả giáo dục của trường Hệ thống quản lý điểm xây dựng trên nhu cầu tin học hóa công việc quản lý của trường ĐH Hùng Vương

2 Cấu trúc đề tài:

Nội dung chính của đề tài được chia làm 4 chương:

Chương I: Cơ sở dữ liệu phân tán

Giới thiệu tổng quát về cơ sở dữ liệu và cơ sở dữ liệu phân tán Phân biệt cơ

sở dữ liệu tập trung với cơ sở dữ liệu phân tán để thấy được sự khác biệt giữa hai cơ sở dữ liệu và lợi ích của cơ sở dữ liệu phân tán

Chương II: Thiết kế cơ sở dữ liệu phân tán

Chương này mô tả cách thiết kế cơ sở dữ liệu phân tán ở mức thấp như phân chia quan hệ thành các đoạn, cấp phát đoạn Trọng tâm là phân đoạn ngang, phân đoạn dọc và phân đoạn hỗn hợp

Chương III: Giới thiệu về ORACLE

Hệ quản trị cơ sở dữ liệu Oracle có thể nói là một hệ quản trị cơ sở dữ liệu hàng đầu thế giới Nó có độ ổn định và tin cậy cao, khả năng lưu trữ và bảo mật

vô cùng lớn Do kiến thức còn hạn hẹp nhóm nghiên cứu chỉ dừng lại ở mức cơ bản giới thiệu một cách tổng quát về hệ quản trị cơ sở dữ liệu Oracle, khả năng quản trị và cách thiết kế cơ sở dữ liệu phân tán trong Oracle ứng dụng vào bài toán nhỏ “ quản lý điểm sinh viên Trường ĐH Hùng Vương”

Chương IV: Xây dựng hệ cơ sở dữ liệu phân tán ứng dụng trong hệ thống quản

lý sinh viên Trường Đại Học Hùng Vương

3

Trang 5

7 DBMS Distributed database management system

Trang 6

BẢNG DANH MỤC CÁC HÌNH VẼ:

1 Hình 1.1: Sơ đồ cơ sở dữ liệu phân tán

2 Hình 4.1: Mô hình thực thể quan hệ

3 Hình 4.2: Sơ đồ tổng thể hệ thống quản lý điểm

4 Hình 4.3: Sơ đồ định vị của các mảnh tại các vị trí

5 Hình 4.4: Sơ đồ ánh xạ địa phương

6 Hình 4.5: Mô hình hệ thống mạng mô phỏng

Trang 7

7 Hình 4.6: Giao diện Form thông tin sinh viên

8 Hình 4.7: Giao diện Form thông tin lớp

9 Hình 4.8: Giao diện Form thông tin môn học

10 Hình 4.9: Giao diện Form danh sách kết quả

11 Hình 4.10: Giao diện Form tra cứu điểm sinh viên

CHƯƠNG I GIỚI THIỆU CƠ SỞ DỮ LIỆU PHÂN TÁN

Những năm gần đây, hệ cơ sở dữ liệu phân tán được phát triển dựa trên cơ sở dữ liệu và mạng máy tính Cơ sở dữ liệu phân tán gồm nhiều cơ sở dữ liệu tích hợp lại với nhau thông qua mạng máy tính để trao đổi dữ liệu, thông tin

Cơ sở dữ liệu được tổ chức và lưu trữ ở những vị trí khác nhau trong mạng máy tính và chương trình ứng dụng làm việc trên cơ sở truy cập dữ liệu ở những điểm khác nhau đó

1.1 Cơ sở dữ liệu

Về cơ bản cơ sở dữ liệu (Database) là tập hợp dữ liệu được lưu trữ một cách có tổ chức để phục vụ cho công việc sử dụng thuận tiện nhất Dữ liệu là số liệu, hình ảnh cần được lưu trữ dưới dạng file, record tiện lợi cho người dùng đối với việc tham khảo, xử lý

7

Trang 8

Về mặt kiến trúc, cơ sở dữ liệu được phân chia thành các mức khác nhau Một cơ sở dữ liệu cơ bản có ba phần chính là mức vật lý, mức khái niệm và mức thể hiện Tuy nhiên với cơ sở dữ liệu cấp cao thì có thể có nhiều mức phân hoá hơn.

Mức vật lý: là mức thấp nhất của kiến trúc hệ cơ sở dữ liệu, ở mức này dữ

liệu được tổ chức dưới nhiều cấp khác nhau như bản ghi, file

Mức khái niệm: là sự biểu diễn trừu tượng của cơ sở dữ liệu vật lý và có

thể nói mức vật lý là sự cài đặt cụ thể của cơ sở dữ liệu ở mức khái niệm

Mức thể hiện: khi cơ sở dữ liệu được thiết kế, những gì thể hiện (giao diện,

chương trình quản lý, bảng ) gần gũi với người sử dụng với cơ sở dữ liệu ở mức khái niệm gọi là khung nhìn Như vậy sự khác nhau giữa khung nhìn và mức khái niệm không lớn

1.2 Cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung

1.2.1 Cơ sở dữ liệu tập trung

Cơ sở dữ liệu tập trung hình thành trước khi có cơ sở dữ liệu phân tán Hình thức này phát triển trên cơ sở tự phát và hệ thống tập trung Như vậy hình thức này không đáp ứng được yêu cầu tổ chức và công việc trên phạm vi lớn

Cơ sở dữ liệu tập trung bộc lộ những nhược điểm sau:

- Tăng khả năng lưu trữ thông tin là khó khăn, bởi bị giới hạn tối đa của thiết bị nhớ

- Độ sẵn sàng phục vụ của cơ sở dữ liệu không cao khi người sử dụng tăng

- Khả năng tính toán của các máy đơn lẻ đang dần tới giới hạn vật lý

- Mô hình tổ chức lưu trữ, xử lý dữ liệu tập trung không phù hợp cho những tổ chức thiết kế, xã hội có hoạt động rộng lớn, đa quốc gia

 Các đặc trưng mô tả cơ sở dữ liệu tập trung là :

Điều khiển tập trung: Điều khiển tập trung các nguồn thông tin của công

việc hay tổ chức Có người quản trị đảm bảo an toàn dữ liệu

Độc lập dữ liệu: Các chương trình ứng dụng không bị ảnh hưởng khi thay

đổi cấu trúc vật lý của dữ liệu

Giảm dư thừa dữ liệu: Tính dư thừa hạn chế được càng nhiều càng tốt vì:

- Dữ liệu không đồng nhất khi có nhiều bản sao của cùng cơ sở dữ liệu logic Vậy chỉ nên có một bản sao duy nhất

- Giảm không gian lưu trữ Giảm dư thừa có nghĩa là cho phép nhiều ứng dụng cùng truy cập đến một cơ sở dữ liệu mà không cần đến nhiều bản sao ở những nơi chương trình ứng dụng cần

Cấu trúc vật lý và khả năng truy cập: người sử dụng truy cập đến cơ sở dữ

liệu tập trung phải thông qua cấu trúc truy cập phức tạp: định vị cơ sở dữ liệu, thiết lập đường truyền

Tính biệt lập và an toàn: trong cơ sở dữ liệu truyền thống, người quản trị hệ

thống có quyền điều khiển tập trung, người sử dụng có chắc chắn được phân quyền mới truy cập vào được dữ liệu

Trang 9

1.2.2 Cơ sở dữ liệu phân tán

Cơ sở dữ liệu phân tán được thiết kế khác cơ sở dữ liệu tập trung:

Về điều khiển tập trung trong cơ sở dữ liệu phân tán không đề cập đến vấn

đề điều khiển tập trung Người quản trị cơ sở dữ liệu chung phân quyền cho người quản trị cơ sở dữ liệu địa phương

Độc lập dữ liệu trong cơ sở dữ liệu phân tán, có tầm quan trọng cũng như

trong cơ sở dữ liệu truyền thống Tính đúng đắn của chương trình không bị ảnh hưởng bởi việc di chuyển dữ liệu từ nơi này sang nơi khác trong mạng máy tính Tuy nhiên tốc độ làm việc bị ảnh hưởng do có thời gian di chuyển dữ liệu

Giảm dư thừa dữ liệu cơ sở dữ liệu phân tán khắc phục được hai nhược

điểm trên vì dữ liệu được chia ra thành nhiều phần nhỏ và chỉ có một bản sao logic tổng thể duy nhất để tiện cho việc truy cập dữ liệu

Về cấu trúc vật lý và khả năng truy cập: Trong cơ sở dữ liệu phân tán, cấu

trúc truy cập phức tạp không phải là công cụ chính để truy cập hiệu quả đến cơ sở dữ liệu Hiệu quả có nghĩa là thời gian tìm kiếm và chuyển dữ liệu nhỏ nhất, chi phí truyền thông thấp nhất

Mỗi cách thức truy cập cơ sở dữ liệu phân tán viết bởi người lập trình hoặc tạo ra bởi một bộ tối ưu Công việc viết ra một cách thức truy cập cơ sở dữ liệu phân tán cũng giống như viết chương trình duyệt trong cơ sở dữ liệu tập trung Công việc mà chương trình duyệt này làm là xác định xem có thể truy cập đến được bao nhiêu cơ sở dữ liệu

Tính toàn vẹn, hồi phục và điều khiển tương tranh: Trong cơ sở dữ liệu

phân tán, vấn đề điều khiển giao tác tự trị có ý nghĩa quan trọng: hệ thống điều phối phải chuyển đổi các qũy thời gian cho các giao tác liên tiếp Như vậy giao tác tự trị là phương tiện đạt được sự toàn vẹn trong cơ sở dữ liệu Có hai mối nguy hiểm của giao tác tự trị là lỗi và tương tranh

Cấu trúc vật lý và khả năng truy cập: Trong cơ sở dữ liệu phân tán, những

người quản trị địa phương cũng phải giải quyết vấn đề tương tự như người quản trị cơ sở dữ liệu truyền thống

Tuy nhiên, hai vấn đề đặc biệt sau đây của cơ sở dữ liệu phân tán có ý nghĩa quan trọng khi đề cập đến:

-Thứ nhất trong cơ sở dữ liệu phân tán với cấp độ tự trị cao ở mỗi điểm, người có dữ liệu địa phương sẽ cảm thấy an toàn hơn vì họ có thể tự bảo vệ dữ liệu của mình thay vì phụ thuộc vào người quản trị hệ thống tập trung

- Thứ hai, vấn đề an toàn thực chất với hệ thống phân tán không giống như các hệ thống thông thường khác mà còn liên quan đến mạng truyền thông

Như vậy trong cơ sở dữ liệu phân tán vấn đề an toàn cơ sở dữ liệu phức tạp hơn và đòi hỏi nhiều kỹ thuật bảo vệ Nguyên nhân gây ra là hệ thống này có tính mở và nhiều người dùng trong cùng hệ thống sử dụng nhiều cơ sở dữ liệu

9

Trang 10

1.3 Khái niệm về cơ sở dữ liệu phân tán

1.3.1 Khái niệm

Cơ sở dữ liệu phân tán là tập hợp dữ liệu logic thuộc về cùng một hệ thống nhưng trải rộng ra nhiều điểm trên mạng máy tính Như vậy có hai vấn đề của cơ sở dữ liệu phân tán với tầm quan trọng tương đương nhau:

Việc phân tán: Trong thực tế dữ liệu không đặt trên cùng một vị trí vì vậy

đây là đặc điểm để phân biệt cơ sở dữ liệu phân tán với cơ sở dữ liệu tập trung và cơ sở dữ liệu đơn lẻ

Liên quan logic: Trong cơ sở dữ liệu phân tán, dữ liệu có một số đặc tính

liên kết chặt chẽ với nhau như tính kết nối, tính liên quan logíc Trong cơ sở dữ liệu tập trung, mỗi vị trí quản lý một cơ sở dữ liệu và người sử dụng phải truy cập đến cơ sở dữ liệu ở những vị trí khác nhau để lấy thông tin tổng hợp

1.3.2 Các đặc điểm chính của cơ sở dữ liệu phân tán

1.3.2.1 Chia sẻ tài nguyên

Việc chia sẻ tài nguyên của hệ phân tán được thực hiện thông qua mạng truyền thông Để chia sẻ tài nguyên một cách có hiệu quả thì mỗi tài nguyên cần được quản lý bởi một chương trình có giao diện truyền thông, các tài nguyên có thể được truy cập, cập nhật một cách tin cậy và nhất quán Quản lý tài nguyên ở đây là lập kế hoạch dự pḥòng, đặt tên cho các lớp tài nguyên, cho phép tài nguyên được truy cập từ nơi này đến nơi khác, ánh xạ lên tài nguyên vào địa chỉ

Tính mở của hệ phân tán được xem như là mức độ bổ sung các dịch vụ dùng chung tài nguyên mà không phá hỏng hay nhân đôi các dịch vụ đang tồn tại Tính mở được hoàn thiện bằng cách xác định hay phân định rõ các giao diện chính của một hệ và làm cho nó tương thích với các nhà phát triển phần mềm Tính mở của hệ phân tán dựa trên việc cung cấp cơ chế truyền thông giữa các tiến trình và công khai các giao diện dùng để truy cập các tài nguyên chung 1.3.2.3 Khả năng song song

Hệ phân tán hoạt động trên một mạng truyền thông có nhiều máy tính, mỗi máy có thể có 1 hay nhiều CPU Trong cùng một thời điểm nếu có N tiến tŕnh cùng tồn tại, ta nói chúng thực hiện đồng thời Việc thực hiện tiến trình theo cơ chế phân chia thời gian (một CPU) hay song song (nhiều CPU)

Khả năng làm việc song song trong hệ phân tán được thực hiện do hai tình huống sau:

- Nhiều người sử dụng đồng thời ra các lệnh hay các tương tác với các

Trang 11

Khả năng mở rộng được đặc trưng bởi tính không thay đổi phần mềm hệ thống và phần mềm ứng dụng khi hệ thống được mở rộng Điều này chỉ đạt được mức độ nào đó với hệ phân tán hiện tại Yêu cầu mở rộng không chỉ là sự

mở rộng về phần cứng, về mạng mà nó trải trên các khía cạnh khi thiết kế hệ phân tán

1.3.2.5 Khả năng thứ lỗi

Việc thiết kế khả năng thứ lỗi của các hệ thống máy tính dựa trên hai giải pháp cơ bản sau:

- Dùng khả năng thay thế để đảm bảo sự hoạt động liên tục và hiệu quả

- Dùng các chương trình hồi phục khi xảy ra sự cố

Xây dựng một hệ thống có thể khắc phục sự cố theo cách thứ nhất thì người

ta nối hai máy tính với nhau để thực hiện cùng một chương trình, một trong hai máy chạy ở chế độ Standby (không tải hay chờ) Giải pháp này tốn kém vì phải nhân đôi phần cứng của hệ thống Một giải pháp để giảm phí tổn là các Server riêng lẻ được cung cấp các ứng dụng quan trọng để có thể thay thế nhau khi có

sự cố xuất hiện Khi không có các sự cố các Server hoạt động bình thường, khi

có sự cố trên máy Server nào đó, các ứng dụng Client chuyển hướng sang các Server còn lại

Cách hai thì các phần mềm hồi phục được thiết kế sao cho trạng thái dữ liệu hiện thời (trạng thái trước khi xảy ra sự cố) có thể được khôi phục khi lỗi được phát hiện

Các hệ phân tán cung cấp khả năng sẵn sàng cao để đối phó với các sai hỏng phần cứng

1.3.2.6 Đảm bảo tin cậy và nhất quán

Hệ thống yêu cầu độ tin cậy cao: Sự bí mật của dữ liệu phải được bảo vệ, các chức năng khôi phục hư hỏng phải được đảm bảo Ngoài ra yêu cầu của hệ thống về tính nhất quán cũng rất quan trọng trong thể hiện: Không được có mâu thuẫn trong nội dung dữ liệu Khi các thuộc tính dữ liệu là khác nhau thì các thao tác vẫn phải nhất quán

1.4 Ưu nhược điểm của cơ sở dữ liệu phân tán

1.4.1 Ưu điểm của CSDL phân tán

- Phù hợp với cấu trúc của tổ chức

- Nâng cao khả năng chia sẻ và tính tự trị địa phương

- Nâng cao tính sẵn sàng

- Nâng cao tính tin cậy

- Nâng cao hiệu năng

11

Trang 12

 Các thành phần sau đây đ̣òi hỏi một HQTCSDLPT thương mại phải có:

- Quản trị dữ liệu (database management): DB

- Truyền thông dữ liệu (data communication): DC

- Từ điển dữ liệu (data dictionary): DD dùng để mô tả thông tin về sự phân

tán của dữ liệu trên mạng

- Cơ sở dữ liệu phân tán (distributed database): DDB

1.5.2 Các loại cơ sở dữ liệu phân tán

+ Các nút có thể thực hiện trên các hệ quản trị CSDL khác nhau

+ Xảy ra khi các nút đã cài đặt CSDL riêng

+ Có được bằng cách tích hợp các CSDL cục bộ đã có

1.6 Các mức trong suốt của cơ sở dữ liệu phân tán

Tính trong suốt của một hệ phân tán được hiểu như là việc che khuất đi các thành phần riêng biệt của hệ đối với người sử dụng và những người lập trình ứng dụng

 Các loại trong suốt trong hệ phân tán:

- Trong suốt phân đoạn (fragmentation transparency)

- Trong suốt về vị trí (location transparency)

- Trong suốt ánh xạ địa phương (local mapping transparency)

- Trong suốt nhân bản (replication transparency)

Trang 13

1.6.1 Trong suốt phân đoạn (FRAGMENTATION TRANSPARENCY)

Trong suốt phân đoạn: là cấp độ cao nhất của mức độ trong suốt, người sử dụng hoặc chương trình ứng dụng chỉ làm việc trên các quan hệ của cơ sở dữ liệu Khi dữ liệu đã được phân đoạn thì việc truy cập vào CSDL được thực hiện

bình thường như là chưa bị phân tán và không ảnh hưởng tới người sử dụng

1.6.2 Tính trong suốt về vị trí (LOCATION TRANSPARENCY)

- Người sử dụng không cần biết về vị trí vật lý của dữ liệu mà có quyền truy cập đến cơ sở dữ liệu tại bất cứ vị trí nào

- Các thao tác để lấy hoặc cập nhật một dữ liệu từ xa được tự động thực hiện bởi hệ thống tại điểm đưa ra yêu cầu

- Tính trong suốt về vị trí rất hữu ích, nó cho phép người sử dụng bỏ qua các bản sao dữ liệu đã tồn tại ở mỗi vị trí Do đó có thể di chuyển một bản sao

dữ liệu từ một vị trí này đến một vị trí khác và cho phép tạo các bản sao mới mà không ảnh hưởng đến các ứng dụng

1.6.3 Trong suốt ánh xạ (LOCAL MAPPINGTRANSPARENCY)

- Trong suốt ánh xạ địa phương là một đặc tính quan trọng trong một hệ thống DBMS(Distributed Database Management System) không đồng nhất

- Ứng dụng tham chiếu đến các đối tượng có các tên độc lập từ các hệ thống cục bộ địa phương

- Ứng dụng được cài đặt trên một hệ thống không đồng nhất nhưng được sử dụng như một hệ thống đồng nhất

1.6.4 Trong suốt nhân bản (REPLICATION TRANSPARENCY)

Mức trong suốt bản sao liên quan chặt chẽ tới mức trong suốt định vị Mức trong suốt bản sao có nghĩa là người sử dụng không biết bản sao của đoạn đặt ở

vị trí nào Mức trong suốt bản sao tương đương mức trong suốt định vị Tuy nhiên, trong những trường hợp thực tế người sử dụng không có mức trong suốt định vị nhưng lại có mức trong suốt bản sao

1.7 Kiến trúc cơ sở dữ liệu phân tán

Sơ đồ dưới đây cho ta một kiến trúc cơ bản (hình 1.1) để tổ chức cho một CDSL phân tán

13

Sơ đồ phân đoạn

Sơ đồ cấp phát

Sơ đồ ánh xạ

địa phương 1

Sơ đồ ánh xạ

Trang 14

Đoạn là phần logic của quan hệ, được đặt vật lý tại một hay vài vị trí trên mạng máy tính Sơ đồ cấp phát xác định những vị trí đặt đoạn Kiểu ánh xạ xác định trong sơ đồ cấp phát cho phép nhận ra một cơ sở dữ liệu phân tán là dư thừa hay không dư thừa.

Về mặt hình thức ánh xạ thường từ một quan hệ sang nhiều đoạn, trong trường hợp ánh xạ 1:1 thì một đoạn được ánh xạ từ một quan hệ Mọi đoạn dữ liệu tương ứng với cùng một quan hệ R và đặt ở cùng vị trí j tạo ra “ảnh vật lý” của quan hệ R ở vị trí j Vì vậy có ánh xạ 1:1 giữa ảnh vật lý và một cặp (quan hệ, đoạn) Mỗi ảnh vật lý có thể được chỉ định bởi một tên quan hệ và một chỉ số vị trí Để phân biệt ảnh vật lý, quan hệ với đoạn dữ liệu, ký hiệu Rj chỉ ảnh vật lý của quan hệ R ở vị trí j

Thuật ngữ trong suốt mô tả bằng bản sao của đoạn tham chiếu đến vị trí lưu trữ và bản sao xác định qua tên quan hệ và hai chỉ số (chỉ số đoạn và chỉ số vị trí)

Trong kiến trúc lược đồ trên có ba mức độ độc lập theo thứ tự giảm: mức tổng thể, mức cấp phát và mức ánh xạ Vì vậy, ở mức thấp hơn cần thiết phải ánh xạ sang mức cao hơn Việc ánh xạ này gọi là sơ đồ ánh xạ và phụ thuộc vào kiểu của cơ sở dữ liệu địa phương Trong hệ thống đồng nhất mức độ độc lập có một số kiểu khác nhau khi ánh xạ địa phương ở các vị trí khác nhau

Ba đối tượng quan trọng thúc đẩy phát triển cấu trúc này là tính riêng rẽ của việc phân đoạn dữ liệu, cấp phát đoạn, điều khiển dư thừa và độc lập dữ liệu đối với hệ quản trị cơ sở dữ liệu địa phương

Trang 15

CHƯƠNG II: THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN

2.1 Các bước thiết kế cơ sở dữ liệu

2.1.1 Thiết kế CSDL tập trung

- Thiết kế sơ đồ khái niệm: mô tả cơ sở dữ liệu đã hợp nhất (mọi dữ liệu

được sử dụng bởi ứng dụng cơ sở dữ liệu)

- Thiết kế cơ sở dữ liệu vật lý: tham chiếu từ lược đồ khái niệm tới vùng

lưu trữ và xác định các cách thức truy cập khác nhau

2.1.2 Thiết kế CSDL phân tán

- Thiết kế lược đồ toàn cục

- Thiết kế phân đoạn: xác định cách thức phân chia những quan hệ toàn bộ

15

Trang 16

thành những đoạn dữ liệu theo chiều dọc, chiều ngang và kiểu hỗn hợp

- Thiết kế cấp phát đoạn dữ liệu: xác định cách thức đoạn dữ liệu tham

khảo đến ảnh vật lý nào và cũng xác định các bản sao của đoạn dữ liệu

- Thiết kế CSDL vật lý cục bộ: công việc thiết kế chương trình ứng dụng

được thực hiện sau khi thiết kế sơ đồ vi trí có kiến thức và yêu cầu của chương trình ứng dụng

- Vị trí nơi chương trình ứng dụng được đưa ra (cũng gọi là vị trí cơ sở của chương trình ứng dụng )

- Số lượng, kiểu và phân tán thống kê các lần truy cập đối với mỗi đối tượng dữ liệu được yêu cầu bởi các chương trình ứng dụng

2.2 Hướng tiếp cận cơ sở dữ liệu

2.2.1 Hướng Top-down

Trong hướng thiết kế Top-down, bắt đầu bởi việc thiết kế sơ đồ tổng thể, tiếp tục thiết kế phân đoạn cơ sở dữ liệu và sau đó cấp phát các đoạn này cho các vị trí, tạo hình ảnh vật lý của dữ liệu Hoàn thành hướng này qua việc thực hiện thiết kế vật lý dữ liệu để cấp phát cho dữ liệu Đối với hệ thống phát triển từ những hệ thống hỗn tạp thì phương pháp này có sức hấp dẫn lớn vì nó cho phép thực hiện thiết kế dựa trên các giải pháp hợp lý theo từng trường hợp

2.2.2 Hướng Bottom-up

Dùng thiết kế Bottom-up khi cơ sở dữ liệu phân tán được phát triển qua việc liên kết cơ sở dữ liệu đã có sẵn Thực tế, trong trường hợp này sơ đồ toàn thể được được tạo ra bởi sự thoả hiệp giữa các loại mô tả dữ liệu có sẵn

 Nói chung các yêu cầu của thiết kế Bottom-up gồm:

- Chọn mô hình cơ sở dữ liệu thông thường để thiết kế lược đồ toàn bộ của cơ sở dữ liệu

- Dịch chuyển mỗi lược đồ địa phương sang mô hình dữ liệu thông thường

- Tích hợp sơ đồ địa phương sang sơ đồ toàn bộ thông thường

Vì vậy thiết kế theo hướng Bottom-up đòi hỏi giải quyết một số vấn đề không đặc biệt đối với cơ sơ dữ liệu phân tán nhưng cũng tồn tại trong hệ thống tập trung

2.3 Các vấn đề thiết kế

2.3.1 Lý do phân đoạn

Việc phân rã một quan hệ thành nhiều đoạn, mỗi đoạn được xử lý như một đơn vị, sẽ cho phép thực hiện nhiều giao dịch đồng thời Ngoài ra việc phân đoạn các quan hệ sẽ cho phép thực hiện song song một câu vấn tin bằng cách chia nó ra thành một tập các câu vấn tin con hoạt tác trên các đoạn Vì thế việc phân đoạn sẽ làm tăng mức độ hoạt động đồng thời và như thế làm tăng lưu lượng hoạt động của hệ thống

Trang 17

2.3.2 Các quy tắc phân đoạn đúng đắn

Chúng ta sẽ tuân thủ ba quy tắc trong khi phân đoạn mà chúng bảo đảm rằng CSDL sẽ không có thay đổi nào về ngữ nghĩa khi phân mảnh

2.3.2.1.Tính đầy đủ (completeness)

Nếu một thể hiện quan hệ R được phân rã thành các đoan R1,R2, ,Rn mỗi mục dữ liệu có thể gặp trong R cũng có thể gặp một trong nhiều đoạn Ri Đặc tính này giống như tính chất phân rã nối không mất thông tin trong chuẩn hoá, cũng quan trọng trong phân đoạn bởi vì nó bảo đảm rằng dữ liệu trong quan hệ

R được ánh xạ vào các đoạn và không bị mất

Trong trường hợp phân đoạn ngang "mục dữ liệu" muốn nói đến là một bộ, c̣òn trong trường hợp phân đoạn dọc, nó muốn nói đến một thuộc tính

2.3.2.2 Tính tái thiết được (reconstruction)

Nếu một thể hiện quan hệ R được phân rã thành các mảnh R1, R2, ,R n, thì cần phải định nghĩa một toán tử quan hệ sao cho:

R= Ri , Ri Є Fr

Toán tử thay đổi tuỳ theo từng loại phân mảnh, tuy nhiên điều quan trọng

là phải xác định được nó Khả năng tái thiết một quan hệ từ các cách của nó bảo đảm ràng buộc được định nghĩa trên dữ liệu dưới dạng các phụ thuộc sẽ được bảo toàn Khả năng tái thiết một quan hệ từ các mảnh của nó bảo đảm rằng các ràng buộc được định nghĩa trên dữ liệu dưới dạng các phụ thuộc sẽ được bảo toàn

2.3.2.3.Tính tách biệt (disjointness)

Nếu quan hệ R được phân rã ngang thành các mảnh R1, R2, ,R n, và mức

dữ liệu di nằm trong mảnh Rj, thì nó sẽ không nằm trong mảnh Rk khác ( k#j ) Tiêu chuẩn này đảm bảo các mảnh ngang sẽ tách biệt (rời nhau) Nếu quan

hệ được phân rã dọc, các thuộc tính khoá chính phải được lặp lại trong mỗi mảnh thì trong trường hợp phân mảnh dọc, tính tách biệt chỉ được định nghĩa trên các trường không phải là khoá chính của một quan hệ

2.3.3 Phân mảnh ngang

Phân mảnh ngang chia một quan hệ theo các bộ, vì vậy mỗi mảnh là một tập con của quan hệ Có hai loại phân mảnh ngang: phân mảnh ngang nguyên thủy và phân mảnh ngang dẫn xuất Phân mảnh ngang nguyên thủy của một quan hệ được thực hiện dựa trên các vị từ được định nghĩa trên quan hệ Ngược lại, phân mảnh ngang dẫn xuất là phân ra một quan hệ dựa vào các vị từ được định nghĩa trên một quan hệ khác

• Phân mảnh ngang nguyên thủy được định nghĩa bằng một phép toán chọn trên các quan hệ chủ nhân của một lược đồ CSDL

•Phân mảnh ngang dẫn xuất được định nghĩa dựa trên một sự phân mảnh ngang một quan hệ thành viên của một đường nối dựa theo phép toán chọn trên quan hệ chủ nhân của đường nối đó, hay ta c̣n gọi là sự phân mảnh quan hệ thành viên dựa trên cơ sở phân mảnh quan hệ chủ nhân

17

Ngày đăng: 30/12/2015, 20:35

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w