Tập trung dữ liệu

Một phần của tài liệu Xây dựng cơ sở dữ liệu phân tán quản lý học sinh sinh viên tại trường cao đẳng kỹ nghệ dung quất (Trang 37 - 43)

7. Kết luận

2.2.1 Tập trung dữ liệu

Tất cả các dữ liệu đƣợc tập trung một chổ. Cách này đơn giản nhƣng có 3 nhƣợc điểm:

- Dữ liệu không sẵn sàng cho ngƣời sử dụng truy nhập từ xa.

- Chi phí truyền thông lớn, thƣờng làm cực đại việc truy nhập dữ liệu tới nơi tập trung.

- Toàn bộ hệ thống ngừng khi cơ sở dữ liệu bị sự cố. 2.2.2 Chia nhỏ dữ liệu

Cơ sở dữ liệu đƣợc chia thành các phần nhỏ liên kết nhau (không trùng lặp). Mỗi phần dữ liệu đƣợc đƣa đến các trạm một cách thích hợp để sử dụng.

2.2.3 Sao lặp dữ liệu

CSDL đƣợc nhân thành nhiều bản từng phần hoặc đầy đủ và đƣợc đặt ở nhiều trạm trên mạng.

Nếu bản sao của CSDL đƣợc lƣu giữ tại mọi trạm của hệ thống ta có trƣờng hợp sao lặp đầy đủ.

Hiện nay có nhiều kỹ thuật mới cho phép tạo bản sao không đầy đủ phù hợp với yêu cầu dữ liệu ở mỗi trạm và một bản đầy đủ đƣợc quản lý ở server.

Sau một khoảng thời gian nhất định các bản sao đƣợc làm đồng bộ với bản chính bằng một ứng dụng nào đó.

Cơ sở dữ liệu đƣợc phân thành nhiều phần: quan trọng và không quan trọng.

- Phần ít quan trọng đƣợc lƣu giữ một nơi.

- Phần quan trọng đƣợc lƣu trữ ở nhiều nơi khác. 2.3 Phân mảnh dữ liệu

Phân mảnh quan hệ là gì. Là việc chia nhỏ một quan hệ thành nhiều quan hệ nhỏ hơn đƣợc gọi là phân mãnh quan hệ

Phần lớn các hệ cơ sở dữ liệu phân tán đƣợc thiết kế theo hƣớng từ trên xuống (Top- Down). Hầu hết các hệ quản trị cơ sở dữ liệu phân tán đƣợc thiết kế, tạo mới cho nên chúng ta đề cập thiết kế theo hƣớng từ trên xuống top down. Thiết kế phân mảnh là công việc đầu tiên cần phải thực hiện, mục đích việc phân mảnh dữ liệu tạo ra các đơn vị cấp phát logic sao cho chi phí thực hiện truy vấn thông tin là thấp nhất. Thiết kế phân mảnh bằng các nhóm một số bộ trong trƣờng hợp phân mảnh dọc có cùng đặc tính theo quan điểm cấp phát các mảnh hình thành bằng các phƣơng pháp nhân mảnh tạo ra các đơn vị cấp phát dữ liệu khác nhau

Các lý do phân mảnh.

Trong thiết kế cơ sở dữ liệu phân tán cần phải thực hiện phân mảnh dữ liệu vì: Hệ quản trị cơ sở dự liệu, các quan hệ bảng đƣợc lƣu trữ dƣới dạng 2 chiều các thao tác đối với CSDL đƣợc thực hiện trên các bảng.

Việc phân rả quan hệ thành nhiều mảnh, mỗi mảnh đƣợc xử lý nhƣ một đơn vị dữ liệu, sẽ cho phép thực hiện giao dịch đồng thời, việc phân mảnh các quan hệ cũng cho phép thực hiện song song một câu vấn tin bằng cách chia nó thành một tập các câu vấn tin con hoạt động trên các mảnh. Vì vậy việc phân mảnh sẽ làm tăng mức độ hoạt động, đồng thời tăng lƣu lƣợng hệ thống

Khung nhìn hoặc đơn vị truy xuất của các ứng dụng không phải là toàn bộ quan hệ mà thƣờng là một mảnh.

Việc phân rã một quan hệ thành nhiều mảnh, mỗi mảnh đƣợc xử lý nhƣ một đơn vị, sẽ cho phép thực hiện nhiều giao dịch đồng thời.

Việc phân mảnh các quan hệ sẽ cho phép thực hiện song song một câu vấn tin bằng cách chia nó ra thành một tập các câu vấn tin con hoạt tác trên các mảnh.

Nếu các ứng dụng có các khung nhìn đƣợc định nghĩa trên một quan hệ cho trƣớc nằm tại những vị trí khác thì có hai cách chọn lựa đơn vị phân tán:

+ hoặc là toàn bộ quan hệ

+ hoặc quan hệ đƣợc lƣu ở một vị trí có chạy ứng dụng.

Thiết đến dữ liệu ở xa. Chọn lựa sau sẽ gây ra nhiều vấn đề khi cập nhật và lãng phí không gian lƣu trữ.

Các quy tắc phân mảnh:

Các nguyên tắc đảm bảo cơ sỡ dự liệu khi phân mảnh sẽ đảm bảo tính không thay đổi về ngữ nghĩa. Dƣới đây là ba quy tắc tuân thủ khi phân mảnh cơ sở dự liệu quan hệ

- Tính đầy đủ: Quan hệ R đƣợc phân rã thành các mảnh R1, R2, ...Rn, thì mổi mục dữ liệu có trong quan hệ R sẽ đƣợc chứa ít nhất một mảnh Ri (i=1,....,n). Quy tắc này đảm bảo cho các mục dữ liệu trong R đƣợc ánh xạ hoàn toàn vào các mảnh mà không bị mất.

- Tính phục hồi: Nếu một quan hệ R đƣợc phân rã thành các mảnh R1, R2, ...Rn, khi đó R= Ri, Ri € FR toàn tử thay đổi tùy theo từng loại phân mảnh. Khả năng phụ hồi quan hệ từ các mảnh sẽ đảm bảo bảo toàn các phụ thuộc

- Tính tách biệt: Nếu quan hệ R đƣợc phân rã thành các mảnh Ri, i=1,..n và mục dữ liệu di nằm trong một mảnh Ri thì nó sẽ không nằm trong mạnh Rk, (k#J). Quy tắc này đảm bảo các mảnh phân rã rời nhau. Trong trƣờng hợp phân mảnh dọc khóa chính của quan hệ phải đƣợc lập lại trong tất cả các mảnh. Vì vậy tính tách biệt trong phân mảnh dọc đƣợc hiểu không liên quan gì đến khóa chính của quan hệ.

2.3.1 Phân mảnh ngang

Quan hệ đƣợc chia theo chiều ngang đây là phép chọn trong quan hệ. Chọn những bộ của quan hệ thỏa mãn một biểu thức điều kiện cho trƣớc:

Ví dụ:

Tách ngang quan hệ PROJ thành 2 quan hệ PROJ1 và PROJ2 thỏa điều kiện BUDGET ≤ 200000 BUDGET >200000 nhƣ sau:

σ BUDGET ≤ 200000 (PROJ)

σ BUDGET >200000 (PROJ)

PNO PNAME BUDGET

P1 Instrumentation 150000

P2 Database develop 135000

Phân mảnh ngang một quan hệ tổng thể n-bộ R là tách R thành các quan hệ con n-bộ R1, R2, ..., Rk sao cho quan hệ R có thể đƣợc khôi phục lại từ các quan hệ con này bằng phép hợp: R = R1υ R2υ ... υ Rk.

Có hai loại phân mảnh ngang:

- Phân mảnh ngang nguyên thủy (primary horizontal fragmentation): phân mảnh ngang nguyên thủy của một quan hệ đƣợc thực hiện dựa trên các vị từ đƣợc định nghĩa trên quan hệ đó.

PNO PNAME BUDGET

P3 CAD/CAM 250000

Phân mảnh ngang nguyên thuỷ đƣợc định nghĩa bằng một phép toán chọn trên các quan hệ chủ nhân của một lƣợc đồ của CSDL. Vì thế cho biết quan hệ R, các mảnh ngang của R là các R Rl = ơFl(R), 1 < i < z.

Trong đó Fl là công thức chọn đƣợc sử dụng để có đƣợc mảnh Rl. Chú ý rằng nếu Fl có dạng chuẩn hội, nó là một vị từ hội sơ cấp (mj).

- Phân mảnh ngang dẫn xuất (derived horizontal fragmentation): phân mảnh ngang dẫn xuất của một quan hệ đƣợc thực hiện dựa trên các vị từ đƣợc định nghĩa trên quan hệ khác.

Nhƣ vậy, trong phân mảnh ngang tập các vị từ đóng một vai trò quan trọng. 2.3.2 Phân mảnh dọc

Các quan hệ đƣợc chia theo chiều dọc. Nghĩa là thiết lập một quan hệ mới chỉ có một số thuộc thuộc tính quan hệ gốc thực tế đây là phép chiếu trên tập con các thuộc tính quan hệ

Ví dụ:

Tách dọc quan hệ PROJ thành 2 quan hệ PROJ1 và PROJ2 nhƣ sau: π PNO, BUDGET (PROJ) và π PNO, PNAME,LOG (PROJ) và

PNO BUDGET PNO PNAME LOG

P1 150000 P1 Instrumentation Montreal

P2 135000 P2 Database develop New York

P3 250000 P3 CAD/CAM New York

P3 310000 P4 Maintenance Pais

Phân mảnh dọc một quan hệ tổng thể n-bộ R là tách R thành các quan hệ con R1, R2, ..., Rk sao cho quan hệ R có thể đƣợc khôi phục lại từ các quan hệ con này bằng phép nối: R = R1 R2 ..., Rk.

Mục đích của phân mảnh dọc là phân hoạch một quan hệ thành một tập các quan hệ nhỏ hơn để nhiều ứng dụng có thể chỉ chạy trên một quan hệ.

2.3.3 Phân mảnh hỗn hợp

Cách đơn giản nhất để phân mảnh hỗn hợp gồm có: Áp dụng phân mảnh ngang cho các mảnh phân chia theo chiều dọc; phân mảnh dọc cho các mảnh phân chia theo chiều ngang.

Trong đa số các trƣờng hợp, phân mảnh ngang hoặc phân mảnh dọc đơn giản cho một lƣợc đồ CSDL không đủ đáp ứng các yêu cầu từ ứng dụng. Trong trƣờng hợp đó phân mảnh dọc có thể thực hiện sau một số mảnh ngang hoặc ngƣợc lại, sinh ra một lối phân hoạch có cấu trúc cây. Bởi vì hai chiến lƣợc này đƣợc áp dụng lần lƣợt, chọn lựa này đƣợc gọi là phân mảnh hỗn hợp.

Nếu ứng dụng có những yêu cầu ngăn cản việc phân rã thành các mảnh để đƣợc sử dụng độc quyền, thì những ứng dụng có các khung nhìn đƣợc định nghĩa trên nhiều mảnh sẽ bị giảm hiệu suất hoạt động.

Nếu một khung nhìn đòi hỏi thông tin ở nhiều mảnh thì việc truy xuất dữ liệu để nối lại sẽ có chi phí cao.

Kiểm soát dữ liệu ngữ nghĩa (semantic data control): Do kết quả của phân mảnh, các thuộc tính tham gia vào một phụ thuộc có thể bị phân rã vào các mảnh khác nhau và đƣợc cấp phát cho những vị trí khác nhau. Trong trƣờng hợp này, một nhiệm vụ đơn giản nhƣ kiểm tra các phụ thuộc cũng phải thực hiện truy tìm dữ liệu ở nhiều vị trí.

2.4 Nhân bản dữ liệu

Giả sử CSDL đã đƣợc phân mảnh, tích hợp và sẽ thỏa các yêu cầu phải cấp phát cho các vị trí trên mạng, khi dữ liệu cấp phát có thể không nhân bản hoặc nhân bản. Không nhân bản đƣợc gọi là CSDL phân hoạch, các mảnh chỉ đƣợc cấp phát trên các trạm và không có bản sao nào trên mạng. Trong trƣờng hợp nhân bản, hoặc toàn bộ CSDL đều có trên tất cả các trạm ( CSDL đƣợc nhân bản đầy đủ) hoặc các mảnh của CSDL đƣợc phân tán tới các trạm bằng cách các bản sao đƣợc đặt trên nhiều trạm (CSDL đƣợc nhân bản từng phần). một số các bản sao của mảnh có thể là đầu vào cho thuật toán cấp phát hoặc quyết định giá trị của biến đƣợc xá định bởi thuật toán.

Nhân bản làm tăng độ tin cậy và tang hiệu quả của các câu vấn tin chỉ đọc (Read-only Query) đặc biệt có thể truy xuất CSDL khi gặp sự cố. Hơn nữa các truy vấn đọc truy xuất đến cùng một mục dữ liệu có thể cho thực hiện song song vì các bản sao có mặt tại vị trí nhiều.

Nhân bản hoàn toàn Nhân bản một phần Phân hoạch

Xử lý truy vấn Dễ Cùng mức độ khó tin

Quản lý thƣ mục Dễ hoặc không tồn tại Cùng mức độ khó tin

Đều khiển đồng thời Vừa phải Khó Dễ

Độ tin cậy Rất cao Cao Thấp

Thực tế Có thể áp dụng Thực tế Có thể áp dụng

Việc cấp phát dữ liệu phải đƣợc thực hiện sao cho thỏa mãn hai yêu cầu sau: - Chi phí nhỏ nhất

- Hiệu năng lớn nhất: Giảm thiều thời gian đáp ứng tăng tối đa lƣu lƣợng hệ thống tại mỗi vị trí

Công việc thiết kế CSDL phân tán phụ thuộc rất nhiều vào các yếu tố đó là ảnh hƣởng đến một thiết kế tối ƣu, tổ chức logic CSDL, vị trí các ứng dụng, đặc tính truy xuất của các ứng dụng đến CSDL và đặc tính của hệ thống máy tính tại mỗi vị trí. Điều này làm cho việc diễn đạt bài toán trở nên hết sức phức tạp.

Các thông tin cần thiết kế phân tán bao gồm: - Thông tin cơ sỡ dữ liệu.

- Thông tin ứng dụng. - Thông tin mạng.

Yêu cầu thông tin về mạng và thông tin về hệ thống máy tính chỉ đƣợc sử dụng trong các mô hình cấp phát không đƣợc sử dụng trong các thuật toán phân mảnh dữ liệu.

2.5 Sử dụng hệ thống mạng nội bộ hiện có và nghiên cứu hiện trạng mạng nội bộ của Trƣờng

KHOA ĐIỆN TỬ

Hub

PHÕNG TỔ CHỨC

SƠ ĐỒ MÔ PHỎNG MÁY TÍNH TẠI CÁC PHÕN,G KHOA, ĐƠN VỊ TRƢỜNG CAO ĐẲNG KỸ NGHỆ DUNG QUẤT

PHÕNG KẾ TOÁN

PHÕNG ĐÀO TẠO

KHOA CƠ KHÍ

Hub

KHOA LỌC HÓA DẦU

Hub KHOA CƠ BẢN Hub KHOA TỔNG HỢP Hub HIỆU TRƢỞNG HIỆU PHÓ HIỆU PHÓ

Hình 2.2: Sơ đồ mạng máy tính Trường CĐKN Dung Quất

Một phần của tài liệu Xây dựng cơ sở dữ liệu phân tán quản lý học sinh sinh viên tại trường cao đẳng kỹ nghệ dung quất (Trang 37 - 43)

Tải bản đầy đủ (PDF)

(97 trang)