1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên Cứu Ứng Dụng Giải Pháp Phân Tán Dữ Liệu Quản Lý Đào Tạo Tín Chỉ Trong Các Trường Cao Đẳng Cộng Đồng

26 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu ứng dụng giải pháp phân tán dữ liệu quản lý đào tạo tín chỉ trong các trường Cao đẳng Cộng đồng
Tác giả Lý Văn Kiên
Người hướng dẫn TS. Trần Thiện Chính
Trường học Học viện Công nghệ Bưu chính Viễn thông
Chuyên ngành Khoa học máy tính
Thể loại Luận văn Thạc sĩ
Năm xuất bản 2015
Thành phố Hà Nội
Định dạng
Số trang 26
Dung lượng 5,83 MB

Nội dung

Trang 1

LÝ VĂN KIÊN

NGHIÊN CỨU ỨNG DỤNG GIẢI PHÁP

PHAN TAN DU LIEU QUAN LÝ DAO TẠO TÍN CHÍ TRONG CAC TRUONG CAO DANG CONG DONG

Chuyên ngành: Khoa học máy tính

Mã số: 60.48.01.01

TOM TAT LUẬN VĂN THẠC SĨ

HÀ NỘI - 2015

Trang 2

Luận văn được hoàn thành tại:

HỌC VIEN CÔNG NGHỆ BƯU CHÍNH VIÊN THONG

Người hướng dẫn khoa học: TS TRÀN THIỆN CHÍNH

Phản biện 1: TS Tạ Quang Hùng

Phản biện 2: TS Hoàng Lê Minh

Luận văn sẽ được bảo vệ trước Hội đông châm luận văn thạc sĩ tại Học viện Công

nghệ Bưu chính Viễn thông

Vào lúc: 13 giờ 45 ngày 27 tháng 02 năm 2016

Có thê tìm hiệu luận văn tại:

- Thư viện của Học viện Công nghệ Bưu chính Viễn thông

Trang 3

MỞ ĐẦU

Trong những năm gần đây, thuật ngữ Hệ phân tán (Distributed System) đã trở nên gần

gũi với những người làm công tác tin học Việc ứng dụng hệ tin học phân tán vào các lĩnh vực

đời sống xã hội, vào các ngành kinh tế, hàng không, giáo dục, y tế, hành chính, viễn thông, thương mại điện tử ngày càng phát triển mạnh Hiện nay, nước ta đã và đang có rất nhiều nghiên cứu nham phát triển và hoàn thiện các hệ thống dữ liệu phân tán nhăm phát triển ứng dụng trong nhiều lĩnh vực khác nhau.

Một trong các nghiên cứu đó là xây dựng hệ thống cơ sở dit liệu (CSDL) phân tán

quan lý đào tạo theo tin chỉ trong các trường Cao dang Cộng đồng Việt Nam Dao tạo theo

tín chỉ có rất nhiều ưu điểm: Hiệu quả đào tạo cao, có tính mềm dẻo và khả năng thích ứng

cũng như đạt hiệu quả cao về mặt quản lý Tuy nhiên, khi áp dụng phương pháp này thì

khối lượng công việc phải quản lý của nhà trường tăng lên rất lớn, nếu như trong phương pháp học theo niên chế lay nguyên don là lớp thì trong phương pháp học theo tin chi lay nguyên đơn là sinh viên Như vậy công việc của người quản lý tăng lên gấp bội Ví dụ, một

trường Cao dang Cộng đồng có khoảng 2.500 sinh viên các hệ dao tạo, thì việc quản lý một cách chặt chẽ và hợp lý đến từng sinh viên như: Quản lý hồ sơ, quá trình học tập theo từng

tín chỉ, khen thưởng, kỷ luật, điểm, thời khóa biéu cá nhân, học phi, học lại sẽ rat phức tap.

Thực tế, nhiều trường đã xây dựng các phần mềm đào tạo tín chỉ dựa trên hệ quản trị

CSDL tập trung, nhưng khối lượng dữ liệu được sử dụng trong mỗi năm học rất lớn và ngày một tăng, dan tới thời gian truy xuất dữ liệu rất lâu, CSDL bị ngừng trệ phục vụ, thậm chi là mat dữ liệu khi có sự cô xảy ra, có nghĩa là độ sẵn sàng phục vụ của CSDL không còn nữa, gây

ảnh hưởng đến hiệu quả của quan lý dao tạo Mặt khác việc quản ly dữ liệu tập trung cũng cần

phải triển khai hệ thống máy chủ, hạ tang mạng gây tốn kém nhiều chi phi và mức độ an toàn

cho dữ liệu khó có thé được đảm bảo Những hạn chế này đã được khắc phục trong các hệ

CSDL phân tan, đảm bảo dữ liệu luôn có tính sẵn sảng, tin cậy, an toàn và bảo mật.

Mô hình hoạt động của các trường Cao đăng Cộng đồng Việt Nam hiện nay khá đa

dạng ngành nghề đào tạo, đa dạng lĩnh vực hoạt động và đa dạng đối tượng đảo tạo Với

mục đích là tạo cơ hội học tập cho tat cả mọi người ở các trình độ khác nhau Do đó, việc

xây dựng hệ thống CSDL phân tán để hỗ trợ cho quản lý đào tạo tín chỉ, phù hợp với mô hình hoạt động trong các trường Cao dang Cộng đồng hiện nay là van đề cấp thiết Bản thân

Trang 4

tác giả hiện đang công tác tại trường Cao đăng Cộng đồng Hà Tây một thành viên trong hiệp hội các trường Cao dang Cộng đồng Việt Nam.

Vì vậy, để góp phần phục vụ cho công tác quản lý trong đào tạo của Trường, tác giả đã lựa chọn đề tài “Nghiên cứu ứng dụng giải pháp phân tán dữ liệu quản lý đào tạo tín

chỉ trong các trường Cao đẳng Cộng đồng".

Nội dung luận văn gồm ba chương:

Chương 1 - Tổng quan về cơ sở dữ liệu phân tán: Trong chương này sẽ thảo luận về một số các đặc điểm chính của CSDL phân tán, hệ quản trị CSDL phân tán, rút ra những ưu điểm của CSDL phân tán trong thiết kế CSDL Các loại truy xuất, mức trong suốt và an

toàn CSDL phân tán.

Chương 2 - Phương pháp thiết kế cơ sở dữ liệu phân tán quan lý đào tạo tín chỉ trong các trường Cao dang Cộng đồng: Chương này trình bày về mô hình hoạt động va

đưa ra bài toán quản lý dao tạo trong các trường Cao đăng Cộng đồng hiện nay Đưa ra các chiến lược thiết kế, phân tán, phân mảnh, kiểm soát đữ liệu, đồng bộ hóa CSDL phân tán.

Chương 3 - Xây dựng cơ sở dữ liệu phân tán quản lý đào tạo tín chỉ trong trường

Cao đẳng Cộng đồng Hà Tây: Nội dung chương này trình bày về hiện trạng quản lý đào tạo

tín chỉ của trường Cao đăng Cộng đồng Hà Tây hiện nay Từ đó xây dựng, thiết kế hệ thống

phân tán hỗ trợ quản lý đào tạo tín chỉ cho nhà trường.

Trong quá trình làm luận văn không thể tránh khỏi một số các thiếu sót rất mong

nhận được sự đóng góp ý kiên của các thây cô và các bạn học viên.

Trang 5

CHƯƠNG 1 - TONG QUAN VE CƠ SỞ DU LIEU PHAN TAN

1.1 Cơ sở dữ liệu phan tan

1.1.1 Định nghĩa

Một cơ sở đữ liệu (CSDL) phân tán [I] là một tập hợp dữ liệu, mà về mặt logic tập

hợp này thuộc cùng một hệ thống, nhưng về mặt vật ly dit liệu đó được phân tan trên các vi

trí khác nhau của một mạng máy tính.

Phân tán: Dữ liệu không cư trú trên một vị trí mà được phân bố rộng khắp trên nhiều

máy tính đặt tại nhiều vị trí khác nhau, đây là điểm phân biệt một CSDL phân tán với một

CSDL tập trung.

Tương quan logic: Dữ liệu trong hệ phân tán có một số thuộc tính ràng buộc chúng với nhau Điều này giúp chúng ta có thể phân biệt một CSDL phân tán với một tập hợp

CSDL tập trung, các file dữ liệu được lưu trữ tại nhiều vị trí khác nhau, điều này thường thấy trong các ứng dụng mà hệ thống sẽ phân quyền truy nhập dữ liệu trong môi trường

1.1.2 Những đặc điểm chính của cơ sở dữ liệu phân tán 1.1.3 Những ưu điểm của hệ phân tán

1.2 Hệ quản trị cơ sở dữ liệu phân tán

Hệ quản trị CSDL phân tán có chức năng hỗ trợ việc tạo và bảo trì CSDL phân tán,

chúng có các thành phần tương tự như một hệ quản trị CSDL tập trung và các thành phần hỗ

trợ trong việc chuyên tải dữ liệu đến các trạm và ngược lại.

1.3 Hệ quản trị CSDL tập trung

Các ứng dụng, hệ quản trị CSDL và CSDL được cài đặt trên cùng một bộ xử lý Ví dụ:

Trên máy tính cá nhân có thể chạy các chương trình ứng dụng có sử dụng phần mềm CSDL Oracle đề truy nhập tới CSDL trên đĩa cứng của máy tính cá nhân đó.

1.4 So sánh CSDL phân tán và CSDL tập trung

CSDL phân tán không đơn giản là những sự thực hiện phân tán của CSDL tập trung,

bởi vì chúng cho phép thiết kế các đặc trưng khác với CSDL tập trung truyền thống.

1.4.1 Điều khiển tập trung 1.4.2 Độc lập dữ liệu

1.4.3 Giảm dự thừa dit liệu

Trang 6

1.6 Các đặc trưng của các loại hình hệ thống phân tán

Việc chuyền các ứng dụng trên máy tính cá nhân cũng như các ứng dụng trên các hệ thống

máy lớn trung tâm sang mô hình phân tán là một xu hướng phát triển mạnh.

Vấn đề đặt ra là, cần lựa chọn hình thức phân tán thích hợp nào cho mỗi mô hình được chuyên đôi.

1.6.1 Đặc trưng của hệ thong File server và kién trúc Client/Server 1.6.2 Các đặc trưng của kiến trúc Client/Server

a Trình diễn thông tin phân tan

1.7.2 Phân loại các cơ chế điều khiển đồng thời giao dịch phân tán

1.8 Các loại truy xuất và mức trong suốt của CSDL phân tán

1.8.1 Các loại truy xuất CSDL phân tán

a Truy xuất từ xa thông qua các tác vụ cơ bản

b Truy xuất từ xa thông qua chương trình phụ trợ 1.8.2 Các mức trong suốt của CSDL phân tán

Tính trong suốt về vị trí

Tính trong suốt trong việc sử dụng Tinh trong suốt của việc phân chia Tính trong suốt của sự trùng lặp

1.9 Thuật toán nhiều bản sao và đồng bộ hóa dữ liệu

1.9.1 Giải thuật quản lý nhiều bản sao

Trang 7

1.9.2 Dong bộ hóa dữ liệu

Replication trong SQL Server là một tập các giải pháp cho phép sao chép, phân phối dữ liệu và đối tượng CSDL từ một CSDL SQL Server đến SQL Server khác, sau đó đồng bộ

giữa hai CSDL với nhau.

Sử dụng Replication, chúng ta có thé phân phối dé liệu đến nhiều SQL Server khác

nhau hay truy cập từ xa thông qua mạng cụ bộ hay internet Replication cũng nâng cao tinh

thực hiện hay phân phối CSDL trên nhiều Server với nhau.

Đồng bộ hóa đữ liệu sử dụng Replication cho phép chia sẻ dữ liệu giữa các CSDL tại nhiều điểm khác nhau Với một dữ liệu gốc, ta có thé tạo nhiều bản sao và sử dụng tại nhiều nơi Dữ liệu

gốc thay đồi, các dit liệu bản sao cũng sẽ thay đối và ngược lại.

1.10 An toàn dữ liệu phân tan

1.10.1 Kiểm soát cấp quyền tập trung

Một quyền được cấp được xem là một bộ ba thành phần: * Người sử dụng.

v Loại thao tác.

Định nghĩa đối tượng.

1.10.2 Kiểm soát cấp quyền phân tán

Các vấn đề kiểm soát cấp quyền trong môi trường phân tán bao gồm:

Y Cấp quyên cho người sử dụng ở xa.

Quản lý các quy tắc cấp quyền phân tán và xử lý khung nhìn.

« Nhóm người sử dụng.

1.11 Kết luận chương 1

Chương này đã thảo luận về một số các đặc điểm chính của CSDL phân tán, hệ quản trị CSDL phân tán, rút ra những ưu điểm của CSDL phân tán trong thiết kế CSDL.

Các hình thức t6 chức CSDL phân tán và các đặc trưng của nó được đề cập, dé có lựa

chọn giải pháp phù hợp cho thiết kế dữ liệu tương ứng cho từng hệ thống Việc quản lý giao dich và điều khiển đồng thời phân tán cũng rất quan trọng trong việc đảm bao dữ liệu phan tán được truy xuất Giải thuật quản lý nhiều bản sao được đề cập trong chương này nhằm

cho việc đồng bộ hóa gitra các trạm được thuận lợi.

Vấn đề an toàn dữ liệu phân tán được đề cập giúp cho việc kiểm soát quyền truy cập,

quyền phân tán được an toàn hơn Đặc biệt trong điều kiện của CSDL đảo tạo.

Trang 8

TAN QUAN LY DAO TAO TIN CHI TRONG CAC TRUONG CAO DANG CONG DONG

2.1 Mô hình hoạt động trường Cao dang Cộng đồng

Theo hiệp hội Cao đăng Cộng đồng Việt Nam [9], một trường Cao đăng Cộng đồng

(CDCD) theo đúng mô hình có những khác biệt rõ rang với các trường đại học Đặc biệt,

khi giáo dục đại học tại Việt Nam mang tính thống nhất toàn quốc khá cao thì khác biệt lại càng rõ rệt, vì trường CĐCĐ đúng nghĩa mang nhiều tính địa phương hơn Đối với các trường Cao đăng (CD) va dạy nghề tại Việt Nam, trường CDCD theo đúng mô hình có nhiều khác biệt bởi những đặc điểm sau đây:

v_ Đáp ứng nhu cầu cộng đồng

Y Cơ cấu tổ chức đảm bảo sự tham gia của cộng đồng

Y Chương trình đào tạo được phát triển và điều chỉnh theo yêu cầu của công việc Y Đa ngành và đa cấp

v_ Đào tạo theo mô hình học tập suốt đời

2.2 Bài toán quản lý đào tạo tin chỉ trong các trường Cao dang Cộng đồng

Xây dựng hệ thống CSDL phân tán nhằm quản lý học sinh, sinh viên giữa các trường thành viên Đặc điểm mỗi trường là hệ thong đào tao của mỗi trường có nhiều cấp học khác nhau như: Hệ đào tạo nghề ngắn hạn, đải hạn, hệ trung cấp 3 năm, trung cấp 2 năm, cao

đăng chính quy 3 năm, hệ liên thông lên cao đăng, đại học chính quy và vừa học vừa làm.

Tuy nhiên áp dụng dao tao tin chỉ thì chỉ có hệ Cao dang chính quy và hệ liên thông lên cao

đăng, đại học chính quy Dữ liệu dao tạo sẽ duoc phân tán về các cơ sở đào tạo của các

trường thành viên, mỗi trường sẽ quản lý sinh viên của trường mình và phòng đào tạo quản

lý chung tất cả Phòng đào tạo điều hành chính sách và quy chế.

Dữ liệu cần quản lý: Thông tin cá nhân của học sinh, điểm quá trình học cho từng

môn, từng chuyên nganh

Mỗi cơ sở đào tạo tự nhập điểm, thông tin cá nhân sinh viên do cơ sở quản lý và giảng dạy, dữ liệu này sẽ được đưa về đữ liệu điểm của sinh viên tại trường quản lý.

2.3 Thiết kế cơ sở dữ liệu

Hai chiến lược chính [3] đã được xác định trong thiết kế các CSDL phân tán là tiếp

cận từ trên xuống (top-dow) và tiếp cận từ dưới lên (bottom-up) Quá trình thiết kế theo hai

Trang 9

cách tiếp cận này rất khác nhau Nhưng chúng ta biết rất hiếm các ứng dụng đủ đơn giản để có thê sử dụng chỉ một trong hai cách tiếp cận Vì vậy phần lớn thiết kế CSDL cả hai cách tiếp cận đều được áp dung dé b6 sung cho nhau.

2.3.1 Quá trình thiết kế từ trên xuống 2.3.2 Quá trình thiết kế từ dưới lên

2.3.3 Lựa chọn chiến lược thiết kế cơ sở dữ liệu cho bài toán

Với bài toán được nêu ra trong mục 2.2 mô hình thiết kế hệ thống CSDL sẽ lựa chọn phương pháp thiết kế từ trên xuống là giải pháp thích hợp nhất bởi vì:

V Hệ thống mới chưa có CSDL gốc cần phải thiết kế lại từ dau.

* Cần phải xây dựng các chức năng chính cho hệ thống, dé từ đó phân rã ra các chức năng con cho phù hợp với yêu cầu.

Y Cac thiết kế CSDL cần phải thiết kế lại cho phù hợp với mục đích của hệ thống.

Tuy nhiên trong bài toán này, với một số CSDL, quy trình quản lý đào tạo đã hình thành san Cho nên sẽ có vài chức năng thiết kế theo mô hình từ đưới lên cho phù hợp.

2.4 Chiến lược phân tán dữ liệu

Có 4 chiến lược phân tan dữ liệu cơ bản:

2.4.1 Tập trung dữ liệu2.4.2 Chia nhỏ dữ liệu

2.4.3 Sao lưu dữ liệu

2.4.4 Phương thức lai

2.4.5 Lựa chọn chiến lược phân tan dữ liệu cho bài toán

Trong bài toán nêu trong mục 2.2 dé phân tán dữ liệu cho phù hợp ta chọn hai chiến

lược phân tán:

Y Chia nhỏ dữ liệu: Dữ liệu đào tạo sẽ được chia nhỏ ra theo yêu cầu của hệ thông,

đảm bảo sự hoạt động của hệ thống có độ tin cậy cao nhất.

Y Sao lặp dit liệu: Dữ liệu của các phần sẽ được phân bố ở nhiều trạm khác nhau Các

phần này sẽ được đồng bộ với bản chỉnh bằng một ứng dụng hay phần mềm nào đó.

2.5 Phương pháp phân mảnh và cấp phát các mảnh

Trang 10

Thiết kế phân mảnh dữ liệu là công việc đầu tiên phải thực hiện Mục dich của việc phân mảnh dữ liệu là tạo ra các đơn vị cấp phát logic, sao cho chi phí thực hiện truy van thông tin là thấp nhất.

2.5.1 Lý do phân mảnh

Trước tiên khung nhìn của các ứng dụng thường chỉ là một tập con của quan hệ Vì

thế đơn vị truy xuất không phải là toàn bộ quan hệ mà chỉ là các tập con của quan hệ Vì vậy

đưa tập con của quan hệ ra khung nhìn là tốt nhất cho nên phân mảnh các quan hệ và phân

tán đến nơi sử dụng khung nhìn sẽ là điều thích hợp nhất.

Thứ hai là nếu các ứng dụng có các khung nhìn được định nghĩa trên một quan hệ

cho trước, quan hệ đó lại năm tại các vị trí khác thì có hai cách chọn lựa:

1 Đơn vi phân tán là toàn bộ quan hệ không được nhân bản va được lưu ở một vi trí.

2 Quan hệ được nhân bản cho tat cả các vị trí hoặc một số vi trí có chạy ứng dụng.

Lua chọn (1) gây ra một một số lượng lớn các truy xuất không cần thiết đến dit liệu ở xa Còn ngược lại chọn lựa (2) thực hiện nhân bản không cần thiết, gây ra nhiều van đề khi truy nhập và có thé làm lãng phí nhiều không gian lưu trữ.

Cuối cùng, việc phân rã một quan hệ thành nhiều mảnh, mỗi mảnh được xử lý như

một don vi, sẽ cho phép thực hiện nhiều giao dịch đồng thời và cho phép thực hiện song

song một câu vấn tin băng cách chia nó thành một tập các câu vấn con hoạt tác trên các mảnh Vì thế việc phân mảnh sẽ làm tăng mức độ hoạt động đồng thời và như thế làm tăng

lưu lượng hoạt động của hệ thống.

Có hai cách phân mảnh cơ bản là:

vx Phân mảnh ngang.v Phân mảnh doc.

2.5.2 Phương pháp phân mảnh ngang

Phân mảng ngang chính là việc chia quan hệ thành nhiều các nhóm bộ Kết quả của quá trình phân mảnh ngang là các quan hệ con, số lượng quan hệ con phụ thuộc vào điều

kiện rành buộc của các thuộc tính Và các bộ trong các quan hệ con là tách biệt nhau Phân

mảnh ngang thực chat là phép chọn quan hệ thỏa mãn một biéu thức điều kiện cho trước.

a Phân mảnh ngang nguyên thủy

Phân mảnh ngang nguyên thuỷ được định nghĩa bằng một phép toán chọn trên các quan hệ chủ nhân của một lược đồ của CSDL.

Trang 11

b Phân mảnh ngang dẫn xuất

Phân mảnh ngang dẫn xuất được định nghĩa trên một quan hệ thành viên của đường nối dựa theo phép toán chọn trên quan hệ chủ nhân của đường nối đó.

Chúng ta cần kiểm tra tính đúng đắn của phân mảnh ngang: * Tinh day đủ

Phân mảnh ngang nguyên thuỷ: Với điều kiện các vị từ chọn là đầy đủ, phân mảnh thu cũng được đảm bảo là đầy đủ, bởi vi cơ sở của thuật toán phân mảnh là tập các vi từ cực

tiêu và đầy đủ Pr, nên tính đầy đủ được bảo đảm với điều kiện không có sai sót xảy ra.

Phân mảnh ngang dẫn xuất: Có khác chút ít, khó khăn chính ở đây là do vị từ định nghĩa phân mảnh có liên quan đến hai quan hệ Trước tiên chúng ta hãy định nghĩa qui tắc

đầy đủ một cách hình thức * Tinh tai thiết được

Tái thiết một quan hệ toàn cục từ các mảnh được thực hiện bằng toán tử hợp trong cả

phân mảnh ngang nguyên thủy lẫn dẫn xuất, Vì thế một quan hệ R với phân mảnh F,={R;,

Ra, ,R„m} chúng ta có:

RE=UR;, VR¡e Fr

* Tinh tach rời

Với phân mảnh nguyên thuỷ tính tách rời sẽ được bảo đảm miễn là các vị từ hội sơ

cấp xác định phân mảnh có tính loại trừ tương hỗ (mutually exclusive) Với phân mảnh dẫn xuất tính tách rời có thể bảo đảm nếu đồ thị nối thuộc loại đơn giản.

2.5.3 Phương pháp phân mảnh dọc

Một phân mảnh dọc cho một quan hệ R sinh ra các mảnh Rị, Rạ, ,R;, mỗi mảnh chứa

một tập con thuộc tính của R và cả khoá của R Mục đích của phân mảnh dọc là phân hoạch

một quan hệ thành một tập các quan hệ nhỏ hơn để nhiều ứng dụng chỉ cần chạy trên một

mảnh Một phân mảnh “tối ưu” là phân mảnh sinh ra một lược đồ phân mảnh cho phép giảm tối đa thời gian thực thi các ứng dụng chạy trên mảnh đó.

Dé có được các lời giải tối ưu cho bài toán phân mảnh dọc rất không hiệu quả, phải sử

dụng hai phương pháp Heuristic cho phân mảnh dọc các quan hệ toàn cục.

1 Nhóm thuộc tính: Bắt đầu gán mỗi thuộc tính cho một mảnh và trong mỗi bước, nối

một sô mảnh lại với nhau cho tới khi thỏa mãn điêu kiện.

Trang 12

2 Tach mảnh: Bắt đầu băng một quan hệ và quyết định cách phân chia dựa trên hành vi

truy nhập của các ứng dụng trên các thuộc tính.

Kỹ thuật tách mảnh thích hợp với phương pháp thiết kế từ trên xuống Các mảnh không gối chồng lên nhau (không phải là khóa chính) Ngược lại, với phương pháp nhóm thuộc tính thường tạo ra các mảnh gối chồng lên nhau.

2.5.4 Bài toán cấp phát các mảnh

Gia sử đã có một tập các mảnh F={F\, Fạ, ,Fn} và một mang bao gồm các vi trí

S={S¡, So, Sm} trên đó có một tập các ứng dụng Q={dq¡, q›, ,qạ} đang chạy.

Bài toán cấp phát là tìm một phân phối “tối ưu” của F cho S Tính tôi ưu có thé được định nghĩa ứng với hai số đo:

Chi phí nhỏ nhất: Hàm chi phí có chỉ lưu mảnh F, vào vị trí S¡, chi phí van tin mảnh

Fj vào vi trí S¡, chi phí cập nhật F; tại tất cả mọi vị trí có chứa nó và chỉ phí truyền đữ liệu.

Vi thé bài toán cấp phát cố gắng tìm một lược đồ cấp phát với ham chi phí tổ hợp nhỏ nhất.

Hiệu năng: Chiến lược cấp phát được thiết kế nhằm duy trì một hiệu quả lớn đó là hạ thấp thời gian đáp ứng và tăng tối đa lưu lượng hệ thống tại mỗi vị trí.

2.5.5 Lựa chọn phương pháp phân mảnh cho bài toán

Với bài toán quản lý đào tạo tín chỉ nêu ra trong mục 2.2, kết hợp với việc trình bày

hai phương pháp phân mảnh, phân mảnh ngang, phân mảnh dọc nêu ra trong mục 2.5.2 và2.5.3 Lựa chọn phương pháp phân mảnh ngang cho việc phân mảnh CSDL cho bài toán làphù hợp bởi lẽ:

vx Kỹ thuật phân mảnh dọc phức tạp hơn so với kỹ thuật phân mảnh ngang, vi số lựa chọn phân hoạch rất lớn.

Y Phương pháp phân mảnh doc thì số mảnh tạo ra lớn do đó làm quá trình truy xuất bị

ảnh hưởng Kỹ thuật cài đặt phân mảnh dọc phức tạp hơn so với phân mảnh ngang.

Để có được các lời giải tối ưu cho bài toán phân mảnh dọc rất không hiệu quả, phải

sử dụng hai phương pháp Heuristic cho phân mảnh dọc các quan hệ toàn cục.

VY Phương pháp phân mảnh ngang dễ thiết kế và cài đặt hơn, đồng thời làm giảm thời gian truy xuất đữ liệu.

2.6 Kiểm soát dữ liệu ngữ nghĩa

CSDL không chỉ tập trung ở một nơi mà phân tán trên nhiều nơi khác nhau Khi có

một yêu câu về cập nhật dữ liệu, làm thê nào đê dữ liệu van đảm bảo được tính nhât quán và

Trang 13

toàn ven dữ liệu Dinh nghĩa các quy tắc nhằm kiểm soát các thao tác dữ liệu là một trong những yêu cầu quan trọng của một hệ quản trị CSDL tập trung hay phân tán.

Kiểm soát dữ liệu ngữ nghĩa bao gồm:

Y Quản trị khung nhìn.

Y Kiểm soát tính an toàn và bảo mật * Kiểm soát tính toàn vẹn ngữ nghĩa.

Các chức năng này phải bảo đảm cho những người sử dụng được phép sẽ thực hiện

đúng đắn các thao tác trên CSDL nhằm duy tri tính toàn vẹn dit liệu.

2.7 Đồng bộ hóa CSDL phân tán

2.7.1 Dong bộ hóa CSDL cho bài toán quản lý đào tạo tin chỉ

Đồng bộ hóa dữ liệu Replication cho phép chia sẻ dữ liệu giữa các CSDL tại nhiều điểm

khác nhau Với một dữ liệu gôc, ta có thê tạo nhiêu bản sao và sử dụng tại nhiêu nơi Dữ liệu

Replicate 3

Hình 2.4: Mô hình phân tán dữ liệu Replicate

Ngày đăng: 07/04/2024, 12:22

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w