LÝ VĂN KIÊN
NGHIÊN CỨU ỨNG DỤNG GIẢI PHÁP
PHAN TAN DU LIEU QUAN LÝ DAO TẠO TÍN CHÍ TRONG CAC TRUONG CAO DANG CONG DONG
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01
TOM TAT LUẬN VĂN THẠC SĨ
HÀ NỘI - 2015
Trang 2Luận văn được hoàn thành tại:
HỌC VIEN CÔNG NGHỆ BƯU CHÍNH VIÊN THONG
Người hướng dẫn khoa học: TS TRÀN THIỆN CHÍNH
Phản biện 1: TS Tạ Quang Hùng
Phản biện 2: TS Hoàng Lê Minh
Luận văn sẽ được bảo vệ trước Hội đông châm luận văn thạc sĩ tại Học viện Công
nghệ Bưu chính Viễn thông
Vào lúc: 13 giờ 45 ngày 27 tháng 02 năm 2016
Có thê tìm hiệu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
Trang 3MỞ ĐẦU
Trong những năm gần đây, thuật ngữ Hệ phân tán (Distributed System) đã trở nên gần
gũi với những người làm công tác tin học Việc ứng dụng hệ tin học phân tán vào các lĩnh vực
đời sống xã hội, vào các ngành kinh tế, hàng không, giáo dục, y tế, hành chính, viễn thông, thương mại điện tử ngày càng phát triển mạnh Hiện nay, nước ta đã và đang có rất nhiều nghiên cứu nham phát triển và hoàn thiện các hệ thống dữ liệu phân tán nhăm phát triển ứng dụng trong nhiều lĩnh vực khác nhau.
Một trong các nghiên cứu đó là xây dựng hệ thống cơ sở dit liệu (CSDL) phân tán
quan lý đào tạo theo tin chỉ trong các trường Cao dang Cộng đồng Việt Nam Dao tạo theo
tín chỉ có rất nhiều ưu điểm: Hiệu quả đào tạo cao, có tính mềm dẻo và khả năng thích ứng
cũng như đạt hiệu quả cao về mặt quản lý Tuy nhiên, khi áp dụng phương pháp này thì
khối lượng công việc phải quản lý của nhà trường tăng lên rất lớn, nếu như trong phương pháp học theo niên chế lay nguyên don là lớp thì trong phương pháp học theo tin chi lay nguyên đơn là sinh viên Như vậy công việc của người quản lý tăng lên gấp bội Ví dụ, một
trường Cao dang Cộng đồng có khoảng 2.500 sinh viên các hệ dao tạo, thì việc quản lý một cách chặt chẽ và hợp lý đến từng sinh viên như: Quản lý hồ sơ, quá trình học tập theo từng
tín chỉ, khen thưởng, kỷ luật, điểm, thời khóa biéu cá nhân, học phi, học lại sẽ rat phức tap.
Thực tế, nhiều trường đã xây dựng các phần mềm đào tạo tín chỉ dựa trên hệ quản trị
CSDL tập trung, nhưng khối lượng dữ liệu được sử dụng trong mỗi năm học rất lớn và ngày một tăng, dan tới thời gian truy xuất dữ liệu rất lâu, CSDL bị ngừng trệ phục vụ, thậm chi là mat dữ liệu khi có sự cô xảy ra, có nghĩa là độ sẵn sàng phục vụ của CSDL không còn nữa, gây
ảnh hưởng đến hiệu quả của quan lý dao tạo Mặt khác việc quản ly dữ liệu tập trung cũng cần
phải triển khai hệ thống máy chủ, hạ tang mạng gây tốn kém nhiều chi phi và mức độ an toàn
cho dữ liệu khó có thé được đảm bảo Những hạn chế này đã được khắc phục trong các hệ
CSDL phân tan, đảm bảo dữ liệu luôn có tính sẵn sảng, tin cậy, an toàn và bảo mật.
Mô hình hoạt động của các trường Cao đăng Cộng đồng Việt Nam hiện nay khá đa
dạng ngành nghề đào tạo, đa dạng lĩnh vực hoạt động và đa dạng đối tượng đảo tạo Với
mục đích là tạo cơ hội học tập cho tat cả mọi người ở các trình độ khác nhau Do đó, việc
xây dựng hệ thống CSDL phân tán để hỗ trợ cho quản lý đào tạo tín chỉ, phù hợp với mô hình hoạt động trong các trường Cao dang Cộng đồng hiện nay là van đề cấp thiết Bản thân
Trang 4tác giả hiện đang công tác tại trường Cao đăng Cộng đồng Hà Tây một thành viên trong hiệp hội các trường Cao dang Cộng đồng Việt Nam.
Vì vậy, để góp phần phục vụ cho công tác quản lý trong đào tạo của Trường, tác giả đã lựa chọn đề tài “Nghiên cứu ứng dụng giải pháp phân tán dữ liệu quản lý đào tạo tín
chỉ trong các trường Cao đẳng Cộng đồng".
Nội dung luận văn gồm ba chương:
Chương 1 - Tổng quan về cơ sở dữ liệu phân tán: Trong chương này sẽ thảo luận về một số các đặc điểm chính của CSDL phân tán, hệ quản trị CSDL phân tán, rút ra những ưu điểm của CSDL phân tán trong thiết kế CSDL Các loại truy xuất, mức trong suốt và an
toàn CSDL phân tán.
Chương 2 - Phương pháp thiết kế cơ sở dữ liệu phân tán quan lý đào tạo tín chỉ trong các trường Cao dang Cộng đồng: Chương này trình bày về mô hình hoạt động va
đưa ra bài toán quản lý dao tạo trong các trường Cao đăng Cộng đồng hiện nay Đưa ra các chiến lược thiết kế, phân tán, phân mảnh, kiểm soát đữ liệu, đồng bộ hóa CSDL phân tán.
Chương 3 - Xây dựng cơ sở dữ liệu phân tán quản lý đào tạo tín chỉ trong trường
Cao đẳng Cộng đồng Hà Tây: Nội dung chương này trình bày về hiện trạng quản lý đào tạo
tín chỉ của trường Cao đăng Cộng đồng Hà Tây hiện nay Từ đó xây dựng, thiết kế hệ thống
phân tán hỗ trợ quản lý đào tạo tín chỉ cho nhà trường.
Trong quá trình làm luận văn không thể tránh khỏi một số các thiếu sót rất mong
nhận được sự đóng góp ý kiên của các thây cô và các bạn học viên.
Trang 5CHƯƠNG 1 - TONG QUAN VE CƠ SỞ DU LIEU PHAN TAN
1.1 Cơ sở dữ liệu phan tan
1.1.1 Định nghĩa
Một cơ sở đữ liệu (CSDL) phân tán [I] là một tập hợp dữ liệu, mà về mặt logic tập
hợp này thuộc cùng một hệ thống, nhưng về mặt vật ly dit liệu đó được phân tan trên các vi
trí khác nhau của một mạng máy tính.
Phân tán: Dữ liệu không cư trú trên một vị trí mà được phân bố rộng khắp trên nhiều
máy tính đặt tại nhiều vị trí khác nhau, đây là điểm phân biệt một CSDL phân tán với một
CSDL tập trung.
Tương quan logic: Dữ liệu trong hệ phân tán có một số thuộc tính ràng buộc chúng với nhau Điều này giúp chúng ta có thể phân biệt một CSDL phân tán với một tập hợp
CSDL tập trung, các file dữ liệu được lưu trữ tại nhiều vị trí khác nhau, điều này thường thấy trong các ứng dụng mà hệ thống sẽ phân quyền truy nhập dữ liệu trong môi trường
1.1.2 Những đặc điểm chính của cơ sở dữ liệu phân tán 1.1.3 Những ưu điểm của hệ phân tán
1.2 Hệ quản trị cơ sở dữ liệu phân tán
Hệ quản trị CSDL phân tán có chức năng hỗ trợ việc tạo và bảo trì CSDL phân tán,
chúng có các thành phần tương tự như một hệ quản trị CSDL tập trung và các thành phần hỗ
trợ trong việc chuyên tải dữ liệu đến các trạm và ngược lại.
1.3 Hệ quản trị CSDL tập trung
Các ứng dụng, hệ quản trị CSDL và CSDL được cài đặt trên cùng một bộ xử lý Ví dụ:
Trên máy tính cá nhân có thể chạy các chương trình ứng dụng có sử dụng phần mềm CSDL Oracle đề truy nhập tới CSDL trên đĩa cứng của máy tính cá nhân đó.
1.4 So sánh CSDL phân tán và CSDL tập trung
CSDL phân tán không đơn giản là những sự thực hiện phân tán của CSDL tập trung,
bởi vì chúng cho phép thiết kế các đặc trưng khác với CSDL tập trung truyền thống.
1.4.1 Điều khiển tập trung 1.4.2 Độc lập dữ liệu
1.4.3 Giảm dự thừa dit liệu
Trang 61.6 Các đặc trưng của các loại hình hệ thống phân tán
Việc chuyền các ứng dụng trên máy tính cá nhân cũng như các ứng dụng trên các hệ thống
máy lớn trung tâm sang mô hình phân tán là một xu hướng phát triển mạnh.
Vấn đề đặt ra là, cần lựa chọn hình thức phân tán thích hợp nào cho mỗi mô hình được chuyên đôi.
1.6.1 Đặc trưng của hệ thong File server và kién trúc Client/Server 1.6.2 Các đặc trưng của kiến trúc Client/Server
a Trình diễn thông tin phân tan
1.7.2 Phân loại các cơ chế điều khiển đồng thời giao dịch phân tán
1.8 Các loại truy xuất và mức trong suốt của CSDL phân tán
1.8.1 Các loại truy xuất CSDL phân tán
a Truy xuất từ xa thông qua các tác vụ cơ bản
b Truy xuất từ xa thông qua chương trình phụ trợ 1.8.2 Các mức trong suốt của CSDL phân tán
Tính trong suốt về vị trí
Tính trong suốt trong việc sử dụng Tinh trong suốt của việc phân chia Tính trong suốt của sự trùng lặp
1.9 Thuật toán nhiều bản sao và đồng bộ hóa dữ liệu
1.9.1 Giải thuật quản lý nhiều bản sao
Trang 71.9.2 Dong bộ hóa dữ liệu
Replication trong SQL Server là một tập các giải pháp cho phép sao chép, phân phối dữ liệu và đối tượng CSDL từ một CSDL SQL Server đến SQL Server khác, sau đó đồng bộ
giữa hai CSDL với nhau.
Sử dụng Replication, chúng ta có thé phân phối dé liệu đến nhiều SQL Server khác
nhau hay truy cập từ xa thông qua mạng cụ bộ hay internet Replication cũng nâng cao tinh
thực hiện hay phân phối CSDL trên nhiều Server với nhau.
Đồng bộ hóa đữ liệu sử dụng Replication cho phép chia sẻ dữ liệu giữa các CSDL tại nhiều điểm khác nhau Với một dữ liệu gốc, ta có thé tạo nhiều bản sao và sử dụng tại nhiều nơi Dữ liệu
gốc thay đồi, các dit liệu bản sao cũng sẽ thay đối và ngược lại.
1.10 An toàn dữ liệu phân tan
1.10.1 Kiểm soát cấp quyền tập trung
Một quyền được cấp được xem là một bộ ba thành phần: * Người sử dụng.
v Loại thao tác.
Định nghĩa đối tượng.
1.10.2 Kiểm soát cấp quyền phân tán
Các vấn đề kiểm soát cấp quyền trong môi trường phân tán bao gồm:
Y Cấp quyên cho người sử dụng ở xa.
Quản lý các quy tắc cấp quyền phân tán và xử lý khung nhìn.
« Nhóm người sử dụng.
1.11 Kết luận chương 1
Chương này đã thảo luận về một số các đặc điểm chính của CSDL phân tán, hệ quản trị CSDL phân tán, rút ra những ưu điểm của CSDL phân tán trong thiết kế CSDL.
Các hình thức t6 chức CSDL phân tán và các đặc trưng của nó được đề cập, dé có lựa
chọn giải pháp phù hợp cho thiết kế dữ liệu tương ứng cho từng hệ thống Việc quản lý giao dich và điều khiển đồng thời phân tán cũng rất quan trọng trong việc đảm bao dữ liệu phan tán được truy xuất Giải thuật quản lý nhiều bản sao được đề cập trong chương này nhằm
cho việc đồng bộ hóa gitra các trạm được thuận lợi.
Vấn đề an toàn dữ liệu phân tán được đề cập giúp cho việc kiểm soát quyền truy cập,
quyền phân tán được an toàn hơn Đặc biệt trong điều kiện của CSDL đảo tạo.
Trang 8TAN QUAN LY DAO TAO TIN CHI TRONG CAC TRUONG CAO DANG CONG DONG
2.1 Mô hình hoạt động trường Cao dang Cộng đồng
Theo hiệp hội Cao đăng Cộng đồng Việt Nam [9], một trường Cao đăng Cộng đồng
(CDCD) theo đúng mô hình có những khác biệt rõ rang với các trường đại học Đặc biệt,
khi giáo dục đại học tại Việt Nam mang tính thống nhất toàn quốc khá cao thì khác biệt lại càng rõ rệt, vì trường CĐCĐ đúng nghĩa mang nhiều tính địa phương hơn Đối với các trường Cao đăng (CD) va dạy nghề tại Việt Nam, trường CDCD theo đúng mô hình có nhiều khác biệt bởi những đặc điểm sau đây:
v_ Đáp ứng nhu cầu cộng đồng
Y Cơ cấu tổ chức đảm bảo sự tham gia của cộng đồng
Y Chương trình đào tạo được phát triển và điều chỉnh theo yêu cầu của công việc Y Đa ngành và đa cấp
v_ Đào tạo theo mô hình học tập suốt đời
2.2 Bài toán quản lý đào tạo tin chỉ trong các trường Cao dang Cộng đồng
Xây dựng hệ thống CSDL phân tán nhằm quản lý học sinh, sinh viên giữa các trường thành viên Đặc điểm mỗi trường là hệ thong đào tao của mỗi trường có nhiều cấp học khác nhau như: Hệ đào tạo nghề ngắn hạn, đải hạn, hệ trung cấp 3 năm, trung cấp 2 năm, cao
đăng chính quy 3 năm, hệ liên thông lên cao đăng, đại học chính quy và vừa học vừa làm.
Tuy nhiên áp dụng dao tao tin chỉ thì chỉ có hệ Cao dang chính quy và hệ liên thông lên cao
đăng, đại học chính quy Dữ liệu dao tạo sẽ duoc phân tán về các cơ sở đào tạo của các
trường thành viên, mỗi trường sẽ quản lý sinh viên của trường mình và phòng đào tạo quản
lý chung tất cả Phòng đào tạo điều hành chính sách và quy chế.
Dữ liệu cần quản lý: Thông tin cá nhân của học sinh, điểm quá trình học cho từng
môn, từng chuyên nganh
Mỗi cơ sở đào tạo tự nhập điểm, thông tin cá nhân sinh viên do cơ sở quản lý và giảng dạy, dữ liệu này sẽ được đưa về đữ liệu điểm của sinh viên tại trường quản lý.
2.3 Thiết kế cơ sở dữ liệu
Hai chiến lược chính [3] đã được xác định trong thiết kế các CSDL phân tán là tiếp
cận từ trên xuống (top-dow) và tiếp cận từ dưới lên (bottom-up) Quá trình thiết kế theo hai
Trang 9cách tiếp cận này rất khác nhau Nhưng chúng ta biết rất hiếm các ứng dụng đủ đơn giản để có thê sử dụng chỉ một trong hai cách tiếp cận Vì vậy phần lớn thiết kế CSDL cả hai cách tiếp cận đều được áp dung dé b6 sung cho nhau.
2.3.1 Quá trình thiết kế từ trên xuống 2.3.2 Quá trình thiết kế từ dưới lên
2.3.3 Lựa chọn chiến lược thiết kế cơ sở dữ liệu cho bài toán
Với bài toán được nêu ra trong mục 2.2 mô hình thiết kế hệ thống CSDL sẽ lựa chọn phương pháp thiết kế từ trên xuống là giải pháp thích hợp nhất bởi vì:
V Hệ thống mới chưa có CSDL gốc cần phải thiết kế lại từ dau.
* Cần phải xây dựng các chức năng chính cho hệ thống, dé từ đó phân rã ra các chức năng con cho phù hợp với yêu cầu.
Y Cac thiết kế CSDL cần phải thiết kế lại cho phù hợp với mục đích của hệ thống.
Tuy nhiên trong bài toán này, với một số CSDL, quy trình quản lý đào tạo đã hình thành san Cho nên sẽ có vài chức năng thiết kế theo mô hình từ đưới lên cho phù hợp.
2.4 Chiến lược phân tán dữ liệu
Có 4 chiến lược phân tan dữ liệu cơ bản:
2.4.1 Tập trung dữ liệu2.4.2 Chia nhỏ dữ liệu
2.4.3 Sao lưu dữ liệu
2.4.4 Phương thức lai
2.4.5 Lựa chọn chiến lược phân tan dữ liệu cho bài toán
Trong bài toán nêu trong mục 2.2 dé phân tán dữ liệu cho phù hợp ta chọn hai chiến
lược phân tán:
Y Chia nhỏ dữ liệu: Dữ liệu đào tạo sẽ được chia nhỏ ra theo yêu cầu của hệ thông,
đảm bảo sự hoạt động của hệ thống có độ tin cậy cao nhất.
Y Sao lặp dit liệu: Dữ liệu của các phần sẽ được phân bố ở nhiều trạm khác nhau Các
phần này sẽ được đồng bộ với bản chỉnh bằng một ứng dụng hay phần mềm nào đó.
2.5 Phương pháp phân mảnh và cấp phát các mảnh
Trang 10Thiết kế phân mảnh dữ liệu là công việc đầu tiên phải thực hiện Mục dich của việc phân mảnh dữ liệu là tạo ra các đơn vị cấp phát logic, sao cho chi phí thực hiện truy van thông tin là thấp nhất.
2.5.1 Lý do phân mảnh
Trước tiên khung nhìn của các ứng dụng thường chỉ là một tập con của quan hệ Vì
thế đơn vị truy xuất không phải là toàn bộ quan hệ mà chỉ là các tập con của quan hệ Vì vậy
đưa tập con của quan hệ ra khung nhìn là tốt nhất cho nên phân mảnh các quan hệ và phân
tán đến nơi sử dụng khung nhìn sẽ là điều thích hợp nhất.
Thứ hai là nếu các ứng dụng có các khung nhìn được định nghĩa trên một quan hệ
cho trước, quan hệ đó lại năm tại các vị trí khác thì có hai cách chọn lựa:
1 Đơn vi phân tán là toàn bộ quan hệ không được nhân bản va được lưu ở một vi trí.
2 Quan hệ được nhân bản cho tat cả các vị trí hoặc một số vi trí có chạy ứng dụng.
Lua chọn (1) gây ra một một số lượng lớn các truy xuất không cần thiết đến dit liệu ở xa Còn ngược lại chọn lựa (2) thực hiện nhân bản không cần thiết, gây ra nhiều van đề khi truy nhập và có thé làm lãng phí nhiều không gian lưu trữ.
Cuối cùng, việc phân rã một quan hệ thành nhiều mảnh, mỗi mảnh được xử lý như
một don vi, sẽ cho phép thực hiện nhiều giao dịch đồng thời và cho phép thực hiện song
song một câu vấn tin băng cách chia nó thành một tập các câu vấn con hoạt tác trên các mảnh Vì thế việc phân mảnh sẽ làm tăng mức độ hoạt động đồng thời và như thế làm tăng
lưu lượng hoạt động của hệ thống.
Có hai cách phân mảnh cơ bản là:
vx Phân mảnh ngang.v Phân mảnh doc.
2.5.2 Phương pháp phân mảnh ngang
Phân mảng ngang chính là việc chia quan hệ thành nhiều các nhóm bộ Kết quả của quá trình phân mảnh ngang là các quan hệ con, số lượng quan hệ con phụ thuộc vào điều
kiện rành buộc của các thuộc tính Và các bộ trong các quan hệ con là tách biệt nhau Phân
mảnh ngang thực chat là phép chọn quan hệ thỏa mãn một biéu thức điều kiện cho trước.
a Phân mảnh ngang nguyên thủy
Phân mảnh ngang nguyên thuỷ được định nghĩa bằng một phép toán chọn trên các quan hệ chủ nhân của một lược đồ của CSDL.
Trang 11b Phân mảnh ngang dẫn xuất
Phân mảnh ngang dẫn xuất được định nghĩa trên một quan hệ thành viên của đường nối dựa theo phép toán chọn trên quan hệ chủ nhân của đường nối đó.
Chúng ta cần kiểm tra tính đúng đắn của phân mảnh ngang: * Tinh day đủ
Phân mảnh ngang nguyên thuỷ: Với điều kiện các vị từ chọn là đầy đủ, phân mảnh thu cũng được đảm bảo là đầy đủ, bởi vi cơ sở của thuật toán phân mảnh là tập các vi từ cực
tiêu và đầy đủ Pr, nên tính đầy đủ được bảo đảm với điều kiện không có sai sót xảy ra.
Phân mảnh ngang dẫn xuất: Có khác chút ít, khó khăn chính ở đây là do vị từ định nghĩa phân mảnh có liên quan đến hai quan hệ Trước tiên chúng ta hãy định nghĩa qui tắc
đầy đủ một cách hình thức * Tinh tai thiết được
Tái thiết một quan hệ toàn cục từ các mảnh được thực hiện bằng toán tử hợp trong cả
phân mảnh ngang nguyên thủy lẫn dẫn xuất, Vì thế một quan hệ R với phân mảnh F,={R;,
Ra, ,R„m} chúng ta có:
RE=UR;, VR¡e Fr
* Tinh tach rời
Với phân mảnh nguyên thuỷ tính tách rời sẽ được bảo đảm miễn là các vị từ hội sơ
cấp xác định phân mảnh có tính loại trừ tương hỗ (mutually exclusive) Với phân mảnh dẫn xuất tính tách rời có thể bảo đảm nếu đồ thị nối thuộc loại đơn giản.
2.5.3 Phương pháp phân mảnh dọc
Một phân mảnh dọc cho một quan hệ R sinh ra các mảnh Rị, Rạ, ,R;, mỗi mảnh chứa
một tập con thuộc tính của R và cả khoá của R Mục đích của phân mảnh dọc là phân hoạch
một quan hệ thành một tập các quan hệ nhỏ hơn để nhiều ứng dụng chỉ cần chạy trên một
mảnh Một phân mảnh “tối ưu” là phân mảnh sinh ra một lược đồ phân mảnh cho phép giảm tối đa thời gian thực thi các ứng dụng chạy trên mảnh đó.
Dé có được các lời giải tối ưu cho bài toán phân mảnh dọc rất không hiệu quả, phải sử
dụng hai phương pháp Heuristic cho phân mảnh dọc các quan hệ toàn cục.
1 Nhóm thuộc tính: Bắt đầu gán mỗi thuộc tính cho một mảnh và trong mỗi bước, nối
một sô mảnh lại với nhau cho tới khi thỏa mãn điêu kiện.
Trang 122 Tach mảnh: Bắt đầu băng một quan hệ và quyết định cách phân chia dựa trên hành vi
truy nhập của các ứng dụng trên các thuộc tính.
Kỹ thuật tách mảnh thích hợp với phương pháp thiết kế từ trên xuống Các mảnh không gối chồng lên nhau (không phải là khóa chính) Ngược lại, với phương pháp nhóm thuộc tính thường tạo ra các mảnh gối chồng lên nhau.
2.5.4 Bài toán cấp phát các mảnh
Gia sử đã có một tập các mảnh F={F\, Fạ, ,Fn} và một mang bao gồm các vi trí
S={S¡, So, Sm} trên đó có một tập các ứng dụng Q={dq¡, q›, ,qạ} đang chạy.
Bài toán cấp phát là tìm một phân phối “tối ưu” của F cho S Tính tôi ưu có thé được định nghĩa ứng với hai số đo:
Chi phí nhỏ nhất: Hàm chi phí có chỉ lưu mảnh F, vào vị trí S¡, chi phí van tin mảnh
Fj vào vi trí S¡, chi phí cập nhật F; tại tất cả mọi vị trí có chứa nó và chỉ phí truyền đữ liệu.
Vi thé bài toán cấp phát cố gắng tìm một lược đồ cấp phát với ham chi phí tổ hợp nhỏ nhất.
Hiệu năng: Chiến lược cấp phát được thiết kế nhằm duy trì một hiệu quả lớn đó là hạ thấp thời gian đáp ứng và tăng tối đa lưu lượng hệ thống tại mỗi vị trí.
2.5.5 Lựa chọn phương pháp phân mảnh cho bài toán
Với bài toán quản lý đào tạo tín chỉ nêu ra trong mục 2.2, kết hợp với việc trình bày
hai phương pháp phân mảnh, phân mảnh ngang, phân mảnh dọc nêu ra trong mục 2.5.2 và2.5.3 Lựa chọn phương pháp phân mảnh ngang cho việc phân mảnh CSDL cho bài toán làphù hợp bởi lẽ:
vx Kỹ thuật phân mảnh dọc phức tạp hơn so với kỹ thuật phân mảnh ngang, vi số lựa chọn phân hoạch rất lớn.
Y Phương pháp phân mảnh doc thì số mảnh tạo ra lớn do đó làm quá trình truy xuất bị
ảnh hưởng Kỹ thuật cài đặt phân mảnh dọc phức tạp hơn so với phân mảnh ngang.
Để có được các lời giải tối ưu cho bài toán phân mảnh dọc rất không hiệu quả, phải
sử dụng hai phương pháp Heuristic cho phân mảnh dọc các quan hệ toàn cục.
VY Phương pháp phân mảnh ngang dễ thiết kế và cài đặt hơn, đồng thời làm giảm thời gian truy xuất đữ liệu.
2.6 Kiểm soát dữ liệu ngữ nghĩa
CSDL không chỉ tập trung ở một nơi mà phân tán trên nhiều nơi khác nhau Khi có
một yêu câu về cập nhật dữ liệu, làm thê nào đê dữ liệu van đảm bảo được tính nhât quán và
Trang 13toàn ven dữ liệu Dinh nghĩa các quy tắc nhằm kiểm soát các thao tác dữ liệu là một trong những yêu cầu quan trọng của một hệ quản trị CSDL tập trung hay phân tán.
Kiểm soát dữ liệu ngữ nghĩa bao gồm:
Y Quản trị khung nhìn.
Y Kiểm soát tính an toàn và bảo mật * Kiểm soát tính toàn vẹn ngữ nghĩa.
Các chức năng này phải bảo đảm cho những người sử dụng được phép sẽ thực hiện
đúng đắn các thao tác trên CSDL nhằm duy tri tính toàn vẹn dit liệu.
2.7 Đồng bộ hóa CSDL phân tán
2.7.1 Dong bộ hóa CSDL cho bài toán quản lý đào tạo tin chỉ
Đồng bộ hóa dữ liệu Replication cho phép chia sẻ dữ liệu giữa các CSDL tại nhiều điểm
khác nhau Với một dữ liệu gôc, ta có thê tạo nhiêu bản sao và sử dụng tại nhiêu nơi Dữ liệu
Replicate 3
Hình 2.4: Mô hình phân tán dữ liệu Replicate