1. Trang chủ
  2. » Cao đẳng - Đại học

XÂY DỰNG HỆ THỐNG CƠ SỞ DỮ LIỆU PHÂN TÁN QUẢN LÝ ĐÀO TẠO ÁP DỤNG CHO CÁC TRƯỜNG ĐẠI HỌC – CAO ĐẲNG - Full 10 điểm

66 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Hệ Thống Cơ Sở Dữ Liệu Phân Tán Quản Lý Đào Tạo Áp Dụng Cho Các Trường Đại Học – Cao Đẳng
Tác giả Nguyễn Thị Ly Sa
Trường học Đại Học Đà Nẵng
Chuyên ngành Công Nghệ Thông Tin
Thể loại báo cáo tổng kết
Năm xuất bản 2013
Thành phố Đà Nẵng
Định dạng
Số trang 66
Dung lượng 4,57 MB

Nội dung

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ XÂY DỰNG HỆ THỐNG CƠ SỞ DỮ LIỆU PHÂN TÁN QUẢN LÝ ĐÀO TẠO ÁP DỤNG CHO CÁC TRƯỜNG ĐẠI HỌC – CAO ĐẲNG Mã số: T2013-07-04 Chủ nhiệm đề tài: Nguyễn Thị Ly Sa Đà Nẵng, 12/2013 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ XÂY DỰNG HỆ THỐNG CƠ SỞ DỮ LIỆU PHÂN TÁN QUẢN LÝ ĐÀO TẠO ÁP DỤNG CHO CÁC TRƯỜNG ĐẠI HỌC – CAO ĐẲNG Mã số: T2013-07-04 Xác nhận của cơ quan chủ trì đề tài Chủ nhiệm đề tài Nguyễn Thị Ly Sa Đà Nẵng, 12/2013 MỤC LỤC MỞ ĐẦU ............................................................................................................... 1 CHƯƠNG 1. LÝ THUYẾT VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN ............................ 3 1.1. Các khái niệm ......................................................................................................... 3 1.2. Các lý do sử dụng cơ sở dữ liệu phân tán .............................................................. 4 1.3. Hạn chế của cơ sở dữ liệu phân tán........................................................................ 4 1.4. Kiến trúc của hệ cơ sở dữ liệu phân tán ................................................................. 5 1.5. Kỹ thuật thiết kế cơ sở dữ liệu phân tán................................................................. 5 1.5.1. Kiến trúc cơ bản của cơ sở dữ liệu phân tán ................................................... 5 1.5.2. Các chiến lược thiết kế cơ sở dữ liệu phân tán................................................ 6 1.5.3. Phân mảnh (Fragmentation) ............................................................................ 6 1.5.4. Nhân bản (Replication) ................................................................................... 7 1.5.5. Hạn chế của phân mảnh và nhân bản .............................................................. 8 CHƯƠNG 2. CƠ SỞ DỮ LIỆU PHÂN TÁN TRONG MS SQL SERVER .......... 9 2.1. Distributed Transaction .......................................................................................... 9 2.2. Replication ........................................................................................................... 11 2.2.1. Khái niệm ...................................................................................................... 11 2.2.2. Các loại Replication trong MS SQL Server .................................................. 12 2.3. Lợi ích của Replication ........................................................................................ 13 2.4. Các vấn đề cơ bản trong Replication ................................................................... 13 2.4.1. Thành phần chính trong Replication ............................................................. 13 2.4.2. Mô hình nhân bản logic ................................................................................. 14 2.4.3. Các mô hình nhân bản vật lý ......................................................................... 15 2.4.4. Kỹ thuật chuyển dữ liệu từ Publisher tới Subcriber ...................................... 17 2.4.5. Các loại Agent ............................................................................................... 18 CHƯƠNG 3. REPLICATION ................................................................................ 19 3.1. Snapshot Replication ............................................................................................ 19 3.1.1. Giới thiệu Snapshot Replication .................................................................... 19 3.1.2. Hoạt động của Snapshot Replication............................................................. 19 3.2. Transactional Replication..................................................................................... 20 3.2.1. Giới thiệu Transactional Replication............................................................. 20 3.2.2. Hoạt động của Transactional Replication ..................................................... 21 3.2.3. Transactional Replication with updatable Subcription ................................. 21 3.3. Merge Replication ................................................................................................ 22 3.3.1. Giới thiệu Merge Replication ........................................................................ 22 3.3.2. Hoạt động của Merge Replication ................................................................. 23 CHƯƠNG 4. XÂY DỰNG MÔ HÌNH PHÂN TÁN.............................................. 24 4.1. Qui trình quản lý đào tạo ...................................................................................... 24 4.2. Mô hình cơ sở dữ liệu phân tán quản lý đào tạo ................................................. 24 4.3. Thiết kế cơ sở dữ liệu phân tán ............................................................................ 25 4.4. Giải pháp đồng bộ cơ sở dữ liệu phân tán ............................................................ 26 4.5. Các vấn đề trong đồng bộ dữ liệu ........................................................................ 26 4.6. An toàn và bảo mật trong Replication ................................................................. 27 4.7. Cài đặt thực nghiệm ............................................................................................. 27 4.8. Kiểm tra kết quả đồng bộ thông qua chương trình ứng dụng .............................. 31 4.9. Đánh giá kết quả thực nghiệm ............................................................................. 36 CHƯƠNG 5. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ....................................... 37 5.1. Kết quả đạt được .................................................................................................. 37 5.2. Hạn chế................................................................................................................. 37 5.3. Hướng phát triển .................................................................................................. 37 TÀI LIỆU THAM KHẢO ........................................................................................... 38 DANH MỤC HÌNH VẼ Hình 1. Hệ cơ sở dữ liệu phân tán và hệ cơ sở dữ liệu tập trung ................................. 3 Hình 2. Kiến trúc cơ sở dữ liệu phân tán ...................................................................... 5 Hình 3. Minh họa các phương pháp phân mảnh .......................................................... 6 Hình 4. Quá trình truyền một Distributed Transaction qua các site .......................... 10 Hình 5. Mức độ độc lập và độ trễ của các phương pháp phân tán ............................ 12 Hình 6. Mô hình nhân bản logic ................................................................................. 15 Hình 7. Mô hình nhân bản Publisher/Distributor-Subscriber đơn giản..................... 15 Hình 8. Mô hình nhân bản vật lý Central Publisher-Multiple Subscribers ................ 16 Hình 9. Mô hình central Subscriber/Multiple Publisher ............................................ 16 Hình 10. Mô hình Multiple Publishers-Multiple Subscriber ...................................... 17 Hình 11. Hoạt động của Snapshot Replication ........................................................... 20 Hình 12. Hoạt động của Transactional Replication ................................................... 21 Hình 13. Hoạt động của Merge Replication ............................................................... 23 Hình 14. Một mô hình cơ sở dữ liệu phân tán quản lý đào tạo .................................. 25 Hình 15. Cơ sở dữ liệu được dùng thử nghiệm ........................................................... 28 Hình 16. Cấu hình Replication trong MS SQL Server ................................................ 29 Hình 17. Cơ sở dữ liệu tại các server ......................................................................... 29 Hình 18. Kết quả đồng bộ dữ liệu giữa server Phòng đào tạo và server Khoa ......... 30 Hình 19. Kết quả đồng bộ dữ liệu giữa server Phòng đào tạo và server Sinh viên ... 30 Hình 20. Đăng nhập vào server Phòng đào tạo và server Sinh viên .......................... 31 Hình 21. Thêm mới một dòng dữ liệu tại server Phòng đào tạo................................. 31 Hình 22. Dòng dữ liệu mới được đồng bộ về server Khoa ......................................... 32 Hình 23. Cập nhật dữ liệu liệu tại server Phòng đào tạo ........................................... 32 Hình 24. Cập nhật dữ liệu liệu tại server Khoa ......................................................... 33 Hình 25. Kết quả sau khi đồng độ tại server Phòng đào tạo ...................................... 33 Hình 26. Kết quả sau khi đồng độ tại server Khoa ..................................................... 34 Hình 27. Cập nhật dữ liệu tại server Phòng đào tạo .................................................. 34 Hình 28. Cập nhật dữ liệu tại server Khoa ................................................................. 35 Hình 29. Kết quả sau khi đồng độ tại server Phòng đào tạo ...................................... 35 Hình 30. Kết quả sau khi đồng độ tại server Khoa ..................................................... 36 DANH MỤC BẢNG Bảng 1. So sánh các phương pháp nhân bản ..............................................................7 DANH MỤC TỪ VIẾT TẮT 2PC : Two Phase Commit CĐ : Cao Đẳng DB : DataBase DBMS : Distributed Database Management System DDB : Distributed DataBase DDBS : Distributed Database System-DDBS DTC : Distributed Transaction Coordinator ĐHĐN : Đại học Đà Nẵng IPSEC : IP Security IT : Information Technology LAN : Local Area Network MS : Microsoft PAL Publication Access List SSL : Secure Sockets Layer VPN : Virtual Private Network ĐẠI HỌC ĐÀ NẴNG CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN Độc lập – Tự do – Hạnh phúc THÔNG TIN KẾT QUẢ NGHIÊN CỨU 1. Thông tin chung: - Tên đề tài: XÂY DỰNG HỆ THỐNG CƠ SỞ DỮ LIỆU PHÂN TÁN QUẢN LÝ ĐÀO TẠO ÁP DỤNG CHO CÁC TRƯỜNG ĐẠI HỌC – CAO ĐẲNG - Mã số: T2013-07-04 - Chủ nhiệm: NGUYỄN THỊ LY SA - Thành viên tham gia: - Cơ quan chủ trì: Trường Cao đẳng Công nghệ thông tin – Đại học Đà Nẵng - Thời gian thực hiện: từ ngày 01/01/2013 đến ngày 31/12/2013 2. Mục tiêu: - Tìm hiểu cơ sở dữ liệu phân tán và các các kỹ thuật phân tán dữ liệu trong MS SQL Server, đặc biệt là kỹ thuật Replication . - Xây dựng một mô hình cơ sở dữ liệu phân tán trong quản lý đào tạo. 3. Tính mới và sáng tạo: - Đề tài đã đề xuất một mô hình cơ sở dữ liệu phân tán cho hệ thống quản lý đào tạo và chọn lựa giải pháp đồng bộ cơ sở dữ liệu phân tán trong MS SQL Server - Cài đặt thử nghiệm với cơ sở dữ liệu hiện đang sử dụng của Trường CĐ Công nghệ Thông tin-ĐHĐN 4. Tóm tắt kết quả nghiên cứu: Đề tài đã đề xuất một mô hình cơ sở dữ liệu phân tán cho hệ thống quản lý đào tạo áp dụng cho các trường Đại học Cao đẳng. Cụ thể, hệ thống cơ sở dữ liệu phân tán của Trường CĐ Công nghệ Thông tin-ĐHĐN gồm 3 server: - Server dùng riêng cho Phòng Đào tạo và các bộ phận khác như Phòng Công tác Sinh viên, Phòng Tài vụ để cập nhật lớp học phần, điểm, học phí, xét học vụ… (gọi là server Phòng Đào tạo) - Server dùng riêng cho các Khoa cập nhật thông tin lịch trình giảng dạy của giáo viên, điểm danh, phân công giáo viên hướng dẫn đề tài… (gọi là server Khoa) - Server dành riêng cho sinh viên xem các thông tin cá nhân và thông tin liên quan đến việc học tập qua internet như điểm, thời khóa biểu và đăng ký học phần… (gọi là server Sinh viên ) Ba server này kết nối với nhau thông qua hệ thống mạng LAN, mọi dữ liệu trong hệ thống quản lý đào tạo đều được lưu tại server Phòng Đào tạo, một phần dữ liệu của server này được nhân bản đến 2 server còn lại theo đúng chức năng và nhiệm vụ của từng server. Ba server này đều đặn đồng bộ dữ liệu với nhau để đảm bảo tính chính xác cao nhất của dữ liệu. Đề tài sử dụng kỹ thuật Replication trong MS SQL Server 2008 để cài đặt thử nghiệm. Kết quả đồng bộ có độ chính xác đạt 100% và thời gian đồng bộ ở mức chấp nhận được. 5. Tên sản phẩm: - Hệ thống cơ sở dữ liệu phân tán quản lý đào tạo - Bài báo đăng Kỷ yếu hội thảo nghiên cứu khoa học: Công Nghệ Thông Tin Và Ứng Dụng Công Nghệ Thông Tin Trong Các Lĩnh Vực, Trường Cao đẳng Công nghệ Thông tin, lần thứ 2. - Báo cáo tổng kết kết quả nghiên cứu đề tài. 6. Hiệu quả, phương thức chuyển giao kết quả nghiên cứu và khả năng áp dụng: - Về mặt Giáo dục - Đào tạo: Phục vụ công tác giảng dạy, nghiên cứu và thực hành chuyên đề Cơ sở dữ liệu phân tán cho sinh viên trong khoa Công nghệ Thông tin, chuyên ngành Hệ thống thông tin. - Về sản phẩm ứng dụng : Góp phần nâng cao hiệu quả trong quá trình quản lý đào tạo tại các trường Đại học Cao Đẳng. 7. Hình ảnh, sơ đồ minh họa chính: Hình 1. Một mô hình cơ sở dữ liệu phân tán trong quản lý đào tạo Hình 2. Cấu hình Replication trong MS SQL Server Publisher: server Phòng Đào tạo Subscriber: server Sinhviên Subscriber: server Khoa Publication ứng với server Khoa Publication ứng với server Sinh viên Subscription tại server Sinh viên Subscription tại server Khoa Đà Nẵng, ngày 15 tháng 12 năm 2013 Cơ quan chủ trì Chủ nhiệm đề tài Nguyễn Thị Ly Sa 1 MỞ ĐẦU 1. Tổng quan tình hình nghiên cứu thuộc lĩnh vực của đề tài ở trong và ngoài nước Công nghệ cơ sở dữ liệu đã trải qua một quá trình hình thành và phát triển khá lâu dài. Ban đầu, các hệ cơ sở dữ liệu thường gắn liền với ứng dụng, nghĩa là mỗi ứng dụng định nghĩa và duy trì dữ liệu của riêng chúng. Phát triển hơn, dữ liệu được quản lý một cách tập trung, nhiều ứng dụng khác nhau có thể truy xuất dữ liệu trực tiếp từ cơ sở dữ liệu tập trung đó. Cơ sở dữ liệu tập trung cũng tồn tại nhiều khuyết điểm, có thể kể đến đó là khi trung tâm dữ liệu có sự cố thì toàn hệ thống sẽ ngừng hoạt động, hay tình trạng tắc nghẽn khi có quá nhiều yêu cầu truy xuất vào cơ sở dữ liệu. Cơ sở dữ liệu phân tán ra đời đã phần nào khắc phục được những điểm yếu của cơ sở dữ liệu tập trung. Là kết quả của sự hợp nhất của hai hướng tiếp cận đối với quá trình xử lý dữ liệu: công nghệ cơ sở dữ liệu và công nghệ mạng máy tính. Cơ sở dữ liệu phân tán gồm nhiều cơ sở dữ liệu tích hợp lại với nhau thông qua mạng máy tính để trao đổi dữ liệu. Cơ sở dữ liệu được tổ chức và lưu trữ ở những vị trí khác nhau trong mạng máy tính và chương trình ứng dụng làm việc trên cơ sở truy cập dữ liệu ở những điểm khác nhau đó. Xét trên khía cạnh người dùng, đặc biệt là các công ty xí nghiệp lớn, thì cơ sở dữ liệu phân tán đáp ứng nhu cầu tốt hơn cơ sở dữ liệu tập trung ứng với sự phân bố ngày càng rộng rãi của các tổ chức này. Tuy nhiên, vấn đề lớn nhất của hệ thống cơ sở dữ liệu phân tán nói chung và của đề tài nói riêng chính là sự phức tạp của nó, bên cạnh vấn đề của cơ sở dữ liệu tập trung còn rất nhiều vấn đề phải giải quyết như: thiết kế cơ sở dữ liệu phân tán, xử lý truy vấn đồng thời trong phân tán, đảm bảo tính chính xác, toàn vẹn dữ liệu và an toàn hệ thống… Quản lý một hệ thống cơ sở dữ liệu phân tán là một thách thức ngay cả đối với người có nhiều kiến thức và kinh nghiệm trong lĩnh vực này. Vì vậy, quyết định có sử dụng hệ thống cơ sở dữ liệu phân tán thay cho hệ thống cơ sở dữ liệu tập trung hay không là cả bài toán lớn cần phải giải quyết. 2. Tính cấp thiết của đề tài Hiện nay phần lớn hệ thống quản lý đào tạo của các Trường Đại học Cao đẳng, cụ thể Trường CĐ Công nghệ Thông tin-Đại học Đà Nẵng được xây dựng theo mô hình cơ sở dữ liệu tập trung, cơ sở dữ liệu được lưu ở một máy chủ (server) và mọi hoạt động như đăng ký học phần của sinh viên, nhập điểm của phòng đào tạo hay quản lý 2 lớp học của giáo viên… đều truy cập trực tiếp lên một server gây nên sự quá tải xử lý cho server, giảm hiệu suất hoạt động của toàn bộ hệ thống. Nhằm góp phần nâng cao hiệu quả trong việc quản lý sinh viên của các trường Đại học Cao đẳng, đề tài này tập trung tìm hiểu và xây dựng mô hình cơ sở dữ liệu phân tán phù hợp với các yêu cầu đặt ra của hệ thống quản lý đào tạo. 3. Mục tiêu của đề tài Xây dựng hệ thống cơ sở dữ liệu phân tán quản lý đào tạo áp dụng vào các trường Đại học Cao Đẳng, cụ thể là trường CĐ Công nghệ Thông tin - Đại học Đà Nẵng 4. Đối tượng, phạm vi nghiên cứu 4.1. Đối tượng nghiên cứu: Mô hình cơ sở dữ liệu phân tán và giải pháp đồng bộ cơ sở dữ liệu 4.2. Phạm vi nghiên cứu: Hệ thống quản lý đào tạo trường CĐ Công nghệ Thông tin - ĐHĐN. MS SQL Server 2008 5. Cách tiếp cận, phương pháp nghiên cứu - Từ thực tế quản lý đào tạo của các trường Đại học Cao Đẳng, đề tài đề xuất một mô hình cơ sở dữ liệu phân tán phù hợp với hệ thống quản lý đào tạo. - Tìm hiểu các kỹ thuật phân tán dữ liệu trong MS SQL Server và chọn lựa phương pháp thích hợp với mô hình đã đề xuất - Cài đặt thực nghiệm vào hệ thống quản lý đào tạo của Trường CĐ Công nghệ Thông tin - ĐHĐN. 6. Nội dung nghiên cứu: - Thực trạng hệ thống quản lý đào tạo của các trường Đại học Cao đẳng, cụ thể là Trường CĐ Công nghệ Thông tin- ĐHĐN - Mô hình cơ sở dữ liệu phân tán quản lý đào tạo và giải pháp đồng bộ cơ sở dữ liệu phân tán trong MS SQL Server - Kết quả cài đặt thực nghiệm vào Trường CĐ Công nghệ Thông tin- ĐHĐN. 3 Chương 1. LÝ THUYẾT VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN Chương này sẽ trình bày về các khái niệm trong cơ sở dữ liệu phân tán, lý do sử dụng cơ sở dữ liệu phân tán cũng và các ưu và nhược điểm của nó. 1.1. Các khái niệm [1, 2] Cơ sở dữ liệu phân tán (Distributed DataBase - DDB) là một tập hợp nhiều cơ sở dữ liệu có liên đới logic và được phân bố trên một mạng máy tính. Trong đó liên đới logic là dữ liệu ở các nơi được sử dụng để giải quyết chung một vấn đề, còn phân bố trên một mạng máy tính là toàn bộ dữ liệu không phải lưu trữ ở một nơi mà lưu trữ trên nhiều trạm thuộc mạng máy tính. Hệ quản trị cơ sở dữ liệu phân tán (Distributed Database Management System- DDBMS) được định nghĩa là một hệ thống phần mềm cho phép quản lý các hệ cơ sở dữ liệu phân tán và làm cho sự phân tán trở nên “trong suốt” đối với người sử dụng. Hệ cơ sở dữ liệu phân tán (Distributed Database System-DDBS): Được xây dựng dựa trên hai công nghệ cơ bản là cơ sở dữ liệu và mạng máy tính. Một hệ cơ sở dữ liệu phân tán không phải là tập hợp các tập tin được lưu riêng lẻ tại mỗi nút của một mạng máy tính mà các tập tin này phải có liên đới logic với nhau, có cấu trúc và được truy xuất qua một giao diện chung.  Hệ cơ sở dữ liệu phân tán và hệ cơ sở dữ liệu tập trung (a) Hệ cơ sở dữ liệu phân tán (b) Hệ cơ sở dữ liệu tập trung Hình 1. Hệ cơ sở dữ liệu phân tán và hệ cơ sở dữ liệu tập trung Nếu như trong môi trường hệ cơ sở dữ liệu tập trung dữ liệu được tập trung tại một nút mạng và mọi yêu cầu được chuyển tới vị trí đó, thì hệ cơ sở dữ liệu phân tán là môi trường trong đó dữ liệu phân tán trên một số vị trí.  Hệ cơ sở dữ liệu phân tán và hệ xử lý phân tán Hệ xử lý phân tán (Distributed Processing) hay còn gọi là hệ tính toán phân tán (Distributed Computing) là hệ thống mà một số các bộ phận xử lý tự vận hành, được liên kết bởi một mạng máy tính và cùng thực hiện các tác vụ mà chúng được phân Trạm 5 Trạm 1 Trạm 2 Trạm 3Trạm 4 Mạng truyền dữ liệu Trạm 5 Trạm 1 Trạm 2 Trạm 3Trạm 4 Mạng truyền dữ liệu 4 công. Như vậy sự khác nhau cơ bản giữa hệ cơ sở dữ liệu phân tán và hệ xử lý phân tán chính là đối tượng phân tán, trong hệ cơ sở dữ liệu phân tán đối tượng phân tán là dữ liệu còn trong hệ xử lý phân tán đối tượng phân tán là thành phần xử lý. 1.2. Các lý do sử dụng cơ sở dữ liệu phân tán [1, 2] - Các tổ chức có cấu trúc phân tán: Trong thực tế có nhiều tổ chức được phân tán khắp nơi, trong khi đó, dữ liệu quản lý ngày càng lớn và phục vụ cho đa người dùng nằm phân tán, vì vậy cơ sở dữ liệu phân tán là con đường thích hợp với cấu trúc tự nhiên của các tổ chức đó. - Cần kết nối các cơ sở dữ liệu có sẵn: Cơ sở dữ liệu phân tán là giải pháp tự nhiên khi có các cơ sở dữ liệu đang tồn tại và sự cần thiết xây dựng một ứng dụng toàn cục. Trong trường hợp này cơ sở dữ liệu phân tán được tạo theo tiến trình từ dưới lên dựa trên nền tảng cơ sở dữ liệu đang tồn tại. Tiến trình này đòi hỏi phải tái cấu trúc các cơ sở dữ liệu cục bộ ở một mức nhất định. - Sự lớn mạnh của tổ chức: Các tổ chức có thể phát triển mở rộng bằng cách thành lập thêm các đơn vị mới, vừa có tính tự trị, vừa có quan hệ với các đơn vị tổ chức khác. - Giảm chi phí truyền thông: Việc tăng ứng dụng cục bộ có thể làm giảm chi phí truyền thông. - Nâng cao hiệu suất: Có cơ chế xử lý song song và phân mảnh dữ liệu theo ứng dụng làm cực đại hóa tính cục bộ của ứng dụng. - Tăng độ tin cậy và tính sẵn sàng: Khi hệ thống cơ sở dữ liệu tập trung bị hỏng, toàn bộ hệ thống trở nên vô dụng với tất cả các người dùng. Còn đối với cơ sở dữ liệu phân tán, nếu có một thành phần nào đó của hệ thống bị hỏng, hệ thống vẫn có thể duy trì hoạt động tại một số vị trí. 1.3. Hạn chế của cơ sở dữ liệu phân tán [1, 2] Bên cạnh các ưu điểm được trình trình bày bên trên, hệ thống cơ sở dữ liệu phân tán cũng có nhiều hạn chế sau: - Tính phức tạp: Các vấn đề của hệ cơ sở dữ liệu phân tán dĩ nhiên là phức tạp hơn rất nhiều với hệ cơ sở dữ liệu tập trung, bên cạnh các vấn đề của hệ tập trung nó còn rất nhiều vấn đề phải giải quyết như: thiết kế cơ sở dữ liệu phân tán, xử lý truy vấn phân tán, điều khiển đồng thời phân tán, … - Chi phí phần cứng: Một khi dữ liệu được sao lưu ở nhiều vị trí khác nhau sẽ dẫn đến việc gia tăng các tài nguyên cần sử dụng để lưu trữ. - Khó khăn trong việc đảm bảo tính toàn vẹn dữ liệu và sự an toàn của hệ thống. 5 1.4. Kiến trúc của hệ cơ sở dữ liệu phân tán [1, 2] - Kiến trúc client/server: Dữ liệu được tập trung và xử lý hầu hết ở server, các client chỉ lưu trữ và xử lý một phần dữ liệu thực sự cần thiết trong phạm vị hoạt động của client đó. - Kiến trúc peer-to-peer: Các vị trí ngang hàng nhau, có thể sử dụng như một hệ thống độc lập, tự quản lý dữ liệu của chính mình và chia sẻ dữ liệu cho các vị trí khác. 1.5. Kỹ thuật thiết kế cơ sở dữ liệu phân tán [1, 2] 1.5.1. Kiến trúc cơ bản của cơ sở dữ liệu phân tán Hình 2. Kiến trúc cơ sở dữ liệu phân tán - Lược đồ tổng thể: Định nghĩa tất cả các dữ liệu sẽ được lưu trữ trong cơ sở dữ liệu phân tán. Trong mô hình dữ liệu quan hệ, lược đồ tổng thể bao gồm tất cả các lược đồ quan hệ. - Lược đồ phân mảnh: Mỗi lược đồ quan hệ trong lược đồ tổng thể có thể chia thành một vài phần không gối lên nhau được gọi là mảnh (Fragments). Có nhiều cách khác nhau để thực hiện việc phân chia này (xem mục 1.5.3). - Lược đồ định vị: Các mảnh từ lược đồ phân mảnh được định vị vật lý trên một hoặc nhiều vị trí. Lược đồ định vị định nghĩa mảnh nào định vị tại các vị trí nào. - Lược đồ ánh xạ địa phương: Tập hợp tất cả các mảnh được lưu trữ tại một vị trí. CSDL1 CSDL2 CSDL3 Lược đồ tổng thể Lược đồ phân mảnh Lược đồ định vị Lược đồ ánh xạ địa phương 1 Lược đồ ánh xạ địa phương 2 Lược đồ ánh xạ địa phương 3 6 1.5.2. Các chiến lược thiết kế cơ sở dữ liệu phân tán - Phương pháp top-down: Phương pháp này thích hợp với cơ sở dữ liệu được thiết kế từ đầu. Bắt đầu từ việc thu thập và phân tích yêu cầu của hệ thống, tiếp theo là thiết kế các lược đồ cần thiết trong cơ sở dữ liệu phân tán: lược đồ tổng thể, lược đồ phân mảnh, lược đồ định vị và lược đồ ánh xạ địa phương. - Phương pháp bottom-up: Trong thực tế, nhiều hệ thống đã có sẵn một số cơ sở dữ liệu tại các địa phương, nhiệm vụ của người thiết kế là tích hợp chúng thành một cơ sở dữ liệu tổng thể. Phương pháp này là quá trình tích hợp lược đồ địa phương thành lược đồ tổng thể. 1.5.3. Phân mảnh (Fragmentation) Thiết kế phân mảnh chính là trả lời câu hỏi “Làm thế nào để cơ sở dữ liệu và các ứng dụng chạy trên cơ sở dữ liệu đó có thể đặt ở nhiều vị trí?”. Phân mảnh là chia một quan hệ thành những mảnh tách biệt, mỗi mảnh được phân bố tại các vị trí khác nhau. Lý do của phân mảnh là có được đơn vị phân tán thích hợp. Thường thì khung nhìn của các ứng dụng chỉ là tập con của quan hệ, nên đơn vị truy xuất không phải là toàn bộ quan hệ mà là tập con của quan hệ. Do đó, xem tập con của quan hệ là đơn vị phân tán là điều thích hợp duy nhất. Các phương pháp phân mảnh: phân mảnh ngang (Horizontal Fragmentation), phân mảnh dọc (Vertical Fragmentation) và phân mảnh hỗn hợp (Mixed Fragmentation). Hình 3. Minh họa các phương pháp phân mảnh 1. Phân mảnh ngang (Horizontal Fragmentation): Phân mảnh ngang chính là việc chia quan hệ theo chiều ngang, kết quả của phân mảnh ngang là các quan hệ con, số bộ trong các quan hệ con này là tách biệt nhau. Phân mảnh ngang thực chất là phép chọn thỏa một điều kiện cho trước. Phân mảnh ngang được chia làm 2 loại: phân mảnh ngang nguyên thủy và phân mảnh ngang dẫn xuất. 7 - Phân mảnh ngang nguyên thủy: Phân mảnh ngang nguyên thuỷ được định nghĩa bằng một phép toán chọn trên các quan hệ gốc. Với quan hệ R, các mảnh ngang của R là các Ri: Ri = σFi(R), 1 ≤ i ≤ n. Trong đó Fi là điều kiện chọn được sử dụng để có được mảnh Ri. - Phân mảnh ngang dẫn xuất: Phân mảnh ngang dẫn xuất là phân rã một quan hệ thành các mảnh dựa vào điều kiện chọn được định nghĩa trên một quan hệ khác có liên quan. 2. Phân mảnh dọc (Vertical Fragmentation): Một phân mảnh dọc cho một quan hệ R sinh ra các mảnh R1, R2,.., Rr, mỗi mảnh chứa một tập con các thuộc tính của R và cả khoá của R . Phân mảnh dọc thực chất là chia quan hệ theo chiều dọc, nghĩa là thiết lập các quan hệ mới từ một số thuộc tính của quan hệ gốc. Thực chất đây là phép chiếu lên tập con các thuộc tính của quan hệ. 3. Phân mảnh hỗn hợp (Mixed Fragmentation): Trong đa số các trường hợp, phân mảnh ngang hoặc phân mảnh dọc đơn giản không đủ đáp ứng các yêu cầu từ ứng dụng. Có một số trường hợp phân mảnh dọc có thể thực hiện sau một số mảnh ngang hoặc ngược lại, chọn lựa này được gọi là phân mảnh hỗn hợp.  Các qui tắc phân mảnh đúng đắn: Khi phân mảnh một quan hệ phải tuân thủ các quy tắc sau để đảm bảo cơ sở dữ liệu không bị thay đổi về ngữ nghĩa sau khi phân mảnh: - Tính đầy đủ: Nếu một quan hệ R được phân thành các mảnh R1, R2,…, Rn thì mỗi bộ giá trị có trong R phải có mặt trong một hoặc các đoạn Ri - Tính tái thiết được: Nếu một quan hệ R được phân thành các mảnh R1, R2,…, Rn thì cần phải tồn tại một phép toán ω sao cho có thể tái thiết quan hệ gốc R từ các quan hệ phân rã Ri thông qua phép toán ω: R = ω(Ri). - Tính tách biệt: Nếu một quan hệ R được phân đoạn ngang thành các quan hệ R1, R2, …, Rn và bộ giá trị ti nằm trong đoạn Ri thì nó sẽ không nằm trong một đoạn Rk nào nữa. Tiêu chuẩn này đảm bảo các đoạn tách rời nhau. Nếu quan hệ được phân rã dọc thì khóa chính phải được lặp lại trong mỗi đoạn. 1.5.4. Nhân bản (Replication) Cơ sở dữ liệu sau khi phân mảnh thích hợp cần phải được quyết định cấp phát các mảnh cho các vị trí, các mảnh có thể được nhân bản hoặc có thể không nhân bản. Trong cơ sở dữ liệu không nhân bản (được gọi là cơ sở dữ liệu phân hoạch), mỗi mảnh được cấp phát trên một vị trí và không có bản sao nào trên các vị trí còn lại. 8 Trường hợp nhân bản, hoặc toàn bộ hoặc toàn bộ cơ sở dữ liêu tồn tại ở mỗi vị trí (cơ sở dữ liệu nhân bản hoàn toàn) hoặc các mảnh phân tán đến các vị trí, trong đó một mảnh có thể có nhiều bản sao nằm tại nhiều vị trí (cơ sở dữ liệu nhân bản một phần). Lý do cần nhân bản là nhằm đảm bảo được độ tin cậy và hiệu quả cho yêu cầu truy vấn dữ liệu, cụ thể nếu có nhiều bản sao của một đơn vị dữ liệu đặt tại nhiều vị trí thì người dùng vẫn có cơ hội truy xuất được dữ liệu ngay cả khi vị trí khác xảy ra sự cố. Bảng 1 so sánh ba phương pháp nhân bản ứng với các chức năng khác nhau của hệ cơ sở dữ liệu phân tán. Nhân bản hoàn toàn Nhân bản một phần Phân hoạch Xử lý truy vấn Dễ Khó Khó Quản lý thư mục Dễ hoặc không tồn tại Khó Khó Điều khiển đồng thời Vừa phải Khó Dễ Độ tin cậy Rất cao Cao Thấp Tính thực tế Có thể áp dụng Thực tế Có thể áp dụng Bảng 1. So sánh các phương pháp nhân bản 1.5.5. Hạn chế của phân mảnh và nhân bản - Hạn chế của phân mảnh liên quan đến việc kiểm tra tính toàn vẹn của dữ liệu, chẳng hạn như một số thuộc tính tham gia vào một ràng buộc có thể bị phân rã thành các mảnh khác nhau và cấp phát cho những vị trí khác nhau, lúc đó việc kiểm tra ràng buộc phải truy tìm dữ liệu ở nhiều vị trí. Hay một hạn chế khác của phân mảnh khi một ứng dụng có các khung nhìn được định nghĩa trên nhiều mảnh khác nhau sẽ giảm hiệu suất hoạt động. - Đối với việc nhân bản, việc cập nhật dữ liệu cũng gặp nhiều rắc rối vì hệ thống phải đảm bảo rằng tất cả các bản sao ở các vị trí phải được cập nhật chính xác. Vì vậy, quyết định phân mảnh như thế nào, có nhân bản hay không và việc phân bố các mảnh tới các vị trí sao cho tối ưu là bài toán qui hoạch toán học với độ phức tạp NP-hard nhằm hạ tối đa chi phí lưu trữ, chi phí xử lý và truyền thông. 9 Chương 2. CƠ SỞ DỮ LIỆU PHÂN TÁN TRONG MS SQL SERVER MS SQL Server hỗ trợ hai phương pháp phân tán dữ liệu là Distributed Transaction và Replication. Chương này sẽ trình bày đặc điểm của từng phương pháp, đặc biệt là Replication và sự khác nhau giữa chúng. 2.1. Distributed Transaction [3] Transaction (giao dịch) là một đơn vị xử lý nguyên tố gồm tập hợp các thao tác truy xuất tới những hạng mục dữ liệu. Transaction phải thỏa mãn 4 tiêu chí sau đây: - Tính nguyên tố: Hoặc là tất cả các thao tác trong giao dịch được thực hiện thành công hoặc không thao tác nào thành công cả. - Tính nhất quán: Khi giao dịch kết thúc (thành công hay thất bại), toàn bộ dữ liệu phải ở trong trạng thái nhất quán. - Tính cô lập: Khi có nhiều giao dịch thực thi đồng thời thì kết quả của giao dịch này không ảnh hưởng tới kết quả của giao dịch kia. - Tính bền vững: Khi một giao dịch hoàn thành thì tất cả thay đổi của nó trên dữ liệu vẫn được duy trì bền vững bất chấp sự cố có thể xảy ra. Chẳng hạn, một giao dịch T chuyển số tiền 100$ từ tài khoản A1 sang tài khoản A2 tại một ngân hàng B gồm hai thao tác như sau:  O1: Rút 100$ từ tài khoản A1.  O2: Nạp 100$ vào tài khoản A2. Giao dịch T được gọi là thành công khi cả hai hành động thành công, nếu một trong hai hành động thất bại thì hành động còn lại phải thất bại và giao dịch lúc đó được xem là thất bại. Distributed Transaction tượng trưng cho một trong hai cách phân tán dữ liệu trong MS SQL Server. Distributed transaction là một giao dịch bao gồm những thao tác truy cập đến những hạng mục dữ liệu trên nhiều site khác nhau. Sự kết hợp các site để cùng thực hiện một giao dịch được điều hành bởi bộ phận quản lý giao dịch. MS DTC (Microsoft Distributed Transaction Coordinator) là một bộ phận quản lý giao dịch, bằng cách áp dụng kỹ thuật Two Phase Commit (2PC), MS DTC đảm bảo sự hoàn thành giao dịch tại tất cả các site vào cùng một thời điểm. Mở rộng ví dụ chuyển tiền bên trên, ngân hàng B có 2 chi nhánh B1 và B2 trong đó tài khoản A1 được quản lý bởi site ở chi nhánh B1 và tài khoản A2 được quản lý bởi site ở chi nhánh B2. Khi đó, giao dịch T là một distributed transaction, việc thực thi của giao dịch T liên quan đến việc thực thi của cả 2 site. 10 Để đưa ra quyết định đúng trong việc commit (chấp nhận) hay rollback (hủy bỏ) của một distributed transaction, những site liên quan cần phải có kết nối với nhau. Cụ thể, khi một ứng dụng khởi tạo một distributed transaction bằng cách gửi yêu cầu Begin Transaction đến một site bất kỳ trong hệ thống. Khi đó site này sẽ đóng vai trò Coordinator, nó giữ một bảng copy của MS DTC log chứa nội dung của distributed transaction và thông tin của các site liên quan đến distributed transaction. Mỗi site mà có chứa những hạng mục dữ liệu được truy cập bởi distributed transaction này sẽ là một Participant. Vào giai đoạn cuối của một distributed transaction, các Participant chịu trách nhiệm phối hợp với Coordinator để đồng thuận trong việc commit hay rollback (xem Hình 4). Hình 4. Quá trình truyền một distributed transaction qua các site Two Phase Commit (2PC) được đề xuất nhằm tạo ra sự đồng thuận trong việc Commit hay Rollback giữa Coordinator và các Participant của một distributed transaction. Để đảm bảo tính nguyên tố của transaction, nếu một site liên quan đến một distributed transaction bị rollback, thì toàn bộ các site liên quan phải bị rollback bất chấp chúng đã rơi vào trạng thái chuẩn bị commit (PreparedCommit). Và chỉ khi tất cả các site liên quan đều ở trạng tháo preparedcommit thì distributed transaction mới được commit. Cụ thể, kỹ thuật 2PC gồm 2 pha: pha biểu quyết (Voting Phase) và pha hoàn tất (Completion Phase): - Tại Voting Phase: Coordinator gửi thông báo “CanCommit?” yêu cầu tất cả các Participant báo cáo trạng thái của nó liên quan đến transaction. Sau khi nhận được thông báo “CanCommit?”, nếu một Participant có thể commit thì nó tạm thời chưa được commit mà chỉ được ở trong trạng thái preparedcommit và gửi thông báo “Yes” về Coordinator. Nếu một Participant đã rollback thì gửi thông báo “No” về Coordinator. Site(S3)Site(S2)Site(S1) 11 - Tại Completion Phase: Dựa vào các thông báo trạng thái của các Participant, Coordinator ra quyết định cuối cùng và gửi quyết định đến tất cả Participant. Cụ thể, nếu tất cả các Participant thông báo “Yes” trong Voting Phase, Coordinator ra quyết định “DoCommit”. Nếu tồn tại một Participant thông báo “No” trong voting phase thì Coordinator ra quyết định “DoRollback”. Sau khi nhận được quyết định cuối cùng từ Coordinator, nếu quyết định là “DoCommit” thì các Participant thực hiện chuyển từ trạng thái preparedcommit sang trạng thái commit. Ngược lại nếu quyết định “DoRollback”, các Participant chuyển từ trạng thái preparedcommit sang trạng thái rollback. Quá trình thực thi 2PC có thể bị ảnh hưởng khi một site bị sự cố hoặc các tin nhắn bị mất. Khi đó, các site khác bị lock trong một khoảng thời gian dài để chờ site gặp sự cố khôi phục hay tin nhắn được gửi lại, điều này dẫn tới các hạng mục dữ liệu liên quan đến distributed transaction không được giải phóng cho các transaction khác truy cập trong một thời gian dài. Đây chính là điểm yếu của kỹ thuật phân tán dữ liệu này. 2.2. Replication [3, 4, 6] 2.2.1. Khái niệm Replication (nhân bản) là “một tập các công nghệ” mà có thể di chuyển dữ liệu và các đối tượng của cơ sở dữ liệu từ vị trí này sang các vị trí khác, điều này cho phép người dùng có thể làm việc với bản copy của cơ sở dữ liệu và bất kỳ thay đổi nào trong cơ sở dữ liệu tại một vị trí cũng sẽ được chuyển tới các vị trí ở xa đang có kết nối qua hệ thống mạng máy tính. Sự nhất quán của cơ sở dữ liệu được duy trì bởi quá trình xử lý đồng bộ. Có 2 phương pháp nhân bản dữ liệu: Eager replication và Lazy Replication. - Eager Replication: Với phương pháp này, tất cả các site được bảo đảm là luôn thấy cùng giá trị dữ liệu tại cùng một thời điểm, điều này có nghĩa khi một ứng dụng cập nhật trên một bản sao của một bảng dữ liệu tại một site thì các bản sao khác của bảng dữ liệu đó tại các site khác cũng được cập nhật trong cùng giao dịch, nếu bất kỳ site nào mất kết nối thì việc cập nhật sẽ bị ngăn chặn. Hơn nữa, tính nguyên tố của giao dịch được đảm bảo bởi kỹ thuật 2PC, mỗi site phải commit đồng thời mọi thay đổi hoặc không site nào commit những thay đổi. Phương pháp nhân bản này rõ ràng không khả thi khi số lượng site quá lớn. - Lazy Replication: Có một sự nhất quán ngầm giữa các site do có một sự trì hoãn trong việc phản ánh các giá trị dữ liệu đến các site tham gia, việc cập nhật dữ liệu vẫn được thực hiện trên site này dù site khác có mất kết nối và việc đồng bộ sẽ được thực hiện khi site đó kết nối trở lại. Ưu điểm của phương pháp nhân bản này là tính độc lập của các site được tăng cao, tuy nhiên cũng có thể có 2 site cùng cập nhật trên 12 cùng một hạng mục dữ liệu tại cùng thời điểm, điều này có thể dẫn tới sự xung đột và đây là vấn đề cần phải giải quyết trong Lazy Replication. Sự khác nhau cơ bản giữa Eager Replication và Lazy Replication là dữ liệu có nhất quán tại cùng một lúc hay không. 2.2.2. Các loại Replication trong MS SQL Server MS SQL Server đã đưa ra nhiều loại nhân bản để đáp ứng các yêu cầu khác nhau của ứng dụng. Mỗi loại cung cấp các khả năng và thuộc tính khác nhau nhằm đạt đến mục tiêu đảm bảo tính độc lập server và sự nhất quán dữ liệu. - Snapshot Replication: Đây là nhân bản đơn giản nhất thuộc loại Lazy Replication, nó sao chép toàn bộ dữ liệu cần nhân bản từ Publisher tới Subscriber. Khi có thay đổi, Snapshot Replication gởi tất cả dữ liệu tới cho Subscriber thay vì chỉ gởi những thay đổi. Loại nhân bản này được đánh giá cao trong các ứng dụng chỉ đọc như tìm kiếm hay các hệ thống yêu cầu dữ liệu mới nhất và dung lượng không lớn. - Transactional Replication: Nhân bản này sử dụng transaction log để giữ những thay đổi trên dữ liệu (insert, update, delete) và lưu những thay đổi này lên cơ sở dữ liệu phân tán (tại Distrubutor), những thay đổi này sẽ được chuyển đến các Subscriber ngay sau khi cập nhật. Các subscription của nhân bản này được gán mặc định là read-only nên nó thuộc loại Lazy Replication, trường hợp cho phép cập nhật trên subscription thì nhân bản này thuộc loại Eager Replication. - Merge Replication: Nhân bản này thuộc loại Lazy Replication nên các site có tính độc lập rất cao, Publisher và Subscriber có thể làm việc độc lập và sẽ kết nối với nhau theo những khoảng thời gian để hội tụ kết quả lại, cả hai Publisher và Subsciber đều có thể cập nhật dữ liệu. Nếu xung đột xảy ra giữa các server thì những xung đột này sẽ được giải quyết một cách tự động, khi đó bộ giải quyết đụng độ sẽ chọn server có độ ưu tiên cao hơn. Hình 5. Mức độ độc lập và độ trễ của các phương pháp phân tán Độ trễ và tính độc lập thấp Độ trễ và tính độc lập cao Transactional Replication Snapshot Replication Merge Replication 13 Việc chọn lựa loại nhân bản nào tùy thuộc vào nhiều yếu tố trong đó 2 yếu tố chính là độ trễ của việc đồng bộ và tính độc lập giữa các site. Hình 5 cho thấy mức độ độc lập và độ trễ giữa các loại nhân bản, trong đó Transactional Replication có độ trễ và tính độc lập thấp nhất, Merge Replication có độ trễ cao nhất và tính độc lập tối đa. Phầ

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ XÂY DỰNG HỆ THỐNG CƠ SỞ DỮ LIỆU PHÂN TÁN QUẢN LÝ ĐÀO TẠO ÁP DỤNG CHO CÁC TRƯỜNG ĐẠI HỌC – CAO ĐẲNG Mã số: T2013-07-04 Chủ nhiệm đề tài: Nguyễn Thị Ly Sa Đà Nẵng, 12/2013 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN BÁO CÁO TỔNG KẾT ĐỀ TÀI KHOA HỌC VÀ CÔNG NGHỆ CẤP CƠ SỞ XÂY DỰNG HỆ THỐNG CƠ SỞ DỮ LIỆU PHÂN TÁN QUẢN LÝ ĐÀO TẠO ÁP DỤNG CHO CÁC TRƯỜNG ĐẠI HỌC – CAO ĐẲNG Mã số: T2013-07-04 Xác nhận quan chủ trì đề tài Chủ nhiệm đề tài Nguyễn Thị Ly Sa Đà Nẵng, 12/2013 MỤC LỤC MỞ ĐẦU CHƯƠNG LÝ THUYẾT VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 1.1 Các khái niệm .3 1.2 Các lý sử dụng sở liệu phân tán 1.3 Hạn chế sở liệu phân tán 1.4 Kiến trúc hệ sở liệu phân tán 1.5 Kỹ thuật thiết kế sở liệu phân tán .5 1.5.1 Kiến trúc sở liệu phân tán 1.5.2 Các chiến lược thiết kế sở liệu phân tán 1.5.3 Phân mảnh (Fragmentation) 1.5.4 Nhân (Replication) 1.5.5 Hạn chế phân mảnh nhân CHƯƠNG CƠ SỞ DỮ LIỆU PHÂN TÁN TRONG MS SQL SERVER 2.1 Distributed Transaction 2.2 Replication 11 2.2.1 Khái niệm 11 2.2.2 Các loại Replication MS SQL Server 12 2.3 Lợi ích Replication 13 2.4 Các vấn đề Replication 13 2.4.1 Thành phần Replication .13 2.4.2 Mơ hình nhân logic .14 2.4.3 Các mơ hình nhân vật lý 15 2.4.4 Kỹ thuật chuyển liệu từ Publisher tới Subcriber 17 2.4.5 Các loại Agent .18 CHƯƠNG REPLICATION 19 3.1 Snapshot Replication 19 3.1.1 Giới thiệu Snapshot Replication 19 3.1.2 Hoạt động Snapshot Replication 19 3.2 Transactional Replication 20 3.2.1 Giới thiệu Transactional Replication 20 3.2.2 Hoạt động Transactional Replication .21 3.2.3 Transactional Replication with updatable Subcription 21 3.3 Merge Replication 22 3.3.1 Giới thiệu Merge Replication 22 3.3.2 Hoạt động Merge Replication .23 CHƯƠNG XÂY DỰNG MƠ HÌNH PHÂN TÁN 24 4.1 Qui trình quản lý đào tạo 24 4.2 Mơ hình sở liệu phân tán quản lý đào tạo 24 4.3 Thiết kế sở liệu phân tán 25 4.4 Giải pháp đồng sở liệu phân tán 26 4.5 Các vấn đề đồng liệu 26 4.6 An toàn bảo mật Replication 27 4.7 Cài đặt thực nghiệm .27 4.8 Kiểm tra kết đồng thơng qua chương trình ứng dụng 31 4.9 Đánh giá kết thực nghiệm .36 CHƯƠNG KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 37 5.1 Kết đạt 37 5.2 Hạn chế .37 5.3 Hướng phát triển 37 TÀI LIỆU THAM KHẢO 38 DANH MỤC HÌNH VẼ Hình Hệ sở liệu phân tán hệ sở liệu tập trung Hình Kiến trúc sở liệu phân tán Hình Minh họa phương pháp phân mảnh Hình Quá trình truyền Distributed Transaction qua site 10 Hình Mức độ độc lập độ trễ phương pháp phân tán 12 Hình Mơ hình nhân logic 15 Hình Mơ hình nhân Publisher/Distributor-Subscriber đơn giản 15 Hình Mơ hình nhân vật lý Central Publisher-Multiple Subscribers 16 Hình Mơ hình central Subscriber/Multiple Publisher 16 Hình 10 Mơ hình Multiple Publishers-Multiple Subscriber 17 Hình 11 Hoạt động Snapshot Replication 20 Hình 12 Hoạt động Transactional Replication 21 Hình 13 Hoạt động Merge Replication 23 Hình 14 Một mơ hình sở liệu phân tán quản lý đào tạo 25 Hình 15 Cơ sở liệu dùng thử nghiệm 28 Hình 16 Cấu hình Replication MS SQL Server 29 Hình 17 Cơ sở liệu server 29 Hình 18 Kết đồng liệu server Phịng đào tạo server Khoa 30 Hình 19 Kết đồng liệu server Phòng đào tạo server Sinh viên 30 Hình 20 Đăng nhập vào server Phòng đào tạo server Sinh viên 31 Hình 21 Thêm dòng liệu server Phòng đào tạo 31 Hình 22 Dịng liệu đồng server Khoa 32 Hình 23 Cập nhật liệu liệu server Phòng đào tạo 32 Hình 24 Cập nhật liệu liệu server Khoa 33 Hình 25 Kết sau đồng độ server Phòng đào tạo 33 Hình 26 Kết sau đồng độ server Khoa 34 Hình 27 Cập nhật liệu server Phòng đào tạo 34 Hình 28 Cập nhật liệu server Khoa 35 Hình 29 Kết sau đồng độ server Phòng đào tạo 35 Hình 30 Kết sau đồng độ server Khoa 36 DANH MỤC BẢNG Bảng So sánh phương pháp nhân 2PC DANH MỤC TỪ VIẾT TẮT CĐ DB : Two Phase Commit DBMS : Cao Đẳng DDB : DataBase DDBS : Distributed Database Management System DTC : Distributed DataBase ĐHĐN : Distributed Database System-DDBS IPSEC : Distributed Transaction Coordinator IT : Đại học Đà Nẵng LAN : IP Security MS : Information Technology PAL : Local Area Network SSL : Microsoft VPN Publication Access List : Secure Sockets Layer : Virtual Private Network ĐẠI HỌC ĐÀ NẴNG CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG CĐ CÔNG NGHỆ THÔNG TIN Độc lập – Tự – Hạnh phúc THÔNG TIN KẾT QUẢ NGHIÊN CỨU Thông tin chung: - Tên đề tài: XÂY DỰNG HỆ THỐNG CƠ SỞ DỮ LIỆU PHÂN TÁN QUẢN LÝ ĐÀO TẠO ÁP DỤNG CHO CÁC TRƯỜNG ĐẠI HỌC – CAO ĐẲNG - Mã số: T2013-07-04 - Chủ nhiệm: NGUYỄN THỊ LY SA - Thành viên tham gia: - Cơ quan chủ trì: Trường Cao đẳng Cơng nghệ thông tin – Đại học Đà Nẵng - Thời gian thực hiện: từ ngày 01/01/2013 đến ngày 31/12/2013 Mục tiêu: - Tìm hiểu sở liệu phân tán các kỹ thuật phân tán liệu MS SQL Server, đặc biệt kỹ thuật Replication - Xây dựng mô hình sở liệu phân tán quản lý đào tạo Tính sáng tạo: - Đề tài đề xuất mơ hình sở liệu phân tán cho hệ thống quản lý đào tạo chọn lựa giải pháp đồng sở liệu phân tán MS SQL Server - Cài đặt thử nghiệm với sở liệu sử dụng Trường CĐ Công nghệ Thông tin-ĐHĐN Tóm tắt kết nghiên cứu: Đề tài đề xuất mơ hình sở liệu phân tán cho hệ thống quản lý đào tạo áp dụng cho trường Đại học Cao đẳng Cụ thể, hệ thống sở liệu phân tán Trường CĐ Công nghệ Thông tin-ĐHĐN gồm server: - Server dùng riêng cho Phòng Đào tạo phận khác Phịng Cơng tác Sinh viên, Phịng Tài vụ để cập nhật lớp học phần, điểm, học phí, xét học vụ… (gọi server Phòng Đào tạo) - Server dùng riêng cho Khoa cập nhật thông tin lịch trình giảng dạy giáo viên, điểm danh, phân công giáo viên hướng dẫn đề tài… (gọi server Khoa) - Server dành riêng cho sinh viên xem thông tin cá nhân thông tin liên quan đến việc học tập qua internet điểm, thời khóa biểu đăng ký học phần… (gọi server Sinh viên ) Ba server kết nối với thông qua hệ thống mạng LAN, liệu hệ thống quản lý đào tạo lưu server Phòng Đào tạo, phần liệu server nhân đến server lại theo chức nhiệm vụ server Ba server đặn đồng liệu với để đảm bảo tính xác cao liệu Đề tài sử dụng kỹ thuật Replication MS SQL Server 2008 để cài đặt thử nghiệm Kết đồng có độ xác đạt 100% thời gian đồng mức chấp nhận Tên sản phẩm: - Hệ thống sở liệu phân tán quản lý đào tạo - Bài báo đăng Kỷ yếu hội thảo nghiên cứu khoa học: Công Nghệ Thông Tin Và Ứng Dụng Công Nghệ Thông Tin Trong Các Lĩnh Vực, Trường Cao đẳng Công nghệ Thông tin, lần thứ - Báo cáo tổng kết kết nghiên cứu đề tài Hiệu quả, phương thức chuyển giao kết nghiên cứu khả áp dụng: - Về mặt Giáo dục - Đào tạo: Phục vụ công tác giảng dạy, nghiên cứu thực hành chuyên đề Cơ sở liệu phân tán cho sinh viên khoa Công nghệ Thông tin, chuyên ngành Hệ thống thông tin - Về sản phẩm ứng dụng : Góp phần nâng cao hiệu trình quản lý đào tạo trường Đại học Cao Đẳng Hình ảnh, sơ đồ minh họa chính: Hình Một mơ hình sở liệu phân tán quản lý đào tạo Publisher: server Phòng Đào tạo Publication ứng với server Khoa Publication ứng với server Sinh viên Subscriber: server Sinhviên Subscription server Sinh viên Subscriber: server Khoa Subscription server Khoa Hình Cấu hình Replication MS SQL Server

Ngày đăng: 01/03/2024, 01:53

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w