Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 34 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
34
Dung lượng
874 KB
Nội dung
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH CHƯƠNG TRÌNH ĐẠO TẠO THẠC SĨ CNTT ________________ BÁO CÁO THU HOẠCH CHUYÊN ĐỀ CƠ SỞ DỮ LIỆU NÂNG CAO Đề tài: THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN Giảng viên HD: SV thực hiện: PGS.TS Đỗ Phúc Nguyễn Bảo Minh (CH1101104) Lớp Cao học CNTT Qua mạng Khóa 6 TP. HCM, 7/2012 Mục Lục MỤC LỤC CHƯƠNG TRÌNH ĐẠO TẠO THẠC SĨ CNTT 1 TP. HCM, 7/2012 1 LỜI MỞ ĐẦU 1 CHƯƠNG 1: KHÁI QUÁT VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 2 1.1 Cơ sở dữ liệu tập trung 2 1.2. Cơ sở dữ liệu phân tán 2 1.2.1 Định nghĩa 2 1.2.2 Các đặc điểm chính của cơ sở dữ liệu phân tán 4 1.2.2.1 Chia sẻ tài nguyên 4 1.2.2.2 Tính mở 4 1.2.2.3 Khả năng song song 5 1.2.2.4 Khả năng mở rộng 5 1.2.2.5 Khả năng thứ lỗi 5 1.2.2.6 Tính trong suốt 6 1.2.2.7 Đảm bảo tin cậy và nhất quán 6 Hệ thống yêu cầu độ tin cậy cao: sự bí mật của dữ liệu phải được bảo vệ, các chức năng khôi phục hư hỏng phải được đảm bảo. Ngoài ra yêu cầu của hệ thống về tính nhất quán cũng rất quan trọng trong thể hiện: không được có mâu thuẫn trong nội dung dữ liệu. Khi các thuộc tính dữ liệu là khác nhau thì các thao tác vẫn phải nhất quán 6 1.2.3 Sự khác nhau cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung 6 1.2.4 Lợi điểm của cơ sở dữ liệu phân tán 8 1.2.5 Hệ quản trị cơ sở dữ liệu phân tán 9 CHƯƠNG 2 :THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN 12 2.1 Các chiến lược thiết kế 12 2.1.1 Quá trình thiết kế từ trên xuống (top-down) 12 2.1.2- Quá trình thiết kế từ dưới tên (Bottom-up) 12 2.2.Các vấn đề thiết kế 12 2.2.1. Lý do phân mảnh 12 2.2.2.Các quy tắc phân mảnh đúng đắn 12 2.3 Các yêu cầu thông tin 13 2.4. Phân mảnh ngang 13 2.4.1 Hai kiểu phân mảnh ngang 14 2.4.2 Phân mảnh ngang nguyên thuỷ 14 2.4.2.1 Thuật toán COM_MIN 15 2.4.2.2 Thuật toán phorizontal 17 2.4.3 Phân mảnh ngang dẫn xuất 18 2.4.4 Kiểm định tính đúng đắn 20 2.5 Phân mảnh dọc 20 2.5.1 Các yêu cầu thông tin của phân mảnh dọc 21 2.5.2 Ái lực của các thuộc tính 22 2.5.4 Thuật toán phân mảnh dọc 25 2.5.4.1 Thuật toán PARTITION 26 2.6 - Phân mảnh hỗn hợp 27 CHƯƠNG 3: CÀI ĐẶT CHƯƠNG TRÌNH MÔ PHỎNG 29 KẾT LUẬN 31 TÀI LIỆU THAM KHẢO 32 Báo cáo thu hoạch Cơ Sở Dữ Liệu Nâng Cao Trang 2 Lời Mở Đầu LỜI MỞ ĐẦU Vào những năm 1970, các máy tính đã có đủ khả năng xây dựng hệ thống thông tin và hệ cơ sở dữ liệu. Các hệ thống cơ sở dữ liệu (Database systems) đã không ngừng phát triển và đã có những thành công lớn trong suốt hơn ba thập kỷ qua. Ngày càng có nhiều dữ liệu được thu thập và lưu trữ dưới dạng cơ sở dữ liệu lớn. Một mặt đã hình thành và phát triển các mô hình lý thuyết hệ cơ sở dữ liệu, mặt khác những nguồn phát triển hệ thống ứng dụng cũng ngày càng lớn mạnh. Hệ thống thông tin hình thành trên cơ sở kết nối các máy tính lại với nhau. Những năm gần đây, hệ cơ sở dữ liệu phân tán được phát triển mạnh trong thực tế dựa trên sự phát triển của cơ sở dữ liệu (CSDL) và mạng máy tính. Vì yêu cầu của công ty, doanh nghiệp, đơn vị kinh doanh về vấn đề tổ chức sao cho kinh doanh có hiệu quả nhất và nắm bắt thông tin nhanh nhất khi các cơ sở của công ty hiện ở những địa điểm xa nhau cho nên xây dựng một hệ thống làm việc trên cơ sở dữ liệu phân tán là phù hợp xu hướng hiện nay vì hệ thống này thoả mãn được những yêu cầu tổ chức của đơn vị. Lợi điểm về tổ chức và kỹ thuật của xu hướng phát triển cơ sở dữ liệu phân tán là: giải quyết được những hạn chế của cơ sở dữ liệu tập trung và phù hợp xu hướng phát triển tự nhiên với cơ cấu không tập trung của các tổ chức, công ty doanh nghiệp. CSDL phân tán ra đời dựa trên nền tảng chính của CSDL tập trung nhưng với đặc điểm riêng nổi bật là thiết kế theo phương pháp phân mảnh dữ liệu và sử dụng các bản sao (replication), dữ liệu phân tán sẽ được cập nhật và lưu tại các nút (site), mỗi nút tương ứng với một database server và chỉ thực hiện một số chức năng nhất định. Việc ứng dụng CSDL phân tán có thể khắc phục được các nhược điểm vốn có của CSDL tập trung. Ngoài ra, việc kết nối giữa các CSDL từ xa được thực hiện qua kết nối database link sẽ đáp ứng được một số tiêu chuẩn cơ bản như cải thiện năng suất thực hiện công việc, đảm bảo an toàn dữ liệu, giảm giá thành truyền thông, bảo mật cao, dễ dàng thay đổi, phát triển, … Trang 1 Chương 1: Khái quát về cơ sở dữ liệu phân tán CHƯƠNG 1: KHÁI QUÁT VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 1.1 Cơ sở dữ liệu tập trung Về cơ bản cơ sở dữ liệu (Database) là tập hợp dữ liệu được lưu trữ một cách có tổ chức để phục vụ cho công việc sử dụng thuận tiện nhất. Dữ liệu là số liệu, hình ảnh cần được lưu trữ dưới dạng file, record tiện lợi cho người dùng đối với việc tham khảo, xử lý Mỗi cơ sở dữ liệu cần có chương trình quản lý, xắp xếp, duy trì dữ liệu gọi là hệ quản trị cơ sở dữ liệu (DBMS - Database Management System). Hệ quản trị cơ sở dữ liệu được coi là bộ diễn dịch ngôn ngữ bậc cao để dịch các công việc người sử dụng thao tác trên dữ liệu mà người dùng không cần quan tâm đến thuật toán. Về mặt kiến trúc, cơ sở dữ liệu được phân chia thành các mức khác nhau. Một cơ sở dữ liệu cơ bản có ba phần chính là mức vật lý, mức khái niệm và mức thể hiện. Tuy nhiên với cơ sở dữ liệu cấp cao thì có thể có nhiều mức phân hoá hơn. Mức vật lý: là mức thấp nhất của kiến trúc hệ cơ sở dữ liệu, ở mức này dữ liệu được tổ chức dưới nhiều cấp khác nhau như bản ghi, file Mức khái niệm: là sự biểu diễn trừu tượng của cơ sở dữ liệu vật lý và có thể nói mức vật lý là sự cài đặt cụ thể của cơ sở dữ liệu ở mức khái niệm. Mức thể hiện: khi cơ sở dữ liệu được thiết kế, những gì thể hiện (giao diện, chương trình quản lý, bảng ) gần gũi với người sử dụng với cơ sở dữ liệu ở mức khái niệm gọi là khung nhìn. Như vậy sự khác nhau giữa khung nhìn và mức khái niệm không lớn. 1.2. Cơ sở dữ liệu phân tán 1.2.1 Định nghĩa Cơ sở dữ liệu phân tán (distributed database) là sự tập hợp dữ liệu mà về mặt luận lý chúng thuộc cùng một hệ thống nhưng được đặt ở nhiều nơi (site) của một mạng máy tính. Sự phân tán dữ liệu(data distribution): dữ liệu phải được phân tán ở nhiều nơi. Sự tương quan luận lý(logical correlation): dữ liệu của các nơi được sử dụng chung để cùng giải quyết một vấn đề. Về cơ bản thì CSDL phân tán được mô tả như 3 mô hình sau: Trang 2 Chương 1: Khái quát về cơ sở dữ liệu phân tán Báo cáo thu hoạch Cơ Sở Dữ Liệu Nâng Cao Cơ sở dữ liệu phân tán trên một mạng phân tán địa lý Cơ sở dữ liệu phân tán trên một mạng cục bộ Trang 3 Chương 1: Khái quát về cơ sở dữ liệu phân tán 1.2.2 Các đặc điểm chính của cơ sở dữ liệu phân tán 1.2.2.1 Chia sẻ tài nguyên Việc chia sẻ tài nguyên của hệ phân tán được thực hiện thông qua mạng truyền thông. Để chia sẻ tài nguyên một cách có hiệu quả thì mỗi tài nguyên cần được quản lý bởi một chương trình có giao diện truyền thông, các tài nguyên có thể được truy cập, cập nhật một cách tin cậy và nhất quán. Quản lý tài nguyên ở đây là lập kế hoạch dự phòng, đặt tên cho các lớp tài nguyên, cho phép tài nguyên được truy cập từ nơi này đến nơi khác, ánh xạ lên tài nguyên vào địa chỉ truyền thông, 1.2.2.2 Tính mở Tính mở của hệ thống máy tính là dễ dàng mở rộng phần cứng (thêm các thiết bị ngoại vi, bộ nhớ, các giao diện truyền thông ) và các phần mềm (các mô hình hệ điều hành, các giao thức truyền tin, các dịch vụ chung tài nguyên ) Một hệ phân tán có tính mở là hệ có thể được tạo từ nhiều loại phần cứng và phần mềm của nhiều nhà cung cấp khác nhau với điều kiện là các thành phần này phải theo một tiêu chuẩn chung. Tính mở của hệ phân tán được xem như là mức độ bổ sung các dịch vụ Báo cáo thu hoạch Cơ Sở Dữ Liệu Nâng Cao Cơ sở dữ liệu phân tán trên hệ thống đa xử lý Trang 4 Chương 1: Khái quát về cơ sở dữ liệu phân tán dùng chung tài nguyên mà không phá hỏng hay nhân đôi các dịch vụ đang tồn tại Tính mở được hoàn thiện bằng cách xác định hay phân định rõ các giao diện chính của một hệ và làm cho nó tương thích với các nhà phát triển phần mềm. Tính mở của hệ phân tán dựa trên việc cung cấp cơ chế truyền thông giữa các tiến trình và công khai các giao diện dùng để truy cập các tài nguyên chung. 1.2.2.3 Khả năng song song Hệ phân tán hoạt động trên một mạng truyền thông có nhiều máy tính, mỗi máy có thể có 1 hay nhiều CPU. Trong cùng một thời điểm nếu có N tiến trình cùng tồn tại, ta nói chúng thực hiện đồng thời. Việc thực hiện tiến trình theo cơ chế phân chia thời gian (một CPU) hay song song (nhiều CPU). Khả năng làm việc song song trong hệ phân tán được thực hiện do hai tình huống sau: - Nhiều người sử dụng đồng thời ra các lệnh hay các tương tác với các chương trình ứng dụng - Nhiều tiến trình Server chạy đồng thời, mỗi tiến trình đáp ứng các yêu cầu từ các tiến trình Client khác. 1.2.2.4 Khả năng mở rộng Hệ phân tán có khả năng hoạt động tốt và hiệu quả ở nhiều mức khác nhau. Một hệ phân tán nhỏ nhất có thể hoạt động chỉ cần hai trạm làm việc và một File Server. Các hệ lớn hơn tới hàng nghìn máy tính. Khả năng mở rộng được đặc trưng bởi tính không thay đổi phần mềm hệ thống và phần mềm ứng dụng khi hệ được mở rộng. Điều này chỉ đạt được mức độ nào đó với hệ phân tán hiện tại. Yêu cầu mở rộng không chỉ là sự mở rộng về phần cứng, về mạng mà nó trải trên các khía cạnh khi thiết kế hệ phân tán. 1.2.2.5 Khả năng thứ lỗi Việc thiết kế khả năng thứ lỗi của các hệ thống máy tính dựa trên hai giải pháp cơ bản sau: - Dùng khả năng thay thế để đảm bảo sự hoạt động liên tục và hiệu quả. - Dùng các chương trình hồi phục khi xảy ra sự cố. Xây dựng một hệ thống có thể khắc phục sự cố theo cách thứ nhất thì người ta nối hai máy tính với nhau để thực hiện cùng một chương trình, một trong hai máy chạy ở chế độ Standby (không tải hay chờ). Giải pháp này tốn kém vì phải nhân đôi phần cứng của hệ thống. Một giải pháp để giảm phí tổn là các Server riêng lẻ được cung cấp các ứng dụng quan trọng để có thể thay thế nhau khi có sự cố xuất hiện. Khi không có các sự cố các Server hoạt động bình thường, khi có sự cố trên một Server nào đó, các ứng dụng Clien tự chuyển hướng sang các Server còn lại. Cách hai thì các phần mềm hồi phục được thiết kế sao cho trạng thái dữ Báo cáo thu hoạch Cơ Sở Dữ Liệu Nâng Cao Trang 5 Chương 1: Khái quát về cơ sở dữ liệu phân tán liệu hiện thời (trạng thái trước khi xảy ra sự cố) có thể được khôi phục khi lỗi được phát hiện. Các hệ phân tán cung cấp khả năng sẵn sàng cao để đối phó với các sai hỏng phần cứng . 1.2.2.6 Tính trong suốt Tính trong suất của một hệ phân tán được hiểu như là việc che khuất đi các thành phần riêng biệt của hệ đối với người sử dụng và những người lập trình ứng dụng. Tính trong suốt về vị trí. Người sử dụng không cần biết vị trí vật lý của dữ liệu. Người sử dụng có quyền truy cập tới đến cơ sở dữ liệu nằm bất kỳ tại vị trí nào. Các thao tác lấy, cập nhật dữ liệu tại một điểm dữ liệu ở xa được tự động thực hiện bởi hệ thống tại điểm đưa ra yêu cầu, người sử dụng không cần biết đến sự phân tán của cơ sở dữ liệu trên mạng. Tính trong suốt trong việc sử dụng: Việc chuyển đổi của một phần hay toàn bộ cơ sở dữ liệu do thay đổi về tổ chức hay quản lý, không ảnh hưởng tới thao tác người sử dụng. Tính trong suốt của việc phân chia: Nếu dữ liệu được phân chia do tăng tải, nó không được ảnh hưởng tới người sử dụng. Tính trong suốt của sự trùng lặp: Nếu dữ liệu trùng lặp để giảm chi phí truyền thông với cơ sở dữ liệu hoặc nâng cao độ tin cậy, người sử dụng không cần biết đến điều đó. 1.2.2.7 Đảm bảo tin cậy và nhất q uán Hệ thống yêu cầu độ tin cậy cao: sự bí mật của dữ liệu phải được bảo vệ, các chức năng khôi phục hư hỏng phải được đảm bảo. Ngoài ra yêu cầu của hệ thống về tính nhất quán cũng rất quan trọng trong thể hiện: không được có mâu thuẫn trong nội dung dữ liệu. Khi các thuộc tính dữ liệu là khác nhau thì các thao tác vẫn phải nhất quán . 1.2.3 Sự khác nhau cơ sở dữ liệu phân tán và cơ sở dữ liệu tập trung Cơ sở dữ liệu tập trung cùng với cơ sở dữ liệu không qua thiết kế hình thành trước khi có cơ sở dữ liệu phân tán. Hai hình thức này phát triển trên cơ sở tự phát và hệ thống tập trung. Như vậy hai hình thức này không đáp ứng được yêu cầu tổ chức và công việc trên phạm vi lớn. Cơ sở dữ liệu phân tán được thiết kế khác cơ sở dữ liệu tập trung. Do đó cần đối sánh các đặc trưng của cơ sở dữ liêu phân tán với cơ sở dữ liệu tập trung để thấy được lợi ích của cơ sở dữ liệu phân tán. Đặc trưng mô tả cơ sở dữ liệu tập trung là điều khiển tập trung, độc lập dữ liệu, giảm bớt dư thừa, cơ cấu vật lý phức tạp đối với khả năng truy cập, toàn vẹn, hồi phục, điều khiển tương tranh, biệt lập và an toàn dữ liệu. Điều khiển tập trung: Điều khiển tập trung các nguồn thông tin của công việc hay tổ chức. Có người quản trị đảm bảo an toàn dữ liệu. Báo cáo thu hoạch Cơ Sở Dữ Liệu Nâng Cao Trang 6 Chương 1: Khái quát về cơ sở dữ liệu phân tán Trong cơ sở dữ liệu phân tán: không đề cập đến vấn đề điều khiển tập trung. Người quản trị cơ sở dữ liệu chung phân quyền cho người quản trị cơ sở dữ liệu địa phương. Độc lập dữ liệu: là một trong những nhân tố tác động đến cấu trúc cơ sở dữ liệu để tổ chức dữ liệu chuyển cho chương trình ứng dụng. Tiện lợi chính của độc lập dữ liệu là các chương trình ứng dụng không bị ảnh hưởng khi thay đổi cấu trúc vật lý của dữ liệu. Trong cơ sở dữ liệu phân tán, độc lập dữ liệu có tầm quan trọng cũng như trong cơ sở dữ liệu truyền thống. Khái niệm cơ sở dữ liệu trong suốt mô tả hoạt động chương trình trên cơ sở dữ liệu phân tán được viết như làm việc trên cơ sở dữ liệu tập trung. Hay nói cách khác tính đúng đắn của chương trình không bị ảnh hưởng bởi việc di chuyển dữ liệu từ nơi này sang nơi khác trong mạng máy tính. Tuy nhiên tốc độ làm việc bị ảnh hưởng do có thời gian di chuyển dữ liệu. Giảm dư thừa dữ liệu: Trong cơ sở dữ liệu tập trung, tính dư thừa hạn chế được càng nhiều càng tốt vì: -Dữ liệu không đồng nhất khi có vài bản sao của cùng cơ sở dữ liệu logic; để tránh được nhược điểm này giải pháp là chỉ có một bản sao duy nhất. -Giảm không gian lưu trữ. Giảm dư thừa có nghĩa là cho phép nhiều ứng dụng cùng truy cập đến một cơ sở dữ liệu mà không cần đến nhiều bản sao ở những nơi chương trình ứng dụng cần . Trong cơ sở dữ liệu truyền thống tính dư thừa dữ liệu cũng cần quan tâm vì: -Tính cục bộ của chương trình ứng dụng sẽ tăng nếu dữ liệu đặt ở mọi nơi mà chương trình ứng dụng cần. -Khả năng sẵn sàng của hệ thống cao bởi vì khi có lỗi ở một nơi nào đó trong hệ thống thì không cản trở hoạt động của chương trình ứng dụng. Nói chung, nguyên nhân đối lập với tính dư thừa đưa ra trong môi trường truyền thống vẫn còn đúng cho hệ thống phân tán và vì vậy công việc định giá mức độ tốt của tính dư thừa đòi hỏi định giá lại công việc lựa chọn mức độ dư thừa dữ liệu. Cơ sở dữ liệu phân tán khắc phục được hai nhược điểm này vì dữ liệu được chia ra thành nhiều phần nhỏ và chỉ có một bản sao logic tổng thể duy nhất để tiện cho việc truy cập dữ liệu. Cấu trúc vật lý và khả năng truy cập: người sử dụng truy cập đến cơ sở dữ liệu tập trung phải thông qua cấu trúc truy cập phức tạp: định vị cơ sở dữ liệu, thiết lập đường truyền Trong cơ sở dữ liệu phân tán, cấu trúc truy cập phức tạp không phải là công cụ chính để truy cập hiệu quả đến cơ sở dữ liệu. Hiệu quả có nghĩa là thời gian tìm kiếm và chuyển dữ liệu nhỏ nhất, chi phí truyền thông thấp nhất. Mỗi cách thức truy cập cơ sở dữ liệu phân tán viết bởi người lập trình hoặc tạo ra bởi một bộ tối ưu. Công việc viết ra một cách thức truy cập cơ sở dữ liệu phân tán Báo cáo thu hoạch Cơ Sở Dữ Liệu Nâng Cao Trang 7 Chương 1: Khái quát về cơ sở dữ liệu phân tán cũng giống như viết chương trình duyệt trong cơ sở dữ liệu tập trung. Công việc mà chương trình duyệt này làm là xác định xem có thể truy cập đến được bao nhiêu cơ sở dữ liệu. Tính toàn vẹn, hồi phục và điều khiển tương tranh: Mặc dù trong cơ sở dữ liệu, tính toàn vẹn, hồi phục và điều khiển đồng thời liên quan nhiều vấn đề liên quan lẫn nhau. Mở rộng hơn vấn đề này là việc cung cấp các giao tác. Giao tác là đơn vị cơ bản của việc thực hiện: giao tác cụ thể là bó công việc được thực hiện toàn bộ hoặc không được thực hiện. Trong cơ sở dữ liệu phân tán, vấn đề điều khiển giao tác tự trị có ý nghĩa quan trọng: hệ thống điều phối phải chuyển đổi các quỹ thời gian cho các giao tác liên tiếp. Như vậy giao tác tự trị là phương tiện đạt được sự toàn vẹn trong cơ sở dữ liệu Có hai mối nguy hiểm của giao tác tự trị là lỗi và tương tranh. Tính biệt lập và an toàn: trong cơ sở dữ liệu truyền thống, người quản trị hệ thống có quyền điều khiển tập trung, người sử dụng có chắc chắn được phân quyền mới truy cập vào được dữ liệu. Điểm quan trọng là trong cách tiếp cận cơ sở dữ liệu tập trung, không cần thủ tục điều khiển chuyên biệt. Trong cơ sở dữ liệu phân tán, những người quản trị địa phương cũng phải giải quyết vấn đề tương tự như người quản trị cơ sở dữ liệu truyền thống. Tuy nhiên, hai vấn đề đặc biệt sau đây của cơ sở dữ liệu phân tán có ý nghĩa quan trọng khi đề cập đến: -Thứ nhất trong cơ sở dữ liệu phân tán với cấp độ tự trị cao ở mỗi điểm, người có dữ liệu địa phương sẽ cảm thấy an toàn hơn vì họ có thể tự bảo vệ dữ liệu của mình thay vì phụ thuộc vào người quản trị hệ thống tập trung. -Thứ hai, vấn đề an toàn thực chất với hệ thống phân tán không giống như các hệ thống thông thường khác mà còn liên quan đến mạng truyền thông. Như vậy trong cơ sở dữ liệu phân tán vấn đề an toàn cơ sở dữ liệu phức tạp hơn và đòi hỏi nhiều kỹ thuật bảo vệ. Nguyên nhân gây ra là hệ thống này có tính mở và nhiều người dùng trong cùng hệ thống sử dụng nhiều cơ sở dữ liệu. 1.2.4 Lợi điểm của cơ sở dữ liệu phân tán Có nhiều nguyên nhân để phát triển cơ sở dữ liệu phân tán nhưng tựu trung lại chỉ gồm những điểm sau đây: Lợi điểm về tổ chức và tính kinh tế: tổ chức phân tán nhiều chi nhánh và dùng cơ sở dữ liệu phân tán phù hợp với các tổ chức kiểu này. Với vai trò là động lực thúc đẩy kinh tế thương mại phát triển rộng hơn, thì việc phát triển các trung tâm máy tính phân tán ở nhiều vị trí trở thành nhu cầu cần thiết. Tận dụng những cơ sở dữ liệu sẵn có: Hình thành cơ sở dữ liệu phân tán từ các cơ sở dữ liệu tập trung có sẵn ở các vị trí địa phương. Báo cáo thu hoạch Cơ Sở Dữ Liệu Nâng Cao Trang 8 [...]... xa đến cơ sở dữ liệu và trả về kết quả của chương trình ứng dụng yêu cầu Hệ quản trị cơ sở dữ liệu phân tán cung cấp cả hai kiểu truy cập bởi vì mỗi cách truy cập đều có ưu điểm của nó Báo cáo thu hoạch Cơ Sở Dữ Liệu Nâng Cao Trang 11 Chương 2: Thiết kế cơ sở dữ liệu phân tán CHƯƠNG 2 :THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN 2.1 Các chiến lược thiết kế 2.1.1 Quá trình thiết kế từ trên xuống (top-down) Phân tích... quản trị cơ sở dữ liệu tập trung cài đặt ở những điểm khác nhau trên mạng máy tính Những phần mềm cần thiết cho việc xây dựng cơ sở dữ liệu phân tán là: Phần quản lý cơ sở dữ liệu ( Database Management - DB ) Phần truyền thông dữ liệu (Data Communication - DC ) Từ điển dữ liệu được mở rộng để thể hiện thông tin về phân tán dữ liệu trong mạng máy tính (Data Dictionary - DD) Phần cơ sở dữ liệu phân tán (Distributed... hai cách cơ bản: Truy cập từ xa trực tiếp và gián tiếp Mô hình truy cập từ xa qua phương thức cơ sở của hệ quản trị cơ sở dữ liệu Theo mô hình trực tiếp trên, chương trình ứng dụng đưa ra yêu cầu truy cập đến cơ sở dữ liệu từ xa, yêu cầu này được hệ quản trị cơ sở dữ liệu tự động tìm nơi đặt dữ Báo cáo thu hoạch Cơ Sở Dữ Liệu Nâng Cao Trang 10 Chương 1: Khái quát về cơ sở dữ liệu phân tán liệu và thực... trận Use và Ma trận AF (Access Frequency) Báo cáo thu hoạch Cơ Sở Dữ Liệu Nâng Cao Trang 29 Chương 3: Cài đặt chương trình mô phỏng Báo cáo thu hoạch Cơ Sở Dữ Liệu Nâng Cao Trang 30 Kết luận KẾT LUẬN Bài thu hoạch đã tìm hiểu được các khái niệm cơ bản về cơ sở dữ liệu phân tán, cũng như trình bày các phương pháp thiết kế trong cơ sở dữ liệu phân tán Mặc dù đã có nhiều cố gắng trong cách trình bày và nội... cơ sở dữ liệu phân tán chương trình ứng dụng đặt ở địa phương có thể giảm bớt được chi phí truyền thông khi thực hiện bằng cách khai thác cơ sở dữ liệu tại chỗ Tăng số công việc thực hiện: Hệ cơ sở dữ liệu phân tán có thể tăng số lượng công việc thực hiện qua áp dụng nguyên lý xử lý song song với hệ thống xử lý đa nhiệm Tuy nhiên cơ sở dữ liệu phân tán cũng có tiện lợi trong việc phân tán dữ liệu như... tán và phân chia công việc thực hiện để công việc quản trị hệ thống đơn giản hơn) -Quản trị và điều khiển cơ sở dữ liệu bao gồm công cụ quản lý cơ sở dữ liệu, tập hợp thông tin về các thao tác trên cơ sở dữ liệu và cung cấp thông tin tổng thể về file dữ liệu đặt ở các nơi trong hệ thống -Điều khiển tương tranh và điều khiển hồi phục dữ liệu của giao tác phân tán Cách thức truy cập cơ sở dữ liệu từ... đường nối khác 1.2.5 Hệ quản trị cơ sở dữ liệu phân tán Hệ Quản trị CSDL phân tán (D–DBMS) là phần mềm quản trị CSDLPT và cung cấp cơ chế truy cập giúp người sử dụng không nhận biết được sự phân tán Hệ CSDL phân tán (DDBS) = DDB + D– DBMS DDBMS Hệ thống phát triển theo kiểu thương mại có sẵn được phát triển bởi những người cung cấp hệ cơ sở dữ liệu tập trung Hệ cơ sở dữ liệu tập trung mở rộng bằng cách... hoạch Cơ Sở Dữ Liệu Nâng Cao Trang 9 Chương 1: Khái quát về cơ sở dữ liệu phân tán Các thành phần của hệ quản trị CSDLPT Những dịch vụ hệ quản trị cơ sở dữ liệu cung cấp: -Cách thức truy cập dữ liệu từ xa: bằng chương trình ứng dụng -Lựa chọn một cấp độ trong suốt phân tán thích hợp: cho phép mở rộng hệ thống theo nhiều cách khác nhau theo từng hoàn cảnh (phải cân nhắc giữa cấp độ trong suốt phân tán. .. giả và bạn bè đồng nghiệp Trang 31 Tài Liệu Tham Khảo TÀI LIỆU THAM KHẢO 1 Bài giảng Cơ sở dữ liệu nâng cao Tác giả: PGS.TS Đỗ Phúc 2.Giáo Trình Cơ Sở Dữ Liệu Nâng Cao Đại Học Bách Khoa HCM 3 Giáo trình điện tử Cơ Sở Dữ Liệu Nâng Cao, Công Nghệ Tri Thức và Trí Tuệ Nhân Tạo Biên soạn: Trung tâm thông tin – ĐH Quốc Gia Tp HCM 4.Nguyên lý các hệ cơ sở dữ liệu phân tán tập 1 M.Tamer Ozsu & Patrick Valduriez... NHANVIEN MNV TENNV chức vụ El J.Dọc Kỹ sư điện E2 M.Smith Phân tích E2 M.Smith Phân tích E3 A.Lee Kỹ sư cơ khí E3 A.Lee Kỹ sư cơ khí E4 J.Miller Programmer E5 B.Casey Phân tích hệ thống E6 L.Chu Kỹ sư điện E7 R.david Kỹ sư cơ khí J.Jones Phân tích hệ thống E8 Báo cáo thu hoạch Cơ Sở Dữ Liệu Nâng Cao Trang 18 Chương 2: Thiết kế cơ sở dữ liệu phân tán Thế thì chúng ta có thể nhóm các kỹ sư thành hai nhóm . lớn. Cơ sở dữ liệu phân tán được thiết kế khác cơ sở dữ liệu tập trung. Do đó cần đối sánh các đặc trưng của cơ sở dữ liêu phân tán với cơ sở dữ liệu tập trung để thấy được lợi ích của cơ sở dữ. cáo thu hoạch Cơ Sở Dữ Liệu Nâng Cao Trang 11 Chương 2: Thiết kế cơ sở dữ liệu phân tán CHƯƠNG 2 :THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN 2.1 Các chiến lược thiết kế 2.1.1 Quá trình thiết kế từ trên xuống. 1 Chương 1: Khái quát về cơ sở dữ liệu phân tán CHƯƠNG 1: KHÁI QUÁT VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 1.1 Cơ sở dữ liệu tập trung Về cơ bản cơ sở dữ liệu (Database) là tập hợp dữ liệu được lưu trữ một cách