Cơ sở dữ liệu phân tán
VieBooksCh ơng 1: Tính u việt của CSDL phân tán: I/Khái niệm về CSDL phân tán:1/Định nghĩa CSDL phân tán:Định nghĩa : Một CSDL phân tán là một tập hợp dữ liệu mà về mặt logic tập dữ liệu này thuộc về một hệ thống, nhng đợc trải trên các vị trí khác nhau của một mạng máy tính.Có hai điểm quan trọng đợc nêu ra trong định nghĩa trên:-Phân tán: Dữ liệu không c trú trên một vị trí, điều này giúp chúng ta có thể phân một CSDL phân tán với một CSDL tập trung, đơn lẻ.-T ơng quan logic: Dữ liệu có một số các thuộc tính ràng buộc chúng với nhau, điều này giúp chúng ta có thể phân biệt một CSDL phân tán với một tập hợp CSDL cục bộ hoặc các tệp c trú tại các vị trí khác nhau trong một mạng máy tính.Thế nào là phân tán:Xử lý logic hoặc xử lý nguyên tố đợc phân tán.Phân tán theo chức năng: Nhiều chức năng của hệ thống máy tính có thể đợc uỷ thác cho các phần cứng hoặc phần mềm hoặc cả hai.Phân tán dữ liệu.Phân tán điều khiển. 2/Phân lớp các hệ thống tính toán phân tán: Trình độ mắc nối: Khoảng cách của các yếu tố xử lý đợc kết nối.Cấu trúc nối kết với nhauSự độc lập đối với nhau giữa các thành phần3/Kiến trúc cơ bản của CSDL phân tán:Đây không là kiến trúc tờng minh cho tất cả các CSDL phân tán, tuy vậy kiến trúc này thể hiện tổ chức của bất kỳ một CSDL phân tán nào.1 VieBooksSơ đồ tổng thểSơ đồ phân đoạnSơ đồ định vị Sơ đồ ánh xạ địa phương 2Sơ đồ ánh xạ địa phương 1DBMS của vị trí 1CSDL địa phương tại vị trí 1Các vị trí khác .DBMS của vị trí 2CSDL địa phương tại vị trí 2Hình 1.I.1 Kiến trúc cơ bản của CSDL phân tán-Sơ đồ tổng thể: Định nghĩa tất cả các dữ liệu sẽ đợc lu trữ trong CSDL phân tán. Trong mô hình quan hệ, sơ đồ tổng thể bao gồm định nghĩa của tập các quan hệ tổng thể. -Sơ đồ phân đoạn: Mỗi quan hệ tổng thể có thể chia thành một vài phần không gối lên nhau đợc gọi là đoạn (fragments). Có nhiều các khác nhau để thực hiện việc phân chia này. ánh xạ(một nhiều) giữa sơ đồ tổng thể và các đoạn đợc định nghĩa trong sơ đồ phân đoạn. -Sơ đồ định vị: các đoạn là các phần logic của quan hệ tổng thể đ-ợc định vị vật lý trên một hoặc nhiều vị trí trên mạng. Sơ đồ định vị định nghĩa đoạn nào định vị tại các vị trí nào. Lu ý rằng kiểu ánh xạ đợc định nghĩa trong sơ đồ định vị quyết định CSDL phân tán là d thừa hay không.-Sơ đồ ánh xạ địa ph ơng: ánh xạ các ảnh vật lý và các đối tợng đợc lu trữ tại một trạm (tất cả các đoạn của một quan hệ tổng thể trên cùng một vị trí tạo ra một ảnh vật lý). II/Các đặc điểm của CSDL phân tán đối ng ợc lại CSDL tập trung: -Điều khiển tập trung: Trong CSDL phân tán khái niệm này không đợc nhấn mạnh. Khả năng điều khiển tập trung phụ thuộc vào kiến trúc của CSDL phân tán. Trong CSDL phân tán có khả năng nhận biết cấu trúc điều khiển phân cấp dựa trên một ngời quản trị CSDL toàn cục (có trách nhiệm trên toàn thể CSDL phân tán), và các ngời quản trị CSDL cục bộ (có trách nhiệm trên CSDL cục bộ của chúng). Điều này nhấn mạnh rằng các ngời quản trị CSDL cục bộ có thể có trình độ tự trị cao. Các CSDL phân tán có thể rất khác nhau về trình độ tự trị: từ hoàn toàn tự trị không có bất cứ một hệ quản trị CSDL tập trung nào đến hầu nh hoàn toàn điều khiển tập trung. -Độc lập dữ liệu: Tổ chức thực sự của dữ liệu là trong suốt đối với các chơng trình ứng dụng. Các chơng trình đợc viết có một khung nhìn nhận 2 VieBooksthức (conceptual) đợc gọi là sơ đồ nhận thức. Lợi ích chủ yếu là chơng trình không bị ảnh hởng bởi những thay đổi tổ chức vật lý của dữ liệu. Trong CSDL phân tán, đọc lập dữ liệu cũng quan trọng nh trong CSDL truyền thống. Tuy nhiên, có một khái niệm mới nảy sinh có tên là trong suốt phân tán. Trong suốt phân tán có nghĩa là một chơng trình đợc viết (trên một CSDL phân tán) nh CSDL không đợc phân tán. Hay nói cách khác chơng không bị ảnh hởng bởi sự di chuyển dữ liệu từ một vị trí các sang vị trí khác, tuy nhiên tốc độ thực hiện của nó bị ảnh hởng. Độc lập dữ liệu đợc cung cấp trong CSDL truyền thống đợc cung cấp qua nhiều mức kiến trúc có sự mô tả về dữ liệu và ánh xạ giữa chúng khác nhau; các khái niệm: sơ đồ nhận thức, sơ đồ lu trữ, sơ đồ ngoài (external schema). Một cách tơng tự nh vậy, Trong suốt phân tán đạt đợc trong CSDL phân tán các mức và các sơ đồ mới: -Trong suốt phân đoạn: Các ứng dụng thực hiện các truy nhập vào CSDL nh nó không đợc phân tán. -Trong suốt định vị: Các ứng dụng phải xác định truy nhập vào đoạn nào của CSDL phân tán. Có thể truy nhập song song vào nhiều đoạn cùng một lúc để tận dụng khả năng song song của CSDL phân tán. -Trong suốt ánh xạ địa ph ơng: Các ứng dụng phải xác định truy nhập vào đoạn nào tại vị trí nào của CSDL phân tán.-Không trong suốt: Ngời lập trình ứng dụng phải viết các ch-ơng trình có thể chạy đợc trên hệ thống hệ quản trị CSDL địa phơng (DBMSs) đợc cài đặt tại vị trí ứng dụng cần đọc dữ liệu (trên các vị trí khác nhau các hệ điều hành có thể khác nhau, hoặc DBMSs có thể khác nhau: các bản dịch (release) khác nhau trong cùng một hệ thống, các hệ thống khác nhau trong cùng một kiểu- ví dụ các DBMSs khác nhau trong họ Codasyl -, các họ hệ thống khác kiểu- ví dụ một quan hệ và một hệ thống Codasyl -.), các chơng trình này thực hiện yêu cầu các hàm và cài đặt các chơng trình phụ trợ tại các vị trí đợc yêu cầu. ứng dụng phải đợc viết với một yêu cầu làm hoạt động các chơng trình phụ trợ ở xa này thay thế các lệnh SQL. -Giảm d thừa: Trong CSDL truyền thống d thừa đợc giảm tới mức có thể vì hai nguyên nhân sau: -Sự mâu thuẫn giữa một vài bản sao của cùng một dữ liệu đợc tự động tránh vì thực tế chỉ có một bản.-Tiết kiệm không gian lu trữ.Trong CSDL phân tán, có một vài nguyên nhân làm cho việc quan tâm đến sự d thừa dữ liệu nh một đặc điểm ao ớc: -Vị trí của các ứng dụng có thể đợc tăng nếu dữ liệu đợc sao bản tại tất cả các vị trí cần đến nó.3 VieBooks-Tính sẵn sàng của hệ thống có thể tăng vì nếu một vị trí lỗi không dừng việc thực hiện của các ứng dụng tại các vị trí khác nếu dữ liệu đ-ợc sao bản.Do đó, việc giảm d thừa đòi hỏi một sự ớc lợng định giá khá phức tạp. Và việc sao bản là tỉ lệ thuận với việc tăng số lợng thực hiện các truy nhập sửa đổi dữ liệu vì khi thực hiện một truy nhập sửa đổi trên một dữ liệu chúng ta đồng thời phải sửa đổi dữ liệu trên các sao bản của dữ liệu đó. -Cấu trúc vật lý phức tạp và việc truy nhập hiệu quả: Các cấu trúc truy nhập phức tạp, ví dụ nh các chỉ số (index) thứ hai, các chuỗi tệp có quan hệ với nhau (interfile chain) ., là mặt chủ yếu của CSDL truyền thống. Hỗ trợ các cấu trúc này là một phần hết sức quan trọng của hệ quản trị CSDL. Nguyên nhân cho việc cung cấp các cấu trúc truy nhập phức tạp là để thu đợc hiệu quả truy nhập vào dữ liệu. Trong CSDL phân tán các cấu trúc truy nhập phức tạp không là công cụ đúng cho hiệu quả truy nhập. Hiệu quả truy nhập CSDL phân tán không thể đợc cung cấp bởi các cấu trúc phức tạp các vị trí có quan hệ với nhau. -Tính toàn vẹn dữ liệu, khôi phục lại và điều khiển t ơng tranh: Trong CSDL, vấn đề toàn vẹn, khôi phục lại, và điều khiển tơng tranh, mặc dù là các vấn đề khác nhau song chúng có quan hệ qua lại chặt chẽ với nhau. Giải pháp cho các vấn đề này chủ yếu là việc cung cấp các giao tác (transaction). Khái niệm giao tác và vấn đề quản lý giao tác sẽ đề cập ở phần sau. -Biệt lập (Privacy) và bảo mật: Trong CSDL truyền thống, các ngời quản trị CSDL có điều khiển tập trung, có thể đảm bảo rằng chỉ một truy nhập đợc uỷ quyền đợc thực hiện. Lu ý rằng, dù sao, CSDL tập trunggần nh tự chính nó không với một thủ tục điều khiển đặc biệt nào, là nhiều nhợc điểm riêng biệt hơn và xâm phạm bảo mật hơn con đờng cũ dựa trên các tệp riêng lẻ. Trong CSDL phân tán, các ngời quản trị cục bộ thực chất đơng đầu với các vấn đề giống các ngời quản trị CSDL trong CSDL truyền thống. Dù sao, hai khía cạnh đặc biệt của CSDL phân tán đáng đợc đề cập đến:-Trong một CSDL phân tán với một trình độ tự quản của các vị trí rất cao, các ngời chủ dữ liệu địa phơng cảm giác đợc bảo vệ hơn vì họ có thể tự chủ các việc bảo vệ thay vì phụ thuộc vào ngời quản trị CSDL trung tâm.-Các vấn đề bảo mật là bản chất trong hệ phân tán nói chung, vì các mạng truyền thông có thể biểu hiện một điểm yếu với sự lu ý bảo vệ. 4 VieBooksIII/Tính u việt của CSDL phân tán: 1/Các lợi ích của CSDL phân tán:-Khả năng mau phục hồi (Resilience): Việc truy nhập dữ liệu không phụ thuộc vào một máy hay một đờng nối trên mạng. Nếu có bất kỳ một lỗi nào thì sau đó vài CSDL có thể đợc truy nhập trên các nút địa phơng, hơn nữa một lỗi trên đờng nối có thể tự động chọn đờng lại qua các đờng nối khác.-Giảm dòng dữ liệu trên đ ờng truyền_cải thiện thời gian trả lời: Cung cấp trả lời có bởi dữ liệu gần sát nơi các ngời sử dụng thờng xuyên dữ liệu.-Khung nhìn logic đơn cho các câu hỏi: Trong suốt định vị cho phép dữ liệu vật lý có thể đợc di chuyển mà không thay đổi ứng dụng hay thông báo cho ngời sử dụng.-Tự trị địa ph ơng: -Việc quản lý: Đợc quản lý một cách độc lập.-Việc tạo lập: Có các định nghĩa tạo lập và điều khiển có tính cục bộ.-Điều khiển truy nhập: Có quyền định nghĩa và điều khiển có tính cục bộ. -Giảm cạnh tranh (reduced politics): bằng cách trao vùng nghiệp vụ tự chủ cục bộ. -Cách thức mở rộng dễ dàng: Dễ dàng phát triển mở rộng đạt đợc:-Nhiều bộ xử có thể đợc thêm vào mạng. -Nhiều CSDL có thể đợc thêm vào trên một nút mạng.-Cập nhật phần mềm là độc lập với cấu trúc vật lý.2/Các bất lợi của CSDL phân tán:- Sự thiếu kinh nghiệm.- Phức tạp.- Giá cả: Nâng cấp phần cứng, phần mềm.- Sự phân tán trong điều khiển.- Bảo mật: Khó khăn hơn CSDL tập trung.- Khó khăn trong việc thay đổi: Hiện nay cha có các công cụ hoặc phơng pháp nào để trợ giúp ngời sử dụng chuyển đổi dữ liệu của họ từ CSDL tập trung sang CSDL phân tán. Nghiên cứu CSDL không thuần nhất và sự thống nhất CSDL đợc chờ đợi để giải quyết khó khăn này. 5 VieBooks3/Các nguyên nhân sử dụng CSDL phân tán:-Nguyên nhân về tổ chức và kinh tế: Trên thực tế nhiều tổ chức là không tập trung vì vậy CSDL phân tán là con đờng thích hợp với cấu trúc tự nhiên của các tổ chức đó. Với sự phát triển gần đây trong các kỹ thuật máy tính, cán cân kinh tế thúc đẩy có hệ lớn, các trung tâm máy tính trở lên đáng nghi ngại. Nguyên nhân về tổ chức và kinh tế là nguyên nhân hết sức quan trọng cho việc phát triển CSDL phân tán. -Sự liên kết các CSDL dang tồn tại: CSDL phân tán là giải pháp tự nhiên khi có các CSDL đang tồn tại và sự cần thiết thực hiện xây dựng một ứng dụng toàn cục. Trong trờng hợp này CSDL phân tán đợc tạo từ dới lên (bottom-up) từ các CSDL đã tồn tại trớc đó. Tiến trình này có thể đòi hỏi cấu trúc lại cục bộ ở một mức độ nhất định. Dù sao, những sửa đổi này là nhỏ hơn rất nhiều so với việc tạo lập một CSDL tập trung hoàn toàn mới. -Sự phát triển mở rộng: Các tổ chức có thể mở rộng bằng cách thêm các đơn vị mới, vừa có tính tự trị vừa có quan hệ tơng đối với các tổ chức khác. Khi đó con đờng CSDL phân tán hỗ trợ một sự mở rộng uyển chuyển với một mức độ ảnh hởng tối thiểu tới các đơn vị đang tồn tại. Với con đờng CSDL tập trung, cũng có thể khởi tạo kích thớc lớn cho việc mở rộng trong tơng lai. Điều đó rất khó tiên định và thực hiện với một phí tổn lớn, hoặc sự mở rộng này có ảnh hởng lớn không chỉ trên các ứng dụng mới mà còn trên các ứng dụng đang tồn tại. -Làm giảm tổng chi phí tìm kiếm: Trên thực tế nhiều ứng dụng cục bộ rõ ràng giảm tổng chi phí truyền thôngvới phơng diện một CSDL tập trung. Bởi vậy số tối đa các vị trí của các ứng dụng là một trong các mục đích chính trong thiết kế CSDL phân tán.-Sự quan tâm hiệu suất (Performance considerations): S tồn tại một vài bộ vi xử lý tự trị đa đến kết quả tăng hiệu suất thông qua một mức độ song song cao. Sự quan tâm này có thể chỉ có thể đợc ứng dụng cho một hệ thống đa xử lý không nhất thiết phải là một hệ CSDL phân tán. Dù sao, CSDL phân tán có lợi trong sự phân tán dữ liệu phản ánh các tiêu chuẩn phụ thuộc ứng dụng cái số tối đa vị trí các ứng dụng. Trong cách này sự gây trở ngại lẫn nhau giữa các bộ vi xử lý là tối thiểu. Trọng tải đợc chia sẻ giữa các bộ vi xử lý, và các tắc nghẽn nguy kịch, nh mạng truyền thông tự nó hoặc dịch vụ chung cho toàn bộ hệ thống là đợc tránh. Kết quả này là một hệ quả của đòi hỏi khả năng xử lý tự trị cho các ứng dụng cục bộ đã đợc phát biểu trong định nghĩa CSDL phân tán. -Tính tin cậy và tính sẵn sàng: Con đờng CSDL phân tán, đặc biệt với dữ liệu d thừa,nó cũng đợc sử dụng để đạt đợc một sự tin cậy và tính sẵn sàng cao hơn. Dù sao, việc thu đợc mục đích này không phải không rắc rối và đòi hỏi sử dụng các kỹ thuật vẫn cha đợc hiểu biết hoàn chỉnh. Khả năng xử lý tự trị của các vị trí khác nhau tự nó không đảm bảo một tính tin 6 VieBookscậy toàn bộ cao của hệ thống, nhng nó đảm bảo một thuộc tính graceful degration. Nói một cách khác, sự cố trong CSDL phân tán có thể thờng xuyên hơn một CSDL tập trung vì có số lợng thành phần lớn hơn, nhng hậu quả của sự cố đợc hạn chế tới các ứng dụng sử dụng dữ liệu của vị trí có sự cố, và đổ vỡ hoàn toàn của hệ thống là hiếm xảy ra.Chơng 2: Các kỹ thuật sử dụng trong cơ sở dữ liệu phân tán:I/Thiết kế cơ sở dữ liệu phân tán: Thiết kế một hệ thống máy tính phân tán là việc quyết định sắp đặt dữ liệu và chơng trình tới các trạm làm việc của mạng máy tính. Trong trờng hợp thiết kế DBMSs có hai vấn đề chính là:- Sự phân bố dữ liệu của DBMS.- Sự phân bố các chơng trình ứng dụng chạy trên nó.1/Tổ chức của hệ thống CSDL phân tán:Giả thiết có một mạng máy tính đã đợc thiết kế. Ta chỉ quan tâm đến việc thiết kế dữ liệu phân tán. Tổ chức của các hệ thống phân tán đợc nghiên cứu theo 3 chiều trực giao sau:-Tầng chia xẻ.-mô hình truy nhập.-Mức hiểu biết.Trong giới hạn của chiều chia xẻ có ba khả năng sau cho dữ liệu và chơng trình:-Không chia xẻ: Mỗi ứng dụng và dữ liệu của nó thực hiện tại một vị trí, không có sự liên lạc với một chơng trình hoặc truy nhập tới một file dữ liệu tại những vị trí khác.-Chia xẻ dữ liệu: Các chơng trình phân phối đợc tại tất cả các vị trí, nhng file dữ liệu thì không nh vậy, nó vẫn chỉ đợc thực hiện tại một vị trí.-Chia xẻ dữ liệu và chơng trình: Cả dữ liệu và chơng trình đều có thể đợc chia xẻ, nghĩa là một chơng trình từ một vị trí có thể yêu cầu một dịch vụ từ chơng trình khác tại vị trí khác, trong khi quay trở lại có thể phải truy nhập một file dữ liệu đợc xác định tại vị trí thứ ba.7 VieBooks K iểu tru y nhậ pC h ia xẻM ứ c h iểubiếtT ĩn hD ữ liệu +C h ư ơn g trìn hD ữ liệuT ừ ngph ầnĐ ầy đủĐ ộ ngH ìn h 2 .I.1 T ổ ch ức củ a H ệ C S D L ph ân tán Mô hình truy nhập: Các yêu cầu truy nhập dữ liệu của ngời sử dụng có thể là tĩnh (không thay đổi theo thời gian) hoặc động. Rõ ràng thiết kế và quản lí các môi trờng tĩnh dễ hơn nhiều so với việc thiết kế và quản lí các hệ thống phân tán động. Dọc theo chiều này quan hệ giữa thiết kế CSDL phân tán và xử lý câu hỏi đã đợc thiết lập. Mức hiểu biết: Mức hiểu biết về c xử mô hình truy nhập. Có một khả năng lý thuyết là các ngời thiết kế không có bất kỳ thông tin ngời user truy nhập vào CSDL nh thế nào.2/Khung làm việc chung cho thiết kế hệ CSDL phân tán:Từ sơ đồ kiến trúc của Hệ CSDL phân tán, ngời ta đa ra sơ đồ thiết kế chung cho Hệ CSDL phân tán nh sau:Thiết kế lợc đồ quan niệm: Mô tả toàn bộ dữ liệu sẽ đ-ợc dùng trong ứng dụng. Thiết kế CSDL vật lí: Là quá trình thực hiện ánh xạ lợc đồ quan niệm vào các vùng chứa và xác định cách thức truy nhập thích hợp cho chúng. Thiết kế phân đoạn: Thực hiện việc phân chia dữ liệu thành các phần, kèm theo cách thức truy nhập thích hợp.Thiết kế sự phân phối các phần: Các đoạn dữ liệu đợc đa vào các vị trí lu trữ thích hợp với yêu cầu hoạt động thực tế của hệ thống.Ví dụ: Ta không thể đa dữ liệu về CANBO cho phòng quản lý Sinh Viên và ngợc lại. 8 VieBooksThiết kế các lược đồ quan niệmThiết kế CSDL vật líThiết kế phân đoạnThiết kế sự phân phối các thành phầnHình 2.I.2Đối với các ứng dụng của CSDL phân tán cần chú ý:-Vị trí mà ứng dụng đợc đa ra.-Điều khiển sự hoạt hoá của ứng dụng. Trong phơng pháp chung thì ứng dụng có thể đợc đa ra tại nhiều vị trí, chúng ta phải điều khiển sự hoạt hoá của ứng dụng tại mỗi vị trí.-Thống kê phân tán các ứng dụng.3/Các chiến lợc thiết kế hệ CSDL phân tán:Theo khung làm việc chung cho thiết kế hệ CSDL phân tán, đến nay có hai phơng pháp chính là: TOP-DOWN và BOTTOM-UP. a.Phơng pháp TOP-DOWN:TOP-DOWN: Là phơng pháp thiết kế từ trên xuống và đợc chia ra làm nhiều giai đoạn, mỗi giai đoạn đều có nhiệm vụ riêng, giai đoạn này nối tiếp giai đoạn kia, đầu ra của giai đoạn trớc đợc làm đầu vào cho giai đoạn kế tiếp sau nó. Quá trình thiết kế hệ theo phơng pháp TOP-DOWN bao gồm các bớc sau:Các định nghĩa: Định nghĩa môi trờng hệ thống, dữ liệu và các tiến trình cho tất cả những khả năng về dữ liệu của ngời sử dụng. Tài liệu về những điều kiện cần thiết nằm trong hai tham số: Thiết kế View và Thiết kế mức quan niệm.Thiết kế View: Hoạt động phân phối với sự định nghĩa những cái chung cho ngời sử dụng.Thiết kế mức quan niệm: Là một tiến trình kiểm tra và xác định rõ hai nhóm quan hệ Phân tích thực thể và Phân tích chức năng:9 VieBooks-Phân tích thực thể: Liên quan tới sự xác định các loại thực thể, các thuộc tính và các mối quan hệ giữa chúng.-Phân tích chức năng: Xác định các chức năng cơ sở.Lợc đồ tổng thể mức quan niệm, mẫu truy nhập thông tin và External Schema Definition: Tập hợp kết quả của các bớc trên, xắp xếp các thực thể trên các vị trí của hệ thống phân tán và chuyển tới bớc tiếp theo.User InputCác yêu cầu về phân tíchCác yêu cầu hệ thốngThiết kế mức quan niệm Thiết kế viewLược đồ tổng thểmức quan niệmTruy nhập thông tinCác định nghĩasơ đồ ngoàiThiết kế phân tánLược đồ mức quan niệm địa phươngThiết kế vật lýLược đồ vật lýQuan sát và kiểm traFeedbackFeedbackTập hợp các viewUserinputHình 2.I.3 Sơ đồ thiết kế CSDL phân tán theo mô hình TOP-DOWNThiết kế phân tán: Thiết kế phân tán bao gồm hai phần phân đoạn và định vị CSDL. Lợc đồ mức quan niệm: Tạo ra các lợc đồ CSDL mức quan niệm.10 [...]... CSDL phân tán: I/Khái niệm về CSDL phân tán: 1/Định nghĩa CSDL phân tán: Định nghĩa : Một CSDL phân tán là một tập hợp dữ liệu mà về mặt logic tập dữ liệu này thuộc về một hệ thống, nhng đợc trải trên các vị trí khác nhau của một mạng máy tính. Có hai điểm quan trọng đợc nêu ra trong định nghĩa trên: -Phân tán: Dữ liệu không c trú trên một vị trí, điều này giúp chúng ta có thể phân một CSDL phân tán. .. cả hai. Phân tán dữ liệu. Phân tán điều khiển. 2 /Phân lớp các hệ thống tính toán phân tán: Trình độ mắc nối: Khoảng cách của các yếu tố xử lý đợc kÕt nèi. CÊu tróc nèi kÕt víi nhau Sù ®éc lËp ®èi với nhau giữa các thành phần 3/Kiến trúc cơ bản của CSDL phân tán: Đây không là kiến trúc tờng minh cho tất cả các CSDL phân tán, tuy vậy kiến trúc nµy thĨ hiƯn tỉ chøc cđa bÊt kú mét CSDL phân tán nào. 1 ... tán với một CSDL tập trung, đơn lẻ. -T ơng quan logic: Dữ liệu có một số các thuộc tính ràng buộc chúng với nhau, điều này giúp chúng ta có thể phân biệt một CSDL phân tán với một tập hợp CSDL cục bộ hoặc các tệp c trú tại các vị trí khác nhau trong một mạng máy tính. Thế nào là phân tán: Xử lý logic hoặc xử lý nguyên tố đợc phân tán. Phân tán theo chức năng: Nhiều chức năng của hệ thống máy tính... CSDL phân tán nh sau: Thiết kế lợc đồ quan niệm: Mô tả toàn bộ dữ liệu sẽ đ- ợc dùng trong ứng dụng. Thiết kế CSDL vật lí: Là quá trình thực hiện ánh xạ lợc đồ quan niệm vào các vùng chứa và xác định cách thức truy nhập thích hợp cho chúng. Thiết kế phân đoạn: Thực hiện việc phân chia dữ liệu thành các phần, kèm theo cách thức truy nhập thích hợp. Thiết kế sự phân phối các phần: Các đoạn dữ liệu. .. hiện của các ứng dụng tại các vị trí khác nếu dữ liệu đ- ợc sao bản. Do đó, việc giảm d thừa đòi hỏi một sự ớc lợng định giá khá phức tạp. Và việc sao bản là tỉ lệ thuận với việc tăng số lợng thực hiện các truy nhập sửa đổi dữ liệu vì khi thực hiện một truy nhập sửa đổi trên một dữ liệu chúng ta đồng thời phải sửa đổi dữ liệu trên các sao bản của dữ liệu đó. -Cấu trúc vật lý phức tạp và việc truy... lí các hệ thống phân tán động. Dọc theo chiều này quan hệ giữa thiết kế CSDL phân tán và xử lý câu hỏi đà đợc thiết lập. Mức hiểu biết: Mức hiểu biết về c xử mô hình truy nhập. Có một khả năng lý thuyết là các ngêi thiÕt kÕ kh«ng cã bÊt kú th«ng tin ngêi user truy nhËp vµo CSDL nh thÕ nµo. 2/Khung lµm viƯc chung cho thiết kế hệ CSDL phân tán: Từ sơ đồ kiến trúc của Hệ CSDL phân tán, ngời ta đa... cung cÊp c¸c cÊu tróc truy nhËp phøc tạp là để thu đợc hiệu quả truy nhập vào dữ liệu. Trong CSDL phân tán các cấu trúc truy nhập phức tạp không là công cụ đúng cho hiệu quả truy nhập. Hiệu quả truy nhập CSDL phân tán không thể đợc cung cấp bởi các cấu trúc phức tạp các vị trí có quan hệ với nhau. -Tính toàn vẹn dữ liệu, khôi phục lại và điều khiển t ơng tranh: Trong CSDL, vấn đề toàn vẹn, khôi... mật hơn con đờng cũ dựa trên các tệp riêng lẻ. Trong CSDL phân tán, các ngời quản trị cục bộ thực chất đơng đầu với các vấn đề giống các ngời quản trị CSDL trong CSDL truyền thống. Dù sao, hai khía cạnh đặc biệt của CSDL phân tán đáng đợc đề cập đến: -Trong một CSDL phân tán với một trình độ tự quản của các vị trí rất cao, các ngời chủ dữ liệu địa phơng cảm giác đợc bảo vệ hơn vì họ có thể tự chủ... quan đến việc liên kết giữa bộ lập lịch và bộ xử lý dữ liệu. Khi một thao tác đợc chấp nhận đợc đi tiếp tới bộ xử lý dữ liệu, bộ lập lịch cần giữ lại việc gửi một thao tác không phù hợp khác, nhng thao tác có thể đợc chấp nhận đối với bộ xử lý dữ liệu đến khi thao tác đầu tiên đợc xử lý và đợc báo nhận. Có một yêu cầu để đảm bảo bộ xử lý dữ liệu thực hiƯn c¸c thao t¸c trong mét thø tù gièng thø... nhìn mức nhất quán 3 nếu: T không ghi đè dữ liệu nháp của giao tác khác T không chuyển giao bất cứ một việc ghi nào đến khi nó hoàn thành hoàn toàn việc ghi của nó (đến khi kết thúc giao tác EOT). T không đọc dữ liệu nháp từ các giao tác khác. Các giao tác khác không nháp vào bất cứ dữ liệu nào đọc bởi T trớc khi T hoàn thành. Mức 2: T không ghi đè lên dữ liệu nháp của giao tác khác. T không chuyển . dụng trong cơ sở dữ liệu phân tán: I/Thiết kế cơ sở dữ liệu phân tán: Thiết kế một hệ thống máy tính phân tán là việc quyết định sắp đặt dữ liệu và chơng. CSDL phân tán: I/Khái niệm về CSDL phân tán: 1/Định nghĩa CSDL phân tán: Định nghĩa : Một CSDL phân tán là một tập hợp dữ liệu mà về mặt logic tập dữ liệu