Điều khiển tương tranh trong cơ sở dữ liệu phân tán

37 923 12
Điều khiển tương tranh trong cơ sở dữ liệu phân tán

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

MỤC LỤC CHƢƠNG I TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 1.1.CƠ SỞ DỮ LIỆU PHÂN TÁN 1.1.1 Khái niệm 1.1.2 Lợi điểm Hệ sở liệu phân tán 1.2.QUẢN TRỊ CƠ SỞ DỮ LIỆU PHÂN TÁN CHƢƠNG II QUẢN TRỊ TƢƠNG TRANH 2.1 MÔ HÌNH XỬ LÍ GIAO TÁC 2.1.1 Các định nghĩa 2.1.2 Mô hình xử lý giao tác tập trung 2.1.3 Mô hình xử lý giao tác phân tán 10 2.2 PHÂN TÍCH BÀI TOÁN ĐIỀU KHIỂN TƢƠNG TRANH 11 2.2.1 Tính khả 13 2.2.2 Mô hình điều khiển tương tranh 15 2.2.3 Thời gian nhãn thời gian CSDL phân tán 16 2.3 CÁC KỸ THUẬT ĐIỂU KHIỂN TƢƠNG TRANH 17 2.3.1 Các kỹ thuật đồng hóa dựa khóa hai pha 17 2.3.2 Quá trình thực 2PL 18 2.3.3 Kỹ thuật 2PL chép 18 2.3.4 Kỹ thuật 2PL biểu 19 2.3.5 Kỹ thuật 2PL tập trung 19 2.3.6 Phát ngăn chặn tắc nghẽn 20 2.4 CÁC KỸ THUẬT ĐỒNG BỘ HÓA DỰA TRÊN TRẬT TỰ NHÃN THỜI GIAN 24 2.4.1 Sự thực T/O 24 2.4.2 Luật ghi Thomas 26 2.4.3 Đa phiên T/O 26 2.4.2 Luật ghi Thomas 29 2.4.3 Đa phiên T/O 29 2.4.4 Duy trì T/O 31 2.4.5 Quản lý nhãn thời gian 31 2.5 DC-ROLL 32 2.5.1 ROLL (Request Order Linked List ) 33 2.5.2 Kiến trúc chu trình liệu gốc 35 2.5.3 DC-ROLL 36 Cơ sở liệu phân tán – Điều khiển tương tranh CHƯƠNG I TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 1.1.CƠ SỞ DỮ LIỆU PHÂN TÁN 1.1.1 Khái niệm Vì yêu cầu công ty, doanh nghiệp, đơn vị kinh doanh vấn đề tổ chức cho kinh doanh có hiệu nắm bắt thông tin nhanh sở công ty địa điểm xa xây dựng hệ thống làm việc sở liệu phân tán phù hợp xu hƣớng hệ thống thoả mãn đƣợc yêu cầu tổ chức đơn vị Lợi điểm tổ chức kỹ thuật xu hƣớng phát triển sở liệu phân tán là: giải đƣợc hạn chế sở liệu tập trung phù hợp xu hƣớng phát triển tự nhiên với cấu không tập trung tổ chức, công ty doanh nghiệp Nói tóm lại, sở liệu (CSDL) phân tán tập hợp liệu, mà mặt logic tập hợp thuộc hệ thống, nhƣng mặt vật lý liệu đƣợc trải vị trí khác mạng máy tính Nhƣ có hai vấn đề sở liệu phân tán với tầm quan trọng tƣơng đƣơng nhau: Việc phân tán : Trong thực tế liệu không đặt vị trí đặc điểm để phân biệt sở liệu phân tán với sở liệu tập trung sở liệu đơn lẻ Liên quan logic : Trong sở liệu phân tán, liệu có số đặc tính liên kết chặt chẽ với nhƣ tính kết nối, tính liên quan logíc Trong sở liệu tập trung, vị trí quản lý sở liệu ngƣời sử dụng phải truy cập đến sở liệu vị trí khác để lấy thông tin tổng hợp 1.1.2 Lợi điểm Hệ sở liệu phân tán Có nhiều nguyên nhân để phát triển sở liệu phân tán nhƣng trung lại gồm điểm sau đây: Lợi điểm tổ chức tính kinh tế:tổ chức phân tán nhiều chi nhánh dùng sở liệu phân tán phù hợp với tổ chức kiểu Với vai trò động lực thúc đẩy kinh tế thƣơng mại phát triển rộng hơn, việc phát triển trung tâm máy tính phân tán nhiều vị trí trở thành nhu cầu cần thiết Đồng Văn Toàn – Lớp HTTT & TT - KS CLC K53 Page Cơ sở liệu phân tán – Điều khiển tương tranh Tận dụng sở liệu sẵn có: Hình thành sở liệu phân tán từ sở liệu tập trung có sẵn vị trí địa phƣơng Thuận lợi cho nhu cầu phát triển: Xu hƣớng dùng sở liệu phân tán cung cấp khả phát triển thuận lợi giảm đƣợc xung đột chức đơn vị tồn giảm đƣợc xung đột chƣơng trình ứng dụng truy cập đến sở liệu Với hƣớng tập trung hoá, nhu cầu phát triển tƣơng lai gặp khó khăn Giảm chi phí truyền thông: Trong sở liệu phân tán chƣơng trình ứng dụng đặt địa phƣơng giảm bớt đƣợc chi phí truyền thông thực cách khai thác sở liệu chỗ Tăng số công việc thực hiện:Hệ sở liệu phân tán tăng số lƣợng công việc thực qua áp dụng nguyên lý xử lý song song với hệ thống xử lý đa nhiệm Tuy nhiên sở liệu phân tán có tiện lợi việc phân tán liệu nhƣ tạo chƣơng trình ứng dụng phụ thuộc vào tiêu chuẩn mở rộng vị trí làm cho nơi xử lý hỗ trợ lẫn Do tránh đƣợc tƣợng tắc nghẽn cổ chai mạng truyền thông dịch vụ thông thƣờng toàn hệ thống Tính dễ hiểu sẵn sàng: Hƣớng phát triển sở liệu phân tán nhằm đạt đƣợc tính dễ hiểu tính sẵn sàng cao Tuy nhiên để đạt đƣợc mục tiêu dễ làm đòi hỏi sử dụng kỹ thuật phức tạp Khả xử lý tự trị điểm làm việc khác không đảm bảo tính dễ sử dụng Hai nguyên nhân mặt kỹ thuật đáp ứng cho phát triển hệ sở liệu phân tán: - Công nghệ tạo máy tính nhỏ tảng phần cứng có khả phục vụ xây dựng hệ thống thông tin phân tán - Kỹ thuật thiết kế hệ sở liệu phân tán đƣợc phát triển vững dựa hai kỹ thuật thiết kế Top-down Bottom-up từ năm thập kỷ 60 Kỹ thuật thiết kế sở liệu phân tán phức tạp nhƣng hệ sở liệu phân tán cần thiết cho xu hƣớng phát triển kinh tế 1.2.QUẢN TRỊ CƠ SỞ DỮ LIỆU PHÂN TÁN Hệ quản trị sở liệu phân tán cung cấp công cụ nhƣ tạo lập quản lý sở liệu phân tán Phân tích đặc điểm hệ thống quản trị sở liệu phân tán nhƣ dƣới để phân biệt hệ thống phát triển theo kiểu thƣơng mại có sẵn kiểu mẫu phân tán Hệ thống phát triển theo kiểu thƣơng mại có sẵn đƣợc phát triển Đồng Văn Toàn – Lớp HTTT & TT - KS CLC K53 Page Cơ sở liệu phân tán – Điều khiển tương tranh ngƣời cung cấp hệ sở liệu tập trung Hệ sở liệu tập trung mở rộng cách thêm vào phần bổ xung qua cách cung cấp thêm đƣờng truyền điều khiển hệ quản trị sở liệu tập trung cài đặt điểm khác mạng máy tính Những phần mềm cần thiết cho việc xây dựng sở liệu phân tán là: Phần quản lý sở liệu ( Database Management -DB ) Phần truyền thông liệu (Data Communication - DC) Từ điển liệu đƣợc mở rộng để thể thông tin phân tán liệu mạng máy tính (Data Dictionary - DD) Phần sở liệu phân tán (Distributed Database DDB) Mô hình thành phần hệ quản trị sở liệu phát triển theo kiểu thƣơng mại (Truy cập từ xa trực tiếp) Những dịch vụ hệ quản trị sở liệu cung cấp: - Cách thức truy cập liệu từ xa: chƣơng trình ứng dụng - Lựa chọn cấp độ suốt phân tán thích hợp:cho phép mở rộng hệ thống theo nhiều cách khác theo hoàn cảnh (phải cân nhắc cấp độ suốt phân tán phân chia công việc thực để công việc quản trị hệ thống đơn giản hơn) - Quản trị điều khiển sở liệu bao gồm công cụ quản lý sở liệu, tập hợp thông tin thao tác sở liệu cung cấp thông tin tổng thể file liệu đặt nơi hệ thống Đồng Văn Toàn – Lớp HTTT & TT - KS CLC K53 Page Cơ sở liệu phân tán – Điều khiển tương tranh - Điều khiển tƣơng tranh điều khiển hồi phục liệu giao tác phân tán Cách thức truy cập sở liệu từ xa qua chƣơng trình ứng dụng theo hai cách bản: Truy cập từ xa trực tiếp gián tiếp Hình 1.2 Mô hình truy cập từ xa qua phương thức sở hệ quản trị sở liệu Theo mô hình trực tiếp trên, chƣơng trình ứng dụng đƣa yêu cầu truy cập đến sở liệu từ xa, yêu cầu đƣợc hệ quản trị sở liệu tự động tìm nơi đặt liệu thực yêu cầu điểm Kết đƣợc trả lại cho chƣơng trình ứng dụng Đơn vị chuyển đổi hai hệ trị sở liệu phƣơng thức truy cập sở liệu kết nhận đƣợc (thông qua việc thực phƣơng thức truy cập này) Mô hình dƣới mô tả cách thức truy cập phức tạp (truy cập gián tiếp): Theo mô hình truy cập này, chƣơng trình ứng dụng thực yêu cầu qua chƣơng trình phụ điểm khác Chƣơng trình phụ đƣợc ngƣời lập trình ứng dụng viết để truy cập từ xa đến sở liệu trả kết chƣơng trình ứng dụng yêu cầu Đồng Văn Toàn – Lớp HTTT & TT - KS CLC K53 Page Cơ sở liệu phân tán – Điều khiển tương tranh CHƯƠNG II QUẢN TRỊ TƯƠNG TRANH Điều khiển tƣơng tranh hoạt động kết hợp truy xuất đồng thời vào hệ quản trị sở liệu đa ngƣời dùng Điều khiển tƣơng tranh cho phép nhiều ngƣời dùng truy xuất vào sở liệu lại làm cho ngƣời sử dụng có cảm tƣởng nhƣ có họ thao tác sở liệu riêng biệt Khó khăn ngăn chặn việc cập nhật sở liệu ngƣời dùng sở liệu đƣợc cập nhật ngƣời khác Vấn đề điều khiển tƣơng tranh vấn đề quan trọng hệ quản trị sở liệu phân tán vì: (1) Tại thời điểm có nhiều ngƣời sử dụng truy xuất liệu lƣu trạm khác hệ phân tán; (2) Một chế điều khiển tƣơng tranh máy tính biết đƣợc tƣơng tác máy tính khác Điều khiển tƣơng tranh đƣợc nghiên cứu nhiều năm qua, hệ quản trị sở liệu tập trung toán đƣợc giải tốt Một lý thuyết toán học đƣợc phát triển để phân tích vấn đề điều khiển tƣơng tranh sở đƣa phƣơng pháp chuẩn để giải điều này, phƣơng pháp “khóa hai pha” (two- phase locking) Những nghiên cứu gần điều khiển tƣơng tranh sở liệu tập trung tập trung vào việc cải tiến khóa hai pha với mong muốn hệ thống đạt đƣợc điều tối ƣu vấn đề Đối với điều khiển tƣơng tranh môi trƣờng phân tán phức tạp nhiều Hơn 20 thuật toán điều khiển tƣơng tranh đƣợc đƣa vài thuật toán số đƣợc sử dụng Những thuật toán thƣờng phức tạp, khó hiểu, khó chứng minh tính đắn (thực tế có nhiều thuật toán không xác) Vì chúng đƣợc mô tả nhiều thuật ngữ khác tạo nên giả định khác môi trƣờng hệ quản trị sở liệu phân tán bản, nên khó để so sánh thuật toán với nhau, chí lĩnh vực định lƣợng Thực tế tác giả cho phƣơng pháp họ tốt nhất, nhƣng có chứng thuyết phục ý kiến Trong chƣơng làm quen với số thuật ngữ chuẩn để mô tả thuật toán điều khiển tƣơng tranh môi trƣờng hệ quản trị sở liệu phân tán mô hình chuẩn cho môi trƣờng Bài toán điều khiển tƣơng tranh đƣợc tách làm hai toán đồng hóa đọc-ghi ghi- ghi Mọi thuật toán điều khiển tƣơng tranh phải bao gồm hai thuật toán để giải hai toán Bƣớc nhằm mục đích hiểu thuật toán điều khiển tƣơng tranh tách biệt với thuật toán toán Thực ra, thuật toán đƣợc thuật toán điều khiển tƣơng tranh hệ quản trị sở liệu phân tán dùng với hai ký thuật chính: khóa hai pha thứ tự nhãn thời gian Đồng Văn Toàn – Lớp HTTT & TT - KS CLC K53 Page Cơ sở liệu phân tán – Điều khiển tương tranh 2.1 MÔ HÌNH XỬ LÍ GIAO TÁC Để hiểu thuật toán điều khiển tƣơng tranh hoạt động nhƣ nào, trƣớc hết phải hiểu xem thuật toán tác động lên toàn sở liệu phân tán nhƣ 2.1.1 Các định nghĩa Thông thƣờng trạm hệ phân tán máy tính chạy hai module phần mềm: quản lý giao tác (TM-Transaction Management) quản lý liệu (DT-Data Management) Các TM quản lý mối tƣơng tác ngƣời dùng hệ quản trị sở liệu phân tán (DDBMS) DM quản lý sở liệu Để dễ dàng trình bày định nghĩa liên quan đến TM DM giả sử rằng, mạng hệ thống giao tiếp máy tính, có độ tin cậy tuyệt đối, nghĩa là: trạm A gửi thông điệp tới trạm B trạm B đƣợc đảm bảo nhận đƣợc thông điệp mà lỗi, đồng thời việc phân phối thông điệp tới trạm theo thứ tự mà chúng đƣợc gửi Dƣới góc độ ngƣời sử dụng, sở liệu bao gồm tập mục liệu logic kí hiệu X, Y, Z Trạng thái sở liệu logic định giá trị đến mục liệu logic sở liệu Mỗi mục liệu logic đƣợc lƣu DM hệ thống dƣ thừa vài DM Một đƣợc lƣu trữ mục liệu logic đƣợc gọi “mục liệu lƣu trữ”, X kí hiệu x1,…, xm kí hiệu x đề đến mục liệu lƣu trữ Trạng thái sở liệu lƣu trữ định giá trị tới mục liệu lƣu trữ sở liệu Ngƣời dùng tƣơng tác với DDBMS thông qua giao tác thực thi Các giao tác truy vấn trực tuyến biểu diễn ngôn ngữ truy vấn độc lập chƣơng trình ứng dụng đƣợc viết ngôn ngữ lập trình đa Tập đọc logic (logical Readset) tập ghi logic (logical writeset) giao tác tập mục liệu logic mà giao tác đọc, ghi sử dụng Tƣơng tự, tập đọc lƣu trữ (stored readset), tập ghi lƣu trữ (stored writeset) tập mục liệu lƣu trữ mà giao tác đọc, ghi sử dụng Độ xác thuật toán điều khiển tƣơng tranh đƣợc định nghĩa liên quan tới việc ngƣời sử dụng muốn biết rõ thực thi giao tác Có hai tiêu chuẩn liên quan đến vấn đề này: (1) Ngƣời dùng mong muốn giao tác đƣợc báo cho hệ thống biết đƣợc thực hiện; (2) Ngƣời dùng mong việc tính toán đƣợc thực giao tác nhƣ cho dù thực thi hệ thống chuyên dụng hay song song với giáo tác khác hệ thống đa chƣơng trình Đây vấn đề điều khiển tƣơng tranh Đồng Văn Toàn – Lớp HTTT & TT - KS CLC K53 Page Cơ sở liệu phân tán – Điều khiển tương tranh Một DDBMS gồm bốn thành phần (hình 2.1): giao tác, TM, DM liệu Các giao tác kết nối với TM, TM kết nối với DM DM quản lý liệu (các TM không kết nối với TM khác, DM không kết nối với nhau) Chức TM quản lý giao tác Mỗi giao tác đƣợc thực thi DDBMS dƣới giám sát TM, nghĩa giao tác chuyển thao tác sở liệu tới TM Mọi tính toán phân tán cần thiết để thực thi giao tác đƣợc quản lý bới TM Hình 2.1: Kiến trúc hệ thống DDBMS Bốn loại thao tác đƣợc định nghĩa giao diện giao tác-TM là: READ(X): trả lại giá trị X trạng thái sở liệu logic hành WRITE(X-new value): tạo trạng thái sở liệu logic X đƣợc gán giá trị new-value BEGIN: bắt đầu tính toán END: kết thúc giao tác Chức DM quản lý sở liệu lƣu trữ Để trả lời yêu Đồng Văn Toàn – Lớp HTTT & TT - KS CLC K53 Page Cơ sở liệu phân tán – Điều khiển tương tranh cầu từ giao tác, TM phát lệnh tới DM có chứa mục liệu lƣu trữ cần thiết để đọc ghi vào mục liệu liên quan 2.1.2 Mô hình xử lý giao tác tập trung Một hệ quản trị sở liệu tập trung bao gồm mô đun quản lý giao tác (TM-Transaction Manager) mô đun quản lý liệu (DM- Data manager) xử lý nơi khác Một giao tác T truy cập hệ quản trị sở liệu cách phát thao tác BEGIN, READ, WRITE END, thao tác đƣợc xử lý nhƣ sau BEGIN: Module quản lý giao tác TM khởi tạo không gian làm việc cá nhân cho giao tác T, không gian có chức nhƣ nhớ đệm tạm thời lƣu trữ giá trị đọc ghi vào sở liệu READ(X): TM tìm X không gian làm việc T Nếu tồn tại, giá trị trả lại cho T Ngƣợc lại, TM phát tín hiệu đọc(X) tới sở liệu để lấy X từ sở liệu, sau gán giá trị vừa lấy cho T đƣa vào không gian làm việc T WRITE(X, new value): TM kiểm tra lại không gian làm việc riêng X Nếu tồn tại, giá trị X đƣợc cập nhật cho giá trị Ngƣợc lại, X với giá trị đƣợc tạo không gian làm việc Giá trị X không đƣợc lƣu sở liệu thời điểm END: TM phát lệnh dm-write(X) cho mục liệu logic X đƣợc cập nhật T Mỗi lệnh dm-write(X) yêu cầu module quản lý liệu cập nhật giá trị X sở liệu đƣợc lƣu giá trị X không gian làm việc T Khi tất lệnh dm-write đƣợc thực hiện, giao tác T kết thúc trình xử lý không gian làm việc riêng đƣợc xóa Hệ quản trị sở liệu khởi tạo lại T trƣớc trình xử lý lệnh dm-write Tác dụng việc khởi tạo lại T xóa không gian làm việc riêng thực lại giao tác T từ đầu Rất nhiều thuật toán điều khiển tƣơng tranh sử dụng thao tác khởi động lại nhƣ cách để làm hoạt động giao tác Tuy nhiên, lệnh dm-write đơn đƣợc xử lý, T không đƣợc khởi động lại Mỗi lệnh dm-write cài đặt cách cố định việc cập nhật vào sở liệu không đƣợc phép tác động đến phần giao tác Một hệ quản trị sở liệu phân tán tránh kết phần nhƣ cách sử dụng thuộc tính nguyên tố, thuộc tính yêu cầu thuộc tính khác lệnh dm-write giao tác có đƣợc thực thi hay không Thao tác chuẩn thuộc tính nguyên tố thủ tục gọi cam kết hai pha Giả sử T cập nhật hai mục liệu X Y Khi T phát lệnh END giai đoạn cam kết hai pha bắt đầu, DM đƣa yêu cầu ghi X Y Những lệnh yêu cầu DM chép liệu X Y từ không gian làm vệc riêng Đồng Văn Toàn – Lớp HTTT & TT - KS CLC K53 Page Cơ sở liệu phân tán – Điều khiển tương tranh T vào nơi lƣu trữ an toàn Nếu hệ quản trị sở liệu bị treo giai đoạn đầu tiên, thiệt hại kho liệu, kể từ cập nhật T đƣợc ghi nhận vào kho lƣu trữ sở liệu Trong suốt giai đoạn thứ hai, TM phát lệnh dm-write X Y, yêu cầu DM chép giá trị X Y vào kho liệu Nếu hệ quản trị sở liệu bị treo suốt giai đoạn thứ hai, sở liệu chứa thông tin không đúng, nhƣng giá trị X Y đƣợc lƣu kho lƣu trữ an toàn, mâu thuẩn đƣợc khắc phục cách khôi phục lại hệ thống: thủ tục khôi phục lại đọc giá trị X Y từ nơi lƣu trữ an toàn khôi phục lại cam kết Chú ý mô hình toán học trình xử lý giao tác, ƣớc lƣợng chức thực hệ quản trị sở liệu Trong chi tiết hoạt động nguyên tố cam kết quan trọng việc thiết kế hệ quản trị sở liệu, nhƣng chúng chi tiết trọng tâm để hiểu điều khiển tƣơng tranh Để giải thích thuật toán điều khiển tƣơng tranh, cần mô hình xử lý giao tác với nguyên tố cam kết nhìn thấy đƣợc, nhƣng không bao quát 2.1.3 Mô hình xử lý giao tác phân tán Mô hình xử lý giao tác môi trƣờng phân tán khác với môi trƣờng tập trung hai điểm: điều khiển không gian làm việc riêng xử lý cam kết hai pha - Trong hệ quản trị sở liệu tập trung, giả thiết rằng: - Không gian làm việc riêng phần TM; - Dữ liệu di chuyển cách tự giao tác không gian làm việc nó, nhƣ không gian làm việc giao tác DM Những giả thiết không thích hợp hệ quản trị sở liệu phân tán TM DM thực địa điểm khác chi phí di chuyển liệu TM DM lớn Để giảm chi phí này, nhiều hệ quản trị sở liệu phân tán sử dụng thủ tục truy vấn tối ƣu tổ chức nhớ đệm cho không gian làm việc cá nhân giao tác nhằm điều chỉnh luồng liệu địa điểm Chẳng hạn, SDD-1 không gian làm việc cá nhân giao tác T đƣợc phân bố địa điểm mà T truy xuất liệu Giả sử T cập nhật mục liệu x, y, z đƣợc lƣu trữ tƣơng ứng DMx, DMy, DMz giả sử TM T bị thất bại sau phát lệnh dmwrite(x) nhƣng trƣớc phát lênh dm-write y z Lúc này, chắn sở liệu không xác Đối với hệ quản trị sở liệu tập trung tƣợng dị thƣờng nguy hại giao tác truy xuất vào sở liệu TM khôi phục lại Tuy nhiên, hệ quản trị sở liệu phân tán, TM khác thực lệnh truy xuất vào sở liệu không xác Đồng Văn Toàn – Lớp HTTT & TT - KS CLC K53 Page 10 Cơ sở liệu phân tán – Điều khiển tương tranh khóa đọc x1 choT1 khóa đọc x1 cho T1 khóa đọc x1 cho T1 khóa ghi y1 cho T1 khóa ghi y1 cho T1 khóa ghi y1 cho T1 *khóa ghi x1 cho T3 *khóa ghi x1 cho T3 *khóa ghi x1 cho T3 Không khóa đƣợc đánh dấu * đƣợc chấp nhận hệ thống rơi vào tình trạng tắc nghẽn Tuy nhiên đồ thị chờ DM không xếp vòng Hình 2.9 Tắc nghẽn nhiều trạm 2.3.6.2 Phát tắc nghẽn Các khối tắc nghẽn đƣợc phát nhờ vào việc tìm kiếm chu trình đồ thị chờ Nếu tìm thấy chu trình, giao tác chu trình đƣợc chọn để huỷ, gọi victim, phá hủy đƣợc tắc nghẽn Để cực tiểu hóa chi phí khởi động lại victim, việc chọn victim thƣờng đƣợc dựa vào số tài nguyên đƣợc dùng giao tác chu trình Khó khăn lớn việc phát tắc nghẽn hệ thống phân tán xây dựng đồ thị chờ cách có hiệu Mỗi lịch trình 2PL xây dựng đồ thị chờ cách dễ dàng dựa vào mối quan hệ chờ cục Tuy nhiên, đồ thị tác dụng việc mô tả tất tắc nghẽn sở liệu phân tán (hình 2.8) Thay vào đó, đồ thị chờ cục phải kết nối thành đồ thị chờ tổng thể Chúng ta bàn số kỹ thuật xây dựng đồ thị chờ tổng thể để phát tắc nghẽn: tập trung phân cấp Trong kỹ thuật tập trung, theo định kỳ, lịch trình gửi đồ thị chờ cục tới phận phát tắc nghẽn Bộ phận kết hợp đồ thị cục thành hệ thống đồ thị chờ cách hợp đồ thị cục lại Trong kỹ thuật phân cấp, trạm liệu đƣợc tổ chức thành phân cấp với phận phát tắc nghẽn nút Các khối tắc nghẽn địa phƣơng trạm đơn đƣợc phát trạm; khối tắc nghẽn liên quan đến hai hay nhiều trạm miền đƣợc phát phận phát tắc nghẽn miền Mặc dù hai kỹ thuật đƣợc đề cập khác mức chi tiết, nhƣng hai liên quan đến chu kỳ chuyển liệu tới phận phát tắc nghẽn hay nhiều trạm Chu kỳ tự nhiên trình sinh hai vấn đề Thứ nhất, khối tắc nghẽn tồn vài phút mà không bị phát thời gian trả lời Đồng Văn Toàn – Lớp HTTT & TT - KS CLC K53 Page 23 Cơ sở liệu phân tán – Điều khiển tương tranh không đƣợc đảm bảo Để giải điều này, phận phát tắc nghẽn phải hoạt động thƣờng xuyên hơn, tăng chi phí phát tắc nghẽn Thứ hai, giao tác T khởi động lại nhiều lí khác vấn đề tƣơng tranh (chẳng hạn trạm bị hỏng) Cho đến việc khởi động lại T đƣợc truyền đến phận phát tắc nghẽn, phận tìm thấy chu trình đồ thị chờ có chứa T Một chu trình nhƣ gọi khối tắc nghẽn ảo (phantom deadlock) Khi phát khối tắc nghẽn ảo, phận phát tắc nghẽn không cần khởi động lại giao tác khác T Sự đề phòng đặc biệt cần thiết để tránh việc khởi động lại không cần thiết 2PL biểu Chi phí việc phát tắc nghẽn khởi động lại giao tác thực chƣa hoàn chỉnh Việc khai báo trƣớc giảm đƣợc chi phí Bằng cách thu khóa giao tác trƣớc thực thi, hệ thống phải khởi động lại giao tác chƣa thực 2.4 CÁC KỸ THUẬT ĐỒNG BỘ HÓA DỰA TRÊN TRẬT TỰ NHÃN THỜI GIAN Với giao tác đƣợc gán nhãn thời gian TM TM gắn kết nhãn thời gian để tất dm-read dm-write thực đại diện cho giao tác DM phụ thuộc để xử lý phép toán mâu thuẫn trật tự nhãn thời gian Nhãn thời gian phép toán O ký hiệu ts(O) Việc định nghĩa phép toán mâu thuẫn phụ thuộc vào loại đồng hóa đƣợc thực khóa đối lập: - Với đồng rw, hai phép toán mâu thuẫn nếu: (a) hai phép toán phần tử liệu (b) dm-read dm-write - với đồng ww, hai phép toán mâu thuẫn nếu: (a) phép toán phần tử liệu (b) tất dm-write Điều dễ dàng chứng minh T/O đạt đƣợc xếp xoắn →rwr (→ww) quan hệ sử dụng cho đồng rw (ww) Khi DM xử lý phép toán mâu thuẫn thứ tự nhãn thời gian, cạnh →rwr (→ww) quan hệ trọng thứ tự nhãn thời gian Một cách tuần tự, tất đƣờng quan hệ trật tự nhãn thời gian tất giao tác có nhãn nhất, đồng thời thứ tự nhãn thời gian dãy giá trị có thứ tự 2.4.1 Sự thực T/O Sự thực T/O bao gồm việc xây dựng chƣơng trình T/O, phần mềm đóng gói đó, phần mềm nhận dm-read dm-write output phép toán tùy theo đặc điểm T/O Trong thực tế, prewwrite phải đƣợc xử lý suốt chƣơng trình T/O cho việc uỷ thác hai pha để phép toán đắn Nhƣ trƣờng hợp với 2PL, thực T/O phân biệt đƣợc Đồng Văn Toàn – Lớp HTTT & TT - KS CLC K53 Page 24 Cơ sở liệu phân tán – Điều khiển tương tranh chƣơng trình với sở liệu Khi giao tác bị bỏ qua, đƣợc gán nhãn thời gian lớn nhãn cũ TM khởi động lại Kỹ thuật khởi động lại đƣợc đề cập kỹ dƣới Cơ chế uỷ thác hai pha kết hợp nhãn thời gian prewrite việc chấp nhận hay loại bỏ priwrite thay cho dm –write Đầu tiên chƣơng trình chấp nhận prewrite, phải đảm bảo chấp nhận dm-write tƣơng ứng vấn đề dm-write đến Với rw (hoặc ww) đồng bộ, S chấp nhận prewrite(x) với nhãn thời gian TS đƣa dm-read(x) (hoặc dm-write(x)) với nhãn thời gian lớn TS dm-write(x) đƣợc đƣa Hiệu tƣơng tự thiết lập khóa ghi x cho khoảng thời gian tồn việc uỷ thác hai pha Để thực qui tắc trên, S đệm dm-read, dm-write prewrite Min-R-ts(x)=Min nhãn thời gian đệm cho dm-read(x), Min-W-ts(x) = Min nhãn thời gian bất đệm cho dm-write(x), Min-P-ts(x) = Min nhãn thời gian đệm cho dm-prewrite(x) Sự đồng Rw đƣợc thực nhƣ sau: R dm-read(x) Nếu ts(R)Min-P-ts(x), R đƣợc làm đệm Ngƣợc lại R output P prewrite(x) ts(P)Min-RMột dm-write(x) vW không bị loại bỏ Nếu ts(W)>min-P -ts(x) W vật đệm ngƣợc lai W output 4.Khi W output, prewrite tƣơng ứng làm đệm Đây nguyên nhân minP-ts(x) tăng, đệm dm-writes đƣợc retested để nhìn thấy dm-write output Nhƣ hình 2.11 Khi dm-write(x) đến, thực nhƣ sau: Đồng Văn Toàn – Lớp HTTT & TT - KS CLC K53 Page 25 Cơ sở liệu phân tán – Điều khiển tương tranh Hình 11 : Làm rỗng đệm đồng hóa T/O ww Với 2PL, biến thông thƣờng đƣợc yêu cầu giao tác khai báo trƣớc readsets writesets nó, thực tất dm-reads prewrites trƣớc thực bắt đầu Nếu tất toán tử đƣợc chấp nhận, giao tác đƣợc đảm bảo để thực không cần khởi động lại nguy hiểm Một biến khác phải dừng lại trình xử lý toán hạng để đợi cho toán hạng với nhãn thời gian nhở 2.4.2 Luật ghi Thomas Với đồng hóa ww, chƣơng trình T/O đƣợc đánh giá cách lạc quan việc sử dụng lời nhận xét THOM79 W dm-write(x) giả sử ts(W)ts(W) ; nhƣ hình 11b Nếu R-ts(x) nằm Interval(W), W bị loại bỏ ngƣợc lại W output tạo phiên x với nhãn thời gian ts(W) Biểu diễn phiên mục liệu x trục thời gian : Giá trị V1 Nhãn thời gian W V2 V3 10 20 Vn-1 Vn 92 100 Để xử lý dm-read(x) với nhãn thời gian 95, tìm nhãn thời vW lớn mà nhỏ 95, trƣờng hợp 92 Đó phiên bạn đọc Bởi trƣờng hợp này, giá trị đọc dm-read Vn-1 Chúng ta miêu tả nhãn thời gian x tƣơng tự Các nhãn thời gian R Các giá trị V1 Các nhãn thời gian W 15 … V2 V3 10 92 100 Vn-1 Vn 20 92 100 W dm-write(x) với nhãn thời gian 93 Interval(W) =(93,100) Để xử lý W tạo phiên x với nhãn thời gian Các nhãn thời gian R Các giá trị V1 V2 10 Các nhãn thời gian W 15 V3 20 92 95 … Vn-1 Vn 92 100 Hình 2.12 Việc đọc ghi đa phiên Đồng Văn Toàn – Lớp HTTT & TT – KS CLC K53 Page 27 Cơ sở liệu phân tán – Điều khiển tương tranh Với kỹ thuật đồng hóa ww, đa phiên T/O phiên nâng cao TWR Một dm-write(x) thƣờng tạo phiên với nhãn thời gian ts(dm-write) không bị loại bỏ Sự hợp two-phase commit yêu cầu dm-read dm- prewrite (nhƣng không dm-write) đƣợc đệm nhƣ T/O Thiết lập P vật đệm prewrite(x) : interval(P) khoảng thời gian từ ts(P) đến W-ts(s) >ts(P) Kỹ thuật đồng hóa Rw đƣợc thực nhƣ sau: R dm-read(x) R không bị loại bỏ Nếu ts(R) nằm khoảng interval(prewrite(x)) với vài đệm prewrite(x) R đƣợc đệm ngƣợc lại R output P prewrite(x) Nếu vài R-ts(x) trong interval(P), P bị loại bỏ ngƣợc lại P đƣợc đệm W md-write(x) W luôn output tức khắc Khi W output, prewrite đƣợc đệm đệm dm-read đƣợc khởi động lại để nhìn thấy output Two-phase commit kết kỹ thuật đồng hóa ww, dm-write không bị loại bỏ với kỹ thuật đồng hóa ww R=dm-read(x) R sẵn sàng ts(R)∉interval(P), P đệm prewrite(x) Khi dm-write đến thực nhƣ sau: ts(x), W đƣợc làm vật đệm, (nếu W output nguyên nhân gây vật đệm dm-read(x) bị loại bỏ) ngƣợc lại W output Khi W output, prewrite tƣơng ứng đƣợc dùng làm vật đệm Nếu lý để min-P-ts(x) tăng vật đệm dm-reads đƣợc kiểm tra lại (retested) để nhìn thấy có dm-reads output Nếu nguyên nhân tăng min-R-ts(x), đệm dm-writes đƣợc kiểm tra lại, Điều đƣợc diễn tả hình 10 R=dm-read(x) W=dm-write(x) R sẵn sàng đến trước yêu cầu prewrite sớm nhất: Nếu ts(R)[...]... các mục dữ liệu hợp lệ khác Đồng Văn Toàn – Lớp HTTT & TT – KS CLC K53 Page 34 Cơ sở dữ liệu phân tán – Điều khiển tương tranh 2.5.2 Kiến trúc chu trình dữ liệu gốc Không giống với các hệ cơ sở dữ liệu truyền thống là các giao tác đƣợc chuyển tới các trạm dữ liệu, trong chu kỳ dữ liệu, dữ liệu đƣợc chuyển tới các trạm mà giao tác đang thực hiện Hình 16 là cấu trúc của mô hình chu trình dữ liệu Data... một chu kỳ nào Do đó, chu kỳ dữ liệu chỉ phù hợp với hệ thống gồm ít cập nhật và truy vấn đơn giản Đồng Văn Toàn – Lớp HTTT & TT – KS CLC K53 Page 35 Cơ sở dữ liệu phân tán – Điều khiển tương tranh 2.5.3 DC-ROLL Để sử dụng các tiện lợi của chu kỳ dữ liệu và tránh các nhƣợc điểm của nó, ta giả sử chỉ dùng chu kỳ dữ liệu để chuyển dữ liệu điều khiển tƣơng tranh Cơ sở dữ liệu vẫn sẽ đƣợc truy xuất bằng... quá trình xử lý T kết thúc 2.2 PHÂN TÍCH BÀI TOÁN ĐIỀU KHIỂN TƯƠNG TRANH Trƣớc khi phân tích bài toán điều khiển tƣơng tranh, ta xét một số ví dụ về “dị thƣờng” để thấy đƣợc tầm quan trọng của việc điều khiển tƣơng tranh Ví dụ về các dị thường trong điều khiển tương tranh Mục đích của điều khiển tƣơng tranh là ngăn chặn nhiễu từ những ngƣời dùng đang truy xuất vào cơ sở dữ liệu Chúng ta sẽ tìm hiểu vấn... chuyển tải dữ liệu một cách triệt để đƣợc Chu kỳ dữ liệu (datacycle) là một cách quản lý cơ sở dữ liệu phân tán không mang tính truyền thống Chu kỳ dữ liệu giải quyết một cách có hiệu quả bài toán linh hoạt (scaleability) nhƣng đặt các ràng buộc đáng kể lên kích thƣớc cơ sở dữ liệu và mức độ ganh đua DC-ROLL là một phƣơng pháp điều khiển tƣơng tranh mới trong môi trƣờng phân tán dựa trên cơ sở "Yêu cầu... Page 11 Cơ sở dữ liệu phân tán – Điều khiển tương tranh ví dụ về các máy rút tiền tự động ATM (automated teller machine) Tƣơng ứng với các yêu cầu của khách hàng, ATM lấy dữ liệu từ một cơ sở dữ liệu, tính toán và lƣu kết quả trở lại vào cơ sở dữ liệu Dị thường 1: Mất cập nhật Giả sử tại một thời điểm có hai khách hàng đang cố gắng gửi tiền vào cùng một tài khoản Trong trƣờng hợp không có điều khiển. .. tính toàn vẹn dữ liệu Một thực thi gọi là có tính khả tuần tự nếu nó tƣơng đƣơng với một chuỗi thao tác, nghĩa là nếu nó tạo ra cùng một kết quả và có cùng tác động lên cơ sở dữ liệu nhƣ các chuối thao tác Một trong những yêu cầu của điều khiển tƣơng tranh trong cơ sở dữ liệu phân tán là phải đảm bảo rằng tất cả các thực thi đều có tính khả tuần tự Chỉ các thao tác truy xuất vào cơ sở dữ liệu đã đƣợc... Cơ sở dữ liệu phân tán – Điều khiển tương tranh hiệu truy xuất của giao tác ƒ Để RELEASE một mục d liệu khi đã hoàn thành các thao tác với nó, giao tác gán giá trịcủa bit tƣơng ứng bằng 0 Nếu có giao tác nào khác CHECK ROLL sau đó, nó sẽ tìm mục dữ liệu thích hợp Cũng giống nhƣ CHECK, RELEASE không yêu cầu truy xuất riêng biệt 5.5.1.2 ROLL dựa trên sơ đồ điều khiển tương tranh Một thuật toán điều khiển. .. 2.5 DC-ROLL Tái tạo bản sao dữ liệu là một phƣơng pháp phổ biến trong cơ sở dữ liệu phân tán để cân bằng chuyển tải dữ liệu (load balancing) Để sử dụng có hiệu quả phƣơng pháp 2PL truyền thống trong môi trƣờng bản sao, một bản sao của mỗi mục dữ liệu đƣợc chỉ định làm mục chính Điều này dẫn tới kết quả là làm tăng gánh nặng cho việc điều khiển tƣơng tranh trên các trạm lƣu dữ liệu "nóng" Nói cách khác,... Linked List (ROLL)- và cấu trúc chu kỳ dữ liệu DC-ROLL tránh đƣợc thắt nút cổ chai của 2PL truyền thống Nó cũng đơn giản hoá việc quản lý độ nhất quán của cơ sở dữ liệu trong môi trƣờng bản sao vì không cần bộ phận điều khiển tƣơng tranh trung tâm Không giống với chu trình dữ liệu truyền thống, DC-ROLL không yêu cầu gộp cơ sở dữ liệu thành một khối Giống ROLL, cơ sở dữ liệu đƣợc chia ra, vì vậy DC-ROLL... KS CLC K53 Page 32 Cơ sở dữ liệu phân tán – Điều khiển tương tranh 2.5.1 ROLL (Request Order Linked List ) ROLL là một đối tƣợng lƣu trữ dữ liệu điều khiển tƣơng tranh, đƣợc xử lý trực tiếp bằng các giao tác, nghĩa là hiện tƣợng thắt nút cổ chai bị loại bỏ Thành phần cơ bản của ROLL là một vector bit để nhận dạng các yêu cầu truy xuất dữ liệu của các giao tác Vị trí của mỗi bit trong vector bit tƣơng .. .Cơ sở liệu phân tán – Điều khiển tương tranh CHƯƠNG I TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 1.1.CƠ SỞ DỮ LIỆU PHÂN TÁN 1.1.1 Khái niệm Vì yêu cầu công ty,... Kỹ thuật thiết kế sở liệu phân tán phức tạp nhƣng hệ sở liệu phân tán cần thiết cho xu hƣớng phát triển kinh tế 1.2.QUẢN TRỊ CƠ SỞ DỮ LIỆU PHÂN TÁN Hệ quản trị sở liệu phân tán cung cấp công... thể file liệu đặt nơi hệ thống Đồng Văn Toàn – Lớp HTTT & TT - KS CLC K53 Page Cơ sở liệu phân tán – Điều khiển tương tranh - Điều khiển tƣơng tranh điều khiển hồi phục liệu giao tác phân tán Cách

Ngày đăng: 15/01/2016, 22:39

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan