Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 25 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
25
Dung lượng
239,83 KB
Nội dung
NHÂNBẢNTRONGSQLSERVER7.0 CHƯƠNG 1: GIỚI THIỆU VỀ NHÂNBẢN I. GIỚI THIỆU CHUNG Nhânbản là sự duy trì trực tiếp các bản sao dữ liệu và một số các tài nguyên khác. Nó là chìa khoá trong một hệ thống phân bố hiệu quả, trong đó nó có thể làm tăng hiệu suất máy, độ sẵn sàng cao và ít sai sót. Mục đích của việc nhân bản: I.1 Tăng hiệu suất máy tính: Nhânbản dữ liệu đến các server làm tăng hiệu suất đáp ứng thời gian thực của hệ thống, giải quyết được tình trạng thắt cổ chai (bottleneck), và làm giảm số lượng đầu vào một cách đáng kể (số lượng user vào thao tác trên dữ liệu giảm). I.2 Tăng tính sẵn sàng: Nếu dữ liệu được nhânbản đến nhiều server độc lập nhau thì có thể thay thế server mặc đònh bằng server khác khi server mặc đònh bò hư , do đó xác suất để hệ thống sẵn sàng tăng lên, cũng có nghóa là khả năng thành công cho một ứng dụng bất kì tăng lên. Giả sử có n replica và xác suất để một máy chết là p lúc đó xác suất để n máy chết là pn do đó độ sẵn sàng sẽ là 1-pn. I.3 Ít sai sót: Khả năng này mạnh hơn tính sẵn sàng cao, vì nó có thể bao gồm cả đảm bảo về thời gian thực và đảm bảo về các sai sót không mong muốn sẽ không xuất hiện. Ví dụ: Nếu yêu cầu được xử lý trên hệ thống có một server thì khi server này chết giữa chừng sẽ không biết server này đã thực hiện xong chưa. Nhưng trong hệ thống có nhân bản, nếu 1 server bò chết các server khác sẽ xử lý tiếp tục cho đến khi hoàn tất. II. YÊU CẦU TRONGNHÂN BẢN: Có 2 yêu cầu chính khi nhânbản dữ liệu: • Trong suốt • Nhất quán II.1 Trong suốt: Các client sẽ không biết sự hiện diện của các replica. Khi client được kết nối vào 1 server để truy suất dữ liệu , thì dữ liệu đó được xem như là duy nhất và khi client gởi yêu cầu hay toán hạng cần xử lý đến server thì client chỉ xem như xử lý trên 1 bảntrong khi thực tế nó được xử lý trên nhiều nhân bản(replica) ở mức vật lý . II.2 Nhất quán: Yêu cầu bao gồm đọc và cập nhật dữ liệu (yêu cầu đọc không cần tính chất này). Khi các client gởi cùng 1 yêu cầu đến các server khác nhau, thì quản lý nhânbản phải đảm bảo là tất cả các client sẽ nhận về cùng 1 kết quả. CHƯƠNG 2: KIẾN TRÚC NHÂNBẢNTRONGSQLSERVER7.0Nhânbản là một kó thuật quan trọng và hữu hiệu trong việc phân bố cơ sở dữ liệu (CSDL) và thực thi các stored procedure. Kó thuật nhânbảntrong MS SQLServer cho phép bạn tạo ra những bản sao dữ liệu giống hệt nhau, di chuyển các bản sao này đến những vùng khác nhau và đồng bộ hoá dữ liệu 1 cách tự động để tất cả các bản sao có cùng giá trò dữ liệu.Nhân bản có thể thực thi giữa những CSDL trên cùng một server hay những server khác nhau được kết nối bởi mạng LANs,WANs hay Internet. SQLServer đã đưa ra nhiều cơ chế nhânbản để đáp ứng các yêu cầu khác nhau của ứng dụng. Mỗi loại cung cấp các khả năng và thuộc tính khác nhau nhằm đạt đến mục tiêu của tính độc lập site và sự nhất quán các giao dòch. I. MỤC TIÊU CHÍNH TRONGNHÂN BẢN: SQLServer đã đưa ra nhiều cơ chế nhânbản để đáp ứng các yêu cầu khác nhau của ứng dụng. Mỗi loại cung cấp các khả năng và thuộc tính khác nhau nhằm đạt đến mục tiêu của tính độc lập site và sự nhất quán dữ liệu. I.1 Nhất quán dữ liệu (data consistency): Có 2 cách để đạt được tính nhất quán dữ liệu: - Nhất quán giao dòch (Transactional Consistency) - Hội tụ dữ liệu (Data Convergence) I.1.1 Nhất quán giao dòch: - Bảo đảm tất cả dữ liệu giống nhau tại mọi site ở bất kì thời điểm. - Tất cả giao dòch thực hiện tại một site duy nhất. Có 2 loại : I.1.1.a Nhất quán lập tức (Immediate Transactional Consistency hay Tight Consistency trong MS SQLServer 6.0): Ở kiểu này, tất cả các site được bảo đảm là luôn thấy cùng giá trò dữ liệu tại cùng một thời điểm. Cách duy nhất để đạt được nhất quán giao dòch (transactional consistency) trong môi trường cập nhật phân bố (distributed update environment) là sử dụng 2-phase commit protocol giữa tất cả site tham gia (participating site). Mỗi site phải commit đồng thời mọi thay đổi hoặc không site nào commit những thay đổi. Giải pháp này rõ ràng không khả thi khi số lượng site quá lớn. I.1.1.b Nhất quán ngầm (Latent Transactional Consistency hay Loose Consistency trong MS SQLServer 6.0) : Có một sự nhất quán ngầm giữa các site tham gia do cóù một sự trì hoãn trong việc phản ánh các giá trò dữ liệu đến các site tham gia và vào lúc này các site không bảo đảm có cùng giá trò dữ liệu. Việc sửa đổi các giá trò dữ liệu có thể bò trì hoãn đủ lâu để tất cả các site cùng cập nhật, sau đó tất cả các site sẽ có cùng giá trò dữ liệu. Ngoài ra các giá trò dữ liệu này cũng phải giống với những giá trò đạt được khi thực hiện các công việc tại một site.Sự khác nhau duy nhất giữa nhất quán giao dòch lập tức và nhất quán giao dòch ngầm là dữ liệu có nhất quán tại cùng một lúc hay không? I.1.2 Hội tụ dữ liệu: Với sự hội tụ dữ liệu, tất cả các site có thể quy về cùng 1 giá trò dữ liệu nhưng không nhất thiết là giá trò dữ liệu này bò gây ra bởi những tác vụ được làm trên một site duy nhất. User có thể tự do thao tác trên các site theo các cách khác nhau. Khi các nút (node) đồng bộ, tất cả các site sẽ hội tụ về cùng 1 giá trò. Nếu đụng độ gây ra bởi sự sửa đổi cùng 1 dữ liệu tại những site khác nhau thì những sửa đổi này sẽ được giải quyết một cách tự động( chọn site có độ ưu tiên cao hơn hay site đưa sửa đổi đến trước .). I.2. Độc lập site (site autonomy): Độc lập site xét đến ảnh hưởng của những thao tác trên một site đến các site khác. Thường độc lập site càng tăng thì tính nhất quán dữ liệu giảm. Nhânbản kết hợp (Merge replication) có mức độc lập site cao nhất, tạo ra sự hội tụ nhưng lại không đảm bảo tính nhất quán dữ liệu. 2PC (two phase commit) có tính nhất quán dữ liệu cao nhưng lại không có tính độc lập site. Những giải pháp khác thì thường ở giữa 2 tính này. II. KIẾN TRÚC NHÂNBẢN : II.1 Các thành phần chính của nhân bản: • Publisher: Là 1 server tạo dữ liệu để nhânbản đến các server khác. Nó xác đònh dữ liệu nào được nhân bản, dữ liệu nào thay đổi và duy trì những thông tin về các công bố tại site đó. • Subscriber: Là 1 server lưu giữ nhânbản và nhận các tác vụ cập nhật. SQLServer7.0 cho phép Subsriber cập nhật dữ liệu nhưng quá trình cập nhập ở Subscriber không giống như ở Publisher. Một Subscriber có thể là một Publisher của các Subscriber khác. • Distributor: Là một server mà chứa CSDL phân bố (distribution database) và lưu trữ metadata, history data và transaction. SQLServer sử dụng CSDL phân bố để lưu và chuyển (store_and_forward) dữ liệu nhânbản từ Publisher đến các Subscriber. Có 2 loại Distributor : local Distributor và remote Distributor. • Publication: Đơn giản là một tập hợp các mẩu dữ liệu (article). Một mẩu là một nhóm dữ liệu được nhân bản. Một mẩu có thể bao gồm một table hay chỉ là một vài hàng (horizontal fragment) hay cột (vertical fragment). Một Publication thường gồm nhiều mẩu. II.2. Chiều di chuyển dữ liệu: Có 2 kiểu di chuyển dữ liệu: II.2.1 Push subscription: - Publisher đẩy (push) những thay đổi đến Subscriber mà không quan tâm Subscriber có cập nhật hay không. - Push subscription được sử dụng trong những ứng dụng mà yêu cầu gởi những thay đổi đến Subscriber ngay khi những thay đổi này xảy ra ở Publisher. - Push Subscription giúp việc quản lý các Subcsriber đơn giản và tập trung hơn, đồng thời giúp bảo mật tốt hơn vì qúa trình khởi động (initialization process) sẽ được quản lý tại một chỗ . Nhưng vì thế, Distributor có thể phải đảm nhận nhiều quá trình phân bố subscription đến các Subscriber cùng một lúc . Điều này dễ dẫn đến hiện tượng thắt cổ chai (bottleneck) . - Mô hình này không thích hợp khi số lượng các Subscriber trở nên quá lớn. Distributor o Receives data changes o Hold copy of data o Maintains source databases o Makes data available for SubcriberPulisher o Receives and stores changes o Forwards changes to - Push subscription gây ra 1 phí xử lý cao hơn tại Publisher. Để tránh hiện tượng này, những thay đổi có thể được đẩy đến Subscriber theo một lòch đònh kì. II.2.2 Pull subscription: - Subsciber kéo (pull) những thay đổi tại Publisher về theo một khoảng thời gian đònh kì. - Tốt cho những user độc lập thay đổi bởi vì chúng cho phép user xác đònh khi nào thì những thay đổi dữ liệu được đồng bộ - Ngược với push subscription ,pull subscription bảo mật thấp nhưng cho phép số lượng Subsriber cao hơn . - Một publication có thể sử dụng cảû hai push và pull subscription. III. TÁC NHÂN (AGENT) : Việc thiết kế các nhânbản có thể tạo ra 1 hay nhiều agent. • Snapshot agent: - Chuẩn bò lược đồ, data file, stored procedure - Lưu snapshot lên Distributor và ghi lại những thông tin về trạng thái đồng bộ vào CSDL phân bố (distribution database) . - Mỗi publication có 1 snapshot agent riêng chạy trên Distributor và liên kết với Publisher. • Log Reader agent: - Di chuyển những transaction cần nhânbản từ transaction log trên Publisher đến CSDL phân bố . - Mỗi publication dùng nhânbản transaction có 1 log reader agent ,chạy trên Distributor và liên kết (connect) đến Publisher. • Distribution Agent: - Di chuyển transaction và những tác vụ sao chép giữ trong CSDL phân bố đến Subscriber. - TH: Nhânbản transaction hay snapshot mà đồng bộ lập tức ( immediate synchronization): khi 1 push subscription được tạo, mỗi publication có 1 distribution agent riêng, chạy trên Distributor và liên kết với Subscriber. - TH: Nhânbản transaction và snapshot không đồng bộ lập tức : Publisher và Subscriber sẽ dùng chung distribution agent , chạy trên Distributor và liên kết với Subscriber. - TH: pull subscription đến snapshot publication hay transactional publication: có distribution agent, chạy trên Subscriber - Nhânbản kết hợp (merge replication) không có distribution agent. • Merge agent: Latent Transactional Consistency Data Convergency Transactional Consistency SiteAutonomy Immediate Transactional Consistency Di chuyển và điều hòa những thay đổi dữ liệu xảy ra sau khi 1 snapshot khởi động (initial snapshot) được tạo. Mỗi merge publication có 1 merge agent ,liên kết và cập nhật được với cả hai Publisher và Subscriber. IV. CÁC LOẠI NHÂN BẢN: Trong thực tế khó có thể có được một loại nhânbản phù hợp mọi yêu cầu. Công việc kinh doanh thường đòi hỏi nhiều ứng dụng khác nhau vì thế SQLServer đã đưa ra nhiều cách thức nhânbản để đáp ứng các yêu cầu đó. SQLServer đưa ra 3 loại nhânbản để sử dụng khi thiết kế ứng dụng: • Nhânbản snapshot • Nhânbản transaction • Nhânbản kết hợp Mỗi loại cung cấp các khả năng và thuộc tính khác nhau nhằm đặt đến mục tiêu của tính độc lập site và sự nhất quán dữ liệu. CHƯƠNG 3: CÁC LOẠI NHÂNBẢN I. NHÂNBẢN SNAPSHOT ( snapshot replication ) : I.1 Giới thiệu: Nhânbản snapshot là loại nhânbản đơn giản nhất, nhânbản snapshot sao chép toàn bộ dữ liệu cần nhânbản (còn gọi là quá trình làm tươi dữ liệu) từ Publisher đến các Subscriber. Nó đảm bảo sự nhất quán tiềm ẩn (Latent Transactional Consistency) giữa Publisher và Subscriber. Nhânbản snapshot được đánh giá cao trong các ứng dụng chỉ đọc như tìm kiếm hay các hệ thống không yêu cầu dữ liệu mới nhất và dung lượng dữ liệu không lớn. Nhânbản Snapshot gửi tất cả dữ liệu đến cho Subscriber thay vì chỉ gửi những thay đổi. Nếu mẫu dữ liệu rất lớn nó phải cần đến hệ thống mạng đủ mạnh để truyền dữ liệu. Khi sử dụng nhânbản snapshot cần phải tính đến tỉ lệ giữa kích cỡ của toàn bộ dữ liệu và những thay đổi của nó. I.2 Tác nhân (agent): Cập nhật snapshot được thực hiện bởi snapshot agent và distribution agent. Snapshot agent chuẩn bò những snapshot file (snapshot file là file sao chép lược đồ và dữ liệu của những table phân bố) chứa lược đồ và dữ liệu của những table phân bố, lưu những file này vào snapshot folder trên Distributor và ghi lại những công việc đồng bộ trong CSDL phân bố (distribution database). Distribution agent gởi những snapshot job (tác vụ sao chép dữ liệu) giữ trong bảng dữ liệu phân bố đến Subsciber. CSDL phân bố ( distribution database) chỉ được sử dụng trongnhân bản, không chứa user table. I.2.1 Snapshot agent: Snapshot agent thực hiện theo các bước sau: - Thiết lập một share-lock lên tất cả table (article) trong publication. Share-lock ngăn không cho các user khác cập nhật lên table đó. - Sao chép lược đồ dữ liệu của mỗi article ( .sch file) và các index, các ràng buộc ( .idx file) lên Distributor. Các file này được lưu vào 1 thư mục con trong thư mục làm việc của Distributor. - Nếu tất cả các Subsciber đều là MS SQLServer thì bản sao của dữ liệu được lưu thành .bcp file. Nếu các Subscriber không đồng nhất ( các Subsciber chứa nhiều loại CSDL khác nhau , ví dụ: Access, Oracle…) thì bản sao của dữ liệu được lưu thành .txt file. - Cuối cùng agent gỡ bỏ share-lock trên mỗi table phân bố và hoàn tất việc viết vào 1 log history file ( log history file ghi lại quá trình làm việc của các agent). I.2.2 Distribution agent: Tác nhân áp dụngï những lược đồ và những dữ liệu vào CSDL của Subscriber. Nếu Subscriber không phải là SQL Server, distribution agent sẽ chuyển đổi kiểu dữ liệu trước khi những dữ liệu này được áp dụng vào Subsciber. Ví dụ: Publisher sử dụng SQLServer ,Subscriber sử dụng Oracle. Trước khi những dữ liệu được áp dụng lên Subscriber , nó sẽ được chuyển đổi kiểu từ SQLServer sang Oracle. Snapshot có thể được áp dụng khi subscription được tạo hay theo 1 khoảng thời gian nhất đònh. II. NHÂNBẢN GIAO DỊCH (Transactional Replication) II.1 Giới thiệu: Sử dụng nhânbản giao dòch để nhânbản 2 kiểu đối tượng khác nhau: table và stored procedure. Bạn có thể chọn tất cả hay 1 phần của 1 table được nhânbản như là 1 article trong publication. Tương tự, bạn cũng có thể chọn 1 hay nhiều stored procedure được nhânbản như là 1 article trong cùng hay khác publication. Nhânbản giao dòch sử dụng transaction log để giữ những thay đổi được làm trên dữ liệu trong 1 article. SQLServer giám sát những lệnh insert, update, delete hay những sửa đổi trên dữ liệu và lưu những thay đổi đó lên CSDL phân bố (distribution database). Những thay đổi đó sẽ được gởi đến Subscriber và tuân theo một trật tự nhất đònh. [...]... immediate-updating Subcriber không nên được update trong cùng 1 transaction II.4.2 Nhânbản những thực thi của Stored procedure : SQL server không những cho phép bạnnhânbản dữ liệu trong bảng mà còn hỗ trợ bạnnhânbản stored procedure một trong 2 cách Nếu bạn có một hay nhiều stored procedure như là những article trong một snapshot publication, SQLserver sao chép toàn bộ store procedure từ Publisher... cũng tương tự như những hàm được sử dụng trongnhânbản snapshot II.3 Thu dọn trongnhânbản transaction: ( tương tự cho nhânbản snapshot) Khi CSDL phân bố ( distribution database ) được tạo, SQLServer sẽ tự động thêm vào 3 tác vụ tại Distributor: • Agent checkup • Transaction cleanup • History cleanup Những tác vụ này giúp cho việc nhânbản hiệu quả hơn trong môi trường long_running Tác vụ cleanup... bạn gồm một hay nhiều stored procedure như là article trong một nhânbản giao dòch , SQLServer sẽ nhânbản thực thi của stored procedure hơn là những dữ liệu thay đổi gây ra bởi sự thực thi những stored procedure đó Cách làm này đặc biệt hữu ích trongnhânbản mà kết quả của những stored procedure có thể ảnh hưởng một số lượng lớn dữ liệu Nhânbản những thay đổi như thực thi một lệnh đơn làm tăng... decentralized conflict logging Bảng này có cùng cấu trúc với bảng gốc, và conflict reslover sao chép phiên bản (version) gần nhất của hàng vào bảng Version “thắng cuộc” của hàng đònh cư trong user table thật sự Những cột trong bảng hệ thống sysmergearticles giữ những thông tin về những bảng có liên quan đến bảng tranh chấp, và tên của những bảng đó Xoá bỏ những tranh chấp sẽ lần theo bảng MSmerge-delete-conflicts... nhật hàng có cùng giá trò khoá và timestamp với hàng trong bảng delete Kiểm tra@@ROWCOUNT / @@ERROR Nếu thành công, trả về một giá trò timestamp mới SQLServer tổ chức 2 bảng (table) : delete và insert để lưu những dữ liệu thay đổi được làm trên một bảng (table) mà chưa được commit Thực tế lệnh update bao gồm 1 hàng trong bảng insert và 1 hàng trong bảng delete Chú ý : một giao dòch mà ảnh hưởng lên... Subscriber lập tức (Immediate_Updating Subscriber): Trong trường hợp đơn giản nhất, cả hai nhânbản snapshot và giao dòch làm việc dựa trên mô hình nhânbản một chiều ( dữ liệu chỉ được nhânbản từ Publisher đến Subscriber) Tuy nhiên MS SQLServer cung cấp thêm một mô hình mới cho phép Subscriber sửa đổi dữ liệu nhân bản, tùy chọn Immediate_Updating Subscriber sẽ cung cấp sự nhất quán giao dòch ngầm (latent... công cụ của SQL Server Agent và có thể được quản lý trực tiếp bằng cách sử dụng SQL Server Enterprise Manager Snapshot agent thực thi trên Distribution Merge agent thực thi trên Distribution khi dùng push subsciption hay thực thi trên Subsciber khi dùng pull subsciption III.3 Giải quyết tranh chấp trongnhânbản kết hợp: MA phát hiện tranh chấp thông qua một cột hệ thống gọi là lineage trong bảng MSmerge-contents,... một server có thể đóng 2 vai trò Publisher và Subcriber, nên thiết lập cấu hình này thì đơn giản II.4 Central Subcriber : Trong mô hình này, một số Publisher cùng nhânbản những thông tin vào một bảng đích chung tại một Subcriber Bảng dữ liệu đích được phân mảnh ngang và phải chứa khóa chính Mô hình này có thể rất hữu ích, như trong hệ thống cần tập hợp tất cả các bảng thống kê dữ liệu từ 1 số server. .. trước Các xung đột này có thể được phát hiện và giải quyết theo cấp độ hàng hay cột của bảng dữ liệu Nhânbản kết hợp nhận biết những thay đổi trong một CSDL nguồn và đồng bộ những giá trò giữa Publisher và Subscriber Cả hai Publisher và Subscriber đều có thể cập nhật dữ liệu Trongnhânbản kết hợp, Publisher là server tạo publication Mặc dù Publisher tạo publication nhưng nó không tự động “thắng” 1... xảy ra Lúc này MS SQL Server tự động xoá một trong hai hàng có cùng khóa chính đó Những thông tin lỗi này cũng được lưu trong bảng tranh chấp Những vấn đề khác như là vi phạm ràng buộc duy nhất yêu cầu một vài tác vụ user để khôi phục sự hội tụ Vi phạm tính toàn vẹn hay gặp nhất là insert một hàng với một khoá ngoại trong khi site khác thì đang xoá hàng với khoá chính tương ứng SQL Server cũng tự xoá . NHÂN BẢN TRONG SQL SERVER 7. 0 CHƯƠNG 1: GIỚI THIỆU VỀ NHÂN BẢN I. GIỚI THIỆU CHUNG Nhân bản là sự duy trì trực tiếp các bản sao dữ liệu. các server khác nhau, thì quản lý nhân bản phải đảm bảo là tất cả các client sẽ nhận về cùng 1 kết quả. CHƯƠNG 2: KIẾN TRÚC NHÂN BẢN TRONG SQL SERVER 7. 0