Các công nghệ đồng bộ dữ liệu

Một phần của tài liệu đồ án kỹ thuật cơ khí Tìm hiểu về hệ thống máy tính chịu đựng lỗi, sẵn sàng cao (Trang 47)

2 trạm

3.3.3.Các công nghệ đồng bộ dữ liệu

3.3.3.1. Replication

Việc sao lưu dữ liệu ra băng từ hay các đĩa CD, DVD rồi chuyển đến hệ thống DR và đưa vào hoạt động cũng có thể coi là một dạng của Replication. Tuy nhiên với cách làm này thì hệ thống DR sẽ không còn ý nghĩa về mặt hoạt động do các giá trị RTO và RPO sẽ đẩy lên tới vài ngày hay vài tuần. Đó là điều không thể chấp nhận được trong hệ thống hoạt động liên tục. Tuy nhiên sao lưu ra băng từ hay DVD, CD đều được sử dụng trong hệ thống tác nghiệp hay DR cho phần sao lưu. Điều này sẽ làm giảm đi các rủi ro trong việc dữ liệu bị hỏng hay xóa mất dữ liệu.

Dưới đây ta sẽ tiếp cận các công nghệ Replication mang tính chuyên nghiệp và vận hành tự động dựa vào các phần mềm của các nhà cung cấp SAN hay tiện ích của hệ quản trị dữ liệu.

3.3.3.2. Application-based replication

Phương pháp này được hiểu một cách đơn giản là sử dụng các tiện ích sẵn có của hệ quản trị dữ liệu cung cấp để thực hiện việc sao chép thông tin trong Database từ hệ thống DC sang hệ thống DR. Ví dụ, với Oracle ta có tiện ích Oracle Data Guard.

Oracle Data Guard cung cấp hiệu quả và toàn diện trong giải pháp khôi phục thảm họa và tính sẵn sàng cao. Dễ quản lý chuyển đổi dự phòng và cho phép hoán đổi vài trò giữa cơ sở dữ liệu chính và dự phòng, giảm thiểu thời gian chết của cơ sở dữ liệu chính do kế hoạch hoặc không có kế hoạch trước. Oracle Data Guard là một phần mềm tự động hóa cơ sở hạ tầng tạo ra, quản lý, giám sát, duy trì và theo dõi một hoặc nhiều chế độ cơ sở dữ liệu dự phòng để bảo vệ doanh nghiệp khỏi hỏng hóc, thảm họa và tham nhũng. Data Guard duy trì cơ sở dữ liệu dự phòng là một bản sao lưu đồng bộ với cơ sở dữ liệu chính. Các cơ sở dữ liệu dự phòng có thể được đặt cách trạm chính hàng ngàn kilomet hoặc có thể nằm trong cùng thành phố, tòa nhà. Nếu cơ sở dữ liệu chính không sẵn sàng vì dự định có kế hoạch hoặc không có kế hoạch trước như mất điện đột ngột, Data Guard có thể chuyển một vài cơ sở dữ liệu dự phòng qua các luật được định nghĩa do đó giảm thiểu thời gian chết và ngăn ngừa bất kỳ sự mất mát dữ liệu nào của hệ thống.

Sẵn sàng là một tính năng của phiên bản Oracle Enterprise, Data Guard có thể được sử dụng kết hợp với Oracle High Availability chẳng hạn như Real Application Clusters và Recovery Manager để cung cấp một mức độ cao về bảo mật dữ liệu và tính sẵn sàng của dữ liệu chưa từng có trong ngành công nghiệp.

Chú ý: với Oracle Data Guard thì khi DR xảy ra thì điều đó có nghĩa bên DC hoàn toàn không thể hoạt động nên sẽ lựa chọn phương án database DR sẽ đưa Standby lên làm Primary (chính) rồi tạo một cơ sở dữ liệu khác làm

Standby (chế độ chờ nóng) cho cơ sở dữ liệu này. Sau khi DC được khôi phục thì phải dựng lại hệ thống như cũ.

3.3.3.3. Sao lưu Host-based replication

Phương pháp này dùng các phần mềm như NetApp ReplicatorX™, Symantec Veritas Volume Replicator và Double-Take Software’s Double-

Take thực hiện việc sao chép toàn bộ cấu trúc các server từ bên DC sang bên DR. Việc sao chép này bao gồm các file dữ liệu, file hệ thống thậm chí cả partition của ổ đĩa. Ở các phần mềm này có sử dụng khái niệm Consistancy Group dùng để xác định các file dữ liệu ở các volume khác nhau hay các file hệ thống sẽ được sao chép theo từng cụm. Tuy nhiên phương pháp này có một nhược điểm là nó không đảm bảo sự toàn vẹn của một giao dịch dữ liệu, do vậy cần nhiều thời gian để xóa bỏ các giao dịch chưa được hoàn thành trước khi đưa hệ thống DR vào hoạt đông.

3.3.3.4. Storage-based replication

Phương pháp này có thể coi là một phần của Host-based replication, tuy nhiên phương pháp này có những tính ưu việt hơn Host-based replication. Do các file dữ liệu thường được lưu trữ trên các thiết bị lưu trữ chuyên dụng như SAN hay NAS mà các thiết bị này có các phần mềm điều khiển việc sao lưu riêng biệt nên ta có thể sử dụng chúng cho việc sao chép dữ liệu từ DC sang DR thay cho việc sao chép toàn bộ mọi thứ như ở phương pháp trên. Ta có thể liệt kê ra đây một số các phần mềm như IBM Metro Mirror (PPRC) và Global Mirror (XRC), EMC SRDF và MirrorView, Hitachi Data Systems TrueCopy và Network Appliance SnapMirror®. Cũng như Host-based replication, Storage-based replication không đảm bảo sự toàn vẹn của một giao dịch dữ liệu

3.3.4. Các phương thức Backup dữ liệu3.3.4.1.Sao lưu ngoại tuyến (Offline backup) 3.3.4.1.Sao lưu ngoại tuyến (Offline backup)

Offline backup được thực hiện khi tất cả các thành phần của hệ thống được dừng lại. Hồ sơ, dữ liệu và dữ liệu cấu hình này sau đó được coi là ổn định và có thể sao lưu mà không cần quan tâm đến các thay đổi được thực hiện bởi người sử dụng hoặc bên ngoài ứng dụng tại thời điểm đó. Các điều kiện tối ưu cho một offline backup khi các tình huống sau đây xảy ra :

o Tất cả người dùng bị ngắt kết nối từ hệ thống o Tất cả tiến trình ứng dụng và quản lý bị ngừng lại o Tất cả tiến trình back–end bị ngừng lại

o Tất cả tiến trình cơ sở dữ liệu bị ngừng lại

Sau khi tất cả các thành phần được dừng lại, các sao lưu có thể được tiến hành. Sao lưu cơ sở dữ liệu, vùng lưu trữ tập tin, mục tìm kiếm nội dung và dữ liệu được cấu hình là cần thiết. Sau khi hoàn thành tất cả hoạt động sao lưu, hệ thống sẽ khởi động lại và hoạt động bình thường.

3.3.4.2. Sao lưu trực tuyến “ấm” (Warm online backup)

Một Warm Online Backup được thực hiện khi người dùng vẫn có thể truy cập vào hệ thống nhưng một số chức năng của hệ thống bị hạn chế để thực hiện việc sao lưu ít phức tạp và để đảm bảo sự nhất quán giữa các tập tin và lượng dữ liệu khổng lồ.

3.3.4.3. Sao lưu trực tuyền “nóng” (Hot online backup)

Một Hot Online Backup được thực hiện khi hệ thống được sao lưu và các hoạt động người sử dụng không bị hạn chế. Các nội dung chính, tiến trình, chỉ mục và hoạt động xuất bản được tiếp tục trong loại sao lưu này. Do những khó khăn của việc đồng bộ hóa dữ liệu trên trạng thái sao lưu này, không có người sử dụng sao lưu này và không cung cấp thủ tục cho nó.

3.3.5. Các loại backup dữ liệu

Mỗi bản sao lưu được thực hiện không nhất thiết phải là một bản sao lưu đầy đủ dữ liệu, tập tin, dữ liệu cấu hình và chỉ mục. Ngoài việc sử dụng cách sao lưu khác nhau và có một phương pháp phổ biến được sử dụng để giảm thời gian chết và khối lượng dự liệu sao lưu là chúng ta chỉ sao lưu các dữ liệu mà không có trong các bản sao lưu trước đó và khi nào có yêu cầu thì ta sẽ kết hợp hai bản sao lưu đó lại với nhau.

3.3.5.1. Sao lưu đầy đủ (Full backup)

Một Full backup là sao lưu tất cả các tập tin ở trong một khu vực lưu trữ xác định. Không cần chú ý đến trạng thái của chúng như ngày chuyển đổi sau cùng hoặc ngày tạo.

3.3.5.2. Sao lưu tăng dần (Incremental backup)

Một Incremental Backup chỉ sao lưu những tập tin được sửa đổi kể từ lần sao lưu cuối cùng, dù sao lưu cuối cùng là một sao lưu tăng dần. Một lợi thế của sao lưu này là chúng lưu trữ số lượng dữ liệu tối thiểu bởi vì chỉ sao lưu những tập tin mới sửa đổi. Nhưng bất lợi là nếu phải khôi phục đầy đủ thì các tập tin phải được khôi phục từ tập tin đầu tiên đến tập tin gần đây nhất, sau đó là liên tiếp những bản sao lưu tiếp theo.

3.3.5.3. Sao lưu cộng dồn (Differential backup)

Differential Backup là một bản sao lưu mà chỉ sao lưu những tập tin đã được sửa đổi từ lần sao lưu đầy đủ gần đây nhất. Một bản sao lưu Differential Backup là rất giống với một sao lưu Incremental Backup, nhưng có sự khác biệt. Sao lưu Incremental Backup được sử dụng để tiết kiệm băng lưu trữ hay đĩa, nhưng có thể có hoặc không giảm thời gian khôi phục. Khi cần thiết phục hồi, sao lưu đầy đủ và tất cả các sao lưu Incremental Backup được yêu cầu phải hoàn khôi phục dữ liệu hoàn toàn.

Sao lưu Diferential Backup không lưu băng dự trữ hay đĩa. Sao lưu Differential Backup được thực hiện tiếp các bản sao lưu Diferential Backup đầu tiên là sao lưu IncrementalBackup lớn hơn được thực hiện cùng một lúc. Thời gian khôi phục thường nhanh hơn khi sử dụng sao lưu Differential Backup so với sao lưu Incremental Backup. Nếu cần thiết phục hồi, chỉ có sao lưu đầy đủ và sao lưu Differential Backup gần đây nhất sẽ phải được phục hồi.

Sao lưu Differential Backup chia sẻ với các sao lưu Incremental Backup cùng một vấn đề phục hồi các tập tin đã xóa.

3.3.5.4. Sao lưu tổng hợp (Synthetic Backup)

Một sao lưu Synthetic Backup có nghĩa là kết hợp một bản sao lưu đầy đủ với các bản sao lưu Incremental Backup hoặc với một bản sao lưu

Differential Backup.

Một sao lưu đầy đủ, kết hợp với sao lưu Incremental Backup hoặc sao lưu Differential Backup, có thể không rõ ràng từ một bản sao lưu đầy đủ riêng biệt mà được thực hiện tại thời điểm của sao lưu Incremental Backup gần đây nhất hoặc sao lưu Differential Backup. Đối với trường hợp này, các bản sao lưu từng phần tiếp theo phải bao gồm thông tin ghi nhận các tập tin đã bị xóa trước khi sao lưu đầy đủ. Điều này thường đòi hỏi việc sử dụng một máy chủ sao lưu với một thông tin cơ sở dữ liệu về các tập tin đã được sao lưu. Nó có thể kết hợp các thông tin từ bản sao lưu Incremental Backup với sao lưu Differential Backup, thêm mới và thay đổi tập tin và loại bỏ một vài tập tin đã xóa trong nội dung hiện thời của sao lưu Synthetic Backup.

3.3.5.5. Sao lưu tăng tiến (Progressive Backup)

Một sao lưu Progressive Backup kết hợp những ưu điểm của sao lưu Incremental Backup và sao lưu Diferential Backup và loại bỏ sự cần thiết phải thực hiện một sao lưu đầy đủ.

Trong phương pháp này một sao lưu đầy đủ đầu tiên được thực hiện và sau đó chỉ sao lưu Incremental Backup được thực hiện. Cách tiếp cận này giảm số lượng dữ liệu được gửi tới máy chủ lưu trữ sao lưu. Các máy chủ sao lưu cũng xác định xem một tập tin mà trước đây nó được coi là hoạt động đã được xóa. Với những thông tin này máy chủ sao lưu có thể tái cung cấp các thiết lập của tập tin đã được sao lưu trên hệ thống là bản sao lưu gần đây nhất hoặc trước nó. Đã xóa, hoặc không hoạt động, các tập tin được giữ lại cho một khoảng thời gian nhất định trước khi bị xóa vĩnh viễn khỏi máy chủ sao lưu.

3.3.5.6. Sao lưu nhiều mức tăng dần (Multilevel Incremental Backup)

Một sao lưu Multilevel Incremental Backup giống như sao lưu Incremental Backup, ngoại trừ nó là sao lưu tất cả các tập tin đã được sửa đổi kể từ lần cuối n-1 mức sao lưu.

Với sao lưu Multilevel Incremental Backup, một bản sao đầy đủ được xem là một mức sao lưu mức 0. Điểm mạnh của sao lưu Multilevel Incremental

Backup là bao gồm lợi thế của sao lưu Incremental Backup và sao lưu Differential Backupsa.

3.3.6. Các giải pháp xây dựng hệ thống chịu lỗi (Disaster Recovery)3.3.6.1. Các yếu tố để xây dựng hệ thống Disaster Recovery 3.3.6.1. Các yếu tố để xây dựng hệ thống Disaster Recovery

Hình 3.3. Biểu đồ chi phí và thời gian khôi phục hệ thống

Hiện nay có rất nhiều phương thức và giải pháp thực hiện DR, các phương thức thực hiện phụ thuộc vào một số yếu tố sau :

Recovery Time Objective ( RTO ) : Là khoảng thời gian yêu cầu khôi phục chức năng kinh doanh, ứng dụng, server, mạng để tiếp tục hoạt động.

Recovery Point Objective (RPO ) : Là yêu cầu về thời điểm khôi phục dữ liệu trên hệ thống khi sảy ra sự cố. Yếu tố này được tính bằng thời gian.

3.3.6.2. Sử dụng băng từ (Tape backup)

Phương pháp này đơn giản sao chép các băng từ tới một địa điểm khác. Khi cần khôi phục dữ liệu thì khôi phục dữ liệu từ băng từ.

- Ưu điểm

o Giải pháp đơn giản. o Chi phí đầu tư đơn giản. o Tiện lợi với lượng dữ liệu lớn.

o Khoảng cách không bị giới hạn bởi giới hạn công nghệ. - Nhược điểm

o Thời gian khôi phục lâu (lên tới nhiều ngày). o Lượng dữ liệu mất lớn khi khôi phục.

o Không thể tự động phục hồi hệ thống khi có sự cố.

3.3.6.3. Remote Mirroring

Hình 3.4. Mô hình hệ thống Remote Mirroring

Với phương pháp này dữ liệu sẽ được ghi bởi ứng dụng tới hệ thống file system và sẽ được sao lưu thành hai phiên bản bởi phần mềm quản lý volume (Volume Management). Với phương pháp này, dữ liệu sẽ được lưu thành hai phiên bản giống nhau tại hai trạm. Trong điều kiện làm việc bình thường thì chỉ các máy chủ tại trạm chính mới có quyền truy cập dữ liệu. Các hệ thống tại DR được đặt ở chế độ standby mode và không ứng dụng nào có quyền truy cập. Chỉ khi nào có sự cố thì các máy chủ tại trạm phụ được được active và truy cập vào dữ liệu

- Ưu điểm :

o Không bị mất mát dữ liệu. o Phù hợp với lượng dữ liệu lớn.

o Cấu hình có thể tùy biến uyển chuyển. - Nhược điểm

o Khoảng cách bị giới hạn bởi giao thức FC. o Tải lớn tại các máy chủ.

3.3.6.4. Đồng bộ dữ liệu mức phần cứng ( Hardware Replication)

Hình 3.5. Mô hình hệ thống đồng bộ hóa dùng phần cứng

Phương pháp này sử dụng tính năng đồng bộ dữ liệu của thiết bị lưu trữ. Với phương pháp này thì không một máy chủ nào tham gia vào quá trình đồng bộ dữ liệu. Toàn bộ quá trình đồng bộ dữ liệu trong suốt với các ứng dụng cũng như các máy chủ. Vì vậy không tạo nhiều tải lên hệ thống ứng dụng cũng như máy chủ. Trong hầu hết các trường hợp, có hai phương pháp đồng bộ dữ liệu: đồng bộ và dị bộ

- Ưu điểm

o Không bị mất mát dữ liệu (trong trường hợp triển khai chế độ đồng bộ).

o Khả năng uyển chuyển (có thể chọn chế độ đồng bộ hoặc dị bộ tùy theo chất lượng đường truyền).

o Giải pháp ít phức tạp hơn.

o Không phát sinh tải tại mức máy chủ. o Một điểm đồng bộ dữ liệu duy nhất. - Nhược điểm

o Chi phí có thể cao.

o Phụ thuộc vào hệ thống lưu trữ.

3.3.6.5. Đồng bộ dữ liệu dùng phần mềm (software replication)

Hình 3.6. Mô hình hệ thống đồng bộ hóa dùng phần mềm

Phương pháp này không cần sử dụng khả năng của tủ đĩa để đồng bộ dữ liệu sang trạm DR như phương án trước. Thay vì sử dụng phần cứng để đồng bộ dữ liệu, phương án này sử dụng phần mềm ở các máy chủ để đồng bộ dữ liệu. Khi dữ liệu được ghi từ ứng dụng xuống volume thì phần mềm đồng bộ sẽ phát hiện ra các thay đổi và đồng bộ các dữ liệu thay đổi theo chế độ đồng bộ (synchronous) hoặc dị bộ (asynchronous). Phương thức truyền dẫn thường là thông qua giao thức TCP/IP nên khoảng cách không có nhiều giới hạn về khoảng cách giữa hai trạm. Trong điều kiện bình thường, các volume được

đồng bộ không được sử dụng cho tới khi trạm chính ngừng hoạt động, các máy chủ tại trạm phụ sẽ được activate và truy cập dữ liệu.

- Ưu điểm

o Không bị giới hạn bởi khoảng cách. o Bảo vệ lợi ích đầu tư.

o Độc lập với hệ thống lưu trữ. - Nhược điểm

o Tạo nhiều tải tại máy chủ. o Khả năng quản trị phức tạp.

o Lượng dữ liệu đồng bộ bị giới hạn do hạn chế của đường truyền TCP/IP.

o Phụ thuộc vào ứng dụng.

3.3.6.6. Đồng bộ cơ sở dữ liệu (Database replication)

Hình 3.7. Mô hình hệ thống đồng bộ hóa dùng cơ sở dữ liệu

Một phần của tài liệu đồ án kỹ thuật cơ khí Tìm hiểu về hệ thống máy tính chịu đựng lỗi, sẵn sàng cao (Trang 47)