MC/ServiceGuard (Kết cụm của HP)

Một phần của tài liệu Các giải pháp nâng cao tính sẵn sàng hệ thống mạng, mạng ISP công ty viễn thông quân đội VIETEL (Trang 36)

2.9.1. (ỉiói thiệu

MC/ServiceGuarđ là một sản phẩm nâng cao tính sẩn sàng cho hệ thống đang chạy

hè điêu h à n h HP-UX 1 0 . X và 1 ] -X. MC/Service Guard tạo ra một mồi tnrờng. trong đ ó , khi

có một sự kiện lỏi irong một thành phẩn hệ thống như là SPU hoặc Card mạng, dịch vụ {ứng dụng) sẽ được chuyển tới mội SPU khác rồi chạy và cung cấp dịch vụ lại trong một khoáng thời gian rất ngắn.

MC/ServieceGuard được thiết kế phù hợp cho việc loại bỏ các lỗi đơn, và ta có thể dề dìinụ chuyển điều khiển ứng dụng tới SPU khác, do đó ta có thể ngừng SPU gốc để bảo dưỡng hoặc thực hiện mục đích khác của người quản trị.

Chy Tv Khoa Công nghệ Dại học Quốc gia Hà nội

Với MC/Service Guard ta có thể tổ chức các ứng dụng của mình ihành các gói và địrh danh cho nó. Như vậy ta có thể chuyển gói điều khiến đã được dịnh danh tới SPU

khác hoặc liên lạc việc trao đổi với LAN rỗi trong trường họp có một sự cố phần cứng ở

trong SPU gốc hoặc Card mạng. [13]

2.9.2. Đặc điểm và lợi ích của MC/Service Guard

Đặc điểm và lợi ích của MC/Service Guard bao gồm:

r ứng dụng trong suốt (Application transparency): Các máy trạm sẽ không

thể biết một dịch vụ đang chạy trên máy dịch vụ nào.

r Cấu hình ìại mội cách thông minh (Intelligent reconfiguration): Trong

trường hợp bị lỏi, kết cụm tự nó sẽ tự động làm cho dịch vụ sẵn sàng. Không đòi hói một thao tác nào của con người để cấu hình lại kết cụm.

> Côn bằììg tài mềm dẻo: Vào ỉúc nút bị hỏng, hoạt động tải trên nút hổng có thể được phân phối qua các nút còn lại trên kết cụm. Ví dụ, nếu một nút có

ba ứng dụng và nút đó bị lỗi, các ứng dụng này có thế phân tán tới ba máy

khác nhau trong kết cụm.

'r Kiểu máy Mixed Series 800: Một kết cụm có thể có một sự pha trộn với kiểu

máy nghiộp vụ (business server). Ví dụ, một hệ thống lớn T500 có thể trong cùng một kết cụm như một hệ thống K-Series.

r Cập nhật phẩn mém trực tuyến: Các hệ thống trong kết cụm có thề được

nâng cấp phần mém dịch vụ mà không ảnh hưởng đến hoạt động của các

ứng dụng chạy trên kết cụm.

r Sẩn sàng cao: Một nút bất kv trong kết cụm có khả nảng thưc hiện các ứng

dụng phân chia. Nếu một nút bị hỏng, tất cả phẩn ứng dụng phân chia trên

nút sẽ được chuyển đến các nút khác trong kết cụm.

Chy Ty Khoa Công nghệ Đại học Quốc gia Hà nội

> Chuyển đổi ừng dụng nhanh'. Khoảng thời gian từ khi một ứng dụng bắt đầu lỏi dên lúc ứng dụng đó khơi dộng lại trên nút khác là dưới sáu mười giây.

Journaled File System (JFS) thường được sử dụng nhằm tối ưu hoá thời gian thứ lỗi bằng cách giảm thiểu Ihời gian cần thiết để sửa chữa hệ thống file.

> Bảo vệ lỗi cho mạng LAN: Mọi giao diện card mạng (LANIC) đểu có thể có một LANIC dự phòng tương ứng. Nếu LANIC chính hóng, tất cả các địa chí ÍP dược cấu hình trên card mạng chính sẽ chuyển tới card mạng dự phòng.

r Quàn t r ị ứng dụng dễ dàng và mềm dẻo: Các ứng dụng có thế dễ dàng (adsbygoogle = window.adsbygoogle || []).push({});

ngừng và khởi đòng lại trên các nút Irong kết cụm. Màn hình hiến thị các

trạng thái của kết cụm và ứng dụng bang cả chế độ đổ họa và chế độ ký tự

nền.

'y Không có lài nguyên rỗi: Mọi máy đều là máy hoạt động, mọi hệ thống trong kết cụm đéu có thể đang thực hiện các ứng dụng cấp thiết, không có hệ thống nào “ngồi không” để chờ hệ thống khác hỏng. [13]

2.9.3. Khỏa kết cụm (Cluster Lock)

Khóa kết cụm là một vùng đĩa nằm trong một nhóm dung lượng (Volume group) dùng chung cho tất cả các nút trong kết cụm. Khóa kết cụm nhóm dung lượng và tên dung

lượng vật lý (Physical volume) được xác định trong file cấu hình kết cụm. Khóa kết cụm được sử dụng trong sự kiện tranh chấp trong khi một kết cụm đang chạy bị hỏng thì

MC/Service Guard cố dành lại một kết cụm mới. Kết cụm này chia thành hai nửa kết cụm

với kích thước tương đương. Mỏi nửa kết cụm sẽ cố gắng dành được khóa kết cụm. Nửa

kết cụm nào dành dược Khóa kết cụm sẽ thi hành kết cụm mới, ngăn chặn khả năng hai nứa kết cụm chạy cùng một thời điểm. Nếu hai nửa kết cụm không cùng kích thước thì nưa kết cụm có kích thước lớn hơn 50% sẽ thi hành trên kết cụm mới và khóa kết cụm

khóng dược sứ dụng.

Chy Ty Khoa Công nghệ Đại học Quốc gia Hà nội

Nếu trong một kết cụm gồm hai nút, ta phải cấu hình khóa kết cụm. Nếu các kết nối giữa hai nút bị mất thì núi đang chiếm khóa kết cụm sẽ kế lục kết cụm và nút kia sẽ

rmrns, hoạt động. Nếu không cổ khóa kết cụm, ỉồi của nút này sẽ dẫn đến lỗi ở nút kia và kết cụm sẽ bị dừng. Cũng nên chú ý rằng nếu khóa kếl cụm lỗi trong khi một nút đang

tranh chấp thì kết cụm sẽ bị dừng hoạt động.

Ta có the tuv chọn khóa kết cụm đơn hoặc kép dựa trên kiểu cấu hình mà ta xây dựng. Với cá hai khoá đơn hoặc kép, nó quan trọng ở chỗ đĩa của khoá kết cụm đảm bảo

sẩn sàng ngay cả khi một nút bị mất điện. Vì thế sự lựa chọn cấu hình khoá phụ thuộc mộl phần vào sô' nguồn cung cấp điện sẩn có. Bất kể ta chọn thế nào, tất cả các nút trong kết

cụm đều phải truy nhập vào khoá để duy trì hiệu quả cao. [13]

2.9.4. Nhịp tìm

Các sói nhịp tim là cơ chế mà mỗi nút nằm trong kết cụm được tổ chức để truyền

các ihông tin trạng thái.

Mỗi nút gửi một thông điệp nhịp tim đến nút láng giềng với mỗi “nhịp “ HEATREAT_INTERVAL là vài phần triệu giây được xác định trong file cấu hình kết

cụm. Níu láng giềng tìm nhịp thông điệp nàv từ mỗi nút và nếu nó khỏng nhận được thông điệp irong khoảng thời gian NODE_TIMEOUT, kết cụm sẽ khác phục lỏi và sẽ khống gửi gói thôn« điệp nhịp ũm trong thời gian này.

Nếu nhịp tim và dữ liệu được gửi qua cùng một mạng LAN, sự tấc nghẽn dừ liệu có

thế trở ihành nguyên nhân làm cho gói nhịp tim không đến được nút ỉáng giểng. Điéu này có ĩhc dẫn đến sự khỏi phục lồi một nứt mặc dù tất cả các nút đểu hoạt đông bình thường.

Đế ngăn cán tình huống này, ta có thể cấu hình nhiéu tham số nhịp tìm_IP “HEATBEAT_IP" hoặc sử dụng đường Serial (đối với kết cụm có hai nút) cho nhịp tim.

[12J

Chv Ty Khoa Cóng nghè Đại học Quốc gia Hà nội

2.9.5. Gói till (Packaging)

Một ứng dụng chạy trẽn một môi trường MC/ServiceGuard phải được cấu hình cù na với lất Cói các tài nguyên liên quan thành một gói tin. (adsbygoogle = window.adsbygoogle || []).push({});

Thông tin cần thiết để thi hành gói tin trong kết cụm MC/ServiceGuard được chứa

trong file cấu h ì n h của gói tin và Irong script điều khiển gói. Một file cấu hình và một script dieu khicn gói lù cẩn thiết đối với sự tồn tại của mỗi gói tin.

Script điều khiển gói được thực hiện để khởi động hay kết thúc ứng dụng trong mồi

Irường MC/Scrvice Guard.

Tài nguyên cho các gói bao gồm:

> Các Volume Group

r Các địa chi IP

y Các liến trình dịch vụ Các file gói bao gổm:

r File Cấu hình gói (pkg.conf)

> Script dieu khiển gói (pkg.cntl)

2.9.6. NODE Fai! Fast

'r NODE Fail Fast Disabled

Nếu c ó nhiêu gói tồn tại trên cùng một nút và có một số gói đó bị lỗi. Theo ngầm

định, chi có gói bị lồi sẽ được chuyến đến nút khác. Cách xử lý này gọi là NODE NODE

Fail Fast Disabled. Với HP-UX 11.x, tiến trình này có thể cấu hình cho mỗi gói.

r NODE Füll Fast Enabled

Chy Ty Khoa Công nghệ Đại học Quốc gia Hà nội

Khi mộ! gói được cấu hình với NODE_FAILFAST_ENABLED YES. nó sẽ gây ra

lỗi cho tất cả các gói trong cùng nút đó nếu:

• Nút mất sự kết nối. hoặc

• Script để ngừng gói bị lồi.

Việc gâv ra một lỗi trong một nút không làm ảnh hưởng đến các gói khác hoặc ảnh

hườn« đến các phần mểm không chạy trên môi trường MC/Service Guard, vì thế Iham số

này chi nên thiết iập khi một gói chứa một dịch vụ mà sự mất đi dịch vụ đó có thể làm nút dó không sử dụng.

Node Fail Fast Enabled

.. 1

|— F E g g — I

i PkQ 3 I

!___ ________

Node Fail Fast Disabled (adsbygoogle = window.adsbygoogle || []).push({});

- X Pkg 2

P kg3 After ’

Failure P kg2

Hìnli 2.10 Minh họa về NODE Fa il Fast

I Pkq'i....1

I FRg~2~~'|

I FíặT5 "1

2.9.7. Các cư ché thứ lồi (Failover Policies)

Cơ chế thứ lỗi được sử dụng để xác định nút khởi động gói khi một gói bị lỗi.

Cơ chế ngầm định là CONFICrƯRED_NODE. Cơ chế này sẽ chọn một nút trong trật iự ưu tiên từ danh sách nút (NODE_NAME) trong file cấu hình gói. Cơ chế luân phiên là núi tối thiểu số gói (MINJPACKAGE_NODE). Cơ chế này chọn ra một nút mà nút này

sẽ ihực ihi số gói ít nhất tại thời điểm có gói bị lỗi và đùng nút này để khởi động lại.

Chy Ty Khoa Còng nghệ Đại hoc Quốc gia Hà nội

2.9.8. ( ’ông cụ MCVService Guard

Còng cụ Enterprise Cluster Master (B5139BA) được phát triển đế đơn giản hóa việc thiét l ậ p cúc gói liên quan tới NFS và Cơ sở dữ liệu. NFS, Cơ sớ dữ liệu và Netscape không thế khới động như một tiến trình địch vụ, vì thế nó đòi hỏi một ứng dụng giám sát các script.

Tầm quan trọng của công cụ này là bao gồm một script giám sát cho mỗi ứng dụng,

giúp cho người cài dặt khỏi viết script giám sát ứng dụng.

Cổng cụ Enterprise Cluster hứa hẹn sẽ xây dựno tất cả script mà tương lai yêu cầu.

Cộng cụ Enterprise Cluster Master (B5139BA) hiện nay đã có

r Cơ Sơ dữ liệu • Oracle

• Informix

• Sysbase and Progress

r Domain Software

• Netscape Enterprise Server

• Netscape Proxy Server

• Netscape Livewire

• Netscape FastTrack Server [13]

Chy Tv Khoa Công nghệ Đại học Quốc gia Hà nội

2.10. SteelEye LifeKeeper (Két cụm của SteelEye)

2.10.1. Giói thiệu

SteelEve™ một trong những nhà cung cấp phần m ề m nổi tiếng cho các doanh (adsbygoogle = window.adsbygoogle || []).push({});

nghiệp, các tổ chức về giải pháp sẩn sàng cao và sự khôi phục tai họa. SteelEye đạt dược việc tích hơp và dẽ dàng thi hành giải pháp ứng dụng sẵn sàng cao và bản sao dữ liệu cho những hệ thống truyéu thỏng và phức tạp với giá thành rẻ

LifeKeeper cung cấp một giải pháp thứ lỗi đầv đủ để đặt được tính sán sàng cao

cho dữ liệu, những ứng dụng, và những tài nguyên truyền thông. LifeKeeper không yêu cầu sự tùy biến phần cứng với sự chịu đựng lỗi cao. LifeKeeper cho phép nhóm các máy dịch vụ tù hai đên mười sáu máy cho mỗi kết cụm , tự động việc phát hiên lỗi và khắc

phục lỗi.

Trong trường hợp có một lỏi xảy ra, LifeKeeper dịch chuyển những tài nguyên cần bảo v ệ từ nút bị lồi tới một nút khác đã xác định trước. Người dùng có thể bị gián đoạn

trong thời gian dịch chuyển, nhưng LifeKeeper tự động khôi phục những tiến trình của hệ ihổng cũ khi nó hoàn thành sự dịch chuyển.

Các loại tài nguyên mà LifeKeeper hỗ trợ tự động địch chuyển, báo vệ và khắc

phục lỗi bao gồm:

r Tiến trình và ứng dụng

r Thiết bị lưu trữ chung

Ã- Thiết bị lưu trữ qua hệ thống mạng (Network Attached Storage Device)

r File hệ thống (ext2, ext'3, Ilfs)

'r Tài nguyên truyền thông (TCP/IP)

'r ứng dụng cơ sơ dữ liệu (Oracle, Informix Dynamic Server, MySQL. DB2)

Ch V Tv Khoa Cóng nghệ Đai học Quốc gia Hà nội

r Tài nguyên ứng dụng Web (IIS, Apache. Apache SSL)

r Tài nguyên thư điện tử (Sendmail, SAMS, SMMS) > Dịch vụ in (lpđ)

r Samba ( file và chia sẻ máy in) [201

2.10.2. Phân mềm công cụ khôi phục ứng dụng (Application Recovery Kit

Software)

LifeKeeper cho phép báo vệ tài nguyên trong một máy dịch vụ. Những tài nguyên cán được bao vệ đã dược chỉ rõ trong các thành phần cúa cóng cụ khôi phục ứng dụng.

Nhân của LifeKeeper cho Hệ điều hành Linux cung cấp các cống cụ khôi phục các

tài nguvên sau:

> File hệ thống (File System)

r Úng dụng file hệ lhống (Application with file system)

r- ứng dụng với phân chia vùng đĩa (Application with Disk Partition)

^ Địa chi IP (IP)

Mỗi một cổng cụ khôi phục định nghĩa các kiểu tài nguyên liên quan tới kiểu của

ứng dụng đó mà dược bảo vệ bới LifeKeeper.

2.10.3. Đường truyền thông (Communication Path) (adsbygoogle = window.adsbygoogle || []).push({});

LifeKeeper giám sát các tài nguyên điều khiển và cung cấp khả năng khôi phục lỗi

thông qua đường truyền thông chia sẻ giữa các máy dịch vụ. LifeKeeper sử dụng đường truyền thông đế theo dõi các tình trạng của các máy dịch vụ. Đường truyền thông là điểm

mấu chốt đê LifeKeeper có thể phát hiện lỗi và khôi phục tài nguyên trong khi các máy

ChV Ty Khoa CotĩỊỊ nghệ tìai học Quốc gia Hà nội

(lịch vụ dang hoạt động. Cho nên I1Ó rất cần đến việc xác định nhiều đường truyển dự phòng sứ dụng các giao thức khác nhau.

Trước khi xác định tài nguvèn hoặc phân cấp tài nguyên trong LifeKeeper, ta cẩn phai xác (tịnh đường truyền thông cho mỗi máy dịch vụ. LifeKeeper sử dụng đường truyền thỏim dể kết hợp với việc xác định các tài nguyên, trạng thái, tình trạng giữa các máy dịch

vụ cho việc phát hiện và khắc phục lỗi.

LifeKeeper cung cấp ba kiểu đường truyền ihông khác nhau, cho nên ta có thể

định nahĩa đường truyền thông dự phòng sử dụng giao thức khác nhau. Dự phòng đường liuyén thông với eiao thức khác nhau cho phép tránh khói những việc khác phục do yêu cầu phái sinh mộl khi đường truyền thông bị lỗi.

Khi định nghĩa đường truyền thông, ta phải xây dựng một mức độ ưu tiên cho mỗi

dường.

Các đường truyền thông hỗ trự bởi LifeKeeper bao gổm:

r TCP/IP (Socket): Thường là đường LAN có độ ưu tiên cao nhất.

'y TTY(serial port): Đường truyền thông TTY sử dụng thường xuyên sau TCP/IP trong trường hợp chỉ có hai máy dịch vụ.

> Đĩa dùng chung: LifeKeeper cho phép định nghĩa một vùng đĩa ihỏ (raw

disk) trong cùng mộĩ đĩa chia sẻ như ỉà một nơi liên kết giữa hai máy dịch vụ. Đường truyền thông bằng vùng đìa dùng chung phái được định nghĩa cùng vùng đĩa mà cả hai máy dịch vụ sử dụng chung. Vùng đĩa

thường là nhỏ (1 MB) và không bao gồm file hệ thống. [19]

C hy Ty Khoa Công nghệ Đại học Quôc gia Hờ nội

2.11. Microsoft Cluster (Kết cụm của Microsoft)

2.11.1. Giới thiệu vé việc thiết lặp Microsoft Cluster

Microsoft Cluster Server (MSCS) dược thiết kế để cung cấp độ sẵn sàng cao cho dữ liệu và các ứng dựng qua mô hình khác phục lỗi. Nó [à phần có sẵn trong các hệ điểu hành

Microsoft Windows NT5 Server 4.0, Enterprise Edition, Windows'1 2000 Advanced Server và Windows 2000 Datacenter.

Windows NT Server 4.0 phiên ban Enterprise và Windows 2000 Advanced Server

chí hỗ trợ các kết cụm với hai nút. trong khi đó Windows 2000 DataCenter hồ trợ từ hai đến bốn nút. Nếu một ứng dụng hay tài nguyên trên một nút bị lỗi, núi này sẽ cố sắng

khởi đông lại. Nếu ứng dụng hay tài nguyên vượt quá ngưỡng, kết cụm sẽ cô gắng khởi

động lại nó trên một nút khác. Quá trình thứ iỗi có thể xuất hiện nhanh chóng trong một vài giây phụ ihuộc vào kiểu tài nguyên.

Sản phẩm về kết cụm dầu tiên của Microsoft là Microsoft Cluster Server (MSCS)

1.0, được xuất bán cùng với Microsoft Windows NT Server 4.0 phiên bản Enterprise. MSCS (mã nguồn gọi là "wolfpack”) chạy trên một kết cụm với hai nút. Ngoài ra sản

phẩm cho phép các dich vụ nằm trong Windows NT bao gổm dịch vụ file, dịch vụ in và dịch vụ Web khỏi động lại hoặc chuyển các tài nguyên từ một núi đến nút khác trong kết

cụm. (adsbygoogle = window.adsbygoogle || []).push({});

Microsoft cũng tạo ra một giao diện lập trình ứng dụng kết cụm (API) cho phép

những người lập trình thứ ba tạo các ứng dụng sản phẩm kết cụm MSCS. Microsoft bám

sát với một số sản phẩm ứng đụng như Microsoft SQL Server và Microsoft Exchange Server. Với dòng sản phẩm Microsoft Windows 2000 Server, Microsoft đề cao kết cụm

bảna cách đưa vào tính nảng cân bằng tải IP và các ứng dụng dựa trên Microsoft

Một phần của tài liệu Các giải pháp nâng cao tính sẵn sàng hệ thống mạng, mạng ISP công ty viễn thông quân đội VIETEL (Trang 36)