2.7 Hub cho kênh quang
Hub được sử dụng để kết nối các thiết bị thành một vòng lặp FC-AL đơn giản. Hub cung cấp kết nối nối các port với nhau thành một vòng loop, gửi các khung đi trên các port này. Khác với Switch, hub không có chức năng định tuyến khung mà chỉ đơn thuần chuyển vật lý về mức tín hiệu điện.
Hub kết nối các thiết bị thành một vòng loop hình sao, tại mỗi điểm nối hub có một khối bypass giúp cho tín hiệu có thể truyền đến node tiếp theo trên vòng lặp khi node đó có sự cố hoặc không hoạt động.
Hub có 02 loại là: Hub không có chức năng quảng lý và Hub có chức năng quản lý.
2.7.1 Hub không có chức năng quản lý (Unmanaged Hub):
Là loại hub chỉ đơn thuần tạo kết nối cho các node và có khối xác định trạng thái của từng port để nhận biết đầu nối đó đang được gắn vào hay tháo khỏi hub. Hub loại này không có phần mềm đi kèm. Nhược điểm của loại hub này là khó quản lý, băng thông bị chia sẻ cho các thiết bị.
2.7.2 Hub có chức năng quản lý (managed hub):
Được sản suất ra để giải quyết các vấn đề của unmanaged hub. Khác với hub không có chức năng quản lý, Hub có chức năng quản lý có thêm một số chức năng như: xác định lỗi trên port, hỗ trợ quản lý qua telnet, giao diện web hoặc quang giao thức SNMP.
2.8 Switch trên kênh quang:
Như đã đề cập đến ở chương trước, khi các switch ghép lại thành một mạng thì mạng đó được gọi với tên là fabric. Trên mạng fabric các khung được định hướng đi trên một hoặc nhiều switch khác nhau nhờ các khối thông dịch địa chỉ đích đến trên từng switch.
Switch cung cấp nhiều kết nối hơn so với hub và được sử dụng trong các mô hình kết nối FC-AL hoặc Fabric. Chúng thường có từ 8 đến 16 cổng, một switch độc lập
có thể tạo một SAN nhỏ. Băng thông cho mỗi cổng thường lớn hơn 100Mb/s, vì vậy các khung dữ liệu (frame) được truyền nhận giữa các node trong SAN ở tốc độ cao.
2.9 So sánh SAN với các công nghệ lƣu trữ khác
Mô hình lưu trữ gắn liền với máy chủ - DAS (Direct Attached Strorage) và mô hình lữu trữ mạng – NAS (Network Area Storage) là hai công nghệ được sử dụng phổ biến trước SAN. DAS sử dụng thiết bị lưu trữ được gắn liền với máy chủ, mỗi máy chủ có một thiết bị lưu trữ riêng biệt và không chia sẻ cho server khác được (Hình 2.27). Khác với DAS, NAS sử dụng một thiết bị lưu trữ riêng biệt cho tất cả các thiết bị trên mạng, các thiết bị này kết nối tới tủ lưu trữ qua môi trường TCP/IP (hình 2.28)
Hình 2.27 Mô hình lƣu trữ DAS
Hình 2.29 Mô hình lƣu trữ SAN
2.9.1 Ưu điểm của SAN so với DAS
- Tận dụng tối đa khả năng sử dụng dữ liệu có trên thiết bị lưu trữ nhờ việc quản lý tập trung.
- Quản lý tập trung, đơn giản- giảm chi phí cho vận hành và quản lý - Linh hoạt trong cấu hình.
- Giảm tắc nghẽn dữ liệu trên mạng nhờ sử dụng mạng riêng - Tính an toàn và độ khả dụng cao hơn NAS.
- Tăng hiệu suất trong sao lưu dữ liệu.
- Bảo vệ được chi phí đầu tư khi nhu cầu tăng, nâng cấp thiết bị lưu trữ phát sinh.
2.9.2 Ưu điểm của SAN so với NAS
Khác với DAS, NAS làm việc khá tốt trong việc cung cấp vùng lưu trữ tập trung cho các thiết trên mạng. Tuy nhiên khi dung lượng yêu cầu tăng lên thì NAS lại gặp khó khăn trong việc thêm thiết bị lưu trữ trong mạng và quản lý tập trung. NAS thực hiện sao lưu dữ liệu qua mạng TCP/IP nên gây ảnh hưởng đến hiệu năng của mạng khi hoạt động, đặc biệt với phiên sao lưu có kích thước lớn.
Bảng sau đây sẽ mô tả điểm khác nhau giữa hai công nghệ lưu trữ này
SAN NAS
Giao thức Fibre Channel TCP/IP
và khả dụng cao, đảm bảo tính liên tục của giao dịch giữa máy chủ và thiết bị lưu trữ
Ứng dụng sao lưu và phục hồi dữ liệu
Ứng dụng đòi hỏi tính tập trung vùng lưu trữ, tập trung server
dữ liệu chỉ đọc (read only database access)
Các ứng dụng chia sẻ file dữ liệu
Dữ liệu có kích thước nhỏ truyền trên khoảng các xa.
Ưu điểm
Dữ liệu truyền đi có kích thước lớn
Dữ liệu truyền đi đảm bảo Linh hoạt trong cấu hình Không ảnh hưởng đến hiệu năng của mạng cục bộ - LAN Hiệu năng cao, độ ổn đinh, kháng lỗi lớn.
Quản lý tập trung
Tương thích với nhiều nhà cung cấp
Triển khai, vận hành đơn giản
Tốt cho các ứng dụng có yêu cầu chia sẻ dữ liệu có kích thước nhỏ và thời gian đáp ứng không khắt khe
-
3 CHƢƠNG 3: HIỆU SUẤT LƢU TRỮ SAN
3.1 Các nhân tố hiệu năng:
Trong việc giám sát, đo lường, kiểm định hiệu năng thì bước thu thập và phân tích dữ liệu là phức tạp nhất. Với SAN do có nhiều nhân tố, đối tượng ảnh hưởng đến hiệu năng nên công việc này lại càng phức tạp hơn nhiều lần.
3.1.1 Tốc độ dữ liệu:
Hầu hết các ứng dụng (90%) sử dụng IO block có kích thước từ 2KB đến 8KB và yêu cầu một lượng lớn số IO trong một giây (I/Os). Phần còn lại khoảng 10% ứng dụng yêu cầu số lượng nhỏ IO trong một giây nhưng kích thước của mỗi IO block lại rất lớn.
SAN và các thành phần của nó như đĩa cứng, thiết bị điều khiển, mức RAID có thể được thiết kế để tăng tối đa số IO trong một giây hoặc tăng kích thước của từng block trên giây (MB/s) nhằm tối ưu hóa cho từng ứng dụng.
Ví dụ: Một ứng dụng có yêu cầu 2000 I/O trên một giây, kích thước mỗi I/O là 8KB. Hình vẽ từ kết quả thống kê (hình 3.1) cho thấy để đáp ứng được yêu cầu của ứng dụng này cần có một kênh truyền có tốc độ dữ liệu khoảng 16MB/s. Với những ứng dụng sử dụng kích thước I/O nhỏ hơn sẽ yêu cầu tốc độ thấp hơn.
3.1.2 Thời gian đáp ứng (Response Time):
Thời gian đáp ứng phản ánh hiệu năng của hệ thống lưu trữ. Thời gian đáp ứng của một hệ thống là tổng thời gian làm việc của các khối đơn lẻ trong hệ thống đó.
Ví dụ: Có một hệ thống như hình 3.2. Máy chủ có tốc độ xử lý là 500MB/s, được cắm một card HBA có tốc độ xử lý 80MB/s. HBA được nối đến mạng FC_AL trên bus có tốc độ 90MB/s. Controller của tủ lưu trữ có tốc độ xử lý dữ liệu là 55MB/s.
Nếu máy chủ có yêu cầu trao đổi dữ liệu nhiều và trong khoảng thời gian ngắn với tốc độ lớn hơn 80MB/s thì hiện tượng thắt cổ chai sẽ xảy ra.
Hình 3.2 Minh họa hiện tƣợng nghẽn cổ chai
Hiện tượng thắt cổ chai xảy ra khi có dữ liệu chuyển từ thiết bị có tốc độ cao tới thiết bị có tốc độ thấp. Việc chia tải không cân bằng cho các đĩa trên thiết bị lưu trữ cũng gây ảnh hưởng đến thời gian đáp ứng của toàn hệ thống (lỗi này có thể khắc phục được bằng việc triển khai RAID trên tủ lưu trữ). Vì vậy thời gian đáp ứng của hệ thống là tổng thời gian làm việc (service time) của các khối thành phần của thiết bị đó.
3.1.3 Hiệu năng của đĩa cứng:
Các yếu tố sau đây có ảnh hưởng đến hiệu năng truy suất của đĩa cứng: - Kiểu bus
- Thời gian tìm kiếm - Tốc độ quay của đĩa
- Kiểu dữ liệu cần đọc: là ngẫu nhiên (yêu cầu số lần truy cập I/O cao) hay tuần tự (yêu cầu MB/s cho một lần cao).
Thời gian trễ lớn nhất với tủ đĩa là thời gian cho cơ cấu vật lý làm việc. Mặc dù lượng dữ liệu lưu trữ lên một đĩa ngày càng tăng lên, kích thước của đĩa ngày càng giảm xuống nhưng thời gian tìm kiếm và thời gian quay của đĩa vẫn giới hạn hiệu năng của đĩa.
Hình 3.3 Các yếu tố ảnh hƣởng đến hiệu năng của đĩa cứng
Mức RAID, số lượng đĩa của tủ đĩa cũng phản ánh hiệu năng của tủ. Hình 3.4 mô tả điều này:
Hình 3.4 Mô tả hiệu năng của tủ với mức RAID và số lƣợng đĩa trên tủ
Trên hình vẽ có 04 tủ với cấu hình khác nhau:
- Tủ JBOD (just bunk of disk): là tập hợp nhiều đĩa đấu nối lại với nhau thành một đĩa lớn hơn.
- Tủ 12RO: Tủ có 12 đĩa cấu hình RAID0 - Tủ 24RO: Tủ có 24 đĩa cấu hình RAID0
Hình 4.5 cho thấy rằng càng có nhiều đĩa cấu hình RAID0 ( phân dữ liệu đều ra các đĩa) thì tủ có khả năng đáp ứng yêu cầu IO càng lớn. Điều này cũng có nghĩa là cùng với sự phát triển của cơ sở dữ liệu, để hiệu năng đảm bảo thì phải sử dụng nhiều đĩa có dung lượng phù hợp thay vì dùng ít đĩa có dung lượng lớn.
3.2 Nhiễu, suy giảm tín hiệu trên kênh quang
3.2.1 Suy hao (Attenuation):
Với đa số các cáp quang có trên thị trường hiện nay, cáp đơn mode có độ suy hao sấp sỉ khoảng 0.5 dB/km và 1.000dB/km với cáp đa mode. Các nguyên nhân chính gây ra suy hao năng lượng là:
- Do cáp bị gập, uốn cong.
- Do tán sắc tạo nên bởi vật liệu không trong suốt, hoặc lỗi chế tạo trong mức lõi. - Tán sắc và phản xạ tại điểm nối.
Với mỗi bước sóng khác nhau thì độ suy hao cũng khác nhau.
3.2.2 Tán sắc (Dispersion):
Là hiện tượng tán sắc ánh sáng khi tia sáng truyền dọc sợi cáp quang. Sự tán sắc được tạo bởi việc chồng lấp ánh sáng có bước sóng khác nhau và hệ số khúc xạ của vật liệu làm lõi cáp.
3.2.3 Trễ (Latencies):
Mỗi frame có kích thước phần dữ liệu là 2048 bytes. Với tốc độ kênh quang thì mỗi byte dữ liệu được truyền đi (dang nối tiếp) sử dụng tối thiểu 02 mét cáp (với sóng ngắn). Như vậy một khung dữ liệu nếu truyền một lần với thiết bị không có bộ đệm là 2m/byte x 2,048bytes/frame = 4.1km/frame. Điều này có nghĩa là phải sử dụng một sợi cáp 10Km cho 2.4 frame, chính vì lý do này nên các thiết bị chuyển mạch đều phải có bộ đệm cho từng cổng để đệm dữ liệu trước khi gửi đi.
Khi thiết kế SAN cần cân nhắc một số điểm sau:
- Độ trễ tăng lên cùng với kích thước dữ liệu. - Đỗ trễ tăng lên khi buffer không có đủ chỗ chứa.
3.3 Đặc thù môi trƣờng:
3.3.1 Các mức RAID và chọn lựa:
Hệ thống RAID là một tập hợp của nhiều đĩa đơn lẻ được quản lý bởi một khối điều khiển hoặc phần mềm. RAID có thể triển khai ở cả mức vật lý lẫn phần mềm. RAID giúp hệ thống vượt qua được giới hạn thông thường của đĩa cứng đơn lẻ. RAID có nhiều mức khác nhau, mỗi mức sẽ đáp ứng được một trong các tiêu chí:
- Hiệu năng - Chi phí
- Mức khả dụng (availability)
Khi thiết kế SAN, người thiết kế phải nắm bắt được yêu cầu của người dùng để chọn mức RAID phù hợp, mỗi mức RAID khác nhau sẽ có ảnh hưởng khác nhau về kiểu đọc và ghi dữ liệu. Ví dụ mức RAID5 sẽ cải thiện đáng kể tốc độ đọc dữ liệu nhưng lại giảm hiệu năng với thao tác ghi dữ liệu [1].
3.3.2 Các mức RAID :
RAID 0 tripping: cung cấp khả năng phân bố lượng IO trải đều trên các đĩa, nhưng không có khả năng bảo vệ dữ liệu (protection) khi có sự cố. RAID 0 thích hợp cho các ứng dụng chạy thử nghiệm, ứng dụng có tính đơn giản trong việc khôi phục dữ liệu. RAID 0 là mức RAID có tốc độ đọc/ghi nhanh nhất.
RAID 1 Mirroring: Dữ liệu được lưu thành 02 bản, có thể phục hồi dữ liệu khi một bản có sự cố. RAID 1 cải thiện được hiệu năng với các thao tác đọc dữ liệu nhưng không cải thiện được tốc độ ghi dữ liệu.
RAID 1+0 Striped mirror: là mức RAID cung cấp cả tính năng bảo vệ dữ liệu vì có mirror và cải thiện hiệu năng với thao tác viết vì dữ liệu được ghi trên nhiều đĩa. Mức RAID này là tổng hợp các ưu điểm của RAID 1 Mirroring và RAID 0 Stripping.
RAID 4 Independent access, dedicated parity driver: cung cấp tốc độ đọc nhanh, tuy nhiên tốc độ viết lại khá chậm.
RAID 5 Independent access, parity striped over all the drives: có khả năng đọc song song với nhiều đĩa trong cụm. có tính năng đảm bảo dữ liệu hơn các kiểu RAID trước đây vì phần bít chẵn lẻ được lưu trên rải rác trên các đĩa.
Adaptive RAID 3/5: Raid 3 và raid 5 lưu trữ dữ liệu và thông tin chẵn lẽ giống nhau về cách thức và vị trí. Điểm khác biệt giữa hai mức raid này là cách đọc và viết dữ liệu: raid 3 cho phép đọc/ghi song song, raid 5 lại đọc/ghi riêng rẽ.
Truy cập song song (parallel access) được sử dụng cho ứng dụng yêu cầu băng thông cao (high bandwitdth), Truy cập riêng rẽ (independent) được sử dụng cho các ứng dụng yêu cầu lưu lượng cao (high I/O). ứng dụng có yêu cầu lưu lượng cao sẽ sử dụng mức raid 5. dữ liệu thường backup và restore (khối lượng lớn) nên sử dụng mức raid 3.
3.3.3 So sánh giữa các mức RAID
Raid 0 Raid 1+0 Raid 4 Raid 5 Raid 3/5 Hiệu năng
đọc Cao nhất Cao Cao Cao Cao Hiệu năng
ghi Cao Cao Thấp Thấp Thấp Tải phải chịu trên một I/0 Đọc Ghi Đọc 2x ghi Đọc 4x ghi Đọc 4x ghi Đọc 4x ghi Dung lượng mất đi do raid 0 % 50% tổng
dung lượng 1 đĩa 1 đĩa 1 đĩa
Rủi ro mất dữ liệu Cao Thấp (raid 0+10 Thấp nhất (raid 1) Thấp Thấp Thấp Ứng dụng Ứng dụng thường, dữ liệu chỉ đọc Ứng dụng quan trọng, tần suất viết cao ứng dụng quang trọng, tần suất ghi thấp ứng dụng quang trọng, tần suất ghi thấp ứng dụng quang trọng, tần suất đọc ghi cao
3.3.4 Tương quang hiệu năng của RAID với thao tác đọc ghi
Mới mỗi mức raid khác nhau, hiệu năng của các thao tác đọc/ghi cũng khác nhau. Hình 3.5 sau mô tả một ví dụ điển hình:
Hình 3.5 tƣơng quan hiệu năng với thao tác đọc ghi
Hình 3.5 so sánh các mức raid 0, raid 0+1, raid 5 với các thao tác khác nhau. Với Logfile (thao tác ghi 100%, thao tác đọc là 0%), raid 0 có hiệu suất ghi là 100 thì raid 0+1 chỉ có được khoảng gần 50% hiệu năng và raid 5 chỉ còn có khoảng 21%.
Với thao tác đọc. khi đến 100% thao tác của ứng dụng với tủ đĩa là đọc thì mức hiệu năng của 03 loại RAID lại bằng nhau. Tùy theo điều kiện của ứng dụng mà tỷ lệ đọc/ghi sẽ thay đổi khi đó hiệu năng tương quan giữa tỷ lệ đọc/ghi và hiệu năng làm việc của tủ đĩa (service time) cũng thay đổi [1].
3.3.5 Một số môi trường ứng dụng tiêu biểu:
Một số môi trường ứng dụng tiêu biểu sau đây được thu thập từ kết quả đo lường. và được các hãng lớn như IBM, HP sử dụng để đề xuất trong việc tối ưu hóa cấu hình tủ đĩa.
3.3.5.1 SQL Server 2000:
Cơ sở dữ liệu SQL 2000 có một số đặc tính: - Truy cập nhẫu nhiên
- Kích thước IO là 64KB cho các bảng (table) và index
- Ghi không đồng bộ: có tần suất đẩy dữ liệu và thời gian đáp ứng không quan trọng.
- Hỗ trợ truy xuất đa luồng (multi thread),
SQL log file: kích thước IO là 8 đến 60 KB, dữ liệu ghi đồng bộ 100%, đơn luồng dữ liệu.
3.3.5.2 Oracle 8 :
Cơ sở dữ liệu của Oracle 8 có các đặc tính:
- Kích thước IO là 8KB ( là 32K cho các ứng dụng Datawarehouse)