iSCSI là một giao thức dựa vào TCP/IP dành cho việc thiết lập và quản lý các kết nối giữa các thiết bị lưu trữ dựa vào IP, các máy chủ và máy khách. Có thể sử dụng giao thức iSCSI trong hạ tầng mạng SAN cho việc truyền dữ liệu tốc độ cao tại mức block giữa các thành phần trong mạng lưu trữ dữ liệu.
Kiến trúc của iSCSI dựa vào mô hình client/server, nó được triển khai trong môi trường mà các thiết bị rất gần nhau và được kết nối với bus SCSI. Việc đóng gói phân phối tin cậy các khối dữ liệu giữa thiết bị nguồn và thiết bị đích qua mạng TCP/IP là chức năng chính của iSCSI. iSCSI cung cấp cơ chế cho việc đóng gói các lệnh SCSI trên mạng IP và thao tác phía trên TCP.
Đối với mạng lưu trữ SAN, yêu cầu then chốt của truyền dữ liệu là: - Hợp nhất các hệ thống lưu trữ dữ liệu.
- Backup dữ liệu. - Phân cụm server. - Sao chép dữ liệu. - Phục hồi dữ liệu.
Tất cả các thao tác phải được kiểm soát trong một môi trường an toàn với QoS. iSCSI được thiết kế để thực hiện các chức năng trên trong mạng TCP/IP một cách an toàn với QoS thích hợp. iSCSI có bốn thành phần sau:
- Quy ƣớc đặt tên và địa chỉ iSCSI: một node iSCSI là một định danh của thiết bị iSCSI trong mạng. Mỗi node iSCSI có một tên iSCSI duy nhất (lên tới 255 byte) được tạo theo các luật của các node Internet.
- Quản lý phiên iSCSI: Phiên iSCSI gồm có pha đăng nhập và pha Full Feature, nó được thực hiện bởi một lệnh đặc biệt.
- Xử lý lỗi iSCSI: trong một số mạng IP có xác suất lỗi cao trong phân phối dữ liệu, đặc biệt là trong mạng WAN, khi đó iSCSI có thể cung cấp phương thức xử lý lỗi.
- Bảo mật iSCSI: iSCSI có thể được sử dụng trong mạng ở đó dữ liệu có thể được truy cập không hợp lệ, giao thức này cho phép các phương thức bảo mật khác.
Giao thức iSCSI cho phép những khối dữ liệu SCSI (lệnh hoặc dữ liệu) chuyển qua hệ thống mạng dựa trên nền tảng TCP/IP. Giao thức iSCSI được đánh giá như một công nghệ then chốt để phát triển thị trường SAN. Do tính phổ biến của mạng nên iSCSI dễ dàng được chấp nhận và được ứng dụng một cách rộng rãi.
Đặc tả iSCSI bổ sung thêm vào giữa tầng giao vận TCP/IP một lớp chức năng nhằm cung cấp thêm một số dịch vụ như dịch vụ mã hóa dữ liệu IPSec. Lớp Data Sync
phục vụ cơ chế định hướng và đồng bộ dữ liệu. Lớp Data Sync đảm bảo đúng thứ tự lệnh, dữ liệu và làm phù hợp dữ liệu khi ghi trực tiếp vào vùng bộ nhớ của ứng dụng. Nếu không có lớp Data Sync, thiết bị iSCSI đòi hỏi lượng bộ nhớ đệm lớn hơn và phải thực hiện một số tác vụ sao chép để lưu trữ cũng như sắp xếp lại dữ liệu trước khi chuyển chúng lên lớp trên.
Việc thiết lập một phiên giao dịch iSCSI giữa Initiator và Target cần dùng một hoặc nhiều kết nối TCP để vận chuyển các lệnh, trạng thái và dữ liệu SCSI bên trong các các gói dữ liệu iSCSI (là đơn vị dữ liệu của giao thức - PDU). PDU chứa khối mô tả lệnh SCSI chuẩn theo cấu trúc thông điệp báo cho bên nhận biết đó là gói dữ liệu hay lệnh điều khiển.
2.3.4. So sánh FCP và iSCSI
Khái niệm SAN thường gắn với mạng quang, dành riêng phục vụ kết nối giữa các thiết bị lưu trữ hoặc giữa thiết bị lưu trữ và máy chủ. Giao thức dùng để vận chuyển các khối dữ liệu cũng là giao thức kênh quang. Trong thời gian gần đây, iSCSI được coi là giao thức đầy tiềm năng trong việc phát triển thị trường SAN. Những ưu điểm và nhược điểm của giao thức iSCSI dựa trên cơ sở giao thức vận chuyển dữ liệu mà nó sử dụng (TCP/IP). Chính vì vậy, ta có thể coi việc so sánh giữa hai giao thức của SAN là FCP và iSCSI chính là so sánh giữa hai giao thức vận chuyển dữ liệu FC và TCP/IP.
Về kết nối và khoảng cách kết nối
FCP cho phép thực hiện các kết nối có khoảng cách xa lên tới 10 km. Với iSCSI, kết nối của thiết bị lưu trữ với máy chủ rất đa dạng thông qua IP SAN, qua IP LAN hay thậm chí nối thẳng vào máy chủ và được sử dụng như là một thiết bị lưu trữ gắn thẳng (DAS). iSCSI không chỉ cung cấp giải pháp xây dựng SAN cho những trung tâm dữ liệu tập trung, nó còn thực hiện tốt việc kết nối giữa những khoảng cách cực lớn nhờ mạng Internet toàn cầu. Sự phát triển hệ thống mạng Internet băng thông rộng sẽ là một thuận lợi cho việc phát triển thị trường iSCSI.
Về khả năng tương tác
Các nhà phát triển thiết bị lưu trữ kênh quang vẫn phát triển và cải tiến sản phẩm phần cứng và phần mềm một cách riêng rẽ. Điều này dẫn đến khả năng tương thích không cao của các thiết bị. Để giảm bớt những lỗi phát sinh, người sử dụng thường phải giảm thiểu việc sử dụng các tính năng mới của các thiết bị kênh quang. iSCSI sử dụng nền giao thức TCP/IP là chuẩn thống nhất nên không phát sinh những lỗi liên tác giữa các thiết bị.
Về chi phí
Trong thực tế cho thấy chi phí cho SAN dựa trên iSCSI thường thấp hơn. Các yếu tố làm giảm chi phí cho iSCSI SAN bao gồm:
- Giá các thiết bị thành phần SAN dựa trên giao thức iSCSI thấp hơn do tính phổ dụng, số lượng nhà cung cấp và qui mô sản xuất của các thiết bị xây lên SAN như bộ điều hợp, bộ chuyển mạch, bộ dẫn đường, ...
- Thời gian đào tạo, chi phí đào tạo và duy trì iSCSI SAN thấp hơn nhiều so với FCP SAN, do TCP/IP gần như là kỹ năng cơ bản của các cán bộ kỹ thuật công nghệ thông tin hiện nay.
CHƢƠNG 3. GIẢI PHÁP CẢI TIẾN MẠNG LƢU TRỮ TRONG MỘT HỆ THỐNG NGÂN HÀNG
3.1. MỘT SỐ VẤN ĐỀ CẦN LƢU Ý KHI CẢI TIẾN HỆ THỐNG MẠNG LƢU TRỮ
Để có thể xây dựng được một giải pháp SAN tổng thể, có khả năng đáp ứng tốt các đòi hỏi về cơ sở hạ tầng hiện tại và các nhu cầu phát triển trong tương lai, nhằm bảo vệ tốt chi phí đầu tư, cần xem xét một số tiêu chí cơ bản sau:
- Hợp nhất lưu trữ
- Các giải pháp với khả năng sẵn sàng cao
- Sao lưu không sử dụng LAN (LAN – free backup)
- Sao lưu không sử dụng tài nguyên máy chủ (Server-free backup) - Phục hồi sau thảm họa
Khi xem xét tới các ứng dụng sẽ chạy trên SAN cần phải xác định được các thành phần sau:
- Các dịch vụ hiện tại không đáp ứng được yêu cầu
- Các dịch vụ hỗ trợ khách hàng cần hoạt động 24giờ/ngày, 7ngày/tuần - Các cơ sở dữ liệu Data Warehouse phải đảm bảo hoạt động trực tuyến - Cải thiện kênh truyền thông
Hiệu suất trên mạng SAN là khả năng hỗ trợ và đáp ứng tới các ứng dụng khác nhau đang chạy trên SAN như:
- Tính toán được tầm quan trọng của ứng dụng - Băng thông cần thiết cho mỗi ứng dụng hoặc IOPS
- Số lượng băng thông được cấp phát cực đại cho mỗi ứng dụng - Dung lượng lưu trữ mà ứng dụng được phép quản lý
- Trong trường hợp SAN có sự cố, hiệu suất cần cấp phát cho ứng dụng là bao nhiêu
- Ứng dụng nào luôn cần có các đường kết nối dự phòng để đảm bảo hiệu suất và tính sẵn sàng cao
Một mạng SAN được thiết kế nhằm hỗ trợ tốt cho các ứng dụng. Như vậy, khi có các ứng dụng mới hoặc ứng dụng cũ đòi hỏi thêm dung lượng lưu trữ thì cần phải đáp ứng được. Nếu có thể xác định được mức độ tăng trưởng trong vòng một hoặc hai năm tới. Khi đó, ta có thể dự trù được thiết bị cần phải nâng cấp.
Bảo mật:
Các ứng dụng trên SAN cần được bảo vệ nhằm ngăn ngừa việc mất mát hoặc hỏng dữ liệu, cần phải có chiến lược sao lưu và phục hồi dữ liệu với nhiều mức khác nhau. Dữ liệu và ứng dụng phải được đảm bảo hoạt động tốt trong trường hợp xảy ra thảm họa.
Trên mạng SAN, sẽ bao gồm nhiều máy chủ kết nối tới, phải có những chính sách xác thực nhằm cho phép các máy chủ chỉ có thể được truy cập tới những tài nguyên được cấp phát. Để đạt được yêu cầu này ta có thể phân chia theo các vùng (zoning).
Xác định rõ các yêu cầu cho hạ tầng cơ sở:
Nếu hệ thống bắt đầu xây dựng là một hệ thống mạng mới, với một hạ tầng cơ sở được xây dựng từ đầu. Rất đơn giản và dễ dàng để tối ưu mô hình mạng theo đúng yêu cầu đặt ra. Nhưng trong thực tế, ta phải nâng cấp từ một hạ tầng cơ sở hiện có.
Vì vậy, trước khi xây dựng một mạng SAN, ta nên biết rõ ràng thành phần nào trong hệ thống cũ sẽ bị thay thế như:
- Cấu hình lưu trữ hiện tại.
- Cấu trúc mạng LAN hoặc SAN. - Các ứng dụng hiện tại.
- Các thiết bị cần băng thông và hiệu suất.
- Những thông tin khác liên quan đến một mạng SAN sẽ được xây dựng.
Toàn bộ những thông tin trên sẽ giúp xác định được những thành phần đang tồn tại nào có thể sử dụng trong mạng SAN mới, những thành phần nào cần được nâng cấp để kết nối tới một môi trường mới.
Khả năng lƣu thông của các ứng dụng:
Trong trường hợp cài đặt các hệ thống dự phòng (thư viện băng từ, các tủ đĩa lưu trữ khác) cần phải xem xét đến băng thông dành cho luồng dữ liệu đi trực tiếp từ thiết bị này đến thiết bị khác (như từ đĩa cứng tới đĩa cứng, từ đĩa cứng tới băng từ).
Xem xét kích thước của các đối tượng dữ liệu được gửi bởi những ứng dụng khác nhau nhằm tính toán sự quá tải có thể xảy ra trên kênh truyền. Lúc này cần quan tâm đến các lớp của dịch vụ (CoS) để cung cấp tài nguyên cho mỗi ứng dụng.
Xác định số các node sẽ kết nối tới thiết bị lưu trữ và tổng số lưu lượng dữ liệu có thể truyền tại một thời điểm, giúp ngăn ngừa hiện tượng tắc nghẽn cổ chai.
Lựa chọn mô hình:
Mạng linh hoạt, dễ dàng tương tác trong tương lai và giúp bảo vệ chi phí đầu tư khi có thể tích hợp các thành phần vào trong môi trường SAN sẽ được mở rộng trong tương lai. Một xu hướng điển hình đang được phát triển là môi trường switch fabric. Bởi vì switch fabric có tính linh hoạt và phạm vi mở rộng trong tương lai là rất tốt.
Thiết kế dựa trên switch fabric:
Một switch đơn hoặc một director sẽ bị giới hạn số cổng trực tiếp kết nối. Nhằm tăng số lượng cổng kết nối, ta sử dụng nhiều switch hoặc director kết nối với nhau, và chúng được gọi là fabric phân tầng (cascaded fabric).
Đây là phương pháp có hiệu quả tốt, chi phí chấp nhận được để hỗ trợ nhiều cổng cho mạng SAN, giúp giảm thiểu khả năng lỗi trên mạng so với việc chỉ có một điểm kết nối tới máy chủ, nhằm tăng tính sẵn sàng cho các ứng dụng. Việc phân tầng giúp đạt được khoảng cách xa nhất giữa các thiết bị.
ISL (Inter switch link)
Khi kết nối giữa hai SAN switch, các cổng switch sẽ tự động chuyển sang kiểu cổng E-port bởi phần mềm. Các switch có thể được đưa vào mạng mà không làm ngắt quảng hoạt động của mạng. Nhiều đường liên kết có thể hoạt động đồng thời giữa hai switch bất kỳ trong fabric, cho phép định nghĩa nhiều đường liên kết dự phòng.
Mặc định, tất cả các đường ISL đều được dùng để truyền dữ liệu. Trong trường hợp một đường có sự cố, dữ liệu vẫn tiếp tục được truyền bởi các đường liên kết khác. Ngoài ra, ISL sử dụng một giao thức để tự động cập nhật thông tin định tuyến và thông tin về các vùng thông qua tất cả các đường ISL.
Thay đổi cấu hình của ISL sẽ gây ra việc tính toán lại các đường định tuyến bên trong fabric. Do vậy, nên hạn chế điều này. Tổng số các đường ISL từ một switch tới một switch liền kề là 8 đường, nhưng có thể nhiều hơn 8 đường ISL có thể được cấu
hình trên một switch trong trường hợp switch đó kết nối tới nhiều hơn một switch liền kề.
3.2. THỰC TRẠNG MẠNG LƢU TRỮ TRONG MỘT HỆ THỐNG NGÂN HÀNG
Một hệ thống Ngân hàng có mạng lưới chi nhánh trải rộng trên phạm vi toàn quốc. Xét về mặt công nghệ, tương xứng với hệ thống mạng lưới chi nhánh lớn như vậy đòi hỏi phải có hệ thống cơ sở hạ tầng CNTT đủ mạnh nhằm đáp ứng được nhu cầu giao dịch của toàn hệ thống trong thời đại CNTT phát triển mạnh mẽ như vũ bão ngày nay.
Theo xu hướng phát triển của công nghệ trên thế giới, khoảng 5 năm trở lại đây, các hệ thống xử lý tập trung phát triển một cách mạnh mẽ đang dần dần thay thế cho các hệ thống phân tán không còn phù hợp với thời đại. Các hệ thống giao dịch của Ngân hàng cũng không nằm ngoài xu hướng đó.
Hiện tại, ngoài các hệ thống xử lý phân tán lạc hậu (ví dụ như hệ thống Chuyển tiền điện tử, hệ thống Giao dịch trực tuyến…) đang dần dần được thay thế bởi các hệ thống xử lý tập trung mới, Ngân hàng có một số hệ thống xử lý tập trung chính sau:
- Hệ thống Xử lý giao dịch trực tuyến - OLTP (Online Transaction Processing) - Hệ thống kho dữ liệu – DataWarehouse
- Hệ thống đào tạo - Training
Hiện tại, các hệ thống này là các hệ thống mạng SAN nhỏ, độc lập với nhau vì vậy chưa thể tận dụng được ưu điểm của SAN như chia sẻ dữ liệu, sử dụng đường truyền tốc độ cao giữa các hệ thống.
3.2.1. Hệ thống Xử lý giao dịch trực tuyến - OLTP
Mục tiêu của hệ thống:
- Xây dựng Hệ thống Thanh toán Ngân hàng và Kế toán Khách hàng tin cậy, an toàn và mạnh để đảm bảo kinh doanh hiệu quả và đáp ứng các yêu cầu của nền kinh tế quá độ và đang tăng trưởng.
- Đáp ứng những thay đổi và sự tăng lên về nhu cầu của khách hàng.
- Hiện đại hoá Hệ thống Thanh toán Ngân hàng và Kế toán Khách hàng, bao gồm tất cả các nghiệp vụ ngân hàng và các hoạt động quản lý.
- Giảm chi phí quản lý, cải thiện hiệu suất và tăng khả năng sinh lợi của Ngân hàng.
- Cung cấp các dịch vụ ngân hàng đa dạng và thuận tiện nhằm đáp ứng nhu cầu ngày càng tăng của khách hàng.
- Giảm thời gian trôi nổi, đẩy nhanh quay vòng vốn và tăng hiệu quả kinh doanh. - Cải tiến các hoạt động kế toán và kiểm soát nội bộ.
- Xây dựng một hệ thống CNTT hiện đại nhằm hỗ trợ hoạt động kinh doanh và quản lý nghiệp vụ của Ngân hàng.
- Tích hợp với các dịch vụ ngân hàng mới trong tương lai và các dịch vụ ngân hàng quốc tế.
Đặc điểm của hệ thống (mô hình):
Hệ thống xử lý giao dịch trực tuyến là một hệ thống xử lý tập trung. Toàn bộ dữ liệu được tập trung tại Trung tâm xử lý chính. Tại các chi nhánh chỉ có các máy PC kết nối trực tiếp vào hệ thống máy chủ tại Trung tâm xử lý chính. Ngoài ra, tại chi nhánh còn có máy chủ chứa dữ liệu tạm thời, được sử dụng khi đường truyền bị gián đoạn.
Lý do sử dụng mô hình xử lý tập trung:
- Cung cấp được các giao dịch ngân hàng cho khách hàng tại bất kỳ chi nhánh nào (giao dịch gửi nhiều nơi rút nhiều nơi).
- Có khả năng cung cấp được các dịch vụ ngân hàng mới như ATM, Thẻ Debit,