1.1.3 Cấu hình kết nối các thiết bị lưu trữ dữ liệu 1.1.3.1 Kết nối trực tiếp Kết nối trực tiếp thiết bị lưu trữ DAS Direct Attached Storage là cách kết nối thẳng từ các thiết bị nhớ với
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-
Bùi Tuấn Nam
NGHIÊN CỨU VÀ XÂY DỰNG MỘT HỆ THỐNG THU THẬP,
Trang 3BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-
Bùi Tuấn Nam
NGHIÊN CỨU VÀ XÂY DỰNG MỘT HỆ THỐNG THU THẬP,
Trang 4MỤC LỤC
LỜI CAM ĐOAN iii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT iv
DANH MỤC CÁC BẢNG v
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ vi
LỜI GIỚI THIỆU 1
CHƯƠNG 1 Kiến thức cơ sở 2
1.1 Lưu trữ và hệ thống lưu trữ 2
1.1.1 Các thiết bị lưu trữ dữ liệu 3
1.1.2 Các chuẩn giao tiếp thiết bị nhớ 7
1.1.3 Cấu hình kết nối các thiết bị lưu trữ dữ liệu 9
1.1.4 RAID 13
1.2 Mạng máy tính 15
1.2.1 Mô hình kết nối các hệ thống mở 15
1.2.2 TCP/IP 17
1.2.3 Kiến trúc mạng 25
1.2.4 Cáp sợi quang 28
1.3 Tổng quan về PACS 30
1.4 Cấu trúc của hệ thống PACS 30
1.4.1 Các thiết bị thu ảnh (tạo ảnh số) y tế 30
1.4.2 Máy tính giao tiếp thu nhận hình ảnh/dữ liệu 31
1.4.3 Máy chủ PACS & máy chủ lưu trữ 32
1.4.4 Display Workstation 38
1.4.5 Application Server 39
1.4.6 System Network 39
1.5 Quy mô của PACS 40
1.6 Kiến trúc của PACS 40
1.6.1 Các tiêu chuẩn công nghiệp 40
1.6.2 Kết nối mở và kiến trúc mở 42
Trang 51.6.3 Độ tin cậy 42
1.7 Hoạt động của PACS 43
1.7.1 Quy trình cơ bản của PACS 43
1.7.2 Kiến trúc PACS đơn và quy trình hoạt động 45
1.7.3 Mô hình PACS chủ - tớ và quy trình hoạt động 47
1.7.4 Mô hình WEB 50
1.8 HIS 50
1.9 RIS 51
1.10 HL7 51
1.11 DICOM 52
1.11.1 Cấu trúc chuẩn DICOM 54
1.11.2 Các lớp dịch vụ DICOM 55
1.11.3 Dịch vụ lưu trữ 56
1.11.4 Dịch vụ in 57
1.11.5 Danh sách công việc của thiết bị tạo ảnh 57
CHƯƠNG 2 Thiết kế hệ thống thu thập, lưu trữ và xử lý dữ liệu hình ảnh y tế tại bệnh viện K 59
2.1 Thực trạng hệ thống thiết bị hình ảnh ở bệnh viện K 59
2.1.1 Trang thiết bị chẩn đoán hình ảnh 59
2.1.2 Những tồn tại 59
2.2 Yêu cầu thiết kế 60
2.3 Mô hình thiết kế 61
2.4 Phương án thực hiện 61
2.5 Cài đặt hệ thống thử nghiệm 62
2.5.1 Cài đặt bộ lưu trữ NAS 62
2.5.2 Cài đặt phần mềm eFilm 68
2.6 Triển khai hệ thống thực tế 69
CHƯƠNG 3 Kết quả và bàn luận 70
TÀI LIỆU THAM KHẢO 71
Trang 6LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là do tôi nghiên cứu, tìm tòi, tổng hợp chứ không sao chép từ tài liệu nào khác
Tác giả luận văn
Bùi Tuấn Nam
Trang 7DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
ARP Address Resolution Protocol
CR Computed Radiography
DICOM Digital Imaging and Communications in Medicine
DR Digital Radiography
GOF Glass Optical Fiber
HIS Hospital Information System
IP Internet Protocol
LUN Logical Unit Number
MAC Media Access Control
MRI Magnetic Resonance Imaging
OSI Open Systems Interconnection
PACS Picture Archiving and Communication System POF Plastic Optical Fiber
RAID Redundant Arrays of Independent Disks
RIS Radiology Information System
TCP Transmission Control Protocol
UDP User Datagram Protocol
Trang 8DANH MỤC CÁC BẢNG
Bảng 1-1 Các đơn vị dữ liệu 2
Bảng 1-2 Tốc độ ghi của một số loại ổ đĩa quang học 5
Bảng 1-3 Mô tả các xử lý của hệ thống PACS 35
Bảng 1-4 Các chức năng của máy trạm 38
Bảng 2-1 Dung lượng lưu trữ của một số loại hình ảnh y tế 62
Trang 9DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1-1 Băng từ AIT-3, dung lượng 100 GB, tốc độ truyền 12Mbps 3
Hình 1-2 Ổ băng từ AIT-3 4
Hình 1-3 Cấu tạo ổ cứng 6
Hình 1-4 Kết nối trực tiếp thiết bị lưu trữ 9
Hình 1-5 Hệ thống lưu trữ SAN 11
Hình 1-6 Bộ lưu trữ NAS 12
Hình 1-7 So sánh 3 hệ thống lưu trữ 12
Hình 1-8 RAID 0 và RAID 1 13
Hình 1-9 RAID 3 và RAID 4 14
Hình 1-10 RAID 5 15
Hình 1-11 Mô hình 7 lớp OSI 17
Hình 1-12 Kiến trúc phân lớp của giao thức TCP/IP 18
Hình 1-13 Quá trình đóng gói dữ liệu TCP/IP 18
Hình 1-14 Cấu trúc dữ liệu ở các lớp 19
Hình 1-15 Cấu trúc các lớp địa chỉ IP 23
Hình 1-16 Mặt nạ mạng con 24
Hình 1-17 Mạng tuyến 26
Hình 1-18 Mạng sao 26
Hình 1-19 Mạng vòng 27
Hình 1-20 Mạng trung tâm 27
Hình 1-21 Mạng hình lưới 28
Hình 1-22 Cấu tạo cáp sợi quang 29
Hình 1-23 Mối quan hệ và các xử lý của hệ thống PACS 34
Hình 1-24 Quy trình hoạt động cơ bản của PACS 43
Hình 1-25 Quy trình hoạt động của PACS đơn 45
Hình 1-26 Quy trình hoạt động của mô hình PACS chủ - tớ 48
Hình 2-1 Mô hình Web Server Distribution 61
Hình 2-2 Cấu hình máy tính mô phỏng NAS 62
Trang 10Hình 2-3 Bộ NAS khi khởi động xong 63
Hình 2-4 Thêm ổ cứng cho NAS 64
Hình 2-5 Tạo bộ lưu trữ RAID 5 64
Hình 2-6 Ổ đĩa RAID 5 65
Hình 2-7 Kết nối ổ đĩa RAID 5 vào hệ thống 65
Hình 2-8 NAS với ổ đĩa RAID 5 66
Hình 2-9 Địa chỉ đích lưu trữ tới NAS 66
Hình 2-10 Máy tính kết nối NAS qua iSCSI 67
Hình 2-11 Máy tính với ổ đĩa iSCSI 67
Hình 2-12 Lưu trữ dữ liệu hình ảnh trên NAS 68
Hình 2-13 Địa chỉ DICOM để nhận hình ảnh 69
Trang 11LỜI GIỚI THIỆU Hiện nay, trong tiến trình hội nhập với thế giới, Việt Nam đã có đầy đủ các trang thiết bị y tế hiện đại để phục vụ chăm sóc sức khỏe nhân dân Trong đó việc
sử dụng, khai thác hiệu quả là một yếu tố rất đáng quan tâm Cần phải nâng cao trình độ người sử dụng và nâng cao chất lượng, hiệu năng của hệ thống thiết bị Là một người làm kỹ thuật trong mảng thiết bị y tế, tôi nhận thấy cần phải khai thác hơn nữa các tính năng của hệ thống thiết bị tránh lãng phí, nâng cao chất lượng, hiệu quả điều trị cho người bệnh
Trong quá trình công tác tại bệnh viện K, tôi thấy rằng các dữ liệu hình ảnh y tế của bệnh nhân chỉ được lưu tạm thời trong bộ lưu trữ của các thiết bị hình ảnh y tế
và cứ bị xóa dần để dành chỗ cho những hình ảnh mới Trong khi đó các nhà kho lưu trữ hồ sơ bệnh án kèm phim x-quang của bệnh nhân luôn chật cứng Câu hỏi đặt
ra ở đây là: Tại sao ta không lưu trữ dữ liệu số? Dữ liệu số vừa gọn, dễ sao lưu, bảo quản vừa dễ tìm kiếm, và một điều chắc chắn là chẩn đoán hình ảnh trên phim x-quang không thể bằng hình ảnh trên màn hình độ phân giải cao được Chính vì vậy
tôi thực hiện đề tài: Xây dựng một hệ thống thu thập, lưu trữ và xử lý dữ liệu hình ảnh y tế Và đến nay, việc thực hiện đề tài đã cơ bản hoàn thành, cần có thêm
thông tin về lưu lượng bệnh nhân trên toàn bộ hệ thống thiết bị hình ảnh để có thể triển khai thực tế tại cơ sở Tân Triều của bệnh viện K
Tôi xin chân thành cảm ơn TS Vũ Duy Hải –Người thầy đã theo sát, giúp đỡ
và cho tôi nhiều ý kiến quý báu trong quá trình hoàn thành luận văn
Tôi xin chân thành cảm ơn KS Cát Văn Thi – TP VTTB, TS Nguyễn Văn Thi – PTK CĐHA cùng toàn thể các đồng nghiệp tại bệnh viện K đã ủng hộ, hỗ trợ tôi trong quá trình thực hiện đề tài
Tôi xin chân thành cảm ơn gia đình cùng tất cả các bạn bè, đồng nghiệp đã quan tâm, động viên và giúp đỡ tôi trong quá trình làm luận văn tốt nghiệp
Bùi Tuấn Nam
Trang 12CHƯƠNG 1 Kiến thức cơ sở 1.1 Lưu trữ và hệ thống lưu trữ
Thông thường trong hệ thống bệnh viện, các thông tin cá nhân của bệnh nhân, các chẩn đoán, các kết quả xét nghiệm, các ảnh chụp chiếu đều được ghi trên giấy
tờ hoặc trên phim Tuy nhiên trong kỷ nguyên số, mọi thông tin y tế của bệnh nhân cũng được lưu trữ số hóa Với nhiều ưu điểm của hình ảnh y tế, lượng thông tin y tế cho mỗi bệnh nhân gia tăng đột biến
Đơn vị thông tin nhỏ nhất là bit, được biểu diễn bằng 2 giá trị 0 và 1 Lớn hơn bit là byte, gồm 8 bit Các đơn vị thường sử dụng trong các hệ thống PACS1 hiện nay là kilobyte, megabyte, gigabyte và terabyte
1 Picture Archiving and Communication System
Trang 1350 năm qua, mật độ lưu trữ (số lượng bit có thể lưu trữ trong 1 inch vuông) đã gia tăng hơn 17 triệu lần
Kỹ thuật lưu trữ gồm có online, near-line hoặc offline Ổ cứng là công nghệ online bởi nó có thể truy cập tức thời Băng từ, đĩa quang học được xếp vào near-line vì chúng cần phải được nạp vào đầu đọc trước khi có thể truy cập, việc nạp vào đầu đọc có thể được thực hiện tự động Offline là khi các phương tiện lưu trữ không được nạp tự động vào các đầu đọc để có thể truy cập thông tin, cần phải có sự can thiệp của con người
1.1.1 Các thiết bị lưu trữ dữ liệu
1.1.1.1 Băng từ
Băng từ hiện vẫn được sử dụng trong một số hệ thống PACS làm bộ lưu trữ dài hạn hoặc bộ sao lưu phụ của bộ lưu trữ dài hạn Dữ liệu được ghi và đọc ra trên băng nhựa được phủ lớp mỏng vật liệu từ tính.Việc ghi và đọc dữ liệu được thực hiện khi băng từ được kéo từ cuộn này sang cuộn kia qua đầu từ đặt cố định Kích thước dữ liệu tối đa mỗi băng từ lưu trữ được cũng ngang với ổ cứng cùng thời điểm, khoảng 0,5 đến 1TB dữ liệu không nén Ưu điểm của băng từ lưu dữ liệu là giá thành lưu trữ trên mỗi đơn vị dữ liệu tương đối thấp nhưng nhược điểm là thời gian truy cập dài, chính vì vậy nó thường được dùng để sao lưu dữ liệu cho các hệ thống PACS
Hình 1-1 Băng từ AIT-3, dung lượng 100 GB, tốc độ truyền 12Mbps
Trang 14Hình 1-2 Ổ băng từ AIT-3
1.1.1.2 Đĩa quang
Đĩa quang như CD, DVD và Blu-ray là các phương tiện lưu trữ dữ liệu số, dữ liệu được ghi vào và đọc ra bằng tia laser Đĩa quang và thư viện đĩa, còn gọi là jukebox, có khả năng tự động nạp và đổi đĩa hiện vẫn được sử dụng rộng rãi để lưu trữ hình ảnh y tế trong các hệ thống PACS
Một đĩa CD tiêu chuẩn được làm bằng nhựa polycarbonate đường kính 120 mm dày 1,2 mm Đĩa CD có thể lưu trữ tới 700 MB dữ liệu Đĩa được đúc sẵn một rãnh xoắn ốc để dẫn tia laser Mặt rãnh xoắn ốc được phủ một lớp rất mỏng để ghi dữ liệu, trên đó được phủ một lớp phản xạ mỏng bằng bạc hoặc hợp kim bạc và trên cùng được phủ một lớp sơn bảo vệ Tia laser dùng để đọc có bước sóng 780 nm, kích thước bit dữ liệu trên đĩa khoảng 1,6 µm Có 2 loại đĩa CD là CD-R và CD-
RW, CD-R chỉ ghi được một lần và sau khi ghi thì không xóa được; CD-RW có thể ghi xóa nhiều lần
Đĩa DVD có kích thước giống như đĩa CD nhưng bao gồm 2 đĩa polycarbonate dày 0,6 mm dán lại với nhau, một đĩa có cấu trúc giống như đĩa CD, đĩa còn lại để
Trang 15bảo vệ mặt ghi dữ liệu khỏi trầy xước Đĩa DVD một mặt, một lớp có dung lượng 4,7 GB kích thước điểm ghi dữ liệu trên đĩa khoảng 0,74 µm, đầu đọc sử dụng diode laser bước sóng 650 nm và khẩu độ thấu kính hội tụ lớn hơn so với đầu đọc đĩa CD
Đĩa Blu-ray – BD có kích thước giống như đĩa CD BD sử dụng tia laser màu xanh-tím bước sóng 405 nm với kích thước điểm dữ liệu trên đĩa 580 nm Một đĩa
BD một mặt có thể lưu trữ tới 25 GB dữ liệu
Bảng 1-2 Tốc độ ghi của một số loại ổ đĩa quang học
1.1.1.3 Ổ cứng
Ổ cứng có cấu tạo gồm một chồng đĩa được gắn đồng trục vào trục quay và động cơ Đĩa thường cấu tạo bằng nhôm hoặc thuỷ tinh, trên bề mặt được phủ một lớp vật liệu từ tính là nơi chứa dữ liệu Mỗi đĩa từ có thể sử dụng hai mặt, nếu có nhiều đĩa từ, chúng gắn song song, quay đồng trục, cùng tốc độ với nhau khi hoạt động Tốc độ quay của đĩa từ 5.400 vòng/phút đối với các ổ đĩa tốc độ thấp và tới 15.000 vòng/phút với các ổ đĩa tốc độ cao
Cụm đầu đọc để đọc/ghi dữ liệu Cụm đầu đọc gồm có đầu ghi/đọc được gắn trên cần di chuyển đầu đọc (head arm hoặc actuator arm) Đầu đọc đơn giản được cấu tạo gồm lõi ferit (trước đây là lõi sắt) và cuộn dây (giống như nam châm điện) Đầu đọc trong đĩa cứng có công dụng đọc dữ liệu dưới dạng từ hoá trên bề mặt đĩa
Trang 16từ hoặc từ hoá lên các mặt đĩa khi ghi dữ liệu Cần di chuyển đầu đọc/ghi có nhiệm
vụ di chuyển theo phương song song với các đĩa từ ở một khoảng cách nhất định, dịch chuyển và định vị chính xác đầu đọc tại các vị trí từ mép đĩa đến vùng phía trong của đĩa (phía trục quay)
Trên một mặt làm việc của đĩa từ chia ra nhiều vòng tròn đồng tâm thành các track Trên track chia thành những phần nhỏ bằng các đoạn hướng tâm thành các sector Các sector là phần nhỏ cuối cùng được chia ra để chứa dữ liệu Theo chuẩn thông thường thì một sector chứa dung lượng 512 byte Số sector trên các track là khác nhau từ phần rìa đĩa vào đến vùng tâm đĩa, các ổ đĩa cứng đều chia ra hơn 10 vùng mà trong mỗi vùng có số sector/track bằng nhau Tập hợp các track cùng bán kính ở các mặt đĩa khác nhau thành các cylinder Trên một ổ đĩa cứng có nhiều cylinder bởi có nhiều track trên mỗi mặt đĩa từ
Ổ cứng đầu tiên có dung lượng 5 MB được phát minh năm 1952 bởi IBM, cho đến nay dung lượng của một ổ cứng đã lên tới con số 10 TB
Hình 1-3 Cấu tạo ổ cứng
Trang 171.1.1.4 Ổ rắn SSD
Ổ trạng thái rắn SSD (Solid-State Drive) lưu trữ dữ liệu sử dụng bộ nhớ trạng thái rắn hay còn gọi là bộ nhớ truy cập ngẫu nhiên (RAM) hoặc bộ nhớ nhanh (flash memory) Các bộ nhớ RAM trên ổ SSD là loại nonvolatile RAM, khi mất nguồn cung cấp, dữ liệu trên RAM không bị mất Tốc độ truy cập dữ liệu của ổ SSD nhanh hơn và độ tin cậy cao hơn ổ đĩa cứng vì không có các bộ phận cơ khí dịch chuyển Chức năng của SSD cũng giống như ổ đĩa cứng
1.1.2 Các chuẩn giao tiếp thiết bị nhớ
1.1.2.1 ATA
ATA (Advanced Technology Attachment) là chuẩn giao tiếp song song của ổ cứng, nó còn được gọi là IDE (Integrated Drive Electronics) hoặc PATA (Parallel ATA) Hiện nay ổ đĩa ATA ít được sử dụng trong các máy chủ PACS do tốc độ truy cập dữ liệu tương đối chậm so với các chuẩn khác như SATA hay SCSI
1.1.2.2 SATA
SATA (Serial ATA) thay thế chuẩn ATA với cáp kết nối tốc độ cao, chỉ có 8 chân So với ATA chuẩn SATA truyền dữ liệu nhanh và hiệu quả cao hơn, và có thể tháo lắp ổ cứng mà không cần phải tắt máy tính Chuẩn SATA II có băng thông 3Gbps, còn chuẩn SATA 3 có tốc độ lên tới 6Gbps
1.1.2.3 SCSI
SCSI là chuẩn có vài giao diện khác nhau dùng để kết nối máy tính chủ với các
ổ cứng, ổ băng từ, ổ đĩa quang Cổng cắm SCSI có các loại 50 chân, 68 chân hoặc
80 chân để kết nối các ổ nhớ với máy chủ hoặc kết nối các ổ nhớ với nhau Bus SCSI song song thông thường có thể kết nối tới 16 ổ nhớ như ổ cứng, ổ đĩa quang hoặc ổ băng từ Mỗi thiết bị trên cùng bus SCSI được phân biệt bởi một số định danh SCSI duy nhất gọi là LUN1 Nói chung SCSI có giá thành cao hơn SATA
1 Logical Unit Number
Trang 18nhưng có tốc độ truyền dữ liệu cao hơn Nhiều hệ thống PACS sử dụng các ổ đĩa SCSI trong các máy chủ
1.1.2.4 SAS
SAS (Serial Attached SCSI) là một bước phát triển của SCSI song song Nó được sử dụng hầu hết trong các máy chủ quan trọng như là máy chủ PACS SAS có tốc độ truy cập nhanh hơn hầu hết SCSI song song và còn cho phép “cắm nóng”, điều này cho phép thay thế những ổ nhớ hỏng mà không cần phải tắt máy chủ như với hệ thống sử dụng SCSI song song
1.1.2.5 iSCSI
iSCSI là một giao diện đầy hứa hẹn Để tận dụng các chuẩn SCSI truyền thống, Ethernet và TCP/IP cũng được sử dụng để kết nối từ xa các ổ cứng lại với nhau Với máy chủ, các ổ đĩa iSCSI được xem như kết nối cục bộ Với mạng lưu trữ cục bộ SAN (Storage Area Network) sử dụng iSCSI có thể sử dụng cấu trúc mạng và chuyển mạch hiện tại mà không cần phải nối cáp riêng Chuẩn này cũng đang ganh đua với chuẩn FC-based SAN, có cùng chức năng nhưng cần có mạng FC Fabric chuyên dụng đắt đỏ hơn Trong hệ thống PACS, iSCSI có thể được sử dụng để truy cập từ xa hệ thống lưu trữ
1.1.2.6 Fibre Channel
Giữa hai bộ vi xử lý hoặc giữa bộ vi xử lý với thiết bị ngoại vi, có hai cách truyền dữ liệu là kết nối mạng hoặc kết nối kênh truyền dữ liệu Kết nối kênh là cách truyền dữ liệu trực tiếp giữa một số ít thiết bị
Giao thức Fibre Channel (FCP) là một giao thức máy tính có thể đạt được yêu cầu truyền dữ liệu với khối lượng lớn FC cung cấp một kết nối hay chuyển mạch trực tiếp từ điểm đến điểm giữa hai thiết bị như máy chủ, thư viện băng từ, dãy ổ cứng… Một khi kênh được thiết lập, đó là môi trường phần cứng mạnh mẽ dùng để truyền dữ liệu với tốc độ cao mà không cần nhiều sự can thiệp của phần mềm Tuy được gọi là kênh nhưng FC có thể chạy cả trên đôi dây xoắn cũng như cáp quang
Trang 19Tất cả công việc một cổng FC phải làm đó là quản lý một kết nối từ điểm tới điểm giữa cổng đó với toàn hệ thống
Các thiết bị chuẩn FC có tốc độ dữ liệu 1Gbps, 2Gbps, 4Gbps và 8Gbps Hiện tại các thiết bị 1Gbps và 2Gbps đang được sử dụng rộng rãi
1.1.3 Cấu hình kết nối các thiết bị lưu trữ dữ liệu
1.1.3.1 Kết nối trực tiếp
Kết nối trực tiếp thiết bị lưu trữ DAS (Direct Attached Storage) là cách kết nối thẳng từ các thiết bị nhớ với máy tính hoặc máy chủ, thông thường các thiết bị lưu trữ này được lắp đặt ngay trong máy tính hoặc máy chủ Kết nối DAS có thể sử dụng một trong các giao diện ATA, SATA, SCSI với máy tính hoặc máy chủ SAS có ưu điểm dễ dàng lắp đặt triển khai, không đòi hỏi kỹ thuật cao; có giá thành thấp, chi phí hoạt động và bảo trì thấp; tốc độ truy cập dữ liệu cao chủ yếu là phần cứng, tác động của phần mềm là tối thiểu
Tuy nhiên SAS có nhược điểm là bị giới hạn về khả năng mở rộng: khoảng cách kết nối với máy chủ, số lượng thiết bị kết nối với máy chủ; không thể chia sẻ
dữ liệu với các máy chủ khác
Hình 1-4 Kết nối trực tiếp thiết bị lưu trữ
Trang 201.1.3.2 Storage Area Network
Nhu cầu quản lý tập trung, tốc độ truy cập dữ liệu, khả năng chia sẻ dữ liệu với các máy chủ ở xa và các thiết bị khác, khả năng mở rông không gian lưu trữ dẫn đến việc các thiết bị lưu trữ cần phải được kết nối mạng
Với mạng máy tính, các thiết bị lưu trữ kết nối trực tiếp với máy tính hoặc máy chủ, các máy tính hoặc máy chủ sau đó kết nối với nhau qua mạng LAN hoặc WAN Các máy chủ chạy trên các hệ điều hành khác nhau do đó việc truyền một lượng dữ liệu lớn giữa các máy chủ sẽ làm giảm hiệu quả hoạt động mà còn vượt quá giới hạn băng thông của kênh kết nối giữa thiết bị lưu trữ và máy chủ
Một trong những công nghệ mới giải quyết được những vấn đề này đó là mạng khu vực lưu trữ SAN SAN là một hệ thống lưu trữ dữ liệu dùng để trao đổi dữ liệu giữa các hệ thống máy tính và các thiết bị lưu trữ Nó có các bộ chuyển mạch để kết nối các thiết bị lưu trữ và rất nhiều máy chủ bằng một mạng chuyen dụng, do vậy các thiết bị lưu trữ có thể kết nối trực tiếp với nhau và một thiết bị lưu trữ có thể được truy cập bởi nhiều máy chủ
Một thành tố quan trọng của cấu trúc SAN là topo FC của nó, cải thiện đáng kể tốc độ dữ liệu, có thể lên tới 20Gbps Mạng SAN sử dụng kiến trúc FC, kết cấu SAN là một kết nối của nhiều chuyển mạch FC liên kết các thiết bị FC với nhau để trao đổi dữ liệu, giảm lỗi, loại bỏ hỏng hóc gây ra tại một điểm, tăng tối đa khoảng cách kết nối giữa các thiết bị Trong số các topo FC, hiện nay cấu trúc chuyển mạch thường được sử dụng hơn cả
Một mạng FC có nhiều điểm tương tự như mạng LAN nhưng có sự khác biệt đáng kể Mạng FC có giá thành rất cao do đó không được sử dụng rộng rãi như mạng LAN, nhưng với một hệ thống lớn như hệ thống PACS của bệnh viện thì khá phù hợp Trong mạng SAN không có máy chủ/tớ, lưu thông trong mạng chỉ có dữ liệu trao đổi giữa các máy chủ và các thiết bị lưu trữ So với NAS, SAN có tốc độ
Trang 21truy cập nhanh hơn và tin cậy hơn vì nó truy cập dữ liệu ở mức block và sử dụng mạng FC chuyên dụng
Hệ thống SAN cho phép sử dụng nhiều loại máy chủ hỗ trợ chuẩn SAN Các thiết bị lưu trữ trong SAN có thể là một mảng ổ cứng, mảng ổ quang hoặc một thư viện băng từ
Hình 1-5 Hệ thống lưu trữ SAN
1.1.3.3 Network Attached Storage
NAS là một thiết bị lưu trữ trên mạng thông thường, NAS cũng có thể hiểu là bất kỳ thiết bị lưu trữ nào được kết nối mạng Phần cứng quan trọng nhất của NAS tương tự như một máy chủ Về bản chất NAS chính là một file server kết nối LAN, ngoại trừ phần mềm NAS và các chức năng của nó chỉ phục vụ việc lưu trữ dữ liệu
và cho phép nhiều máy khách truy cập dữ liệu Thiết bị NAS với máy chủ và hệ điều hành giới hạn chỉ tập trung cung cấp dịch vụ truy cập và quản lý dữ liệu ở mức file, nó được chia sẻ bởi các máy chủ ứng dụng và các máy khách trong toàn mạng Một thiết bị NAS có bảng mạch chủ, CPU, RAM, các chức năng giao tiếp và hệ điều hành hạn chế do vậy nó không mạnh bằng một máy chủ thông thường Người quản lý lưu trữ có thể được truy cập và quản lý NAS từ xa Nó cung cấp truy cập dữ liệu ở mức file, các máy chủ hay máy trạm sử dụng file đó mà không cần xác định địa chỉ để lấy file trên thiết bị lưu trữ Không giống như DAS, các thiết bị lưu trữ nằm trong máy chủ, ở NAS, các thiết bị lưu trữ có thể nằm ở bất kỳ đâu trên mạng
Trang 22Các máy khách và máy chủ ứng dụng lấy những file dữ liệu lưu trữ trên các thiết bị NAS trên mạng như lấy trong ổ đĩa cục bộ Nhiều thiết bị NAS có thể cung cấp dịch
vụ lưu trữ file dữ liệu cho một máy chủ sử dụng mạng Ethernet thông thường với các giao thức truyền file thích hợp Hiệu suất của NAS phụ thuộc vào chất lượng của mạng mà nó kết nối vào, tốc độ CPU, lượng RAM nó có Hiệu suất của NAS giảm đáng kể khi có quá nhiều người sử dụng, quá nhiều truy cập đồng thời và công suất của CPU đạt giá trị giới hạn NAS gần như là một thiết bị plug-and-play, khi cần mở rộng không gian lưu trữ, có thể cắm thêm nhiều NAS vào mạng
Hình 1-6 Bộ lưu trữ NAS
Hình 1-7 So sánh 3 hệ thống lưu trữ
Trang 231.1.4 RAID
Với nhiều công việc, dữ liệu luôn sẵn sàng là rất quan trọng bao gồm cả công tác sao lưu để phục hồi dữ liệu RAID1 là viết tắt của cụm từ Redundant Arrays of Independent Disks, một công nghệ quan trọng được thiết kế cho các hệ thống quan trọng để bảo vệ dữ liệu trong trường hợp ổ cứng hỏng RAID dùng nhiều ổ cứng cùng với việc phân tách, sao chép dữ liệu nhằm nâng cao độ tin cậy, cải thiện tốc độ truy xuất, tăng không gian lưu trữ RAID thực hiện việc kết hợp các ổ cứng bằng cả phần cứng lẫn phần mềm Với hệ thống được kết nối, RAID thể hiện là một ổ logic đơn Có nhiều cấu hình RAID, mỗi cấu hình có những ưu và nhược điểm riêng Mirroring là cơ chế để tất cả dữ liệu được sao chép trên tất cả các ổ cứng một cách tự động Striping là xử lý để phân tách dữ liệu thành nhiều phần nhỏ và lưu trữ các phần này trên nhiều ổ đĩa Hai kỹ thuật này được sử dụng độc lập hoặc kết hợp với nhau trong rất nhiều mức RAID, phụ thuộc vào cách thiết kế hệ thống Mục đích của RAID nhằm cải thiện cả về độ tin cậy lẫn hiệu quả của bộ lưu trữ dữ liệu, giảm lỗi và tăng tốc độ truy cập dữ liệu
RAID 0 kết hợp ít nhất 2 ổ cứng, khi dữ liệu được lưu trữ, nó được phân tách thành các phần bằng nhau để lưu trong các ổ cứng Lợi ích của RAID 0 là máy chủ
có thể ghi đọc dữ liệu đồng thời vào mảng đĩa, do đó dữ liệu được truy cập nhanh hơn, cải thiện tốc độ truy xuất Tuy nhiên khả năng gặp lỗi của RAID-0 rất cao
Hình 1-8 RAID 0 và RAID 1
1 Redundant Arrays of Independent Disks
Trang 24RAID-1 còn gọi là sao chép ổ đĩa, dữ liệu được sao y hệt nhau trên nhiều ổ cứng Mỗi ổ đĩa trong bộ đĩa đều chứa cùng một cơ sở dữ liệu hoàn chỉnh do đó khi một ổ đĩa bị hỏng, cả bộ đĩa vẫn hoạt động bình thường, bộ đĩa RAID-1 chỉ hỏng khi tất cả các đĩa trong bộ bị hỏng RAID-1 nâng cao độ tin cậy, cải thiện khả năng chịu lỗi, tốc độ đọc cao nhưng tốc độ ghi chậm và giá thành cao
RAID-3 sử dụng một tập dữ liệu được phân tách giống RAID-0 cùng với một ổ đĩa dùng để kiểm tra tính toàn vẹn dữ liệu ở mức byte khi truyền hoặc truy cập dữ liệu từ bộ lưu trữ Như vậy RAID-3 cải thiện được hiệu suất và tăng khả năng chịu lỗi Nếu ổ đĩa parity hỏng RAID-3 cũng không bị ảnh hưởng nhưng lại gây ra hiệu ứng thắt cổ chai đối với hoạt động ghi vì thôngtin kiểm tra tính toàn vẹn parity được cập nhật mỗi khi dữ liệu được ghi vào
Hình 1-9 RAID 3 và RAID 4
RAID-4 tương tự như RAID-3 ngoại trừ dữ liệu được phân tách ở mức block, một block dữ liệu tiêu chuẩn có kích thước 512 byte Thông tin kiểm tra tính toàn vẹn được tính toán khi mỗi block dữ liệu được truy cập
RAID-5 giống như RAID-4 ở chỗ dữ liệu được phân tách ở cấp độ block nhưng khác ở chỗ các thông tin về tính toàn vẹn parity được lưu xen kẽ cùng với các dữ liệu được phân tách trên tất cả các đĩa trong bộ đĩa Nếu một đĩa bị hỏng, dữ liệu trên đó sẽ được khôi phục lại từ những đĩa còn lại Với RAID-5, nếu một đĩa thứ 2
bị hỏng trước khi đĩa hỏng thứ nhất được thay thế và khôi phục lại dữ liệu thì việc mất dữ liệu là không thể tránh khỏi do đó trong hệ thống thường gắn sẵn một ổ sơ