1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tăng cường chất lượng ảnh X-Ray bằng kỹ thuật đa kênh và phối hợp ảnh

80 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tăng cường chất lượng ảnh X-Ray bằng kỹ thuật đa kênh và phối hợp ảnh
Tác giả Võ Ngọc Thẩm
Người hướng dẫn TS. Nguyễn Mạnh Hùng
Trường học Đại học Sư Phạm Kỹ Thuật Thành Phố Hồ Chí Minh
Chuyên ngành Kỹ Thuật Điện Tử
Thể loại luận văn thạc sĩ
Năm xuất bản 2022
Thành phố Tp. Hồ Chí Minh
Định dạng
Số trang 80
Dung lượng 6,27 MB

Cấu trúc

  • Chương 1 (22)
    • 1.1. Lý do chọn đề tài (22)
    • 1.2. Tình hình nghiên cứu hiện nay (23)
      • 1.2.1. Các kỹ thuật tăng cường ảnh truyền thống (23)
      • 1.2.2. Các phương pháp tăng cường ảnh X-quang (24)
    • 1.3. Mục tiêu (25)
    • 1.4. Nội dung nghiên cứu (26)
    • 1.5. Giới hạn (26)
    • 1.6. Phương pháp nghiên cứu (26)
    • 1.7. Bố cục luận văn (27)
  • Chương 2 (28)
    • 2.1. Ảnh X-quang (28)
      • 2.1.1. Tia X trong y tế (29)
      • 2.1.2. Kỹ thuật chụp ảnh X-quang (30)
      • 2.1.3 Chuẩn lưu trữ ảnh y tế DICOM (31)
    • 2.2. Các phương pháp tăng cường ảnh truyền thống (34)
    • 2.3. Các phương pháp nén dải động (36)
    • 2.4. Tăng cường ảnh X-quang sử dụng kỹ thuật học sâu (deep learning) (39)
    • 2.4. Mô hình tăng cường ảnh dựa vào đặc tính vật lý của ảnh X-quang (39)
    • 2.5 Các thước đo chất lượng ảnh (44)
  • Chương 3 (46)
    • 3.1. Tổng quan về mô hình đề xuất (46)
    • 3.2. Ước lượng vùng chứa thông tin quan trọng (47)
    • 3.3. Lượng tử hóa ảnh (49)
    • 3.4. Kết hợp ảnh (52)
  • Chương 4 (55)
    • 4.1 Đánh giá định tính và định lượng giữa các phương pháp (56)
    • 4.2 Đánh giá ảnh hưởng của việc lựa chọn ngưỡng cận dưới (60)
    • 4.3 Đánh giá sự ảnh hưởng của thông số K (61)
  • Chương 5 (63)
    • 5.1. Kết luận (63)
    • 5.2 Hướng phát triển (64)
  • TÀI LIỆU THAM KHẢO (65)
    • 3.4 Image fusion (0)

Nội dung

Lý do chọn đề tài

Ảnh X-quang là một phương pháp đơn giản nhưng hiệu quả giúp bác sĩ đánh giá ban đầu tình trạng sức khỏe bệnh nhân Thông thường, các thiết bị chụp ảnh X-quang y tế chụp và lưu trữ ảnh ở định dạng DICOM 12 bits Hầu hết các thiết bị hiển thị thương mại ngày nay vẫn có màn hình hiển thị với dải động (LDR) hạn chế Do đó để có thể lưu trữ và hiển thị trên các màn hình thương mại, các ảnh DICOM này sẽ được chuyển sang định dạng 8 bits thông dụng như JPEG, PNG Hình 1.1 là một vài hình ảnh X-quang đặc trưng Có thể thấy được rằng với độ tương phản thấp và giải động thấp, các thành phần quan trọng như các cơ quan nội tạng, sương, và các khối u trở nên khó để có thể nhận dạng Vì vậy mà các kỹ tăng cường độ tương phản là cần thiết để có thể nhìn thấy được các chi tiết trong cả vùng tối lẫn vùng sáng

Hình 1.1: Một số ảnh X-quang đặc trưng với độ tương phản thấp và giải động thấp

Các kỹ thuật tăng cường ảnh thông dụng [1], [2] sẽ được sử dụng để tăng độ tương phản của ảnh mới Các kỹ thuật tăng cường ảnh thông dụng giúp tăng cường độ tương phản trong khi giảm thiểu hiệu ứng không mong muốn như halo hoặc không trung hợp Tuy nhiên, các phương pháp truyền thống sử dụng biến đổi tuyến tính để chuẩn hóa thông tin từ ảnh DICOM sang các chuẩn lưu trữ truyền thống có thể sẽ làm

2 mất đi một lượng thông tin trong ảnh gốc ban đầu Dẫn đến các phương pháp tăng cường chất lượng ảnh được áp dụng sau đó mặc dù làm tăng độ tương phản và độ sắc nét của ảnh nhưng không thể khôi phục những thông tin đã mất Chính vì vậy trong đề tài này, người thực hiện đề tài đề xuất một phương pháp giúp chuyển đổi ảnh X- quang y tế từ định dạng DICOM sang các định dạng truyền thống để có thể hiển thị trên các thiết bị thương mại với màn hình có dải động thấp Bên cạnh đó áp dụng các phương pháp giúp tăng cường chất lượng ảnh X-quang và giảm tối đa các nguy cơ có thể làm suy giảm lượng thông tin của ảnh Tạo ra một ảnh X-quang đạt được độ tương phản tốt hơn các phương pháp truyền thống và giúp bảo toàn các chi tiết của ảnh.

Tình hình nghiên cứu hiện nay

Có nhiều phương pháp tăng cường chất lượng ảnh sử dụng trong tăng cường chất lượng ảnh RGB có thể áp dụng để tăng cường chất lượng ảnh X-quang Các kỹ thuật tăng cường ảnh truyền thống này khi áp dụng cho ảnh x quang có ưu và nhược điểm riêng của nó Mục 1.2.1 sẽ trình bày tóm gọn các kỹ thuật tăng cường ảnh truyền thống cũng như chỉ ra ưu và nhược điểm của mỗi phương pháp Gần đây có nhiều kỹ thuật hiện đại được đề xuất cho việc tăng cường chất lượng ảnh như nén ảnh HDR và tăng cường chất lượng ảnh ứng dụng mạng học sâu deep learning Ảnh X-quang có cấu tạo và ý nghĩa vật lý riêng của nó, vì vậy mà đã có một số phương pháp được thiết kế chuyên biệt cho việc tăng cường ảnh X-quang Các phương pháp tăng cường chất lượng ảnh X-quang cũng như ưu và nhược điểm của các phương pháp sẽ được trình bày trong mục 1.2.2 Bên cạnh đó người thực hiện đề tài cũng nêu ra các hạn chế của các phương pháp được đề xuất gần đây, từ đó đưa ra các giải pháp mới để khắc phục các nhược điểm này

1.2.1 Các kỹ thuật tăng cường ảnh truyền thống

Nhiều phương pháp truyền thống để nâng cao chất lượng hình ảnh đã được đề xuất để cải thiện độ tương phản và chi tiết hình ảnh như ánh xạ tông màu toàn cục (Global tone mapping)[1], ánh xạ tông màu cục bộ (Local tone mapping)[2], retinex[3], và phương pháp tăng cường ảnh trong miền tần số [4]

Trong các phương pháp này, phương pháp ánh xạ tông màu toàn cục sử dụng một hàm biến đổi mức xám để chuyển các giá trị mức xám đầu vào thành các giá trị mới đồng thời mở rộng độ tương phản toàn cục Bởi vì hàm biến đổi này là đồng nhất trên toàn bộ ảnh, hướng tiếp cận này có nhược điểm là các chi tiết hình ảnh có thể không được tăng cường nhiều

Ngược lại, các phương pháp ánh xạ tông màu cục bộ có các chiến lược tăng cường ảnh dựa vào thông tin cục bộ của ảnh Ưu điểm của phương pháp này là độ tương phản luôn được tăng cao tại tất cả các vùng Tuy nhiên, ảnh tổng quát có thể

3 tạo ra các hiệu ứng khối không mong muốn Do đó, việc duy trì tính nhất quán không gian sau khi tăng cường qua phương pháp cục bộ là một vấn đề cần quan tâm khi sử dụng các phương pháp này

Phương pháp Retinex [3] đề xuất tách một ảnh thành hai thành phần là thành phần mức sáng và thành phần phản xạ Bằng cách loại bỏ độ lệch của thành phần mức sáng, độ tương phản của ảnh sẽ được tăng cường Phương pháp này đặt biệt hiệu quả đối với vùng ảnh được chiếu sáng yếu hoặc vùng tối Mặc dù vậy độ tương phản ở các vùng sáng không được cải thiện nhiều Hơn nữa, kết quả tăng cường ảnh thường có hiệu ứng vầng hào quang (halo effect) và trông không tự nhiên

Trong một cách tiếp cận khác, các phương pháp tăng cường ảnh trên miền tần số

[4] sử dụng các phép biến đổi ảnh (chẳng hạn như phép biến đổi cosin rời rạc DCT hoặc phép biến đổi wavelet) để tìm các thành phần tần số thấp và tần số cao Sau đó, trọng số của thành phần tần số cao sẽ được tăng cường nhằm mục đích hiển thị rõ các chi tiết Cuối cùng, phép biến đổi nghịch đảo sẽ được sử dụng để biến đổi ảnh về miền không gian Mặc dù các phương pháp dựa trên biến đổi có thể thực hiện tăng cường độ tương phản cục bộ và toàn cục, chúng ta có thể tìm thấy hiệu ứng hào quang (halo effect) trong hình ảnh đầu ra

Mặc dù các phương pháp trên đều có hiệu quả nhất định, các phương pháp thiết kế không tính đến đặc tính vật lý của ảnh X-quang Do đó, một phương pháp có tính tới đặc tính vật lý của ảnh X-quang cần được xem xét Trong phần tiếp theo (1.2.2) người thực hiện đề tài sẽ trình bày về các đặc tính kỹ thuật của một ảnh X-quang và các phương pháp tận dụng kỹ thuật này để tăng cường độ tương phản của ảnh

1.2.2 Các phương pháp tăng cường ảnh X-quang

Các kỹ thuật tăng cường ảnh thông dụng được trình bày trong mục 1.2.1 giúp tăng cường độ tương phản trong khi giảm thiểu hiệu ứng không mong muốn như halo hoặc không trung hợp Mặc dù vậy, độ tương phản hay độ tự nhiên của ảnh không phải là điều duy nhất mà một ảnh y tế cần quan tâm Ảnh X-quang, về mặt vật lý, sẽ đo lường mức năng lượng còn sót lại của tia x khi chiếu qua một vật thể Khối lượng của vật thế càng lớn, lượng năng lượng bị hấp thụ càng nhiều Do đó, các pixel trong ảnh X-quang sẽ phản ánh khối lượng của vật thể mà tia x tương ứng chiếu qua Ví dụ, trong hình 1.2, vùng sáng tượng trưng cho vùng có có khối lượng cao nơi tập trung nhiều cơ, xương; còn vùng tối tượng trưng cho không khí Trong đó, vùng sáng của ảnh X-quang được quan tâm vì có nhiều cơ quan nội tạng quan trọng và xương tập trung ở vùng này Ngược lại, các chi tiết nhỏ nhưng quang trọng như các khối u (nodules) thường xuất hiện trong các vùng tối Việc duy trì lượng thông tin này, về

4 mặt nào đó sẽ có đóng góp trong việc chẩn đoán và điều trị Vì vậy, nhiều phương pháp đã được thiết kế đặt biệt để tăng cường chất lượng ảnh X-quang

Trong đó [5] dựa vào đặc tính vật lý của ảnh để thiết kế ra một mô hình ước lượng mô cơ và tăng cường độ tương phản của ảnh bằng cách loại bỏ có thành phần mô cơ không cần thiết Cụ thể, phương pháp này giả định mức xám của một điểm ảnh là tổng của các thành phần mô cơ và các thành phần khối u hoặc thành phần chứa thông tin quan trọng khác Nếu thành phần mô cơ được loại bỏ, ta sẽ có được dải động lớn hơn để mô tả những thành phần quan trọng khác

Dựa trên ý tưởng của [5], [6] mô tả bài toán tìm thành phần mô cơ như một bài toán tối ưu và giải bài toán này để ước lượng phần mô cần loại bỏ Hơn thế nữa, [6] cải tiến mô hình gốc nhằm đảm bảo duy trì mức năng lượng không đổi cho ảnh sau biến đổi mặc dù vẫn tăng cường độ tương phản của ảnh

Tuy đã có nhiều thành công, hai mô hình có nhược điểm là các ảnh phải được chuẩn hoá bằng việc dựa vào điểm có giá trị lớn nhất trong ảnh X-quang như trong phương trình (1); và việc các ảnh được tạo ra bằng cách kết hợp các ảnh tăng cường từ ảnh được chuẩn hoá Để chuẩn hóa dữ liệu về khoảng [0,1], phương pháp này sử dụng giá trị lớn nhất trong ảnh DICOM như một ngưỡng cận trên tương ứng với giá trị 1 trong ảnh chuẩn hóa Vì ảnh chuẩn hoá là ảnh được nén lại từ ảnh gốc nên khả năng đã mất đi thông tin nên các ảnh được tăng cường cũng sẽ mất đi các thông tin này

Bên cạnh đó, ngưỡng cận dưới trong ảnh DICOM không được quan tâm trong các phương pháp tăng cường ảnh X-quang được đề xuất trước đó Trong hình 1.2, vùng không có thông tin (hình chữ nhật đỏ) có giá trị lớn hơn 0 Điều đó có nghĩa là tồn tại một ngưỡng cận dưới mà những điểm ảnh có giá trị nhỏ hơn khoảng này sẽ không nằm trong vùng cần quan sát như mô, cơ, xương, phổi Việc xác định được ngưỡng này sẽ giúp giới hạn cận dưới cho phép toán chuẩn hóa, từ đó nhiều thông tin sẽ được hiển thị hơn trên ảnh

Chính vì vậy trong luận văn này tôi đề nghị một phương pháp tăng cường chất lượng ảnh X-quang y tế có các mục tiêu được trình bày trong phần 1.3.

Mục tiêu

Trong luận văn này, người thực hiện đề tài đề xuất một phương pháp giúp hiển thị ảnh X-quang y tế được lưu trữ ở định dạng DICOM lên các thiết bị thương mại có giải động thấp(LDR) Cụ thể phương pháp tăng cường ảnh X-quang dựa trên việc xác định khoảng chứa thông tin quan trọng bằng cách tính toán để lựa chọn ngưỡng cận trên và ngưỡng cận dưới sau đó trích xuất các ảnh thành phần và kỹ thuật kết hợp ảnh Những ảnh thành phần này hiển thị các chi tiết trong những vùng năng lượng

5 ngắn nên dễ dàng nhận ra sự khác biệt giữa các mô cơ Trong khi đó, kỹ thuật kết hợp ảnh sẽ giúp kết hợp các thông tin chi tiết trong từng ảnh thành phần vào ảnh cuối cùng

Cùng với đó là các thí nghiệm tiến hành trên bộ dữ liệu với nhiều ảnh khác nhau chứng tỏ phương pháp mới có thể tạo ra ảnh có độ tương phản cao hơn so với các phương pháp trước vốn dựa trên kỹ thuật chuẩn hóa tuyến tính ảnh DICOM.

Nội dung nghiên cứu

Trong quá trình nghiên cứu đề tài, người thực hiện đề tài đã lần lượt thực hiện các bước cụ thể như sau:

- Xử lý ảnh DICOM: Tìm hiểu về chuẩn lưu trữ DICOM trong y tế, cũng như cấu tạo và các thành phần trong một tệp DICOM Cách sử dụng các thư viện để đọc và hiển thị ảnh X-quang trong tệp DICOM

- Tìm hiểu về nguyên lý cũng như cấu tạo của một ảnh X-quang y tế, từ đó xác định vùng thông tin quang trọng cần được xử lý trên ảnh X-quang

- Với ý tưởng bảo toàn thông tin trên ảnh X-quang gốc, người thực hiện đề tài đã đề xuất xây dựng mô hình tạo ra K ảnh, với mỗi ảnh có giải mức xám khác nhau từ vùng thông tin quang trọng của ảnh đầu vào

- Xây dựng mô hình kết hợp ảnh, tạo ra ảnh tăng cường có độ tương phản và chất lượng cao

- Đánh giá kết quả qua các phương pháp kiểm tra chất lượng ảnh như đo độ sắc nét, nhiễu, độ tương đồng về cấu trúc,

Giới hạn

Xây dựng hệ thống tăng cường chất lượng ảnh có đầu vào là ảnh X-quang y tế (ở đây người thực hiện đề tài tập trung vào xử lý ảnh x quang ngực) được lưu trữ ở định dạng DICOM 12 hoặc 16 bit và ngõ ra là ảnh LDR có độ tương phản cao và bảo toàn thông tin ảnh.

Phương pháp nghiên cứu

- Phương pháp thu thập thông tin, tự nghiên cứu, sau đó tổng hợp và đưa ra phương án thực hiện đề tài

- Nghiên cứu các tài liệu và viết tổng quan

- Nghiên cứu triển khai công nghệ và thử nghiệm hệ thống: xây dựng chương trình cụ thể để thử nghiệm, phân tích, đánh giá kết quả đạt được Ý tưởng: Xây dựng một mô hình tăng cường chất lượng ảnh x-ray có thể cân bằng độ tương phản ở cả vùng tối và vùng sáng và giúp bảo toàn được thông tin trên ảnh gốc

Bố cục luận văn

Chương 1: Tổng Quan: Đặt vấn đề liên quan đến đề tài, tìm hiểu những lý do và sự cần thiết để thực hiện đề tài, mục tiêu hoàn thành, giới hạn cũng như những bước đi từ cơ bản đến cụ thể mà nhóm sẽ thực hiện trong quá trình nghiên cứu đề tài

Chương 2: Cơ Sở Lý Thuyết: Giới thiệu về ảnh X-quang y tế, kỹ thuật phân nhóm giữ liệu dùng K-mean, gaussian mixture model Giới thiệu về ảnh X-quang y tế, giới thiệu các phương pháp tăng cường ảnh truyền thống, giới thiệu phương pháp tăng cường ảnh dựa vào đặc tính vật lý của ảnh

Chương 3: Phương Pháp Đề Nghị: Từ những hạn chế còn tồn đọng của các phương pháp trước đó Người thực hiện đề tài đưa ra phương pháp để xây dựng mô hình tăng cường ảnh X-quang giúp thực hiện các mục tiêu đã đề ra và trình bày chi tiết cách thực hiện

Chương 4: Thí Nghiệm: Ở phần này, người thực hiện đề tài đã triển khai đánh giá kết quả từ mô hình đề xuất trên một tạp giữ liệu ảnh X-quang ngực được được cung cấp bởi một bệnh viện Dùng nhiều thước đo khác nhau để đánh giá chất lượng ảnh được tăng cường So sánh với các phương pháp tăng cường chất lượng ảnh trước đó Cũng như ảnh của các tham số điều khiểu lên hiệu suất của hệ thống đề xuất

Chương 5: Kết luận: Người thực hiện đề tài tóm tắt các kết quả đã đạt được, những đóng góp chính của phương pháp đề xuất Cũng như nêu ra các hướng phát triển để xây dựng một mô hình tăng cường chất lượng ảnh X-quang y tế tốt hơn trong tương lai

Ảnh X-quang

X-quang là một loại bức xạ năng lượng cao Máy chụp X-quang phát ra các chùm tia X có bức xạ cao, các tia X này xuyên qua các mô mềm và thành phần dịch trong cơ thể dễ dàng, từ đó tạo hình ảnh, các bác sĩ sẽ dựa vào hình ảnh này để chẩn đoán bệnh

Chụp X-quang là một trong những kỹ thuật chẩn đoán hình ảnh một cách nhanh chóng, dễ dàng và tiết kiệm được thời gian trong quá trình chẩn đoán bệnh Chi phí của chụp X-quang cũng tương đối thấp Trong lĩnh vực y tế, máy X-quang giữ một vài trò rất quan trọng, giúp cho các bác sĩ chẩn đoán bệnh một cách dễ dàng và nhanh nhanh chóng Những ứng dụng của chụp X-quang giúp chẩn đoán và khảo sát cấu trúc các bộ phận của cơ thể bệnh nhân Như chụp xương khớp, chụp bụng, chụp sọ não, chụp phổi, chụp cột sống, tiết niệu, mạch, dạ dày, Hình 2.1 là một số ví dụ của ảnh X-quang được sử dụng trong y tế a) Ảnh X-quang ngực b) Ảnh X-quang vùng sương chậu

8 c) Ảnh X-quang bàn tay d) Ảnh X-quang cẳng chân

Hình 2.1: Một số ví dụ về hình ảnh X-quang y tế

Hiện nay, phương pháp chụp X-quang này được sử dụng rộng rãi và phổ biến trên khắp cả nước, từ bệnh viện lớn đến bệnh viện nhỏ, từ bệnh viện tư đến bệnh viện công Để chuẩn đoán bệnh qua ảnh X-quang được hiểu quả đòi hỏi nhiều yếu tố như kinh nghiệm của bác sĩ và chất lượng của ảnh X-quang Tùy thuộc vào chất lượng của máy chụp mà ta sẽ có các ảnh X-quang với chất lượng khác nhau Với những ảnh X-quang chất lượng thấp, việc tăng cường chất lượng ảnh là cần thiết để giúp bác sĩ dễ dàng hơn trong phát hiện bất thường và chuẩn đoán bệnh

Tia x là một dạng bức xạ điện từ, tương tự như ánh sáng nhìn thấy Tuy nhiên, không giống như ánh sáng, tia x có năng lượng cao hơn và có thể đi qua hầu hết các vật thể, bao gồm cả cơ thể X-quang y tế được sử dụng để tạo ra hình ảnh của các mô và cấu trúc bên trong cơ thể Nếu tia x đi qua cơ thể cũng đi qua máy dò tia x ở phía bên kia của bệnh nhân, một hình ảnh sẽ được hình thành đại diện cho “bóng” do các vật thể bên trong cơ thể tạo thành Một loại máy dò tia x là phim ảnh, nhưng có nhiều loại máy dò khác được sử dụng để tạo ra hình ảnh kỹ thuật số Các hình ảnh có được của quá trình này được gọi là ảnh X-quang

2.1.2 Kỹ thuật chụp ảnh X-quang Để tạo ra một bức ảnh X-quang, bệnh nhân được định vị sao cho phần cơ thể được chụp ảnh nằm giữa nguồn tia x và máy dò tia x Khi máy được bật, tia x đi qua cơ thể và được các mô khác nhau hấp thụ với số lượng khác nhau, tùy thuộc vào mật độ phóng xạ của các mô mà chúng đi qua

Hình 2.2: Nguyên lý chụp X-quang y tế

Mật độ phóng xạ được xác định bởi cả mật độ và số nguyên tử (số proton trong hạt nhân nguyên tử) của các vật liệu được chụp ảnh Ví dụ, các cấu trúc như xương chứa canxi, có số nguyên tử cao hơn hầu hết các mô Do đặc tính này, xương dễ dàng hấp thụ tia X và do đó, tạo ra độ tương phản cao trên máy dò tia X Kết quả là các cấu trúc xương có vẻ trắng hơn các mô khác trên nền đen của ảnh chụp X-quang Ngược lại, tia X di chuyển dễ dàng hơn qua các mô ít bức xạ hơn như mỡ và cơ, cũng như qua các khoang chứa đầy không khí như phổi Các cấu trúc này được hiển thị bằng màu xám trên phim chụp X-quang Tóm lại, hình ghi sẽ càng đậm màu khi càng có nhiều tia X chiếu đến phim Còn khi chúng ta nhìn thấy trên ảnh có những vùng màu trắng thì đó là do những bộ phận cơ thể đặc như xương cản trở các tia X

Thông thường hình X-quang cho ta thấy:

● Xương, răng, gãy xương và các điểm bất thường của xương

● Các khe khớp, những bất thường của ổ khớp như thoái hóa khớp

● Hình dạng và kích thước của tim Vì thế có thể phát hiện được một số bệnh về tim

● Sự thay đổi độ đậm của mô nền Ví dụ như có một khối u phổi đặc hơn nhu mô phổi thì hình ảnh X-quang thu được sẽ thấy hình ảnh bóng mờ trên ảnh

● Tụ dịch có trong phổi, ruột thì sẽ cho hình ảnh bóng mờ với độ xám đậm nhạt khác với màu đen chứa khí của nhu mô phổi bình thường hoặc ruột rỗng

2.1.3 Chuẩn lưu trữ ảnh y tế DICOM

DICOM được viết tắt của từ Digital Imaging and Communications in Medicine Standards (tiêu chuẩn ảnh số và truyền thông trong y tế) là một hệ thống tiêu chuẩn công nghiệp được phát triển nhằm đáp ứng nhu cầu của của các nhà sản xuất cũng như người sử dụng trong việc kết nối, lưu trữ, trao đổi, in ấn ảnh y tế Định dạng dữ liệu DICOM khác so với các định dạng khác là các nhóm thông tin được tích hợp vào bên trong tập tin DICOM Do đó, nếu một tập tin X-quang phổi theo định dạng DICOM sẽ chứa các thông tin như tên bệnh nhân, mã ID bệnh nhân, vì vậy hình ảnh sẽ không bao giờ bị thất lạc thông tin Một đối tượng dữ liệu DICOM sẽ bao gồm các thuộc tính như họ và tên, mã ID, và cũng bao gồm các thuộc tính đặc biệt chứa dữ liệu Pixel của hình ảnh

Việc hỗ trợ khám chữa bệnh liên tuyến giữa các bệnh viện là điều rất khó khăn, đặc biệt trong lĩnh vực giải phẫu, phẫu thuật chỉnh hình Hiện đại hóa nền y học nước nhà để tạo ra những thay đổi mới mẻ, thúc đẩy sự phát triển và đem lại nhiều lợi ích thiết thực trong đời sống xã hội là vấn đề cần thiết và cấp bách Thấy được tầm quan trọng đó, hầu hết các bệnh viện đã có khoa chẩn đoán hình ảnh riêng biệt và trong y tế cũng đã hình thành nên một chuẩn trao đổi dữ liệu hình ảnh DICOM (Digital Imaging and Communications in Medicine) Việc quản lý hệ thống thông tin hình ảnh cũng như việc khai thác nó trong các hệ thống thông tin bệnh viện trở thành một việc làm cần thiết và không thể thiếu, nhất là trong điều kiện cơ sở hạ tầng mạng phát triển và chúng ta cũng quen dần với các khái niệm: Bệnh viện số, bệnh viện di động, chẩn đoán bệnh từ xa v.v Ảnh y tế DICOM được chụp từ các phương tiện kỹ thuật tiên tiến như: chụp cộng hưởng từ (Magnetic Resonace Imaging – MRI), chụp hình ảnh cắt lớp (Computed Tomography - CT), chụp X-quang hay siêu âm được ứng dụng rộng rãi trong cho chẩn đoán cận lâm sàng để phát hiện bệnh lý từ sọ não, đầu mặt cổ, tim, ngực, bụng, chậu, xương, mô mềm cho đến bệnh lý mạch máu não, cổ, mạch máu chi và các mạch máu tạng khác Ảnh được chụp từ thiết bị chụp cắt lớp CT còn được dùng để hướng dẫn phẫu thuật xạ trị, theo dõi sau phẫu thuật Kể từ khi ra đời vào năm 1993 cho đến nay, chuẩn DICOM đã được đầu tư nghiên cứu và được ứng dụng rất rộng rãi trong ngành y tế trên toàn thế giới Có thể nói đây là chuẩn ảnh phổ biến nhất hiện nay Khi nghiên cứu về DICOM vấn đề đang được quan tâm nhất hiện nay đó là kỹ thuật nhằm nâng cao chất lượng hình ảnh, cũng như các ứng dụng của DICOM trên nghiên cứu lâm sàng Nhằm đưa chuẩn ảnh này đến một tầm cao mới

11 của sự phát triển, không chỉ là ứng dụng trong chẩn đoán bệnh mà còn ứng dụng trong việc nghiên cứu các loại bệnh cũng như đào tạo y khoa

Cấu trúc của chuẩn ảnh DIOCM gồm các thành phần sau:

- Thích nghi: Định nghĩa các nguyên tắc thực thi chuẩn gồm các yêu cầu thích nghi và báo cáo thích nghi CS (Conformation Statement)

- Định nghĩa đối tượng thông tin IOD (Information Object Desfinition)

- Định nghĩa lớp dịch vụ SC (Service Classes)

- Ngữ nghĩa và cấu trúc dữ liệu

- Hỗ trợ truyền thông mạng cho việc trao đổi bản tin

- Định dạng file và lưu trữ trung gian

- Sơ lược ứng dụng lưu trữ trung gian

- Chức năng lưu trữ và định dạng trung gian cho trao đổi dữ liệu

- Chức năng hiển thị chuẩn mức xám

- Nguồn ánh xạ nội dung

Hình 2.3: Cấu tạo của một file DICOM

12 Định dạng file DICOM gồm 2 thành phần là header và dữ liệu ảnh: Header gồm (tên và ID của bệnh nhân, loại ảnh y khoa (CT, MR, Audio Recording,…) , kích thước ảnh, máy sinh ảnh,…) Dữ liệu ảnh bao gồm (Ảnh nén (bitmap) hoặc ảnh chưa nén từ (jpeg, gif, …), định nghĩa đối tượng thông tin IOD (Information Object Definition)., định nghĩa lớp dịch vụ SC (Service Classes), ngữ nghĩa và cấu trúc dữ liệu, từ điển dữ liệu, trao đổi bản tin, hỗ trợ truyền thông mạng cho việc trao đổi bản tin, khuôn dạng file và lưu trữ trung gian, sơ lược ứng dụng lưu trữ trung gian, chức năng lưu trữ và khuôn dạng trung gian cho trao đổi dữ liệu, chức năng hiển thị chuẩn mức xám, sơ lược an toàn, nguồn ánh xạ nội dung

Thông tin đầu file (Header): Bao gồm các định danh bộ dữ liệu được đưa vào file Nó bắt đầu bởi 128 byte file Preamble (tất cả được đưa về 00H), sau đó 4 byte kí tự “DICM”, tiếp theo là các thành phần dữ liệu đầu file Các thành phần dữ liệu đầu file này là bắt buộc đối với mọi file DICOM Các thành phần dữ liệu này có nhãn dạng (0002, xxxx), được mã hóa theo cú pháp chuyển đổi VR ẩn và Little Endian Bộ dữ liệu: Mỗi file chỉ chứa một bộ dữ liệu thể hiện một SOP cụ thể và duy nhất liên quan đến một lớp SOP đơn và IOD tương ứng Một file có thể chứa nhiều hình ảnh khi các IOD được xác định mang nhiều khung Cú pháp chuyển đổi được sử dụng để mã hóa bộ dữ liệu được xác định duy nhất thông qua UID cú pháp chuyển đổi trong thông tin đầu file DICOM Thông tin quản lý file: Khuôn dạng file DICOM không bao gồm thông tin quản lý file để tránh sự trùng lắp với chức năng liên quan ở lớp khuôn dạng trung gian Nếu cần thiết với một sơ lược ứng dụng DICOM cho trước, các thông tin sau sẽ được đưa ra bởi một lớp khuôn dạng trung gian:

- Định danh sở hữu nội dung file

- Thông tin truy cập (ngày giờ tạo)

- Điều khiển truy cập file ứng dụng

- Điều khiển truy cập phương tiện trung gian vật lý (bảo vệ ghi …)

Khuôn dạng file DICOM an toàn: Một file DICOM an toàn là một file DICOM được mã hóa với một cú pháp bản tin mật mã được định nghĩa trong 10 RFC2630 Phụ thuộc vào thuật toán mật mã sử dụng, một file DICOM an toàn có thể có các thuộc tính an toàn sau:

- Xác nhận nguồn gốc dữ liệu

- Tính toàn vẹn dữ liệu Cấu trúc căn bản của file DICOM là Data Set

Cấu tạo Data Set Một File sẽ chứa một Data Set biểu diễn cho một thực thể SOP liên quan tới lớp SOP (tương ứng với IOD) Tập dữ liệu bao gồm một tập hợp các phần tử dữ liệu (Data Element -DE) DE chứa giá trị thuộc tính được mã hoá theo cú

13 pháp chuyển đổi (TrS-Transfer Syntax) Dựa vào TrS ta có thể xác định xem dữ liệu trong file được mã hoá theo kiểu gì Để làm việc với tập dữ liệu DICOM chúng ta cần cài đặt thư viện Pydicom Pydicom là một gói Python thuần túy để làm việc với các tệp DICOM Nó cho phép bạn đọc, sửa đổi và ghi dữ liệu DICOM một cách dễ dàng.

Các phương pháp tăng cường ảnh truyền thống

Trong phần này, các phương án tăng cường độ tương phản của của một ảnh sẽ được tóm tắt

Hiệu chỉnh gamma [7], hiệu chỉnh đường cong biến đổi [8] và cân bằng lược đồ mức xám là những phương pháp ánh xạ tông màu toàn cục được sử dụng phổ biến Bằng cách chọn thủ công tham số gamma của chức năng ánh xạ toàn cục, các phương pháp hiệu chỉnh gamma có thể kéo dài độ tương phản của hình ảnh trong các vùng tối hoặc vùng sáng Ý tưởng đằng sau các phương pháp hiệu chỉnh đường cong S tương tự như hiệu chỉnh gamma Tuy nhiên, phương pháp hiệu chỉnh đường cong chữ

S cung cấp nhiều tham số hơn để điều chỉnh thủ công và do đó cho phép hệ thống sử dụng chức năng ánh xạ toàn cục hình chữ S để tăng cường cả vùng tối và vùng sáng cùng một lúc Mặt khác, cân bằng biểu đồ (HE) [7] và HE đa tỷ lệ [9] nhằm mục đích tự động xác định chức năng ánh xạ toàn cục bằng cách tối đa hóa entropy biểu đồ của hình ảnh nâng cao Các phương pháp dựa trên HE hiệu quả nhưng chúng có xu hướng nâng cao quá mức hình ảnh và tạo ra các hiện vật không tự nhiên khi phân bố biểu đồ có đỉnh Cuối cùng, các phương pháp lập bản đồ tông màu toàn cầu này không thể nâng cao một cách thích ứng các vùng ảnh cục bộ Để cải thiện độ tương phản cục bộ, phương pháp ánh xạ dựa trên biểu đồ 2D [10] và [2] giới thiệu thông tin bối cảnh từ các bản vá lân cận đã được đề xuất gần đây Ý tưởng quan trọng đằng sau chúng là sự gia tăng chênh lệch mức xám giữa pixel và các pixel lân cận có thể trực tiếp mở rộng độ tương phản cục bộ của hình ảnh Theo đó, trong [10], tác giả đã tạo một biểu đồ 2D để ghi lại sự xuất hiện của các cặp mức xám trong một vùng nhỏ Một chức năng ánh xạ có thể được thiết lập để cân bằng biểu đồ 2D theo cách làm cho sự khác biệt về cường độ của các cặp pixel lân cận được phân phối đồng đều Thuật toán tăng cường độ tương phản theo ngữ cảnh và biến đổi (CVC) [11] là một phiên bản cải tiến của [10] Cũng như yêu cầu biểu đồ mục tiêu phải đồng nhất, trong CVC, một thuật ngữ vi phân đã được đưa ra để làm cho biểu đồ mục tiêu trơn tru Chức năng ánh xạ cuối cùng có thể đạt được bằng cách ánh xạ các thành phần đường chéo của biểu đồ 2D ban đầu của hình ảnh đầu vào với các thành phần đường chéo của biểu đồ mục tiêu 2D Trong [2], một hàm mục tiêu phức tạp hơn đã được đề xuất để ước tính biểu đồ mục tiêu Bên cạnh các hạn chế về phân phối đồng đều và các hạn chế về độ trơn,

14 các yếu tố ảnh bậc cao đã được xem xét đồng thời Những sửa đổi này có thể tạo ra kết quả hài lòng hơn Tuy nhiên, chi phí tính toán cao

Mặt khác, một chiến lược kết hợp kết giữa phương pháp ánh xạ toàn cục và phương pháp tăng cường dựa trên chuyển đổi đã được xuất trong [12] và [13] Trong

[12], một thuật toán tăng cường độ tương phản dựa trên entropy không gian trong DCT (SECEDCT) đã được giới thiệu Entropy không gian của các cường độ mức xám khác nhau trên một hình ảnh đã được xác định và tính toán Với chức năng entropy không gian, chức năng tăng cường độ tương phản toàn cục ánh xạ cường độ đầu vào với giá trị đầu ra sau đó được xác định Hơn nữa, để tăng cường độ tương phản cục bộ, 2D-DCT đã được sử dụng để chuyển hình ảnh nâng cao toàn cầu vào miền tần số Bằng cách đặt trọng số thích hợp cho các thành phần tần số cao, có thể thu được kết quả nâng cao cục bộ và toàn cục bằng một phép biến đổi nghịch đảo của DCT Mặc dù SECEDCT có thể nâng cao độ tương phản của hình ảnh, những thuật toán không cho phép hệ thống kiểm soát mức độ tương phản toàn cục và không thể bảo toàn độ sáng của hình ảnh Để giải quyết những vấn đề này, các tác giả gần đây đã đề xuất một phiên bản sửa đổi [13]

Các phương pháp dựa trên Retinex là những lựa chọn thay thế khác để làm sắc nét hình ảnh và nén dải động Single-Scale Retinex (SSR) [14] tăng cường độ tương phản của hình ảnh bằng cách tính toán tỷ lệ cường độ giữa pixel và môi trường xung quanh Tuy nhiên, để có được một kết quả tốt hơn, nó đòi hỏi một quá trình thử-và- sai để chọn thang bộ lọc Hơn nữa, để cân bằng giữa nén động và kết xuất hình ảnh, Multi-Scale Retinex (MSR) [15] đã được đề xuất để kết hợp nhiều kết quả nâng cao SSR được tạo ra dưới các thang bộ lọc khác nhau.

Phương pháp dựa trên retinex và phương pháp dựa trên biến đổi có liên quan với nhau Cả hai phương pháp đều phân rã hình ảnh đầu vào thành các lớp cơ sở (thành phần tần số thấp) và lớp chi tiết (thành phần tần số cao) Bằng cách làm giảm các lớp cơ sở hoặc tăng các lớp chi tiết, các chi tiết hình ảnh có thể được xác định Các chiến lược phân hủy khác nhau đã được tìm thấy trong tài liệu Các tác giả trong [16] và

[17] đã nâng cao hình ảnh bằng cách sử dụng một lớp cơ sở và một lớp chi tiết, trong khi nhiều lớp cơ sở và chi tiết được xem xét để tăng cường trong [18] và [19] Đặc biệt, các hàm tuyến tính đã được sử dụng để nén các lớp cơ sở [18] và [20] trong miền cường độ ban đầu Thay vào đó, [21] và [19] đã nén dải động bằng các hàm phi tuyến trong miền đối tượng.

Gần đây, một số cách thức tổng hợp ảnh đã được đề xuất để cải thiện chất lượng của hình ảnh Thay vì nâng cao hình ảnh bằng cách cài đặt tham số thống nhất, phương pháp dựa trên tổng thể cố gắng tạo ra nhiều phiên bản cải tiến trong đó một

15 số phần hình ảnh hiển thị chất lượng cảm nhận cao hơn đầu vào ban đầu Những hình ảnh được tạo này sau đó được kết hợp liền mạch để tạo ra kết quả nâng cao cuối cùng Trong [22], các tác giả đã sử dụng bộ lọc LLSURE để tạo ra hình ảnh ít nhiễu hơn Kết quả khử nhiễu cuối cùng được thực hiện thông qua phản ứng tổng hợp trung bình.

Các phương pháp nén dải động

Ảnh X-quang chuẩn được cấp bởi các máy chụp X-quang thường ở định dạng 12 hoặc 16 bits Vì vậy, ta có thể xem ảnh X-quang là một ảnh có dải đáp ứng cao(HDR)

Do đó, các phương pháp dùng để nén dải đáp ứng cao (HDR compression) dùng cho ảnh truyền thống cũng có thể được sử dụng để tăng cường ảnh X-quang Hình ảnh dải động cao (HDR) là một lĩnh vực ngày càng có tầm quan trọng, nhưng hầu hết các thiết bị hiển thị vẫn có dải động (LDR) hạn chế Nhiều kỹ thuật khác nhau đã được đề xuất để nén dải động trong khi vẫn giữ lại thông tin hình ảnh quan trọng Hình 2.4 trình bày sơ đồ khối của 2 phương pháp được sử dụng để nén ảnh HDR

Hình 2.4: Phương pháp nén ảnh HDR

Thông thường, có hai giải pháp cho quá trình nén dải đáp ứng Trong phương pháp đầu tiên, hình ảnh HDR trước tiên được tái tạo thông qua hàm phản hồi của máy ảnh (CDF) [23]; sau đó phương pháp ánh xạ tông màu [23], [24], [17] được sử dụng để nén hình ảnh dải động cao xuống mức thấp hơn Trong ứng dụng của tôi, ảnh x- ray gốc dưới định dạng DICOM đã là một ảnh HDR, do đó ta có thể áp dụng các phương pháp ánh xạ tông màu để thực hiện việc tăng cường ảnh Theo cách tiếp cận này, có hai phương pháp để nén dải đáp ứng của ảnh Phương pháp toàn cục [23] sử dụng một chức năng ánh xạ duy nhất để ánh xạ phạm vi động từ cao xuống thấp Cụ thể các tác giả đã đề xuất một kỹ thuật ánh xạ tông màu nhanh, chất lượng cao để hiển thị hình ảnh có độ tương phản cao trên các thiết bị có dải giá trị độ sáng động hạn chế Phương pháp này dựa trên nén logarit của các giá trị độ chói, mô phỏng phản ứng của con người với ánh sáng Một hàm công suất thiên vị được giới thiệu để thay

16 đổi một cách thích ứng các cơ số logarit, dẫn đến bảo toàn tốt các chi tiết và độ tương phản Để cải thiện độ tương phản trong các vùng tối, các thay đổi đối với quy trình hiệu chỉnh gamma được đề xuất Kỹ thuật ánh xạ logarit thích ứng có khả năng tạo ra hình ảnh được điều chỉnh theo cảm quan với nội dung động cao và hoạt động ở tốc độ tương tác Phương pháp này giải quyết nhu cầu về một thuật toán nhanh phù hợp với các ứng dụng tương tác, tự động tạo ra hình ảnh trông thực tế cho nhiều cảnh khác nhau thể hiện dải độ sáng động cao Để đạt được hiệu quả, tác giả đã sử dụng chức năng ánh xạ tông màu đồng nhất trong không gian dựa trên một mô hình đơn giản về cảm nhận độ sáng Cung cấp cho người dùng khả năng điều chỉnh giao diện hình ảnh nhanh chóng về độ sáng và độ tương phản trong một ứng dụng tương tác Hình ảnh thu được rất chi tiết và thể hiện trung thực các cảnh ban đầu có độ tương phản cao được tái tạo trong khả năng của phương tiện hiển thị Thiết kế kỹ thuật ánh xạ tông màu (Tone mapping) của phương pháp này được hướng dẫn bởi một số quy tắc Nó phải cung cấp kết quả nhất quán bất chấp sự đa dạng phong phú của các cảnh tự nhiên và độ chính xác của giá trị bức xạ có thể có trong ảnh HDR Ngoài ra, nó phải có khả năng thích ứng và mở rộng để giải quyết các khả năng hiện tại của các phương pháp hiển thị và sự phát triển trong tương lai của chúng Lập bản đồ tông màu phải nắm bắt được diện mạo thực tế của cảnh, đồng thời tránh đưa vào các hiện vật như đảo ngược độ tương phản hoặc quầng đen Độ sáng tổng thể của hình ảnh đầu ra phải trung thực với bối cảnh Nó phải “thân thiện với người dùng” tức là tự động trong hầu hết các trường hợp, với một vài thông số trực quan cung cấp khả năng điều chỉnh Chức năng ánh xạ tông màu được trình bày trong công thức (1) được sử dụng để tính giá trị hiển thị 𝐿 𝑑 cho mỗi pixel

𝐿 𝑑𝑚𝑎𝑥 được sử dụng như một hệ số tỷ lệ để điều chỉnh đầu ra với màn hình dự kiến của nó Trong mẫu số, lôgarit thập phân được sử dụng vì giá trị độ chói tối đa trong cảnh luôn được lấy mẫu lại thành lôgarit thập phân bởi hàm thiên vị Tham số thiên vị b rất cần thiết để điều chỉnh độ nén các giá trị cao và khả năng hiển thị của các chi tiết trong vùng tối

Trong khi đó các phương pháp cục bộ [24] và [17] sử dụng các chiến lược ánh xạ khác nhau cho từng phần cục bộ Tác giả đã giới thiệu một kỹ thuật mới để hiển thị hình ảnh dải động cao, giúp giảm độ tương phản trong khi vẫn giữ được chi tiết

Nó dựa trên sự phân hủy hai quy mô của hình ảnh thành một lớp cơ sở, mã hóa các

17 biến thể quy mô lớn và một lớp chi tiết Chỉ có lớp nền bị giảm độ tương phản, do đó giữ được chi tiết Lớp cơ sở thu được bằng cách sử dụng một bộ lọc bảo toàn cạnh được gọi là bộ lọc hai bên Đây là một bộ lọc phi tuyến tính, trong đó trọng lượng của mỗi pixel được tính bằng cách sử dụng Gaussian trong miền không gian nhân với một hàm ảnh hưởng trong miền cường độ làm giảm trọng lượng của các pixel có chênh lệch cường độ lớn Phương pháp thể hiện phép lọc song phương trong khuôn khổ thống kê mạnh mẽ và cho thấy nó liên quan như thế nào đến sự khuếch tán dị hướng Sau đó, tăng tốc lọc song phương bằng cách sử dụng phép gần đúng tuyến tính từng đoạn trong miền cường độ và lấy mẫu con thích hợp Điều này dẫn đến tốc độ tăng hai bậc của độ lớn Phương pháp này nhanh chóng và không cần cài đặt tham số Trong bài báo này, tác giả giới thiệu một toán tử nhanh và mạnh mẽ lấy hình ảnh dải động cao làm đầu vào và nén độ tương phản trong khi vẫn giữ nguyên các chi tiết của hình ảnh gốc Toán tử dựa trên sự phân rã hai quy mô của hình ảnh thành lớp cơ sở (các tính năng quy mô lớn) và lớp chi tiết Chỉ có lớp nền bị giảm độ tương phản, do đó giữ được độ chi tiết Để thực hiện phân hủy nhanh chóng thành hai lớp này và để tránh hiện tượng tạo ra vầng hào quang, tác giả đã giới thiệu một bộ lọc bảo vệ cạnh mạnh mẽ và nhanh chóng

Bằng cách chỉ sử dụng duy nhất một hàm ánh xạ trên toàn ảnh, phương pháp nén toàn cục [23] có thể làm giảm độ tương phản của hình ảnh và dẫn đến hiện tượng bão hòa màu Ngược lại, phương pháp nén màu cục bộ [24] có thể có thể có độ tương phản cao nhưng sẽ bị hiệu ứng hallo Trong [17], các tác giả chỉ ra rằng hiệu ứng hallo có thể được khắc phục bằng cách làm mịn các cạnh của ảnh

Mặc dù đạt được nhiều kết quả đáng kỳ vọng, nghiên cứu gần đây [25] chỉ ra rằng các phương án nén dải động cục bộ có xu hướng tạo ra tín hiệu gradient ngược với ảnh gốc Hiện tượng này có thể tránh được bằng cách lấy mẫu nhiều ảnh đầu vào với các thời gian phơi sáng khác nhau Do đó, không phải bất kỳ chuỗi hình ảnh nào cũng có thể áp dụng phương pháp này để nén dải động

Bên cạnh phương pháp nén trực tiếp ảnh có dải động cao, một phương án khác là kết hợp nhiều ảnh dải động thấp dựa vào việc đánh giá chất lượng của từng điểm ảnh trong một chuỗi ảnh có độ phơi sáng khác nhau Các điểm ảnh có chất lượng tốt hơn sẽ có mức độ tin cậy cao hơn và có có trọng số cao hơn để hiển thị ở ảnh đầu ra Một số phương pháp đã được đề xuất để ước tính các bản đồ tin cậy Có nhiều phương pháp để đánh giá chất lượng của một điểm ảnh Trong [26], chất lượng điểm ảnh được ước tính bằng các chỉ số độ tương phản, độ bão hòa màu và độ phơi sáng Trong [27]

- [28], các tác giả sử dụng hệ số entropy cục bộ để ước lượng chất lượng của các điểm ảnh Mặc dù việc ước lượng không đòi hỏi thời gian tính toán cao, các bản đồ trọng

18 số thường rất nhiễu và có thể tạo ra nhiều hiệu ứng không mong muốn nếu chúng ta trực tiếp kết hợp chúng một cách tuyến tính để tạo ra ảnh đầu ra Do đó, cần phải có một quá trình hiệu chỉnh các bản đồ trọng số này Một phương án nổi tiếng được Mertens [26] và Shen [29] áp dụng là sử dụng phương pháp kim tự tháp Laplacian

[27] để tách ảnh gốc thành nhiều ảnh có độ phân giải thấp hơn Sau đó ảnh được tăng cường sẽ là sự kết hợp của ảnh ở nhiều độ phân giải khác nhau Chiến lược này giúp ảnh thành phần tần số thấp ở ảnh độ phân giải thấp kết hợp một cách tự nhiên với các thành phần chi tiết của ảnh có độ phân giải cao.

Tăng cường ảnh X-quang sử dụng kỹ thuật học sâu (deep learning)

Gần đây, các phương pháp tăng cường ảnh dựa trên học sâu đã đạt được thành công đáng kể trong việc khôi phục và nâng cao hình ảnh So với các phương pháp thông thường, các phương pháp tăng cường ảnh áp dụng học sâu có ưu điểm và nhược điểm của chúng

Phương pháp tăng cường hình ảnh thông thường có thể cung cấp một kết quả tốt, nhưng kết quả này phụ thuộc nhiều vào các thông số điều khiển Bởi vì rất khó để chọn các thông số điều khiển phù hợp cho tất cả các hình ảnh, một chuyên gia có thể cần phải chọn các thông số này theo cách thủ công Ngược lại, các phương pháp dựa trên học sâu có thể hoạt động mà không cần lựa chọn tham số Bởi vì mạng học sâu có thể ước lượng gần đúng các thông số điều khiển, người dùng không phải chuyên gia cũng có thể nhanh chóng có được hình ảnh được tăng cường tốt mà không cần hiểu sâu về thuật toán đã được áp dụng

Tuy nhiên, để đào tạo một mô hình dựa trên học sâu, một tập dữ liệu được dán nhãn là cần thiết Trong trường hợp thực hiện các nhiệm vụ tăng cường hoặc nén, các hình ảnh ghép đôi phải được cung cấp [30] Các hình ảnh ghép đôi bao gồm hình ảnh đầu vào và hình ảnh nâng cao tương ứng của nó Ở đây hình ảnh nâng cao được cung cấp bởi một chuyên gia Gần đây, phương pháp hiện đại [31] có thể không yêu cầu các hình ảnh ghép đôi nhưng cần một tập hợp các hình ảnh nâng cao để đào tạo mô hình Generative Adversarial Networks [32] Tuy nhiên, hiệu suất sẽ không thể so sánh được với các phương pháp sử dụng hình ảnh ghép nối để huấn luyện mạng.

Mô hình tăng cường ảnh dựa vào đặc tính vật lý của ảnh X-quang

Như đã giới thiệu trong mục 1.2.2 về các đặc tính của ảnh X-quang cũng như một số mô hình tăng cường ảnh X-quang dựa vào các đặc tính vật lý này Trong phần này, người thực hiện đề tài sẽ giới thiệu chi tiết hơn về ý tưởng cũng như phương pháp thực hiện trong mô hình [6]

Trong mô hình này, tác giả đã xây dựng một mô hình nâng cao độ tương phản hình ảnh được đề xuất thông qua sự suy giảm thành phần Giả định rằng hình ảnh X-

19 quang có thể bao gồm các thành phần chi tiết quang trọng và các thành phần mô cơ không quang trọng có thể loại bỏ Ở đây, các thành phần có thể loại bỏ đề cập đến một số lượng mô cơ trên cơ thể Ngược lại, các thành phần chi tiết bao gồm các phần cần quan tâm như xương và nội tạng Để tăng cường hình ảnh X-quang, tác giả đã đưa ra mô hình giảm bớt các thành phần có thể có thể loại bỏ để từ đó có thể mở rộng phạm vi động để thể hiện các thành phần chi tiết Để hiện thực hóa khái niệm, mô hình hình ảnh được định nghĩa là:

𝐼 𝑚𝑎𝑥 = 𝐷(𝑥) + 𝑅(𝑥) (2.2) Trong đó 𝐼 𝑛 (𝑥) là hình ảnh chuẩn hóa, I (x) là hình ảnh tia X đầu vào, 𝐼 𝑚𝑎𝑥 là giá trị lớn nhất của toàn bộ hình ảnh, D (x) là thành phần chi tiết và R (x) là phần có thể tháo rời Ngoài ra, x là chỉ số không gian, 𝐼 𝑛 (𝑥), D (x) và R (x) đều nằm trong khoảng từ 0 đến 1 Để đạt được Hình ảnh tia X nâng cao cuối cùng E (x), một chức năng tăng cường độ tương phản 𝐶𝑒(∙) được áp dụng cho thành phần chi tiết D (x) Đó là: 𝐸(𝑥) = 𝐶𝑒(𝐷(𝑥)) = 𝐶𝑒(𝐼 𝑛 (𝑥) − 𝑅(𝑥)) (2.3) Sau khi loại bỏ R (x) khỏi 𝐼 𝑛 (𝑥), chúng ta dự kiến sẽ có không gian trống để tăng cường D (x) bằng cách mở rộng phạm vi động của nó Nếu chúng ta có thể thiết kế chức năng nâng cao Ce (∙) để sử dụng dải động miễn phí, thì việc nâng cao hình ảnh sẽ trở nên khả thi

Hình 2.5: Mô hình tăng cường ảnh của phương pháp[6]

Trong hệ thống này, chức năng nâng cao được thiết kế Ce (∙) là:

𝑦∈𝐿 𝑥 𝐼(𝑦) là cực đại cục bộ của vùng cục bộ, 𝐿 𝑥 , xung quanh pixel ảnh x và λ(x) là tham số có thể điều khiển được Lý tưởng nhất là λ(x) giúp điều chỉnh linh hoạt mức tham chiếu trong mô hình nâng cao Nếu λ (x) = 1, mô hình E(x) suy giảm để tham chiếu đến 𝐼 𝑛 𝑚𝑎𝑥 (𝑥)⁡cực đại cục bộ

Vì giá trị lớn nhất của 𝐸 𝑥 không bị giới hạn bởi 𝐼 𝑛 (𝑥), phạm vi động của hình ảnh nâng cao có thể được mở rộng Ngoài ra, bằng cách tham chiếu đến 𝐼 𝑛 𝑚𝑎𝑥 (𝑥) tối đa cục bộ, phương pháp được đề xuất có thể tăng cường độ tương phản ở cả vùng tối và vùng sáng Đặc biệt, độ giãn tương phản được kiểm soát bởi

1 (𝐼⁄ 𝑛 𝑚𝑎𝑥 (𝑥) 𝜆(𝑥) − 𝑅(𝑥))⁡ Đối với một vùng tối, mẫu số 𝐼 𝑛 𝑚𝑎𝑥 (𝑥) 𝜆(𝑥) − 𝑅(𝑥), cũng nhỏ Do đó, độ tương phản có thể bị kéo dài Đối với một vùng sáng 𝐼 𝑛 𝑚𝑎𝑥 (𝑥) ≈ 1, và do đó việc tăng cường của 𝐸(𝑥) tương tự như kết quả được tạo ra, đã cho thấy khả năng tăng cường tốt các vùng sáng

Thành phần suy giảm R(x) trong phương trình (2.2) đóng một vai trò quan trọng trong mô hình tăng cường độ tương phản Giả sử rằng bản đồ thành phần mô có thể tháo rời tối đa để tăng cường độ tương phản hình ảnh có thể được xác định và ký hiệu là T(x) Chúng ta có thể đặt R(x) = T(x) để loại bỏ nhiều mô nhất có thể và kéo dài độ tương phản của hình ảnh để có được kết quả nâng cao Tuy nhiên, mô có thể là cơ hoặc mỡ Các cơ quan cũng được làm bằng mô cơ thể Nếu loại bỏ quá nhiều mô để kéo căng cản quang, chúng ta cũng có thể mất các thông tin hữu ích Do đó, trong hệ thống này, tác giả chỉ làm suy giảm các thành phần một phần Để ước tính T(x), tác giả đã giới thiệu một ràng buộc có tên là “Tối đa hóa độ tương phản cục bộ” Nếu chúng ta đặt R(x) = T(x), nghĩa là α = 1, để kéo dài độ tương phản cục bộ, một kết quả tương phản cực cao sẽ được tạo ra Khi R(x) = T(x), phạm vi động là cực đại Bản đồ T có thể được ước lượng gần đúng bằng phương trình (2.5)

𝑦∈𝐿 𝑥 𝐼 𝑛 (𝑦) ≜ 𝐼 𝑛 𝑚𝑖𝑛 (𝑥) (2.5) Trong (4), 𝐿 𝑥 đại diện cho vùng cục bộ xung quanh pixel x và y là pixel bên trong

𝐿 𝑥 Do đó, bản đồ thành phần T(x) tại pixel x có thể được ước lượng bằng cách tìm giá trị cực tiểu cục bộ trong một vùng cục bộ xung quanh x

Số hạng có thể điều thứ hai trong mô hình này là λ(x) Trong hệ thống này, tác gải điều chỉnh cục bộ giá trị của λ(x) tại các vị trí khác nhau để giữ độ sáng nhất quán Tham số đã chọn 𝜆 ∗ (𝑥) tại pixel x có thể được xác định bằng phương trình (2.6):

Ngoài ra, việc lựa chọn tỷ lệ suy giảm cần được thảo luận thêm Khi làm giảm các thành phần mô, độ tương phản động của các chi tiết hình ảnh được kéo dài Tuy nhiên, đồng thời, một số thông tin trong hình ảnh nâng cao bị thiếu, đặc biệt là các thành phần tần số thấp Do đó, sẽ là một thách thức để tạo ra một cải tiến thỏa đáng bằng cách chọn một tỷ lệ suy giảm tối ưu để tạo ra kết quả cuối cùng Thay vào đó, các tác giả đã đề xuất một khung tổng hợp hình ảnh không chỉ cung cấp giải pháp để tạo ra kết quả hài lòng bằng cách tích hợp nhiều hình ảnh nâng cao mà còn giữ cho hệ thống hoạt động hiệu quả

Cuối cùng, tác giả đã áp dụng một chiến lược tổng hợp để tích hợp nhiều hình ảnh nâng cao Bằng cách xác định trọng lượng phù hợp để kết hợp hình ảnh, khung tổng hợp có thể tạo ra kết quả cuối cùng với độ tương phản cao

Trong bài báo này, một hệ thống tăng cường chất lượng ảnh X-quang mới dựa trên sự suy giảm thành phần, điều chỉnh độ tương phản và kết hợp hình ảnh đã được đề xuất Bằng cách làm giảm độ sáng của các mô trên hình ảnh, các tác giả có thể tăng cường các chi tiết thiết yếu ở cả vùng sáng và vùng tối một cách thích ứng Được thành lập trong khái niệm này, một mô hình điều chỉnh tham số mới đã được xây dựng Mô hình này cho phép người dùng dễ dàng nâng cao độ tương phản của hình ảnh bằng cách điều chỉnh thang độ suy giảm Để tăng cường độ tương phản cục bộ, một chiến lược tổng hợp cũng được đề xuất để kết hợp nhiều hình ảnh nâng cao và tạo ra đầu ra cuối cùng bằng cách tối đa hóa độ tương phản trực quan Phương pháp giúp tăng cường các cơ quan, cấu trúc xương và một số chi tiết nhỏ nhưng quan trọng, chẳng hạn như các nốt nhỏ trong hình ảnh X-quang có độ tương phản thấp

Hình 2.6: Sơ đồ hệ thống của mô hình tăng cường ảnh X-quang[6]

Quy trình tăng cường ảnh của phương pháp này được trình bày tóm tắt trong hình 2.6 Chúng ta có thể thấy rằng với việc sử dụng ảnh đã chuẩn hóa chứ không phải ảnh X-quang gốc để xử lý, điều này có nguy cơ dẫn đến một số thông tin trên ảnh gốc đã bị mất đi Cùng với đó phương pháp này cũng cho thấy một số hạn chế như nhạy với các tham số điều khiển, kích thước ảnh, cũng như số lượng ảnh dùng để kết hợp ảnh

Từ đó gây ra một số khó khăn nhất định cho người sử dụng

Năng lượng được ghi lại trong hình ảnh tia X có thể tiết lộ tình trạng bên trong của cơ thể con người Vì vậy, chụp X-quang đã trở thành một công cụ tiêu chuẩn để kiểm tra sức khỏe Tuy nhiên, tính chất tương phản thấp của ảnh chụp X-quang khiến chúng ta khó nhận ra các chi tiết nhỏ và bất thường Vì vậy mà các phương pháp tăng cường độ tương phản của hình ảnh X-quang là cần thiết Từ những hạn chế còn tồn đọng của phương pháp trên, người thực hiện để tài đã đề xuất một phương pháp mới, giúp tăng cường độ tương phản và khắc phục được các hạn chế của các phương pháp trước đó Chương 3 trình bày chi tiết phương pháp được đề xuất trong luận văn này

Các thước đo chất lượng ảnh

Trong đề tài này người thực hiện đề tài sử dụng một số phương pháp để đánh giá chất lượng ảnh Đầu tiên là độ tương phản Độ tương phản cao hơn có nghĩa là hình ảnh đẹp hơn Độ tương phản của một ảnh được tính bằng công thức (2.7)

𝑀𝑁∑ 𝑁−1 𝑖=0 ∑ 𝑀−1 𝑗=0 (𝐼 𝑖𝑗 − 𝐼̅)⁡ (2.7) Trong đó các cường độ 𝐼 𝑖𝑗 là phần tử thứ I và thứ j của hình ảnh hai chiều có kích thước M bằng N 𝐼⁡là cường độ trung bình của tất cả các giá trị pixel trong ảnh Hình ảnh được giả định có cường độ pixel được chuẩn hóa trong phạm vi [0,1]

Thước đo thứ hai là chỉ số tương đồng về cấu trúc (SSIM) SSIM cao hơn có nghĩa là mối quan hệ giữa các cặp điểm ảnh tốt hơn SSIM đo độ giống nhau về cấu trúc giữa ảnh đã tăng cường và ảnh gốc ban đầu vốn có dải đáp ứng cao Nếu giá trị SSIM lớn, ta có thể đảm bảo cấu trúc của ảnh sau tăng cường giống với cấu trúc của ảnh gốc ở mức các vùng cục bộ Ngược lại, nếu giá trị SSIM nhỏ cấu trúc ở mức vùng cục bộ sẽ khác nhau ngay cả khi độ tương phản được tăng cao Chỉ số SSIM được tính dựa theo công thức (2.8)

(𝜇 𝑥 2 +𝜇 𝑦 2 +𝑐 1 )(𝜎 𝑥 2 +𝜎 𝑦 2 +𝑐 2 ) (2.8) Các tham số của phương trình bao gồm vị trí (x, y) của ảnh N x N trong mỗi hình ảnh, giá trị trung bình của cường độ pixel theo hướng x và y, phương sai của cường độ theo hướng x và y, cùng với hiệp phương sai

Thước đo thứ ba là chỉ số sự khác biệt về mức năng lượng (LBD) [36] LBD nhỏ hơn có nghĩa là mối quan hệ giữa các cặp pixel lân cận được bảo tồn tốt Sự khác biệt về mức năng lượng (LBD) so sánh sự khác biệt giữa các giá trị lớn nhất của ảnh trước tăng cường và sau khi tăng cường như phương trình (2.9) Ở đây 𝐹 𝑚𝑎𝑥 ( ) Là bộ lọc lấy giá trị lớn nhất ứng với một cửa sổ có kích thước r Giá trị LBD càng lớn chứng tỏ ảnh sau tăng cường và ảnh trước tăng cường khác biệt về mức năng lượng, điều này có nghĩa là mức xám của ảnh sau tăng cường không phản ánh đúng mức năng lượng hoặc khối lượng tương ứng của vùng tia x chiếu qua

𝑀𝑁||𝐹 𝑚𝑎𝑥 (𝐼) − 𝐹 𝑚𝑎𝑥 (𝐸)|| (2.9) Thước đo thứ 4 là Tenengrad (TEN) [37] đo độ sắc nét của hình ảnh Điểm cao hơn có nghĩa là chất lượng hình ảnh tốt hơn

𝑇𝐸𝑁 = ⁡ √𝐺𝑥 2+ 𝐺 𝑦 2 (2.10) Trong đó Gx và Gy là hai hình ảnh mà tại mỗi điểm chứa các giá trị xấp xỉ đạo hàm ngang và dọc tương ứng

Thước đo thứ năm là Discrete Entropy (DE) [38] đo lượng thông tin trong một hình ảnh Điểm DE cao hơn có nghĩa là càng có nhiều thông tin trong hình ảnh được giữ

Thước đo thứ sáu là Measurement of Enhancement (EME) [39] Điểm số này càng cao thì hiệu suất nâng cao hình ảnh càng tốt Số liệu cuối cùng là Absolute Mean Brightness Error (AMBE) [40] được đề xuất để xếp hạng hiệu suất trong việc duy trì độ sáng ban đầu AMBE thấp hơn cho thấy độ sáng được bảo toàn tốt hơn

Tổng quan về mô hình đề xuất

Phương pháp đề nghị được tóm tắt trong hình 3.1 Hệ thống tăng cường ảnh X- quang có đầu vào là ảnh X-quang y tế được lưu trữ ở định dạng DICOM 12bit và ảnh ngõ ra là một ảnh LDR 8bit với độ tương phản tốt Như đã trình bày, chúng ta thấy rằng trên ảnh X-quang tồn tại những vùng thông tin không quang trọng và những thông tin này nếu có thể loại bỏ sẽ giúp tăng giải động để tăng cường độ tương phản cho ảnh Chính vì vậy việc xác định vùng thông tin có thể loại bỏ và vùng thông tin quang trọng trong một ảnh X-quang cần được ưu tiên xem xét Đầu tiên, ảnh DICOM được đưa vào hệ thống, sau đó toàn bộ thông tin 12 bit trên ảnh được phân thành nhiều vùng thông tin nhỏ Vùng giá trị chứa những thông tin quan trọng sẽ được ước lượng một cách tự động dựa vào việc đánh giá entropy của từng vùng con Sau khi đã xác định được vùng thông tin chứa dữ liệu quang trọng, thông tin trong vùng dữ liệu quan trọng này sẽ được tách nhỏ thành các vùng con tiêu chuẩn thể hiện bằng 8 bits dữ liệu giống như các ảnh thông thường a) Tổng quan hệ thống b) Lưu đồ hệ thống

Hình 3.1: Tổng quan và lưu đồ hoạt động của hệ thống

Việc trích xuất này đóng vai trò giống như chụp ảnh với một thời gian phơi sáng (exposure time) cố định Sau đó, chất lượng các điểm ảnh trong từng ảnh mới sẽ được đánh giá dựa trên các giá trị về độ tương phản cũng như độ bão hoà của chúng Chất lượng của mỗi điểm ảnh sẽ được dùng làm tham chiếu để kết hợp các ảnh với nhau Mặc dù vậy, việc kết hợp trực tiếp các điểm ảnh sẽ tạo ra sự không đồng nhất ở ảnh tăng cường Vì vậy việc ước lượng bảng đồ trọng số và tinh chỉnh trọng số cho từng điểm ảnh phải được thực hiện trước khi kết hợp ảnh để tăng độ tự nhiên cho ảnh được tăng cường

Bằng việc xử lý ảnh trực tiếp từ ảnh DICOM, cùng với các kỹ thuật tăng cường ảnh được sử dụng sau đó Giúp cho ảnh không chỉ có độ tương phản tốt mà còn giúp bảo toàn thông tin trên ảnh một cách hữu hiệu

Tiếp theo, người thực hiện đề tài sẽ trình bày chi tiết các kỹ thuật đã được sử dụng trong mô hình đề xuất Mục 3.2 trình bày phương pháp ước lượng vùng thông tin quang trọng, phương pháp lượng tử hóa ảnh sẽ được trình bày trong mục 3.3, mục 3.4 trình bày phương pháp kết hợp ảnh.

Ước lượng vùng chứa thông tin quan trọng

Trong phần này, người thực hiện đề tài trình bày phương pháp xác định khoảng mức xám chứa thông tin quan trọng của ảnh X-quang

Hình 3.2: Lược đồ histogram của vùng ngoài cơ thể

Như trong hình 3.2, chúng ta có thể thấy rằng ảnh X-quang tồn tại những vùng không khí bên ngoài ảnh, thông tin ở những vùng này không có ý nghĩa Giá trị của những vùng tối không có thông tin này thường rất lớn, vì vậy ta có thể loại bỏ vùng thông tin này để có thể mô tả vùng thông tin quan trọng tốt hơn Việc xác định được vùng thông tin có thể loại bỏ cần được thực hiện và đánh giá cẩn thận Nếu vùng thông tin bị loại bỏ quá lớn có thể dẫn đến việc mất đi các thông tin quan trọng trong ảnh X-quang Hình 3.3 trình bày quy trình ước lượng vùng chứa thông tin quang trọng

Hình 3.3: Lưu đồ xác định khoảng chứa thông tin quan trọng

Do đặc thù của ảnh x-ray là các vùng sáng sẽ chứa nhiều thông tin quan trọng, vì vậy ngưỡng cận trên vẫn sẽ được chọn là giá trị lớn nhất trong ảnh như đề nghị ở [34]

Tuy nhiên việc lựa chọn ngưỡng cận dưới cần được lựa chọn cẩn thận hơn để đảm bảo không mất đi những thông tin cần thiết Ở đây, người thực hiện đề tài chia vùng thông tin gốc [min(I),max(I)] thành các vùng thông tin con 𝑐 0 𝑚𝑖𝑛(𝐼)⁡, 𝑐 1 , 𝑐 2 , … , 𝑐 𝑘 , 𝑐 𝑘+1 = 𝑚𝑎𝑥⁡(𝐼) Lượng thông tin trong mỗi khoảng con [𝑐 𝑘 , 𝑐 𝑘+1 ] được đo lường bằng entropy của một ảnh thành phần I[𝑐 𝑘 , 𝑐 𝑘+1 ] thể hiện lượng thông tin có trong khoảng [𝑐 𝑘 , 𝑐 𝑘+1 ] Bằng cách cộng dồn lượng thông tin có trong các vùng thông tin thành phần, ta có thể chọn được giá trị cận dưới 𝐼 𝑖𝑚 𝑚𝑖𝑛 = 𝑐 𝑘 thoả điều kiện lượng thông tin bị mất trong khoảng [min(I), 𝐼 𝑖𝑚 𝑚𝑖𝑛 ] sẽ không lớn hơn một ngưỡng 𝛿 cho trước Để tìm các ngưỡng xám 𝑐 𝑘 mà có thể mô tả các cùng thông tin quan trọng của ảnh, người thực hiện đề tài sử dụng phương pháp phân nhóm để tách các mức xám

28 của từng vùng trên ảnh X-quang Ở đây, mỗi điểm ảnh được mô tả bằng ba đặc trưng [𝐼 𝑖,𝑗 , 𝑖, 𝑗]; trong đó 𝐼 𝑖,𝑗 là mức xám tại hàng ith và cột 𝑗 𝑡ℎ ; i và j là thứ tự của hàng và cột của điểm ảnh tương ứng Các đặc trưng đó được chuẩn hoá về khoảng [0,1] như sau [𝐼 𝑖,𝑗 /𝑚𝑎𝑥⁡(𝐼), 𝑖/𝐷, 𝑗/𝐷] với 𝐷 = √𝑀 2 + 𝑁 2 Ở đây, M và N là số hàng và số cột của ảnh I Người thực hiện đề tài đã sử dụng phương pháp phân nhóm Gaussiance Mix Model để phân nhóm các điểm ảnh thành các nhóm khác nhau Giá trị [𝑐 𝑘 ] chính là mức xám của tâm các nhóm có được sau khi thực hiện việc phân nhóm sau khi sắp xếp từ thấp tới cao Như thể hiện trong hình 3.3, các giá trị ck này tượng trưng cho mức xám trung bình của các phần trong cơ thể Do đó khoảng [𝑐 𝑘 , 𝑐 𝑘+1 ] sẽ chứa thông tin của hai vùng có mức xám lân cận nhau

Sau khi tìm được các mức xám đặc trưng cho các vùng trong cơ thể, ta rút trích ảnh thành phần mô tả thông tin của khoảng [𝑐 𝑘 , 𝑐 𝑘+1 ] như sau:

𝐸 𝑐 𝑘 ,𝑐 𝑘+1 = − ∑ 255 𝑟=0 𝑝 𝑟 (𝐼 𝑐 𝑘 ,𝑐 𝑘+1 ) 𝑙𝑜𝑔 2 𝑝 𝑟 (𝐼 𝑐 𝑘 ,𝑐 𝑘+1 )⁡ (3.2) Gọi 𝐴 𝑘 = ∑ 𝑘 𝑙=0 𝐸 𝑐 𝑙−1 ,𝑐 𝑙 là giá trị cộng dồn của lượng thông tin từ các vùng thông tin thành phần; 𝐴 𝑘 = 𝐴 𝑘 /𝑚𝑎𝑥⁡(𝐴 𝑘 ) đo lường lượng thông tin sẽ bị mất nếu bỏ qua các điểm ảnh nhỏ hơn 𝐶 𝑘 Giá trị cận dưới 𝐼 𝑖𝑚 𝑚𝑖𝑛 chính là giá trị lớn nhất của 𝑐 𝑘 sao cho lượng thông tin bị mất nhỏ hơn một ngưỡng 𝛿 < 1 như phương trình (3.3):

Lượng tử hóa ảnh

Tiếp theo, người thực hiện đề tài sẽ trình bày phương pháp biểu diễn khoảng thông tin quang trọng bằng nhiều hình ảnh LDR Ngay cả khi xác định được ngưỡng cận trên và cận dưới của vùng chứa nhiều thông tin quan trọng, việc nén tuyến tính ảnh DICOM sẽ luôn làm mất thông tin của ảnh gốc như thể hiện trong hình 3.4

Hình 3.4: Sơ đồ phương pháp tăng cường chất lượng ảnh

Do đó, thay vì thực hiện việc nén ảnh rồi tăng cường ảnh nén như trong [5] và

[6], người thực hiện đề tài đề nghị tách vùng thông tin quan trọng thành nhiều vùng nhỏ 8 bits nơi thông tin có thể được hiển thị một cách đầy đủ Sau đó, các ảnh 8 bits này sẽ được kết hợp cùng nhau để tái tạo lại toàn bộ thông tin của ảnh gốc Ý tưởng này tương tự như trong kỹ thuật kết hợp ảnh khi mỗi ảnh được chụp với một độ mở màn trập khác nhau

Hình 3.5: Sơ đồ tăng cường chất lượng ảnh đề xuất

Hình 3.5 tóm tắt quy trình tăng cường ảnh của phương pháp đề xuất Đầu tiên, người thực hiện đề tài sẽ phân tích ảnh đầu vào để chọn ngưỡng trên 𝐼 𝑚𝑎𝑥 và ngưỡng dưới 𝐼 𝑚𝑖𝑛 của khoảng chứa thông tin quan trọng Sau đó, trên khoảng này các ảnh LDR sẽ được trích xuất(𝐼 1 ,𝐼 2 , ,𝐼 𝑘 là các ảnh thành phần được tách ra từ ảnh gốc) Mỗi pixel trên các ảnh LDR này sẽ được gán một trọng số thể hiện chất lượng của từng pixel Dựa vào các trọng số này, những ảnh LDR trên sẽ được kết hợp cùng với nhau để tạo ra một ảnh mới có thể bao gồm mọi thông tin của từng ảnh thành phần Sau khi đã xác định được ngưỡng cận dưới chứa thông tin quan trọng, chúng ta tiến hành xây dựng mô hình tạo ra K ảnh (với K là số lượng ảnh mong muốn) Sử dụng phương pháp lượng tử hóa chia ảnh gốc ban đầu thành nhiều ảnh nhỏ chứa thông tin hữu hạn 8 bit Hình 3.3 thể hiện các ảnh thành phần được tạo ra từ ảnh gốc

Hình 3.6: Các ảnh thành phần được tạo ra từ ảnh gốc

Trong phần này, tôi thảo luận phương pháp tách các ảnh có dải tần nhạy sáng thấp trong khoảng chứa thông tin quan trọng [𝐼 𝑖𝑚 𝑚𝑖𝑛 , 𝐼 𝑖𝑚 𝑚𝑎𝑥 ] Gọi L là số lượng các dải tần thành phần [𝐼 𝑙 𝑚𝑖𝑛 , 𝐼 𝑙 𝑚𝑎𝑥 ] được tách ra từ dải tầng [𝐼 𝑖𝑚 𝑚𝑖𝑛 , 𝐼 𝑖𝑚 𝑚𝑎𝑥 ], độ rộng của mỗi dải tầng sẽ được tính bằng hệ số ∆ như trong phương trình (3.4) Bên cạnh đó ngưỡng trên 𝐼 𝑙 𝑚𝑎𝑥 và ngưỡng dưới 𝐼 𝑙 𝑚𝑖𝑛 ⁡sẽ được tính bằng phương trình (3.5) và (3.6): ∆= 𝐼 𝑖𝑚 𝑚𝑎𝑥 −𝐼 𝑖𝑚 𝑚𝑖𝑛

Có thể thấy rằng 𝐼 𝑙 𝑚𝑎𝑥 = 𝐼 𝑙+1 𝑚𝑖𝑛 như được thể hiện trong hình 1.b Hơn thế nữa, bởi vì dải tầng của một ảnh thành phần không nên nhỏ hơn 255 (8 bits), giá trị lớn nhất của L được xác định theo phương trình (3.7)

255 (3.7) Ứng với một ngưỡng nhạy sáng [𝐼 𝑙 𝑚𝑖𝑛 , 𝐼 𝑙 𝑚𝑎𝑥 ], ảnh thành phần được trích ra như sau:

∆ ) (3.8) Phương trình này đảm bảo mọi điểm ảnh của 𝐼 𝑙 sẽ nằm trong khoảng từ 0 đến 255

Số lượng ảnh thành phần được tạo ra cũng ảnh hưởng đến chất lượng ảnh tăng cường Chính vì vậy việc đánh giá và lựa chọn số lượng ảnh thành phần để có thể tạo ra ảnh tăng cường có chất lượng tốt nhất là cần thiết Ở phần thí nghiệm, người thực hiện đề tài đã tiến hành thí nghiệm và đưa ra kết luận về ảnh hưởng của số lượng ảnh thành phần lên hiệu suất của hệ thống.

Kết hợp ảnh

Trong phần này, phương pháp tạo ra một hình ảnh chất lượng cao dựa trên các hình ảnh vốn chỉ mô tả một dải động ngắn được trình bày Đầu tiên, chất lượng của mỗi điểm ảnh được ước lượng thông qua các thông số đo lường được Ảnh kết quả sẽ là sự kết hợp có trọng số của các hình ảnh đã được tạo ra ở phần 3.3 Phương pháp kết hợp ảnh tạo ra ảnh kết quả bằng cách chỉ giữ lại những điểm ảnh có chất lượng tốt nhất trong chuỗi hình ảnh đầu vào Để đánh giá chất lượng của một điểm ảnh, một vài thông số chất lượng phải được đo lường Thông thường, độ tương phản, độ bão hoà và độ phơi sáng là ba thông số để đánh giá chất lượng điểm ảnh có thông tin màu RGB Mặc dù vậy, trong ứng dụng này, ảnh x-ray là một ảnh xám nên không cần đánh giá độ phơi sáng mà chỉ cần quan tâm tới độ tương phản và độ bão hoà Về chi tiết, độ tương phản và độ bão hoà có thể được định nghĩa như sau:

- Độ tương phản: Độ tương phản của một điểm ảnh là sự khác biệt giữa điểm ảnh đó với những điểm ảnh xung quanh Độ tương phản cao có nghĩa là dễ nhận ra các chi tiết tại điểm ảnh đó Do đó, điểm ảnh nào có giá trị cao hơn sẽ tạo ra trọng số cao hơn Ta có thể nhân cập một ảnh với bộ lọc Laplaciance

[35] để có thể tính được độ tương phản của một điểm ảnh

- Độ bão hòa: Một điểm ảnh được gọi là bão hoà nếu giá trị của nó quá sáng hoặc quá tối Do đó nếu điểm ảnh nhận giá trị trung vị của khoảng hiển thị ảnh (giá trị 127 với ảnh 8 bits) thì sẽ được gọi là ảnh có chất lượng tốt và không nằm ở vùng bão hoà

Bằng cách sử dụng hai chỉ tiêu đo chất lượng để tạo ra bản đồ trọng số 𝑊 𝑖𝑗,𝑘 , ta có thể biểu diễn sự đóng góp của hình ảnh thứ 𝑘 𝑡ℎ ⁡vào ảnh kết quả tại vị trí (i, j) Bản đồ trọng số 𝑊 𝑖𝑗,𝑘 cần phải được chuẩn hóa sao cho bất kỳ điểm ảnh (i, j) nào cũng có

32 tổng các trọng số ∑ 𝑊̂ 𝑖𝑗,𝑘 cộng lại bằng 1 Điều này có thể được thực hiện thông qua phương trình (14)

𝑊̂ 𝑖𝑗,𝑙 = [⁡∑ 𝑁=1 𝑙 ′ 𝑊 𝑖𝑗,𝑙 ′ ] −1 𝑊 𝑖𝑗,𝑙 (3.9) Hình ảnh kết quả R có thể thu được bằng cách phối hợp các trọng số của các hình ảnh đầu vào như sau:

𝑙=1 𝐼 𝑖𝑗,𝑙 (3.10) Với 𝐼 𝑙⁡ ⁡là hình ảnh đầu vào thứ l trong chuỗi Mặc dù vậy, chỉ áp dụng phương trình (3.9) tạo sẽ không thể tạo ra một bản đồ trọng số thích hợp Do bản đồ này có thể có nhiều nhiễu nên việc sử dụng phương trình (3.10) một cách trực tiếp không thể tạo ra một ảnh kết quả như ý mà sẽ tạo ra một sự kết hợp có nhiều thành phần không thống nhất với nhau

Hình 3.7: Kết quả không thống nhất với nhau khi kết hợp ảnh trực tiếp: (a) Hình ảnh được tăng cường; (b) Phóng to phổi (c) Phóng to xương chậu Điều này xảy ra là do sự không đồng nhất giữa các bản đồ trọng số với nhau Vì vậy, trước khi chuẩn hoá, các bản đồ trọng số 𝑊 𝑖𝑗,𝑙 cần phải được làm mịn để tránh sự xung đột không đáng có Cách thức đơn giản nhất để thực hiện việc làm mịn là sử dụng bộ lọc thông thấp Gaussian [33] [34] Mặc dù vậy bộ lọc này sẽ dẫn tới thông tin quanh các cạnh sẽ bị nhoè Việc lựa chọn các thông số điều khiển bộ lọc Gaussian cũng tuỳ thuộc vào kinh nghiệm và thay đổi qua các ảnh khác nhau Để giải quyết vấn đề này, phương pháp của Burt và Adelson [35] là một giải pháp có tính khả thi cao Thay vì trực tiếp kết hợp các ảnh như trong phương trình (16), các ảnh thành phần ảnh đầu vào được phân tách thành nhiều mức có độ phân giải thấp hơn bằng kỹ thuật Laplacian pyramid với M mức Cùng với đó, bản đồ trọng số {𝑊̂ } 𝑖𝑗,𝑙 𝑚 cũng được

33 tách thành M mức phân giải thấp hơn bằng kỹ thuật Gaussian pyramid Ở các mức càng lớn, các bản đồ trọng số sẽ càng mượt Việc tính toán ảnh ngõ ra cho từng độ phân giải sẽ được thực hiện bằng phương trình (3.11)

𝐿{𝑅} 𝑖𝑗 𝑚 = ∑ 𝑁 𝑙=1 𝐺{𝑊̂ } 𝑖𝑗,𝑙 𝑚 𝐿{𝐼} 𝑖𝑗,𝑙 𝑚 (3.11) Sau khi có được ảnh kết quả R cho từng độ phân giải ‘m’ khác nhau, người thực hiện đề tài tiến hành tái tạo lại ảnh kết quả bằng kỹ thuật Laplacian pyramid Theo phương án này, ảnh có độ phân giải cao sẽ được tạo ra bằng cách tăng độ phân giải trực tiếp của ảnh có độ phân giải thấp và kết hợp với thành phần chi tiết của ảnh có độ phân giải cao như phương trình (3.11)

𝑅 𝑚 = 𝛼𝑅 ↑ 𝑚+1 + (1 − 𝛼)𝐿{𝑅} 𝑖𝑗 𝑚 (3.12) Chiến lược kết hợp ảnh bằng cách phối hợp nhiều độ phân giải khác nhau cho phép tạo ra ảnh mới với thành phần tần số thấp được giữ nguyên và thành phần tần số cao được tăng cường ở ảnh có độ phân giải cao Hình 3.5 thể hiện kết quả sau khi tăng cường ảnh

Đánh giá định tính và định lượng giữa các phương pháp

Trong đánh giá định lượng, có bảy thước đo chất lượng ảnh được sử dụng để so sánh, đánh giá kết quả của các phương pháp tăng cường ảnh Bảy chỉ số đo lường chất lượng hình ảnh theo các thuộc tính khác nhau

Có 5 phương pháp tăng cường ảnh được sử dụng để so sánh với phương pháp đề xuất Đầu tiên, tôi so sánh phương pháp được đề xuất với các phương pháp nổi tiếng như cân bằng histogram [1] Ngoài ra, vì hình ảnh X-quang là hình ảnh có dải động cao, nên các phương pháp nén dải động [17] và [23] cũng có thể được sử dụng để nâng cao hình ảnh Hơn nữa, người thực hiện đề tài cũng so sánh phương pháp đề xuất với các phương pháp được thiết kế đặc biệt để tăng cường ảnh X-quang như Koonsanit [41], Huang [6]

Kết quả trong Bảng 1 trình bày độ tương phản, độ sắc nét Tenengrad (TEN), chênh lệch độ sáng cục bộ (LBD), đo chỉ số tương đồng về cấu trúc (SSIM), Discrete Entropy (DE), Measurement of Enhancement (EME), Absolute Mean Brightness Error (AMBE) của các phương pháp trên Theo kết quả này, các phương pháp truyền thống như HE, Drago và Duran không đạt được độ tương phản cao trong việc tăng cường hình ảnh x-quang Ngược lại, các phương pháp được thiết kế đặc biệt cho hình ảnh y tế, chẳng hạn như Koonsanit và Huang có độ tương phản và độ sắc nét cao hơn Tuy nhiên, Koonsanit chỉ tập trung vào tăng cường độ tương phản mà không xem xét thông tin khối lượng Do đó, LBD của nó được phóng đại rất nhiều lên 0,17 Phương pháp của Huang được thiết kế để tăng cả độ tương phản và bảo toàn thông tin khối lượng Vì vậy, nó đạt được độ tương phản rất cao trong khi giữ LBD thấp hơn so với các phương pháp truyền thống như HE Phương pháp Duran [17] và Drago [23] là phương pháp nén HDR Nó có nghĩa là hình ảnh gốc được trình bày dưới dạng 16 bit

Do đó, mức tối đa cục bộ là khá cao Ngược lại, hình ảnh nâng cao hoặc được nén là hình ảnh LDR và giá trị tối đa cục bộ nằm trong khoảng [0-255] Do hiện tượng này,

36 tôi không thể sử dụng chỉ số LBD để đánh giá thuộc tính bảo toàn khối lượng trên phương pháp dựa trên HDR Không giống như các phương pháp dựa trên HDR, các phương pháp khác đã chuẩn hóa hình ảnh HDR thành hình ảnh LDR chuẩn hóa Sau đó, một giải pháp nâng cao được áp dụng Nó có nghĩa là hình ảnh gốc và hình ảnh nâng cao đều nằm trong phạm vi LDR Vì lý do này, người thực hiện đề tài không thể so sánh phương pháp của mình với các phương pháp dựa trên HDR về chỉ số LBD hoặc AMBE

Không giống như Huang, phương pháp đề xuất được thiết kế để tránh bỏ sót thông tin từ ảnh gốc Vì nó dựa vào bản đồ chất lượng [26] để kết hợp hình ảnh, nên phương pháp đề xuất có độ tương phản tốt hơn nhiều so với phương pháp truyền thống và tương đương với phương pháp của Huang Bên cạnh đó, phương pháp được khuyến nghị có LBD tốt hơn một chút so với Huang Giá trị LBD của Huang là 0,11 trong khi phương pháp đề xuất là 0,10

Xét về các chỉ số DE và EME, kết quả cho thấy rằng phương pháp đề xuất và phương pháp Huang có hiệu quả tốt hơn các phương pháp khác Cụ thể, phương pháp Huang tốt hơn so với phương pháp được đề xuất về số liệu DE; nhưng phương pháp đề xuất tốt hơn về EME Xét về SSIM và AMBE, Huang và phương pháp đề xuất không tốt hơn các phương pháp thông thường Lý do là các phương pháp này tập trung vào việc tăng cường độ tương phản nhưng không bảo toàn mối quan hệ giữa các pixel lân cận hoặc mức độ sáng Do đó, chỉ số SSIM không thể so sánh với chuyển đổi toàn cầu, trong đó chỉ một phép chuyển đổi được áp dụng cho toàn bộ hình ảnh Đằng sau so sánh định lượng, người thực hiện đề tài đã cung cấp một đánh giá định tính khác trong Hình 7 Ở đây, không chỉ hình ảnh tăng cường được hiển thị mà còn cung cấp kết quả phóng to để chứng minh hiệu suất của phương pháp của đề xuất Kết quả cho thấy mặc dù Huang có độ tương phản và độ sắc nét cao hơn, nhưng vẻ ngoài của nó không tự nhiên

Bảng 4.1: So sánh các phương pháp tăng cường hình ảnh (Màu đỏ đại diện cho kết quả tốt nhất, màu xanh lam đại diện cho kết quả tốt thứ hai.)

Hình 4.2 So sánh định tính giữa phương pháp đề xuất với các phương pháp khác: (a) HE [1]; (b) Drago [23]; (c) Koonsanit [41]; (d) Durand [17]; (e) Huang

[6]; (f) Đề xuất; (g) Phóng to vùng phổi (Huang); (h) Phóng to vùng phổi (Phương pháp đề xuất); (i) Phóng to vùng xương chậu (Huang); (k) Phóng to vùng xương chậu (Đề xuất)

Trong Hình 4.2 (g), diện tích phổi, mức xám bên trong và bên ngoài của xương tương đối giống nhau, nhưng mức xám ở rìa xương là cực kỳ cao Ngược lại, phương

39 pháp đề xuất trong Hình 4.2 (h) đảm bảo tính nhất quán bên trong và bên ngoài vùng xương Hơn nữa, trong Hình 4.2 (i) và Hình 4.2 (k), vùng xương chậu, phương pháp Huang [5] có độ sắc nét tốt hơn trong khi phương pháp đề xuất có độ sắc nét chấp nhận được.

Đánh giá ảnh hưởng của việc lựa chọn ngưỡng cận dưới

Trong phần này, ảnh hưởng của giới hạn dưới nằm trong phần 3.2 Người thực hiện đề tài đã đo điểm LBD được đưa ra bởi các δ khác nhau để giải thích sự đóng góp của giới hạn dưới Kết quả thực nghiệm ở hình 4.3 Kết quả cho thấy việc tăng giá trị sẽ làm giảm nhẹ giá trị LBD xuống mức thấp nhất Điều này cho thấy khả năng chọn một giới hạn dưới thích hợp để bảo toàn thông tin khối lượng trong khi vẫn đạt được độ tương phản cao

Hình 4.3 Ảnh hưởng của δ lên LBD và TEN

Trong khi đó, chọn δ quá cao sẽ làm mất hoàn toàn ý nghĩa lưu giữ thông tin của ảnh Ngoài ra, giá trị TEN có thể tăng nhưng không quá nhiều khi δ lớn hơn 0,1 Do đó, tối ưu phải là giá trị LBD nhỏ nhất Hơn nữa, người thực hiện đề tài đã trình bày một số kết quả ảnh tăng cường với các δ khác nhau trong Hình 4.4 Ví dụ, nếu δ 0,7, tất cả thông tin trong vùng phổi sẽ bị mất, và LBD là cực kỳ lớn

Hình 4.4 Kết quả với δ khác nhau: (a) δ = 0,01; (b) δ = 0,1; (c) δ = 0,3; (d) δ

Đánh giá sự ảnh hưởng của thông số K

Trong phần này, người thực hiện đề tài đã đánh giá ảnh hưởng của số lượng hình ảnh thành phần (K) đến hiệu suất Các chỉ số tương phản và SSIM được sử dụng để đánh giá định lượng Kết quả trong Hình 4.5 cho thấy điểm tương phản có xu hướng tăng khi K tăng, và SSIM có xu hướng giảm Bởi vì một hình ảnh được nâng cao cần có độ tương phản cao và SSIM cao, do đó sẽ không có K tối ưu nào có thể được chọn để nâng cao hình ảnh

Hình 4.5 Ảnh hưởng của K lên chất lượng của ảnh tăng cường

Trong trường hợp này, tùy thuộc vào mục đích của chúng ta, giá trị K nên tuân theo các chiến lược lựa chọn khác nhau Để hiểu rõ hơn về cách chọn một giá trị K phù hợp, một thí nghiệm định lượng được trình bày trong Hình 4.6 Ở đây, các hình ảnh nâng cao tương ứng với K = 4 và K = 10 được hiển thị Nếu K lớn hơn (K = 10), độ tương phản có thể cao hơn Có thể quan sát chi tiết hơn ở vùng xương chậu khi K

= 10 Nếu K nhỏ hơn, chi tiết ở vùng chậu không rõ ràng, nhưng điểm SSIM cao hơn

Hình 4.6 Ảnh tăng cường với các giá trị K khác nhau: (a) K=4; (b) K

Kết luận

Người thực hiện đề tài đã tiến hành tìm hiểu các cơ sở lý thuyết, kỹ thuật chụp ảnh X-quang cũng như đặc tính vật lý của ảnh X-quang trong y tế Tìm hiểu tình hình nghiên cứu hiện tại, các kỹ thuật dùng để tăng cường chất lượng ảnh nói chung và kỹ thuật tăng cường ảnh X-quang y tế nói riêng Từ đó nắm bắt được các kỹ thuật tiên tiến nhất trong xử lý ảnh cũng như thấy được những khó khăn, hạn chế đang gặp phải của các phương pháp tăng cường chất lượng ảnh được đề xuất trước đó

Người thực hiện đề tài đã đề xuất một cơ sở lý thuyết về bảo toàn thông tin ảnh và xây dựng một hệ thống tăng cường chất lượng ảnh X-quang giải quyết được những hạn chế của các phương pháp trước đó Hệ thống đã đáp ứng được yêu cầu đề ra là giúp tạo ra ảnh X-quang được tăng cường chất lượng, có độ tương phản và độ sắt nét tốt hơn ảnh đầu vào

Cụ thể, trong luận văn này người thực hiện đề tài đã giới thiệu một phương pháp tăng cường ảnh X-quang dựa trên việc xác định phạm vi chứa thông tin quan trọng trong ảnh x quang và ứng dụng cơ chế kết hợp ảnh để tăng cường chất lượng ảnh x quang So với các phương pháp truyền thống chuẩn hóa tuyến tính hình ảnh DICOM thành hình ảnh LDR, mô hình đề xuất đã phân tích phạm vi cụ thể chứa thông tin hữu ích của hình ảnh DICOM Do đó, phương pháp đề xuất có độ tương phản tốt hơn phương pháp ban đầu Bên cạnh đó, kết quả thực nghiệm chứng minh rằng phương pháp này tốt hơn các phương pháp hiện có về bảo toàn thông tin đại khối lượng (LBD) Người thực hiện đề tài đã xây dựng một mô hình tăng cường chất lượng ảnh x quang hoàng chỉnh với đầu vào là ảnh x quang được lưu trữ ở định dạng DICOM 12bit và đầu ra là ảnh x quang 8 bit với độ sắt nét và độ tương phản cao Bên cạnh đó người thực hiện đề tài cũng đã tiến hành hàng loạt các thí nghiệm để đánh giá ảnh hưởng của các tham số lên hệ thống cũng như dùng nhiều thước đo chất lượng ảnh khác nhau để đánh giá hiệu quả của hệ thống và so sánh với các phương pháp nổi tiếng khác

Kết quả thí nghiệm cho thấy phương pháp đề xuất có độ tương phản tốt hơn so với các phương pháp tăng cường ảnh truyền thống Ngoài ra phương pháp đề xuất còn giúp bảo toàn thông tin khối lượng ảnh tốt hơn những phương pháp hiện có Điều này có ý nghĩa quang trọng trong việc giúp bác sỹ chẩn đoán bệnh

Hướng phát triển

Bên cạnh những kết quả đạt được như mong đợi, một vài chỉ số cần cải thiện Về số liệu SSIM, phương pháp đề xuất không thể so sánh với phương pháp thông thường Trong tương lai người thực hiện đề tài sẽ tập trung vào cách đảm bảo thông tin được bảo toàn Hơn nữa, một mô hình đào tạo học sâu sẽ được sử dụng để nâng cao hình ảnh chụp X-quang ngực

Ngày đăng: 26/02/2024, 02:01