Hỗ trợ chuẩn Đoán ung thư gan dựa trên hình Ảnh siêu Âm Hỗ trợ chuẩn Đoán ung thư gan dựa trên hình Ảnh siêu Âm
Trang 2LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS Đỗ Thanh Hà
Trang 3dưới sự hướng dẫn giúp đỡ của TS Đỗ Thanh Hà Trong toàn bộ nội dungnghiên cứu của luận văn, các vấn đề được trình bày đều là những tìm hiểu
và nghiên cứu của chính cá nhân tôi hoặc là được trích dẫn từ các nguồntài liệu có ghi tham khảo rõ ràng, hợp pháp
Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theoquy định cho lời cam đoan này
Học viên thực hiện
Lê Thị Hồng Hạnh
Trang 4cảm ơn sâu sắc tới giảng viên hướng dẫn của tôi, Tiến sĩ Đỗ Thanh Hà,người đã định hướng, trực tiếp dẫn dắt và cố vấn cho tôi trong suốt quá trìnhnghiên cứu và thực hiện đề tài.
Tiếp theo, tôi xin chân thành cảm ơn Ban giám hiệu cũng như các thầy
cô giáo Khoa Toán - Cơ - Tin học của Trường Đại học Khoa học Tự nhiên
vì đã tạo điều kiện cho chúng tôi được học tập và hoàn thành khoá luận mộtcách thuận lợi Xin cảm ơn các quý thầy cô giáo đã dạy dỗ và truyền đạtkiến thức cho chúng tôi suốt thời gian qua
Tôi cũng xin gửi lời cảm ơn tới các học viên chuyên ngành Khoa học dữliệu khoá 2019-2021, những người đã cùng đồng hành, hỗ trợ và khuyếnkhích tôi trong những năm học tập vừa qua
Tuy đã có nhiều cố gắng nhưng luận văn này không thể tránh khỏi thiếusót Tác giả rất mong nhận được những ý kiến đóng góp của thầy cô, bạn bè
để bài luận văn được hoàn thiện hơn và đóng góp thêm nhiều ý nghĩa ứngdụng trong thực tiễn
Học viên thực hiện
Lê Thị Hồng Hạnh
Trang 5Mở đầu 1
1.1 Sơ lược về các kiểu dữ liệu ảnh y tế 4
1.1.1 Ảnh X-quang 5
1.1.2 Ảnh cắt lớp vi tính 6
1.1.3 Ảnh cắt lớp phát xạ 8
1.1.4 Ảnh chụp cộng hưởng từ 10
1.1.5 Ảnh siêu âm 11
1.2 Tiêu chuẩn định dạng của dữ liệu ảnh y tế 15
1.3 Cơ sở dữ liệu về ảnh siêu âm 17
1.3.1 Các cơ sở dữ liệu công khai 18
1.3.2 Cơ sở dữ liệu nghiên cứu trong luận văn 20
2 Các phương pháp học sâu hỗ trợ chẩn đoán ung thư gan dựa trên đoạn phim siêu âm 22 2.1 Các phương pháp học sâu trong xử lý dữ liệu video 23
2.2 Chẩn đoán ung thư gan sử dụng mạng học sâu 26
2.2.1 Kiến trúc mạng CNN 27
2.2.2 Kiến trúc mạng ResNet 38
2.2.3 Kiến trúc mạng 3D-ResNet 41
2.2.4 Kiến trúc mạng LSTM 42
Trang 63 Thực nghiệm và kết quả 50
3.1 Nhắc lại cơ sở dữ liệu công khai 50
3.2 Độ đo 52
3.3 Thiết kế thực nghiệm và kết quả 53
3.3.1 Lựa chọn tỉ lệ chia tập train, validation và test 53
3.3.2 Lựa chọn số lượng khung hình/giây (FPS) và tổng số lượng khung hình trong một đoạn phim 54
3.4 Thực nghiệm mô hình 58
3.4.1 Tham số mô hình và thời gian huấn luyện 58
3.4.2 Kết quả và so sánh các mô hình 59
3.5 Phân tích và đánh giá 60
4 Kết luận và hướng phát triển 62 4.1 Kết luận 62
4.2 Hướng phát triển 62
Trang 71.1 So sánh các loại ảnh y tế 15
1.2 Một số bộ dữ liệu công khai về ảnh siêu âm [1] 19
1.3 Thông tin bộ dữ liệu thực nghiệm trong luận văn 21
2.1 So sánh hiệu năng của các mô hình học sâu và các mô hình truyền thống [2] 23
2.2 Học sâu trong phân loại ảnh y tế 24
2.4 Một số nghiên cứu ứng dụng các mô hình học sâu trong bài toán phân loại hành động vào dữ liệu video siêu âm 25
2.3 Hiệu năng của một số mô hình học sâu áp dụng vào bài toán phân loại hành động trên bộ dữ liệu UCF101 26
2.5 Các tham số và siêu tham số trong mạng nơ ron tích chập 38
3.1 Thông tin bộ dữ liệu thực nghiệm trong luận văn 50
3.2 Kết quả thực nghiệm lựa chọn tỉ lệ chia tập 54
3.3 Kết quả thực nghiệm lựa chọn FPS và số lượng khung hình 58
3.4 Tham số mô hình 58
3.5 Kết quả mô hình 59
3.6 Đánh giá mô hình 3D-ResNet18 60
Trang 81.1 Hình ảnh X-quang: (a) lồng ngực [3], (b) xương cẳng chân [4], (c) đốt
sống cổ [5] 6
1.2 Hình ảnh một số lát cắt trong chụp cắt lớp vi tính phổi [6] 7
1.3 Hình ảnh chụp cắt lớp phát xạ não [7]: (a) Não của người bình thường, (b) Não của người bị bệnh Parkinson, (c) Não của người bệnh Parkin-son đã được điều trị 9
1.4 Hình ảnh chụp cộng hưởng từ não [8]: (a) Mặt cắt ngang, (b) Mặt cắt đứng ngang, (c) Mặt cắt đứng dọc 11
1.5 Hình ảnh siêu âm gan [9]: (a) Chế độ B, (b) Chế độ màu Doppler 12
1.6 Hình ảnh các loại mặt cắt trong chẩn đoán hình ảnh [10] 13
1.7 So sánh hình ảnh siêu âm: (a) truyền thống, (b) CEUS 14
1.8 Một số thông tin lưu trữ trong tệp tin ảnh DICOM 17
1.9 Một số khung hình trích ra từ đoạn phim siêu âm do nhóm nghiên cứu ĐHKHTN liên kết với Bệnh viện 108 thu thập 20
1.10 Một số khung hình trích ra từ các đoạn phim siêu âm trong bộ dữ liệu SYSU-FLL-CEUS: (a) Khung hình từ đoạn phim HCC, (b) Khung hình từ đoạn phim FNH, (c) Khung hình từ đoạn phim HEM 21
2.1 Mô hình mạng nơ ron tích chập [11] 28
2.2 Minh hoạ tích chập [12] 28
2.3 Minh hoạ làm nét ảnh bằng tích chập 29
2.4 Minh hoạ phát hiện đường biên trong ảnh bằng tích chập 30
Trang 92.7 Các hàm kích hoạt thường sử dụng: (a) Sigmoid, (b) Tanh, (c) ReLU
[12] 33
2.8 Minh hoạ average pooling và max pooling [14] 34
2.9 Cách hoạt động của lớp batch normalization 35
2.10 Hình minh hoạ sự khác biệt giữa mạng không có lớp Dropout (a) và mạng có lớp Dropout (b) [15] 36
2.11 Hình minh hoạ lớp kết nối đầy đủ [16] 37
2.12 Sai số của tập train (hình bên trái) và tập test (hình bên phải) với mạng 20 lớp và 56 lớp thực hiện trên bộ CIFAR-10 [17] 38
2.13 Hình minh hoạ một khối phần dư [17] 39
2.14 So sánh kiến trúc của mạng học sâu thông thường và mạng học sâu ResNet [17] 40
2.15 Minh hoạ phép nhân tích chập 3D [18] 41
2.16 Kết quả mô hình 3D-ResNet trên hai bộ dữ liệu UCF-101 và HMDB-51, huấn luyện từ đầu và áp dụng pretrained, với số lớp tăng dần [19] 42 2.17 Mạng LSTM [20] 43
2.18 Mô hình CNN kết hợp LSTM [21] 46
2.19 Kiến trúc mạng InceptionV3 [22] 47
2.20 Mô hình hai luồng (two-stream) [23] 48
3.1 Hình ảnh ba pha của các loại tổn thương gan khu trú [24] 51
3.2 Công thức tính các chỉ số [25] 53
3.3 Mô tả tổng số lượng khung hình, số lượng khung hình/giây và độ dài của các đoạn phim (Ý nghĩa các cột: frame_count: tổng số lượng khung hình, fps: số lượng khung hình/giây, length: độ dài đoạn phim tính bằng giây) 55
3.4 Phân phối số lượng khung hình/giây 55
Trang 11STT Chữ
viết tắt
Chữ viết đầy đủ Ý nghĩa
1 CT Computed Tomography Chụp cắt lớp vi tính
2 PET Positron Emission Tomography Chụp cắt lớp phát xạ
3 MRI Magnetic Resonance Imaging Chụp cộng hưởng từ
4 CEUS Contrast-Enhanced Ultrasound Siêu âm tăng cường độ tương
phản
5 DICOM Digital Imaging and
Communi-cation in Medicine
Tiêu chuẩn hình ảnh số vàtruyền tải trong y tế
6 ACR American College of
Radiolo-gist
Hiệp hội X-quang Hoa Kỳ
7 NEMA National Electrical
Manufac-turers Association
Hiệp hội các nhà sản xuất thiết
bị điện quốc gia của Mỹ
8 CAD Computer-Aided Diagnosis Chẩn đoán được hỗ trợ bởi máy
tính
9 HCC Hepatocellular Carcinoma Ung thư gan
11 FNH Focal Nodular Hyperplasia Nốt tăng sản khu trú
12 CNN Convolution Neural Network Mạng nơ ron tích chập
14 RNN Recurrent Neural Network Mạng nơ ron hồi quy
15 LSTM Long Short-Term Memory Mạng bộ nhớ dài ngắn
16 FPS Frames per Second Số lượng khung hình/giây
Trang 12STT Tiếng Anh Tiếng Việt
1 Spatial resolution Độ phân giải không gian
10 Fully connected neural network Mạng nơ ron kết nối đầy đủ
11 Digital signal processing Xử lý tín hiệu số
23 Fully-connected layer Lớp kết nối đầy đủ
24 Nonlinear activation function Hàm kích hoạt phi tuyến
Trang 1326 Overfit Hiện tượng mô hình học quá khớp
với tập huấn luyện
38 Portal venous phase Pha tĩnh mạch cửa
Trang 14Trong y học, chẩn đoán hình ảnh đóng một vai trò quan trọng trong quá trình pháthiện, điều trị và theo dõi bệnh nhân Theo truyền thống, công việc này được trực tiếpthực hiện bởi con người - là các chuyên gia, bác sĩ trong ngành với nhiều năm kinhnghiệm Mặc dù chẩn đoán hình ảnh đã chứng minh được tính hiệu quả trong y học,đây vẫn là công việc tốn rất nhiều thời gian và sức lực Hiện nay, với sự phát triển củakhoa học máy tính nói chung và khoa học dữ liệu nói riêng, việc áp dụng các thànhtựu công nghệ hỗ trợ trong y học đã đạt nhiều thành tựu đáng lưu ý, đặc biệt là trongviệc hỗ trợ các bác sĩ chẩn đoán dựa trên hình ảnh một cách tự động, tiêu tốn ít thờigian và chi phí Ứng dụng đặc biệt với các căn bệnh nghiêm trọng và nguy hiểm nhưung thư, việc sử dụng hình ảnh để phát hiện, chẩn đoán và theo dõi quá trình điều trịđòi hỏi một sự chính xác đủ cao trong một khoảng thời gian đủ nhanh để có thể đưa
ra phương pháp điều trị kịp thời
Đến nay đã có rất nhiều nghiên cứu về ứng dụng xử lý ảnh y tế [26] [27] Nhìnchung, các tác vụ ứng dụng xử lý ảnh y tế có thể kể đến như là khoanh vùng tổnthương [26], nhận dạng và dự báo bệnh [27], phân loại bệnh [26], v.v Đối tượng củacác nghiên cứu trải dài trên nhiều loại hình ảnh khác nhau (như ảnh chụp cắt lớp vitính (CT), ảnh chụp cộng hưởng từ (MRI), ảnh siêu âm (ultrasound), v.v.) ứng dụngvới nhiều căn bệnh trên nhiều bộ phận khác nhau của cơ thể Mỗi loại hình ảnh cónhững ưu nhược điểm riêng phù hợp với từng bộ phận và từng loại bệnh nhất định.Trong các loại hình ảnh y tế thì ảnh siêu âm là loại hình ảnh được ứng dụng phổ biến
do có nhiều ưu điểm về tính nhanh chóng kịp thời với chi phí thấp Tương tự như các
Trang 15vụ quan trọng được hỗ trợ bằng xử lý ảnh siêu âm Các nghiên cứu trước đây thườngtập trung vào xử lý hình ảnh siêu âm tĩnh và chưa có nhiều nghiên cứu xử lý videosiêu âm Có thể có hai nguyên nhân cho việc này Thứ nhất là cơ sở dữ liệu ảnh siêu
âm không nhiều và không dễ thu thập, do đó dữ liệu nghiên cứu sẽ có nhiều hạn chế
Lý do thứ hai là xử lý hình ảnh tĩnh có phần đơn giản hơn xử lý video Tuy nhiên trongthực tế, loại hình ảnh siêu âm mà các bác sĩ thường làm việc là video, và để có đượccác hình ảnh tĩnh có ý nghĩa cần thêm một bước chọn lọc trung gian nữa Luận văntập trung nghiên cứu các phương pháp xử lý video ứng dụng trong video ảnh siêu âm
y tế và cụ thể là ảnh siêu âm gan để hỗ trợ chẩn đoán ung thư gan, một căn bệnh ungthư phổ biến (xếp thứ 6 trong các loại bệnh ung thư trên toàn thế giới - theo số liệucủa Quỹ Nghiên cứu Ung thư Thế giới) với tỉ lệ sống sót thấp (tỉ lệ sống sót sau 5 năm
là 20% - theo số liệu của Hiệp hội Ung thư Mỹ)
Luận văn được trình bày theo 3 chương với các nội dung như sau:
Chương 1: Tổng quan về ảnh y tế và ảnh siêu âm
Chương này sẽ giới thiệu về các kiểu dữ liệu ảnh y tế nói chung và ảnh siêu âm nóiriêng gồm đặc điểm và ứng dụng của từng loại ảnh Bên cạnh đó chương giới thiệu vềtiêu chuẩn định dạng phổ biến nhất của ảnh y tế cũng như các bộ cơ sở dữ liệu côngkhai
Chương 2: Các phương pháp học sâu hỗ trợ chẩn đoán ung thư gan dựa trên đoạn
phim siêu âm
Chương này sẽ tập trung nghiên cứu và phát triển một số phương pháp học sâu ápdụng trong việc phân loại bệnh ung thư gan trên đoạn phim siêu âm, dựa trên nhữngphương pháp học sâu đã áp dụng thành công trong bài toán phân loại hành động củacon người
Chương 3: Thực nghiệm và kết quả
Chương này sẽ trình bày kết quả thực nghiệm áp dụng các phương pháp đã nghiên
Trang 16Chương này sẽ đánh giá tổng quan về kết quả thực nghiệm cũng như đề xuất hướngphát triển tiếp theo cho bài toán.
Trang 17Tổng quan về ảnh y tế và ảnh siêu âm
Chương này giới thiệu về các kiểu dữ liệu ảnh y tế thường gặp, đặc điểm và ứngdụng của các loại ảnh này cũng như tiêu chuẩn định dạng phổ biến nhất của ảnh y tế.Bên cạnh đó, chương tổng quan về ảnh y tế và ảnh siêu âm sẽ điểm qua về một số cơ
sở dữ liệu công khai, đặc biệt tập trung mô tả một số cơ sở dữ liệu ảnh siêu âm và lựachọn bộ dữ liệu siêu âm ứng dụng thực nghiệm trong luận văn
1.1 Sơ lược về các kiểu dữ liệu ảnh y tế
Y học hiện đại chẩn đoán bệnh dựa vào các triệu chứng lâm sàng (chẩn đoán lâmsàng) và các triệu chứng cận lâm sàng (chẩn đoán cận lâm sàng) Trong chẩn đoáncận lâm sàng thì chẩn đoán dựa trên hình ảnh thu được từ các thiết bị ghi nhận hìnhảnh ngày càng chiếm vai trò quan trọng, nhất là ngày nay với sự trợ giúp của các thiết
bị hiện đại thu nhận được hình ảnh rõ nét hơn, cộng với ứng dụng của các thuật toánhọc máy giúp cho việc chẩn đoán trở nên dễ dàng và chính xác hơn
Ảnh y tế là một cách biểu thị trực quan cấu trúc của các cơ quan trên cơ thể, đặcbiệt là các phần cấu trúc bên trong da và xương mà không thể quan sát bên ngoài đểchẩn đoán được Có 4 loại tín hiệu chính được sử dụng để tạo nên ảnh y tế, đó là: (1)Tia X, (2) Tia gamma, (3) Cộng hưởng từ hạt nhân và (4) Sóng siêu âm [29]
Từ các loại tín hiệu trên và ứng dụng vào các thiết bị chuyên dụng, nhiều kiểu dữ
Trang 18liệu ảnh y tế rất phong phú được tạo thành, có thể kể đến như ảnh X-quang, ảnh cắtlớp vi tính (CT - computed tomography), ảnh cắt lớp phát xạ (PET - positron emissiontomography), ảnh chụp cộng hưởng từ (MRI - magnetic resonance imaging), ảnh siêu
âm (ultrasound), v.v Mỗi loại hình ảnh có những ưu nhược điểm khác nhau và phục
vụ cho việc chẩn đoán các loại bệnh khác nhau
1.1.1 Ảnh X-quang
Ảnh X-quang được khám phá bởi W C Rontgen vào năm 1895 và trở thành phươngthức tạo ảnh y tế phổ biến nhất hiện nay Ảnh X-quang được phân loại vào nhóm ảnhtạo bởi tia X sử dụng phép chiếu1, bởi cách thực hiện tạo ảnh là sử dụng tia X chiếuxuyên qua cơ thể và chiếu lên mặt phằng 2D để thể hiện hình ảnh cấu trúc của xương,
mô và các tế bào Vì vậy, đặc điểm chính của ảnh là tất cả các bộ phận nằm trên mặtphẳng chiếu ảnh sẽ hiện chồng lên nhau trong bức ảnh X-quang Một số ví dụ về ảnhX-quang thể hiện trong hình 1.1, trong đó hình (a) là ảnh X-quang lồng ngực, có thểthấy cả phần xương sườn trước và sau hiện trên cùng một tấm ảnh Hình (b) thể hiệnhình ảnh xương cẳng chân có vết gãy ngay giữa đoạn xương Hình (c) là góc chụpnghiêng một phần đầu và cổ, có thể nhìn rõ xương đốt sống cổ trên hình
1 Projectional radiography hay còn được gọi là Conventional radiography: chụp X-quang sử dụng phép chiếu lên mặt phẳng 2 chiều hay còn được gọi là chụp X-quang thông thường
Trang 19Hình 1.1: Hình ảnh X-quang: (a) lồng ngực [3], (b) xương cẳng chân [4], (c) đốt sống
Ứng dụng phổ biến nhất của ảnh X-quang là kiểm tra tình trạng xương khớp nhưgãy xương, thoái hoá khớp, u xương, v.v Bên cạnh đó ảnh X-quang còn được sử dụng
để phát hiện các bệnh lý về hô hấp (viêm phổi, tràn dịch màng phổi, v.v.), kiểm tratình trạng răng (trước khi nhổ răng, trồng răng, v.v.) và nhiều ứng dụng khác
1.1.2 Ảnh cắt lớp vi tính
Giống với ảnh X-quang, ảnh cắt lớp vi tính cũng được tạo thành bởi tia X Điểmkhác biệt là công cụ tạo ảnh cắt lớp vi tính thu thập hình chiếu của các mô từ nhiềuhướng khác nhau bằng việc chiếu tia X xung quanh cơ thể Hệ thống tái tạo ảnh kếthợp tín hiệu thu nhận được và tái tạo lại thành nhiều hình ảnh liền kề nhau, gọi lànhững "lát cắt" Ảnh cắt lớp vi tính vượt trội so với ảnh X-quang ở việc có thể tái tạolại hình ảnh 3D của cơ thể thay vì ảnh 2D và điều này hỗ trợ tốt hơn cho việc chẩn
Trang 20đoán, đặc biệt là khi cần phát hiện tế bào ung thư với kích cỡ và vị trí chính xác.Một số các thông số quan trọng của ảnh chụp cắt lớp vi tính thể hiện ở số lượng látcắt, độ dày lát cắt và khoảng cách giữa các lát cắt Điều chỉnh các tham số này phùhợp có thể giúp phát hiện sớm và chính xác những tế bào hay khối u nhỏ bất thường
mà những phương pháp tạo ảnh khác khó phát hiện được Trong hình 1.2 là ví dụ vềhình ảnh các lát cắt liên tiếp của phổi Các lát cắt này sẽ được xếp liên tiếp nhau tạothành một hình khối 3D Nếu khoảng cách giữa các lát cắt quá lớn hoặc độ dày lát cắtquá mỏng thì ảnh chụp cắt lớp vi tính có thể bỏ sót những bất thường nhỏ nằm giữahai lát cắt liên tiếp Vì vậy việc lựa chọn các thông số này cần được đánh giá tỉ mỉtrước khi thực hiện chụp hình
Hình 1.2: Hình ảnh một số lát cắt trong chụp cắt lớp vi tính phổi [6]
Trong chụp cắt lớp vi tính, việc kết hợp sử dụng các chất cản quang sẽ đem lại hìnhảnh rõ nét hơn cũng như có thể đánh giá việc ngấm thuốc, lưu thông các chất cảnquang trong cơ thể theo thời gian thực Các chất này có tỷ trọng cao và xuất hiện màutrắng trên ảnh, làm nổi bật các mạch máu, các cơ quan hoặc các cấu trúc khác Chấtcản quang được đưa vào cơ thể qua nhiều đường (đường tiêm, đường uống) tùy theomục đích chẩn đoán của bác sĩ
Trang 21Ảnh cắt lớp vi tính thường được ứng dụng trong chẩn đoán và điều trị các nhómbệnh lý như chấn thương, ung thư, tim mạch Trong bệnh lý chấn thương, chụp CT cóthể phát hiện các vấn đề về chấn thương toàn bộ cơ thể như: chấn thương sọ não, chấnthương đầu mặt cổ hay các chấn thương hệ thống xương khớp cũng như chấn thươngkhoang ngực, bụng, chậu Trong các bệnh lý ung thư, chụp CT rất có giá trị trongsàng lọc, chẩn đoán các khối u cũng như phân loại, định hướng điều trị và theo dõisau điều trị Trong bệnh lý tim mạch, chụp CT được ứng dụng trong chẩn đoán bệnhmạch vành, bệnh lý mạch não, mạch thận, mạch chi, v.v nhờ kỹ thuật không xâm lấnnên ít gây tổn hại cho bệnh nhân hơn các kỹ thuật chẩn đoán can thiệp khác Ngoài
ra, khi cấp cứu các ca liên quan đến ổ bụng, chụp CT có vai trò rất quan trọng trongchẩn đoán một số bệnh thường gặp trong cấp cứu bụng ngoại khoa mà siêu âm hạnchế đánh giá như viêm tụy cấp, viêm ruột thừa, viêm ruột hoại tử, áp xe trong ổ bụng,v.v
Rủi ro khi chụp ảnh cắt lớp vi tính cũng giống như rủi ro khi chụp ảnh X-quang khibệnh nhân phải tiếp xúc với tia X hay bức xạ ion hoá dẫn đến khả năng đột biến gen
và ung thư Bên cạnh đó khi cần sử dụng chất cản quang, bệnh nhân cũng có nguy cơphản ứng với các chất này như dị ứng, phát ban
1.1.3 Ảnh cắt lớp phát xạ
Ảnh cắt lớp phát xạ nằm trong nhóm kỹ thuật ảnh y tế được tạo bởi tia gamma.Loại hình ảnh này khác với các nhóm hình ảnh khác bởi phương thức thực hiện tạoảnh cần phải đưa các hợp chất phóng xạ thích hợp vào cơ thế Các hợp chất này đượcđánh dấu bằng phóng xạ phát ra tia gamma và đưa vào cơ thể bệnh nhân qua đườngtiêm, truyền hoặc uống Sau một khoảng thời gian (khoảng 60 phút) khi các mô đãhấp thụ hợp chất được đánh dấu thì máy chụp ảnh cắt lớp phát xạ sẽ ghi lại tín hiệuphát ra từ chất phóng xạ trong các hợp chất đánh dấu đó Các tín hiệu sẽ được chuyểnthành hình ảnh thông qua một hệ thống máy tính, sau đó các bác sĩ sẽ phân tích hìnhảnh để chẩn đoán bệnh
Trang 22Nguyên lý của việc chẩn đoán bệnh bằng hình ảnh cắt lớp phát xạ xuất phát từ việctiêu hao năng lượng của tế bào Tất cả các tế bào đều cần năng lượng để sống và hoạtđộng Một trong những nguồn năng lượng ấy là đường Các tế bào bệnh thường cầnnhiều năng lượng hơn và tiêu hao nhiều đường hơn so với các tế bào lành Qua việcđưa vào cơ thể các hợp chất giống như đường (ví dụ gluco FDG) được đánh dấu bằngchất phát xạ và đánh giá các vùng tập trung nhiều chất phóng xạ qua sự chênh lệchtrên hình ảnh, bác sĩ sẽ chẩn đoán được vùng bị bệnh trên cơ thể cũng như mức độnặng nhẹ của bệnh Hình 1.3 thể hiện sự khác nhau về vùng tập trung chất phóng xạgiữa não của người bị bệnh Parkinson so với người bình thường.
Hình 1.3: Hình ảnh chụp cắt lớp phát xạ não [7]: (a) Não của người bình thường, (b)
Não của người bị bệnh Parkinson, (c) Não của người bệnh Parkinson đã được điều trị
Chụp cắt lớp phát xạ là kỹ thuật phổ biến nhất được sử dụng trong chẩn đoán vàtheo dõi ung thư như phát hiện sớm ung thư, phát hiện và theo dõi giai đoạn phát triểncủa ung thư Ngoài ra ảnh chụp cắt lớp phát xạ còn được dùng trong chẩn đoán cácvấn đề bệnh lý khác như bệnh về hệ thần kinh (Parkinson, Alzheimer), bệnh về timmạch (các bệnh lý động mạch vành)
Trang 231.1.4 Ảnh chụp cộng hưởng từ
Nguyên lý cộng hưởng từ hạt nhân được Felix Block và Edward Puroel phát hiệnvào năm 1946, cộng hưởng từ được ứng dụng rộng rãi từ năm 1950 Nguyên lý nàyđược phát triển xuất phát từ đặc điểm trong cơ thể người chứa rất nhiều nước, đồngnghĩa với có nhiều nguyên tử hydro (proton) Ngoài ra, trong những môi trường khácnhau thì quá trình hồi phục của các hạt nhân diễn ra khác nhau Do đó, tín hiệu phát
ra tại giữa vùng bình thường và khối u, hay giữa mô cứng và mô mềm sẽ không giốngnhau Nếu ta dựa vào hoạt động từ của các nguyên tử hydro để ghi nhận sự phân bốnước khác nhau của các mô trong cơ thể thì chúng ta có thể ghi hình và phân biệt đượccác mô đó Mặt khác, trong cùng một cơ quan, các tổn thương bệnh lý đều dẫn đến sựthay đổi phân bố nước tại vị trí tổn thương, dẫn đến hoạt động từ tại đó sẽ thay đổi sovới mô lành, nên ta cũng sẽ ghi hình được các thương tổn
Ứng dụng nguyên lý này, máy quét cộng hưởng từ sử dụng một từ trường mạnh vàmột hệ thống phát các xung có tần số vô tuyến để điều khiển hoạt động điện từ củanhân nguyên tử, từ đó tạo ra hình ảnh Trong từ trường mạnh, hạt nhân của nguyên tửhydro - một proton - có xu hướng tự xếp dọc theo hướng của từ trường Sau đó, mộtăng ten thu phát sóng radio tần số thấp (tần số radio này được thay đổi trong vùng từtrường ổn định của nam châm chính tùy theo mục đích khảo sát) được sử dụng để gửitín hiệu đến các nguyên tử hydro của cơ thể, sau đó nhận lại tín hiệu về chiều chuyểnđộng của các nguyên tử này Tín hiệu của ăng ten được truyền về trung tâm xử lý tínhiệu và tái tạo thành hình ảnh cấu trúc của các cơ quan, bộ phận trong cơ thể cần khảosát
Trang 24Hình 1.4: Hình ảnh chụp cộng hưởng từ não [8]: (a) Mặt cắt ngang, (b) Mặt cắt đứng
ngang, (c) Mặt cắt đứng dọc
Ảnh chụp bởi phương pháp cộng hưởng từ có ưu điểm là tạo ra ảnh của cấu trúc các
mô mềm trong cơ thể như tim, phổi, gan và các cơ quan khác rõ hơn và chi tiết hơn sovới ảnh được tạo bằng các phương pháp khác Ví dụ trong hình 1.4 là hình ảnh chụpcộng hưởng từ 3 loại mặt cắt của não với mức độ chi tiết cao và có thể được chụp theonhiều hướng, đưa ra nhiều góc nhìn hơn cho bác sĩ Hơn nữa, nhờ sử dụng từ trường
và sóng radio, không sử dụng tia X nên MRI rất an toàn cho bệnh nhân Đây là một
kỹ thuật nhanh, gọn không gây ảnh hưởng phụ, là một phương pháp chẩn đoán hìnhảnh hiện đại, hiệu quả và phổ biến trên thế giới Ngày nay, MRI được sử dụng để kiểmtra gần như mọi cơ quan trong cơ thể Kỹ thuật này đặc biệt có giá trị trong việc chụpảnh chi tiết não hoặc dây cột sống Chụp cộng hưởng từ còn có giá trị hơn nữa khi cóthể hỗ trợ bác sĩ nắm được thông tin về vị trí thương tổn trước khi phẫu thuật (chẳnghạn như tiểu phẫu não) với khả năng chụp được những hình ảnh 3 chiều Chỉ có mộtnhược điểm nhỏ với phương pháp này là khi người bệnh có các vật bằng kim loại cấytrong cơ thể không được phát hiện có thể bị ảnh hưởng bởi từ trường mạnh
1.1.5 Ảnh siêu âm
Siêu âm là một phương thức tạo hình ảnh y tế được nghiên cứu rộng rãi kể từ đầunăm 1950 Hình ảnh siêu âm sử dụng đầu dò điện để tạo ra các chùm âm thanh tần
Trang 25số cao (khoảng 1–10 MHz) lặp đi lặp lại Các xung này truyền vào mô mềm của cơthể, tương tác và phản xạ trở lại đầu dò Thời gian quay lại của các xung này cung cấpthông tin về vị trí (độ sâu) của vật phản xạ và cường độ các xung này cung cấp thôngtin về mật độ vật chất của vật phản xạ Bằng cách di chuyển và quét đầu dò cùng vớichùm âm thanh của nó phát ra, hình ảnh thời gian thực về mặt cắt của mô mềm có thểđược tạo ra
Hình 1.5: Hình ảnh siêu âm gan [9]: (a) Chế độ B, (b) Chế độ màu Doppler
Hệ thống hình ảnh siêu âm cung cấp một số phương thức chụp ảnh như sau:
• Chế độ A (A-mode): tạo ra hình ảnh dưới dạng sóng một chiều và do đó bản thân
nó không thực sự là một hình ảnh (hình ảnh thường có ít nhất 2 chiều) Tuy vậy,chế độ chụp này có thể cung cấp thông tin chi tiết về những chuyển động nhanhhoặc nhỏ, ví dụ như chuyển động trong van tim
• Chế độ B (B-mode): là hình ảnh giải phẫu mặt cắt ngang thông thường, ví dụ nhưtrong hình 1.5 (a) là hình ảnh mặt cắt gan khi siêu âm Có một số cách đặt đầu
dò có thể tạo ra hình ảnh với những góc nhìn khác nhau hay còn gọi là mặt cắt
Ví dụ một số mặt cắt như: mặt cắt ngang (transverse plane), mặt cắt đứng dọc(sagittal plane), mặt cắt đứng ngang/ mặt cắt đứng trực diện (coronal plane) (xemhình 1.6)
Trang 26Hình 1.6: Hình ảnh các loại mặt cắt trong chẩn đoán hình ảnh [10]
• Chế độ M (M-mode hay Motion-mode): tạo ra một chuỗi các tín hiệu chế độ A
và hiển thị bằng đồ thị theo thời gian thực trên màn hình máy tính Chế độ M tạo
ra một hình ảnh không đại diện cho mặt cắt của giải phẫu nhưng quan trọng đốivới việc đo lường sự dịch chuyển theo thời gian
• Chế độ hình ảnh Doppler: sử dụng đặc tính của tần số hoặc dịch pha gây ra khi dichuyển các đối tượng (hiệu ứng Doppler) để tạo ra hình ảnh là màu được mã hóabởi chuyển động của chúng như ví dụ trong hình 1.5 (b)
Ngoài ra, để làm tăng độ nét của hình ảnh siêu âm, người ta còn sử dụng một kỹthuật gọi là CEUS (Contrast-Enhanced Ultrasound - siêu âm tăng cường độ tươngphản) CEUS sử dụng tác nhân hình ảnh không có bức xạ, được gọi là chất tươngphản siêu âm hoặc chất tăng cường siêu âm, để cải thiện độ rõ nét, độ tin cậy và chứcnăng của siêu âm truyền thống Sự khác biệt về độ nét giữa hình ảnh CEUS và hình
Trang 27ảnh siêu âm truyền thống có thể nhận thấy trong hình 1.7
Hình 1.7: So sánh hình ảnh siêu âm: (a) truyền thống, (b) CEUS
Chất tăng cường tương phản chứa các bong bóng siêu nhỏ chứa đầy khí tương thíchsinh học có kích thước nhỏ hơn các tế bào hồng cầu và có tính chất phản xạ đối vớitín hiệu siêu âm Khi chất tăng cường tương phản được tiêm vào tĩnh mạch cánh taycủa bệnh nhân trước khi siêu âm, khí bên trong các bong bóng siêu nhỏ làm tăng mức
độ tương phản của hình ảnh siêu âm khi các bong bóng này luân chuyển trong máu.Sau khi thực hiện chụp ảnh siêu âm, các chất tăng cường tương phản có thể được đàothải ra khỏi cơ thể trong vòng vài phút
Mặc dù nhìn chung chất lượng hình ảnh của kỹ thuật này chưa tốt bằng các kỹ thuậttạo ảnh y tế khác như cắt lớp vi tính hay cộng hưởng từ, hiệu quả chi phí và tính diđộng cũng như khả năng thích ứng với nhiều mục tiêu tạo hình ảnh khác nhau làm cho
kỹ thuật này trở nên vô cùng phổ biến Sóng siêu âm không chỉ sử dụng trong chẩnđoán mà còn hỗ trợ điều trị bệnh Trong chẩn đoán, ứng dụng phổ biến nhất của siêu
âm là trong sản khoa để theo dõi tiến trình phát triển của thai nhi và phát hiện các bấtthường Công nghệ sử dụng sóng siêu âm cũng ít gây hại với thai nhi hơn so với cáccông nghệ khác như tia X Siêu âm cũng được ứng dụng trong trị liệu với mục đíchtương tự việc sử dụng các phương pháp vật lý trị liệu, có tác dụng làm lành vết thương,làm nóng mô, làm tan cục máu đông, dẫn truyền thuốc qua da hoặc vận chuyển thuốc
Trang 28Thông tin Ảnh hưởng
Ứng dụng phân giải thời gian thực đến cơ thể
Ảnh X-quang Tia X 1 mm Trung bình Không Có (bức xạ ion hoá) Tạo ảnh của các mô cứng
và mềm trên cơ thể (VD: xương)
Ảnh cắt lớp vi tính Tia X 0.5 mm Cao Không Có (bức xạ ion hoá) Tạo ảnh của các tế bào
cứng và mềm trên cơ thể (VD: sọ não, phổi, v.v.) Ảnh cắt lớp phát xạ Tia Gamma 4 mm Cao Không Có (có xâm lấn) Tạo ảnh của các tế bào
mềm trên cơ thể (VD: não)
Ảnh chụp cộng hưởng từ Từ trường 0.5 mm Cao Không Không Tạo ảnh của các mô mềm
trên cơ thể (VD: tim, phổi, gan, v.v.) Ảnh siêu âm Âm thanh tần số cao 1 mm Thấp Có Không Tạo ảnh của các mô mềm
trên cơ thể (VD: tim, phổi, gan, v.v.)
Bảng 1.1: So sánh các loại ảnh y tế
1.2 Tiêu chuẩn định dạng của dữ liệu ảnh y tế
Ảnh siêu âm nói riêng và các loại ảnh y tế nói chung thường được lưu trữ dướiđịnh dạng DICOM Định dạng này tuân theo tiêu chuẩn DICOM (viết tắt của DigitalImaging and Communications in Medicine) - là tiêu chuẩn để xử lý, lưu trữ, in ấn vàthu nhận hình ảnh trong y tế Tiêu chuẩn này bao gồm cả việc định nghĩa cấu trúc tậptin và giao thức truyền thông tin
Trước sự phát triển mạnh mẽ, đa dạng về chủng loại thiết bị cũng như khác biệt vềtiêu chuẩn dữ liệu của các nhà sản xuất thiết bị điện tử y tế những năm 70-80, Amer-ican College of Radiologist (ACR) và National Electrical Manufacturers Association(NEMA) nhận thấy cần phát triển một hệ thống tiêu chuẩn chung về định dạng, lưu
Trang 29trữ và trao đổi ảnh trong y tế Chính vì vậy, chuẩn ACR-NEMA thứ nhất ra đời năm
1985 với các quy định về khuôn dạng dữ liệu, cách thức truyền bản tin kiểu điểm –điểm Phiên bản thứ 2 ra đời năm 1988 được bổ sung thêm các định nghĩa về phầncứng, giao thức phần mềm, từ điển dữ liệu và khắc phục một số lỗi của phiên bản thứnhất Tuy nhiên, cả hai phiên bản vẫn còn nhiều thiếu sót và chưa định nghĩa rõ ràng
về kết nối thiết bị với mạng máy tính Chính vì vậy, tiêu chuẩn thứ 3 ra đời lấy tên làDICOM, kế thừa những ưu việt và khắc phục những hạn chế của hai phiên bản trước
đó, đồng thời tiếp tục được bổ sung hoàn thiện trong những năm 1991-1995
Hệ thống tiêu chuẩn DICOM được chia ra nhiều phần Phiên bản hiện hành (2021e)gồm các nội dung sau:
• Phần 1: Giới thiệu và tổng quan
• Phần 2: Sự tương thích
• Phần 3: Định nghĩa đối tượng thông tin
• Phần 4: Thông số kỹ thuật của lớp dịch vụ
• Phần 5: Cấu trúc dữ liệu và mã hóa
• Phần 6: Từ điển dữ liệu
• Phần 7: Trao đổi tin nhắn
• Phần 8: Hỗ trợ giao tiếp mạng cho trao đổi tin nhắn
• Phần 10: Lưu trữ và định dạng tệp để trao đổi dữ liệu
• Phần 11: Hồ sơ ứng dụng lưu trữ dữ liệu
• Phần 12: Định dạng dữ liệu và phương tiện vật lý để trao đổi dữ liệu
• Phần 14: Chức năng hiển thị tiêu chuẩn thang độ xám
• Phần 15: Hồ sơ quản lý hệ thống và bảo mật
• Phần 16: Nguồn ánh xạ nội dung
• Phần 17: Thông tin giải thích
• Phần 18: Dịch vụ Web
• Phần 19: Lưu trữ ứng dụng
Trang 30• Phần 20: Báo cáo hình ảnh sử dụng Kiến trúc tài liệu lâm sàng HL7
• Phần 21: Sự chuyển đổi giữa DICOM và các đại diện khác
• Phần 22: Giao tiếp thời gian thực
Định dạng ảnh DICOM được quy định trong mục 10 Hiện nay DICOM là địnhdạng ảnh được dùng phổ biến nhất trong y tế Một file ảnh DICOM ngoài dữ liệu hìnhảnh, còn chứa cả những thông tin khác như thông tin về bệnh nhân, về loại máy tạo rabức ảnh, v.v Đó cũng là sự khác biệt của định dạng ảnh DICOM so với các định dạngảnh khác Một tập tin theo định dạng DICOM thường có phần mở rộng là dcm Hình1.8 là ví dụ về một số thông tin được lưu trữ trong một tệp tin ảnh DICOM
Hình 1.8: Một số thông tin lưu trữ trong tệp tin ảnh DICOM
1.3 Cơ sở dữ liệu về ảnh siêu âm
Ảnh siêu âm với nhiều ưu điểm khác biệt như mức độ an toàn cao, hình ảnh đượccung cấp trong thời gian thực, chi phí thực hiện ít tốn kém giúp cho siêu âm trở thànhphương pháp chẩn đoán hình ảnh phổ biến hiện nay Trong việc theo dõi giám sát quá
Trang 31trình phát triển của bệnh, ví dụ như ung thư gan, siêu âm là phương pháp được ưu tiênhơn so với chụp ảnh cắt lớp hay chụp cộng hưởng từ vì tính an toàn của nó, có thểthực hiện nhiều lần hơn trong cùng một khoảng thời gian, giúp cho việc theo dõi vàchẩn đoán được kịp thời Luận văn sẽ tập trung giới thiệu và nghiên cứu về dữ liệu vàcác phương pháp áp dụng với ảnh siêu âm, đặc biệt là ảnh siêu âm trong chẩn đoánung thư gan.
1.3.1 Các cơ sở dữ liệu công khai
Hiện nay một trong các thách thức lớn nhất với người nghiên cứu ảnh y tế là thiếucác bộ dữ liệu quy mô lớn, được chuẩn hoá và gán nhãn đầy đủ Lí do cho việc này làthời gian và chi phí thu thập, gán nhãn cho dữ liệu ảnh y tế là rất lớn với sự tham giacủa các chuyên gia y tế mới đủ khả năng gán nhãn cho dữ liệu Trên thế giới hiện cómột số bộ dữ liệu mở về ảnh y tế như bộ dữ liệu ảnh X-Quang lồng ngực của Viện Y
tế Quốc gia Hoa Kỳ (NIH)2, cơ sở dữ liệu ảnh y tế về các bệnh ung thư của cơ quanLưu trữ Hình ảnh Y sinh Quốc gia Hoa Kỳ (NBIA)3, cơ sở dữ liệu MedPix của Thưviện Y học Quốc gia Mỹ4, v.v Đặc điểm chung của các cơ sở dữ liệu này là phần lớnthuộc loại hình ảnh X-quang, MRI hoặc PET, số lượng dữ liệu thuộc một loại bệnhkhông nhiều, nhãn dữ liệu gán không đầy đủ Để tìm được một bộ dữ liệu ảnh siêu âmgan được khoanh vùng và gán nhãn đầy đủ là việc không dễ dàng do hai lí do Một là
để khoanh vùng và gán nhãn dữ liệu cần sự tham gia của các chuyên gia trong ngành,tốn nhiều thời gian và chi phí Lí do thứ hai đây là dữ liệu cá nhân của người bệnh nên
có hạn chế lớn về việc công khai Vì vậy cơ sở dữ liệu để nghiên cứu về ảnh siêu âmcòn rất hạn chế và không đồng nhất giữa các nghiên cứu Một số bộ dữ liệu công khaiđược cung cấp trong các cuộc thi hoặc do một số nhóm tác giả cung cấp được tổnghợp trong bảng 1.2
2 https://nihcc.app.box.com/v/ChestXray-NIHCC
3 https://www.cancerimagingarchive.net/
4 https://medpix.nlm.nih.gov/home
Trang 32Bộ dữ liệu Độ phân giải Kích thước Mô tả
Thử thách phân đoạn dây
siêu âm vú (Breast
Ultra-sound Teaching File)
vụ cho mục đích giáo dục
Bộ dữ liệu về tổn thương
siêu âm vú (Breast
Ultra-sound Lesions Dataset)
ác tính và 356 mẫu lành tính
tử cung (Cervical
Dysto-nia)
61 người trưởng thành: 35 mẫu bệnh và 26 mẫu bình thường
Các phép đo sinh trắc học
từ hình ảnh siêu âm thai
nhi (Biometric
Measure-ments from Fetal
Ultra-sound Image)
90 đầu, 90 bụng
Phân đoạn hình ảnh siêu
âm của thai nhi (Fetal US
756×546 9 bộ huấn luyện, 1 bộ kiểm tra Phân đoạn đầu, bụng và
xương đùi của thai nhi
Phân đoạn mạch máu
(Vessel Segmentation)
hơn 7000 trường hợp Hình ảnh siêu âm nội
mạch (IVUS Challenge,
gần 113 µm 512 × 5 khung hình Phân đoạn mạch máu dựa
trên ranh giới tạo bởi thành mạch máu
Tổn thương gan khu trú
(SYSU-FLL-CEUS)
HEM và 58 FNH
Trang 331.3.2 Cơ sở dữ liệu nghiên cứu trong luận văn
Trong luận văn sử dụng hai bộ dữ liệu để nghiên cứu và thực nghiệm Bộ cơ sở dữliệu thứ nhất được nhóm nghiên cứu Đại học Khoa học Tự nhiên (ĐHKHTN) thu thập
từ các cơ sở y tế có liên kết với Bệnh viện Trung ương Quân đội 108, thời gian thuthập bắt đầu từ tháng 10/2021 và dự kiến thu thập trong vòng 3-5 năm, với mục đích
sử dụng để nghiên cứu phát triển các giải pháp hỗ trợ bác sĩ trong việc chẩn đoán ungthư gan Dữ liệu cần thu thập tối thiểu 11000 (mười một nghìn) cá nhân, trong đó tốithiểu có 10000 (mười nghìn) bệnh nhân và 1000 (một nghìn) người không bị bệnh
Dữ liệu của mỗi cá nhân là đoạn phim (video) siêu âm khu vực tương ứng, với ít nhất
05 vị trí khác nhau Định dạng lưu trữ là chuẩn DICOM
Bộ dữ liệu được các bác sĩ gán nhãn với hỗ trợ của công cụ được cung cấp bởi nhómnghiên cứu ĐHKHTN Các nhãn được gán cần đạt yêu cầu thể hiện được cấu trúc giảiphẫu gan và các đặc điểm của khối u Hiện trạng bộ dữ liệu đã có 16 đoạn phim siêu
âm và chưa có nhãn Bộ dữ liệu sẽ được sử dụng để phát triển phương pháp nội suyvùng quan tâm (ROI - Region of Interest) giữa các khung hình giúp giảm thiếu thờigian gán nhãn của bác sĩ đồng thời vẫn có đủ nhãn đạt yêu cầu Bước gán nhãn này sẽ
là bước hỗ trợ cho giai đoạn phát triển các phương pháp học máy giúp chẩn đoán ungthư và góp phần làm tăng hiệu năng cho các phương pháp Trong hình 1.9 là dữ liệumẫu của một vài khung hình trích ra từ các đoạn phim siêu âm:
Hình 1.9: Một số khung hình trích ra từ đoạn phim siêu âm do nhóm nghiên cứu
ĐHKHTN liên kết với Bệnh viện 108 thu thập
Trang 34Bộ dữ liệu thứ hai được sử dụng thực nghiệm trong luận văn này được lấy từ bộ
dữ liệu công khai SYSU-FLL-CEUS5, thu thập tại bệnh viện First Affiliated, đại họcSun Yat-sen ở Quảng Châu, Trung Quốc Thông tin bộ dữ liệu và một số ví dụ hìnhảnh trích ra từ các đoạn phim siêu âm được nêu trong bảng 1.3 và hình 1.10
Độ phân giải Kích thước Mô tả
768×576 358 đoạn phim Ba loại nhãn: 186 mẫu của bệnh nhân ung thư gan
(HCC - Hepatocellular Carcinoma), 112 mẫu củabệnh nhân u máu trong gan (HEM - Hemangioma)
và 60 mẫu của bệnh nhân có nốt tăng sản khu trú(FNH - Focal Nodular Hyperplasia) (nghĩa là 186mẫu ác tính và 172 mẫu lành tính)
Bảng 1.3: Thông tin bộ dữ liệu thực nghiệm trong luận văn
Hình 1.10: Một số khung hình trích ra từ các đoạn phim siêu âm trong bộ dữ liệu
SYSU-FLL-CEUS: (a) Khung hình từ đoạn phim HCC, (b) Khung hình từ đoạn phim FNH, (c) Khung hình từ đoạn phim HEM
Với hiện trạng bộ dữ liệu thu thập bởi nhóm nghiên cứu của ĐHKHTN còn khá ít
và chưa có nhãn, luận văn sẽ tập trung nghiên cứu các phương pháp học máy hỗ trợphân loại và chẩn đoán ứng dụng trên bộ dữ liệu công khai, làm nền tảng trước khiứng dụng trên bộ dữ liệu thực tế sau khi đã thu thập và gán nhãn đầy đủ
5 https://github.com/lemondan/Focal-liver-lesions-dataset-in-CEUS
Trang 35Các phương pháp học sâu hỗ trợ chẩn đoán ung thư gan dựa trên đoạn phim
siêu âm
Nhằm khắc phục những thiếu sót của chẩn đoán siêu âm và giúp bác sĩ nâng cao
độ chính xác và hiệu quả của chẩn đoán, nhiều hệ thống chẩn đoán hỗ trợ bằng máytính (CAD - Computer-Aided Diagnosis) đã được phát triển Trong những năm gầnđây, học sâu đã đạt được thành công lớn trong thị giác máy tính với những lợi thế độcđáo của nó Ở khía cạnh phân tích hình ảnh y tế cụ thể là ảnh siêu âm, học sâu cũng
đã được các nhà nghiên cứu khai thác tiềm năng to lớn của nó và áp dụng vào các
hệ thống CAD Trong nhiều bài báo nghiên cứu, các tác giả cũng chỉ ra rằng việc ápdụng các mô hình học sâu vào dữ liệu ảnh y tế cho kết quả tốt hơn so với các mô hìnhtruyền thống [2]
Chương này sẽ tập trung nghiên cứu và phát triển một số phương pháp học sâu ápdụng trong việc phân loại bệnh ung thư gan dựa trên hình ảnh siêu âm Bộ dữ liệuthực nghiệm trong chương này là bộ SYSU-FLL-CEUS đã được nêu trong chương
1 Với giới hạn của dữ liệu thực nghiệm là không được gán vùng quan tâm (ROI),các phương pháp nghiên cứu tập trung vào khả năng phân loại tự động của mô hình
Trang 36mà không cần có nhãn ROI từ các chuyên gia Cụ thể, nghiên cứu sẽ dựa trên nhữngphương pháp học sâu đã áp dụng trong bài toán phân loại hành động của con người vàphân tích ứng dụng trong bài toán phân loại ung thư gan trên dữ liệu đoạn phim siêuâm.
2.1 Các phương pháp học sâu trong xử lý dữ liệu video
Những năm gần đây, các phương pháp học sâu - một nhánh của học máy đã thểhiện sự đột phá trong các ứng dụng xử lý ảnh nói chung và xử lý ảnh y tế nói riêng.Thực nghiệm cho thấy hiệu năng của các mô hình học sâu tốt hơn đáng kể so với các
mô hình học máy truyền thống, như thống kê trong bảng 2.1:
Bài toán phân loại Các phương pháp truyền thống Các phương pháp học sâu
Thuật toán Độ chính xác Độ nhạy Độ đặc hiệu Thuật toán Độ chính xác Độ nhạy Độ đặc hiệu
Khối u hoặc tổn thương [30] PCA-SVM 88.80% ± 89.11% ± 89.34% ± DPN 92.40% ± 93.84% ± 90.84% ±
Trang 37Cấu trúc mạng Bộ phận cơ thể Ứng dụng Kiểu dữ liệu Số lượng mẫu Hiệu năng (%) Tham khảo
Độ chuẩn xác Độ nhạy Độ đặc hiệu
CNN
Gan Tổn thương gan khu trú
Ảnh 63 mẫu (27 mẫu bình thường, 36 mẫu bất thường) 100 100 100 M Biswas et al [33] Ảnh 550 96.3 100 88.2 M Byra et al [34] Ảnh 157 mẫu (81 mẫu bình thường, 76 mẫu bất thường) 90.6 95 85 D Reddy et al [35] Video N/A 93.1 94.5 93.6 F Pan et al [36] Tuyến giáp Nốt sần Ảnh 1037 mẫu (651 mẫu lành tính, 386 mẫu ác tính) 93.1 90.8 94.5 T Liu et al [31] Ngực Khối u và thương tổn Ảnh 7408 mẫu (4254 mẫu lành tính, 3154 mẫu ác tính) 90 86 96 S Han et al [37] Não Động mạch cảnh Ảnh 501 mẫu 89.1 89.0 88.0 S Savas et al [38] Phổi COVID-19 Video N/A - 84-97 90-99 B Barros et al [39]
Video N/A 90 90 - S Ebadi et al [23]
AE Gan Tổn thương gan khu trú Ảnh 110 mẫu 97.2 98.0 95.7 T Hassan et al [32] DPN N/A Khối u và thương tổn Ảnh 200 mẫu (100 mẫu lành tính, 100 mẫu ác tính) 92.4 93.8 90.8 X Liu et al [30] DLS Ngực Khối u và thương tổn Ảnh 632 mẫu (550 mẫu lành tính, 82 mẫu ác tính) 92.4 93.8 90.8 A Becker et al [40] DBN Gan Khối u và thương tổn Ảnh N/A 86.4 83.3 87.5 K Wu et al [41]
Bảng 2.2: Học sâu trong phân loại ảnh y tế
Mặc dù học sâu đã được ứng dụng vào chẩn đoán ảnh y tế từ khá lâu, đến nay tronglĩnh vực y tế vẫn có khá ít những nghiên cứu ứng dụng học sâu với dữ liệu video sovới các nghiên cứu về dữ liệu ảnh
Thực tế đã có nhiều phương pháp học sâu được phát triển cho những bài toán phânloại video khác Các phương pháp học sâu này có thể chia thành 4 nhóm:
• Nhóm 1: CNN áp dụng với từng khung hình đơn lẻ (single-frame CNN)
• Nhóm 2: 3D-CNN
• Nhóm 3: CNN kết hợp với LSTM
• Nhóm 4: Các mô hình hai luồng (two-stream)
Ví dụ phổ biến nhất cho bài toán phân loại video là tác vụ phân loại hành độngcủa con người Bảng 2.3 tổng hợp lại những mô hình học sâu đã được ứng dụng chobài toán phân loại hành động được thực hiện trên bộ dữ liệu thực nghiệm phổ biến làUCF101 [42] và đạt kết quả khả quan
Theo nghiên cứu của tác giả luận văn, đã có một số nghiên cứu ứng dụng cácphương pháp phân loại hành động vào bài toán phân loại video y tế, cụ thể là videosiêu âm và bước đầu đã nhìn thấy tiềm năng của hướng tiếp cận này Các bài nghiêncứu đi theo hướng này được thể hiện trong bảng 2.4
Trang 38Bài báo Mô
hình
Độ chuẩn xác
Độ chính xác
Độ nhạy
Độ đặc hiệu
Classification of liver
tu-mors with CEUS based
on 3D-CNN [36]
CNN
Networks for Lung
Ultrasound Video
Classi-fication [39]
CNN +LSTM
89-95% 84-97% 90-99%
Automated detection
of pneumonia in lung
ultrasound using deep
video classification for
COVID-19 [23]
streamI3D
Bảng 2.4: Một số nghiên cứu ứng dụng các mô hình học sâu trong bài toán phân loại
hành động vào dữ liệu video siêu âm
Với những thành công của học sâu trong dữ liệu video hành động cũng như khảnăng ứng dụng vào các lĩnh vực khác như video y tế, chương này sẽ ứng dụng những
mô hình tiêu biểu đạt kết quả tốt vào dữ liệu video siêu âm với mục tiêu đánh giá khảnăng áp dụng vào thực tiễn của các mô hình này trên dữ liệu video siêu âm nói riêng
và dữ liệu video y tế nói chung
Trang 39Mô hình Nhóm mô hình Accuracy Tài liệu tham
Bảng 2.3: Hiệu năng của một số mô hình học sâu áp dụng vào bài toán phân loại hành
động trên bộ dữ liệu UCF101
2.2 Chẩn đoán ung thư gan sử dụng mạng học sâu
Đến nay đã có nhiều dự án nghiên cứu khai thác các hình thái thị giác khác nhau để
mô tả sự khác biệt giữa khối u ác tính và khối u lành tính Phương pháp thường thấy
là gán nhãn vùng quan tâm (ROI) và trích xuất ra các đặc tính mô tả các khối u khácnhau so sánh với nhu mô bình thường Trong nghiên cứu của Li và cộng sự [45] xácđịnh hình dạng bánh xe của khối u FNH và sự phân bố hỗn loạn của khối u HCC trongđoạn phim CEUS và sau đó sử dụng ANN để chẩn đoán Guo và cộng sự [46] tínhtoán các đặc tính GLCM (Gray-Level Co-occurrence Matrix) từ ROI theo thuật toánphân tích tương quan để phân tích đặc tính kết cấu của các khối u, và họ đạt được kếtquả với độ chính xác 90,41% Tuy nhiên phần lớn các nghiên cứu đều bị giới hạn vớiviệc cần phải mô tả các thông tin hình ảnh thành các thuộc tính trước khi huấn luyện
mô hình Gần đây, học sâu nói chung và mạng nơ-ron tích chập (CNN) nói riêng ứngdụng trên dữ liệu y tế đã được biết đến rộng rãi và đạt những kết quả khả quan hơncác mô hình truyền thống Mô hình CNN cung cấp phương pháp học từ đầu đến cuối
và các đặc tính phong phú, nghĩa là việc tổng hợp đặc tính thủ công không còn cầnthiết Với những ưu điểm trên, một số hệ thống CAD đã ứng dụng CNN và đạt kết quảkhá tốt [47] [48] [49] Trong mục này luận văn sẽ giới thiệu về mô hình CNN và các
Trang 40biến thể khác để giải quyết bài toán đang đề cập.
Mạng nơron tích chập là mạng bao gồm một vài lớp tích chập kết hợp với các hàmkích hoạt phi tuyến như ReLU hay tanh để tạo ra thông tin trừu tượng hơn giữa lớp sau
so với lớp trước Các lớp (layer) liên kết được với nhau thông qua cơ chế tích chập.Lớp tiếp theo là kết quả tích chập từ lớp trước đó Mỗi lớp như vậy được áp dụngcác bộ lọc khác nhau, thông thường có vài trăm đến vài nghìn bộ lọc như vậy Một
số lớp khác như pooling layer dùng để chắt lọc lại các thông tin hữu ích hơn (loại bỏcác thông tin nhiễu) Trong suốt quá trình huấn luyện, CNN sẽ tự động học được cácthông số cho các bộ lọc Ví dụ trong tác vụ phân lớp ảnh, CNN sẽ cố gắng tìm rathông số tối ưu cho các bộ lọc tương ứng theo thứ tự điểm ảnh (rawpixel) -> cạnh biên(edges) -> hình dạng (shapes) -> bề mặt (facial) -> các đặc trưng bậc cao (high-levelfeatures) Lớp cuối cùng được dùng để phân loại ảnh