1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng mô hình deep learning trong chẩn Đoán các cấp Độ bệnh võng mạc tiểu Đường

79 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng dụng mô hình deep learning trong chẩn đoán các cấp độ bệnh võng mạc tiểu đường
Tác giả Đoàn Trọng Hải Anh
Người hướng dẫn ThS Trịnh Huy Hoàng
Trường học Trường Đại học Sư phạm TPHCM
Chuyên ngành Khoa học máy tính
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2023
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 79
Dung lượng 5,37 MB

Nội dung

Bệnh võng mạc tiểu đường Diabetic Reinopathy-DR là một biến chúng phd biến của bệnh tiêu đường, gây ra các tôn thương trên võng mạc ảnh hưởng đến thị lực, Nếu không phát hiện sớm cổ th

Trang 1

KHOA CONG NGHE THONG TIN

DOAN TRONG HAI ANH

UNG DUNG MO HINH DEEP LEARNING TRONG CHAN DOAN CAC CAP DO BENH VONG MAC TIEU DUONG

KHOA LUAN TOT NGHIEP

‘TP.HO CHI MINH - NAM 2023

Trang 2

KHOA CONG NGHE THONG TIN

ĐOÀN TRỌNG HẢI ANH

ỨNG DỤNG MÔ HÌNH DEEP LEARNING TRONG CHAN DOAN CAC CAP DQ BENH VONG MAC TIEU DUONG

CHUYEN NGANH: KHOA HQC MAY TINH

KHÓA LUẬN TÓT NGHIỆP

NGƯỜI HƯỚNG DẪN KHOA HỌC: THS TRỊNH HUY HOÀNG

TP.HCM ~ NAM 2023

Trang 3

Em xin cam đoan rằng khóa luận này là do tự bản thân em tìm hiểu, nghiên cứu dưới s hướng dẫn của Th.S Trinh Huy Hoàng s liệu sử đụng phân tích có nguồn sốc rõ rùng, Các kết quả nghiên cứu trong khóa luận hoàn toàn trưng thực, khách quan -được trích dẫn và chủ thích rõ rằng, đấy đủ

Sinh viên thực hiện Dodin Trọng Hải Anh:

Trang 4

Lai di tn, em sin gi lồi cảm ơn tối Khoa Công nghệ thông tin, trường Dai

học Sư Phạm Thành phó Hồ Chí Minh đã tạo môi trường đảo tạo, rèn luyện, tạo điều

kiến cho em được học ập và trang bị mọi hành trang kiển thức để hoàn thành khóa luận

đìu đất, định hướng tương lai cho tắt cả sinh viên chúng em

in với đỀ tải khóa luận tốt nghiệp này, em xin chân thành cảm ơn đến thầy

(Th.S) Trịnh Huy Hoàng giảng viên khoa Công nghệ thông tin Thay đã để nghị, hướng

cdẫn, cổ vấn và đồng hành cùng em trong suốt thời gian thực hiện đề tải Nhỡ có sự hướng

‘qui trình học tập lý thuyết và thục nghiệm Trong quả trình làm đề ti, thầy đã góp ý, bổ tục chia sé kinh nghiệm, và dẫn dắt sinh viên trên con đường học tập!

Em xin chân thành cảm ơn!

TP: Hồ Chí Minh, ngày 3, tháng 4, năm 2023 Bodin Trọng Hải Anh:

Trang 5

LOI CAM DOAN

11 Tinh edp thi lý đo chọn đề tài

12 Mye tigu nghiên cứu

ch tiếp cận, phương pháp, phạm vỉ nghiên cứu:

22 Mộtsố kiế thức về xử ý ảnh số

221 Ảnh số và điểm ảnh

2.2.2, Hệ màu RGB:

2.2.3, Tensor

Trang 6

23 Phin loại hình ảnh trong thị giác máy 2⁄4 Các phương pháp rút trích đặc trưng, 2.4.1, Convotional Neural Network: 2.4.2 Principal Component Analysis (PCA):

25 Dp do diing để đánh giá mô hình 2.5.1, Accuracy:

2.6, Hàm mất mát

2.6.1 Cross Entropy

CHUONG 3: CAC PHUONG PHAP THUC HIEN 3.1, Mô hình K-Nearest Neighbor (KNN): 3.1.1 Khấi quất về KNN; 3.12 Các bước làm việc của KNN:

3.1.3 Ưu và nhược điểm của K-NN:

3.2 Mô hình Random Forest: 3.2.1, Khai quit vé Random Forest: 3.2.2 Các bước làm việc của Random Forest: 3.2.3 Ưu và nhược điểm của Random Forest: 3.3 Môhình Support Vector Machine (SVM): 3.3.1, Khai quat vé SVM 3.3.2 Các bước làm việc của SVM: 3⁄4 - Môhình Naive Bayes: 3.4.1, Khai quat vé Naive Bayes:

Trang 7

3.43 Uu vi nhuge diém cita Naive Bayes:

Mô hình dựa trên kiến trúc GoogLeNEt:

M6 hinh Convolutional Neural Network (CNN) dé xuất:

-Mé hinh Convolutional Neural Network (CNN) 48 xu:

ƯA và nhược điểm của CNN:

CÀI ĐẶT THỰC NGHIỆM, ĐÁNH GIÁ VÀ SO SÁNH

Trang 8

4.34 Tăng cường dữ liệu

44, Cai dit, huẫn luyện và đánh giá mô hình:

4.4.1, Mô hình CNN đề xuất

4.4.2, Mé hinh dya trén kién trie GoogLeNet, 4.4.3, M@ hinh K-Nearest Neighbor (K-NN): 4.4.4, Mô hình Random Forest 4.4.5 M@ hinh Support Vector Machine (SVM): 4.4.6, M@ hinh Naive Bayes: 4.5 So sinh các mô hình «

'CHƯƠNG 5: KET LUAN VA HUONG PHAT TRIEN

5.1 Kếtuận:

5.2 - Hướng phátin TÀI LIỆU THAM KHẢO

Trang 9

Hình 2, Ì- Triệu chứng mắt bị bệnh võng mạc tiêu đường Nguồn: Vinmec 19 Hình 2, 2- Hình ảnh mắt chưa mắc bệnh, Nguồn: Kaggle 20 Hình 2, 3- Giả đoạn bệnh lý võng mạc nỀn Nguồn: Kaggle snd Hình 2.4- Giải đoạn bệnh lý hoàng điểm Nguồn: Kaggle mỊ

Hình 2 5- Giai đoạn bệnh lý tiền tăng sinh Nguồn: Kaggle 2I

Hình 2, 6 Giải đoạn bệnh lý tăng sinh Nguồn: Kaggle +

Hình 2 9- Minh họa về hệ màu ROB, Nguồn: Greenacademy 24 inh 2 10- Hin hp minh hga v8 tensor 3 chigu Ngudn: Stackoverflow 25

Hình 2 12- Tăng độ tương phản cho hình ảnh 26

Hình 2 14-Minh họa về phân loại hình ảnh trong thị giác máy tính 28

Hình 3 2- Bản đồ thuật toán K-NN nhiễu khi K 34

Hình 3, 5- Minh họa về Convoluional Neural Network Nguồm: Medium 45 Hình 3, ó- Ma trận hình ảnh nhân với ma trận iter 45

Hình 3 7- Ma trận hình ảnh cỡ 5x5 nhân kernel cỡ 3x3 Nguỗn:Nttuan8 46

Hình 3, &- Ma trận đầu ra cỡ 3x3, Nguễn: Nguan§ 46 Hình 3, 9- Minh hoa Stride bing 2 pixel Nguồn: DeepAl 47 Hình 3, 10- Him kich hogt ReLu Nguén: ConfusedCoder 4g Hình 3 11» Minh họa vỀ max pooling Nguồn: Paper With Code 49 Hình 3 l- Dữ iệu được làm phẳng trước khi đưa vào lớp FC Nguỗm: Medium

50

Trang 10

Hình 3 14- Trực quan các lớp cia mé hinh Convolutional Neural Network d

Hình 4 8- Ví dụ về xoay hình ảnh để tăng cường dữ liệu 64

Hình 4, 9- Biểu đồ số lượng samples ác lớp trong bộ dữ liệu mới 64

Hình 4 10- Biểu đồ độ chính xác của mô hình CNN qua các epochs training 6Š

Hình 4, 11- Giá trị hàm mắt mát của mô hình CNN qua ee epochs training 65 Hình 4 12- Ma trận nhằm lẫn của mô bình CNN trên tập test 66 Hình 4, lã- Biểu đồ độ chính xác của mô hình dựa trên kiến trie GoogLeNet qua

Hình 4 l4- Biểu đồ giá tị hàm mắt mát của mô hình dựa tên kí

Hình 4 15- Ma trận nhằm lẫn của mô hình dựa trên kiến trúc GoogLeNet trên

Hình 4 16- Biểu đồ độ chính xác của mô hình K-NN với các giá trị của K 68

Hình 4 17- Ma trận nhằm lẫn của mô hình K-NN với K = Š trên tập tes 68

Hình 4, I3- Ma trận nhằm lẫn của mô hình Random Eorest trên tập tet 69 Hình 4, 19- Ma trận nhằm lẫn của mô bình SVM trên tập test 69 Hình 4, 20- Ma trận nhằm lẫn của mô hình Naive Bayes trên tập test 10

Trang 11

Bảng 4 I- Bảng so sánh độ chính xác các mô hình trên tập test

Trang 12

Diabetic Retinopathy DR Binh wane mye Fre sin al nn

Rau Dic tng

K Nearest Neer Pe ee

nip Conponca nal Php ach eae

nh

Trang 14

Bệnh võng mạc tiểu đường (Diabetic Reinopathy-DR) là một biến chúng phd biến của bệnh tiêu đường, gây ra các tôn thương trên võng mạc ảnh hưởng đến thị lực,

Nếu không phát hiện sớm cổ thể dẫn đến mù lòa, Phát hiện và điều trị sớm bệnh võng nhiệm vụ trong nhiễu lĩnh vục, bao gồm cả y học, có thể được giải quyết bằng cách sử

luận đề xuất phương pháp xây dựng mô hình mạng nơ-ron tích chập (Convlutional

‘Neural Network-CNN) dé chân đoán các cấp độ của bệnh võng mạc tiêu đường Cụ thể,

ý tưởng chính của mô hình CNN là một mô hình deep learning bao gồm các lớp ích chập, các lớp pooling, lớp flatten và các lớp fully connected để chẩn đoán cá c cắp độ của bệnh võng mạc tiểu đường Độ chính xác của phương pháp CNN mà khóa luận đề pháp CNN được đỀ xuất tốt hơn một chút so với mô hình dự trên kiến trúc GoogLeNet

và vượt trội hơn hẳn so với các phương pháp học máy thông thường như: K-nearest

neighbor (K-NN), Support Vector Machine (SVM), Naive Bayes va Random Fores sau

khi huấn luyện trên tập dữ liệu training va kiểm tra trên tập dữ liệu test đã được chia

Trang 15

1.1.Tính cấp thiếu lý do chọn

Trong vài năm gần đây, trí tuệ nhân tạo (Artificial Intelligence-Al), học máy, (Machine learning), và học sâu (Decp leamine) đã được ứng dụng rộng ãi trong nhiều

khỏe cũng đã dễ dảng được cải đặt ngay trên điện thoại thông minh Điều này đã giúp

cho hiu hét moi người có thể tếp cận với công nghệ một cách đơn giản 6]

“Các bác sĩ và các nhà khoa học sẽ "đán nhãn” và xử lý một lượng lớn dữ liệu vẻ

kình ảnh bình thường hay có bệnh lý, các chỉ số sức khỏe tốt hay xấu Những dữ liệu

và nhận diện các chấn đoán khi tiếp xúc với dữ êu của bệnh nhân Quá trình này tương

tự như việc sinh viên trường y tổn rất nhiều thời gian và công sức để học nhận điện các xác hơn Lượng dữ liệu học của máy tính gần như vô hạn, giúp cho AI có khả năng chin doin không kém các chuyên gia Từ đó, ta có thể được triển khai, nhân rộng trên toàn thể giới một cách nhanh chống và tiết kiệm chỉ phí

AI có thể rất mạnh trong việc chẩn đoán bệnh Ví dụ, nó có thể phát hiện ung thư

phổi hoặc đột quy thông qua các phim chụp, đảnh giá nguy cơ đột tử do các bệnh im

võng mạc tiêu đường qua hình ảnh võng mạc [8] Ngoài ra, có các dự án hứa hẹn

cửa AI liên quan đến việc kết hợp nhiều nguồn đỡ liệu khác nhau (như cất lớp, cộng

hưởng từ, giải trình gen, và dữ liệu bệnh nhân cụ thể) đẻ đánh giá một căn bệnh hoặc chẩn đoán sự tiền triển của nó

Bệnh võng mạc tiểu đường là một trong những bệnh lý phổ biển ở người cao tuổi

và có thể gây tên thương đáng kế cho võng mạc Nếu không được phát hiện và điều tị kịp thời, nó có thểdẫn đến mũ lồa, Theo một nghiền cứu thống kế tại Hoa Kỹ, bệnh

võng mạc tiểu đường chiếm 12% trong tổng số các ca mù lỏa mới mỗi năm vả đặc biệt phổ biến ở những người cao tuổi từ 20 đến 64 tuổi [1] Tuy nhiên, các triệu chứng của

Trang 16

và khiển họ không thể điều t lặp thời Điều này dẫn đỗn sự phất triển của căn bệnh và gây m nhiều khó khăn trong quả nình điều tị sau này

rin dé

Để giải quyết n đoán các cấp độ bệnh võng mạc tiêu đường như đã đề

ra, phương pháp học mấy và học sâu có thể được áp dụng để xử lý một lượng lớn hình

ảnh đầu vào Tuy nhiên, để đạt được độ chính xác cao và tốc độ xử lý nhanh, cẳn phải

tìm hiểu và sử dụng các phương pháp và mô hình thích hợp Vì vậy khỏa luận tập trung bằng mô hình CNN do tôi tự thiết lập, so sánh với mô hình trên liễn trúc GoogLeNet

và các phương pháp học máy thông thường như: K-Nearest Neigbor, Random Eorest,

Support Vector Machine, Naive Bayes Ở mô bình dựa trên kiến trúc GoogLeNei, thay

sẵn, khó luận sẽ xây dựng, sửa đối và huần luyện lại từ

ến trúc đã cí

vì sử dụng lại

dau do kiến trúc GoogLLeNet được thiết kế để phân loại các đổi tượng quen thuộc như

chó, mo, áo, cam, quýt v.v Mé-dun inception cia GoogLeNet li chay song song ahigu

ra, mé-dun inception cin có tu điểm là giảm kích thước của bản đồ die trang (Feature yêu cầu chẩn đoán 5 cấp độ của bệnh võng mạc tiểu đường,

1.2 Mye tigu nghiên cứu;

Mục tiêu chủ yếu của đề tài là tìm kiếm phương pháp phù hợp đẻ giải quyết bài toán chẩn đoán các cấp độ cña bệnh võng mặc tiễu đường đạt hiệu quả cao về độ chính giảm tải được khối lượng công ví

Trong phạm vi nghiên cứu này,đ tài rỉnh bày hướng giải uyết bài toán bằng

phương pháp học sâu Đây là bài toán phân loại ảnh đa lớp Bộ ảnh đầu vào là ánh nền

võng mạc được tẤy từ nguồn dữ liệu do các bie st đã thụ thập và gắn nhân Tập ảnh này

sẽ được đưa vào tiễn xử lý để quá trình học sâu được tôi ưu nhất

Trang 17

pháp học máy chuyên sấu Trong quổ tình xử lý học sâu, những đặc trưng cña nh sẽ

ớp hình ảnh và đưa ra dự đoán kết quả phân lớp của ảnh

Áp dạng và so sinh kết quả của các mô kình học sâu nhơ: CNN, kiến trúc

GoogLeNel, các mô hình học máy thông thường nhu: K-NN, SVM, Naive Bayes, Random Forest dé tir đó khóa luận tìm ra được phương pháp tối ưu và hiệu quả nhất

Nghiên cứu và áp dụng những phương pháp phù hợp Từ đó xây dựng hệ thống

hỗ trợ việc chẩn đoán hưởng đến đổi tượng người dùng là những người có nhu cầu chẩn đoán các cấp độ của bệnh võng mạc tiểu đường,

1.3.2 Phương pháp nghiền cứu:

~ _ Tim hiểu về phân loại hình ảnh rong thị giác máy tính

~ _ Tìm hiễu các phương pháp nit trich dic trumg

~ _ Tim hiểu về các phương pháp đo hiệu suắt mô hình cần sử dụng

~ _ Tìm hiễu các him mắt mát cần sử đụng

Phương pháp nghiên cứu thực nghiệm:

= Tim hiễu về mô hình học mấy, học sâu và kết bợp với OpenCV, Kerss,

“TensorFlow, Sklear, v

Trang 18

Ảnh nỀn võng mạc

~_ Đảnh giá và so sánh kết quả đạt được của các mô hình chân đoán

'Công cụ nghiên cứu cơ sở lý thuyết: Các tả liệu, bài báo có nghiên cứu về xử lý

lĩnh vực y khoa Các tải liệu, bài báo, kiến thức về y khoa nói chung, về bệnh võng mạc tiều đường nồi riêng

“Công cụ nghiên cứu thực nghiệm: Các tải liệu, bài bị

‘dung các framework, module học máy, học sâu đặc biệt là trong lĩnh vực thị giác máy „ các bài hướng dẫn có ứng tinh,

1.3.3 Pham vi nghiên cứu:

Pham vi nghiên cứu của để tài hướng đến bộ dữ liệu ảnh nền võng mạc của các

cea bệnh đã được các bác sắn nhăn chính xác

Bộ dữ liệu Diabetic Retinopathy gồm hơn 35000 bức ảnh đã được thu thập trên

website Kaggle.com

Hệ thống chấn đoán sẽ chỉ áp dụng cho việc chấn đoán các cắp độ bệnh võng mạc tiểu đường dựa vio anh nén võng mạc của bệnh nhân

1 Công trình nghiên cứu liên quan:

"Ngày nay, nhiều nhiệm vụ trong nhiễu lĩnh vực, bao gém cả y học, có thể được giải quyết bằng cách sử dụng các kỹ thuật học sâu Thạc sĩ Trịnh Huy Hoàng cũng các

công sự [9] đã để xuất phương pháp transfer learning mạng nơ-ron sâu để phân loại ung

thư phổi và ung thư đại trằng dựa trên GoogLeNet Cụ thể, ý tưởng chính của mô-dun

ng nhiều hoạt động (tổng hợp, tích chập) với nhiều kích thước bộ lọc để học được các đ

inception của GoogL.eNet là chạy song s

trúng từ nhỏ đến lớn ở nhiễu góc độ khác nhau Ưu điểm thứ hai của mô-đun nception là giảm kích thud cia feature maps va xi

If quá trình tham số hóa Đầu ra của các phân loại này đã được điều chính thành 3 hoặc

2 logi do các loại vẫn đề về phổi và đại tràng được yêu cầu Độ chính xác của phương pháp được đề xuất lẫn lượt à 99,66% và 10

Trang 19

“Từ những điều nêu trên, ôi đã đỀra phương hướng đề thục hiện nội dung đề ải

th võng mạc tiêu đường

~ _ Tìm hiểu những công trình liên quan

~ _ Nghiên cứu và tìm hiểu về các phương pháp xử lý ảnh số

- So sinh va dua ra kết quả và báo cáo

~ _ Kếthuận và hưởng phát tiễn cho trơng bi

“Cấu trúc khóa luận tốt nghiệp:

~_ Mục tiêu nghiên cứu,

~ _ Cách tiếp cận, phương pháp, phạm vỉ nghiên cứu, công trình nghiên cứu liên quan

~_ Tóm tắt nội dung khóa luận

~_ Cấu trúc khoá luận

Chương 2: Cơ sở lý thuyết

Trang 20

~ Mé hinh dya trén kign triic GoogLeNet

= Convolutional Neural Network dé xuat,

“Chương 4: Cải đặt thực nghiệm, đánh giá và so sinh

Cau bình máy tính

~_ Cải đặt các ứng dụng, thư viện, modu cẩn thiết

= Cai dt, huấn luyện và đánh giá các mô hình

~ _ So sánh các mô hình

Chương 5; Kết luận

~_ Kết luận

~ _ Hướng phát tr

Trang 21

3.1 Khái quát về bệnh vãng mạc tiểu đường:

“Căn bệnh võng mạc tiêu đường ngày cảng trở nên phổ biến ở các nước đang phát

triển và được xem là nguyên nhân chính đẫn đến mà lòa ở các quốc gia Cỡ khoảng 90%

đường, bắt kể loại tiêu đường phụ thuộc vào Insulin hay không [1] Với hơn 200 triệu

nguồi mắc tiêu đường trên toàn cầu, nếu không được phát hiện và điều trị kịp thời, các tổn thương của bệnh tại võng mạc như phủ hoàng điểm, xuất huyết võng mạc, xuất huyết

dịch kính, bong võng mạc sẽ trở nên rất nghiêm trọng và có thể dẫn đến mà tba [10]

21.1 Nguyên nhân gây ra bệnh võng mạc tiểu đường:

“Các mao mạch võng mạc bị tổn thương do bệnh tiểu đường, gây tắc và thiểu máu võng mạc, khiến cơ thể kích thích phát triển tân mạch (mạch máu mới) để nuôi dưỡng, sắc vùng võng mạc bị thiểu máu 1] Tuy nhiên, những lân mạch này möng manh và đễ

võng mạc Hoàng điểm (điểm vàng) là trung tâm của võng mạc, đây là nơi có tập trung

nhiễu tỄ bảo thị giác nhất và là bộ phận quan trọng trong quổ tình nhận dạng hình ảnh

Bệnh tiểu đường gây tổn thương trực tiếp đến võng mạc, đặc biệt là hoàng điểm, gây cảnh hướng đến chức năng thị giác và lâm suy giảm tẩm nhìn [10]

Trang 22

2.1.2.1 Giải đoạn mắt chưa mắc bệnh:

6 giai đoạn này, mắt bệnh nhân tiểu đường vẫn chưa bị bệnh võng mạc tiều

vũng mạc bị phinh to, xuất hiện xuất huyết nhẹ, tiết tích tụ trong võng mạc và phù

mạch mắu, ẫn đến tổn thương của võng mạc, Nếu giai đoạn bệnh lý chưa ảnh hưởng

đến khu vực hoàng điểm, thì thị lực của bệnh nhân chưa bị giảm Tuy nhiên, bệnh nhân

6 thể cảm thấy các đâu hiệu khác như thấy điểm den trước mắt hoặc thay đổi vỀ mâu sắc Việc theo đõi và điều trị kịp thôi rắt quan trọng để ngăn ngừa tỉnh trạng bệnh trằm trọng và bảo vệ chức năng thị giác [10]

Trang 23

Giảm thị lực ở bệnh nhân tiêu đường, đặc biệt là thể bệnh không phụ thuộc insulin

ở độ tuổi từ 50-70 thường đo hoàng điểm bị phù, cỏ th tạo thành nang và di kèm với

thiểu máu nuôi dưỡng cục bộ Phù hoàng điểm với các xuất tiết cứng quanh hoàng điểm

"Để khắc phục bệnh lý hoàng điểm với triệu chứng giảm thị lục nghiêm trọng, bệnh nhân phục hoàng điểm nhanh chóng [10]

2.1.2.4 Giải đoạn bệnh lý tiền tăng sinh:

“Tổn thương ở võng mạc giả đoạn này gây nên bởi sự bắt thường cung cp máu cho võng mạc, dẫn đến các tồn thương thiểu máu cục bộ, xuất huyết, xuất tiết và phù võng mạc.Tên thương ở iai đoạn này nếu đc dọn chức năng thị giác hoặc gây thiểu máu cặc bộ nặng cần chụp võng mạc bằng laser quang đông đễ phòng biển chứng [I0]

Trang 24

“Trong giai đoạn bệnh lý tăng sinh, các mô mỡ và mô sợi bị chông chéo và dày hơn, gầy ra sự biến dạng và tăng kích thước của võng mac Triệu chứng thường gặp chí là mắt th lực Điễu trị bệnh võng mạc ti đường giai đoạn bệnh lý ting sinh, các, bác sĩ thường khuyến cáo bệnh nhân kiểm tra định kỳ và kiểm soát tốt nông độ đường

huyết, điều trị bằng thuốc hoặc phẫu thuật có thể được đề xuất tủy thuộc vào tinh trang bệnh lý và mức độ tổn thương của võng mạc [10]

2.2 Mot sé kiến thức về xử lý ảnh số:

-3211 Ảnh số và điễm ảnh:

Ảnh số là một loại hình ảnh được tạo thành bằng cách sử dụng các thuật toán số

học và các thiết bị ện từ để chuyển đội các tin hiệu quang học thành tin hiệu điện và lưu trừ chúng đưới dạng số Các ảnh số có thể được lưu trữ, xử lý và chia sé dB ding

cdụng của ảnh số rắt đa dạng, bao gồm trong y học, khoa học vật lý, công nghệ thông tin,

nghệ thuật, giải trí và nhiều lĩnh vực khác [11]

Điểm ảnh (hay còn gọi là pixel) là đơn vị cơ bản nhất trong một hình ảnh số, Một

kình ảnh được tạo thành bởi rất nhiều điểm ảnh, mỗi điểm ảnh có một giá trị mẫu sắc và theo một mạng lưới 2 chiều, các điểm ảnh này tạo thành một hình ảnh hoàn chỉnh Độ

n

Trang 25

cảng tốt, Trong hệ mau RGB, giá trị của mỗi mu (đỏ, xanh lá cây, xanh dương) được

biếu điễn bằng một số trong khoảng từ 0 đến 255, và mỗi điểm ánh được biểu điễn bằng

3 số tương ứng với giá tị của 3 màu này Độ sáng của một điểm ảnh được biểu diễn

255 tương đương với màu trắng Giá trị của mỗi điểm ảnh quyết định chất lượng và độ

chỉ tết của hình ảnh, và có vai trò quan trọng trong các ứng dung đỏ họa và xử lý ảnh

Trang 26

Hệ màu RGB (Red Green Blue) là hệ màu được sử dụng phổ biến trong đỗ hoa

và xử lý hình ảnh Hệ màu RGB được tạo thành bởi 3 màu cơ bản là đỏ (R), xanh lá cây

(G) và xanh dương (B) Mỗi màu được biểu diễn bằng một giá trị số trong khoảng tử 0

Trang 27

ỗ (Đigital Image Proeessing) là một lĩnh vực của khoa học máy tính

€ kiểm tra và điều

Trang 28

F_

“Tăng độ tương phản cho hình ánh: Tăng độ tương phản trong xứ lý ảnh là quá

trình làm tăng độ khác biệt giữa các pixel trong ảnh Việc tăng độ tương phản cổ thể

giúp cải thiện chất lượng và độ nét của ảnh, làm nỗi bật các chỉ tiết và khuôn mặt, giúp

cho người xem dễ đàng nhận điện và phân tích các thông ti trong ảnh Tuy nhiên, cằn phải lưu ý rằng việc tăng độ tương phản quá mức có thể làm mắt mát thông tin trong ảnh, làm cho các đổi tượng trở nên bị méo mồ và không còn tự nhiên như ban đầu Do, dich sir dung và không làm mắt mát quá nhiễ thông tin trong ảnh Ngoài ra, cũng cần

lưu ý rằng, việc tăng độ tương phản có thể làm tăng nhiề và các chỉ tiết không mong

muốn trong ảnh

Trang 29

Điều này giúp người dũng có thể xoay ảnh theo các góc độ khác nhau để phủ hợp với

gdm xoay ảnh theo góc độ cổ định hoặc xoay ảnh theo góc độ ngẫu nhiên Khi thực biện

xoay ảnh, người dùng cần phải lưu ý đến việc ảnh sau khi xoay có thể bị biển dang hoặc

mất mát thông tin Vì vậy, việc lựa chọn phương pháp xoay ảnh phù hợp vả thực hiện

kiểm tra kỹ lưỡng là rất quan trọng Ngoài ra, việc xoay ảnh cũng cỏ thể gây ra hiện tượng nhiễu hoặc các chỉ tiết không mong muốn trong ảnh

Phân loại hình ảnh trong thị giác máy tính:

Phân loi ình ảnh là một tác vụ quan trọng trong lĩnh vụ thị giác mấy tính, có thể được định nghĩa là quá tỉnh tự động xác định loại hoặc phân loại đối tượng trong tượng mà ảnh đó đại điện [3]

“Các phương pháp phân loại

cảnh trong thị giác máy tính có thể được

ia thành hai loại chính: phân loại nhị phân và phân loại đa lớp Trong phân loại nhị phân, đoán về loại của đối tượng trong ảnh đồ thuộc vào một trong nhiễu lớp khắc nhau [14]

Trang 30

các thuật toán học máy truyền thống như Random Forest, SVM, các mô hình học sâu như Convolutional Neural Network (CNN) Cée phương pháp này ảnh, và sử dụng các kỹ thuật tiền xử lý để tăng tính đồng nhất của các hình ảnh trong tập dữ liệu Khi được áp dụng cho ảnh mới, các mô hình phân loại hình ảnh đánh giá cảnh dựa trên các đặc trưng của nó và đưa ra dự đoán về loại của đổi tượng trong ảnh 1s)

Nearest Neighbor, vi

ink 2 14 hoa phn log nk non tie mi

2.4 Các phương pháp rút trích đặc trưng hình ảnh:

24.1 Convotional Neural Network:

‘Convolutional Neural Network (CNN) li một mô hình học sâu được sử dụng đẻ rút trích đặc trưng hình ánh CNN có khá năng tự động học các đặc trưng phức tạp của {nh tir ede ting convolution va pooling trong mô hình [16]

CNN có thể được sử dụng để giải quyết các bài toán liên quan đến phân loại ảnh, nhận dạng đối tượng và phát hiện đối tượng trong ảnh Quá trình huấn luyện mô hình

CNN bao gồm việc cung cấp cho mô hình các ảnh huấn luyện cùng với các nhãn tương

cứng để mô hình tự động bọc các đặc trưng quan trọng tử các ảnh đó [7]

Céc ting eonvolution trong mô hình CNN eó chức năng rút trích các đặc trưng

ee bộ từ ảnh đầu vào Mỗi tằng convoluton sử dụng các bộ lọc để thực hiện việc ích

28

Trang 31

ảnh có kích thước nhỏ hơn ảnh đầu vào, nhưng chứa các thông tỉn quan trọng về các đặc trưng cục bộ của ảnh

Sau đó, ting pooling được sử dụng đễ giảm kich thude eta feature maps vi tgo ra cbc feature maps cé 49 phân giải thấp hơn, giúp g am chi phi ti .overliting Cuối cùng, các feature maps được đưa vào các ting fully connected dé phan

loại ảnh [4]

CNN la mét phương pháp rất mạnh mẽ dé rút trích đặc trưng hình ảnh và đã được

sử dụng thành công trong nhiều bãi toán thực iên quan đến xữ lý ảnh và compter vision [16]

(2.4.2, Principal Component Analysis (PCA):

PCA (Principal Component Analysis) là một trong những phương pháp phổ biển cược sử dụng trong rất bích đặc trưng ảnh PCA được sử dụng đ giảm số chiễu của cảnh, giúp giảm chỉ phí tính toán và cải thiện độ chính xác của các mô hình học máy [18]

“Các bước thực hiện PCA trong rút trích đặc trưng ảnh như sau [18]

~ _ Chuẫn hồa ảnh: ảnh được chuyển đổi sang định dạng số vàchuẫn hóa để trị trung bình bằng 0 và độ lệch chuẩn bằng 1

“Chuyển đổi ảnh thành ma trận: ảnh được chuyển đổi thành một ma trộn, trong đó mỗi hàng tương ứng với một vector đặc trưng của ảnh

Tính ma trận hiệp phương sai: Ma trận hiệp phương sai được tính toán từ

Trang 32

ảnh mới, với số chiều giảm xuống tương ứng với số lượng thành phần chính đã chọn

PCA trong rút trích đặc trưng ảnh có thể được sử dụng độc lập hoặc kết hợp với

các phương pháp khác như Convoluional Neural Netvork (CNN) để tăng độ chính xác

của việc phân loại hoặc nhận dạng ảnh.CA là một phương pháp giám chiều dữ liệu được

sử dạng để ích chọn đặc trưng hình ảnh PCA giảm chiều số lượng đặc trưng của ảnh

để làm giảm chiễu dữ liệu và tăng tốc quá trình huẫn luyện,

2.5.04 đo dùng để đánh giá mô hình:

Accuracy = (Số lượng dự đoán chính xác) / (Tổng số lượng dữ liệu) [I8]

Ví dụ, nếu một mô hình phân loại được 1000 điểm dữ liệu và dự đoán chính xác

900 điểm, thì accuraey của mô hình đồ sẽ là

'Công thite tinh Cross Entropy được xác định bởi

30

Trang 33

H@.9) = ~Y@@) WEE) [20] Trong đĩ:

Hípa) giá tí Cross Enropy của phân phối xác suất p và q (x) là xác suất thực ế của biển ngẫu nhiên

(x) là xác sut đự độn của biến ngẫu nhiên

“Giá trị Cross Entropy sẽ cảng thấp nêu phân phối xác suất dự đốn cảng gần với phân phốt xác suất thực tế Digu này cĩ nghĩa là mơ hình dự đốn của chúng ta là chính xác và đáng tin cậy [21]

"Trong học máy, Cross Entropy thing được sử dụng như là hàm mắt mát để đánh giá độ chính xác của một mơ hình phân loại Mục tiêu của chúng ta là ìm cách điều

chỉnh các tham số trong mơ hình đẻ giám thiêu giá trị của Cross Entropy, và từ đĩ cải

thiện độ chính xác của mơ hình [22]

Trang 34

“Trong nghiên cứu này, thực hiện việc phân loại bệnh võng mạc tiểu đường thông qua các phương pháp về Machine learning thông thường và Deep learning nur: K-Nearest Neighbor, Random Forest, Support Vector Machine, Naive Bayes, kiến trúc

CNN tyr tinh chỉnh và mô hình dựa trên kiến trúc GoogLeNet để chin đoán các cắp độ

ccủa bệnh võng mạc tiểu đường Chỉ tiết từng phương pháp sẽ được

3.1, M6 hinh K-Nearest Neighbor (KNN):

3L1.2 Các bước làm việc của KINN

“Thuật toán K-NN gằm một số bước sau [23]

Bước 1: Xác định tham số K = số láng giềng gần nhất Bước 2: Tỉnh khoảng cách đối tượng cần phân lớp với tắt cả các đối tượng trong training data

Bước 3: Sắp xếp khoảng cách theo thứ tự tăng dần và xác định K đối tượng gần

nhất so với đổi tượng cần phân lớp

Bước 4: Lấy tắt cả các lớp của K láng giềng gắn nhất

Bước 5: Dựa vào phân lớp của K để xác định lớp cho đối tượng cần phần lớp,

Trang 35

Gia sử bãitoán đặt ra: chúng ta mới quen biết một người bạn, tuy nhiên chúng ta

đều là fan của Manchester United, vậy nên chúng ta cẳn biết người bạn này có phải fan

cửa kin địch Livepool hay không Qua hồi gian tìm hiễu, ta đã thu thập được một số cdữ liệu và biểu hiện dưới dạng như hình vẽ trên

Ta để đăng nhìn thổ

y có 2 loại: hình mẫu xanh biểu diễn cho những người là lan ccủa Liverpool, tam giác màu đỏ biểu diễn cho những người không phải là fần Liverpool, ình tròn mẫu xanh lá là người bạn mình muốn biết có phải fan Liverpool hay không, những người bạn

"ĐỂ xác định người bạn mã bạn thân nhất với, phương pháp đơn giản nhất là tìm điểm gin chấm xanh trong hình và xác định xem nó thuộc vào class nào, có phải là hình vuông hay tam giác Với hình trên, chúng ta có thể đễ đăng nhận thấy điểm gin chim màu đó

Phương pháp trên đang gặp vấn đ vỉ xung quanh chẳm xanh xuất hiện quá nhiều

hình vuông màu xanh, điều này làm cho việc xác định điểm gần nhắt là không kha thi

3

Trang 36

thấy rằng cổ hai hình tam giác và một hình vuông xanh có khoảng cách gằn nhất với

“chấm xanh Vì vậy, chắm xanh sẽ được phân vào lớp tam giác Nếu lầy K=f, ta sẽ có cả

năm hình vuông xanh và bai hình tam giác, và lần này chắm xanh sẽ được phân vào lớp

"hình vuông xanh Trong trường hop lly K=4, ta thấy có hai hình vuông và hai hình tam cách của các

th gần nhất với điểm đang xét

Việc chọn số K lẻ sẽ giúp tránh được trường hợp xảy ra bắt định khi phân loại

"Nếu ta chọn K là số chấn, khi có trưởng hợp:

~ _ Đễ dàng cải đặt và sử dụng thuật toán

~ _ Đễ dàng đự đoán kết quả của dữ liệu mới

Trang 37

3

Random Forest là một thuật toán học máy (machine learning) duge str dung cho “hải qui về Random Forest việc phân loại, dự đoán, và phân tích dữ liệu Nó được phát triển bởi Leo Breiman và Adele Cutler vio nim 2001 [24],

“Thuật toán Random Forest dựa trên việc kết hợp các cây quyết định (decision

tres) de lap với nhau để tạo m một mô hình dự đoán mạnh mẽ hơn, Các cây quyết

định được tạo ra bằng cách chọn một tập con ngẫu nhiên các đặc trưng (features) từ tập

diệu và su đô xây đưng cây quyết định rên tập con đó, Sau đổ, kết quả dự đoần của các cây quyết định được kết hợp ại để đưa ra kết quả cuối cùng [24] Với việc kết hợp các cây quyết định, thuật toán Random Forest có thể giảm thiểu .overfiting (quá khớp) và tăng độ chính xác của mô hình Nó cũng cho phép các dữ liệu

"bị thiểu (missing data) và nhiễu (noise) mà không ảnh hướng đến độ chính xác của mô hình

Random Eorest là một trong những thuật toán phổ biến nhất trong học máy và

_ tải chính, marketing [25, 26] được sử dụng rộng rãi trong nhiều lĩnh vực như y

4.2.2, Cie baie lim vige cia Random Forest:

“Thuậttoán Random Forest Ii một mô hình học mấy được xây dựng dựa rên việc kết hợp các cây quyết định độc lập với nhau để tạo ra một mô hình dự đoán mạnh me

“Các bước cơ bản của thuật toán Random Forest bao gồm [25]:

Bước Ì: Chọn ngẫu nhiên một tập con dữ liệ từtập dữ liệu huần luyện

Bước 2: Xây dựng một cây quyết định trên tập con dữ liệu được chọn, bằng cách

lập lại các bước sau đây:

= Chọn ngẫu nhiên một tập con các đặc trưng (features) tử tập các đặc trrng,

ban đầu,

“Tìm đặc trưng tốt nhất để chia tap con dữ iệu thành hai phần sao cho các điểm dữ liệu trong cùng một phần có giá tị đích giống nhau nhất có thể

35

Trang 38

.được chọn Trong trường hợp dự đoán giá trị liên tụ, kết quả dự đoán cuối cùng sẽ là giá trì trung bình của các kết quả dự đoán của các cây quyết định Bước 5: Dánh giá độ chính xác của mô hình Random Eoresttrê tập dữ liệu kiểm tra để đánh giá khả năng tổng quất hỏa của mô hình

“Tổng quan về các bước hoạt động của thuật toán Random Eorest này giúp tạo ra

một mô hình dự đoán mạnh mẽ và linh hoạt, và được sử dụng rộng rãi trong nhiều lĩnh

vực của khoa học dữ liệu

4.2.3 Un va nhurge diém của Random Forest:

Kha năng xử lý nhiều và dữ liệu thiểu: Random Forest có khả năng,

xử lý nhiễu và dỡ liệu thiểu một cách hiệu quả Khả năng xác định đặc trưng quan trọng: Random Eorest có khả

Trang 39

~_ Chỉ phí tính toán: Vi Random Eorest xây dụng nhiều cây quyết định độc lập, nó có chỉ phí tính toán cao hơn so với một số thuật toán khác

~_ Đễ bị overiting nếu số lượng cây quá lớn hoặc tập dữ liệu quả

nhỏ: Mặc đủ Random Forest khỏ bị overfitting hơn so với các thuật

oán khác, nhưng vẫn cổ thể xây ra trường hợp overfiting nếu số lượng cây quá lớn hoặc tập dữ iệu quá nhỏ,

“Tôm lại, Random Forestlä một thuật toán học mấy mạnh mẽ và lĩnh hoạt, có khả năng xử lý nhiễu tình huồng dữ liệu phức tạp

3.8 Mô hình Support Vector Machine (SVM):

3⁄31 Khái quất về SVA

“Thuật toán SVM (Support Vector Machine) là một thuật toán học máy giảm sát cđược sử dụng cho các tác vụ phân loại và hồi quy SVM hoạt động bằng cách xây dựng một siêu mặt phẳng để phân tách bai lớp dữ iệu khác nhan [1] Đầu tiên, SVM chuyển đổi dữ li 1 vào không gian đặc trưng cao hơn, gọi là khong gian die tng tang ewig (enhanced feature space), noi né c6 thé để đàng phân

tách các lớp Sau đó, SVM tìm kiếm siêu mặt phẳng tốt nhất đẻ phân tách các lớp Siêu

mặt phẳng tốt nhất là mặt phẳng có khoảng cách lớn nhất đn các điểm dữ iệu gằn nhất ccủa bai lớp, được gọi là các vector hỗ trợ (support vector) [27]

SVM là một thuật toán mạnh mẽ và hiệu quả trong việc xử lý các tập dữ iệu lớn

vì nó chỉ yêu cầu một tập nhỏ các vector hỗ trợ để xác định siêu mặt phẳng tốt nhất

“Thuật toán SVM cũng có thể được mỡ rộng để xử lý các tác vụ phân loại đa lớp [27] 3.42, Cc bude lam việc của SVM:

“Thuật toán SVM bao gồm các bước sa [2]

Bước I: Chuẩn bị dữ liệu: Thu thập và chuỗn bị dữ liệu dễ huần luyện mô hình SVM

Ngày đăng: 30/10/2024, 10:55

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w