Trong việc chẩn đoán bệnh ĐTĐ, các ch số xét nghiệm là các yếu tố rất quan trọng để có thể xác định chính xác tình trạng mắc bệnh c ng như mức đ nguy cơ mắc bệnh ĐTĐ trong tương lai, cùn
GIỚI THIỆU
Tổng quan
Ngày nay, sự thay đổi nhanh chóng của công nghệ trong y tế đã kéo theo sự thay đổi mô hình thực hành của các bác sĩ trong việc chẩn đoán và điều trị bệnh Việc ứng dụng công nghệ trong y tế mang lại cu c sống tốt hơn cho con người ở rất nhiều khu vực trên thế giới c ng nhƣ đóng góp hàng t đô la cho các nền kinh tế tại nhiều quốc gia
Tuy nhiên để có thể áp dụng m t công nghệ, sản phẩm công nghệ nào đó vào thực ti n đòi hỏi rất nhiều trong việc nghiên cứu c ng nhƣ việc kết hợp giữa tri thức từ bác sĩ và các kĩ sƣ công nghệ Việc đánh giá công nghệ sẽ giúp bác sĩ có thể xác định công nghệ nào là thích hợp nhất để mang lại lợi ích cho bệnh nhân Để làm đƣợc điều này các bác sĩ cần thử nghiệm lâm sàng nghiêm ngặt hơn về việc chấp nhận các phát minh mới [1]
Trong những năm gần đây, trí tuệ nhân tạo (AI) đang đƣợc nghiên cứu, phát triển mạnh mẽ, đặc biệt AI có thể phù hợp với rất nhiều lĩnh vực trong xã h i, trong đó có y tế Nhận thấy điều này, các tập đoàn lớn về công nghệ ngày m t quan tâm hơn và đã đầu tƣ rất mạnh mẽ để xây dựng các sản phẩm hỗ trợ các tổ chức y tế c ng nhƣ cho c ng đồng dựa trên AI Trong đó phải kể đến các sản phẩm nổi bật sau:
IBM Watson: là m t chương trình ứng dụng gồm các kỹ thuật cao cấp về xử lý ngôn ngữ tự nhiên, tìm kiếm thông tin, di n đạt và lý giải tri thức, và học máy cho lĩnh vực trả lời các câu hỏi có phạm vi mở r ng [2] IBM Watson có thể tổng hợp và xử lý lƣợng lớn thông tin từ các nguồn khác nhau: Wikipedia, các bài báo, các báo cáo nghiên cứu, bằng sáng chế, ánh xạ các n i dung tổng hợp đƣợc theo từng lĩnh vực, sau đó IBM Watson đƣa ra câu trả lời dựa trên các bằng chứng đáng tin cậy cho các câu hỏi ngôn ngữ tự nhiên [3] Năm 2016, IBM Watson đã có thể tham chiếu chéo nhanh chóng 20 triệu hồ sơ ung thƣ và chẩn đoán chính xác tình trạng bệnh bạch cầu hiếm gặp ở bệnh nhân
Microsoft Healthcare Bot: là 1 dịch vụ cho phép các đối tác của Microsoft xây dựng và triển khai các ứng dụng y tế đƣợc hỗ trợ bởi AI Dữ liệu của người sử dụng sẽ được cá nhân hóa và người sử dụng có thể tương tác với hệ thống hỗ trợ y tế thông qua các trải nghiệm trò chuyện tự nhiên Dịch vụ sẽ sử dụng công nghệ trong xử lý ngôn ngữ tự nhiên c ng nhƣ trí tuệ nhân tạo để hiểu ý định người dùng và cung cấp các thông tin chính xác Các đối tác của Microsoft có thể xây dựng các kịch bản riêng và tích hợp với nhiều hệ thống thông tin, lĩnh vực khác nhau để có các sản phẩm phù hợp Để áp dụng AI vào lĩnh vực y tế, ta có thể lựa chọn m t trong hai hình thức hỗ trợ chính sau: hỗ trợ chẩn đoán và hỗ trợ điều trị Trong đó việc sử dụng mạng nơ-ron nhân tạo cho việc hỗ trợ chẩn đoán bệnh đã và đang đƣợc nghiên cứu và ứng dụng rất nhiều trong từng loại bệnh cụ thể Mạng nơ-ron nhân tạo cung cấp m t công cụ mạnh mẽ để giúp các bác sĩ phân tích, mô hình hóa các dữ liệu lâm sàng phức tạp trên m t loạt các lĩnh vực y tế Mục tiêu của hầu hết ứng dụng sử dụng mạng nơ-ron nhân tạo là phục vụ cho việc phân loại bệnh Trong nhiều nghiên cứu, dữ liệu đƣợc lấy từ kho dữ liệu UCI, và việc sử dụng các mô hình mạng nơ-ron lan truyền ngƣợc cho t lệ phân loại chính xác tới 99 cho việc phân loại bệnh viêm thận và 95 cho việc chẩn đoán bệnh tim [4]
Luận văn này đã nghiên cứu và ứng dụng mạng nơ-ron nhân tạo cho việc xây dựng hệ thống hỗ trợ chẩn đoán bệnh đái tháo đường (ĐTĐ) Bệnh ĐTĐ là bệnh mạn tính, phổ biến, d mắc và điều trị tốn kém Nó ảnh hưởng đến hàng triệu người, cả nam lẫn nữ, ở mọi lứa tuổi và mọi trình đ văn hóa Bệnh ĐTĐ nếu phát hiện mu n hoặc kiểm soát kém sẽ gây ra các biến chứng cấp và mạn tính Trong việc chẩn đoán bệnh ĐTĐ, các ch số xét nghiệm là các yếu tố rất quan trọng để có thể xác định chính xác tình trạng mắc bệnh c ng nhƣ mức đ nguy cơ mắc bệnh ĐTĐ trong tương lai, cùng với đó nghiên cứu đã đưa ra mô hình đề xuất sử dụng mạng nơ-ron nhân tạo kết hợp với cơ sở tri thức sẽ giúp đƣa tri thức, khả năng suy di n của chuyên gia vào mô hình, nhờ vậy đ chính xác trong việc chẩn đoán tình trạng mắc bệnh đái tháo đường cho người sử dụng sẽ tăng lên Cuối cùng mô hình mạng nơ-ron sẽ đƣợc sử dụng để tích hợp cho ứng dụng hỗ trợ chẩn đoán bệnh ĐTĐ.
Phát biểu bài toán
Luận văn nghiên cứu m t mô hình mạng nơ-ron dựa trên hệ cơ sở tri thức phù hợp cho việc chẩn đoán bệnh ĐTĐ Bằng việc phân tích tập dữ liệu, nghiên cứu này sẽ đưa ra các đánh giá, mô tả chi tiết về hướng xử lý dữ liệu đầu vào c ng nhƣ phân chia tập dữ liệu cho việc học Sau đó ứng dụng mô hình này cho việc xây dựng ứng dụng hỗ trợ chẩn đoán bệnh đái tháo đường dựa trên các thông tin đầu vào.
Định hướng giải quyết bài toán
Bước 1: Phân tích thu c tính, giá trị của b dữ liệu về bệnh ĐTĐ của khu vực Pima Indian (thu c Arizona – Mỹ) [5]
Bước 2: Phân tích cơ sở tri thức dựa trên sự tư vấn của các chuyên gia để đƣa ra mô hình cơ bản cho mạng nơ-ron
Bước 3: Xây dựng mô hình mạng nơ-ron truyền thẳng sử dụng giải thuật lan truyền ngƣợc sai số sử dụng dữ liệu nêu trên cho quá trình học và kiểm tra để đánh giá hiệu quả c ng nhƣ tính chính xác của mô hình cho việc chẩn đoán bệnh đái tháo đường
Bước 4: Xây dựng ứng dụng hỗ trợ chẩn đoán bệnh đái tháo đường dựa trên kết quả học và hệ cơ sở tri thức có sử dụng tƣ vấn của chuyên gia c ng nhƣ cập nhật b dữ liệu m t cách liên tục.
Mục tiêu của luận văn
Luận văn đề xuất xây dựng hệ thống hỗ trợ chẩn đoán bệnh sử dụng mạng nơ-ron kết hợp với cơ sở tri thức để hỗ trợ chẩn đoán bệnh đái tháo đường
Đề xuất sử dụng mạng nơ-ron lan truyền ngƣợc kết hợp với cơ sở tri thức
Xây dựng hệ thống hỗ trợ chẩn đoán nguy cơ mắc bệnh ĐTĐ, cho phép chuyên gia cập nhật tri thức
Kết quả đã thực nghiệm trên b dữ liệu về bệnh ĐTĐ của khu vực Pima Indian (nguồn: UCI [5]) có vận dụng các tƣ vấn từ chuyên gia về các tri thức phù hợp với b dữ liệu cho kết quả đạt đƣợc đ chính xác 94.77% Trong mô hình mạng nơ-ron đề xuất, việc xác định mô hình mạng sử dụng các tri thức của chuyên gia, vì thế sẽ có đ chính xác cao hơn với mạng nơ-ron thông thường
Sau đó, kết quả của nghiên cứu đƣợc tích hợp để xây dựng ứng dụng có giao diện tương tác trợ giúp bác sĩ và các nhân viên y tế chẩn đoán tình trạng bệnh ĐTĐ chính xác hơn
1.5 Nội dung của luận văn
Luận văn bao gồm 5 chương:
Chương 1: Chương giới thiệu trình bày lý do lựa chọn đề tài, bài toán cần giải quyết c ng như định hướng và mục tiêu của luận văn
Chương 2: Chương cơ sở lý thuyết trình bày n i dung lý thuyết về mạng nơ-ron c ng nhƣ thuật toán lan truyền ngƣợc đƣợc ứng dụng để giải quyết bài toán
Chương 3: Chương mô hình đề xuất mô tả chi tiết về mô hình của hệ thống, bao gồm việc phân tích dữ liệu, cách thức xác định các thành phần c ng nhƣ mô hình mạng nơ-ron đƣợc áp dụng trong ứng dụng hỗ trợ chẩn đoán bệnh
Chương 4: Chương thực nghiệm, đánh giá mô tả kết quả của mô hình đoán bệnh ĐTĐ và so sánh với các mô hình khác Ứng dụng mô hình với b dữ liệu 60 bệnh nhân ĐTĐ của trung tâm N i tiết – Đái tháo đường, bệnh viện Bạch Mai Hà N i
Chương 5: Chương kết luận đánh giá n i dung nghiên cứu và kết quả đạt được của luận văn, đồng thời trình bày các hướng phát triển, cải thiện hệ thống c ng như định hướng nghiên cứu trong tương lai.
N i dung của luận văn
2.1 Hệ cơ sở tri thức – Hệ chuyên gia
Hệ cơ sở tri thức là m t chương trình máy tính được thiết kế để mô hình hóa khả năng giải quyết vấn đề của chuyên gia con người Hệ cơ sở tri thức cho phép mô hình hóa các tri thức của chuyên gia, dùng tri thức này để giải quyết các vấn đề phức tạp của cùng lĩnh vực
Hệ chuyên gia là hệ cơ sở tri thức áp dụng cho m t lĩnh vực cụ thể Hệ chuyên gia thường có các thành phần sau: cơ sở tri thức, mô tơ suy di n và hệ thống giao tiếp với người sử dụng Người sử dụng sẽ cung cấp sự kiện là những gì đã biết, có thật hoặc có ích cho hệ chuyên gia và sẽ nhận đƣợc câu trả lời là những lời khuyên hay những gợi ý đúng đắn [6]
2.2.2 Các thành phần cơ bản trong hệ cơ sở tri thức
Hình dưới đây thể hiện mô hình ứng dụng hệ cơ sở tri thức
Hình 1: Mô hình ứng dụng hệ cơ sở tri thức [7]
CƠ SỞ LÝ THUYẾT
Hệ cơ sở tri thức – Hệ chuyên gia
Hệ cơ sở tri thức là m t chương trình máy tính được thiết kế để mô hình hóa khả năng giải quyết vấn đề của chuyên gia con người Hệ cơ sở tri thức cho phép mô hình hóa các tri thức của chuyên gia, dùng tri thức này để giải quyết các vấn đề phức tạp của cùng lĩnh vực
Hệ chuyên gia là hệ cơ sở tri thức áp dụng cho m t lĩnh vực cụ thể Hệ chuyên gia thường có các thành phần sau: cơ sở tri thức, mô tơ suy di n và hệ thống giao tiếp với người sử dụng Người sử dụng sẽ cung cấp sự kiện là những gì đã biết, có thật hoặc có ích cho hệ chuyên gia và sẽ nhận đƣợc câu trả lời là những lời khuyên hay những gợi ý đúng đắn [6]
2.2.2 Các thành phần cơ bản trong hệ cơ sở tri thức
Hình dưới đây thể hiện mô hình ứng dụng hệ cơ sở tri thức
Hình 1: Mô hình ứng dụng hệ cơ sở tri thức [7]
Knowledge Engineer (b tiếp nhận tri thức): làm nhiệm vụ thu nhận tri thức từ con người/chuyên gia thông qua giao diện để đưa vào cơ sở tri thức
Database Management System: b quản lý cơ sở dữ liệu
Database: Cơ sở dữ liệu lưu tri thức được biểu di n thành các luật và sự kiện
Knowledge Interference Engine (máy suy di n): Sử dụng các luật, sự kiện và các kĩ thuật suy di n (suy di n tiến, suy di n lùi, ) để rút ra kết luật về vấn đề đang giải quyết
Interference: giao diện người sử dụng, cho phép nhận dữ liệu từ người sử dụng và hiển thị n i dung kết luận từ b máy suy di n
2.2.3 Biểu diễn sự iện – luật trong hệ cơ sở tri thức
Trong mô hình hệ cơ sở tri thức, các dữ liệu tri thức bao gồm sự kiện và luật đƣợc các chuyên gia đƣa vào hệ thống thông qua tính năng quản lý cơ sở tri thức Các dữ liệu này sẽ đƣợc b máy suy di n sử dụng để trả lời các câu hỏi của người sử dụng
Khi đó các thông tin này đƣợc biểu di n theo dạng nhƣ sau:
Mã sự kiện Loại sự kiện Mô tả x y z
Sự kiện [x] thuộc loại sự kiện [y] có nội dung [z]
+ Mã sự kiện là mã số của sự kiện để phân biệt các sự kiện khác nhau + Loại sự kiện: là mã số phân loại mà thông tin sự kiện đó biểu di n ( các loại sự kiện đã đƣợc thể hiện ở trên)
+ Mô tả: thông tin mà sự kiện đó biểu di n
Việc biểu di n sự kiện trong hệ cơ sở tri thức có thể đƣợc thể hiện nhƣ bảng ví dụ dưới đây:
Bảng 1: Ví dụ biểu di n sự kiện trong hệ cơ sở tri thức
Sự iện Loại sự iện Mô tả
4 3 Trong gia đình có người mắc bệnh ĐTĐ
6 7 Từng mang thai trên 3 lần
7 8 Bị mắc bệnh đái tháo đường
8 8 Không bị mắc bệnh đái tháo đường
Luật suy di n là hệ thống các ràng bu c giữa các sự kiện đã đƣợc biểu di n trong hệ thống với nhau Từ luật suy di n thể hiện quan hệ giữa các sự kiện, mô tả qua
1 sự kiện nào đó đƣợc sinh ra từ tập hợp các sự kiện khác Trong hệ thống, luật suy di n đƣợc biển di n nhƣ sau:
Mã luật Điều kiện Kết luận Độ tin cậy (F) x ( y%
Nếu (sự kiện( )^ sự kiện( ) ^ sự kiện( )) thì ((sự kiện( )) với độ tin cậy (y%)
Mã luật: Mã số của luật để phân biệt các luật khác nhau
Điều kiện: Tập hợp mã số các sự kiện bắt bu c để dẫn tới sự kiện kết luận
Kết luật: Sự kiện đƣợc suy ra cuối cùng từ tập hợp các sự kiện ràng bu c đó
Đ tin cậy: đ chính xác của luật suy di n đƣợc đánh giá từ các chuyên gia
2.2.4 Khoảng cách giữa các sự iện
Dựa trên các sự kiện và tập luật, nghiên cứu có thể thể hiện sự liên kết giữa các sự kiện bằng phương pháp sử dụng đồ thị Fact Precedence Graph (FPG), là đồ thị thể hiện mối liên quan giữa sự kiện này với sự kiện khác
Giả sử với tập luật nhƣ sau:
Khi đó đồ thị FPG sẽ đƣợc xây dựng nhƣ hình sau:
Hình 2: Đồ thị Fact Precedence Graph (FPG) [7]
Khởi tạo khoảng cách giữa các sự kiện theo điều kiện nhƣ sau: Với mỗi luật ( , khoảng cách giữa và p sẽ là 1 foreach rule ←R
Từ đồ thị có thể đánh giá đƣợc khoảng cách giữa m t sự kiện hiện tại và sự kiện cuối cùng mong muốn đạt đƣợc Ví dụ khoảng cách từ → S là 3 Để tính đƣợc khoảng cách giữa tất cả các sự kiện của đồ thị, luận văn đề xuất sử dụng giải thuật Floyd
Giải thuật đƣợc thực hiện nhƣ sau: foreach ←( { foreach ←( { foreach ←( { if kc( ) > kc( ) + kc( ) { kc( ) = kc( ) + kc( ) }
Mạng nơ-ron nhân tạo
Mạng nơ-ron nhân tạo, Artificial Neural Network (ANN) gọi tắt là mạng nơ-ron, là m t mô hình toán học hay mô hình tính toán đƣợc xây dựng dựa trên các mạng nơ-ron sinh học [8] Nó đƣợc tạo lên từ m t số lƣợng lớn các phần tử (gọi là phần tử xử lý hay nơ-ron) kết nối với nhau thông qua các liên kết (gọi là trọng số liên kết) làm việc nhƣ m t thể thống nhất để giải quyết m t vấn đề cụ thể Mạng nơ-ron có khả năng học (learn), nhớ lại (recall), và khái quát hóa
(generalize) từ các dữ liệu học – bằng cách gán và điều ch nh (thích nghi) các giá trị trọng số (mức đ quan trọng) của các liên kết giữa các nơ-ron [9]
2.3.2 Các thành phần cơ bản a Đơn vị xử lý Đơn vị xử lý trong mạng nơ-ron còn đƣợc gọi là m t nơ-ron hay m t nút (node), thực hiện m t công việc rất đơn giản: nó nhận tín hiệu vào từ các đơn vị phía trước hay m t nguồn bên ngoài và sử dụng chúng để tính tín hiệu ra sẽ được lan truyền sang các đơn vị khác Đơn vị xử lý trong mạng nơ-ron đƣợc thể hiện trong hình sau:
Hình 3: Đơn vị xử lý trong mạng nơ-ron Trong đó:
w ji : các trọng số tương ứng với các đầu vào
a j : đầu vào mạng (net-input)
z j : đầu ra của nơ-ron
g(x): hàm chuyển (hàm kích hoạt) b Liên ết nơ-ron
Liên kết nơ-ron là m t thành phần của mạng nơ-ron nhân tạo để liên kết giữa các nơ-ron, nó nối đầu ra của nơ-ron lớp này với đầu vào của m t nơ-ron trong lớp khác Đặc trƣng của thành phần liên kết là m t trọng số mà mỗi tín hiệu đi qua đều đƣợc nhân với trọng số này Các trọng số liên kết chính là các tham số tự do cơ bản của mạng neuron, có thể thay đổi đƣợc nhằm thích nghi với môi trường xung quanh
Có thể xem các trọng số là phương tiện để lưu trữ thông tin dài hạn trong mạng nơ-ron và nhiệm vụ của quá trình huấn luyện của mạng là cập nhật các trọng số khi có thêm thông tin về mẫu học Hay nói m t cách khác, các trọng số đều đƣợc điều ch nh sao cho dáng điệu vào ra của mạng sẽ mô phỏng hoàn toàn phù hợp với môi trường đang xem xét c Hàm ết hợp
Mỗi m t đơn vị trong m t mạng kết hợp các giá trị đƣa vào nó thông qua các liên kết với các đơn vị khác, sinh ra m t giá trị gọi là net input Hàm thực hiện nhiệm vụ này gọi là hàm kết hợp (combination function), đƣợc định nghĩa bởi m t luật lan truyền cụ thể Trong phần lớn các mạng nơ-ron, giả sử rằng mỗi m t đơn vị cung cấp m t b c ng nhƣ là đầu vào cho đơn vị mà nó có liên kết, khi đó tổng đầu vào đơn vị j đơn giản ch là tổng trọng số của các đầu ra riêng lẻ từ các đơn vị kết nối c ng thêm ngƣỡng hay đ lệch (bias) b j :
Trường hợp wji > 0, nơ-ron được coi là đang ở trong trạng thái kích thích Tương tự, nếu như w ji < 0, nơ-ron ở trạng thái kiềm chế Các đơn vị với luật lan truyền nhƣ trên đƣợc gọi là các sigma units
Trong m t vài trường hợp người ta c ng có thể sử dụng các luật lan truyền phức tạp hơn M t trong số đó là luật sigma-pi, có dạng nhƣ sau:
Rất nhiều hàm kết hợp sử dụng m t "đ lệch" hay "ngƣỡng" để tính net input tới đơn vị Đối với m t đơn vị đầu ra tuyến tính, thông thường, b j được chọn là hằng số và trong bài toán xấp x đa thức b j = 1 d Hàm ích hoạt
Phần lớn các đơn vị trong mạng nơ-ron chuyển net input bằng cách sử dụng m t hàm vô hướng (scalar-to-scalar function) gọi là hàm kích hoạt, kết quả của hàm này là m t giá trị gọi là mức đ kích hoạt của đơn vị (unit's activation) Loại trừ khả năng đơn vị đó thu c lớp ra, giá trị kích hoạt đƣợc đƣa vào m t hay nhiều đơn vị khác Các hàm kích hoạt thường bị ép vào m t khoảng giá trị xác định, do đó thường được gọi là các hàm bẹp (squashing) Các hàm kích hoạt hay đƣợc sử dụng là:
Bảng 2: M t số hàm kích hoạt thông dụng
Số thứ tự Tên hàm Công thức tính
12 Compet a = 1 với Nơron có n lớn nhất a = 0 với các Nơron còn lại
Hàm sigmoid đặc biệt thuận lợi khi sử dụng cho các mạng đƣợc huấn luyện bởi thuật toán lan truyền ngƣợc (back-propagation), bởi vì nó d lấy đạo hàm, do đó có thể giảm đáng kể tính toán trong quá trình huấn luyện Hàm này đƣợc ứng dụng cho các chương trình ứng dụng mà các đầu ra mong muốn rơi vào khoảng [0,1]
2.3.3 Các mô hình mạng thường gặp
Các lớp trong mạng nơ-ron đƣợc chia thành 3 loại: lớp đầu vào (input layer), lớp ẩn (hidden layer), và lớp đầu ra (output layer) Các mô hình mạng đƣợc thể hiện bởi số lớp, số node trên mỗi lớp, và sự liên kết giữa các lớp Các mạng về tổng thể đƣợc chia thành 2 loại: mạng truyền thẳng (Feed forward neural network) và mạng hồi quy (Recurrent neural network)
Trong mạng nơ-ron truyền thẳng, dòng dữ liệu từ đơn vị đầu vào đến đơn vị đầu ra ch đƣợc truyền thẳng Việc xử lý dữ liệu có thể mở r ng ra nhiều lớp, nhƣng không có các liên kết phản hồi Nghĩa là, các liên kết mở r ng từ các đơn vị đầu ra tới các đơn vị đầu vào trong cùng m t lớp hay các lớp trước đó là không cho phép Mô hình mạng nơ-ron truyền thẳng được biểu di n như hình dưới đây:
Hình 4: Mạng nơ-ron truyền thẳng
Khác với mạng truyền thẳng, trong mạng hồi quy có chứa các liên kết ngƣợc giữa các node, vì thế các thu c tính đ ng của mạng mới quan trọng Trong m t số trường hợp, các giá trị kích hoạt của các đơn vị trải qua quá trình nới lỏng (tăng giảm số đơn vị và thay đổi các liên kết) cho đến khi mạng đạt đến m t trạng thái ổn định và các giá trị kích hoạt không thay đổi nữa Mô hình mạng nơ- ron hồi quy được biểu di n như hình dưới đây:
Hình 5: Mạng nơ-ron hồi quy
2.3.4 Thuật toán lan truyền ngƣợc a Mạng truyền thẳng nhiều lớp (Multi Layer Perceptron)
Mạng truyền thẳng nhiều lớp bao gồm m t lớp đầu vào, m t lớp đầu ra và m t hoặc nhiều lớp ẩn Các nơ-ron đầu vào thực chất không phải các nơ-ron theo đúng nghĩa, bởi lẽ chúng không thực hiện bất kỳ m t tính toán nào trên dữ liệu vào, đơn giản nó ch tiếp nhận các dữ liệu vào và chuyển cho các lớp kế tiếp Trong mạng truyền thẳng nhiều lớp (MLP) có thể hiểu lớp đầu vào thể hiện các thu c tính của dữ liệu đầu vào, mỗi m t node tương đương với m t thu c tính của dữ liệu đầu vào Các nơ-ron ở lớp ẩn và lớp ra mới thực sự thực hiện các tính toán, kết quả đƣợc định dạng bởi hàm đầu ra (hàm chuyển) Cụm từ “truyền thẳng” (feed forward) liên quan đến m t thực tế là tất cả các nơ-ron ch có thể được kết nối với nhau theo m t hướng tới m t hay nhiều các nơ-ron khác trong lớp kế tiếp (loại trừ các nơ-ron ở lớp ra) Mô hình mạng truyền thẳng nhiều lớp được biểu di n như hình dưới đây:
Hình 6: Mạng lan truyền thẳng nhiều lớp
Trong mạng, mỗi liên kết gắn với m t trọng số, trọng số này đƣợc thêm vào trong quá trình tín hiệu đi qua liên kết đó Mỗi nơ-ron tính toán mức kích hoạt của chúng bằng cách c ng tổng các đầu vào và đƣa ra hàm chuyển M t khi đầu ra của tất cả các nơ-ron trong m t lớp mạng cụ thể đã thực hiện xong tính toán thì lớp kế tiếp có thể bắt đầu thực hiện tính toán của mình bởi vì đầu ra của lớp hiện tại tạo ra đầu vào của lớp kế tiếp Khi tất cả các nơ-ron đã thực hiện tính toán thì kết quả đƣợc trả lại bởi các nơ-ron đầu ra
ĐỀ XUẤT MÔ HÌNH HỆ THỐNG HỖ TRỢ CHẨN ĐOÁN BỆNH SỬ DỤNG MẠNG NEURAL
Mô hình ứng dụng hỗ trợ chẩn đoán bệnh đái tháo đường
Kiến trúc mô hình đề xuất cho ứng dụng hỗ trợ chẩn đoán bệnh ĐTĐ đƣợc biểu di n như hình dưới đây:
Hình 10: Kiến trúc hệ thống mô hình đề xuất Trong đó, kiến trúc hệ thống sẽ bao gồm các thành phần sau:
Cơ sở dữ liệu tri thức: bao gồm sự kiện và luật suy di n đƣợc biểu di n trong cơ sở dữ liệu CSDLTT đƣợc sử dụng để xác định các thu c tính đầu vào c ng nhƣ các tham số trong mạng nơ-ron bao gồm: số lớp ẩn, số node trong mỗi lớp ẩn
Mạng nơ-ron: mô hình mạng nơ-ron truyền thẳng sử dụng giải thuật lan truyền ngƣợc, trong đó các giá trị đầu vào và các tham số của mô hình đƣợc quyết định bởi cơ sở dữ liệu tri thức (CSDLTT)
Dữ liệu học: b dữ liệu đƣợc sử dụng cho quá trình học và đánh giá đ chính xác Dữ liệu học cần được xử lý trước khi đưa vào quá trình học của mô hình mạng nơ-ron
Người dùng: người sử dụng tính năng chẩn đoán bệnh của hệ thống thông qua giao diện người dùng
Chuyên gia: người quản lý tri thức bằng các luật và sự kiện được đưa vào CSDLTT
B quản lý công việc định kì: quản lý thời gian xây dựng lại mô hình và tiến hành huấn luyện lại mô hình mạng nơ-ron để phù hợp với CSDLTT mới.
Đầu vào và đầu ra
Trong CSDLTT, dữ liệu đầu vào sẽ bao gồm các sự kiện và luật suy di n sẽ đƣợc quản lý bởi chuyên gia Dữ liệu tri thức sẽ đƣợc phân tích, xây dựng cây AND – OR và đƣa ra các tham số để xây dựng cho mô hình mạng nơ-ron bao gồm: Tổng số lớp ẩn, số Node trong từng lớp ẩn
Sơ đồ quá trình học của mạng nơ-ron dựa trên CSDLTT đƣợc biểu di n bằng sơ đồ hoạt đ ng sau:
Hình 11: Sơ đồ hoạt đ ng quá trình học của mạng nơ-ron kết hợp CSDLTT
Dựa trên sơ hồ hoạt đ ng trên ta có thể nhận thấy các hoạt đ ng chính sau:
Người sử dụng là chuyên gia sẽ quản lý CSDLTT thông qua giao diện người dùng, dữ liệu sẽ được lưu trong cơ sở dữ liệu (CSDL) bao gồm các sự kiện và luật suy di n
Các sự kiện và luật suy di n trong CSDLTT sẽ đƣợc sử dụng để lựa chọn thu c tính đầu vào cho mô hình mạng nơ-ron thông qua kết quả của quá trình tính khoảng cách của các sự kiện, đồng thời kết quả của quá trình xây dựng cây AND – OR sẽ đƣợc sử dụng để xác định các tham số trong mô hình mạng nơ-ron bao gồm số lớp ẩn và số node trong mỗi lớp ẩn
B dữ liệu UCI sẽ được phân tích và được xử lý Các bước xử lý dữ liệu bao gồm: xử lý dữ liệu ngoại lai và tạo thu c tính mới Sau đó dữ liệu sẽ đƣợc chuẩn hóa về khoảng [0,1]
B dữ liệu đã đƣợc chuẩn hóa sẽ đƣợc chia làm dữ liệu học và dữ liệu test
Trong quá trình học, dữ liệu học sẽ đƣợc đƣa vào mô hình mạng nơ-ron để thực hiện việc huấn luyện mạng và tính toán trọng số cuối cùng
B dữ liệu test sẽ đƣợc sử dụng cho quá trình đánh giá mô hình thông qua tính toán đ chính xác của mạng sau khi đƣợc huấn luyện trên tập dữ liệu test
Nếu mô hình đạt kết quả không tốt, hệ thống sẽ tiếp tục đƣợc chuyên gia cập nhật tri thức và mô hình mới sẽ đƣợc tự đ ng hình thành và quá trình học và đánh giá sẽ đƣợc lặp lại
Nếu mô hình đạt kết quả tốt sẽ đƣợc sử dụng để tích hợp vào sản phẩm ứng dụng hỗ trợ chẩn đoán bệnh đái tháo đường
Từ các quá trình trên có thể nhận thấy mô hình mạng nơ-ron kết hợp CSDLTT có khả năng tự xây dựng mô hình mạng nơ-ron và tự cải thiện kết quả dựa trên chính các tri thức của chuyên gia, vì thế mô hình sẽ có tính linh hoạt để áp dụng cho nhiều lĩnh vực c ng nhƣ linh hoạt trong việc nâng cấp và cải thiện hiệu năng.
Mô tả dữ liệu học
Dữ liệu sử dụng cho nghiên cứu đƣợc bao gồm 768 bản ghi dữ liệu bệnh nhân bao gồm 3 loại dữ liệu là: kết quả kiểm tra y tế thực tế, thông tin lịch sử từ bệnh nhân và thông tin mắc bệnh của người thân Danh sách các thu c tính được mô tả trong bảng dưới đây:
Bảng 3: Mô tả thu c tính trong tập dữ liệu
Thuộc tính Kiểu dữ liệu Mô tả Tỉ lệ thiếu dữ liệu (%)
Pregnancies Number Số lần mang thai (bao gồm cả những lần bị sảy thai)
Nồng đ Glucose trong máu sau 2 giờ với kiểm tra dung nạp Glucose
Blood Pressure Number Huyết áp tâm trương 0
Skin Thickness Number Ch số nếp véo da 0
Insulin Number Đo nồng đ Insulin 2 giờ sau ăn
BMI Number Ch số BMI 0
Function Number Đánh giá mức đ tiền sử đái tháo đường của gia đình
Age Number Tuổi của bệnh nhân 0
Kết luận chẩn đoán bệnh:
+ 0: bệnh nhân không mắc bệnh đái tháo đường
+ 1: bệnh nhân mắc bệnh đái tháo đường
Khoảng giá trị các thu c tính của dữ liệu đƣợc thể hiện trong biểu đồ histogram dưới đây:
Hình 12: Biểu đồ histogram các thu c tính của dữ liệu
Xử lý dữ liệu
Trong quá trình xử lý dữ liệu, luận văn sẽ trình bày các bước thường được áp dụng để chuẩn hóa dữ liệu thô trong b dữ liệu là làm sạch và quy chuẩn dữ liệu
3.4.1 Xử lý dữ liệu ngoại lai
Dữ liệu ngoại lai thông thường là những thông tin dữ liệu không chính xác về mặt hình thức: thiếu trường dữ liệu, sai kiểu dữ liệu, dữ liệu không đúng về mặt ý nghĩa, Trong b dữ liệu không có bản ghi có dữ liệu thiếu, tất cả các thu c tính đều có dữ liệu Tuy nhiên trong đó vẫn có những dữ liệu không chính xác về mặt ngữ nghĩa:
Dữ liệu BMI có giá trị bằng 0
Dữ liệu Glucose có giá trị bằng 0
Dữ liệu Blood Pressure có giá trị bằng 0
Dữ liện Skin Thickness có giá trị bằng 0
Số lƣợng các bản ghi đƣợc đánh giá là sai về mặt ngữ nghĩa đƣợc thể hiện trong bảng dưới đây:
Bảng 4: Số lƣợng bản ghi sai về mặt ngữ nghĩa theo từng thu c tính
Thuộc tính Số lƣợng bản ghi
Skin Thickness 227 Để xử lý các dữ liệu này có thể lựa chọn các phương án là loại bỏ khỏi tập dữ liệu hoặc sử dụng giá trị giữa (median) thay cho các bản ghi có giá trị bằng 0 Nếu loại bỏ khỏi tập dữ liệu các giá bản ghi trên sẽ làm mất các bản ghi có dữ liệu quan trọng Vì thế với các trường dữ liệu không chính xác về mặt ngữ nghĩa, giá trị giữa sẽ đƣợc sử dụng để thay thế
Dữ liệu y tế bao gồm các dữ liệu chữ và số, vì thế các dữ liệu chữ cần đƣợc đƣa về các giá trị số bằng cách đƣa ra các quy ƣớc giá trị cho từng thu c tính Ví dụ thu c tính tuổi có giá trị trong khoảng [0, 81] Ngoài ra, vì mạng nơ-ron có miền giá trị của các hàm kích hoạt thông thường là m t khoảng giá trị nào đó: [0,1], [-1,1] vì thế cần tiến hành quy chuẩn các giá trị dữ liệu nằm trong khoảng đó Do đó, luận văn sẽ thực hiện việc quy chuẩn dữ liệu bằng cách đƣa các dữ liệu về khoảng [0,1] bằng phương pháp MinMaxScaling theo công thức sau:
Giá trị biên đ của m t số thu c tính đƣợc thể hiện ở bảng sau:
Bảng 5: Thu c tính và giá trị biên đ
Thuộc tính Khoảng giá trị
Cụ thể, với giá trị thu c tính được liệt kê ở bảng dưới đây:
Bảng 6: Mẫu dữ liệu đầu vào
Mô hình mạng nơ-ron kết hợp cơ sở tri thức
Bảng 7: Mẫu dữ liệu đầu vào đã chuẩn hóa
3.5 Mô hình mạng nơ-ron ết hợp cơ sở tri thức
3.5.1 Cơ sở tri thức Đái tháo đường, còn gọi là bệnh tiểu đường, là m t nhóm bệnh rối loạn chuyển hóa cacbohydrat, mỡ và protein khi hoóc môn insulin của tụy bị thiếu hay giảm tác đ ng trong cơ thể, biểu hiện bằng mức đường trong máu luôn cao; trong giai đoạn mới phát thường làm bệnh nhân đi tiểu nhiều, tiểu ban đêm và do đó làm khát nước [2] Trong các nghiên cứu về chẩn đoán bệnh ĐTĐ, bệnh ĐTĐ có thể xác định sớm dựa trên các yếu tố:
Dấu hiệu sinh tồn: tuổi, giới tính, cân nặng, chiều cao, huyết áp, nhịp tim
Các xét nghiệm lâm sàng nhƣ: ch số Insulin trong máu, ch số Glucose trong máu, tiền sử ĐTĐ trong gia đình
Các nghiên cứu đã xây dựng các mô hình chẩn đoán dựa trên các yếu tố nguy cơ bao gồm m t nhóm các yếu tố trên M t số yếu tố nguy cơ đã đƣợc sử dụng trong các cu c khảo sát chẩn đoán bệnh ĐTĐ tại Thái Lan đƣợc thể hiện ở bảng sau:
Bảng 8: M t số yếu tố nguy cơ sử dụng trong các cu c khảo sát chẩn đoán bệnh ĐTĐ tại Thái Lan [10]
Thuộc tính Yếu tố nguy cơ Điểm đánh giá nguy cơ mắc bệnh ĐTĐ
Tiền sử ĐTĐ của bố mẹ hoặc anh chị em ru t
Không có người bị mắc bệnh ĐTĐ 0
Có người bị mắc bệnh ĐTĐ 4
Khi đó, các mô hình chẩn đoán sẽ đƣợc xây dựng dựa trên các yếu tố nguy cơ này Dưới đây là m t số nghiên cứu ứng dụng các mô hình chẩn đoán được sử dụng cho việc khảo sát tại m t số khu vực khác nhau:
Bảng 9: M t số mô hình chẩn đoán bệnh đái tháo đường [11]
Thời gian, quốc gia thực hiện nghiên cứu Yếu tố nguy cơ đƣợc sử dụng AUROC
2005 – Germany Tuổi, dân t c, chu vi vòng eo, chiều cao, huyết áp, tiền sử bệnh gia đình, 0.80
Tuổi, giới tính, tiền sử mắc bệnh cao huyết áp, tiền sử hút thuốc lá, tần suất hoạt đ ng vật lý,
Tuổi, giới tính, tiền sử sử dụng thuốc corticosteroids, BMI, tiền sử gia đình, tiền sử hút thuốc lá,
Tuổi, BMI, chu vi vòng eo, ch số Glucose trong máu, chế đ ăn rau xanh hàng ngày,
Với dữ liệu đã đƣợc tiền xử lý nêu trong mục 3.4, các thu c tính của dữ liệu học sẽ bao gồm:
Bảng 10: Các thu c tính của dữ liệu học sau quá trình tiền xử lý dữ liệu
Số thứ tự Thuộc tính
Các tri thức bao gồm luật và sự kiện trong CSDLTT đƣợc xây dựng từ sự hỗ trợ của bác sĩ Phạm Thị Hồng Nhung, trung tâm N i tiết – Đái tháo đường, bệnh viện Bạch Mai Hà N i, dựa trên các nghiên cứu về các mô hình chẩn đoán bệnh đái tháo đường Các sự kiện trong CSDLTT sẽ có mức điểm đánh giá nguy cơ mắc bệnh ĐTĐ M t số sự kiện có trong CSDLTT đƣợc thể hiện ở bảng sau:
Bảng 11: M t số sự kiện có trong cơ sở tri thức
Mã sự iện Sự iện Thuộc tính liên quan Điểm nguy cơ
SK1 Bệnh nhân thu c nhóm tuổi < 34 tuổi Age 0 SK2 Bệnh nhân thu c nhóm tuổi từ 34 – 39 tuổi Age 0 SK3 Bệnh nhân thu c nhóm tuổi từ 40 – 44 tuổi Age 1 SK4 Bệnh nhân thu c nhóm tuổi từ 45 – 49 tuổi Age 3
SK5 Bệnh nhân trên 50 tuổi Age 2
SK6 Bệnh nhân có BMI < 23 BMI 0
SK7 Bệnh nhân có BMI >= 23 và < 27.5 BMI 3
SK8 Bệnh nhân có BMI >= 27.5 BMI 5
SK9 Bệnh nhân không có người thân mắc bệnh đái tháo đường
SK10 Bệnh nhân có bố mẹ hoặc anh chị em ru t mắc bệnh đái tháo đường
SK11 Nồng đ Glucose trong máu 2 giờ sau ăn
SK12 Nồng đ Glucose trong máu 2 giờ sau ăn
SK13 Nồng đ Glucose trong máu 2 giờ sau ăn
SK14 Kiểm tra nếp véo da < 80 mm Skin Thickness 0
SK15 Kiểm tra nếp véo da >= 80mm và 90mm Skin Thickness 4
SK17 Bị bệnh tăng huyết áp (huyết áp tâm trương >120 mmHg
SK18 Mang thai 1 và = 3 lần Pregnancies 6
SK22 Nồng đ insulin < 43 pmol/L Insulin 2
SK23 Nồng đ insulin >= 43 và 209 pmol/L Insulin 6
SK25 Không có nguy cơ mắc bệnh đái tháo đường
SK26 Có nguy cơ mắc bệnh đái tháo đường trung bình
SK27 Có nguy cơ cao mắc bệnh đái tháo đường
Các luật trong cơ sở tri thức đƣợc xây dựng dựa trên các mô hình sàng lọc bệnh ĐTĐ Mỗi mô hình sàng lọc sẽ đánh giá mức đ nguy cơ dựa trên các nhóm yếu tố thành phần Các nhóm yếu tố thành phần đồng thời c ng đƣợc chia thành nhóm các thành phần chính và nhóm các thành phần bổ sung, trong đó nhóm các thành phần chính là các thành phần được xem xét trước khi xem xét đến các thành phần bổ sung M t số luật có trong CSDLTT đƣợc thể hiện ở bảng sau:
Bảng 12: M t số luật có trong CSDLTT
Mã luật Điều iện Kết luận
SK6: Bệnh nhân có BMI < 23 Thành phần phụ 1:
SK1: Bệnh nhân thu c nhóm tuổi < 34 tuổi)
SK14: Kiểm tra nếp véo da < 80 mm0
SK25: Không có nguy cơ mắc bệnh đái tháo đường
SK13: Nồng đ Glucose trong máu 2 giờ sau ăn >= 5.88 (mmol/L)) Thành phần phụ 1:
SK27: Có nguy cơ cao mắc bệnh đái tháo đường
SK19: Mang thai >1 và = 27.5
SK27: Có nguy cơ cao mắc bệnh đái tháo đường
SK12: Nồng đ Glucose trong máu 2 giờ sau ăn > 5.55 và < 5.88 (mmol/L) Thành phần phụ 1:
SK4: Bệnh nhân thu c nhóm tuổi từ 45 – 49 tuổi
SK15: Kiểm tra nếp véo da >= 80mm và = 5.88 (mmol/L) Thành phần phụ 1:
SK4: Bệnh nhân thu c nhóm tuổi từ 45 – 49 tuổi
SK17: Bị bệnh tăng huyết áp (huyết áp tâm trương >120 mmHg
SK27: Có nguy cơ cao mắc bệnh đái tháo đường
SK10: Bệnh nhân có bố mẹ hoặc anh chị em ru t mắc bệnh đái tháo đường
SK24: Nồng đ insulin > 209 pmol/L Thành phần phụ 1:
SK13: Nồng đ Glucose trong máu 2 giờ sau ăn >= 5.88 (mmol/L)
SK17: Bị bệnh tăng huyết áp (huyết áp tâm trương >120 mmHg
SK27: Có nguy cơ cao mắc bệnh đái tháo đường
3.5.2 Lựa chọn thuộc tính đầu vào sử dụng CSDLTT
Với các thu c tính input đầu vào của mạng nơ-ron, nghiên cứu sẽ lựa chọn các thu c tính có liên quan tới kết luận đầu ra dựa trên các luật trong cơ sở tri thức Để làm được điều này, nghiên cứu sử dụng phương pháp tính khoảng cách giữa các sự kiện đƣợc nêu trong mục 2.2.4 trong đó công thức tính khoảng cách sự kiện đối với các thành phần chính, thành phần phụ và sự kiện đích theo công thức sau:
Từ khoảng cách giữa các sự kiện sẽ có đƣợc sự liên kết “xa – gần” giữa các sự kiện thu c tính và sự kiện đích Với mô hình học mạng nơ-ron có thể xác định trước số lớp ẩn tối đa của mô hình, khi đó với các thu c tính mà khoảng cách giữa sự kiện có chứa thu c tính đó tới sự kiện đích lớn hơn số lớp ẩn đƣợc quy định, đó sẽ là các thu c tính đƣợc xác định là có liên kết rất thấp tới việc chẩn đoán có hay không mắc bệnh ĐTĐ Các thu c tính này sẽ không đƣợc sử dụng trong mô hình mạng nơ-ron Dựa trên các luật trong bảng mục 3.5.1 có thể xác định đƣợc biểu đồ FPS khoảng cách giữa các sự kiện nhƣ hình sau:
Hình 13: Biểu đồ FPS giữa các sự kiện
Từ biểu đồ FPG có thể nhận ra khoảng cách giữa các sự kiện trong CSDLTT đƣợc thể hiện trong bảng sau:
Bảng 13: M t số giá trị khoảng cách giữa các sự kiện trong cơ sở tri thức
Sự iện 1 Sự iện 2 Khoảng cách
Dựa trên kết quả khoảng cách giữa các sự kiện thể hiện các thu c tính đầu vào, nghiên cứu lựa chọn các thu c tính có sự kiện mà khoảng cách tới sự kiện đích không lớn hơn 2 Vì thế các thu c tính đầu vào đƣợc lựa chọn trong quá trình học của mạng nơ-ron tương ứng với CSDLTT nêu trên là: Age, BMI, Diabetes Pedigree Function, Glucose, Insulin, Blood Pressure, Pregnancies và
3.5.3 Lựa chọn số lƣợng lớp và số lƣợng node sử dụng CSDLTT
Trong các bài toán về học máy nói riêng và AI nói chung, năng lực dự đoán đƣợc hiểu là khả năng dự đoán chính xác kết quả đầu ra với m t hoặc dữ liệu đầu vào là các dữ liệu mới Năng lực dự đoán cao hay thấp sẽ thể hiện công suất mô hình học máy Trong các mô hình học máy, việc lựa chọn các hàm thuật toán không thực sự thay đổi công suất tối đa của mô hình mà ch giúp giảm đáng kể lỗi đào tạo, có nghĩa là giúp mô hình đạt tới công suất tối đa của nó [12] Công suất tối đa của mạng nơ-ron có thể đƣợc kiểm soát bởi hai khía cạnh của mô hình: số lƣợng lớp và số lƣợng node M t mô hình có nhiều lớp hơn và nhiều đơn vị ẩn hơn trên mỗi lớp có khả năng biểu di n các hàm phức tạp hơn [12]
Trong thực tế, việc lựa chọn số lƣợng lớp và số lƣợng node luôn là m t câu hỏi cho người xây dựng mô hình Nếu số lượng lớp và node quá ít có thể làm cho khả năng khái quát hóa của mô hình kém, tuy nhiên, số lƣợng lớp và node quá nhiều có thể khiến mô hình quá phù hợp với b dữ liệu học nhƣng khả năng dự đoán kém với b dữ liệu test, hơn nữa công suất của m t mô hình với x lớp ẩn và y node trong mỗi lớp c ng khác mô hình với m t lớp ẩn và x * y node trong lớp ẩn Dưới đây là biểu đồ hàm mất mát Entropy của m t số mô hình mạng nơ-ron có số lƣợng node khác nhau:
Hình 14: Biểu đồ hàm mất mát Entropy của các mô hình mạng nơ-ron nhiều lớp với số lƣợng node thay đổi từ 1 – 7 trong bài toán phân lớp [13]
Trong khi đó, kết quả biểu đồ hàm mất mát Entropy của m t số mô hình mạng nơ-ron có số lƣợng lớp khác nhau đƣợc thể hiện ở hình sau:
Hình 15: Biểu đồ hàm mất mát Entropy của các mô hình mạng nơ-ron nhiều lớp với số lƣợng lớp thay đổi từ 1 – 5 trong bài toán phân lớp [13]
Từ vấn đề nêu trên, để lựa chọn số lƣợng lớp và node cho mô hình mạng nơ-ron, luận văn đề xuất sử dụng CSDLTT để giải quyết bài toán Các lớp và node trong mô hình thể hiện cho mối liên hệ giữa các thu c tính đầu vào đến kết luận đầu ra Trong khi đó cơ sở dữ liệu tri thức c ng thể hiện mối liên hệ giữa các sự kiện đầu vào (đại diện cho các thu c tính đầu vào) với sự kiện đích (đại diện cho kết luận đầu ra) thông qua các sự kiện trung gian và đƣợc suy di n bằng các luật suy di n Bảng dưới đây thể hiện sự tương ứng giữa cơ sở tri thức và mạng nơ-ron
Bảng 14: Sự tương ứng giữa cơ sở tri thức và mạng nơ-ron [14]
Final Conclusions Output Units Supporting Facts Input Units Intermediate Conclusions Hidden Units Dependencies Weighted Connections
Từ bảng trên có thể nhận thấy sự tương đồng giữa 2 mô hình sử dụng hệ cơ sở tri thức và mạng nơ-ron:
Đầu ra của quá trình suy di n là kết luận về 1 sự kiên - Final Conclusions (ví dụ sự kiện mắc bệnh đái tháo đường), giống như mục tiêu kết luận của mạng nơ-ron – Output Units (Kết luận: Có mắc bệnh đái tháo đường)
Các sự kiện của hệ cơ sở tri thức - Supporting Facts đƣợc thể hiện từ các thu c tính, vì thế có giá trị tương tự các giá trị đầu vào của mạng nơ-ron - Input Units
Các kết luận trung gian - Intermediate Conclusions là các suy di n từ các luật và sự kiện, thể hiện sự liên kết của các sự kiện Bởi vậy có thể thể hiện nhƣ những node ẩn trên mạng nơ-ron
KẾT QUẢ THỰC NGHIỆM
Thông số máy chủ
Để đánh giá mức đ hiệu quả của mạng nơ-ron đề xuất, nghiên cứu sẽ thực hiện so sánh với việc sử dụng mạng nơ-ron truyền thẳng trong các nghiên cứu khác B dữ liệu đƣợc sử dụng trong luận văn là b dữ liệu về bệnh nhân ĐTĐ của khu vực Pima Indian [5] Kết quả thực nghiệm dưới đây được chạy trên máy chủ có thông số nhƣ sau:
Kết quả thực nghiệm
Trong quá trình thực nghiệm, nghiên cứu áp dụng mô hình mạng nơ-ron truyền thẳng sử dụng giải thuật lan truyền ngƣợc, trong đó các thu c tính đầu vào, số lớp ẩn và số node trong mỗi lớp ẩn đƣợc xác định dựa trên cơ sở tri thức đƣợc thể hiện bằng tính năng mô hình hóa của Keras nhƣ sau:
Hình 25: Mô hình mạng nơ-ron thử nghiệm biểu di n bởi thƣ viện Keras
Bảng sau thể hiện các tham số đƣợc sử dụng cho mạng nơ-ron của mô hình học
Bảng 16: Hệ số sử dụng cho mô hình học
Tổng số lƣợng dữ liệu 768
Số lƣợng dữ liệu học 80 tổng dữ liệu
Số lƣợng dữ liệu test 20 tổng dữ liệu
Hàm mất mát Binary cross Entropy
Thuật toán tối ƣu Adam
Hàm truyền giữa các lớp ẩn ReLU
Hàm truyền giữa lớp ẩn và lớp output
Sau quá trình học, giá trị của hàm mất mát và đ chính xác thay đổi theo từng chu kì epoch được thể hiện trong biểu đồ bên dưới:
Hình 26: Biểu đồ giá trị hàm mất mát và đ chính xác với b dữ liệu training và b dữ liệu test trong 4000 chu kì epoch
Quá trình học và kiểm tra với b dữ liệu test không còn xuất hiện hiện tƣợng overfitting Kết quả thử nghiệm cho thấy mô hình có thể đạt đ chính xác cao nhất ở mức 94.77 sau m t số lần chạy thử nghiệm, ngoài ra các ch số về t lệ chính xác, t lệ tái hiện và f1-score được thể hiện ở bảng dưới đây:
Bảng 17: Hiệu năng của mô hình mạng nơ-ron với b dữ liệu UCI Đ chính xác (accuracy) 94.77%
Đánh giá
Với mạng nơ-ron nhiều lớp thông thường khi xử lý trên cùng b dữ liệu của các nghiên cứu khác, đạt đ chính xác có thể đạt 79.05% [16], hoặc 93.06% với Small-world neural network (SW-FFANN) [17], qua đó cho thấy các mô hình mạng nơ-ron có thể đạt hiệu quả chẩn đoán tốt với b dữ liệu nghiên cứu Tuy nghiên với các mô hình nêu trên, việc lựa chọn thu c tính đầu vào c ng nhƣ tham số mô hình mạng dựa trên tính toán của người xây dựng hệ thống và đôi khi điều này dẫn tới các lựa chọn không hiệu quả, hơn thế nữa việc thay đổi về tập dữ liệu hoặc vận dụng các kết quả nghiên cứu y học mới có thể dẫn tới việc phải nghiên cứu, xây dựng lại mô hình học máy từ đầu sẽ mất nhiều chi phí cho việc phát triển và nâng cấp
Trong nghiên cứu này, bằng việc kết hợp mạng nơ-ron truyền thẳng sử dụng thuật toán lan truyền ngƣợc và cơ sở tri thức, đ chính xác có thể đạt đƣợc của mô hình đề xuất với b dữ liệu được sử dụng là 94.77% Bảng dưới đây là kết quả đ chính xác của mô hình đề xuất và m t số mô hình mạng nơ-ron khác:
Bảng 18: Đ chính xác của m t số mô hình mạng nơ-ron trên cùng b dữ liệu
Mô hình Độ chính xác
Small-world neural network (SW-FFANN)[17] 93.06%
Bằng việc kết hợp với cơ sở tri thức, các thu c tính đầu vào và tham số mô hình mạng đƣợc lựa chọn dựa trên tri thức của các chuyên gia sẽ có ý nghĩa hơn với các đánh giá của người xây dựng hệ thống Khi đó mô hình mạng được xây dựng sẽ có các thu c tính đầu vào là các thu c tính hay đƣợc sử dụng trong quá trình chẩn đoán thực tế, đồng thời số lớp ẩn hay số node trong mỗi lớp thể hiện đƣợc sự liên quan chặt chẽ của các thu c tính này do các tham số trên đƣợc xác định bằng các phép suy di n giống nhƣ các lập luận đƣợc sử dụng trong quá trình chẩn đoán và xác định tình trạng bệnh của chính các nhân viên y tế
Cùng với đó, mô hình học máy có thể đƣợc phát triển và tự cải thiện bằng chính tri thức đƣợc các chuyên gia đƣa vào mô hình thông qua CSDLTT m t cách liên tục, cập nhật mà không cần phân tích và đề xuất lại mô hình Tuy nhiên khi sử dụng mạng nơ-ron cho việc chẩn đoán bệnh sẽ không thể đƣợc sử dụng cho việc giải thích lập luận để đƣa ra kết luận chẩn đoán đó.
Usecase: Dữ liệu nghiên cứu của bệnh nhân đái tháo đường tại trung tâm N i tiết – Đái tháo đường, bệnh viện Bạch Mai Hà N i
trung tâm Nội tiết – Đái tháo đường, bệnh viện Bạch Mai Hà Nội 4.4.1 Dữ liệu thử nghiệm
B dữ liệu đƣợc sử dụng là dữ liệu của 60 bệnh nhân nghiên cứu tại trung tâm N i tiết – Đái tháo đường, bệnh viện Bạch Mai Hà N i [19], được thu thập bởi bác sĩ Phạm Thị Hồng Nhung trong thời gian từ tháng 9/2017 đến tháng 12/2018 Dữ liệu của bệnh nhân bao gồm các thông tin phù hợp có thể sử dụng để phục vụ thử nghiệm cho luận văn nhƣ sau:
Bảng 19: Thông tin dữ liệu nghiên cứu của bệnh nhân tại trung tâm N i tiết – Đái tháo đường, bệnh viện Bạch Mai Hà N i
Thuộc tính Kiểu dữ liệu Mô tả Tỉ lệ thiếu dữ liệu (%)
TUOI Number Tuổi của bệnh nhân 0
BMI Number Ch số BMI 0
PARA Number Số lần mang thai 0
TSDTKTK Number Tiền sử đái tháo đường thai kì 0
BMI Number Ch số BMI 0
INSULIN Number Đo nồng đ Insulin 2 giờ sau ăn 0
DTDTK Number Chẩn đoán đái tháo đường:
+ 0: bệnh nhân mắc bệnh đái tháo đường + 1: bệnh nhân không mắc bệnh đái tháo đường
Ngoài ra dữ liệu còn có các thông tin khác nhƣ: họ và tên, địa ch , nghề nghiệp, và ch số PeptideC, ch số HOMA-IR, HOMA-B phục vụ cho nghiên cứu chuyên môn, vì thế các dữ liệu này sẽ không đƣợc sử dụng cho quá trình thử nghiệm của luận văn
Xử lý dữ liệu ngoại lai: Trong dữ liệu nghiên cứu không xuất hiện các dữ liệu bị sai về mặt hình thức hoặc ngữ nghĩa, vì thế quá trình này sẽ bị bỏ qua
Quy chuẩn dữ liệu: o Ch số PARA: là ch số đánh giá tiền sử sản khoa của bệnh nhân, bao gồm 4 số ABCD đƣợc hiểu nhƣ sau: A là số lần sinh con đủ tháng, B là số lần sinh con thiếu tháng, C là số lần sảy thai tự nhiên hoặc hút thai, D là số con hiện còn sống Vì thế khi sử dụng thu c tính PARA cần lấy giá trị X=C+D để đại diện cho số lần mang thai o Các ch số INSULIN, HBA1C không cùng đơn vị với b dữ liệu UCI, tuy nhiên luận văn sử dụng phương thức chuẩn hóa MinMaxScale, vì thế sau khi chuẩn hóa các giá trị INSULIN và HBA1C tương đương khi chuyển đổi cùng đơn vị o Tại bước chuẩn hóa cuối cùng, dữ nghiên cứu sẽ thực hiện việc quy chuẩn dữ liệu bằng cách đƣa các dữ liệu về khoảng 0 – 1 theo MinMaxScaling theo công thức sau:
4.4.3 Kiểm tra ết quả chẩn đoán bằng mô hình mạng nơ-ron đề xuất
Tập dữ liệu thử nghiệm bao gồm 6 thu c tính đầu vào, vì thế, mô hình mạng neural đề xuất sẽ loại bỏ đi các thu c tính tương ứng là Skin Thickness và Blood Pressure , đồng thời tiến hành quá trình học lại với b dữ liệu UCI Sau quá trình học với 6 thu c tính này, đ chính xác giảm đi so với quá trình training với đầy đủ các thu c tính tuy nhiên vẫn ở mức cao: 83.12 Biểu đồ hàm mất mát và đ chính xác được của quá trình training được thể hiện ở hình dưới đây:
Hình 27: Kết quả quá trình training mô hình mạng sau khi loại bỏ 2 thu c tính
Blood Pressure và Skin Thickness
Thực nghiệm với b dữ liệu của bệnh nhân tại bệnh viện Bạch Mai Hà N i, mô hình đạt được đ chính xác 80 trong chẩn đoán bệnh đái tháo đường T lệ chính xác (precision) trong thử nghiệm đạt 95 , tuy nhiên t lệ tái hiện recall ch đạt 63.33 và mô hình cần cải thiện thêm để đạt t lệ tái hiện cao hơn Kết quả thực nghiệm của mô hình được thể hiện trong bảng dưới đây:
Bảng 20: Kết quả thực nghiệm của mô hình với b dữ liệu nghiên cứu bệnh nhân đái tháo đường của bệnh viện Bạch Mai Hà N i Đ chính xác (accuracy) 80%
Chương trình thử nghiệm
Chương trình thử nghiệm cung cấp giao diện tương tác giúp người sử dụng nhận đƣợc kết quả chẩn đoán bằng cách cung cấp các thông tin sức khỏe cho chương trình Tại màn hình chẩn đoán bệnh, người sử dụng sẽ nhập các thông tin ch số sức khỏe, và hệ thống sẽ tiến hành chuẩn đoán nguy cơ mắc bệnh đái tháo đường và hiển thị kết quả tới người sử dụng Kết quả chẩn đoán đựa trên kết quả được đưa ra từ mô hình mạng nơ-ron đề xuất Hình dưới đây là màn hình giao diện tính năng chẩn đoán bệnh:
Hình 28: Màn hình tình năng chẩn đoán bệnh ĐTĐ
Ngoài ra chương trình còn cung cấp giao diện giúp các chuyên gia quản lý cơ sở tri thức Với tính năng quản lý sự kiện, các chuyên gia có thể thêm – sửa – xóa các sự kiện có trong CSDLTT Dưới đây là giao diện màn hình quản lý sự kiện:
Hình 29: Màn hình tính năng quản lý sự kiện
Tính năng quản lý luật cho phép các chuyên gia có thể thêm – sửa – xóa các luật trong CSDLTT Các sự kiện để hình thành luật sẽ đƣợc chuyên gia lựa chọn trong danh sách sự kiện Dưới đây là giao diện tính năng quản lý luật suy di n:
Hình 30: Màn hình tính năng quản lý luật