Dữ liệu và chương trình thực nghiệm

Một phần của tài liệu Khai phá dữ liệu có canh tác dữ liệu và ứng dụng trong khai phá dữ liệu y khoa luận văn thạc sĩ (Trang 74)

4.5.1.1 Dữ liệu thực nghiệm

Chọn ngẫu nhiên 40 bệnh án SXH của tháng 7 và tháng 8/năm 2012 đang lưu trữ tại bệnh viên Nhi Đồng – Đồng Nai đã chẩn đoán bệnh SXH theo hướng dẫn của Bộ Y tế và 10 bệnh nhân SXH đang nằm tại khoa nhiễm bệnh viện Nhi Đồng – Đồng Nai

4.5.1.2 Hướng dẫn sử dụng hệ thống

Bước 1: Khởi động phần mềm. Hệ thống sẽ hiện thị giao diện như hình 4.4

Bước 2: Lấy dữ liệu tập huấn từ tab Dữ liệu tập huấn như hình 4.5

Bước 3: Click vào tab thuật toán C4.5 sinh cây quyết định và chọn button :

“tạo cây quyết định” hay “cây quyết định Demo” như hình 4.6

Hình 4.2 Giao diện chính của hệ thống chương trình

Bước 4: Click vào tab “tiến hành chẩn đoán bệnh và chọn button “load” để

lấy giá trị thuộc tính của bệnh nhân SXH và click vào button “chấn đoán” hệ thống sẽ hiện thị kết quả dự đoán như hình 4.5

Hình 4.4 Hiển thị cây quyết định dạng treeview

4.6 KẾT QUẢ THỰC NGHIỆM Phân lớp Phân lớp bệnh Tổng Mẫu Kết quả chẩn đoán Tỉ lệ % đạt so với chuyên gia BS SXHD SXHD-CB SXHD-VS SXHD 23 22 1 0 95.65 SXHD-CB 18 3 13 2 72.22 SXHD-VS 9 0 1 8 88.88 4.7 NHẬN XÉT KẾT QUẢ THỰC NGHIỆM

Qua kết quả thực nghiệm của hệ thống chương trình trong bảng 4.1 tôi nhận thấy rằng, hệ thống đưa ra chẩn đoán tương đối chính xác trên 88% đã phần nào phân lớp được các đối tượng bệnh SXH. Cụ thể:

- 23 mẫu SXHD có 22 mẫu được chẩn đoán đúng đạt 95.65 %.

- 18 mẫu SXHD-CB 13 mẫu chẩn đoán đúng, 5 mẫu chẩn đoán sai, đạt 72.20 %.

- 9 mẫu SXHD-VS 8 mẫu chẩn đoán đúng, 1 mẫu chẩn đoán sai, đạt 88.88%.

Tuy nhiên, với kết quả trên, SXHD thì hệ thống chẩn đoán tương đối chính xác cao (95.65% vì chẩn đoán SXHD tương đối dễ[4] ) còn SXH cảnh báo và vào sốc vẫn còn có sự chênh lệch(chỉ đạt trung bình 80%). Theo chuyên gia các bác sĩ tại bệnh viện Nhi Đồng – Đồng Nai và các tài liệu về bệnh SXH[2][3], bệnh SXHD chẩn đoán tương đối dễ dàng nhưng để dự đoán

một bệnh nhân vào sốc đang gặp khó khăn trong chẩn đoán lâm sàng bệnh. Sự chênh lệch của kết quả thực nghiệm trên có thể do các nguyên nhân sau:

- Dữ liệu tập huấn cho hệ thống còn ít.

- Sự chuyển độ giữa SXHD-CB và SXHD-VS rất gần nhau [2],[3].

- Chưa có công trình nghiên cứu chính xác về sự béo phì có liên quan đến bệnh nhân vào sốc nhanh hơn bệnh nhân bình thường (nhưng thực tế lâm sàng thấy có sự chênh lệch). Do đó cùng các giá trị như nhau thì có thể bệnh nhân béo phì sẽ vào sốc nhanh hơn.

- Khoãng cách tuổi qua xa. Vì bệnh nhân càng lớn tuổi khả năng vào sốc hiếm hơn [2] . Do đó nếu so sánh cùng tuổi, cùng cân nặng, cùng thời gian nhập viện thì mô hình sinh ra sẽ dự đoán chính xác hơn.

Tuy nhiên qua kết quả trên chúng ta có thể nhận xét được rằng, luận văn đã đạt được mục tiêu đề ra. Là giải pháp có khả năng hỗ trợ bác sĩ dự đoán bệnh SXH (SXH-CB và SXH-VS). Làm giảm tỉ lệ tử vong cũng như chi phí điều trị, cho tất cả những bệnh nhân mắc phải bệnh SXH. Một điều quan trọng hơn thế nữa, chúng ta sẽ thấy được tầm quan trọng của vấn đề KPDL trong lĩnh vực y khoa, mở ra một hướng chẩn đoán và điều trị mới: Kết hợp tri thức chuyên gia bác sĩ và tri thức được trích lọc từ kho dữ liệu HSBA giúp cho việc chẩn đoán bệnh ở mức chính xác cao.

Chương V

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

5.1 KẾT LUẬN

Trong công việc hàng ngày, vai trò của con người vẫn luôn là trọng tâm. Tuy nhiên, thực tế cho thấy, ngày càng có nhiều sự hỗ trợ đắc lực từ phía máy móc và công nghệ. Thật vậy, có thể nói vai trò của khoa học và công nghệ cao là không thể thiếu và đang ảnh hưởng rất lớn tới đời sống của chúng ta. Đó là những công cụ hỗ trợ đắc lực cho con người, giúp cho con người giải quyết vấn đề nhanh chóng, chính xác và hiệu quả hơn, tiết kiệm rất nhiều chi phí. Trong các số đó, một ứng dụng dễ nhận thấy nhất về sự trợ giúp của khoa học công nghệ đối với đời sống con người đó là: Hỗ trợ con người ra quyết định. Trong vai trò nghiên cứu của mình. Bản thân của tác giả là một người cán bộ Y tế (hiện nay đang công tác tại bệnh viện Nhi Đồng – Đồng Nai thuộc phòng KHTH đã thấy được tầm quan trọng của CNTT trong bệnh viện, đặc biệt là sự trợ giúp CNTT hỗ trợ bác sĩ trong vấn đề ra quyết định chẩn đoán bệnh. Tác giả đã chọn công nghệ khai phá tri thức (hay còn gọi là KPDL) để làm cơ sở nghiên cứu luận văn của mình. Qua quá trình nghiên cứu, có thể tóm tắt những kết quả như sau:

5.1.1 Kết quả đạt được 5.1.1.1 Lý thuyết 5.1.1.1 Lý thuyết

Qua quá trình nghiên cứu và tìm hiểu về các vấn đề liên quan tới khai phá dữ liệu, cơ bản đã hoàn thành và đạt được một số kết quả về mặt lý thuyết như sau:

- Giới thiệu về phương pháp KPDL có sử dụng tri thức chuyên gia trong quá trình KPDL hay còn gọi là canh tác dữ liệu. Chứng minh được KPDL có canh tác dữ liệu ưu việt hơn KPDL cổ điển.

- Đưa ra ứng dụng KPDL cụ thể đó là dữ liệu y khoa của bệnh sốt xuất huyết.

- Ngoài vai trò trọng tâm của con người, tác giả cũng chứng minh được rằng công cụ tin học không thể thiếu trong cuộc sống nói chung và trong lĩnh vực y khoa nói riêng. Mở ra một phương pháp chẩn đoán mới: Là sự kết hợp tri thức chuyên gia bác sĩ và tri thức được trích lọc từ cơ sở dữ liệu thông qua công nghệ khám phá tri thức đó là KPDL có canh tác dữ liệu. Đây là công trình nghiên cứu cần được hỗ trợ cũng như được nhân rộng trong các bệnh viện.

- Về Mục đích của luận văn, tác giả đã sử dụng khai phá dữ liệu có canh các dữ liệu để đưa ra chứng cớ (Y học chứng cớ và Y học thực chứng) để hỗ trợ bác sĩ dự đoán sớm vào sốc của bệnh SXH, giảm tử vong cũng như chi phí điều trị của bệnh nhân mắc phải bệnh SXH.

5.1.1.2 Thực nghiệm

- Xây dựng được hệ thống chương trình thực nghiệm.

- Đã tiến hành thực nghiệm với những bệnh nhân đang điều trị tại khoa nhiễm và bệnh án đang lưu trữ tại kho lưu trữ HSBA của bệnh viện Nhi Đồng – Đồng Nai.

- Phân tích được kết quả thực nghiệm: Đạt và không đạt. Bước đầu khả quan hứa hẹn góp phần cải tiến trong chẩn đoán bệnh, cụ thể trong luận văn này là bệnh SXH.

5.1.2 Kết quả chưa đạt được

- Thuật toán C4.5 là một thuật toán hay nhưng so với các thuật toán mới gần đây như See5, C5.0, Sprint thì còn nhiều nhược điểm. Phương pháp để tìm ra luật trong C4.5 là chậm và chiếm nhiều bộ nhớ.

- Dữ liệu tập huấn còn hạn hẹp nên kết quả thực nghiệm đạt được không cao. - KPDL là công nghệ tri thức liên ngành, mới. Việc nghiên cứu trong một khoãng thời gian hạn hẹp thì không thể khám phá hết được chức năng của công nghệ mới này. Do đó, sự vận dụng vào thực tiễn không tránh khỏi những khiếm khuyết. Đây là một vấn đề mà tác giả cũng như bất kỳ học viên nào điều có cùng cảnh ngộ.

5.2 HƯỚNG PHÁT TRIỂN 5.2.1 Lý thuyết

- Nghiên cứu thêm một số thuật toán mới về khai phá dữ liệu bằng cây quyết đinh, tìm hiểu kỹ hơn về các kỹ thuật khai phá dữ liệu khác. - Tìm các phương pháp mới (thuật toán mới) cải tiến các nhược điểm của

các thuật toán sinh cây quyết định được trình bày trong chương III.

5.2.2 Thực hành

- Tập dữ liệu nhiều hơn

- Xây dựng được những chương trình ứng dụng phức tạp và có tính thực tế hơn bằng cây quyết định cụ thể là áp dụng cho nhiều bệnh lý khác nhau.

Trong quá trình nghiên cứu, mặc dù có sự hướng dẫn thật nghiêm túc của Thầy PGS.TS Đặng Trần Khánh, các chuyên gia Điều dưỡng, Y Bác sĩ đầu ngành BV Nhi Đồng – Đồng Nai tư vấn, các bạn ngành Công Nghệ Thông Tin hỗ trợ, cùng với sự nổ lực cá nhân nhưng cũng không thể tránh khỏi những thiếu sót. Tác giả rất chân thành đón nhận từ những đóng góp ý kiến từ các quý Thầy, Cô, các chuyên gia Bác sĩ cũng như bạn bè đồng nghiệp.

Một phần của tài liệu Khai phá dữ liệu có canh tác dữ liệu và ứng dụng trong khai phá dữ liệu y khoa luận văn thạc sĩ (Trang 74)

Tải bản đầy đủ (PDF)

(81 trang)