0
Tải bản đầy đủ (.pdf) (81 trang)

Xây dựng chương trình

Một phần của tài liệu KHAI PHÁ DỮ LIỆU CÓ CANH TÁC DỮ LIỆU VÀ ỨNG DỤNG TRONG KHAI PHÁ DỮ LIỆU Y KHOA LUẬN VĂN THẠC SĨ (Trang 73 -73 )

4.4.4.1 Dữ liệu đầu vào

Tập dữ liệu y khoa của những bệnh nhân có độ tuổi từ 0 đến 15 tuổi được chẩn đoán bệnh SXH theo tiêu chuẩn Who được lưu trữ tại kho lưu trữ HSBA tại bệnh viện Nhi Đồng – Đồng Nai từ năm 2000 – 2012 đã được tham vấn các chuyên gia bác sĩ chọn lựa đặc tính và đã xử lý dữ liệu theo quy trình KPDL có canh tác dữ liệu đã được trình bày chi tiết trong mục [4.2.2

thu thập dữ liệu]

4.4.4.2 Mô tả dữ liệu đầu vào

Sau khi thu thập và xử lý DL, CTDL. DL đưa vào hệ thống gồm các thuộc tính như sau:

- Thuộc tính 1: Gồm có 4 nhóm tuổi được định nghĩa theo khoảng tuổi (khoangtuoi) như sau:

+ Từ 0 đến 1 tuổi: Có giá trị là A :

+ Lớn hơn 1 tuổi đến 6 tuổi : Có giá trị là B + Lớn hơn 6 tuổi đến 9 tuổi : Có giá trị là C + Lớn hơn 9 tuổi đến 15 tuổi : Có giá trị là D - Thuộc tính 2: Nhập viện (nhapvien)

+ Nhập viện ngày thứ 1 đến 2 của bệnh sớm True (bệnh nhân sốt kéo dài kể từ ngày ủ bệnh)

+ Nhập viện ngày thứ 3 trở đi của bệnhtrễ False - Thuộc tính 3: Đau bụng (Daubung)

+ Có đau bụng True. + Không đau bụng False. - Thuộc tính 4: Ói (oi)

+ Không ói False - Thuộc tính 5: Huyết ap (HA)

+ HA bình thườngbt: + HA caocao:

+ HA tụttut: + HA kẹpkep:

- Thuộc tính 6: Siêu âm (SA). + Có dịch True. + Không có dịch False. - Thuộc tính 7: HCT + Bình thường bt. + Cao vừa CV. + Quá caoQC.

- Thuộc tính 8: Tiểu cầu(TC)

+ Giá trị trung bìnhFalse, giảm True - Thuộc tính 9: Chẩn đoán (chandoan)

+ Sốt xuất huyết Dengue 1.

+ Sốt xuất huyết Dengue cảnh báo 2. + Sốt xuất huyết Dengue vào sốc3

4.4.4.3 Dữ liệu đầu ra

- Đầu ra: cây quyết định dạng treeview.

4.4.4.4 Sử dụng thuật toán cho bài toán

Sử dụng thuật toán C4.5 đã trình bài trong chương III

4.4.4.5 Ngôn ngữ phát triển và cơ sở dữ liệu sử dụng

Được phát triển trên nền C# 2010 . CSDL sử dụng là CSDL Asscess 97.

4.5 THỰC NGHIỆM

4.5.1 Dữ liệu và chương trình thực nghiệm 4.5.1.1 Dữ liệu thực nghiệm 4.5.1.1 Dữ liệu thực nghiệm

Chọn ngẫu nhiên 40 bệnh án SXH của tháng 7 và tháng 8/năm 2012 đang lưu trữ tại bệnh viên Nhi Đồng – Đồng Nai đã chẩn đoán bệnh SXH theo hướng dẫn của Bộ Y tế và 10 bệnh nhân SXH đang nằm tại khoa nhiễm bệnh viện Nhi Đồng – Đồng Nai

4.5.1.2 Hướng dẫn sử dụng hệ thống

Bước 1: Khởi động phần mềm. Hệ thống sẽ hiện thị giao diện như hình 4.4

Bước 2: Lấy dữ liệu tập huấn từ tab Dữ liệu tập huấn như hình 4.5

Bước 3: Click vào tab thuật toán C4.5 sinh cây quyết định và chọn button :

“tạo cây quyết định” hay “cây quyết định Demo” như hình 4.6

Hình 4.2 Giao diện chính của hệ thống chương trình

Bước 4: Click vào tab “tiến hành chẩn đoán bệnh và chọn button “load” để

lấy giá trị thuộc tính của bệnh nhân SXH và click vào button “chấn đoán” hệ thống sẽ hiện thị kết quả dự đoán như hình 4.5

Hình 4.4 Hiển thị cây quyết định dạng treeview

4.6 KẾT QUẢ THỰC NGHIỆM Phân lớp Phân lớp bệnh Tổng Mẫu Kết quả chẩn đoán Tỉ lệ % đạt so với chuyên gia BS SXHD SXHD-CB SXHD-VS SXHD 23 22 1 0 95.65 SXHD-CB 18 3 13 2 72.22 SXHD-VS 9 0 1 8 88.88 4.7 NHẬN XÉT KẾT QUẢ THỰC NGHIỆM

Qua kết quả thực nghiệm của hệ thống chương trình trong bảng 4.1 tôi nhận thấy rằng, hệ thống đưa ra chẩn đoán tương đối chính xác trên 88% đã phần nào phân lớp được các đối tượng bệnh SXH. Cụ thể:

- 23 mẫu SXHD có 22 mẫu được chẩn đoán đúng đạt 95.65 %.

- 18 mẫu SXHD-CB 13 mẫu chẩn đoán đúng, 5 mẫu chẩn đoán sai, đạt 72.20 %.

- 9 mẫu SXHD-VS 8 mẫu chẩn đoán đúng, 1 mẫu chẩn đoán sai, đạt 88.88%.

Tuy nhiên, với kết quả trên, SXHD thì hệ thống chẩn đoán tương đối chính xác cao (95.65% vì chẩn đoán SXHD tương đối dễ[4] ) còn SXH cảnh báo và vào sốc vẫn còn có sự chênh lệch(chỉ đạt trung bình 80%). Theo chuyên gia các bác sĩ tại bệnh viện Nhi Đồng – Đồng Nai và các tài liệu về bệnh SXH[2][3], bệnh SXHD chẩn đoán tương đối dễ dàng nhưng để dự đoán

một bệnh nhân vào sốc đang gặp khó khăn trong chẩn đoán lâm sàng bệnh. Sự chênh lệch của kết quả thực nghiệm trên có thể do các nguyên nhân sau:

- Dữ liệu tập huấn cho hệ thống còn ít.

- Sự chuyển độ giữa SXHD-CB và SXHD-VS rất gần nhau [2],[3].

- Chưa có công trình nghiên cứu chính xác về sự béo phì có liên quan đến bệnh nhân vào sốc nhanh hơn bệnh nhân bình thường (nhưng thực tế lâm sàng thấy có sự chênh lệch). Do đó cùng các giá trị như nhau thì có thể bệnh nhân béo phì sẽ vào sốc nhanh hơn.

- Khoãng cách tuổi qua xa. Vì bệnh nhân càng lớn tuổi khả năng vào sốc hiếm hơn [2] . Do đó nếu so sánh cùng tuổi, cùng cân nặng, cùng thời gian nhập viện thì mô hình sinh ra sẽ dự đoán chính xác hơn.

Tuy nhiên qua kết quả trên chúng ta có thể nhận xét được rằng, luận văn đã đạt được mục tiêu đề ra. Là giải pháp có khả năng hỗ trợ bác sĩ dự đoán bệnh SXH (SXH-CB và SXH-VS). Làm giảm tỉ lệ tử vong cũng như chi phí điều trị, cho tất cả những bệnh nhân mắc phải bệnh SXH. Một điều quan trọng hơn thế nữa, chúng ta sẽ thấy được tầm quan trọng của vấn đề KPDL trong lĩnh vực y khoa, mở ra một hướng chẩn đoán và điều trị mới: Kết hợp tri thức chuyên gia bác sĩ và tri thức được trích lọc từ kho dữ liệu HSBA giúp cho việc chẩn đoán bệnh ở mức chính xác cao.

Chương V

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

5.1 KẾT LUẬN

Trong công việc hàng ngày, vai trò của con người vẫn luôn là trọng tâm. Tuy nhiên, thực tế cho thấy, ngày càng có nhiều sự hỗ trợ đắc lực từ phía máy móc và công nghệ. Thật vậy, có thể nói vai trò của khoa học và công nghệ cao là không thể thiếu và đang ảnh hưởng rất lớn tới đời sống của chúng ta. Đó là những công cụ hỗ trợ đắc lực cho con người, giúp cho con người giải quyết vấn đề nhanh chóng, chính xác và hiệu quả hơn, tiết kiệm rất nhiều chi phí. Trong các số đó, một ứng dụng dễ nhận thấy nhất về sự trợ giúp của khoa học công nghệ đối với đời sống con người đó là: Hỗ trợ con người ra quyết định. Trong vai trò nghiên cứu của mình. Bản thân của tác giả là một người cán bộ Y tế (hiện nay đang công tác tại bệnh viện Nhi Đồng – Đồng Nai thuộc phòng KHTH đã thấy được tầm quan trọng của CNTT trong bệnh viện, đặc biệt là sự trợ giúp CNTT hỗ trợ bác sĩ trong vấn đề ra quyết định chẩn đoán bệnh. Tác giả đã chọn công nghệ khai phá tri thức (hay còn gọi là KPDL) để làm cơ sở nghiên cứu luận văn của mình. Qua quá trình nghiên cứu, có thể tóm tắt những kết quả như sau:

5.1.1 Kết quả đạt được 5.1.1.1 Lý thuyết 5.1.1.1 Lý thuyết

Qua quá trình nghiên cứu và tìm hiểu về các vấn đề liên quan tới khai phá dữ liệu, cơ bản đã hoàn thành và đạt được một số kết quả về mặt lý thuyết như sau:

- Giới thiệu về phương pháp KPDL có sử dụng tri thức chuyên gia trong quá trình KPDL hay còn gọi là canh tác dữ liệu. Chứng minh được KPDL có canh tác dữ liệu ưu việt hơn KPDL cổ điển.

- Đưa ra ứng dụng KPDL cụ thể đó là dữ liệu y khoa của bệnh sốt xuất huyết.

- Ngoài vai trò trọng tâm của con người, tác giả cũng chứng minh được rằng công cụ tin học không thể thiếu trong cuộc sống nói chung và trong lĩnh vực y khoa nói riêng. Mở ra một phương pháp chẩn đoán mới: Là sự kết hợp tri thức chuyên gia bác sĩ và tri thức được trích lọc từ cơ sở dữ liệu thông qua công nghệ khám phá tri thức đó là KPDL có canh tác dữ liệu. Đây là công trình nghiên cứu cần được hỗ trợ cũng như được nhân rộng trong các bệnh viện.

- Về Mục đích của luận văn, tác giả đã sử dụng khai phá dữ liệu có canh các dữ liệu để đưa ra chứng cớ (Y học chứng cớ và Y học thực chứng) để hỗ trợ bác sĩ dự đoán sớm vào sốc của bệnh SXH, giảm tử vong cũng như chi phí điều trị của bệnh nhân mắc phải bệnh SXH.

5.1.1.2 Thực nghiệm

- Xây dựng được hệ thống chương trình thực nghiệm.

- Đã tiến hành thực nghiệm với những bệnh nhân đang điều trị tại khoa nhiễm và bệnh án đang lưu trữ tại kho lưu trữ HSBA của bệnh viện Nhi Đồng – Đồng Nai.

- Phân tích được kết quả thực nghiệm: Đạt và không đạt. Bước đầu khả quan hứa hẹn góp phần cải tiến trong chẩn đoán bệnh, cụ thể trong luận văn này là bệnh SXH.

5.1.2 Kết quả chưa đạt được

- Thuật toán C4.5 là một thuật toán hay nhưng so với các thuật toán mới gần đây như See5, C5.0, Sprint thì còn nhiều nhược điểm. Phương pháp để tìm ra luật trong C4.5 là chậm và chiếm nhiều bộ nhớ.

- Dữ liệu tập huấn còn hạn hẹp nên kết quả thực nghiệm đạt được không cao. - KPDL là công nghệ tri thức liên ngành, mới. Việc nghiên cứu trong một khoãng thời gian hạn hẹp thì không thể khám phá hết được chức năng của công nghệ mới này. Do đó, sự vận dụng vào thực tiễn không tránh khỏi những khiếm khuyết. Đây là một vấn đề mà tác giả cũng như bất kỳ học viên nào điều có cùng cảnh ngộ.

5.2 HƯỚNG PHÁT TRIỂN 5.2.1 Lý thuyết

- Nghiên cứu thêm một số thuật toán mới về khai phá dữ liệu bằng cây quyết đinh, tìm hiểu kỹ hơn về các kỹ thuật khai phá dữ liệu khác. - Tìm các phương pháp mới (thuật toán mới) cải tiến các nhược điểm của

các thuật toán sinh cây quyết định được trình bày trong chương III.

5.2.2 Thực hành

- Tập dữ liệu nhiều hơn

- Xây dựng được những chương trình ứng dụng phức tạp và có tính thực tế hơn bằng cây quyết định cụ thể là áp dụng cho nhiều bệnh lý khác nhau.

Trong quá trình nghiên cứu, mặc dù có sự hướng dẫn thật nghiêm túc của Thầy PGS.TS Đặng Trần Khánh, các chuyên gia Điều dưỡng, Y Bác sĩ đầu ngành BV Nhi Đồng – Đồng Nai tư vấn, các bạn ngành Công Nghệ Thông Tin hỗ trợ, cùng với sự nổ lực cá nhân nhưng cũng không thể tránh khỏi những thiếu sót. Tác giả rất chân thành đón nhận từ những đóng góp ý kiến từ các quý Thầy, Cô, các chuyên gia Bác sĩ cũng như bạn bè đồng nghiệp.

Một phần của tài liệu KHAI PHÁ DỮ LIỆU CÓ CANH TÁC DỮ LIỆU VÀ ỨNG DỤNG TRONG KHAI PHÁ DỮ LIỆU Y KHOA LUẬN VĂN THẠC SĨ (Trang 73 -73 )

×