BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH KHÓA LUẬN TỐT NGHIỆP NGÀNH KỸ THUẬT DỮ LIỆU NHẬN DẠNG CÁC KHÁI NIỆM LÂM SÀNG TRONG Y HỌC DỰA TRÊN GHI CHÚ CỦA BỆNH NHÂN GVH[.]
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT THÀNH PHỐ HỒ CHÍ MINH KHĨA LUẬN TỐT NGHIỆP NGÀNH KỸ THUẬT DỮ LIỆU NHẬN DẠNG CÁC KHÁI NIỆM LÂM SÀNG TRONG Y HỌC DỰA TRÊN GHI CHÚ CỦA BỆNH NHÂN GVHD: ThS QCH ĐÌNH HỒNG SVTH: NGƠ TRÍ HUY SKL009501 Tp.Hồ Chí Minh, năm 2022 TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM KHOA CÔNG NGHỆ THƠNG TIN BỘ MƠN KỸ THUẬT DỮ LIỆU Ngơ Trí Huy – 18133015 Đề Tài NHẬN DẠNG CÁC KHÁI NIỆM LÂM SÀNG TRONG Y HỌC DỰA TRÊN GHI CHÚ CỦA BỆNH NHÂN KHÓA LUẬN TỐT NGHIỆP KỸ SƯ KỸ THUẬT DỮ LIỆU GIÁO VIÊN HƯỚNG DẪN ThS QCH ĐÌNH HỒNG KHÓA 2018 – 2022 TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT TP.HCM KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN KỸ THUẬT DỮ LIỆU Ngơ Trí Huy – 18133015 Đề Tài : NHẬN DẠNG CÁC KHÁI NIỆM LÂM SÀNG TRONG Y HỌC DỰA TRÊN GHI CHÚ CỦA BỆNH NHÂN KHÓA LUẬN TỐT NGHIỆP KỸ SƯ KỸ THUẬT DỮ LIỆU GIÁO VIÊN HƯỚNG DẪN ThS QCH ĐÌNH HỒNG KHĨA 2018 – 2022 TRANG NHẬN XÉT CỦA GVHD ĐH Sư Phạm Kỹ Thuật Tp.Hcm Cộng Hòa Xã Hội Chủ Nghĩa Việt Nam KHOA CNTT Độc Lập – Tự Do - Hạnh Phúc Phiếu Nhận Xét Của Giáo Viên Hướng Dẫn Họ tên sinh viên : Ngơ Trí Huy……… MSSV : 18133015…………………… Ngành: Kỹ thuật liệu Tên đề tài: Nhận dạng khái niệm lâm sàng y học dựa ghi bệnh nhân Họ tên giáo viên hướng dẫn: ThS Qch Đình Hồng NHẬN XÉT: Về nội dung đề tài khối lượng thực hiện: ….………………………………………………………………………………………………… ……………………………………………………………………………………………………… ………………………………………………………………………………………… Ưu điểm: ….………………………………………………………………………………………………… ……………………………………………………………………………………………………… ………………………………………………………………………………………… Khuyết điểm: ….………………………………………………………………………………………………… ……………………………………………………………………………………………………… ………………………………………………………………………………………… Đề nghị cho bảo vệ hay không ? Đánh giá loại : Điểm : Tp Hồ chí Minh, ngày tháng năm 2022 Giáo viên hướng dẫn (Ký & ghi rõ họ tên) TRANG NHẬN XÉT CỦA GVPB ĐH Sư Phạm Kỹ Thuật Tp.Hcm Cộng Hòa Xã Hội Chủ Nghĩa Việt Nam KHOA CNTT Độc Lập – Tự Do - Hạnh Phúc Phiếu Nhận Xét Của Giáo Phản Biện Họ tên sinh viên : Ngơ Trí Huy……… MSSV : 18133015…………………… Ngành: Kỹ thuật liệu Tên đề tài: Nhận dạng khái niệm lâm sàng y học dựa ghi bệnh nhân Họ tên giảng viên phản biện: TS Nguyễn Thành Sơn Nhận xét: NHẬN XÉT: Về nội dung đề tài khối lượng thực hiện: ….………………………………………………………………………………………………… ……………………………………………………………………………………………………… ………………………………………………………………………………………… Ưu điểm: ….………………………………………………………………………………………………… ……………………………………………………………………………………………………… ………………………………………………………………………………………… Khuyết điểm: ….………………………………………………………………………………………………… ……………………………………………………………………………………………………… ………………………………………………………………………………………… Đề nghị cho bảo vệ hay không ? Đánh giá loại : Điểm : Tp Hồ chí Minh, ngày tháng năm 2022 Giáo viên phản biện (Ký & ghi rõ họ tên) LỜI CẢM ƠN Em xin chân thành cảm ơn thầy Qch Đình Hồng tận tâm nhiệt tình hướng dẫn em trình thực luận Thầy hướng dẫn dẫn để em có tiểu luận hồn chỉnh Em xin cảm ơn nhà trường tạo điều kiện để em hồn thành thực tiểu luận năm cuối ghế nhà trường Tuy nhiên hạn chế nhiều mặt, nên đề tài khó tránh khỏi sai sót hạn chế định Kính mong nhận phản hồi, đóng góp ý kiến bảo thêm từ Quý Thầy Cơ, để em đạt kiến thức hữu ích, nâng cao trình độ để phục vụ cho nghiệp sau Xin chân thành cảm ơn! TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ KHOA CÔNG NGHỆ THÔNG TIN THUẬT TP.HCM ĐỀ CƯƠNG KHÓA LUẬN TỐT NGHIỆP Họ tên sinh viên : Ngơ Trí Huy……… MSSV : 18133015…………………… Thời gian làm luận văn từ 11/03/2022 đến 12/07/2022 Chuyên ngành: Kỹ thuật liệu Tên luận văn: Nhận dạng khái niệm lâm sàng y học dựa ghi bệnh nhân Họ tên Giáo viên hướng dẫn : ThS Qch Đình Hồng Nhiệm vụ thực • Tìm hiểu mơ hình biểu diễn văn (BERT biến thể) • Tìm hiểu tập liệu từ NBME • Áp dụng mơ hình liệu để giải tốn nhận dạng khái niệm lâm sàng y học dựa ghi bệnh nhân Đề cương viết luận văn PHẦN 1: MỞ ĐẦU PHẦN 2: NỘI DUNG CHƯƠNG TÌM HIỂU BÀI TỐN 1.1 HƯỚNG TIẾP CẬN 1.1.1 Từ khóa 1.1.2 Bài tốn phân loại 1.1.3 Học máy 1.1.4 Các hướng tiếp cận học máy 1.2 CÁC KHÁI NIỆM VÀ MƠ HÌNH ĐỂ GIẢI QUYẾT VẤN ĐỀ 1.2.1 BERT 1.2.2 RoBERTa 1.2.3 DeBERTa 1.2.4 DeBERTa V2 1.3 DỮ LIỆU 1.4 CÁC THAM SỐ ĐÁNH GIÁ 1.4.1 Confusion matrix 1.4.2 Các độ đo đánh giá CHƯƠNG CÁC KHÁI NIỆM LÂM SÀN TRONG Y HỌC VÀ CÁCH MÁY HIỂU CHÚNG 2.1 NGƠN NGỮ TỰ NHIÊN 2.1.1 Ngơn ngữ tự nhiên 2.1.2 Xử lý ngôn ngữ tự nhiên 2.1.3 Transformers 2.1.4 Tokenizer 2.2 CÁCH MÁY HIỂU NGÔN NGỮ TỰ NHIÊN 2.2.1 Giới thiệu ngôn ngữ Python 2.2.2 Đọc ngôn ngữ tự nhiên 2.2.3 Dữ liệu văn vấn đề với ngôn ngữ tự nhiên 2.3 MƠ HÌNH BÀI TỐN 2.4 THỰC HIỆN VÀ GIẢI QUYẾT VẤN ĐỀ THỰC TẾ 2.4.1 Các công việc xử lý liệu 2.4.2 Thực mơ hình CHƯƠNG THỬ NGHIỆM MƠ HÌNH VÀ ỨNG DỤNG 3.1 TRƯỚC KHI XỬ LÝ TẬP DỮ LIỆU 3.1.1 Nguồn liệu 3.1.2 Bài toán kèm theo liệu cách xử lý 3.1.3 Các lớp, thư viện module sử dụng 3.2 HUẤN LUYỆN VÀ ĐÁNH GIÁ MƠ HÌNH HUẤN LUYỆN 3.2.1 Data Loading 3.2.2 Data preprocessing 3.2.3 Processing data 3.2.4 Build Model 3.2.5 Training 3.2.6 Evaluation 3.3 THỰC NGHIỆM VÀ KẾT QUẢ THỰC NGHIỆM (Test Data) 3.3.1 Functions 3.3.2 Submission PHẦN 3: KẾT LUẬN KẾ HOẠCH THỰC HIỆN STT Thời gian Nhiệm vụ Ghi 11/3 - 23/3 Tìm hiểu đề tài Phân tích đề tài, phân biệt data 24/3 - 10/4 Tìm hiểu tư liệu Tìm hiểu BERT nhóm mơ hình BERT 11/4 - 28/4 Tìm hiểu ngơn ngữ tự nhiên 29/4 - 22/5 Thực mơ hình 23/5 - 10/6 11/6 - 26/6 Cách máy hiểu ngôn ngữ tự nhiên, tiền xử lý liệu Thực hàm xử lý liệu, tinh kagge chỉnh tham số DeBERTa Thêm đoạn code Thực phương thức xử lý, hàm notebook độ đo đánh giá, thông số model Thực báo cáo Chỉnh sửa theo hướng dẫn GVHD chỉnh sửa thuyết trình thêm số nội dung 27/6 - 12/7 Báo cáo chỉnh sửa hoàn chỉnh Ngày … tháng … năm 2022 Người viết đề cương Ý kiến giảng viên hướng dẫn (Ký ghi rõ họ tên) ThS QCH ĐÌNH HỒNG (Ký ghi rõ họ tên) NGƠ TRÍ HUY