Hướng đến khung phần mềm khai thác thông tin y tế dựa trên khái niệm

6 12 0
Hướng đến khung phần mềm khai thác thông tin y tế dựa trên khái niệm

Đang tải... (xem toàn văn)

Thông tin tài liệu

Mục tiêu bài báo trình bày đề xuất hướng tới một khung phần mềm tổng quát cho hệ thống khai thác văn bản y tế. Với ý nghĩa là cung cấp cái nhìn tổng thể của một hệ thống khai thác văn bản y tế cần có để làm cơ sở phát triển các hệ thống khai thác thông tin y tế, giúp cho cộng đồng nghiên cứu tiết kiệm được thời gian và công sức phát triển hệ thống khai thác thông tin y tế. Mời các bạn cùng tham khảo!

HƢỚNG ĐẾN KHUNG PHẦN MỀM KHAI THÁC THÔNG TIN Y TẾ DỰA TRÊN KHÁI NIỆM Huỳnh Hữu Nghĩa Khoa Giáo dục Đại cương, Đại học Lao động – Xã hội, thành phố Hồ Chí Minh TĨM TẮT Cộng đồng nghiên cứu quan tâm đến lĩnh vực khai thác văn y tế, họ đưa tốn liên quan đến mơ hình khai thác thơng tin y tế tổng quát, chẳng hạn như: rút trích khái niệm y tế rút trích mối quan hệ khái niệm Ngoài ra, cộng đồng phát triển số nguồn tài nguyên công cụ hỗ trợ khai thác thơng tin y tế Các tốn giải cách rời rạc, chưa có kết nối tự động chưa có khung kiến trúc chung khai thác văn y tế đáp ứng nhu cầu thông tin đa dạng người dùng Mục tiêu báo trình bày đề xuất hướng tới khung phần mềm tổng quát cho hệ thống khai thác văn y tế Với ý nghĩa cung cấp nhìn tổng thể hệ thống khai thác văn y tế cần có để làm sở phát triển hệ thống khai thác thông tin y tế, giúp cho cộng đồng nghiên cứu tiết kiệm thời gian công sức phát triển hệ thống khai thác thơng tin y tế Từ khóa: Khai thác thơng tin y tế, rút trích khái niệm y tế, rút trích mối quan hệ y tế GIỚI THIỆU Những tiến tin học y tế hồ sơ bệnh án điện tử (EHR), hệ thống chăm sóc y tế ứng dụng y sinh học (biomedical) sinh khối lượng liệu lớn lưu trữ hàng trăm sở liệu Ngoài ra, việc số hóa liệu y tế quan trọng báo cáo phịng thí nghiệm, tài liệu nghiên cứu hình ảnh giải phẫu tạo liệu chăm sóc bệnh nhân khổng lồ lưu trữ máy tính Sự phát triển Internet làm xuất nhiều trang web tư vấn cách chăm sóc sức khỏe đặc biệt phát triển bách khoa tồn thư mở Wikipedia chia sẻ thơng tin hình ảnh y khoa Bên cạnh đó, ngày nhiều tạp chí y khoa điện tử đăng tải thành tựu khoa học kỹ thuật y khoa Đây nguồn tài nguyên liệu lớn cung cấp thơng tin bổ ích cho người dùng lĩnh vực y tế Trong lĩnh vực y tế, người dùng như: bác sĩ, y tá, nhà nghiên cứu y khoa, sinh viên chuyên ngành y khoa, công ty bảo hiểm, bệnh nhân người thân bệnh nhân có nhu cầu thơng tin đa dạng như: Bác sĩ cần chứng từ tài liệu khoa học để hỗ trợ định lâm sàng thực hành Sinh viên chuyên ngành nhà nghiên cứu y khoa cần chứng từ tài liệu huấn luyện, trường hợp điều trị cụ thể thực hiện, kết xét nghiệm chẩn đoán, tạp chí, báo sách có liên quan hay tóm tắt thơng tin quan trọng, ví dụ trường hợp cụ thể y tế Bệnh nhân người thân bệnh nhân cần tìm hiểu biết nguyên nhân bệnh, điều kiện điều trị y khoa, lựa chọn cách điều trị, theo dõi trình điều trị Các công ty bảo hiểm cần giám sát việc sử dụng điều kiện điều trị với chi phí thấp, kiểm sốt rủi ro hỗ trợ mức dịch vụ tốt nhất, xác minh thủ tục chẩn đoán theo dõi kết điều trị Nhằm đáp ứng nhu cầu người dùng nêu trên, việc phát triển mơ hình khai thác thơng tin y tế dựa khái niệm mối quan hệ cần thiết với tính tự động gồm phân tích nội dung tài liệu y tế, rút trích khái niệm, rút trích mối quan hệ khái niệm, tổ chức lưu trữ (khái niệm mối quan hệ) thành kho tri thức phát triển ứng dụng tương tác người dùng nhằm cung cấp tri thức cho người dùng 199 Khai thác văn y tế dựa mô hình khai thác khái niệm mối quan hệ trình xử lý liên quan đến ứng dụng như: phân tích nội dung tài liệu, rút trích khái niệm mối quan hệ từ nội dung tài liệu để phục vụ cho lớp ứng dụng khác như: lập mục, tìm kiếm, tóm tắt tài liệu, hỗ trợ tư vấn người dùng, Các ứng dụng thao tác tài liệu tập tài liệu, gọi kho ngữ liệu (Corpus) sử dụng số tài ngun ngơn ngữ học danh sách cho trước (Gazetteers), danh mục từ (lexicons), ontology,… Khi ứng dụng phát triển cách rời rạc, thao tác kho ngữ liệu với định dạng khác dẫn đến hệ khơng thể tích hợp trao đổi kết với nhau, mà u cầu khơng thể thiếu q trình khai thác tài liệu y tế Kết ứng dụng đầu vào cho ứng dụng khác để hình thành nên ứng dụng hồn chỉnh Cụ thể như: với ứng dụng rút trích mối quan hệ khái niệm cần phải thực việc rút trích khái niệm trước Khi toán (con) cài đặt theo cách khác nhau, thao tác định dạng tài liệu khác khó để kết nối lại với Chính lý nhìn tốn khai thác văn y tế mức tổng quát hơn, xác định rõ đối tượng liệu xử lý tham gia vào tốn từ đưa khung kiến trúc chung để tích hợp chúng lại với tổng thể hồn chỉnh dễ dàng cho việc phát triển, tích hợp tiến hố hệ thống khai thác tài liệu y tế Mục tiêu báo trình bày đề xuất hướng đến phát triển khung phần mềm khai thác thông tin y tế dựa khái niệm nhằm hỗ trợ phát triển hệ thống ứng dụng khai thác thông tin y tế dựa khái niệm HƢỚNG ĐẾN KHUNG PHẦN MỀM KHAI THÁC THÔNG TIN Y TẾ DỰA TRÊN KHÁI NIỆM Qua loạt nghiên cứu [1–8] tác giả tổng hợp đề xuất khung phần mềm khai thác thông tin y tế dựa khái niệm biểu diễn hình Khung phần mềm đề xuất phát triển theo kiến trúc thành phần, đảm bảo tính đóng gói khớp nối lỏng lẻo thành phần Mỗi thành phần gồm nhiều thành phần con, thành phần công việc (bài toán) cụ thể, thiết kế dạng khe cắm (plugins) nhằm mục tiêu tháo lắp dễ dàng tạo tính linh hoạt cho khung phần mềm Chi tiết thành phần khung phần mềm trình bày sau: 2.1 Thành phần xử lý ngôn ngữ tự nhiên Thành phần xử lý ngôn ngữ tự nhiên quản lý tất công cụ chương trình hỗ trợ trình xử lý chuyển đổi văn khơng có cấu trúc bán cấu trúc dạng có cấu trúc (đoạn (paragraph), câu (sentence), từ (token), … ) để xử lý tự động hay thủ cơng máy tính Các chức gồm tách đoạn, tách câu, tách token, gán nhãn từ loại (part-of-speech), phân tích cấu trúc cú pháp cấu trúc phụ thuộc từ câu Ngoài chức nêu bổ sung thêm chức chuẩn hoá từ, chức chuẩn hoá từ nhiều hệ thống xử lý ngôn ngữ tự nhiên áp dụng nhằm biến đổi từ xuất văn từ gốc chuẩn để tăng hiệu cho hệ thống 2.2 Thành phần nguồn tài nguyên Thành phần nguồn tài nguyên quản lý tất tài nguyên hỗ trợ cho thành phần rút trích khái niệm rút trích mối quan hệ Các nguồn tài nguyên bao gồm kho ngữ liệu gán nhãn khái niệm mối quan hệ, từ điển thuộc lĩnh vực y tế, nguồn tri thức ngôn ngữ ontology y tế 200 2.3 Thành phần rút trích khái niệm Thành phần rút trích khái niệm quản lý chương trình với chức liên quan đến tốn rút trích khái niệm y tế, tốn rút trích khái niệm chia thành tốn như: rút trích khái niệm [5,6], mở rộng chữ viết tắt chuẩn hố khái niệm[5,6] Các cơng trình nghiên cứu trước đây, gom chung việc mở rộng ký tự/chữ viết tắt vào tốn rút trích khái niệm dẫn đến hiệu thấp tập trung ký tự/chữ viết tắt, diễn đàn nghiên cứu ShARe/CLEF eHealth 2013 tách chức xác định ký tự/chữ viết tắt thành toán mở rộng ký tự/chữ viết tắt mời gọi cộng đồng nghiên cứu đề xuất giải pháp giải Hình Khung phần mềm khai thác thông tin y tế dựa khái niệm 2.4 Thành phần rút trích mối quan hệ khái niệm Thành phần rút trích mối quan hệ thực chức liên quan đến tốn rút trích mối quan hệ khái niệm y tế Bài tốn rút trích mối quan hệ gồm nhiều toán cụ thể như: phân lớp mối quan hệ định nghĩa trước khái niệm y tế (như: vấn đề y tế, điều trị xét nghiệm) I2B2 2010, phân lớp mối quan hệ đồng tham chiếu định nghĩa lĩnh vực y tế (các đồng thm chiếu như: người “coref_person”, vấn đề y tế “coref_problem”, điều trị “coref_treatment” xét nghiệm “coref_test”) I2B2 2011, phân lớp mối quan hệ thời gian bệnh/rối loạn thời gian viết tài liệu, xác định giá trị cho thuộc tính khái niệm (hay gọi tốn điền mẫu) [2,3,4,7] rút trích kiện [1] 2.5 Thành phần ứng dụng Thành phần ứng dụng phần thiếu hệ thống khai thác thông tin y tế dựa khái niệm mối quan hệ, quản lý chương trình ứng dụng cung cấp thông tin cho người dùng Việc biểu diễn khái niệm mối quan hệ khái niệm cho người dùng dễ dàng đọc hiểu thật không đơn giản Trong diễn đàn nghiên cứu ShARe/CLEF eHealth 2014 đưa tốn thách thức “Tìm kiếm tương tác trực quan khám phá liệu y tế” yêu cầu người tham gia thiết kế hiển thị tương tác nhằm giúp cho bệnh nhân hiểu rõ tóm tắt xuất viện họ khám phá thêm tài liệu liên quan 201 từ nguồn tài liệu Internet khía cạnh khác bối cảnh họ Ngoài ra, việc kết hợp, biểu diễn khái niệm mối quan hệ để xây dựng thành phác đồ điều trị khác liên quan đến bệnh cụ thể tái lịch sử bệnh án bệnh nhân, … điều vô quan trọng người dùng bác sĩ, nhà nghiên cứu y khoa hay người thực hành y tế Việc phát triển chương trình ứng dụng tương tác thân thiện với người dùng cần phải có nghiên cứu sâu nhu cầu thông tin người dùng lĩnh vực y tế Phần báo trình bày tình nghiên cứu đề cập đến kịch cụ thể tổ chức CLEF eHealth 2014 đưa task 1: Information Visualisation TÌNH HUỐNG NGHIÊN CỨU Hiện nay, bệnh nhân thân nhân gặp khó khăn việc đọc hiểu nội dung hồ sơ bệnh án, hồ sơ bệnh án có nhiều ký tự/chữ viết tắt thuật ngữ chuyên ngành, việc bệnh nhân thân nhân hiểu biết bệnh án giúp cho trình điều trị tốt Cụ thể, đoạn tài liệu tóm tắt xuất viện bệnh viện Mỹ sau: “AP: 72 yo f w/ ESRD on HD, CAD, HTN, asthma p/w significant hyperkalemia & associated arrythmias.” với nội dung bệnh nhân thân nhân hiểu ý nghĩa cách xác thật không đơn giản Một kịch tổ chức CLEF eHealth đưa bệnh nhân người dùng khác dễ dàng hiểu thơng tin y tế sau tài liệu y tế xử lý nhận diện khái niệm, mở rộng chữ viết tắt, sửa chữa lỗi tả, chuẩn hóa tất điều kiện y tế đến thuật ngữ chuẩn liên kết thuật ngữ xuất tài liệu mà người dùng muốn tìm kiếm Internet Trong trường hợp câu ví dụ cụ thể nêu có kết xử lý sau: “Description of the patient's active problem: 72 year old female with dependence on hemodialysis, coronary heart disease, hypertensive disease, and asthma who is currently presenting with the problem of significant hyperkalemia and associated arrhythmias (Việc mô tả vấn đề thực bệnh nhân: người phụ nữ 72 tuổi với quen thuốc thẩm tách máu, bệnh tim mạch vành, bệnh tăng huyết áp hen suyễn người mà định với vấn đề việc tăng kali huyết đáng kể loạn nhịp tim liên quan).” với kết người dùng dễ dàng hiểu nội dung tài liệu sau chữ viết tắt mở rộng, thuật ngữ nhận diện Bên cạnh thuật ngữ (chữ đậm) xuất tài liệu liên kết đến định nghĩa liên quan nguồn tài nguyên có sẵn thân thiện với người dùng Chẳng hạn, số nguồn tài nguyên như: Wikipedia, Consumer Health Vocabulary, SNOMED-CT … Hơn nữa, cung cấp việc giải thích mối quan hệ thuật ngữ xuất tài liệu thông qua nguồn tài ngun Ví dụ, từ nguồn tài ngun có sẵn trích đoạn văn giải thích mối quan hệ hai thuật ngữ hyperkalemia (tăng kali huyết) arrhythmias (loạn nhịp tim) sau: “Extreme hyperkalemia (having too much potassium in the blood) is a medical emergency due to the risk of potentially fatal arrhythmias (abnormal heart rhythms) (Việc tăng kali huyết cực độ (có nhiều kali máu) tình trạng cấp cứu y tế nguy loạn nhịp tim gây tử vong (nhịp tim bất thường)).” việc giải thích giúp cho người dùng hiểu biết nhiều nội dung tài liệu Ngoài ra, việc cung cấp tài liệu đáng tin cậy liên quan đến vấn đề y tế người dùng quan trọng nhằm giúp cho hiểu biết bệnh nhân Sự hiểu biết giúp hỗ trợ cho bác sĩ trình điều trị tốt Một hệ thống giải kịch nêu cần phải có chức sau: làm bậc khái niệm y tế xuất tài liệu (rút trích khái niệm), chuẩn hóa khái niệm, xác định giá trị cho thuộc tính khái niệm (rút trích mối quan hệ), liên kết khái niệm đến nguồn tài ngun có sẵn nhằm giải thích ngữ nghĩa cho khái niệm tìm kiếm tài liệu y tế có liên quan đến khái niệm Việc phát triển hệ thống đáp ứng nhu cầu người dùng theo kịch khơng phải hai đạt cộng đồng nghiên cứu lĩnh vực 202 bước thực Kịch tác giả vận dụng tình nghiên cứu cụ thể minh họa việc sử dụng đề xuất “Hướng đến khung phần mềm khai thác thông tin y tế dựa khái niệm” để phát triển công cụ phần mềm phục vụ cho bệnh nhân người thân hiểu rõ ràng ý nghĩa khái niệm xuất tóm tắt xuất viện bệnh nhân TRIỂN KHAI HỆ THỐNG PHẦN MỀM DỰA TRÊN KHUNG ĐỀ XUẤT Dựa khung kiến trúc phần mềm khai thác thông tin y tế dựa khái niệm đề xuất để phát triển hệ thống phần mềm với mục đích hỗ trợ bệnh nhân thân nhân dễ dàng đọc hiểu nội dung tài liệu hồ sơ bệnh án điện tử, tóm tắt xuất viện Hệ thống tự động phân tích nội dung tài liệu, nhận diện khái niệm y tế, xác định giá trị chuẩn hố cho thuộc tính liên quan đến khái niệm liên kết khái niệm xuất tài liệu đến nguồn tri thức mở liên quan Internet như: MedLine, Wikipedia trang web y tế Để hỗ trợ người dùng dễ dàng đọc hiểu nội dung tài liệu lâm sàng, toán áp dụng tình nghiên cứu mơ tả sau: người dùng mở tài liệu lâm sàng (tóm tắt xuất viện, kết xét nghiệm, …) thông qua giao diện tương tác người dùng, khái niệm xuất tài liệu tự động làm bật lên, ánh xạ khái niệm đến ontologies thuộc lĩnh vực y tế (UMLS, …) để xác định khái niệm trùng với thuật ngữ định nghĩa ontology hiển thị mã số định danh (CUI) tương ứng ngược lại gán giá trị “CUI-less”, tạo liên kết khái niệm nguồn tài nguyên liên quan đến giải thích ý nghĩa khái niệm truy hồi tài liệu liên quan đến khái niệm cho biết giá trị chuẩn hoá thuộc tính liên quan đến khái niệm (xem hình 2) Hình Hệ thống khai thác khái niệm mối quan hệ tài liệu lâm sàng 203 KẾT LUẬN Khung phần mềm tổng quát dùng để phát triển hệ thống khai thác thông tin y tế dựa khái niệm cần thiết Bài báo trình bày đề xuất hướng đến khung phần mềm tổng quát khai thác thông tin y tế dựa khái niệm Với đề xuất cho thấy thành phần quan trọng cần có hệ thống khai thác thông tin y tế Bài báo trình bày việc sử dụng khung phần mềm đề xuất để phát triển hệ thống phần mềm cụ thể hỗ trợ bệnh nhân người thân dễ dàng hiểu khái niệm y tế xuất hồ sơ bệnh án hay tóm tắt xuất viện đọc Trong thời gian tới, khung phần mềm hoàn thiện trở thành khung phần mềm tổng quát thuận lợi tiết kiệm chi phí cho việc phát triển thống phần mềm khai thác thông tin y tế dựa khái niệm lĩnh vực y tế tương lai Khung phần mềm trở thành khung phần mềm có kiến trúc mở linh hoạt nguồn mở TÀI LIỆU THAM KHẢO [1] Huỳnh Hữu Nghĩa, Hồ Bảo Quốc Hệ Thống Rút Trích Sự Kiện Trên Văn Bản Sinh Học Kỷ yếu Hội nghị Quốc gia lần thứ VII Nghiên cứu ứng dụng Công nghệ thông tin (FAIR), pages 160-166, Thái Nguyên, ngày 19–20/06/2014, ISBN: 978-604-913-300-8 DOI 10.15625/FAIR VII.2014-0337 [2] Huynh Huu Nghia, Vu Son Lam and Ho Bao Quoc ShARe/CLEFeHealth: A Hybrid Approach for Task Working Notes for CLEF 2014 Conference, pages 103 – 110, Sheffield, UK, September 1518, 2014 ISSN 1613-0073, Vol-1180 [3] Huỳnh Hữu Nghĩa, Vũ Sơn Lâm, Hồ Bảo Quốc Một Hướng Tiếp Cận Xác Định Mối Quan Hệ Bệnh Thời Gian Viết Tài Liệu Lâm Sàng Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc Công nghệ thông tin Truyền thông, pages 155 – 160, Đắk Lắk, 30-31/10/2014 [4] Huỳnh Hữu Nghĩa, Hồ Bảo Quốc, Nguyễn An Tế Một Hướng Tiếp Cận Rút Trích Mối Quan Hệ Y Tế Tạp chí: Phát triển khoa học & cơng nghệ, Đại học Quốc Gia Thành phố Hồ Chí Minh, tập 20, số Q3-2017, trang 51-63 ISSN 2588 – 1051 [5] Huỳnh Hữu Nghĩa, Hồ Bảo Quốc Rút trích chuẩn hóa khái niệm y tế tài liệu lâm sàng Kỷ yếu Hội nghị Quốc gia lần thứ X Nghiên cứu ứng dụng Công nghệ thông tin (FAIR’10), pages 832-840, Đà Nẵng, ngày 17–18/08/2017 ISBN: 978-604-913-614-6 [6] Huynh Nghia, Ho Quoc TeamHCMUS: Analysis fo Clinical Text Proceedings of the 9th International Workshop on Semantic Evaluation (SemEval 2015), pages 370–374, Denver, Colorado, June 4-5, 2015 ISBN 978-1-941643-24-2 [7] Huynh Nghia, Ho Quoc A Combined Approach for Disease/Disorder Template Filling Proceedings: 2015 Seventh International Conference on Knowledge and Systems Engineering, pages 328–331 Ho Chi Minh City, Vietnam, October 2015 ISBN 978-1-4673-8013-3/15 $31.00 © 2015 IEEE DOI 10.1109/KSE.2015.62 204 ... triển khung phần mềm khai thác thông tin y tế dựa khái niệm nhằm hỗ trợ phát triển hệ thống ứng dụng khai thác thông tin y tế dựa khái niệm HƢỚNG ĐẾN KHUNG PHẦN MỀM KHAI THÁC THÔNG TIN Y TẾ DỰA TRÊN... xuất hướng đến khung phần mềm tổng quát khai thác thông tin y tế dựa khái niệm Với đề xuất cho th? ?y thành phần quan trọng cần có hệ thống khai thác thơng tin y tế Bài báo trình b? ?y việc sử dụng khung. .. thành khung phần mềm tổng quát thuận lợi tiết kiệm chi phí cho việc phát triển thống phần mềm khai thác thông tin y tế dựa khái niệm lĩnh vực y tế tương lai Khung phần mềm trở thành khung phần mềm

Ngày đăng: 30/09/2021, 11:35

Tài liệu cùng người dùng

Tài liệu liên quan