1. Trang chủ
  2. » Luận Văn - Báo Cáo

DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON

51 40 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 51
Dung lượng 2,42 MB

Nội dung

Luận văn đã tìm hiểu về quy trình nghiên cứu thuốc và quy trình xác định các tác dụng phụ của thuốc sau khi đưa vào thị trường sử dụng, cũng như nguồn dữ liệu y sinh khổng lồ từ Pubmed, dựa vào đây luận văn cũng đã tìm hiểu được về các đặc trưng trong việc phân tích dữ liệu văn bản, đồng thời đã áp dụng thành công mô hình lai giữa mạng nơ ron tích chập và mạng nơ ron hồi quy trong việc dự đoán tác dụng phụ của thuốc từ y văn.

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ──────── * ─────── NGUYỄN ĐỨC ĐƠNG DỰ ĐỐN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN HÀ NỘI 06 – 2021 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ──────── * ─────── NGUYỄN ĐỨC ĐƠNG DỰ ĐỐN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON NGÀNH : CƠNG NGHỆ THÔNG TIN CHUYÊN NGÀNH : HỆ THỐNG THÔNG TIN MÃ SỐ : 8480104.01 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS ĐẶNG THANH HẢI HÀ NỘI 06 – 2021 LỜI CAM ĐOAN Với mục đích học tập, nghiên cứu để nâng cao kiến thức trình độ chun mơn nên tơi làm luận văn cách nghiêm túc hoàn tồn trung thực Trong luận văn tơi có sử dụng số tài liệu tham khảo số tác giả Tơi thích nêu phần tài liệu tham khảo cuối luận văn Tôi xin cam đoan chịu trách nhiệm nội dung trung thực luận văn tốt nghiệp Thạc sĩ Hà Nội, ngày 20 tháng 06 năm 2021 Nguyễn Đức Đông LỜI CẢM ƠN Lời đầu tiên, xin chân thành cảm ơn các thầy cô giáo trường Đại Học Công Nghệ - Đại học Quốc Gia Hà Nội, đặc biệt các thầy cô khoa Công Nghệ Thông Tin truyền đạt cho kiến thức, kinh nghiệm vô quý báu suốt thời gian học tập trường Tôi xin gửi lời cảm ơn đến TS Đặng Thanh Hải – giảng viên khoa Công Nghệ Thông tin – Trường Đại học Cơng Nghệ tận tình giúp đỡ hướng dẫn tận tình suốt trình làm luận văn Cuối cùng, tơi xin cảm ơn đến gia đình, bạn bè động viên, đóng góp ý kiến giúp đỡ q trình nghiên cứu hồn thành luận văn Do thời gian, kiến thức kinh nghiệm tơi cịn hạn chế nên khóa luận khơng thể tránh khỏi sai sót Tơi hy vọng nhận ý kiến nhận xét, góp ý thầy giáo bạn để đồ án hồn Tôi xin chân thành cảm ơn! Hà Nội, ngày 20 tháng 06 năm 2021 Nguyễn Đức Đông MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN MỤC LỤC DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT DANH MỤC HÌNH VẼ DANH MỤC BẢNG BIỂU MỞ ĐẦU 10 CHƯƠNG 1: CƠ SỞ LÝ THUYẾT 12 1.1 THUỐC VÀ QUY TRÌNH PHÁT TRIỂN THUỐC 12 1.1.1 Quy trình phát triển thuốc (Drug development process) 12 1.1.2 Tác dụng phụ thuốc 14 1.2 KHAI PHÁ DỮ LIỆU VÀ CÁC THUẬT NGỮ LIÊN QUAN 15 1.2.1 Định nghĩa khai phá liệu 15 1.2.2 Bài toán phân lớp liệu 15 1.2.3 Học sâu mạng nơ ron 16 1.2.4 Đánh giá mô hình phân lớp 20 CHƯƠNG 2: DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC 21 2.1 Bài toán dự đoán tác dụng phụ thuốc từ y văn 21 2.1.1 Bài toán nhận dạng thực thể bệnh lý thực thể thuốc (Named Entity Recognition – NER) [11] 21 2.1.2 Bài tốn trích xuất mối quan hệ bệnh lý thuốc gây (ChemicalInduced Disease – CID) 22 2.2 Bộ liệu BioCreative V CDR 24 2.2.1 Giới thiệu Pubmed 24 2.2.2 Dữ liệu quan hệ thuốc bệnh - BioCreative V CDR 24 2.2.3 Cấu trúc kho liệu BioCreative V CDR 25 2.2.4 Cách thức xử lý liệu BioCreative V CDR làm đầu vào cho tốn trích xuất quan hệ thuốc bệnh lý 28 2.3 Mơ hình lai dựa mạng nơ ron 31 2.3.1 Mơ hình lai dựa mạng nơ ron 31 2.3.2 Word embedding 33 2.3.3 Position embedding 34 2.3.4 Word relation embedding 34 CHƯƠNG 3: THỰC NGHIỆM VÀ KẾT LUẬN 36 3.1 Cài đặt thực nghiệm 36 3.1.1 Cách thức thực 36 3.1.2 Các tham số thiết lập mơ hình 37 3.2 Thử nghiệm 38 3.2.1 Cấu hình phần cứng 38 3.2.2 Kết thực cho mơ hình học kiểm tra tập liệu test 38 3.3 Đánh giá 40 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 41 TÀI LIỆU THAM KHẢO 42 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Ký hiệu viết tắt Thuật ngữ đầy đủ Giải thích ADR Adverse drug reaction Tác dụng phụ thuốc AI Artificial Intelligence Trí tuệ nhân tạo CDR Chemical-Disease Relations Mối quan hệ bệnh lý thuốc CID Chemical-Induced Disease Bệnh lý thuốc gây CNN Convolutional neural network Mạng nơ ron tích chập DL Deep Learning Học sâu DNN Deep Neural Networks Mạng nơ ron sâu LSTM Long Short-Term Memory Mơ hình nhớ ngắn hạn ML Machine Learning Học máy NCBI National Center for Trung tâm quốc gia thông Biotechnology Information tin công nghệ sinh học NER Named Entity Recognition NLM U.S National Medicine RNN Recurrent neural network Mạng nơ ron hồi quy SDP Shortest Dependency Path Dường dẫn phụ thuộc ngắn WHO World Health Organization Tổ chức y tế giới XML Extensible Markup Language Ngơn ngữ đánh dấu mở rộng Nhận dạng thực thể Library of Thư viện Quốc gia Hoa kỳ DANH MỤC HÌNH VẼ Hình 1.1 – Quy trình nghiên cứu thuốc [02] 13 Hình 1.2 – Mối quan hệ trí tuệ nhân tạo, học máy, học sâu [01] 17 Hình 1.3 – Cấu trúc nơ ron [14] 18 Hình 1.4 – Mơ hình mạng nơ ron tích chập [14] 18 Hình 1.5 – Mạng nơ ron hồi quy hai chiều [14] 19 Hình 2.1 – Dữ liệu định dạng BioC BioCreative V CDR 27 Hình 2.2 – Dữ liệu định dạng PubTator BioCreative V CDR 28 Hình 2.3 – Biểu diễn thực thể thuốc bệnh lý nhận dạng y văn cặp quan hệ thuốc bệnh lý phát văn liệu BioCreative V CDR 30 Hình 2.4 – Mơ hình thuật tốn lai dựa mạng nơ ron tích chập hồi quy [20] 32 Hình 2.5 – Đồ thị quan hệ phụ thuộc đồ thị quan hệ phụ thuộc tối thiểu [20] 35 Hình 3.1 – Cách thức thực dự đoán tác dụng phụ thuốc 36 Hình 3.2 – Đồ thị biểu diễn độ xác q trình học thuật tốn 39 DANH MỤC BẢNG BIỂU Bảng 1.1 – Các giai đoạn phát triển thuốc [16] 14 Bảng 1.1 – Phân loại tác dụng phụ sử dụng thuốc [13] 15 Bảng 2.1 – Bảng mô tả đầu vào đầu việc nhận dạng thực thể bệnh lý thực thể thuốc 21 Bảng 2.2 – Bảng độ đo với các phương pháp nhận dạng thực thể bệnh lý thực thể thuốc [11] 22 Bảng 2.3 – Bảng mô tả đầu vào đầu việc trích xuất mối quan hệ thuốc bệnh 22 Bảng 2.4 – Cấu trúc liệu BioCreative V CDR 25 Bảng 2.5 – So sánh liệu BioCreative V CDR với nguồn liệu khác 25 Bảng 2.6 – Kết đầu trình tiền xử lý liệu BioCreative V CDR làm đầu vào cho mơ hình phân lớp 31 Bảng 3.1 – Các tham số thiết lập mơ hình chạy thuật tốn 37 Bảng 3.2 – Cấu hình phần cứng chạy thử nghiệm thuật toán 38 Bảng 3.3 – Bảng độ đo kết thực (lấy trung bình) 39 Bảng 3.4 – Bảng so sánh kết mơ hình đề xuất với số mơ hình nghiên cứu trước 40 MỞ ĐẦU Tác dụng phụ thuốc phản ứng không mong muốn bao gồm có lợi có hại người dùng sử dụng hoặc vài loại thuốc Thơng thường nhà sản xuất thuốc có mục tác dụng không mong muốn hướng dẫn sử dụng thuốc để liệt kê danh sách loại tác dụng phụ biết đến xác nhận Tuy nhiên thực tế có nhiều tác dụng phụ khác thuốc phát cơng trình nghiên cứu, các y văn (độ tin tưởng cao) hoặc trang mạng xã hội (độ tin tưởng thấp hơn) chưa liệt kê vào hướng dẫn sử dụng thuốc Ở Châu Âu, tác dụng phụ thuốc (ADRs - Adverse drug reactions) gây số lượng bệnh tử vong đáng kể [06] Người ta ước tính khoảng 5% số bệnh nhân nhập viện nguyên nhân tác dụng phụ thuốc, khoảng 5% bệnh nhân điều trị bị ảnh hưởng bới tác dụng phụ thời gian chữa trị, gây khoảng khoảng 197,000 ca tử vong tồn Châu Âu [06] Tác dụng phụ thuốc ảnh hưởng tới 77 tỉ đô la ngân sách chăm sóc sức khỏe Mỹ năm [20] Thông thường tác dụng phụ thuốc nhà sản xuất nghiên cứu đưa trình phát triển thuốc tổng hợp dựa vào báo cáo trực tiếp người dùng cho nhà sản xuất thuốc Ngồi cịn cách khác nhà sản xuất chủ động phân tích các văn y sinh nói thuốc để tìm xem nghiên cứu có tác dụng phụ hay không Nguồn văn đáng tin cậy thường sử dụng y văn, văn thuộc lĩnh vực y sinh Nhưng công việc vô tốn thời gian, tốn khó để lọc tất liệu liên quan các y văn công bố hàng ngày, hàng Theo số lượng công bố Pubmed (https://pubmed.ncbi.nlm.nih.gov/), số lượng báo cơng bố hàng năm ngày tăng lên điển năm 2020 có ~1,6 triệu văn y khoa công bố Đây nguồn tư liệu quý giá mang tính khoa học cao Nếu sử dụng nguồn liệu để thực phân tích cách tự động mang lại lợi ích lớn Mạng nơ ron tích chập mạng nơ ron hồi quy mạng nơ ron sử dụng nhiều tốn trích xuất quan hệ y sinh, mạng nơ ron có điểm mạnh riêng Bằng cách kết hợp các điểm mạnh mơ hình mạng nơ ron tích chập mạng nơ ron hồi quy để tận dụng các điểm mạnh loại, xây dựng mơ hình tốt cho toán trích xuất quan hệ Và lý tác giả định chọn đề tài “Dự đoán tác dụng phụ thuốc từ y văn sử dụng mô hình lai dựa mạng nơ ron” để thực phân tích tác dụng phụ thuốc từ y văn 10 Bước cần phải thực tiền xử lý liệu Do liệu lấy từu BioCreative V CDR liệu bao gồm tiêu đề tóm tắt văn y sinh, thực tách câu xử lý liệu để nhận biết câu có cặp thuốc – bệnh lý tương ứng mối quan hệ chúng (có/khơng) Chi tiết việc xử lý liệu mô tả mục 2.2.4 Dữ liệu sau tiền xử lý đưa vào bước để trích chọn đặc trưng Các đặc trưng sử dụng luận văn bao gồm Word embedding, Position embedding, Word relation embedding Chi tiết các đặc trưng mô tả mục 2.3.2, 2.3.3 2.3.4 Để đảm bảo tính khách quan, sau liệu trích chọn đặc trưng, thực lặp lặp lại việc xây dựng mơ hình thuật tốn kiểm tra kết tập liệu test 3.1.2 Các tham số thiết lập mơ hình Cách thức lựa chọn tham số tối ưu: Luận văn sử dụng phương pháp chạy qua tham số tìm tham số có độ đo điều hòa F sau chạy đạt giá trị lớn Đối với tham số, mơ hình chạy lặp lại 10 lần lấy kết độ đo điều hịa F trung bình 10 lần làm giá trị để đánh giá các tham số tốt hay khơng tốt Giá trị độ đo điều hịa F trung bình cao tốt Sau trình chạy lặp lại tham số, tác giả tìm tham số tối ưu sau: Tên tham số Giá trị Batch size 128 CNN hidden units 100 CNN kernel size Position dimension 50 Dropout rate 0.5 LSTM units 64 Learning rate 0.001 Bảng 3.1 – Các tham số thiết lập mơ hình chạy thuật tốn 37 3.2 Thử nghiệm 3.2.1 Cấu hình phần cứng Cấu hình Chỉ số CPU Intel(R) Core(TM) i5-8300H CPU @ 2.3 - GHz RAM 12 GB OS Ubuntu 18.4 Bảng 3.2 – Cấu hình phần cứng chạy thử nghiệm thuật tốn 3.2.2 Kết thực cho mơ hình học kiểm tra tập liệu test Với tham số tối ưu lựa chọn mục 3.1.2, kết thu tối ưu thể bảng 3.3: precision recall f-score 58.94 54.53 56.65 58.33 58.36 58.35 54.51 59.62 56.95 54.98 66.60 60.24 55.37 58.68 56.98 56.85 61.57 59.12 61.68 43.02 50.69 55.61 61.13 58.24 57.06 60.75 58.85 61.30 40.44 48.73 Giá trị trung bình 10 lần 57.46 56.47 38 56.96 Bảng 3.3 – Bảng độ đo kết thực (lấy trung bình) Nhìn vào số liệu bảng 3.3, thấy độ đo trung bình điều hịa F mơ hình đề xuất giao động khoảng từ [48.73-60.24], mức thấp 50% có ghi, cịn lại từ 56% trở lên có ghi chứng tỏ tham số mơ hình chạy đạt kết tốt từ 56% với xác suất lớn Kết trình thử nghiệm đáp ứng việc phân lớp mối quan hệ cặp thuốc bệnh lý vào tập “Có quan hệ”, đáp ứng mục tiêu đề việc dự đoán tác dụng phụ thuốc y văn Hình 3.2 – Đồ thị biểu diễn độ xác q trình học thuật tốn Nhìn vào hình 3.2, thấy q trình học thuật tốn, việc kiểm tra chéo (đường test) khơng tiệm cận tới độ xác đường train (gần 1), chứng tỏ mơ hình khơng bị overfitting, mơ hình đề xuất đáp ứng việc đưa vào kiểm tra với tập liệu test So sánh mơ hình đề xuất với số mơ hình khác sử dụng chung tập liệu BioCreative V CDR cho toán dự đoán tác dụng phụ thuốc 39 Phương thức Hệ thống Luận văn Mô tả thực CNN+Bi-LSTM Machine learning Zhou cộng không sử dụng [21] KB P R F 57.46 56.47 56.96 CNN 41.1 55.3 47.2 LSTM 54.9 51.4 53.1 LSTM+SVM 64.9 49.3 56.0 LSTM+SVM+PP 55.6 68.4 61.3 62 55.1 58.3 59.6 44.0 50.7 Gu cộng [09] ME Xu cộng [19] SVM Bảng 3.4 – Bảng so sánh kết mơ hình đề xuất với số mơ hình nghiên cứu trước Nhìn vào bảng 3.4 so sánh kết quả, ta thấy mơ hình đề xuất tác giả luận văn cho kết trung bình mức tương đối tốt so với các mơ hình đề xuất trước Các độ đo mơ hình đề xuất có tính hài hịa so với mơ hình cịn lại 3.3 Đánh giá Dựa vào kết thực nghiệm, số kết luật rút sau: - - Mơ hình sử dụng luận văn thành công việc dự đoán tác dụng phụ thuốc chạy tập liệu BioCreative V CDR Khi so sánh với thuật toán khác dùng, tác giả thấy mơ hình sử dụng luận văn cho kết dự đoán khá tương đồng so với nghiên cứu trước Tuy nhiên kết thấp so với số thuật tốn khác cách tính kết cuối trung bình lần chạy (một số lần chạy có độ đo điều hịa F tương đối tối 58% ~60% - xuất lần tổng số 10 lần chạy) 40 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Với số lương nghiên cứu y văn ngày lớn, việc trích xuất thơng tin cách tự động từ kho liệu khổng lồ ngày quan trọng có ý nghĩa Rất nhiều phương pháp tiếp cận khác nhà khoa học sử dụng, có các phương thức học máy nghiên cứu mang lại hiệu tốt Trong luận văn này, tác giả áp dụng thành cơng mơ hình lai mạng nơ ron tích chập mạng nơ ron hồi quy áp dụng vào việc dự đoán tác dụng phụ thuốc từ y văn với độ xác tốt, áp dụng vào thực tế Trong tương lai, tác giả tiếp tục thu thập bổ sung các phương pháp, việc sử dụng sở liệu tri thức y sinh (Knowledge Base) áp dụng mơ hình lai dựa mạng nơ ron hay việc áp dụng thêm số đặc trưng khác để, để cải tiến hiệu dự đoán thuật toán tìm cách tối ưu các tham số thuật toán tự động để đạt kết cao 41 TÀI LIỆU THAM KHẢO Tiếng Việt [01] PGS.TS Nguyễn Hà Nam, PGS.TS Hà Quang Thụy, PGS.TS Nguyễn Trí Thành (2013) “Giáo trình Khai Phá Dữ Liệu”, NXB ĐHQGHN Tiếng Anh [02] Bianca Blanch, Molecular Cardiology Program, Centenary Institute of Cancer Medicine and Cell Biology, Camperdown, Australia; Sydney Medical School, University of Sydney, Camperdown, Australia (2019) “Encyclopedia of Pharmacy Practice and Clinical Pharmacy”, http://dx.doi.org/10.1016/B978-012-812735-3.00201-6 [03] Bouvy JC, De Bruin ML, Koopmanschap MA (2015) “Epidemiology of adverse drug reactions in Europe: a review of recent observational studies.” Drug Saf; pp.437-53 https://doi.org/10.1007/s40264-015-0281-0 PMID: 25822400; PMCID: PMC4412588 [04] Chih-Hsuan Wei, Alexis Allot, Robert Leaman, Zhiyong Lu (2019) “PubTator central: automated concept annotation for biomedical full text articles”, Nucleic Acids Research, Volume 47, Issue W1, pp.587–593, https://doi.org/10.1093/nar/gkz389 [05] Comeau,D.C., Dogan,R.I., Ciccarese,P et al (2013) “BioC: a minimalist approach to interoperability for biomedical text processing”, Database (Oxford), bat064 [06] European Commission (2008) “Proposal for a regulation amending, as regards pharmacovigilance of medicinal products for human use Regulation (EC) No 726/2004”, Impact assessment [07] Gurulingappa,H., Rajput,A.M., Roberts,A et al (2012) “Development of a benchmark corpus to support the automatic extraction of drug-related adverse effects from medical case reports”, J Biomed Inf., 45, pp.885–892 [08] Gurulingappa,H., Klinger,R., Hofmann-Apitius,M et al (2010) “An Empirical Evaluation of Resources for the Identification of Diseases and Adverse Effects in Biomedical Literature”, In: The 2nd Workshop on Building and evaluating resources for biomedical text mining Valetta, Malta [09] Gu,J., Qian,L., and Zhou,G (2016) “Chemical-induced disease relation extraction with various linguistic features” Database (Oxford), baw042 [10] Hand DJ, Mannila H, Smyth P (2001) “Principles of data mining”, MIT Press, Massachusetts 42 [11] Hemati, W., Mehler, A (2019) “LSTMVoter: chemical named entity recognition using a conglomerate of sequence labeling tools”, J Cheminform 11, https://doi.org/10.1186/s13321-018-0327-2 [12] I Aizenberg, N.N Aizenberg, and J P.L Vandewalle (2000) “Multi-Valued and Universal Binary Neurons: Theory, Learning and Applications”, Springer Science & Business Media [13] Kant, A., Bilmen, J., & Hopkins, P M (2019) “Adverse Drug Reactions Pharmacology and Physiology for Anesthesia”, pp.130–143 https://doi.org/10.1016/b978-0-323-48110-6.00007-7 [14] LeCun, Y., Bengio, Y., & Hinton, G (2015) “Deep learning Nature, 521(7553)”, pp.436–444 https://doi.org/10.1038/nature14539 [15] Mulligen,E.M.V., Fourrier-Reglat,A., Gurwitz,D et al (2012) “The EU-ADR corpus: annotated drugs, diseases, targets, and their relationships” J Biomed Inf., 45, pp.879–884 [16] Pennington Jeffrey, Socher Richard, Manning Christopher (2014) “GloVe: Global Vectors for Word Representation”, Association for Computational Linguistics, https://doi.org/10.3115/v1/D14-1162 [17] Sinha S., Vohora D (2017) “Drug Discovery and Development: An Overview”, Pharmaceutical Medicine and Translational Clinical Research, , pp 19-32 [18] WHO (1972) “International drug monitoring: the role of national centres” Tech Rep Ser WHO, no 498 [19] Xu,J., Wu,Y.H., Zhang,Y.Y et al (2016) “CD-REST: a system for extracting chemical-induced disease relation in literature”, Database (Oxford), baw036 [20] Yijia Zhang, Hongfei Lin, Zhihao Yang, Jian Wang, Shaowu Zhang, Yuanyuan Sun, Liang Yang (2018) “A hybrid model based on neural networks for biomedical relation extraction”, Journal of Biomedical Informatics, Volume 81, pp.83-92 [21] Zhou,H.W., Deng,H., Chen,L et al (2016) “Exploiting syntactic and semantics information for chemical-disease relation extraction”, Database (Oxford), baw048 43 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CƠNG NGHỆ CỘNG HỊA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc Hà Nội, ngày 17 tháng 07 năm 2021 BẢN XÁC NHẬN ĐÃ SỬA CHỮA CÁC THIẾU SÓT CỦA LUẬN VĂN Trường Đại học Cơng nghệ có Quyết định số 416/QĐ-ĐT ngày 27 tháng 05 năm 2021 việc thành lập Hội đồng chấm luận văn Thạc sĩ cho học viên Nguyễn Đức Đông, sinh ngày 26/10/1988, Bắc Ninh, chuyên ngành Hệ thống thông tin, ngành Hệ thống thông tin Ngày 10 tháng 07 năm 2021, Trường Đại học Công nghệ (ĐHCN) tổ chức cho học viên bảo vệ luận văn Thạc sĩ trước Hội đồng chấm (có biên kèm theo) Theo Quyết nghị Hội đồng chấm luận văn Thạc sĩ, học viên phải bổ sung sửa chữa điểm sau trước nộp luận văn cuối cho Nhà trường để hoàn thiện hồ sơ sau bảo vệ: Bổ sung trình bày tốn tác dụng phụ thuốc gì, cách chuyển đổi việc nhận dạng thành toán phân lớp nào, cấu trúc tập liệu sao, cách xử lý liệu, làm tăng tính logic làm người đọc dễ hiểu (tại mục 2.1, 2.2.4) Sử dụng thuật ngữ sử dụng rộng rãi “Trí tuệ nhân tạo” (mục 1.2.3.1 – trang 19), “Độ phủ”, “Trung bình điều hịa” (mục 1.2.4 – trang 23) thay cho thuật ngữ bị sai khác Chỉnh sửa lại ngày tháng luận văn với thời điểm (06/2021) Sử dụng công thức chuẩn cho việc tính tốn độ đo precicion recall (tại mục 1.2.4.2) Chỉnh sửa tham chiếu định dạng ngoặc vuông Chỉnh sửa mục bị đánh sai (3.1 nhảy đến 3.1.1.1), 3.1.1 Chỉnh sửa lại cách đánh số thứ tự hình vẽ bảng theo tiền tố chương Bổ sung diễn dải tập liệu BioCreative V CDR thực nghiệm để phục vụ cho toán nhận dạng thực thể bệnh thuốc mối quan hệ bệnh thuốc (mục 2.2.3 – trang 31) Bổ sung mô tả chi tiết mơ hình Bi-RNN CNN sử dụng mơ hình lai, bổ sung cách thức tiến hành thực nghiệm (tại mục 2.3.1, 3.1.1, 3.1.2) 10 Bổ sung trích dẫn bảng biểu, hình vẽ sử dụng luận văn 11 Chuẩn hóa lại phần tài liệu tham khảo theo quy định 12 Bổ sung phần phân tích kết thu giải thích bảng/hình số liệu kết (tại mục 3.2.2 – trang 42,43) 13 Sửa lại bảng tóm tắt bổ sung từ thiếu, xếp lại theo thứ tự bảng chữ (trang 7) 14 Chỉnh sửa lại nội dung phần mở đầu mục trình phát triển thuốc, bổ sung trích dẫn (trang 10 trang 12) 15 Chỉnh sửa lại định nghĩa khai phá liệu theo trích dẫn (trang 16) 16 Chỉnh sửa lại mục trích dẫn theo quy định nhà trường (trang 43, 44) Ngày 17 tháng 07 năm 2021, học viên nộp luận văn có chỉnh sửa Chúng tơi nhận thấy nội dung, hình thức luận văn tóm tắt luận văn sửa chữa, bổ sung theo điểm Quyết nghị Đề nghị Trường Đại học Công nghệ, ĐHQG HN cho phép học viên làm thủ tục khác để công nhận cấp Thạc sĩ Xin trân trọng cảm ơn! XÁC NHẬN CỦA THÀNH VIÊN HỘI ĐỒNG/HỘI ĐỒNG ĐỀ NGHỊ HỌC VIÊN SỬA CHỮA LUẬN VĂN HỌC VIÊN CÁN BỘ HƯỚNG DẪN XÁC NHẬN CỦA CƠ SỞ ĐÀO TẠO ... 2.3 Mơ hình lai dựa mạng nơ ron 2.3.1 Mơ hình lai dựa mạng nơ ron Như phần lý thuyết biết, mạng nơ ron tích chập (CNN) mạng nơ ron hồi quy (RNN) mạng nơ ron phổ biến mạng nơ ron học sâu Trong năm... thuốc từ y văn sử dụng mô hình lai dựa mạng nơ ron? ?? để thực phân tích tác dụng phụ thuốc từ y văn 10 Luận văn có bố cục gồm chương chính: Chương 1: Cơ sở lý thuyết Chương giới thiệu tổng quan thuốc, ... ─────── NGUYỄN ĐỨC ĐƠNG DỰ ĐỐN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON NGÀNH : CƠNG NGHỆ THÔNG TIN CHUYÊN NGÀNH : HỆ THỐNG THÔNG TIN MÃ SỐ : 8480104.01 LUẬN VĂN THẠC

Ngày đăng: 09/09/2021, 01:23

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[01] PGS.TS Nguyễn Hà Nam, PGS.TS Hà Quang Thụy, PGS.TS Nguyễn Trí Thành. (2013) “Giáo trình Khai Phá Dữ Liệu”, NXB ĐHQGHN.Tiếng Anh Sách, tạp chí
Tiêu đề: Giáo trình Khai Phá Dữ Liệu
Nhà XB: NXB ĐHQGHN. Tiếng Anh
[02] Bianca Blanch, Molecular Cardiology Program, Centenary Institute of Cancer Medicine and Cell Biology, Camperdown, Australia; Sydney Medical School, University of Sydney, Camperdown, Australia. (2019) “Encyclopedia of Pharmacy Practice and Clinical Pharmacy”, http://dx.doi.org/10.1016/B978-0-12-812735-3.00201-6 Sách, tạp chí
Tiêu đề: Encyclopedia of Pharmacy Practice and Clinical Pharmacy
[03] Bouvy JC, De Bruin ML, Koopmanschap MA. (2015) “Epidemiology of adverse drug reactions in Europe: a review of recent observational studies.”Drug Saf; pp.437-53. https://doi.org/10.1007/s40264-015-0281-0. PMID:25822400; PMCID: PMC4412588 Sách, tạp chí
Tiêu đề: Epidemiology of adverse drug reactions in Europe: a review of recent observational studies.” "Drug Saf
[04] Chih-Hsuan Wei, Alexis Allot, Robert Leaman, Zhiyong Lu. (2019) “PubTator central: automated concept annotation for biomedical full text articles”, Nucleic Acids Research, Volume 47, Issue W1, pp.587–593, https://doi.org/10.1093/nar/gkz389 Sách, tạp chí
Tiêu đề: PubTator central: automated concept annotation for biomedical full text articles”, "Nucleic Acids Research
[05] Comeau,D.C., Dogan,R.I., Ciccarese,P. et al. (2013) “BioC: a minimalist approach to interoperability for biomedical text processing”, Database (Oxford), bat064 Sách, tạp chí
Tiêu đề: BioC: a minimalist approach to interoperability for biomedical text processing
[06] European Commission. (2008) “Proposal for a regulation amending, as regards pharmacovigilance of medicinal products for human use. Regulation (EC) No 726/2004”, Impact assessment Sách, tạp chí
Tiêu đề: Proposal for a regulation amending, as regards pharmacovigilance of medicinal products for human use. Regulation (EC) No 726/2004”
[07] Gurulingappa,H., Rajput,A.M., Roberts,A. et al. (2012) “Development of a benchmark corpus to support the automatic extraction of drug-related adverse effects from medical case reports”, J. Biomed. Inf., 45, pp.885–892 Sách, tạp chí
Tiêu đề: Development of a benchmark corpus to support the automatic extraction of drug-related adverse effects from medical case reports
[08] Gurulingappa,H., Klinger,R., Hofmann-Apitius,M. et al. (2010) “An Empirical Evaluation of Resources for the Identification of Diseases and Adverse Effects in Biomedical Literature”, In: The 2nd Workshop on Building and evaluating resources for biomedical text mining. Valetta, Malta Sách, tạp chí
Tiêu đề: An Empirical Evaluation of Resources for the Identification of Diseases and Adverse Effects in Biomedical Literature
[09] Gu,J., Qian,L., and Zhou,G. (2016) “Chemical-induced disease relation extraction with various linguistic features”. Database (Oxford), baw042 Sách, tạp chí
Tiêu đề: Chemical-induced disease relation extraction with various linguistic features
[10] Hand DJ, Mannila H, Smyth P. (2001) “Principles of data mining”, MIT Press, Massachusetts Sách, tạp chí
Tiêu đề: Principles of data mining
[11] Hemati, W., Mehler, A. (2019) “LSTMVoter: chemical named entity recognition using a conglomerate of sequence labeling tools”, J Cheminform 11, 3. https://doi.org/10.1186/s13321-018-0327-2 Sách, tạp chí
Tiêu đề: LSTMVoter: chemical named entity recognition using a conglomerate of sequence labeling tools
[12] I. Aizenberg, N.N. Aizenberg, and J. P.L. Vandewalle (2000). “Multi-Valued and Universal Binary Neurons: Theory, Learning and Applications”, Springer Science & Business Media Sách, tạp chí
Tiêu đề: Multi-Valued and Universal Binary Neurons: Theory, Learning and Applications
Tác giả: I. Aizenberg, N.N. Aizenberg, and J. P.L. Vandewalle
Năm: 2000
[13] Kant, A., Bilmen, J., & Hopkins, P. M. (2019). “Adverse Drug Reactions. Pharmacology and Physiology for Anesthesia”, pp.130–143.https://doi.org/10.1016/b978-0-323-48110-6.00007-7 Sách, tạp chí
Tiêu đề: Adverse Drug Reactions. Pharmacology and Physiology for Anesthesia
Tác giả: Kant, A., Bilmen, J., & Hopkins, P. M
Năm: 2019
[14] LeCun, Y., Bengio, Y., & Hinton, G. (2015). “Deep learning. Nature, 521(7553)”, pp.436–444. https://doi.org/10.1038/nature14539 Sách, tạp chí
Tiêu đề: Deep learning. Nature, 521(7553)
Tác giả: LeCun, Y., Bengio, Y., & Hinton, G
Năm: 2015
[15] Mulligen,E.M.V., Fourrier-Reglat,A., Gurwitz,D. et al. (2012) “The EU-ADR corpus: annotated drugs, diseases, targets, and their relationships”. J. Biomed.Inf., 45, pp.879–884 Sách, tạp chí
Tiêu đề: The EU-ADR corpus: annotated drugs, diseases, targets, and their relationships
[16] Pennington Jeffrey, Socher Richard, Manning Christopher. (2014) “GloVe: Global Vectors for Word Representation”, Association for Computational Linguistics, https://doi.org/10.3115/v1/D14-1162 Sách, tạp chí
Tiêu đề: GloVe: Global Vectors for Word Representation
[17] Sinha S., Vohora D. (2017) “Drug Discovery and Development: An Overview”, Pharmaceutical Medicine and Translational Clinical Research, , pp. 19-32 [18] WHO. (1972) “International drug monitoring: the role of national centres”.Tech Rep Ser WHO, no 498 Sách, tạp chí
Tiêu đề: Drug Discovery and Development: An Overview”, "Pharmaceutical Medicine and Translational Clinical Research", , pp. 19-32 [18] WHO. (1972) “International drug monitoring: the role of national centres
[21] Zhou,H.W., Deng,H., Chen,L. et al. (2016) “Exploiting syntactic and semantics information for chemical-disease relation extraction”, Database (Oxford), baw048 Sách, tạp chí
Tiêu đề: Exploiting syntactic and semantics information for chemical-disease relation extraction”, "Database (Oxford)

HÌNH ẢNH LIÊN QUAN

LSTM Long Short-Term Memory Mô hình bộ nhớ ngắn hạn - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
ong Short-Term Memory Mô hình bộ nhớ ngắn hạn (Trang 7)
Hình 1.1 – Quy trình nghiên cứu thuốc [02] - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
Hình 1.1 – Quy trình nghiên cứu thuốc [02] (Trang 13)
Bảng 1.1 – Các giai đoạn phát triển thuốc [2] - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
Bảng 1.1 – Các giai đoạn phát triển thuốc [2] (Trang 14)
Bảng 1.2 – Phân loại các tác dụng phụ khi sử dụng thuốc [13] - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
Bảng 1.2 – Phân loại các tác dụng phụ khi sử dụng thuốc [13] (Trang 15)
Hình 1.2 – Mối quan hệ giữa trí tuệ nhân tạo, học máy, học sâu [01] - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
Hình 1.2 – Mối quan hệ giữa trí tuệ nhân tạo, học máy, học sâu [01] (Trang 17)
Hình 1.3 – Cấu trúc một nơ ron [14] - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
Hình 1.3 – Cấu trúc một nơ ron [14] (Trang 18)
Một số loại mạng nơ ron sâu điển hình có thể kể đến mạng nơ ron kết nối đầy đủ  (Fully  connected  deep  neural  network),  mạng  nơ  ron  tích  chập  (Convolutional  neural network – CNN), mạng nơ ron hồi quy (Recurrent neural network – RNN)  - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
t số loại mạng nơ ron sâu điển hình có thể kể đến mạng nơ ron kết nối đầy đủ (Fully connected deep neural network), mạng nơ ron tích chập (Convolutional neural network – CNN), mạng nơ ron hồi quy (Recurrent neural network – RNN) (Trang 18)
Hình 1. 5– Mạng nơ ron hồi quy hai chiều [14] - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
Hình 1. 5– Mạng nơ ron hồi quy hai chiều [14] (Trang 19)
CHƯƠNG 2: DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
2 DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC (Trang 21)
Bảng 2.1 – Bảng mô tả đầu vào và đầu ra đối với việc nhận dạng thực thể bệnh lý và thực thể thuốc  - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
Bảng 2.1 – Bảng mô tả đầu vào và đầu ra đối với việc nhận dạng thực thể bệnh lý và thực thể thuốc (Trang 21)
Bảng 2.2 – Bảng độ đo với các phương pháp nhận dạng thực thể bệnh lý và thực thể thuốc [11]  - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
Bảng 2.2 – Bảng độ đo với các phương pháp nhận dạng thực thể bệnh lý và thực thể thuốc [11] (Trang 22)
6794356 29 Tricuspid valve regurgitation Disease D014262 6794356    34 51 lithium carbonate  Chemical   D016651  - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
6794356 29 Tricuspid valve regurgitation Disease D014262 6794356 34 51 lithium carbonate Chemical D016651 (Trang 27)
Hình 2.3 – Biểu diễn các thực thể thuốc và bệnh lý được nhận dạng tron gy văn và các cặp quan hệ thuốc và bệnh lý được phát hiện trong văn bản trên dữ  - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
Hình 2.3 – Biểu diễn các thực thể thuốc và bệnh lý được nhận dạng tron gy văn và các cặp quan hệ thuốc và bệnh lý được phát hiện trong văn bản trên dữ (Trang 30)
Bảng 2. 6– Kết quả đầu ra của quá trình tiền xử lý dữ liệu BioCreativ eV CDR làm đầu vào cho mô hình phân lớp  - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
Bảng 2. 6– Kết quả đầu ra của quá trình tiền xử lý dữ liệu BioCreativ eV CDR làm đầu vào cho mô hình phân lớp (Trang 31)
học tốt các đặc trưng từ vựng và cú pháp cục bộ. Ngược lại, mô hình mạng nơ ron hồi quy có kiến trúc mạng nơ ron tuần tư và mạn hơn trong việc nắm bắt các đặc trưng phụ  thuộc liên kết nhau - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
h ọc tốt các đặc trưng từ vựng và cú pháp cục bộ. Ngược lại, mô hình mạng nơ ron hồi quy có kiến trúc mạng nơ ron tuần tư và mạn hơn trong việc nắm bắt các đặc trưng phụ thuộc liên kết nhau (Trang 32)
Hình 2. 5– Đồ thị quan hệ phụ thuộc và đồ thị quan hệ phụ thuộc tối thiểu [20]  - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
Hình 2. 5– Đồ thị quan hệ phụ thuộc và đồ thị quan hệ phụ thuộc tối thiểu [20] (Trang 35)
Để đảm bảo tính khách quan, việc xây dựng mô hình và kiểm tra kết quả được lặp lại >= 10 lần và lấy  độ  đo trung bình điều hòa  F (trung  bình các lần) làm đầu ra  đánh giá kết quả của thuật toán - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
m bảo tính khách quan, việc xây dựng mô hình và kiểm tra kết quả được lặp lại >= 10 lần và lấy độ đo trung bình điều hòa F (trung bình các lần) làm đầu ra đánh giá kết quả của thuật toán (Trang 36)
3.1.2. Các tham số thiết lập mô hình - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
3.1.2. Các tham số thiết lập mô hình (Trang 37)
3.2.1. Cấu hình phần cứng - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
3.2.1. Cấu hình phần cứng (Trang 38)
Cấu hình Chỉ số - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
u hình Chỉ số (Trang 38)
Bảng 3.3 – Bảng độ đo kết quả thực hiện (lấy trung bình) - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
Bảng 3.3 – Bảng độ đo kết quả thực hiện (lấy trung bình) (Trang 39)
Bảng 3.4 – Bảng so sánh kết quả của mô hình đề xuất với một số mô hình đã được nghiên cứu trước đây  - DỰ ĐOÁN TÁC DỤNG PHỤ CỦA THUỐC TỪ Y VĂN SỬ DỤNG MÔ HÌNH LAI DỰA TRÊN MẠNG NƠ RON
Bảng 3.4 – Bảng so sánh kết quả của mô hình đề xuất với một số mô hình đã được nghiên cứu trước đây (Trang 40)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w