Tập tài nguyên xây dựng ontology biểu hiệ ny sinh mở rộng

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu một số mô hình học ontology và ứng dụng trong miền dầu khí (Trang 51 - 53)

2.1. PHÁT BIỂU BÀI TOÁN VÀ MÔ HÌNH GIẢI QUYẾT

2.1.2. Tập tài nguyên xây dựng ontology biểu hiệ ny sinh mở rộng

Như đã được giới thiệu, luận án đề nghị một mô hình học ontology xây dựng một bộ nhận dạng thực thể biểu hiện y sinh dựa trên việc xây dựng tự động tập ví dụ huấn luyện được tích hợp từ hai ontology. Ontololy biểu hiện người

Mammalian Phenotype Ontology là hai nguồn tài nguyên đầu vào cơ bản trong pha xây dựng một ontology biểu hiện y sinh mở rộng.

Human Phenotype Ontology

Human Phenotype Ontology (HPO)7 là một kho dữ liệu chuẩn về biểu hiện của con người nhằm cung cấp một từ vựng chuẩn của các biểu hiện bất thường gặp phải trong các bệnh của con người [69]. Các thuật ngữ trong HPO mô tả một biểu hiện bất thường, chẳng hạn như khiếm tật vách tâm nhĩ.

HPO ban đầu được phát triển bằng cách sử dụng thông tin từ Online Mendelian Inheritance in Man (OMIM)8, đây là nguồn dữ liệu rất quan trọng rất lớn trong lĩnh vực gen người và hơn thế nữa. HPO hiện đang được phát triển bằng cách sử dụng thông tin từ OMIM và tài liệu y khoa, có khoảng 10000 thuật ngữ. Hơn 50000 nhãn cho các bệnh di truyền có thể tải xuống hoặc có thể được duyệt bằng PhenExplorer. Dự án HPO khuyến khích đầu tư từ cộng đồng y học và di truyền học liên quan đến ontology và các nhãn lâm sàng.

Mammalian Phenotype Ontology

Mammalian Phenotype Ontology (MP)9 là một kho ngữ liệu chuẩn về biểu hiện y sinh của động vật (điển hình là chuột) [72]. Một ontology chứa các thuật ngữ mô tả các đặc tính biểu hiện của chuột. Ontology này cho phép so sánh dữ liệu từ các nguồn khác nhau, có thể tạo điều kiện so sánh giữa các loài động vật có vú, giúp xác định các mô hình bệnh thực nghiệm thích hợp và hỗ trợ trong việc khám phá các gen bệnh ứng cử viên và các con đường tín hiệu phân tử. Các thuật ngữ mức cao nhất mô tả các hệ sinh lý, sự sống và hành vi. Các hệ thống sinh lý phân ra thành thuật ngữ biểu hiện hình thái và sinh lý ở cấp nút tiếp theo. Ontology này giúp phân loại và tổ chức các thông tin biểu hiện liên quan đến chuột và các loài động vật có vú khác, Ontology MP áp dụng cho các mô tả biểu hiện của chuột trong Mouse Genome Informatics Database (MGI10) và Rat

7https://hpo.jax.org/app/ 8https://www.omim.org/

9https://www.ebi.ac.uk/ols/ontologies/mp 10 http://www.informatics.jax.org

Genome Database (RGD11), Online Mendelian Inheritance in Animals (OMIA12).

MP có khoảng 8800 thuật ngữ đơn nhất (khoảng 23700 từ đồng nghĩa) mô tả biểu hiện bất thường của chuột và phần mềm OBO-Edit duy trì và bổ sung các thuật ngữ mới, từ đồng nghĩa và các mối quan hệ cho MP.

Một số kho tài nguyên y sinh khác

Ngoài hai ontology biểu hiện y sinh trên đây, luận án sử dụng một số kho tài nguyên y sinh khác như liệt kê dưới đây;

PATO: Một ontology phẩm chất biểu hiện. Ontology có thể được sử dụng kết hợp với các ontology khác như GO hoặc các ontology giải phẫu để chỉ các biểu hiện

FMA: Một ontology miền đại diện cho một cơ thể mạch lạc của các kiến thức khai báo rõ ràng về giải phẫu người. Ontology khung của nó có thể được áp dụng và mở rộng cho tất cả các loài khác

MA: Ontology chuột giải phẫu được phát triển để cung cấp danh pháp chuẩn hóa cho các cấu trúc giải phẫu trong chuột sau khi sinh

UMLS DISEASE: Các khái niệm về bệnh trong UMLS

45CLUSTERS: 45 cụm do Richard Socher và Christopher Manning khởi nguồn từ PubMed

UMLS: Một tập các tiện ích và phần mềm kết hợp nhiều từ vựng và tiêu chuẩn y tế và y sinh. Nó có ba công cụ: Metathesaurus, mạng ngữ nghĩa và các công cụ Lexicon và Lexical SPECIALIST. Các kho tài nguyên y sinh này được sử dụng để bổ sung một số đặc trưng trong biểu diễn dữ liệu khi xây dựng mô hình học máy EM-BS đoán nhận thực thể biểu hiện y sinh.

Một phần của tài liệu (LUẬN án TIẾN sĩ) nghiên cứu một số mô hình học ontology và ứng dụng trong miền dầu khí (Trang 51 - 53)

Tải bản đầy đủ (PDF)

(150 trang)