Giao diện WEB của DO

Một phần của tài liệu đề tài nghiên cứu ứng dụng thuật toán trên đồ thị để phân hạng gen,kiểu hình bệnh và ứng dụng trong việc tìm gen gây bệnh mới và mối liên quan mới giữa các bệnh (Trang 32)

4 Bản Đồ Ngữ nghĩa Bệnh (Disease Ontology)

4.4 Giao diện WEB của DO

Giao diện Web của DO được xây dựng sử dụng Web 2. và công nghệ web ngữ nghĩa.Thành phần quan trọng nhất là Neo4j.Neo4j cung cấp các cơ chế nhanh và hiệu quả để lấy được một node cụ thể hoặc duyệt một tập các node thông qua các liên hệ của chúng mặc dù đối với cơ sở dữ liệu quan hệ thì phải cần những phép toán kết hợp phức tạp.

Những gì được xây dựng trong Neo4j là các hàm đã được tối ưu hóa để tìm được các đường đi (tất cả,ngắn nhất,hoặc do người dùng định nghĩa) giữa hai từ khóa - đây là một nhiệm vụ rất thông thường và ý nghĩa trong việc trực quan hóa các mối quan hệ trong ontology.Giao diện

Web của DO tận dụng API RESTful của Neo4j (http://components.neo4j.org/neo4j-server/

snapshot/rest.html) để lấy được các node và các tính chất liên kết giữa chúng thông qua lời gọi ajax HTTP.Điều đó giúp cho các power-user quen thuộc với Neo4j RESTful API có thể yêu cầu dữ liệu từ cơ sở dữ liệu Bản đồ Ngữ nghĩa Bệnh cho các dự án của mình.Hiện tại bất kỳ user nào cũng có thể lấy được siêu dữ liệu (metadata) của các từ khóa DO đặc tả bằng sử dụng REST metadata API thông qua yêu cầu HTTP theo dạng sau :http://www.disease-ontology.org/api/metadata/<DOID>

Một ví dụ khi ta muốn lấy siêu dữ liệu (metadata) cho từ khóa ’transient cerebral ischemia’:

http://www.disease-ontology.org/api/metadata/DOID:224

Truy vấn trên sẻ trả lại một gói JSON chứa tất cả các siêu dữ liệu cho từ khóa trên bao gồm các từ khóa cha,các từ khóa con,các tham chiếu đến tài liệu tham khảo (xref),từ đồng nghĩa,tên,các định danh thay thế và định danh của DO.Trong tương lai nhóm nghiên cứu sẽ xây dựng thêm các lệnh API để thực hiện các thao tác như tìm kiếm các đường đi giữa hai điểm.

Các từ khóa trong DO được mô hình bên trong cơ sở dữ liệu Neo4j với mỗi node trong graph là một term riêng biệt chứa các thuộc tính sau : Tên (Name),DOID,Định nghĩa (Definition),các Từ

Đồng nghĩa (Synonyms),các Định danh Thay thế,các Tham chiếu chéo và Quan hệ.Các cạnh trong cơ sở dữ liệu đồ thị đại diện mối quan hệ giữa các khóa trong ontology.

Giao diện người dùng.Giao diện Web của Do được thiết kế nhằm tập trung vào việc biểu diễn cây bản đồ ngữ nghĩa (ontology tree),kết quả truy vấn,siêu dữ liệu của từ khóa trong DO.

Giao diện bao gồm HTML và CSS nhằm điều khiển layout,kích thước,font và nền.Cây và các thành phần trực quan hóa được thực hiện bằng cách sử dụng ajax kết hợp với sử dụng Ex- tJS và các thư viện jquery dành cho việc thêm các yếu tố và các chức năng GUI.Tất cả dữ liệu text trogn DO (tên,từ đồng nghĩa,định nghĩa ,xref,DOID) có trong chỉ mục Apache Lucene (http://lucene.apache.org/java/docs/index.html.Việc đánh chỉ mục Lucene cho phép người dùng tìm tất cả hoặc bất kỳ một trường nào đó như là tìm các văn bản đã được xử lý bằng một bộ phân tích làm nhiệm vụ lọc các từ dừng (stop words) trong Tiếng Anh và phân đoạn Từ (tokenization) cho phép các truy vấn mềm dẻo mà trả lại một tập các kết quả chứa các kết quả đúng.

Layout (cách bố trí) của trình duyệt DO có thể chia thành 3 phần con khác nhau.Phần ’Search Panel’ cung cấp tất cả những công cụ cần thiết để chạy các truy vấn từ cơ bản đến nâng cao trên DO.Phần ’Navigation Panel’ chứa một mô hình dựa trên cây tương tác cho phép thăm và duyệt các cây con.Phần ’Content Panel’ là nơi đặt kết quả truy vấn và hình ảnh trực quan của các khóa và mối liên hệ giữa các khóa.

[1] N. Guarino, D. Oberle, and S. Staab. What is an ontology. Handbook on Ontologies, 2009.

[2] The Gene Ontology Consortium. Creating the gene ontology resource: Design and implementation. 2001.

[3] William J. Clancey. Is abstraction a kind of idea or how conceptualization works? 2000. [4] Lynn Marie Schriml et al. Disease ontology: a backbone for disease semantic integration.

Nucleic Acids Research, 40, 2012.

[5] Giancarlo Guizzardi. On ontology, ontologies, conceptualizations,modeling languages, and (meta)models. Proceedings of the 2007 conference on Databases and Information Systems IV, 2007.

[6] Nicola Guarino. Formal ontology and information systems. Proceedings of FOIS’98, Trento, Italy, 6-8 June 1998, 1998.

[7] Nadine Schuurman and Agnieszka Leszczynski. Ontologies for bioinformatics. Bioinformatics and Biology Insights, 2008.

[8] Steffen Schulze-Kremer. Ontologies for molecular biology and bioinformatics. In Silico Biology, 2002.

[9] Robert Stevens, Carole Goble, and Sean Bechhofer. Ontology-based knowledge representation for bioinformatics. Brief Bioinform., 2000.

[10] Frederico Fonseca. The double role of ontologies in information science research. Journal of the American Society for Information Science and Technology, 2007.

[11] Hermann Helbig and Ingo Glockner. The role of intensional and extensional interpretation in semantic representations – the intensional and preextensional layers in multinet. 2007.

Một phần của tài liệu đề tài nghiên cứu ứng dụng thuật toán trên đồ thị để phân hạng gen,kiểu hình bệnh và ứng dụng trong việc tìm gen gây bệnh mới và mối liên quan mới giữa các bệnh (Trang 32)

Tải bản đầy đủ (PDF)

(34 trang)