1. Trang chủ
  2. » Luận Văn - Báo Cáo

đề tài nghiên cứu ứng dụng thuật toán trên đồ thị để phân hạng gen,kiểu hình bệnh và ứng dụng trong việc tìm gen gây bệnh mới và mối liên quan mới giữa các bệnh

34 709 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 34
Dung lượng 1,84 MB

Nội dung

Trong trường hợp đầu tiên ,chúng ta đang nhắc đến một từ khóa trong Triết học,được đặt tên chomột nhánh triết học liên quan tới hình thái tự nhiên natural và cấu trúc structure của "Thực

Trang 1

BÁO CÁO CHUYÊN ĐỀ

Tên chuyên đề 4.3: Nghiên cứu và khảo sát cơ sở dữ liệu bản

đồ ngữ nghĩa gien (GO: Gene Ontology), bản đồ ngữ nghĩa bệnh (DO:Disease Ontology)

Tên đề tài: Nghiên cứu ứng dụng thuật toán trên đồ thị để phân hạng gien, kiểu hình bệnh và ứng dụng trong việc tìm gien gây bệnh mới và mối liên quan mới giữa các bệnh

Mã số : B2014-01-84

HÀ NỘI-2014

Trang 2

List of Figures iv

1.1 Ontology và ontology 1

1.2 Tổ hợp Khái niệm là gì ? 3

1.3 Vai trò của Ngôn ngữ trong việc mô tả Tổ hợp Khái Niệm 6

1.4 Định nghĩa Ontology 7

1.4.1 Các thành phần chính của Ontology 8

1.4.2 Các loại Ontology và vấn đề Thống nhất thông tin 11

2 Bản đồ Ngữ nghĩa ứng dụng trong Tin sinh học 12 2.1 Tại sao ontology lại quan trọng với Sinh học ? 12

2.2 Khảo sát các Ontology sinh học hiện có 14

3 Bản Đồ Ngữ nghĩa Gene (Gene Ontology) 15 3.1 Đề án thiết lập Bản đồ Ngữ nghĩa Gene 15

3.2 Ontology Consortium 16

3.2.1 Các Ontology thành phần 16

3.2.2 Cấu trúc của Gene Ontology 17

3.2.2.1 Cấu trúc của mỗi Khóa (Term) 17

Các thành tố cơ bản 17

Các thành tố phụ thêm 18

3.2.3 Các quan hệ trong GO 20

Quan hệ is a : 20

Quan hệ part of : 20

Mối quan hệ has part : 20

Mối quan hệ điều hòa (regulates) : 21

3.2.4 Cơ sở Dữ liệu Gene Ontology 21

3.2.4.1 Dữ liệu bên trong GO database 21

3.2.4.2 Các cách truy cập có hiệu lực 22

(a) Truy cập trực tuyến : 22

(b) Cài đặt cục bộ : 23

3.2.4.3 Truy vấn GO database 23

ii

Trang 3

Truy vấn thông qua AmiGO 23

Truy vấn trong SQL 23

Truy vấn thông qua perl 23

Truy vấn thông qua java 23

4 Bản Đồ Ngữ nghĩa Bệnh (Disease Ontology) 24 4.1 Giới thiệu về Bản đồ Ngữ nghĩa Bệnh 24

4.2 Phạm vi và mục tiêu của DO 25

4.3 Nội dung và Cấu trúc của DO 25

4.4 Giao diện WEB của DO 26

Trang 4

1.1 Một góc nhỏ của một Thế giới với Người,Nhà quản lý,Nhà nghiên cứu,và các mốiquan hệ giữa họ trong ví dụ về khía cạnh Quản lý nhân lực trong một Công ty phầnmềm lớn 41.2 Sự thay đổi về lượng của khái niệm quan hệ above khi Trạng thái thay đổi,khái niệmquan hệ lúc này chỉ được phản ánh về mặt lượng,biểu diễn toán học của nó chỉ làmột tập số lượng các cách sắp xếp của các khối hộp trên mặt bàn,và biểu diễn đókhông thể hiện được Bản chất của quan hệ này 41.3 Mối quan hệ giữa Ngôn ngữ và Tổ hợp Khái niệm,và Thực tế source :http://www.pilod.nl/w/images/b/b1/D10-fig1.jpg 61.4 (Guarino - [1]) - Mối quan hệ giữa,hiện tượng xảy ra trong thực tế,cách chúng đượcnhận thức (perception),Tổ hợp Khái niệm của chúng,Ngôn ngữ được dùng để bàn về

Tổ hợp khái niệm,Mô hình Dự kiến của Ngôn ngữ,và Bản đồ Ngữ nghĩa 9

3.1 Cấu trúc Ontology là một đồ thị có hướng (directed) không chu trình (acyclic) 183.2 Một ví dụ về GO Term 203.3 Mối quan hệ part-of 20

iv

Trang 5

3.1 Các cơ sở dữ liệu thành phần của GO database 213.2 Các tham số để sử dụng EBI mirror database 223.3 Các tham số dành cho cơ sở dữ liệu gương Ensembl 22

v

Trang 6

DO Disease Ontology

GO Gene Ontology

vi

Trang 7

Ontology và các khái niệm liên quan

Phần này báo cáo sẽ trình bày các thông tin về Bản đồ ngữ nghĩa (Ontology) nói chung, cách phânloại,và vai trò của chúng.Các kiến thức chung về Bản đồ ngữ nghĩa sẽ giúp chúng ta có một hiểubiết nền tảng để đi tới tìm hiểu về các Bản đồ ngữ nghĩa cụ thể,như Bản đồ Ngữ nghĩa Gene vàBản đồ Ngữ nghĩa Bệnh

Từ khóa "ontology" được sử dụng với các ý nghĩa khác nhau trong các cộng đồng khác nhau.Chúng

ta cần phân biệt giữa hai dạng,là dạng không đếm được ("Ontology",với chữ cái O hoa đầu tiên)

và dạng đếm được ("an ontology", chữ cái o đầu tiên viết thường)

Trong trường hợp đầu tiên ,chúng ta đang nhắc đến một từ khóa trong Triết học,được đặt tên chomột nhánh triết học liên quan tới hình thái tự nhiên (natural) và cấu trúc (structure) của "Thựctế" ("Reality").Aristotle làm việc với chủ đề này ở trong cuốn sách Siêu hình học (Metaphysics) vàđịnh nghĩa Ontology như là một khoa học về sự "hữu thể tự thân" (being-qua-being) ,tức là ,khoahọc nghiên cứu về các đặc tính phải có thuộc về các vật thể,bởi vì tính rất tự nhiên của chúng(thực tại tối hậu).Không giống như các ngành khoa học thực nghiệm,chú trọng vào việc tìm kiếm

và mô hình hóa thực tế dưới một góc nhìn (perspective) cụ thể,Ontology tập trung vào đặc tính

tự nhiên và cấu trúc của mọi thứ,mà về mặt bản chất độc lập với mọi mức quan sát,và độc lập cảvới sự tồn tại thực tế của thứ ấy.Lấy một ví dụ,ta đi tìm Ontology của con Kỳ Lân và các Thựcthể giả tưởng khác : mặc dù nó không có tồn tại thật sự,nhưng đặc tính tự nhiên và cấu trúc của

nó có thể được mô tả bằng các hạng mục (categories) và mối quan hệ phổ thông

1

Trang 8

Trong trường hợp thứ hai,nó phản ánh một khái niệm được sử dụng ở trong Khoa học máy tính,ởđây ontology giống như là một dạng đặc biệt của đối tượng thông tin (information object) hay sảnphẩm điện toán (computational artifact).Bản đồ ngữ nghĩa điện toán có ý nghĩa trong việc mô hìnhhóa một cách tiêu chuẩn cấu trúc của một hệ thống,tức là,bao gồm các thực thể liên quan và cácmối quan hệ nổi lên giữa chúng.Một ví dụ về hệ thống có thể là một Công ty với tất cả Công nhântrong đó và những mối quan hệ giữa họ.Kỹ sư về Ontology phần tích những thực thể liên quan và

tổ chức chúng vào trong các khái niệm và quan hệ,được đại diện,tương ứng,bởi Phép vị từ mộtngôi (Unary predicate) và Vị từ hai ngôi (binary predicate).Khung xương sống của ontologybao gồm cấu trúc phân cấp Tổng quát/Chuyên biệt của các Khái niệm,gọi là Taxonomy Giả sử

ta đang quan tâm tới khía cạnh liên quan tới nguồn nhân lực,thì Người,Nhà quản lý,và Nhà nghiêncứu có thể là những Khái niệm liên quan,trong đó thì khái niệm đầu tiên là khái niệm cha được kếthừa bởi hai khái niệm còn lại.Làm việc-với có thể coi như là một quan hệ xảy ra giữa các cá nhân(Người).Một người bằng xương bằng thịt làm việc trong công ty sẽ là một thể hiện (instance) củakhái niệm mà đại diện cho nó

Vào năm 1993,Gruber định nghĩa về ý niệm (chưa đủ đúc kết thành khái niệm) của ontology như là

"Đặc tả của một Tổ hợp khái niệm (conceptualization)".Vào năm 1997,Borst định nghĩa ogy như là "mô tả chuẩn xác về một Tổ hợp khái niệm chia sẻ (Shared conceptualization)".Địnhnghĩa này yêu cầu thêm rằng Tổ hợp khái niệm phải thể hiện được một cách nhìn nhận được chia sẻgiữa vài nhóm khác nhau,thay vì chỉ là một góc nhìn của cá nhân.Studer vào năm 1998,kết hợp haiđịnh nghĩa này,thống nhất thành một định nghĩa "ontology là một đặc tả chuẩn xác (formal),rõràng (explicit) của một Tổ hợp khái niệm chia sẻ".Vậy một Tổ hợp khái niệm là gì ?

Trang 9

ontol-1.2 Tổ hợp Khái niệm là gì ?

Gruber tham khảo ý niệm về Tổ hợp khái niệm được phát biểu bởi Genesereth và Nilsson

"Phần thân của Tri thức được biểu diễn (represented-knowledge) được dựa trênmột Tổ hợp khái niệm : bao gồm các Đối tượng (objects),các Khái niệm (con-cepts),và các Thực thể (entities) khác (được giả thiết là có tồn tại trong lĩnh vực đangquan tâm),cũng như mối quan hệ xảy ra giữa chúng,Một Tổ hợp khái niệm là một bứctranh trừu tượng,khái quát hóa,thể hiện một góc nhìn đơn giản về Thế giới (world)

mà ta muốn biểu diễn với một vài mục đích nào đó.Mọi Cơ sở tri thức(KnowledgeBase),Hệ dựa trên tri thức (Knowledge-base System) ,hay các Tác tử phân mức trithức(Knowledge-level Agent) đều mang chấp nhận với một vài Tổ hợp khái niệm nàođó,một cách trực tiếp,hoặc hàm ý"

Genesereth và Nilsson đã sử dụng một biểu diễn toán học đơn giản để mô tả về ý niệm "Tổ hợpkhái niệm",hay được gọi là : Cấu trúc quan hệ ngoại diên (Extensional relational structure)

Định nghĩa 1.1 (Cấu trúc quan hệ ngoại diên) Cấu trúc quan hệ ngoại diên,là một tuple(D, R) với

• D là một tập gọi là Vũ trụ quần thể (Universe of discourse)

• R là một tập các quan hệ ở trong D

Chú ý rằng,trong định nghĩa ở trên,các thành viên của tập R là các quan hệ toán học thông thườngtrên tập D,là một tập hợp các tổ hợp phần từ trong D.Mỗi phần tử trong R được gọi là một Quan

hệ ngoại diên (extensional relation)

Ví dụ 1.1 Hãy xem xét về vấn đề quản lý Nhân lực trong một Công ty phần mềm lớn với hơn50,000 nhân viên,mỗi người có một Chỉ số riêng bắt đầu bởi chữ cái I.Chúng ta giả thiết rằng

Vũ trụ quần thể ở đây sẽ là tất cả các nhân viên,và do đó ta sẽ chỉ quan tâm đến mối quan hệgiữa người và người.Tập R sẽ chứa một vài quan hệ đơn ngôi,như là Người,Nhà quản lý,Nhà nghiêncứu,và các quan hệ hai ngôi như Báo cáo-cho và Hợp tác-với.Cấu trúc quan hệ ngoại diên củachúng ta cuối cùng sẽ là :

• D = I000001, , I050000,

• R = Người,Nhà Quản lý,Nhà Nghiên cứu,Báo cáo-cho,Hợp tác-với

Trang 10

Hình 1.1: Một góc nhỏ của một Thế giới với Người,Nhà quản lý,Nhà nghiên cứu,và các mối quan

hệ giữa họ trong ví dụ về khía cạnh Quản lý nhân lực trong một Công ty phần mềm lớn

Vấn đề xảy ra đối với các biểu diễn của Genesereth và Nilsson (về Tổ hợp khái niệm) đó là nó chỉđơn giản sử dụng những quan hệ toán học thiếu sâu sắc trên tập D,tức là các Quan hệ ngoạidiên (Extensional relation),gọi nó là ngoại diên là vì biểu diễn quan hệ này chỉ phản ánh đượcđặc tính LƯỢNG của một quan hệ (lực lượng của quan hệ đại số mang biểu diễn cho LƯỢNG củaquan hệ),mà không thể thể hiện được bản CHẤT của mối quan hệ cần được biểu diễn.Lấy ví dụtrong thế giới của các chiếc hộp,với quan hệ above,Vũ trụ quần thể (Universe of Discourse) ở đây

sẽ là những chiếc hộp.Minh họa dưới là các Trạng thái (State of affairs) của Thế giới này

Hình 1.2: Sự thay đổi về lượng của khái niệm quan hệ above khi Trạng thái thay đổi,khái niệm quan hệ lúc này chỉ được phản ánh về mặt lượng,biểu diễn toán học của nó chỉ là một tập số lượng các cách sắp xếp của các khối hộp trên mặt bàn,và biểu diễn đó không thể hiện được Bản chất của

quan hệ này

Như ta thấy ở trên khái niệm above bị thay đổi khi Trạng thái bị thay đổi.tức là Tổ hợp khái niệmnày phụ thuộc rất nhiều vào một Trạng thái cụ thể,đó là một điều không nên có ở một Tổ hợp kháiniệm.Để giải quyết vấn đề này,thì thay vì tập trung vào LƯỢNG của một mối quan hệ,ta sẽ tậptrung vào Ý nghĩa (Chất-meaning) của mối quan hệ đó,độc lập với Trạng thái,với ví dụ trên,thì Ýnghĩa của mối quan hệ above tồn tại trong cái cách bố trí đặc biệt nào đó giữa hai vật thể (khối A

Trang 11

nằm lên trên khối B).Một biểu diễn quan hệ mà thể hiện được Ý nghĩa của một quan hệ thì đượcgọi là Quan hệ Nội hàm (Intensional Relation).

Định nghĩa 1.2 (Thế giới) Đối với một Hệ thống S nhất định mà chúng ta muốn Mô hình hóa,thìmột Trạng thái Thế giới (World State) của S là tất cả các Trạng thái môi trường (State of affair)quan sát được,nói rõ hơn chính là tất cả các phép gán có thể cho các biến số mang vai trò phảnánh,đặc tả Hệ thống đó.Một Thế Giới (World) là một tập tổng thế (totally) có thứ tự (ordered)của các Trạng thái Thế giới,tương ứng với sự tiến hóa theo thời gian của Hệ thống.Nếu chúng tatrừu tượng hóa Hệ thống đến mức lược bỏ yếu tố Thời gian thì lúc này Thế giới (world) sẽ đồngnhất với Trạng thái Thế giới (World State) - trong báo cáo này chúng ta sẽ bỏ qua yếu tố Thời gian

để điều này xảy ra

Định nghĩa 1.3 (Quan hệ Nội hàm) Cho S là một hệ thống tùy ý,D là một tập tùy ý các phần

tử trong S,và W là tập các Trạng thái Thế Giới của S.Cặp < D, W > được gọi là Không gianMiền (Domain Space) của S.Quan hệ Nội hàm (Intensional Relation) ρn với số chiều n trên

< D, W > là một hàm toàn phần (mọi đầu vào trong tập nguồn đều có ánh xạ trong tập đích)

ρn: W → 2Dn từ tập W vào tập các quan hệ (ngoại diên) n-ngôi

Theo như Định nghĩa 2.3 chúng ta đã biểu diễn Quan hệ Nội hàm như một Hàm ánh xạ từ tập cácTrạng thái Thế giới có thể vào một Tập.Việc biểu diễn này có một vài bất lợi thế,nhưng với mụcđích thể hiện ý nghĩa của một quan hệ thì chỉ nó lại thỏa mãn (theo như Guarino).Trong khi cácQuan hệ thông thường chỉ được định nghĩa trên một Miền (Domain) nhất đinh,nhưng Quan hệ Nộihàm được định nghĩa trên Không gian Miền (Domain Space).Ở trên ta định nghĩa Không gian miền

là một cặp < D, W >,một ví dụ về Không gian Miền về Thế giới chiếc Hộp đó là < Dbox, Wbox >với Dbox là tất cả những chiếc hộp ở trên mặt bàn,còn Wbox là tất cả các cách sắp xếp của nhữngchiếc hộp đó

Từ các định nghĩa trên,ta tiếp tục trình bày định nghĩa về Cấu trúc quan hệ Nội hàm sional relational structure) là một biểu diễn cải tiến của Cấu trúc quan hệ Ngoại diên dành cho Tổhợp khái niệm (Conceptualization),(trong

(Inten-Guarino đồng nhất Cấu trúc quan hệ Nội hàm với Tổ hợp khái niệm)

Định nghĩa 1.4 (Cấu trúc quan hệ Nội hàm,hay Tổ hợp khái niệm ) Một Cấu trúcquan hệ nội hàm (hay cũng chính là một Tổ hợp khái niệm theo như Guarino) là một cặp ba

C =< D, W, R > với :

• D là Vũ trụ Quần thể (Universe of discourse)

• W là tập các Thế giới (Worlds) có thể có

Trang 12

• R là tập các quan hệ Nội hàm trên Miền không gian < D, W >

Quay lại định nghĩa về Cấu trúc Quan hệ Ngoại diên < D, R > đã được định nghĩa ở trên.Lúc này

< D, R > chỉ liên quan (phản ánh - nhưng không phải là bản thân) một Thế giới duy nhất (haymột Trạng thái Thế giới ),giờ ta sẽ gọi nó là Cấu trúc Thế giới (World Structure).Lúc này ta sẽxem xét được mối quan hệ giữa Cấu trúc Quan hệ Ngoại diên và Cấu trúc Quan hệ Nội hàm haygiữa Tổ hợp Khái niệm và Cấu trúc Thế giới đó là : "Một Tổ hợp Khái niệm có thể chứa nhiềuCấu trúc Thế giới"

Trong các ứng dụng thực tế,cũng như trong truyền thông giữa con người,chúng ta cần có một ngônngữ để có thể đề cập đến một thành phần bên trong một Tổ hợp khái niệm.Lấy một ví dụ,để biểudiễn thực tế I046758 có hợp tác với I044443,chúng ta cần đề xuất một ký hiệu nhất định nào đó

có trong ý niệm của người sử dụng,có thể được sử dụng để mô tả một mối quan hệ nội hàm nhấtđịnh.Ngôn ngữ có khả năng cung cấp cho người sử dụng một tập các yếu tốt căn bản để có thểtrực tiếp diễn đạt các khái niệm nào đó

Các Tổ hợp khái niệm và các yếu tố Trừu tượng là những thực thể vô hình (immaterial entities)chỉ tồn tại ở bên trong tâm thức của một cá nhân hay một cộng đồng người sử dụng một ngônngữ.Để có thể tạo tài liệu,truyền thông và phân tích chúng phải được "chụp" (captured) lại,tức làbiểu diễn chúng dưới dạng các biểu tượng cụ thể (concrete artifact).Điều đó cho thấy,một ngôn ngữ

là tối quan trọng trong việc thể hiện chúng một cách gọn gàng,đầy đủ và không nhập nhằng.Hìnhminh họa dưới đây gọi là Tam giác Ullmann mối quan hệ giữa Ngôn ngữ và Tổ hợp Khái niệm,vàmột phần của Thực tế (một phần Thực tế ở đây chính là lĩnh vực mà ta quan tâm) :

Hình 1.3: Mối quan hệ giữa Ngôn ngữ và Tổ hợp Khái niệm,và Thực tế source : http://www.pilod.nl/w/images/b/b1/D10-fig1.jpg

Đối với một Khái niệm (Concept) ,thì nội dung ý nghĩa (meaning) của nó bao gồm 2 khíacạnh,Ngoại diên (extension) và Nội hàm(intension).Phần đầu tiên bao gồm tất cả các mốiquan hệ của Khái niệm với các Khái niệm liên quan (CHẤT).Phần thứ hai nói tới Ý nghĩa Tham

Trang 13

chiếu (referential meaning) của Khái niệm,nói đơn giản tức là nó cho ta biết tất cả những trườnghợp được tham chiếu bởi khái niệm này.Lấy ví dụ,Nội hàm của Khái niệm Bảo Đại bao gồm cácQuan hệ đến các Khái niệm như Việt Nam,Vua,Triều Đại nhà Nguyễn,v v,trong khi đó Ngoạidiên của nó sẽ chỉ là một con người lịch sử cụ thể là ngài Bảo Đại (bằng xương bằng thịt).Kháiniệm Hoàng đế có Nội hàm là các Quan hệ với các Khái niệm Nguyên Thủ,Chính Quyền,PhongKiến,v v,còn Ngoại diên của nó là tất cả các Hoàng đế (bằng xương,bằng thịt) trên Hành Tinh.

Đối với một Ngôn ngữ,nó có cũng có hai vai trò tương ứng với trách nhiệm Thông giải các khíacạnh Ý nghĩa của các khái niệm : Thông dịch Ngoại diên và Thông dịch Nội hàm

Nếu ta có một ngôn ngữ logic L,với từ điển V Ta có định nghĩa một Mô hình/Cấu trúc NgoạiDiên bậc nhất (Model/Extensional first-order structure) dành cho L là một cấu trúc < S, I >,với

S =< D, R > là một Cấu trúc Thế giới và I : V → D ∪ R là một Hàm Thông dịch (InterpretationFunction) gán một phần tử của D cho một Hằng ký tự (Constant Symbol) trong V ,và phần tử của

R cho một một Ký tự vị từ (Predicate Symbol) trong V Cách mô hình trên bộc lộ đầy đủ đượcvai trò Thông dịch Ngoại diên (Extensional Interpretation) của một ngôn ngữ.Tương tự ta cũng

có thể bộc lộ được khía cạnh Thông dịch Nội hàm (Intensional Interpretation) bằng cách sửdụng một cấu trúc < C, J >,với C =< D, W, R > là một Tổ hợp Khái niệm với và J : V → D ∪ R

là một hàm gán một phần tử của D cho một Hằng ký tự,và phần tử trong R cho một Ký tự

vị từ trong V Chúng ta sẽ gọi Cấu trúc (bộc lộ khía cạnh Thông dịch Nội hàm) này là Camkết Ngữ nghĩa/Cấu trúc Nội Hàm bậc một (Ontological Commitment/Intensional first-orderstructure) của L.Nếu K =< C, J Cam kết Ngữ nghĩa của L,chúng ta nói rằng L cam kết (commits)với C bởi K,và C lúc này được gọi là Tổ hợp Khái niệm Cơ sở (Underlying Conceptualization của K

Ví dụ 1.2 : Trở lại với Ví dụ 1.2,từ điển V sẽ là : V =Người,Nhà Quản lý,Nhà Nghiên cứu,báocáo-cho,hợp tác-với.Cam kết Ngữ nghĩa bao gồm các ánh xạ từ Ký hiệu Người đến Quan hệ nộihàm Người các ánh xạ tương tự còn lại của Nhà quản lý,Nhà nghiên cứu,báo cáo-cho,và hợp tác-với

Để định nghĩa rõ ràng về Ontology ta cần biết về một Khái niệm gọi là Mô hình Dự kiến (Intentedmodels)

Trang 14

Định nghĩa 1.5 (Mô hình Dự kiến) Cho C = (D, W, R) là một Tổ hợp khái niệm , L làmột ngôn ngữ logic bậc một với từ điển V và Cam kết Ngữ nghĩa K = (C, I).Một mô hình

M = (S, I),được gọi là Mô hình dự kiến của L theo K nếu và chỉ nếu :

• Đối với tất cả các Hằng Ký tự c ∈ V ta luôn có I(c) = I(c)

• Tồn tại một Thế giới w ∈ W sao cho,với mỗi Ký hiệu vị từ v ∈ V ,thì sẽ tồn tại một Quan

hệ Nội hàm ρ ∈ R sao cho I(v) = ρ và I(v) = ρ(w) Một tập IK(L) bao gồm tất cả các Môhình của L mà tương thích với K được gọi là tập các Mô hình Dự kiến của L theo K

Điều kiện thứ nhất yêu cầu các ánh xạ từ các Hằng Ký hiệu tới các phần tử của Vũ trụ Quần thểphải là đồng nhất.Điều kiện thứ hai bắt buộc phải tồn tại một Thế giới mà mọi Ký hiệu Vị từ đềuđược ánh xạ vào một Quan hệ Nội hàm mà giá trị của nó,cho Thế giới đang xét,đồng nhất với kếtquả Thông dịch Ngoại diên của Ký hiệu đó.Điều đó có nghĩa là Mô hình Dự kiến của chúng taphải là một mô tả về Thế giới ấy

Khi đã rõ ràng về định nghĩa của Mô hình Khái niệm trong đầu,giờ ta có thể Định nghĩa rõ ràng

về Bản đồ Ngữ nghĩa hay ontology,và thông qua đó biết được ontology đóng vai trò như là một

Lý thuyết logic được sử dụng tham chiếu đến Ý nghĩa Dự kiến của bộ Từ điển (được sử dụng bởiNgôn ngữ)

Định nghĩa 1.6 (Ontology) Cho C là một Tổ hợp Khái niệm,và L là một Ngôn ngữ logicvới bộ Từ điển (Vocabulary) V và Cam kết Ngữ nghĩa K.Một Bản đồ Ngữ nghĩa - ontology

OK cho C với bộ Từ điển V và Cam kết Ngữ nghĩa K là một một Lý thuyết Logic bao gồm mộttập các luật (formulas) của L,Bản đồ Ngữ nghĩa được thiết kế sao cho tập các Mô hình của nóđược xấp xỉ càng gần nhất có thể với tập các Mô hình Dự kiến của L theo K

1.4.1 Các thành phần chính của Ontology

Gọi ontology là một Lý thuyết Logic của một Ngôn ngữ Logic L , có nghĩa là ontology sử dụng các

Từ (Word) trong từ điển V của L , và tuân theo Cấu trúc Ngữ Pháp của L Nhưng ontology sẽquyết định cách sử dụng các Từ,và cấu trúc Ngữ pháp này để thể hiện một ý nghĩa nào đó thôngqua Mô hình Logic (Logical Model) mà nó hàm ý.Hay nói cách khác ontology tạo ra Ràng buộccho các cách bộc lộ có thể có của một Ngôn ngữ.Một ontology có các Mô hình Logic càng trùngkhớp với các Mô hình Dự kiến của Tổ hợp Khái niệm (của một lĩnh vực - domain cụ thể) mà nóđang đặc tả thì tức là nó càng tốt

Trang 15

Hình 1.4: (Guarino - [1]) - Mối quan hệ giữa,hiện tượng xảy ra trong thực tế,cách chúng được nhận thức (perception),Tổ hợp Khái niệm của chúng,Ngôn ngữ được dùng để bàn về Tổ hợp khái

niệm,Mô hình Dự kiến của Ngôn ngữ,và Bản đồ Ngữ nghĩa

Các thành phần chính của ontology bao gồm các Khái niệm (concept),các Quan hệ (relation),cácThể hiện (instances) và các Luật (axioms) Dưới đây ta sẽ nói về các dạng thường thấy của cácThành phần này :

Một Khái niệm thể hiện một tập hoặc một lớp các Thực thể (Entities) với lĩnh vực đang quantâm.Protein là một Khái niệm trong lĩnh vực Sinh học Phân tử.Khái niệm thông thường rơi vàohai dạng dưới đây :

• Khái niệm cơ sở (Primitive Concept) là khái niệm có những điều kiện cần có dành cho cácthành viên của nó,Lấy một ví dụ,"Protein Hình cấu (globular protein) là một loại portein cóNhân kỵ nước (Hydrophobic core) tức là tất cả các Protein Hình cấu đều phải có Nhân kỵnước,tuy nhiên không phải tất các các Thực thể có Nhân kỵ nước đều là Protein Hình cấu

Trang 16

• Khái niệm xác định (Defined Concept) mà các yêu cầu dành cho các thành viên là các điềukiện cần và đủ.Lấy một ví dụ : tế bào Eukaryotic là dạng tế bào có một nhân,và mọi tế bào

có một nhân đều là tế bào Eukaryotic

Các Quan hệ mô tả các tương tác giữa các Khái niệm hoặc giữa các Thuộc tính của Khái niệm.Các Quan hệ thông thường có hai loại sau :

• Taxonomy là các quan hệ tổ chức các Khía niệm thành các cây phân cấp Tổng quát/Chuyênbiệt

– Quan hệ Đặc tả (Spectialisation Relation) thường được biết đến là quan hệ "is a kindof" Lấy ví dụ Enzyme là một kiểu (is a kind of) Protein

– Quan hệ thành phần (Partitive Relation) mô tả sự kiện một khái niệm là một phần củacác khái niệm khác

• Quan hệ Liên tưởng (Associative Relationship) bao gồm các dạng sau :

– Quan hệ Danh cách (Nominative Relationship) mô tả tên của Khái niệm Ví dụ Proteincó-chỉ-số [chỉ-số],và Gene có-tên [tên]

– Quan hệ Định vị (Locative Relationship) mô tả vị trí của Khái niệm này đối với Kháiniệm khác

– ƠQuan hệ Liên tưởng mô tả các chức năng,tiến trình mà một Khái niệm được thamgia,và các thuộc tính của một Khái niệm - ví dụ Protein có-chức-năng tiếp-nhận ,hoặcProtein tham-gia-vào-quá-trình Phiên-dịch-mã

• Ngoài ra còn có nhiều kiểu Quan hệ khác,như là Quan hệ ’Nhân quả’.v v

Các Quan hệ,cũng giống như các Khái niệm,có thể được tổ chức vào trong các taxonomy.Ví dụnhư,hasName có thể chia thành các quan hệ đặc tả như sau hasGeneName,hasProteinName vàhasDiseaseName

Các Thể hiện (Instance) là những ’thứ’ được đại diện bởi một Khái niệm - cytochrome C ở người(một loại Protein) là một Thể hiện của Khái niệm Protein

Cuối cùng,Luật (Axiom) được sử dụng được sử dụng để tạo ra các ràng buộc cần thiết cho các giátrị của các Thể hiện hay các Lớp.Đặc tính của các Mối quan hệ cũng là một kiểu Luật

Trang 17

1.4.2 Các loại Ontology và vấn đề Thống nhất thông tin

Thống nhất Thông tin (information integration) là một lớp ứng dụng chính dành cho các tologies.Nhưng vấn đề là ở chỗ,hai hệ thống cùng sử dụng chung một Từ điển,cũng không đảmbảo là chúng cùng thống nhất cùng một loại thông tin trừ khi chúng cam kết với cùng một Tổ hợpKhái niệm.Giá sử mỗi hệ thống đều có một Tổ hợp khái niệm riêng của chúng,điều kiện cần có đểtạo sự thống nhất có thể xảy ra được đó là các Mô hình Dự kiến (Intended models) của hai Tổ hợpKhái niệm phải giao nhau (overlap)

on-Cũng có trường hợp có hai tập Mô hình dự kiến được ước lượng bởi hai ontology khác nhau,cả haiontology đều trùng khớp tuy nhiên Mô hình dự kiến của nó thì lại không giao nhau.Điều đó cónghĩa là các hệ thống thống nhất tiếp cận từ dưới lên bắt đầu từ các ontology cục bộ có thể khônghoạt động được nếu điều này xảy ra,đặc biệt là nếu các ontology cục bộ chỉ được tập trung vào cácmối quan hệ liên quan đến các ngữ cảnh đặc biệt,do vậy các hệ thống này rất thiếu ổn định.Dovậy,sẽ là thuận lợi hơn nếu thống nhất dự trên một ontology bậc cao duy nhất thay vì phụ thuộcvào sự thống nhất thiếu bền vững dựa trên phần giao nhau (intersection) nhỏ bé của các ontologiescục bộ khác nhau

Những vấn đề được bàn bạc ở trên đưa ra một gợi ý là ta sẽ phát triển các loại ontology khác nhaudựa trên mức bao hàm (level of generality) của nó :

• Các ontology bậc cao (Top-level ontology): mô tả mọi Khái niệm phổ thông nhất nhưKhông gian,Thời gian,Vật chất,Đối tượng,Sự kiện,Hành động,v v,những Khái niệm này đọclập với các vấn đề hay các lĩnh vực cụ thể ,được thiết kế để sử dụng bởi một cộng đồng lớnnhững người sử dụng

• Các ontology lĩnh vực (Domain ontology) và ontology nhiệm vụ (task ontology) mô tảmột từ điển liên quan tới một lĩnh vực phổ thông (như dược học,hay sinh học phân tử) hoặcmột nhiệm vụ thông thường (như là chẩn đoán,hay bán hàng),bằng cách đặc tả các từ khóađược giới thiệu trong các ontology bậc cao

• Các ontology ứng dụng (Application ontology) mô tả các Khái niệm phụ thuộc cả vàomột lĩnh vực,và nhiệm vụ cụ thể

Ngày đăng: 15/03/2015, 21:11

HÌNH ẢNH LIÊN QUAN

Hình 1.1: Một góc nhỏ của một Thế giới với Người,Nhà quản lý,Nhà nghiên cứu,và các mối quan - đề tài nghiên cứu ứng dụng thuật toán trên đồ thị để phân hạng gen,kiểu hình bệnh và ứng dụng trong việc tìm gen gây bệnh mới và mối liên quan mới giữa các bệnh
Hình 1.1 Một góc nhỏ của một Thế giới với Người,Nhà quản lý,Nhà nghiên cứu,và các mối quan (Trang 10)
Hình 1.3: Mối quan hệ giữa Ngôn ngữ và Tổ hợp Khái niệm,và Thực tế source : http://www.pilod.nl/w/images/b/b1/D10-fig1.jpg - đề tài nghiên cứu ứng dụng thuật toán trên đồ thị để phân hạng gen,kiểu hình bệnh và ứng dụng trong việc tìm gen gây bệnh mới và mối liên quan mới giữa các bệnh
Hình 1.3 Mối quan hệ giữa Ngôn ngữ và Tổ hợp Khái niệm,và Thực tế source : http://www.pilod.nl/w/images/b/b1/D10-fig1.jpg (Trang 12)
Hình 1.4: (Guarino - [1]) - Mối quan hệ giữa,hiện tượng xảy ra trong thực tế,cách chúng được nhận thức (perception),Tổ hợp Khái niệm của chúng,Ngôn ngữ được dùng để bàn về Tổ hợp khái - đề tài nghiên cứu ứng dụng thuật toán trên đồ thị để phân hạng gen,kiểu hình bệnh và ứng dụng trong việc tìm gen gây bệnh mới và mối liên quan mới giữa các bệnh
Hình 1.4 (Guarino - [1]) - Mối quan hệ giữa,hiện tượng xảy ra trong thực tế,cách chúng được nhận thức (perception),Tổ hợp Khái niệm của chúng,Ngôn ngữ được dùng để bàn về Tổ hợp khái (Trang 15)
Hình 3.1: Cấu trúc Ontology là một đồ thị có hướng (directed) không chu trình (acyclic) - đề tài nghiên cứu ứng dụng thuật toán trên đồ thị để phân hạng gen,kiểu hình bệnh và ứng dụng trong việc tìm gen gây bệnh mới và mối liên quan mới giữa các bệnh
Hình 3.1 Cấu trúc Ontology là một đồ thị có hướng (directed) không chu trình (acyclic) (Trang 24)
Hình 3.2: Một ví dụ về GO Term - đề tài nghiên cứu ứng dụng thuật toán trên đồ thị để phân hạng gen,kiểu hình bệnh và ứng dụng trong việc tìm gen gây bệnh mới và mối liên quan mới giữa các bệnh
Hình 3.2 Một ví dụ về GO Term (Trang 26)
Bảng 3.1: Các cơ sở dữ liệu thành phần của GO database - đề tài nghiên cứu ứng dụng thuật toán trên đồ thị để phân hạng gen,kiểu hình bệnh và ứng dụng trong việc tìm gen gây bệnh mới và mối liên quan mới giữa các bệnh
Bảng 3.1 Các cơ sở dữ liệu thành phần của GO database (Trang 27)
Bảng 3.2: Các tham số để sử dụng EBI mirror database - đề tài nghiên cứu ứng dụng thuật toán trên đồ thị để phân hạng gen,kiểu hình bệnh và ứng dụng trong việc tìm gen gây bệnh mới và mối liên quan mới giữa các bệnh
Bảng 3.2 Các tham số để sử dụng EBI mirror database (Trang 28)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w