1. Trang chủ
  2. » Luận Văn - Báo Cáo

Công nghệ orale semanti graph và ứng dụng

85 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Công Nghệ Oracle Semantic Graph Và Ứng Dụng
Tác giả Cao Văn Kết
Người hướng dẫn PGS.TS. Cao Tuấn
Trường học Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành Công Nghệ Thông Tin
Thể loại luận văn
Năm xuất bản 2017
Thành phố Hà Nội
Định dạng
Số trang 85
Dung lượng 2,36 MB

Nội dung

Các thuc tính trong ontology Person .... Các giá tr individual/value .... Các lu t rules trong ontology Person .... Mô hình ontology Person .... B ng MDSYS.RDF_VALUE$ bao g m các c  

Trang 2

LỜI CẢM ƠN

Em xin chân thành bày t lòng bi n PGS.TS Cao Tu

- Vin Công ngh thông tin và Truy n thông     c i h Bách Khoa Hà N - i

Trang 3

LỜI CAM ĐOAN

Trang 4

MỤC LỤC

TRANG PH BÌA 1 

LI C 2

L 3

DANH MC CÁC KÝ HIU, CÁC T VIT T T 7 

DANH MC CÁC HÌNH V 9

DANH MC CÁC BNG BIU 10

M  U 11

NG QUAN V WEB NG  14 

1.1 T ng quan v web ng     14

1.1.1 Ngu n g c s hình thành Web ng      14

1.1.2 Khái ni m v  Web ng  14

1.1.3 M c tiêu c a Web ng ng    14

m c a Web ng    15

1.1.5 Ki n trúc công ngh c a Web ng      16

1.2 Ontology[4] 20

1.3 ng d ng c a CSDL Oracle trong web ng      20

1.3.1 Bài toán Xây d ng các b máy tìm tin 21 

1.3.2 Bài toán ng d ng công ngh ng     n s 21

1.3.3 Bài toán ng d ng khung làm vi   qu n lý tri th c (Framework for   Knowledge Management) 22

    X LÝ NG      QU N TR    XU T QUY TRÌNH NG D NG 24  

2.1 Công ngh x lý ng     24

Trang 5

2.1.1 C u trúc công ngh ng     24

2.1.2 Mô hình d u ng li   26

2.1.3 D u ng li  trong CSDL Oracle 28

a Mô hình siêu d  li u 28

b Các m (Statement) 30

2.1.4 C u trúc các b ng siêu d u ng   li   34

2.1.5 Các loi d li u ng  c 35

2.1.6 Cách s d ng b ng SEM_MATCH    cha các hàm truy v n d u ng   li   36

2.1.7 C p nh t và xu t ra d u ng    li   38

2.1.8 T o và qu n lý ch m c m ng ng        41

2.1.9 L p ch m c ng     u 42

2.1.10 S d ng d u ng   li   43

 xu t quy trình ng d ng công ngh       t tr và truy xu t d u web ng  li   46

 NGHI M 50

3.1 Th nghi m 1 50

3.1.1 Thi t k ontology Person 50 

a Các l p trong ontology Person 50

b Các thuc tính trong ontology Person 51

c Các giá tr (individual/value) 52

d Các lu t (rules) trong ontology Person 52

e Mô hình ontology Person 55

3.1.2 Tmô hình ontology Person trong Oracle 56

Trang 6

3.1.3 Xây d ng các l p, các thu c tính, các lu t và nh p d u vào mô hình       li

ontology Person 57

a Kt n  n CSDL Oracle ontology Person 57

b Xây d ng các l p, các thu c tính, các lu t 58   

3.1.4 S d ng SPARQL truy xu t d    li 61

3.2 Th nghi m 2 64

3.2.1 Thi t k mô hình ontology v t i ph m (crime) 64    

3.2.2 Tmô hình ontology v i ph t m trong Oracle 68

3.2.3 S d ng sem_apis và SPARQL truy xu t d u ontology v t i ph    li   m trong Oracle 70

T QU   72

4.1 Kt qu 72

4.1.1 K t qu  th nghi m 1 72

4.1.2 K t qu  th nghi m 2 76

 79

KT LUNG PHÁT TRI N 82

1 Kt lun 82

ng phát tri n 83 

TÀI LIU THAM KH O 84

Trang 7

WWW World Wide Web  u

W3C World Wide Web

Research Projects Agency

 án Nghiên c u Nâng cao Qu c  phòng c a B  Quc phòng M, ch u trách nhi m phát tri n các công ngh m   i cho

ch v i RDFS ISBN International Standard

Book Number

Mã s tiêu chu n qu c t   cho sách

ASCII American Standard Code Chui thông tin M 

Trang 9

DANH MỤC CÁC HÌNH V

Hình 1.1: Liên kt ng  a các ngu n khác nhau trong Semantic Web 15

Hình 1.2: Kin trúc công ngh web ng   n 4) 17

Hình 1.3: Mt phn nh n d c cách nhau b i ký hi u # 18 

Hình 2.1: Mô t  c u trúc ng   24

Hình 2.2: B ba triple 27

Hình 2.3: Mô hình t suy di n 32 

 quy trình ng d ng công ngh   Oracle Semantic Graph 46

Hình 3.1: Ontology Person 55

Hình 3.2: Mn d u chi ti t trong ontology Person 56li  Hình 3.3: Kt nn CSDL ontology Person 57

Hình 3.4: Xây dng các l p cho ontology Person 58

Hình 3.5: To các thu c tính cho các Object 59

Hình 3.6: To các Rules 60

Hình 3.7: To các individual và nh p giá tr 61 

Hình 3.8: Ontology ti ph m 67

Hình 3.9: Mô hình data ca ontology Crime 68

Hình 4.1: Cu trúc b ng tbl_ontology Person 72 

Hình 4.2: Kt qu tr   v sau câu l nh truy v n select c a sem_apis 73  

Hình 4.3: Kt qu tr   v sau câu l nh truy v n select SPARQL 73 

Hình 4.4: Kt qu tr   v danh sách các subclassof 74

Hình 4.5: Kt qu tr   v danh sách các subclassof c a lp Person 75

Hình 4.6: Kt qu tr   v name c a các Person 75 

Hình 4.7: Kt qu tr   v sau câu l nh truy v n select SPARQL 76 

Hình 4.8: Minh ha kt qu truy v n toiphambaoluc 77 

Hình 4.9: Minh ha kt qu tìm ki  78

Hình 4.10: List ra tt c các name c a Person 79 

Hình 4.11: Suy lun ra Professor thu c Person 80

Trang 11

11

M Ở ĐẦU Oracle là m t trong nh ng h qu n tr        d liu th gi i, nó có  

nhm n i b t khi n nó thành m   tr t h qun tr    c s d ng r ng rãi trong nhi u doanh nghi ng nhanh, tính b o m t,  

c hãng ph n m m Oracle cam k t h tr trong nh     ng h p 

có s c s y ra mà b n thân doanh nghi p không th t kh c ph        c Công ngh web ng i kh   chia s và x   c thông tin có

ng   c nhi u t  chc, doanh nghi p quan tâm và ng d ng, tuy nhiên v       v t , b o m t d  liu c a nó còn g p nhi u khó kh n Hãng Oracle hi     c các v này, cho nên h   i pháp nh m gi i quy t chúng và k t phiên b n Oracle 11g      công ngh      c tích h p vào trong h   qun tr CSDL Oracle Mc dù công ngh  c Oracle công b  c m t s t ch c,    doanh nghi p trên th gi i s d     Vi  m i, n u 

c nghiên c u tìm hi u nó s    t ph n cho công ngh web ng   

 Vi t Nam phát tri n; giúp cho các t ch c, doanh nghi p l n c a Vi t Nam        

có thêm m t n n t ng công ngh     , qu n tr d u ng    li  n trin khai các d án v web ng    nh l a ch  ngh Oracle Semantic Graph và ng d   tài nghiên c u cho lu a mình Các n i dung c  th a lu c

M c tiêu và nhiụ ệ m vụ :

- M c tiêu:ụ M  a lu    u v công ngh Oracle  Semantic Graph và cách ng d ng công ngh này trong v       t tr và truy xut d li u có ng  

- Nhiệ m v :ụ  c mi th c hi c các nhim v sau:

+ Tìm hi u lý thuy t v công ngh web ng      : Tìm hi u v các khái  

ni m, mô hình công ngh m, a web ng 

Trang 12

12

+ Tìm hi u v ng d ng c a CSDL Oracle trong web ng       

vic ng d ng CSDL Oracle trong vi     d u web ng li    thc hin m t s   a web ng  

Đố i tư ợng và ph m vi nghiên c u c a luạ ứ ủ ận văn:

- ng nghiên c u: Công ngh Oracle Semantic Graph  

- Phm vi nghiên c u: 

+ V lý thuy t: Công ngh   web ng 

+ V thc nghi m: ng d ng CSDL Oracle trong web ng     i dung

có nhiu c n nghiên c u Tuy nhiên, trong gi i h    ph c v cho  

m   nghi m, lu     xem xét th nghi m trên 02 ontology:  Ontology nhân s (Person) c a m t nhóm nghiên c u và ontology t i ph     m Jamaica, ph m vi th nghi  ng: T mô hình thi t k ontology Person và   Crime, d a trên quy trình ng d ng công ngh Oracle Semantic Graph tác gi      

xu    và truy xu t, tra c u, t  tìm kim thông tin có ng     b d  li

Phương pháp nghiên cứu: T ng h p lý thuy t (thu th p, tìm hi u, phân     tích), th nghi

Ý nghĩa khoa học và th c ti n: ự ễ

-  Oracle Semantic Graph và ng d 

 mc nghiên c u và ph bi n Vi    u m ra

ng nghiên c u và s d ng m i Vi t Nam      

Trang 13

C u trúc c a luấ ủ ận văn bao gồm các phần nhưsau:

M Ở ĐẦU: N i dung ph n m u ch ra lý do ch       tài; m  i

ng, ph m vi nghiên c u c a lu   t nh

mi ca tác gi  u

CHƯƠNG 1: TỔNG QUAN V WEB NG Ề Ữ NGHĨA VÀ ỨNG D NG

TRONG CSDL ORACLE: N      ng tìm hi u lý thuy t v công ngh web ng     c ng d ng CSDL Oracle trong web ng  



CHƯƠNG 2: CÔNG NGHỆ Ử X LÝ NG Ữ NGHĨA TRONG HỆ QU N Ả TRỊ CSDL ORACLE VÀ ĐỀ XU T QUY TRÌNH NG D NG: N i dung Ấ Ứ Ụ

ng nghiên c u v vi c x lý ng       qu n tr  CSDL Oracle (c u trúc t   ch  li d u ng  

t o ra ontology trong h qu n tr CSDL Oracle, cách t o và qu n lý ch m c m        ng

ng ng      t vào n i dung d li u ng       

qu n tr      xu t quy trình ng d ng công ngh Oracle Semantic    Graph trong vic t và truy xu t d li  u web ng  

CHƯƠNG 3: THỬ NGHI M: nh bày v quá trình th nghi Trì   m

CHƯƠNG 4: KẾT QU Ả VÀ ĐÁNH GIÁ: Trình bày v k t qu    thnghi t qu th k nghim

K T LUẾ ẬN: T ng k     toàn b  lu      t s

ng phát tri n lu 

Trang 14

14

CHƯƠNG 1: Ổ T NG QUAN V WEB NG Ề Ữ NGHĨA

1.1 T ng quan v Web ng ổ ề ữ nghĩa.

1.1.1 Ngun gố ự c s hình thành Web ng ữ nghĩa[12]

World Wide Web (g i t  thành m t kho tàng thông tin kh ng  

l c a nhân lo i và m   ng chuy n t i thông tin không th thi   c trong thi công ngh thông tin ngày nay S   ph  bi n và bùng n thông tin trên Web 

t ra m t thách th c m i là làm th      c thông tin trên Web

là Tim Berners- xu

1.1.2 Khái ni m v ệ ềWeb ngữ nghĩa [12]

Theo Tim Berners-       

m t s m r ng Web hi n t i v      

i làm vi c v i nhau  

Theo nhóm nghiên ccung c p 1 framework chung cho phép d  lic chia s và tái s d ng trong các   

ng d ng, doanh nghi p và c  ng

    a Dammio thì: Semantic Web là 1 t p các công ngh và tiêu chu n cho phép máy móc có th hi   a Web

1.1.3 M c tiêu c a Web ng ụ ủ ữ nghĩa [1]

M c tiêu c a Web có ng     phát tri n các chu n chung và công  ngh cho phép máy tính có th hi   c nhi      chúng có th h t tr c tìm ki m nhanh 

p d li u (d li u liên k    ng), và t ng hóa  các công vic

Trang 15

V i Semantic Web có th gi i quy     t v n này b ng 2 cách: 

- Th nh t: Nó s mô t chi ti   t d li lý không

cnh d ng (format), hình nh, qu ng cáo trên m t trang Web    

 tìm ra s liên quan c a thông tin  

- Th hai: Semantic Web cho phép t o ra m t file mô t m i liên h gi a các      

t p d u khác nhau Ví d Có th t o m t liên k t semantic gi a c t mã qu c gia  li :       

-    d u (database) vli    trên giao di n (form) 

nh p li u n  ng

k t n i và tích h p d u t nhi u ngu    li   ng liên k t các ngu n  khác nhau (tài li u, hình    i, khái ni     r ng Web thành mng m i v i t p các m i quan h m i gi a các ngu n d u, t        li o

ra các m i liên h ng c     u mà Web hi n t 

c

Hình 1.1: Liên k t ng   a các ngu n khác nhau trong Semantic Web [12] 

1.1.4 Ưu điểm c a Web ng ủ ữ nghĩa

Trang 16

 ó th  nh m t th c th thu c l p hay thu c tính c        th nào

d a trên ng c nh ch        p không gian tìm ki m và cho k t qu   



- D u liên k li ng: Thay th cách liên k t s d   

  n t d li u t nhi u ngu n khác nhau m t cách hi u       

qu  nh danh c a tài nguyên (URI) và quan h gi a chúng Cách liên   

kc gi là liên kt bng siêu d u (metadata) li

- H tr công c   t ng hóa: D a vào các lu t suy di   tri thc vcác th c th , máy tính có kh       ng k t lu n m  i ng d ng Web 

    s tr l c nh ng câu h i ki   ki n nào di 

1945 mà chng c  c Nh

1.1.5 Ki n trúc công ngh c a Web ng ế ệ ủ ữ nghĩa

Kin trúc công ngh web ng     i qua 4 phiên b n Phiên b n 4:  

c hoàn thic gi nh g m 8 t ng thay vì 7    

tng c a ki n trúc web ng    c quy chun v i các chu     xu    ng nghiên c u web 

ng  ng nh t s d ng trên th c t       u trong web ng li  

d      c mô hình hóa b    c ch n là chu  i d li u trong web ng   c chu n hóa là OWL d     c a RDF(S); Ontology cung c p t v ng cho vi     i thông tin gi a các ng d ng và d ch v web Bên c         truy vn

  c s d ng r ng rãi và là khuy n ngh c a W3C    

Trang 17

URI  Uniform Resource Identifier: Là m t kí hi u nh n d ng     n

C  th nó là m t xâu ng n cho phép nh n d   i các xâu bt

u b     ng th y trên World Wide Web B t k mt   

Trang 18

c g i là các nút tr ng; m t nút tr ng ch ra s t n t i c u tài nguyên không có         

s c p rõ ràng v tham chi u URIref c a tài nguyên      

- T ng 2 (t ng xml và xml schema): Xml là m t s m r ng c a ngôn ng        

u cho các c u trúc tài li u b t k    

- T ng 3 (RDF): RDF là n n t ng c a web ng       c

 i t ch i thông tin gi a các ng d ng   trên web mà máy có th  hi c

- T ng 4 (ontology): Ontology là m t t p các khái ni m và quan h gi a các      khái nhinh vm vào vi c bi u di n và   

i thông tin

B t v  c xây d tâng RDF và RDFS cung cp

bi u di n ng    m d o cho tài nguyên web và có kh    tr  l p lun

 xây d ng b l p lu n này c n s d ng các ngôn ng           bi u di n

           này cung

http://example.org/Books#Ontology

URIref

URI Phn nh n d ng tùy ý  

Trang 19

19

c p kh   u di n và h l p lu n khác nhau và chúng d a trên n n t ng là   tr     các ngôn ng logic mô t  ng khác nhau

- T ng 5 (logic): Khai báo các nguyên t c logic và cho phép máy tính suy  

- T ng 7 (Trust): T ng này nh  m b o tính tin c y c a các ng d ng trên     web ng 

Ví d: Có mi bo x là xanh, m  i khác lth web ng   c y? Câu tr l i  c xem xét tùy vào các ng c nh M  i ng d ng trên web ng    có m t ng c nh c    th chính vì th các m trên có th n m trong các ng c      

ng khác nhau nên các m  tin c y trong ng c nh   

c c s chng minh v tin c y thì các l p lu    c áp d ng là 

  ki m tra ch ng minh k t h p v i công ngh ch      

Trang 20

m n d u li

Trang 21

1.3.2 ng dụ ng công ngh ngữ nghĩa trong thư viện số

n s ng xuyên x lý m ng l n thông tin t các d ng tài

li u s Ph n l c rút ra t  vi n truy n th   c tp trung biên t p 

l i thành ngu n thông tin s n dùng cho m   i liên quan b ng cách quét bài báo, sách, tài lin ch l i th c a các h     thng máy tính hi          lý sau này Áp dng công ngh semantic web có th nghiên c u và phát tri n h     th n s có th  thc hin

x  , tìm ki m và phân tích t t c các ki u thông tin s Công ngh       ng

 ng, thi t l   c n thi t trong các d ng c a   

nh danh cng s M c tiêu chính là làm cho thao  tác gi a các ph n có th x lý thông minh, nh t quán, m ch l       các l p c a

ng s và các d ch v   

ng d ng ontologies trong vi c mô t h th    ng m t 

n s s d ng d li u mô t có c       mô t h th  c tuy nhiên

ng trong d li u mô t l    y

, vi c ng d   n s không nh ng th c hi     d

liu mô t mô t h     th c mà còn mô t  c n i dung c a nó Thay vì  

Trang 22

22

ng h p m t quy   n s có th tách riêng  

c u trúc t a nó, cung c p mô t cho m  c hi r

m i quan h c  ng vi c s d  ng c u trúc c a ontologies và s d   ng này trong vi c mô t d u, cung c p m t t ng    li   

t ng quát d u mô t và n i dung  li  

M t trong nh ng ng d ng quan tr ng n a có th       thy h thng d u c li a

n s r t l  ng ph c v cho nhi u t ch c, cá nhân vào     nhi u m  u ch yli  u thu c vào hai d ng là d   

liu có c u trúc (trong database) và d  li u phi c u trúc (các ngu n l y t    web) Mt

v  t ra là làm th  các ng d ng s d  ng th i c hai lo i d    

liu này, b i vì trên th c t m    i ng d ng ch s d ng m t lo i d        li u có c u trúc 

ho c phi c u trúc, có chu n chung ph c v cho h u h t các lo       i ng d

d n c xem là n n t ng công ngh c   a semantic web Nó s là c u n i th c hi n chu n hoá các ngu n d u, t        li  

phc v cho m i lo i ng d ng 

1.3.3 ng d ng khung làm viỨ ụ ệc để qu n lý tri th c (Framework for Knowledge ả ứ

Management)

Semantic Web là m t h n n nhi u h a h n cho vi c phát tri n các h         thng

qu n lý tri th c Tuy nhiên, v     nào bi u di n tri th  c   d ng thc máy có th hi  tri th c c n thi t có th     c tìm th y b i các máy  tìm (search engine) S d ng gi i pháp qu n lý tri th c d       nh d

  bi u di n các lu t và d a trên m t k thu t m       chú gi i các ngu n  tri th c b ng cách s d      u ki n Gi i pháp là d a trên các công c    Semantic  n t m thu n l i chính là s    y kh  m tri th c v   p c u t o các ngu n tri th c    

c n thi t cho vi c gi i quy    t m t v   ng th c này có th   c bi u 

di n b ng cách dùng các câu l nh If Then (statement If-    c thi t l p theo  cách suy di n (inference) và y quy  n (trust) trên Semantic Web Các statement (câu lu ki n có th     l p ch m c n i dung các tài nguyên Web   

Trang 23

23

m t cách nhi      i liên k t các t khóa, khái ni m hay metadata   (siêu d  liu này có th s hình thành các truy v n d a trên ng c     

 chính xác trong tìm ki m tri th c  

Ví d : Trong v   nh ch m c tài li u, dù có hay không có tài li   c

nh ch m c b ng t khóa aspirin (thu c aspirin) và headache (b     u), cách aspirin tr u có th  c gi i quy t d dàng   

b ng cách s d  u kic Vi c xây d ng và qu n lý tri   thc trên Semantic Web m t cách khoa h c cho phép s chuy   ng trong

ng phân tán

Kế t luận chương

 khái quát   , ki c  n n n 

ng d ng trong Oracle, m 

ng trong Web hi n t i  

Trang 24

24

CHƯƠNG 2: CÔNG NGH X LÝ NG Ệ Ử Ữ NGHĨA TRONG HỆ QU N TR Ả Ị

CSDL ORACLE VÀ ĐỀ XUẤT QUY TRÌNH NG DỨ ỤNG

             

h chia s và x   c thông tin có ng  n

 c nhi u t ch c, doanh nghi p quan tâm và ng     

d ng, tuy nhiên v    v t m c giúp tìm ki m nhanh và b o   

m t d u c li ng t t Hãng Oracle hi c các v này, cho nên h  i pháp nh m gi i quy t chúng và k t phiên b n Oracle 11g tr       

ông ngh  c tích h p vào trong h qu n tr CSDL    Oracle N  t p tìm hi u sâu v công ngh x lý ng      

 xu t ra quy trình ng d ng công ngh này vào th c t      

2.1 Công ngh x lý ng ệ ử ữ nghĩa trong Oracle

2.1.1 C u trúc công ngh ấ ệngữ nghĩa trong Oracle

  li  li  

v n d u ng  li  c hi n truy v n d u quan h H   li  tr i dùng có

th   t p lu ruy v n d   li u ng  th   hi n c nào

Hình 2.1: Mô t c u trúc ng     [17]

Trang 25

25

Khối Database:   hi n trong hình 2.1 kh i database ch  a  lid u ng 

, các b n th lu n (mô hình RDF/OWL) và d li u quan h truy n th ng        

D u ng li  ng MDSYS.RDF_VALUE b ng này  thông tin v ch th (subjects), thu i

S d ng Staging Table (b ng s p x      t i hàng lot d li u ng  

D liu tiên ph  ki m tra tính chính xác v cú pháp 

c n p vào b ng s p x p ti    n là g i th t c   

SEM_APIS.BULK_LOAD_FROM_STAGING_TABLE

v t o b ng s p x p:

Ví d     

CREATE TABLE stage_table (

RDF$STC_sub varchar2(4000) not null,

RDF$STC_pred varchar2(4000) not null,

RDF$STC_obj varchar2(4000) not null

);

Tải theo đợt (Batch load) hay t i t ng ph n d u ng    li  

S d    t i t ng ph n d u ng  li    d ng l

ti tng ph n d u ng  li  

oracle.spatial.rdf.client.BatchLoader gói tin này n m trong 

<ORACLE_HOME>/md/jlib/sdordf.jar thc hic vi   lic t i d u thành công phi tuân th m t s quy t c sau:    

Trang 26

Khối truy v n (Query):Có th truy v n d u ng    li  n th  lun,

  th c hi n các truy v c h  tr  v ng    d u quan li

h truy n th tìm các m i quan h ng      th c hi n các truy v n có  

h b n th tr  lun   c n s d ng toán t SEM_RELATED 

Khối suy lu n (Infer): kh i này có th m r ng kh      a các truy vn

v d u ng   li  ng cách s d ng suy di n ra (suy lu n), s d ng các quy t      c (lut) và lu Suy di n cho phép t o ra các suy lu    d a trên d 

liu và các lut t thông tin v các lu t và lu  

2.1.2 Mô hình d u ng liệ ữ nghĩa

D u ng  li     t c u trúc d  li  c mô hình

b ng cách s d   th ng Các m siêu d lic bi u di n b ng   

b   c bi u di n là nút, ph n th     c biu

di n b i m t liên k t tr c ti p mô t m i quan h gi         a các nút Các b ba (triple) 

c n m trong m t m ng d li u ng       i mi dùng

Trang 27

27

tt tên và các thành ph ng v i 1 

ct trong mt bng

M t triple c a m t phát bi u (m    ) bao gm 3 thành ph n: ch ng ho   c tài nguyên (Subject or resource), v ng ho c thu      nh (predicate or property), tân ngng ho c giá tr (object or value)  

Subject (Resource) Cao Tu

Predicate (Property) Ging d y 

Object (literal) Phân tích thit k gii thu t và Web ng   

   th bi u di n b 3 triple 

object Subject or resource

Value

thut và Web ng  

Trang 28

m ng có nút b u và nút k t  ng Nút có th  là các nút trng, URI, các ký t  n

DELETE trên bng MDSYS.SEM_MODEL

B ng 2.1: B ng MDSYS.SEM_MODEL trong Oracle [17]  

Column Name Data Type Description

OWNER VARCHAR2(30)   i t o

MODEL_ID NUMBER Ch  s ID c a mô hình t ng   

  c t o ra

Trang 29

29

MODEL_NAME VARCHAR2(25) Tên c a mô hình 

TABLE_NAME VARCHAR2(30) Tên c a b ng tham chi  n d 

li u ng  

COLUMN_NAME VARCHAR2(30)

Tên c a c t lo     c tham chi u  trong b ng  SDO_RDF_TRIPLE_S

MODEL_TABLESPACE_NAME VARCHAR2(30)

Tên c a b     c

s d     b ba cho mô hình này

Khi t o 1 mô hình m   ng th i b ng MDSYS.SEMM_model-name  

 c t o ra và b ng này ch    i t o ra c quy n m i có  nhìn th y Trong b ng MDSYS.SEMM_model-name m i m t dòng ch a 1 b ba và      

  i d ng 1 liên k t trong m t m ng B ng g m có các c     

B ng 2.2: B ng MDSYS.SEMM_model-name [17]  

Tên c t ộ Kiểu d li u ữ ệ Mô t

P_VALUE_ID NUMBER Ch  s value_id cho giá tr    n

text c a thu c tính M t ph n c      a khóa chính

START_NODE_ID NUMBER Ch  s value_id cho giá tr    n

text c a ch   th (Subject) M t ph  n

c a khóa chính  CANON_END_NODE_ID NUMBER

END_NODE_ID NUMBER Ch  s value_id cho giá tr    n

Trang 30

30

DISTANCE NUMBER n

EXPLAIN VARCHAR2(4000) n

PATH VARCHAR2(4000) n

LINK_ID VARCHAR2(71) Giá tr nh n di n duy nh t b ba     

C t P_VALUE_ID, START_NODE_ID, END_NODE_ID và 

CANON_END_NODE_ID ch s giá tr ID th   c t  tính tc các giá tr t v ng   

ng Tuy nhiên, mt giá tr   t v ng có th không ph  i tcùng m t giá tr ID  

b Các m (Statement)

M t b     thông tin v  ch th (subjects), thui ng v i 1 m  tr  n, URI ho c các ký t ng v i b     ba (triples) Mi b ba

 trên m t hàng riêng bi i dùng không nên s d ng câu  

lc DEi vi bng này

B ng MDSYS.RDF_VALUE$ bao g m các c  t sau: (VALUE_ID, VALUE_TYPE, VNAME_PREFIX, VNAME_SUFIX, LITERAL_TYPE, LANGUAGE_TYPE, CANON_ID, COLLISION_EXT, CANON_COLLISION_EXT, LONG_VALUE, VALUE_NAME)

- Tính duy nh t cho b ba (triples):  

M i b        ng MDSYS.RDF_VALUE là không

c trùng l  ki m tra xem b ba (triples) chu n b thêm vào có trùng l p v i     

b ba (triples) hi n có không thì h   thng tii sánh b  i các triple hi n có trong mô hình N u c 3 thành ph n trong b ba (triples) là URI     thì s i sánh c ba thành ph n N    ng Object là ký t (literal) thì s   i sánh ch  th và thu nh tính trùng l p 

ba (triples) sau là trùng l p

<eg:a> <eg:b> "123"^^http://www.w3.org/2001/XMLSchema#int

<eg:a> <eg:b> "123"^^http://www.w3.org/2001/XMLSchema#unsignedByte

Trang 31

- Nút trng:

Các nút tr ng có th   c s d   th ng trong

m ng ng   t mô hình ng   ng có xu t hi n nhi u ltr    n

i cùng tham chin cùng m t tài nguyên 

N u xu t hi  n  hai mô hình ng  c tham chiu

- T suy di n, các quy t c và quy t   :

Suy di n là kh    t o ra suy lu n h p lý d a trên các quy t c, các lu    t

c cung c p b i Oracle ho  i dùng t   n cho phép xây

d ng các truy v n th c hi n k t h p ng        a trên các m i quan h   

gi a các m u d    lic v i vi c k t h p cú pháp d a trên chu i ho c các       giá tr khác 

Trang 32

32

Hình 2.3: Mô hình t suy di n [17]  

M t rulebase là m ng có ch a 1 t p các quy t c M t s quy t     

s mà Oracle h   tr bao g m: RDFS, RDF, OWLSIF, RDFS++, OWLPRIME, Rules Indexes, Virtual Models

RDFS là s m r ng c   c b sung thêm mt tp các quy t c.Các quy tc t ra khi i th c o g t

t

B ng MDSYS.SEMR_rulebase-name g m các c  t sau: (RULE_NAME,

ANTECEDENTS, FILTER, CONSEQUENTS, ALIASES)

N i dung v t  t c các quy t c có th   c xem trong bng

MDSYS.SEM_RULEBASE_INFO (OWNER, RULEBASE_NAME,

RULEBASE_VIEW_NAME, STATUS)

-   m c cho các quy t c:

m c quy t c là m ng có ch a b c tính toán Ch          

c có th  c suy ra t vi c áp d ng các quy t    áp d ng vào cho m t t p   

nh N u 1 truy v   c n b t k quy t  

Trang 33

c trên m t hoc nhiu mô hình và tùy ch n các ch s quy t   ng

S d ng m t mô hình o có th      n hóa vi c qu c quy n truy 

c  i v i d u ng li  , gi s r  o ra ba mô hình ng  

m t ch s quy t c d a trên ba mô hình và quy t      OWLPRIME N u không 

có mô hình o, ph i c p và thu h i riêng quy n truy c p cho t ng mô hình và ch        

m c quy t c Tuy nhiên, n u t   o mt mô hình o có ch a ba mô hình và ch m c các    quy t c, ch   c n c p và thu hc quy n truy c p cho mô hình o duy nh    t

S d ng m t mô hình       t u ki n c p nh t nhanh các mô   hình ng  , gi s mô hình o VM1 ch a mô hình M1 và ch m c quy      

t c R1 (t c là VM1 = M1 UNION ALL R1) và gi s r ng mô hình ng       M1_UPD là m t b n sao c     c c p nh t v i các triples b sung và    R1_UPD là m t ch m c quy t    c t o cho M1_UPD Bây gi có truy vn

i dùng trên VM1 truy c p mô hình c p nh t và ch m c quy t có th xác      c, 

nh l i mô hình  VM1 = M1_UPD UNION ALL R1_UPD)

t o m t mô hình o, s d ng th t c

  b xóa m t mô hình o thì s d ng    th  t c SEM_APIS.DROP_VIRTUAL_MODEL M t mô hình    c t ng b 

u b t k mô hình thành ph n, ch m    , hoc ch  m c quy tc nào b  b

Khi t o m t mô hình   ng th i thông tin v mô hình s      c t ng

  ng MDSYS.SEM_MODEL$ Tuy nhiên, các giá tr trong m t s c   t khác nhau c a mô hình  c v i các mô hình ng   t trong

Trang 34

34

b: (OWNER, MODEL_ID, MODEL_NAME, COLUMN_NAME, MODEL_TABLESPACE_NAME)

t các mô hình c hi n th Thông tin v t c   trong

MDSYS.SEM_VMODEL_INFO

Thông tin v t t c    ng (các mô hình, các quy t và ch m c

ng MDSYS.SEM_VMODEL_DATASETS

- B o m t d li u ng  

Khi m t mô hình ho c ch m c quy t     c t o thì ch   i t o ra hoc

c quy n m i có toàn quy  i dùng ch có quy n xem, t o   

m t s  ch  m c quy t c bao g m chèn, c p nh t và xóa quy n có th s      i quy tc

 i t o mô hình có th c p thêm m t s c quyi mô hình     

Trang 35

d u  li

SEMM_model-name Các b   c ch nh   SEM_RULEBASE_INFO Quy t 

SEM_RULES_INDEX_DATASETS Các d  li   c s d ng trong các ch 

2.1.5 Các loi dữ liệ u ng ữ nghĩa, cấu trúc và phương thức

- King SDO_RDF_TRIPLE th hin d u ng li    nh dng

Trang 36

-   l y toàn b ho c m  t ph a bn c ba (triples) bao gm:

GET_TRIPLE() RETURNS SDO_RDF_TRIPLE

GET_SUBJECT() RETURNS VARCHAR2

GET_PROPERTY() RETURNS VARCHAR2

GET_OBJECT() RETURNS CLOB

2.1.6 Cách s d ng b ng SEM_MATCH ch a các hàm truy v n d u ng ử ụ ả ứ ấ ữ liệ ữnghĩa

Trong oracle s d ng m t b ng SEM_MATH ch a các hàm giúp truy v n d       liu ng  ng SEM_MATH có c u trúc: 

- Thu3.c tính truy v n là m t chu i ký t (ho c ký t n i chu i) v i m         t

hoc nhiu mng cha các bin

- Thuc tính truy v n không th là bi n ràng bu c ho c m t bi u th c liên        

n m t bi n ràng bu c   

Trang 37

37

M t m c bao quanh trong d u ngo 

M i atom (nguyên t ) có th là m t bi n ví d : ?x, m       ví du: fdf:

c m r ng d a trên không gian tên m    nh và giá tr c a thu c tính bí   danh ho c m   ví d : http://www.example.org/family/Male Ngoài ra, atom th ba có th là ch s (ví d : 3.14), m t ch v          n (ví d:

"Herman"), m t ngôn ng   u v i ký t   n ví d "Herman" @en, ho c

mt kiu ký t ví d : "123" ^^ xsd: int  

Ví d : M t truy v n v i các thu c tính ch nh ba m        tìm ông ni

i ông có gi i tính là nam) và chi u cao c a m  a cháu c a ông:      

(?x :grandParentOf ?y) (?x rdf:type :Male) (?y :height ?h)

- Thu nh mô hình ho c mô hình s d  ó là: SEM_MODELS VACHAR2(25) và ki       VARCHAR2 (25)

- Thu nh mt ho c rulebases mà các rule s  

c áp d ng vào truy v n Lo i d li u c a nó là SDO_RDF_RULEBASES nó      

  TABLE OF VARCHAR2 (25) N n trên

mô hình o thì thu c tính này ph   null

- Thu      nh m t ho c nhi u không gian tên   (namespaces) ngoài các không gian tên mc s d    m r ng các tên trong m u truy v n Ki u d u c   li 

nhng h p chi u cao là 6 tr   lên

- Thuc tính index_status cho phép truy v n d u ng   li    khi ch  m c quy t c có liên quan không có tr ng thái h p l (N    n m t 

Trang 38

38

mô hình o, thu c tính này chính là ch m c quy t    c k t h p v i mô hình o)    

N u thu c tính này là null, truy v n tr v m t l i N u thu c tính này không ph i là          null, nó phi là chui INCOMPLETE ho c INVALID 

- Thunh các tùy ch n có th   n k t qu truy  

v n Các tùy ch c th   hi i d ng c p giá tr t khóa Các tùy ch n sau    

c h tr : ALLOW_DUP=T, HINTO={hint-  string}

ho c n i d u vào kho d u ng    li  li          t i mt

ng l n d li u; tuy nhiên, nó không th x lý các triples ch a các giá tr i        

ng l

- Tt (Batch load) s d ng giao di    t i ho c n i d   

liu t m t t    nh d ng N-Triple vào kho d   li u ng   n này chi hàng lo   lý triple cha các giá tr   ng v 

4000 byte

- T i vào d u vào b ng s d ng câu l nh SQL INSERT g li     c

khi to SDO_RDF_TRIPLE_S

- S d ng Staging Table (b ng s p x      t i hàng lot d li u ng  

D  liu tiên phc   ki m tra tính chính xác v 

     c n p vào b ng s p x p ti     n là g i th t c   SEM_APIS.BULK_LOAD_FROM_STAGING_TABLE

v t o b ng s p x p:

Ví d     

CREATE TABLE stage_table (

RDF$STC_sub varchar2(4000) not null,

RDF$STC_pred varchar2(4000) not null,

RDF$STC_obj varchar2(4000) not null

Trang 39

RDF$STC_sub varchar2(4000) not null,

RDF$STC_pred varchar2(4000) not null,

RDF$STC_obj varchar2(4000) not null

);

Có th s d ng m    COMPRESS trong câu l nén b ng nh m làm giám không gian b nh       và c i thi n hi u su t t i d      liu

Ti phân tích cú pháp và n p d li u ng     t

b ng s p x p Trong Oracle t p l     n t i $ ORACLE_HOME / md / demo

i dùng có th s  i tp này   

Không th t   ng có ch a các giá tr l     Loader ki m soát t p tin s      c t ng t ch trong t p tin SQL 

* Loader x u Tuy nhiên b ba (striple) ch a các giá tr     ng l

có th c np b ng cách sau: 

+ S d ng th t c SEM_APIS.BULK_LOAD_FROM_STAGING_TABLE    

     t i t t c trong b ng s p x p   

+ T i các hàng còn l       loi b khi s d ng SQL *   Loader v i t u khi n m u) t  nh d ng N-Triple 

B ng RDF $ ET_TAB là b i các s ki n, tác v khi th c hi n th      

tc SEM_APIS.BULK_LOAD_FROM_STAGING_TABLE B ng RDF $ 

 c t

Trang 40

end_comment varchar2(1000) DEFAULT NULL

v i s   ng l n d u T i t ng ph li   ng là m t l a   ch n t u kin



+ D lic tt vài trit

+ D u ch a m t s li    ng l

Ngày đăng: 19/02/2024, 22:53

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN