Các thuc tính trong ontology Person .... Các giá tr individual/value .... Các lu t rules trong ontology Person .... Mô hình ontology Person .... B ng MDSYS.RDF_VALUE$ bao g m các c
Trang 2LỜI CẢM ƠN
Em xin chân thành bày t lòng bi n PGS.TS Cao Tu
- Vin Công ngh thông tin và Truy n thông c i h Bách Khoa Hà N - i
Trang 3LỜI CAM ĐOAN
Trang 4MỤC LỤC
TRANG PH BÌA 1
LI C 2
L 3
DANH MC CÁC KÝ HIU, CÁC T VIT T T 7
DANH MC CÁC HÌNH V 9
DANH MC CÁC BNG BIU 10
M U 11
NG QUAN V WEB NG 14
1.1 T ng quan v web ng 14
1.1.1 Ngu n g c s hình thành Web ng 14
1.1.2 Khái ni m v Web ng 14
1.1.3 M c tiêu c a Web ng ng 14
m c a Web ng 15
1.1.5 Ki n trúc công ngh c a Web ng 16
1.2 Ontology[4] 20
1.3 ng d ng c a CSDL Oracle trong web ng 20
1.3.1 Bài toán Xây d ng các b máy tìm tin 21
1.3.2 Bài toán ng d ng công ngh ng n s 21
1.3.3 Bài toán ng d ng khung làm vi qu n lý tri th c (Framework for Knowledge Management) 22
X LÝ NG QU N TR XU T QUY TRÌNH NG D NG 24
2.1 Công ngh x lý ng 24
Trang 52.1.1 C u trúc công ngh ng 24
2.1.2 Mô hình d u ng li 26
2.1.3 D u ng li trong CSDL Oracle 28
a Mô hình siêu d li u 28
b Các m (Statement) 30
2.1.4 C u trúc các b ng siêu d u ng li 34
2.1.5 Các loi d li u ng c 35
2.1.6 Cách s d ng b ng SEM_MATCH cha các hàm truy v n d u ng li 36
2.1.7 C p nh t và xu t ra d u ng li 38
2.1.8 T o và qu n lý ch m c m ng ng 41
2.1.9 L p ch m c ng u 42
2.1.10 S d ng d u ng li 43
xu t quy trình ng d ng công ngh t tr và truy xu t d u web ng li 46
NGHI M 50
3.1 Th nghi m 1 50
3.1.1 Thi t k ontology Person 50
a Các l p trong ontology Person 50
b Các thuc tính trong ontology Person 51
c Các giá tr (individual/value) 52
d Các lu t (rules) trong ontology Person 52
e Mô hình ontology Person 55
3.1.2 Tmô hình ontology Person trong Oracle 56
Trang 63.1.3 Xây d ng các l p, các thu c tính, các lu t và nh p d u vào mô hình li
ontology Person 57
a Kt n n CSDL Oracle ontology Person 57
b Xây d ng các l p, các thu c tính, các lu t 58
3.1.4 S d ng SPARQL truy xu t d li 61
3.2 Th nghi m 2 64
3.2.1 Thi t k mô hình ontology v t i ph m (crime) 64
3.2.2 Tmô hình ontology v i ph t m trong Oracle 68
3.2.3 S d ng sem_apis và SPARQL truy xu t d u ontology v t i ph li m trong Oracle 70
T QU 72
4.1 Kt qu 72
4.1.1 K t qu th nghi m 1 72
4.1.2 K t qu th nghi m 2 76
79
KT LUNG PHÁT TRI N 82
1 Kt lun 82
ng phát tri n 83
TÀI LIU THAM KH O 84
Trang 7WWW World Wide Web u
W3C World Wide Web
Research Projects Agency
án Nghiên c u Nâng cao Qu c phòng c a B Quc phòng M, ch u trách nhi m phát tri n các công ngh m i cho
ch v i RDFS ISBN International Standard
Book Number
Mã s tiêu chu n qu c t cho sách
ASCII American Standard Code Chui thông tin M
Trang 9DANH MỤC CÁC HÌNH V Ẽ
Hình 1.1: Liên kt ng a các ngu n khác nhau trong Semantic Web 15
Hình 1.2: Kin trúc công ngh web ng n 4) 17
Hình 1.3: Mt phn nh n d c cách nhau b i ký hi u # 18
Hình 2.1: Mô t c u trúc ng 24
Hình 2.2: B ba triple 27
Hình 2.3: Mô hình t suy di n 32
quy trình ng d ng công ngh Oracle Semantic Graph 46
Hình 3.1: Ontology Person 55
Hình 3.2: Mn d u chi ti t trong ontology Person 56li Hình 3.3: Kt nn CSDL ontology Person 57
Hình 3.4: Xây dng các l p cho ontology Person 58
Hình 3.5: To các thu c tính cho các Object 59
Hình 3.6: To các Rules 60
Hình 3.7: To các individual và nh p giá tr 61
Hình 3.8: Ontology ti ph m 67
Hình 3.9: Mô hình data ca ontology Crime 68
Hình 4.1: Cu trúc b ng tbl_ontology Person 72
Hình 4.2: Kt qu tr v sau câu l nh truy v n select c a sem_apis 73
Hình 4.3: Kt qu tr v sau câu l nh truy v n select SPARQL 73
Hình 4.4: Kt qu tr v danh sách các subclassof 74
Hình 4.5: Kt qu tr v danh sách các subclassof c a lp Person 75
Hình 4.6: Kt qu tr v name c a các Person 75
Hình 4.7: Kt qu tr v sau câu l nh truy v n select SPARQL 76
Hình 4.8: Minh ha kt qu truy v n toiphambaoluc 77
Hình 4.9: Minh ha kt qu tìm ki 78
Hình 4.10: List ra tt c các name c a Person 79
Hình 4.11: Suy lun ra Professor thu c Person 80
Trang 1111
M Ở ĐẦU Oracle là m t trong nh ng h qu n tr d liu th gi i, nó có
nhm n i b t khi n nó thành m tr t h qun tr c s d ng r ng rãi trong nhi u doanh nghi ng nhanh, tính b o m t,
c hãng ph n m m Oracle cam k t h tr trong nh ng h p
có s c s y ra mà b n thân doanh nghi p không th t kh c ph c Công ngh web ng i kh chia s và x c thông tin có
ng c nhi u t chc, doanh nghi p quan tâm và ng d ng, tuy nhiên v v t , b o m t d liu c a nó còn g p nhi u khó kh n Hãng Oracle hi c các v này, cho nên h i pháp nh m gi i quy t chúng và k t phiên b n Oracle 11g công ngh c tích h p vào trong h qun tr CSDL Oracle Mc dù công ngh c Oracle công b c m t s t ch c, doanh nghi p trên th gi i s d Vi m i, n u
c nghiên c u tìm hi u nó s t ph n cho công ngh web ng
Vi t Nam phát tri n; giúp cho các t ch c, doanh nghi p l n c a Vi t Nam
có thêm m t n n t ng công ngh , qu n tr d u ng li n trin khai các d án v web ng nh l a ch ngh Oracle Semantic Graph và ng d tài nghiên c u cho lu a mình Các n i dung c th a lu c
M c tiêu và nhiụ ệ m vụ :
- M c tiêu:ụ M a lu u v công ngh Oracle Semantic Graph và cách ng d ng công ngh này trong v t tr và truy xut d li u có ng
- Nhiệ m v :ụ c mi th c hi c các nhim v sau:
+ Tìm hi u lý thuy t v công ngh web ng : Tìm hi u v các khái
ni m, mô hình công ngh m, a web ng
Trang 1212
+ Tìm hi u v ng d ng c a CSDL Oracle trong web ng
vic ng d ng CSDL Oracle trong vi d u web ng li thc hin m t s a web ng
Đố i tư ợng và ph m vi nghiên c u c a luạ ứ ủ ận văn:
- ng nghiên c u: Công ngh Oracle Semantic Graph
- Phm vi nghiên c u:
+ V lý thuy t: Công ngh web ng
+ V thc nghi m: ng d ng CSDL Oracle trong web ng i dung
có nhiu c n nghiên c u Tuy nhiên, trong gi i h ph c v cho
m nghi m, lu xem xét th nghi m trên 02 ontology: Ontology nhân s (Person) c a m t nhóm nghiên c u và ontology t i ph m Jamaica, ph m vi th nghi ng: T mô hình thi t k ontology Person và Crime, d a trên quy trình ng d ng công ngh Oracle Semantic Graph tác gi
xu và truy xu t, tra c u, t tìm kim thông tin có ng b d li
Phương pháp nghiên cứu: T ng h p lý thuy t (thu th p, tìm hi u, phân tích), th nghi
Ý nghĩa khoa học và th c ti n: ự ễ
- Oracle Semantic Graph và ng d
mc nghiên c u và ph bi n Vi u m ra
ng nghiên c u và s d ng m i Vi t Nam
Trang 13C u trúc c a luấ ủ ận văn bao gồm các phần nhưsau:
M Ở ĐẦU: N i dung ph n m u ch ra lý do ch tài; m i
ng, ph m vi nghiên c u c a lu t nh
mi ca tác gi u
CHƯƠNG 1: TỔNG QUAN V WEB NG Ề Ữ NGHĨA VÀ ỨNG D NG Ụ
TRONG CSDL ORACLE: N ng tìm hi u lý thuy t v công ngh web ng c ng d ng CSDL Oracle trong web ng
CHƯƠNG 2: CÔNG NGHỆ Ử X LÝ NG Ữ NGHĨA TRONG HỆ QU N Ả TRỊ CSDL ORACLE VÀ ĐỀ XU T QUY TRÌNH NG D NG: N i dung Ấ Ứ Ụ
ng nghiên c u v vi c x lý ng qu n tr CSDL Oracle (c u trúc t ch li d u ng
t o ra ontology trong h qu n tr CSDL Oracle, cách t o và qu n lý ch m c m ng
ng ng t vào n i dung d li u ng
qu n tr xu t quy trình ng d ng công ngh Oracle Semantic Graph trong vic t và truy xu t d li u web ng
CHƯƠNG 3: THỬ NGHI M: nh bày v quá trình th nghiỆ Trì m
CHƯƠNG 4: KẾT QU Ả VÀ ĐÁNH GIÁ: Trình bày v k t qu thnghi t qu th k nghim
K T LUẾ ẬN: T ng k toàn b lu t s
ng phát tri n lu
Trang 1414
CHƯƠNG 1: Ổ T NG QUAN V WEB NG Ề Ữ NGHĨA
1.1 T ng quan v Web ng ổ ề ữ nghĩa.
1.1.1 Nguồn gố ự c s hình thành Web ng ữ nghĩa[12]
World Wide Web (g i t thành m t kho tàng thông tin kh ng
l c a nhân lo i và m ng chuy n t i thông tin không th thi c trong thi công ngh thông tin ngày nay S ph bi n và bùng n thông tin trên Web
t ra m t thách th c m i là làm th c thông tin trên Web
là Tim Berners- xu
1.1.2 Khái ni m v ệ ềWeb ngữ nghĩa [12]
Theo Tim Berners-
m t s m r ng Web hi n t i v
i làm vi c v i nhau
Theo nhóm nghiên ccung c p 1 framework chung cho phép d lic chia s và tái s d ng trong các
ng d ng, doanh nghi p và c ng
a Dammio thì: Semantic Web là 1 t p các công ngh và tiêu chu n cho phép máy móc có th hi a Web
1.1.3 M c tiêu c a Web ng ụ ủ ữ nghĩa [1]
M c tiêu c a Web có ng phát tri n các chu n chung và công ngh cho phép máy tính có th hi c nhi chúng có th h t tr c tìm ki m nhanh
p d li u (d li u liên k ng), và t ng hóa các công vic
Trang 15V i Semantic Web có th gi i quy t v n này b ng 2 cách:
- Th nh t: Nó s mô t chi ti t d li lý không
cnh d ng (format), hình nh, qu ng cáo trên m t trang Web
tìm ra s liên quan c a thông tin
- Th hai: Semantic Web cho phép t o ra m t file mô t m i liên h gi a các
t p d u khác nhau Ví d Có th t o m t liên k t semantic gi a c t mã qu c gia li :
- d u (database) vli trên giao di n (form)
nh p li u n ng
k t n i và tích h p d u t nhi u ngu li ng liên k t các ngu n khác nhau (tài li u, hình i, khái ni r ng Web thành mng m i v i t p các m i quan h m i gi a các ngu n d u, t li o
ra các m i liên h ng c u mà Web hi n t
c
Hình 1.1: Liên k t ng a các ngu n khác nhau trong Semantic Web [12]
1.1.4 Ưu điểm c a Web ng ủ ữ nghĩa
Trang 16 ó th nh m t th c th thu c l p hay thu c tính c th nào
d a trên ng c nh ch p không gian tìm ki m và cho k t qu
- D u liên k li ng: Thay th cách liên k t s d
n t d li u t nhi u ngu n khác nhau m t cách hi u
qu nh danh c a tài nguyên (URI) và quan h gi a chúng Cách liên
kc gi là liên kt bng siêu d u (metadata) li
- H tr công c t ng hóa: D a vào các lu t suy di tri thc vcác th c th , máy tính có kh ng k t lu n m i ng d ng Web
s tr l c nh ng câu h i ki ki n nào di
1945 mà chng c c Nh
1.1.5 Ki n trúc công ngh c a Web ng ế ệ ủ ữ nghĩa
Kin trúc công ngh web ng i qua 4 phiên b n Phiên b n 4:
c hoàn thic gi nh g m 8 t ng thay vì 7
tng c a ki n trúc web ng c quy chun v i các chu xu ng nghiên c u web
ng ng nh t s d ng trên th c t u trong web ng li
d c mô hình hóa b c ch n là chu i d li u trong web ng c chu n hóa là OWL d c a RDF(S); Ontology cung c p t v ng cho vi i thông tin gi a các ng d ng và d ch v web Bên c truy vn
c s d ng r ng rãi và là khuy n ngh c a W3C
Trang 17URI Uniform Resource Identifier: Là m t kí hi u nh n d ng n
C th nó là m t xâu ng n cho phép nh n d i các xâu bt
u b ng th y trên World Wide Web B t k mt
Trang 18c g i là các nút tr ng; m t nút tr ng ch ra s t n t i c u tài nguyên không có
s c p rõ ràng v tham chi u URIref c a tài nguyên
- T ng 2 (t ng xml và xml schema): Xml là m t s m r ng c a ngôn ng
u cho các c u trúc tài li u b t k
- T ng 3 (RDF): RDF là n n t ng c a web ng c
i t ch i thông tin gi a các ng d ng trên web mà máy có th hi c
- T ng 4 (ontology): Ontology là m t t p các khái ni m và quan h gi a các khái nhinh vm vào vi c bi u di n và
i thông tin
B t v c xây d tâng RDF và RDFS cung cp
bi u di n ng m d o cho tài nguyên web và có kh tr l p lun
xây d ng b l p lu n này c n s d ng các ngôn ng bi u di n
này cung
http://example.org/Books#Ontology
URIref
URI Phn nh n d ng tùy ý
Trang 1919
c p kh u di n và h l p lu n khác nhau và chúng d a trên n n t ng là tr các ngôn ng logic mô t ng khác nhau
- T ng 5 (logic): Khai báo các nguyên t c logic và cho phép máy tính suy
- T ng 7 (Trust): T ng này nh m b o tính tin c y c a các ng d ng trên web ng
Ví d: Có mi bo x là xanh, m i khác lth web ng c y? Câu tr l i c xem xét tùy vào các ng c nh M i ng d ng trên web ng có m t ng c nh c th chính vì th các m trên có th n m trong các ng c
ng khác nhau nên các m tin c y trong ng c nh
c c s chng minh v tin c y thì các l p lu c áp d ng là
ki m tra ch ng minh k t h p v i công ngh ch
Trang 20m n d u li
Trang 211.3.2 Ứng dụ ng công ngh ệngữ nghĩa trong thư viện số
n s ng xuyên x lý m ng l n thông tin t các d ng tài
li u s Ph n l c rút ra t vi n truy n th c tp trung biên t p
l i thành ngu n thông tin s n dùng cho m i liên quan b ng cách quét bài báo, sách, tài lin ch l i th c a các h thng máy tính hi lý sau này Áp dng công ngh semantic web có th nghiên c u và phát tri n h th n s có th thc hin
x , tìm ki m và phân tích t t c các ki u thông tin s Công ngh ng
ng, thi t l c n thi t trong các d ng c a
nh danh cng s M c tiêu chính là làm cho thao tác gi a các ph n có th x lý thông minh, nh t quán, m ch l các l p c a
ng s và các d ch v
ng d ng ontologies trong vi c mô t h th ng m t
n s s d ng d li u mô t có c mô t h th c tuy nhiên
ng trong d li u mô t l y
, vi c ng d n s không nh ng th c hi d
liu mô t mô t h th c mà còn mô t c n i dung c a nó Thay vì
Trang 2222
ng h p m t quy n s có th tách riêng
c u trúc t a nó, cung c p mô t cho m c hi r
m i quan h c ng vi c s d ng c u trúc c a ontologies và s d ng này trong vi c mô t d u, cung c p m t t ng li
t ng quát d u mô t và n i dung li
M t trong nh ng ng d ng quan tr ng n a có th thy h thng d u c li a
n s r t l ng ph c v cho nhi u t ch c, cá nhân vào nhi u m u ch yli u thu c vào hai d ng là d
liu có c u trúc (trong database) và d li u phi c u trúc (các ngu n l y t web) Mt
v t ra là làm th các ng d ng s d ng th i c hai lo i d
liu này, b i vì trên th c t m i ng d ng ch s d ng m t lo i d li u có c u trúc
ho c phi c u trúc, có chu n chung ph c v cho h u h t các lo i ng d
d n c xem là n n t ng công ngh c a semantic web Nó s là c u n i th c hi n chu n hoá các ngu n d u, t li
phc v cho m i lo i ng d ng
1.3.3 ng d ng khung làm viỨ ụ ệc để qu n lý tri th c (Framework for Knowledge ả ứ
Management)
Semantic Web là m t h n n nhi u h a h n cho vi c phát tri n các h thng
qu n lý tri th c Tuy nhiên, v nào bi u di n tri th c d ng thc máy có th hi tri th c c n thi t có th c tìm th y b i các máy tìm (search engine) S d ng gi i pháp qu n lý tri th c d nh d
bi u di n các lu t và d a trên m t k thu t m chú gi i các ngu n tri th c b ng cách s d u ki n Gi i pháp là d a trên các công c Semantic n t m thu n l i chính là s y kh m tri th c v p c u t o các ngu n tri th c
c n thi t cho vi c gi i quy t m t v ng th c này có th c bi u
di n b ng cách dùng các câu l nh If Then (statement If- c thi t l p theo cách suy di n (inference) và y quy n (trust) trên Semantic Web Các statement (câu lu ki n có th l p ch m c n i dung các tài nguyên Web
Trang 2323
m t cách nhi i liên k t các t khóa, khái ni m hay metadata (siêu d liu này có th s hình thành các truy v n d a trên ng c
chính xác trong tìm ki m tri th c
Ví d : Trong v nh ch m c tài li u, dù có hay không có tài li c
nh ch m c b ng t khóa aspirin (thu c aspirin) và headache (b u), cách aspirin tr u có th c gi i quy t d dàng
b ng cách s d u kic Vi c xây d ng và qu n lý tri thc trên Semantic Web m t cách khoa h c cho phép s chuy ng trong
ng phân tán
Kế t luận chương
khái quát , ki c n n n
ng d ng trong Oracle, m
ng trong Web hi n t i
Trang 2424
CHƯƠNG 2: CÔNG NGH X LÝ NG Ệ Ử Ữ NGHĨA TRONG HỆ QU N TR Ả Ị
CSDL ORACLE VÀ ĐỀ XUẤT QUY TRÌNH NG DỨ ỤNG
h chia s và x c thông tin có ng n
c nhi u t ch c, doanh nghi p quan tâm và ng
d ng, tuy nhiên v v t m c giúp tìm ki m nhanh và b o
m t d u c li ng t t Hãng Oracle hi c các v này, cho nên h i pháp nh m gi i quy t chúng và k t phiên b n Oracle 11g tr
ông ngh c tích h p vào trong h qu n tr CSDL Oracle N t p tìm hi u sâu v công ngh x lý ng
xu t ra quy trình ng d ng công ngh này vào th c t
2.1 Công ngh x lý ng ệ ử ữ nghĩa trong Oracle
2.1.1 C u trúc công ngh ấ ệngữ nghĩa trong Oracle
li li
v n d u ng li c hi n truy v n d u quan h H li tr i dùng có
th t p lu ruy v n d li u ng th hi n c nào
Hình 2.1: Mô t c u trúc ng [17]
Trang 2525
Khối Database: hi n trong hình 2.1 kh i database ch a lid u ng
, các b n th lu n (mô hình RDF/OWL) và d li u quan h truy n th ng
D u ng li ng MDSYS.RDF_VALUE b ng này thông tin v ch th (subjects), thu i
S d ng Staging Table (b ng s p x t i hàng lot d li u ng
D liu tiên ph ki m tra tính chính xác v cú pháp
c n p vào b ng s p x p ti n là g i th t c
SEM_APIS.BULK_LOAD_FROM_STAGING_TABLE
v t o b ng s p x p:
Ví d
CREATE TABLE stage_table (
RDF$STC_sub varchar2(4000) not null,
RDF$STC_pred varchar2(4000) not null,
RDF$STC_obj varchar2(4000) not null
);
Tải theo đợt (Batch load) hay t i t ng ph n d u ng li
S d t i t ng ph n d u ng li d ng l
ti tng ph n d u ng li
oracle.spatial.rdf.client.BatchLoader gói tin này n m trong
<ORACLE_HOME>/md/jlib/sdordf.jar thc hic vi lic t i d u thành công phi tuân th m t s quy t c sau:
Trang 26 Khối truy v n (Query):Có th truy v n d u ng ấ li n th lun,
th c hi n các truy v c h tr v ng d u quan li
h truy n th tìm các m i quan h ng th c hi n các truy v n có
h b n th tr lun c n s d ng toán t SEM_RELATED
Khối suy lu n (Infer): kh i này có th m r ng kh ậ a các truy vn
v d u ng li ng cách s d ng suy di n ra (suy lu n), s d ng các quy t c (lut) và lu Suy di n cho phép t o ra các suy lu d a trên d
liu và các lut t thông tin v các lu t và lu
2.1.2 Mô hình d u ng ữliệ ữ nghĩa
D u ng li t c u trúc d li c mô hình
b ng cách s d th ng Các m siêu d lic bi u di n b ng
b c bi u di n là nút, ph n th c biu
di n b i m t liên k t tr c ti p mô t m i quan h gi a các nút Các b ba (triple)
c n m trong m t m ng d li u ng i mi dùng
Trang 2727
tt tên và các thành ph ng v i 1
ct trong mt bng
M t triple c a m t phát bi u (m ) bao gm 3 thành ph n: ch ng ho c tài nguyên (Subject or resource), v ng ho c thu nh (predicate or property), tân ngng ho c giá tr (object or value)
Subject (Resource) Cao Tu
Predicate (Property) Ging d y
Object (literal) Phân tích thit k gii thu t và Web ng
th bi u di n b 3 triple
object Subject or resource
Value
thut và Web ng
Trang 28m ng có nút b u và nút k t ng Nút có th là các nút trng, URI, các ký t n
DELETE trên bng MDSYS.SEM_MODEL
B ng 2.1: B ng MDSYS.SEM_MODEL trong Oracle [17]
Column Name Data Type Description
OWNER VARCHAR2(30) i t o
MODEL_ID NUMBER Ch s ID c a mô hình t ng
c t o ra
Trang 2929
MODEL_NAME VARCHAR2(25) Tên c a mô hình
TABLE_NAME VARCHAR2(30) Tên c a b ng tham chi n d
li u ng
COLUMN_NAME VARCHAR2(30)
Tên c a c t lo c tham chi u trong b ng SDO_RDF_TRIPLE_S
MODEL_TABLESPACE_NAME VARCHAR2(30)
Tên c a b c
s d b ba cho mô hình này
Khi t o 1 mô hình m ng th i b ng MDSYS.SEMM_model-name
c t o ra và b ng này ch i t o ra c quy n m i có nhìn th y Trong b ng MDSYS.SEMM_model-name m i m t dòng ch a 1 b ba và
i d ng 1 liên k t trong m t m ng B ng g m có các c
B ng 2.2: B ng MDSYS.SEMM_model-name [17]
Tên c t ộ Kiểu d li u ữ ệ Mô t ả
P_VALUE_ID NUMBER Ch s value_id cho giá tr n
text c a thu c tính M t ph n c a khóa chính
START_NODE_ID NUMBER Ch s value_id cho giá tr n
text c a ch th (Subject) M t ph n
c a khóa chính CANON_END_NODE_ID NUMBER
END_NODE_ID NUMBER Ch s value_id cho giá tr n
Trang 3030
DISTANCE NUMBER n
EXPLAIN VARCHAR2(4000) n
PATH VARCHAR2(4000) n
LINK_ID VARCHAR2(71) Giá tr nh n di n duy nh t b ba
C t P_VALUE_ID, START_NODE_ID, END_NODE_ID và
CANON_END_NODE_ID ch s giá tr ID th c t tính tc các giá tr t v ng
ng Tuy nhiên, mt giá tr t v ng có th không ph i tcùng m t giá tr ID
b Các m (Statement)
M t b thông tin v ch th (subjects), thui ng v i 1 m tr n, URI ho c các ký t ng v i b ba (triples) Mi b ba
trên m t hàng riêng bi i dùng không nên s d ng câu
lc DEi vi bng này
B ng MDSYS.RDF_VALUE$ bao g m các c t sau: (VALUE_ID, VALUE_TYPE, VNAME_PREFIX, VNAME_SUFIX, LITERAL_TYPE, LANGUAGE_TYPE, CANON_ID, COLLISION_EXT, CANON_COLLISION_EXT, LONG_VALUE, VALUE_NAME)
- Tính duy nh t cho b ba (triples):
M i b ng MDSYS.RDF_VALUE là không
c trùng l ki m tra xem b ba (triples) chu n b thêm vào có trùng l p v i
b ba (triples) hi n có không thì h thng tii sánh b i các triple hi n có trong mô hình N u c 3 thành ph n trong b ba (triples) là URI thì s i sánh c ba thành ph n N ng Object là ký t (literal) thì s i sánh ch th và thu nh tính trùng l p
ba (triples) sau là trùng l p
<eg:a> <eg:b> "123"^^http://www.w3.org/2001/XMLSchema#int
<eg:a> <eg:b> "123"^^http://www.w3.org/2001/XMLSchema#unsignedByte
Trang 31- Nút trng:
Các nút tr ng có th c s d th ng trong
m ng ng t mô hình ng ng có xu t hi n nhi u ltr n
i cùng tham chin cùng m t tài nguyên
N u xu t hi n hai mô hình ng c tham chiu
- T suy di n, các quy t c và quy t :
Suy di n là kh t o ra suy lu n h p lý d a trên các quy t c, các lu t
c cung c p b i Oracle ho i dùng t n cho phép xây
d ng các truy v n th c hi n k t h p ng a trên các m i quan h
gi a các m u d lic v i vi c k t h p cú pháp d a trên chu i ho c các giá tr khác
Trang 3232
Hình 2.3: Mô hình t suy di n [17]
M t rulebase là m ng có ch a 1 t p các quy t c M t s quy t
s mà Oracle h tr bao g m: RDFS, RDF, OWLSIF, RDFS++, OWLPRIME, Rules Indexes, Virtual Models
RDFS là s m r ng c c b sung thêm mt tp các quy t c.Các quy tc t ra khi i th c o g t
t
B ng MDSYS.SEMR_rulebase-name g m các c t sau: (RULE_NAME,
ANTECEDENTS, FILTER, CONSEQUENTS, ALIASES)
N i dung v t t c các quy t c có th c xem trong bng
MDSYS.SEM_RULEBASE_INFO (OWNER, RULEBASE_NAME,
RULEBASE_VIEW_NAME, STATUS)
- m c cho các quy t c:
m c quy t c là m ng có ch a b c tính toán Ch
c có th c suy ra t vi c áp d ng các quy t áp d ng vào cho m t t p
nh N u 1 truy v c n b t k quy t
Trang 33c trên m t hoc nhiu mô hình và tùy ch n các ch s quy t ng
S d ng m t mô hình o có th n hóa vi c qu c quy n truy
c i v i d u ng li , gi s r o ra ba mô hình ng
m t ch s quy t c d a trên ba mô hình và quy t OWLPRIME N u không
có mô hình o, ph i c p và thu h i riêng quy n truy c p cho t ng mô hình và ch
m c quy t c Tuy nhiên, n u t o mt mô hình o có ch a ba mô hình và ch m c các quy t c, ch c n c p và thu hc quy n truy c p cho mô hình o duy nh t
S d ng m t mô hình t u ki n c p nh t nhanh các mô hình ng , gi s mô hình o VM1 ch a mô hình M1 và ch m c quy
t c R1 (t c là VM1 = M1 UNION ALL R1) và gi s r ng mô hình ng M1_UPD là m t b n sao c c c p nh t v i các triples b sung và R1_UPD là m t ch m c quy t c t o cho M1_UPD Bây gi có truy vn
i dùng trên VM1 truy c p mô hình c p nh t và ch m c quy t có th xác c,
nh l i mô hình VM1 = M1_UPD UNION ALL R1_UPD)
t o m t mô hình o, s d ng th t c
b xóa m t mô hình o thì s d ng th t c SEM_APIS.DROP_VIRTUAL_MODEL M t mô hình c t ng b
u b t k mô hình thành ph n, ch m , hoc ch m c quy tc nào b b
Khi t o m t mô hình ng th i thông tin v mô hình s c t ng
ng MDSYS.SEM_MODEL$ Tuy nhiên, các giá tr trong m t s c t khác nhau c a mô hình c v i các mô hình ng t trong
Trang 3434
b: (OWNER, MODEL_ID, MODEL_NAME, COLUMN_NAME, MODEL_TABLESPACE_NAME)
t các mô hình c hi n th Thông tin v t c trong
MDSYS.SEM_VMODEL_INFO
Thông tin v t t c ng (các mô hình, các quy t và ch m c
ng MDSYS.SEM_VMODEL_DATASETS
- B o m t d li u ng
Khi m t mô hình ho c ch m c quy t c t o thì ch i t o ra hoc
c quy n m i có toàn quy i dùng ch có quy n xem, t o
m t s ch m c quy t c bao g m chèn, c p nh t và xóa quy n có th s i quy tc
i t o mô hình có th c p thêm m t s c quyi mô hình
Trang 35d u li
SEMM_model-name Các b c ch nh SEM_RULEBASE_INFO Quy t
SEM_RULES_INDEX_DATASETS Các d li c s d ng trong các ch
2.1.5 Các loại dữ liệ u ng ữ nghĩa, cấu trúc và phương thức
- King SDO_RDF_TRIPLE th hin d u ng li nh dng
Trang 36- l y toàn b ho c m t ph a bn c ba (triples) bao gm:
GET_TRIPLE() RETURNS SDO_RDF_TRIPLE
GET_SUBJECT() RETURNS VARCHAR2
GET_PROPERTY() RETURNS VARCHAR2
GET_OBJECT() RETURNS CLOB
2.1.6 Cách s d ng b ng SEM_MATCH ch a các hàm truy v n d u ng ử ụ ả ứ ấ ữ liệ ữnghĩa
Trong oracle s d ng m t b ng SEM_MATH ch a các hàm giúp truy v n d liu ng ng SEM_MATH có c u trúc:
- Thu3.c tính truy v n là m t chu i ký t (ho c ký t n i chu i) v i m t
hoc nhiu mng cha các bin
- Thuc tính truy v n không th là bi n ràng bu c ho c m t bi u th c liên
n m t bi n ràng bu c
Trang 3737
M t m c bao quanh trong d u ngo
M i atom (nguyên t ) có th là m t bi n ví d : ?x, m ví du: fdf:
c m r ng d a trên không gian tên m nh và giá tr c a thu c tính bí danh ho c m ví d : http://www.example.org/family/Male Ngoài ra, atom th ba có th là ch s (ví d : 3.14), m t ch v n (ví d:
"Herman"), m t ngôn ng u v i ký t n ví d "Herman" @en, ho c
mt kiu ký t ví d : "123" ^^ xsd: int
Ví d : M t truy v n v i các thu c tính ch nh ba m tìm ông ni
i ông có gi i tính là nam) và chi u cao c a m a cháu c a ông:
(?x :grandParentOf ?y) (?x rdf:type :Male) (?y :height ?h)
- Thu nh mô hình ho c mô hình s d ó là: SEM_MODELS VACHAR2(25) và ki VARCHAR2 (25)
- Thu nh mt ho c rulebases mà các rule s
c áp d ng vào truy v n Lo i d li u c a nó là SDO_RDF_RULEBASES nó
TABLE OF VARCHAR2 (25) N n trên
mô hình o thì thu c tính này ph null
- Thu nh m t ho c nhi u không gian tên (namespaces) ngoài các không gian tên mc s d m r ng các tên trong m u truy v n Ki u d u c li
nhng h p chi u cao là 6 tr lên
- Thuc tính index_status cho phép truy v n d u ng li khi ch m c quy t c có liên quan không có tr ng thái h p l (N n m t
Trang 3838
mô hình o, thu c tính này chính là ch m c quy t c k t h p v i mô hình o)
N u thu c tính này là null, truy v n tr v m t l i N u thu c tính này không ph i là null, nó phi là chui INCOMPLETE ho c INVALID
- Thunh các tùy ch n có th n k t qu truy
v n Các tùy ch c th hi i d ng c p giá tr t khóa Các tùy ch n sau
c h tr : ALLOW_DUP=T, HINTO={hint- string}
ho c n i d u vào kho d u ng li li t i mt
ng l n d li u; tuy nhiên, nó không th x lý các triples ch a các giá tr i
ng l
- Tt (Batch load) s d ng giao di t i ho c n i d
liu t m t t nh d ng N-Triple vào kho d li u ng n này chi hàng lo lý triple cha các giá tr ng v
4000 byte
- T i vào d u vào b ng s d ng câu l nh SQL INSERT g li c
khi to SDO_RDF_TRIPLE_S
- S d ng Staging Table (b ng s p x t i hàng lot d li u ng
D liu tiên phc ki m tra tính chính xác v
c n p vào b ng s p x p ti n là g i th t c SEM_APIS.BULK_LOAD_FROM_STAGING_TABLE
v t o b ng s p x p:
Ví d
CREATE TABLE stage_table (
RDF$STC_sub varchar2(4000) not null,
RDF$STC_pred varchar2(4000) not null,
RDF$STC_obj varchar2(4000) not null
Trang 39RDF$STC_sub varchar2(4000) not null,
RDF$STC_pred varchar2(4000) not null,
RDF$STC_obj varchar2(4000) not null
);
Có th s d ng m COMPRESS trong câu l nén b ng nh m làm giám không gian b nh và c i thi n hi u su t t i d liu
Ti phân tích cú pháp và n p d li u ng t
b ng s p x p Trong Oracle t p l n t i $ ORACLE_HOME / md / demo
i dùng có th s i tp này
Không th t ng có ch a các giá tr l Loader ki m soát t p tin s c t ng t ch trong t p tin SQL
* Loader x u Tuy nhiên b ba (striple) ch a các giá tr ng l
có th c np b ng cách sau:
+ S d ng th t c SEM_APIS.BULK_LOAD_FROM_STAGING_TABLE
t i t t c trong b ng s p x p
+ T i các hàng còn l loi b khi s d ng SQL * Loader v i t u khi n m u) t nh d ng N-Triple
B ng RDF $ ET_TAB là b i các s ki n, tác v khi th c hi n th
tc SEM_APIS.BULK_LOAD_FROM_STAGING_TABLE B ng RDF $
c t
Trang 40end_comment varchar2(1000) DEFAULT NULL
v i s ng l n d u T i t ng ph li ng là m t l a ch n t u kin
+ D lic tt vài trit
+ D u ch a m t s li ng l