LI G II THI U
B ng 6: Mã XQuery tìm danh sách các di 'n viên duy n ht trong v di 'n Hamlet
IV.2.5. Các công ngh x lý khác
Xlink c coi nh m t ph ng th c chu n a các liên k t siêu v n b n vào
file XML. XPointer and XFragments là nh ng cú pháp phát tri n các ph#n trong v n b n XML. XPointer có ôi ch( gi!ng URL, nh ng thay vì t p trung vào v n b n trên m ng, XPointer t p trung vào t'ng o n d li u trong file XML. CSS
(style sheet language) có th áp d ng c !i v i XML gi!ng nh HTML. XSL là m t lo i ngôn ng dùng cho style sheet d a trên XSLT, m t lo i ngôn ng chuy n i s$ d ng trong vi c s p x p l i, thêm vào và xoá i m t s! tag và thu c tính.
DOM và SAX là trình phân tích file XML th ng c dùng trong m t ngôn ng
l p trình. DOM phân tích m t v n b n XML ra theo c u trúc hình cây trong b nh x$ lý. SAX c&ng là trình phân tích tài li u XML nh ng làm vi c theo nguyên t c ch kích ho t khi c n các tags c a d li u XML.
<html><head/><body>
{ for $act in doc("hamlet.xml")//ACT
let $speakers := distinct-values($act//SPEAKER) return
<span>
<h1>{ $act/TITLE/text() }</h1> <ul>
{ for $speaker in $speakers return <li>{ $speaker }</li> } </ul>
</span> }
IV.3. Ki/n trúc c a m t C2 s3 d li u XML
IV.3.1. CSDL XML t nhiên và CSDL quan h h* tr XML
CSDL XML t nhiên c thi t k ,c thù cho vi c l u tr và truy c p các tài li u XML. C&ng nh các CSDL khác, các CSDL này h( tr các tính n ng nh giao d ch, an ninh, truy nh p ng th i, API có th l p trình c, ngôn ng truy v n…. Mô hình bên trong c a CSDL d a trên XML ch không ph i là mô hình quan h . Các CSDL quan h h( tr XML và CSDL XML h( tr d li u quan h khác nhau th hi n vi c t!i u hóa các k ho ch th c hi n các câu truy v n. Trong lõi engine
quan h , ó là các thao tác h t nhân nh restriction, projection và join. CSDL XML có các thao tác h t nhân khác phù h p h n v i vi c th c hi n h i quy khi di chuy n
trong m t c u trúc hình cây .
IV.3.2. Các thành ph n c a m t CSDL XML
Thông th ng các CSDL XML th ng m i là các CSDL lai có th x$ lý c cùng các d li u XML và d li u quan h trong cùng m t h th!ng. D li u quan h
c l u d i các c u trúc d ng b ng. D li u XML c l u d i d ng hình cây có tính n s phân c p trong c u trúc các tài li u XML. Có m t lõi CSDL ho t ng trên hai c u trúc d li u này x$ lý c hai d ng d li u. Ngoài ra h th!ng c&ng c#n có các trình phân tích cho SQL và XQuery. C&ng nh CSDL truy n th!ng, h th!ng, CSDL XML c#n có modul t!i u hóa các câu l nh truy v n. Hình 3 ch ra ki n trúc các thành ph#n c a m t CSDL XML thông d ng.
42
IV.3.3. Các yêu c u i v i CSDL XML
M t CSDL XML ph i th c hi n các d ng truy v n c mong i th c hi n trên d li u XML. th c hi n i u ó, CSDL XML c#n áp ng c các yêu c#u v CSDL thông th ng và các yêu c#u ,c thù c a d ng XML, ví d :
H( tr qu n lý các l c nh ngh a c u trúc d li u và s có hi u l c c a d li u vào theo các l c ó.
Cung c p c ch th m, s$a hay xóa n i dung
Cung c p c ch truy nh p nhi u ng i dung, s toàn v5n c a m t giao d ch, phát hi n deadlock, sao l u, h i ph c s c! và sao l,p d li u. Cung c p các kh n ng nh p và xu t d li u theo lô.
Cho phép c u hình v t lý c a CSDL c t!i u hóa thông qua ki m soát s thi t l p các ch s!, kho ng a c ng c s$ d ng, và các ngu n tài nguyên khác.
T!i u các câu truy v n có c vi c th c hi n m t cách t!t nh t.
IV.4. Trao +i d li u và chu4n
có th trao i thông tin m t cách hi u qu , nh t là trong các c quan chính quy n và trong giao d ch th ng m i, chu n thông tin và chu n d li u có t#m quan tr ng ,c bi t.
IV.4.1. Xu th trao i thông tin b+ng các chu n
M t chu n thông tin xác nh các nguyên t c b t bu c mà các t ch c c#n tuân th /quan tâm khi th c hi n các nghi p v tác nghi p. Chu n thông tin cho phép gi m c chi phí s n xu t, nhât là trong các d án l n, t ng kh n ng tích h p gi a các h th!ng, tái s$ d ng c tri th c, nâng cao kh n ng t ng hoá, và t ng kh n ng m r ng c a các h thông ã c xây d ng.
Chu n d li u là m t th-a thu n b"ng v n b n v s th hi n, nh d ng và nh ngh a các d li u ph bi n. Chu n d li u nêu rõ d li u nào c l u tr , d li u
Nh có chu n d li u, các d li u t ng t nhau c t o m t l#n và sau ó c s$ d ng b i nhi u ng d ng khác nhau. Chu n d li u c i thi n ch t l ng và kh n ng chia s2 d li u gi&a các h th!ng b"ng các ph ng th c sau:
Cho phép t ng thích d li u gi a các ng d ng ph#n m m khác nhau. T ng tính nh t quán c a d li u, gi m thi u s d th'a d li u.
IV.4.2. XML và chu n trao i d li u ph bi n
Vi c xây d ng các chu n d li u trên th gi i ho,c do các t ch c tiêu chu n nghiên c u công b! ho,c do các hi p h i công nghi p trong l nh v c thông tin xu t. H#u nh m(i ngành công nghi p có nhi u chu n d a trên cú pháp c a XML và c&ng có nhi u chu n XML liên ngành. Các ánh d u XML ch a các thông tin v d li u trong su!t quá trình x$ lý, vì th d li u có th c l y ra t' nhi u ngu n, t ng h p l i, ch nh s$a theo yêu c#u và chuy n cho b ph n x$ lý m c khác. Nh ng chu n d li u chính c qu!c t n( l c phát tri n hi n nay liên quan n các v n th ng m i i n t$ và các chu n d li u c a Web. Ví d v các chu n công nghi p d a trên XML nh ebXML cho các ho t ng kinh doanh, ACORD – XML cho ngành công nghi p b o hi m, FPML cho các s n ph m tài chính, HL7 cho ch m sóc y t , IFX cho trao i t ng tác tài chính, IXRetail cho ho t ng bán l2, XBRL cho báo cáo kinh doanh/K toán, NewsML cho tin t c/ xu t b n. Các chu n này h( tr cho các m c ích trao i thông tin gi a các !i tác trong m t ngành công nghi p và các thành viên, nh ngh a d li u cho các ho t ng ang di n ra, ,c t c a tài li u,…Ngày càng nhi u các công ty ch p nh n XML hay b b t bu c ch p nh n XML t n t i c nh tranh, c i ti n các i m t n ng trong x$
lý thông tin, giao d ch v i các !i tác và nhà cung c p hay n thu#n ch th c hi n các công vi c hàng ngày. Các chu n trao i d li u ph bi n là:
ebXML (Electronic Business using eXtensible Markup Language) là
nh ng ,c t cho phép các doanh nghi p có th ti n hành th ng m i thông qua Internet. S$ d ng ebXML, các công ty có m t ph ng pháp chu n trao i các thông i p th ng m i, b t tay h p tác th ng m i, trao i d li u theo d a trên v!n t' chu n, nh ngh a và ng ký các quy trình th ng m i. Chu n ebXML c ch p nh n b i ISO và
44
OASIS nh"m cung c p m t c ch ng d ng XML có th c th c hi n m t cách tr c ti p xây d ng các gi i pháp th ng m i i n t$. ebXML có n m m c ,c t c ch p nh n b i ISO 15000 nh sau:
1. ISO 15000-1: ebXML Các th)a thu n v h s c a các i tác c ng tác 2. ISO 15000-2: ebXML c t v d ch v thong i p
3. ISO 15000-3: ebXML Mô hình thông tin cho vi c $ng ký 4. ISO 15000-4: ebXML c t các d ch v $ng ký
5. ISO 15000-5: ebXML c t k* thu t các thành ph n lõi
Chu n XML v thu TaXML là m t chu n m d a trên XML dùng
trao i các thông tin liên quan n thu c trình bày t i
http://www.taxml.org. Vertex Inc., nh m t t ch c trong l nh v c thu ,
ã làm vi c v TaXML trong m t s! n m. Ngoài ra, Microsoft c&ng phát tri n Tax Markup Language (TaxML), ó là m t t p t' v ng c nh ngh a s$ d ng XML cho d li u v thu c dùng trong các tài li u c a Microsoft. T p t' v ng TaML cho phép xác nh rõ rang các thông tin v thu v i các thu t ng c s$ d ng trong l nh v c thu .
Hình 4: M t giao th c FIXML
Giao th c trao i thông tin tài chính FIXML là m t chu n c phát tri n riêng cho các trao i i n t$ th i gian th c c a các giao th c b o m t, nh"m t ng c ng quá trình th ng m i toàn c#u. Các thông
i p FIXML có th c ki m tra tính có giá tr b i các ch ng trình phân tích ng ngh a chu n. FIXML bao g m m t t p các nh ngh a
ki u tài li u (DTD) mô t cách th hi n các thông i p FIXML.
IV.4.3. Siêu d li u và chu n cho siêu d li u
Trong nh ng n m qua, l ng thông tin a ph ng ti n c l u tr trên Internet d ng hình nh, video, âm thanh, v n b n ngày càng t ng, v i ch t l ng hoàn thi n h n. Chính kh!i l ng và tính a ph ng ti n c a các thông tin này d+n n nguy c tràn ng p các h th!ng x$ lý b"ng c các thông tin có ích và không phù.
S c#n thi t c#n xác nh các ngu n tài nguyên i n t$ m t cách chính xác h n nh"m t o i u ki n cho vi c truy nh p thông tin ã thúc y vi c phát tri n các l c
c a siêu d li u (metadata schema) thông th ng c nh ngh a nh “d li u v d li u”. Vi c phát tri n các siêu d li u c th c hi n cho các ng d ng t ng quát, nh Dublin Core, các d ch v cung c p thông tin chính ph (Government Information Locator Service), d ch v cung c p thông tin toàn c#u (Global Information Locator Service), hay ID c a các !i t ng s! (Digital Object Identifier). Ngoài ra c&ng có các l c siêu d li u cho các l nh v c ,c thù nh sáng ki n mã hóa v n b n (Text Encoding Initiative), mô t các b n l u c mã hóa (Encoded Archival Description), chu n n i dung cho siêu d li u a lý s!
(Content Standard for Digital Geospatial Metadata),…Các l c này d a trên các ng ngh a do máy hi u c nh HTML, SGML, và nhi u nh t là trên XML. Các c ch tìm ki m d a trên siêu d li u có th c c chính xác các siêu th ánh d u (metatag) và n i dung c a các tài nguyên s! trong ó siêu d u li u c g n vào trong hay c m t b n ghi siêu d li u ch n.
IV.5. XML và an toàn b#o m5t
áp ng c các yêu c#u b o m t cho tính riêng t , bí m t và nh t quán có vai trò c!t y u cho th ng m i i n t$. Do c ch p nh n nh khuôn d ng cho tài li u và giao th c, các c ch b o m t c&ng c#n c thi t l p cho các gi i pháp XML. Các chu n b o m t c thi t l p cho các t' v ng XML và các lu t dùng x$ lý. Các chu n này s$ d ng các công ngh m t mã có s*n.
46
Các chu n b o m t c a XML bao g m XML Digital Signature cho tính nh t quán và ký các gi i pháp, XML Encryption cho vi c gi bí m t, XML Key Management cho vi c ng ký, ki m nh khóa công khai, Security Assertion Markup Language cho vi c chuy n t i tính nh danh, th m quy n, và vi c xác nh n các thu c tính, XML Access Control Markup Language nh ngh a các lu t ki m soát vào ra, Platform for Privacy Preferences nh ngh a các chính sách cho vi c m b o
riêng t và tham chi u. Các use-case chính bao g m Web Services (WS-Security)
và Digital Rights Management (eXtensible Rights Markup Language 2.0).
M t yêu c#u c#n thi t cho các chu n an ninh b o m t trên là c#n làm vi c m t cách hoàn h o !i v i các n i dung c t o ra b i XML. B o m t cho XML c#n c tích h p v i XML sao cho v+n gi các tính n ng c a XML trong khi b sung các kh n ng an ninh c#n thi t. Yêu c#u này r t c#n cho các giao th c d a trên XML nh XMLProt, SOAP th ng c dùng x$ lý và bi n i các thông i p m t cách tr c ti p. N i dung chi ti t c a các chu n giao th c trên không n"m trong khuôn kh c a tài này và s% c c p n trong các tài li u khác có liên quan.
IV.6. XML và chính ph i n t*
XML ã c nhi u n c trên th gi i ch n là khuôn d ng d li u trao i d li u, thông tin trong Chính ph i n t$. Chính ph i n t$ nh"m h ng t i m c tiêu ph c v các m!i quan h gi a Chính ph v i các ‘khách hàng’ c a Chính ph , bao g m các quan h gi a Chính ph v i Công dân (G2C), v i ng i lao ng (G2E), Chính ph v i doanh nghi p (G2B), và gi a các c quan Chính ph trong n c v i nhau ho,c v i Chính ph , c quan Chính ph c a các n c khác (G2G).
Trong các d ng giao d ch trên, i m c!t y u là các h th!ng có th hi u c nhau. Trong ng c nh này, XML là khuôn d ng d li u phù h p chuy n t i thông tin và ng ngh a gi a các h th!ng thông tin và các ng d ng. V i vai trò nh là ngôn
ng nh d ng các chu n trao i d li u trong nhi u ngành, l nh v c, XML tham
gia vào h#u h t các giao d ch trong h th!ng Chính ph i n t$. Chi ti t v XML trong các d ch công c a Chính ph i n t$ s% c c p trong nghiên c u khác.
Ph n V. CÁC GI I PHÁP CÔNG NGH CSDL
V.1. Các gi#i pháp CSDL c a IBM
Theo i u tra c a Gartner Group vào tháng 3 n m 2006, 19% (27% n u trong vùng châu Á-Thái bình D ng) các doanh nghi p c h-i tr l i mong mu!n tri n khai s n ph m CSDL c a IBM trong t ng lai. i u này nói lên s t ng tr ng th ph#n c a IBM trong l nh v c CSDL các n m s p t i.
Nh"m a công ngh XML vào th ng m i hóa, IBM ã a ra DB2 9 "Viper",
máy ch d li u có công ngh pureXML và công ngh nén d li u XML theo dòng.
DB2 9 là b c chuy n m i trong vi c l u tr và qu n lý d li u XML, có tác ng m nh m% vào th tr ng CSDL.
Tr c khi công ngh này ra i, qu n lý d li u XML th ng theo các cách ti p c n sau ây:
L u các tài li u XML trong các t p h th!ng
a d li u XML vào các LOB c a CSDL quan h Chia nh- d li u XML vào các b ng và các c t quan h
Tách bi t d li u trong các h th!ng CSDL XML chuyên d ng
Theo các cách trên, ph ng pháp qu n lý và chia s2 d li u XML không áp ng