Ng 6: Mã XQuery tìm danh sách các di 'n viên duy n ht trong v di 'n Hamlet

Một phần của tài liệu nghiên cứu đề xuất định hướng công nghệ pháp triển và ứng dụng các hệ thống thông tin và cơ sở dữ liệu (Trang 40 - 59)

LI G II THI U

B ng 6: Mã XQuery tìm danh sách các di 'n viên duy n ht trong v di 'n Hamlet

IV.2.5. Các công ngh x lý khác

Xlink c coi nh m t ph ng th c chu n a các liên k t siêu v n b n vào

file XML. XPointer and XFragments là nh ng cú pháp phát tri n các ph#n trong v n b n XML. XPointer có ôi ch( gi!ng URL, nh ng thay vì t p trung vào v n b n trên m ng, XPointer t p trung vào t'ng o n d li u trong file XML. CSS

(style sheet language) có th áp d ng c !i v i XML gi!ng nh HTML. XSL là m t lo i ngôn ng dùng cho style sheet d a trên XSLT, m t lo i ngôn ng chuy n i s$ d ng trong vi c s p x p l i, thêm vào và xoá i m t s! tag và thu c tính.

DOM và SAX là trình phân tích file XML th ng c dùng trong m t ngôn ng

l p trình. DOM phân tích m t v n b n XML ra theo c u trúc hình cây trong b nh x$ lý. SAX c&ng là trình phân tích tài li u XML nh ng làm vi c theo nguyên t c ch kích ho t khi c n các tags c a d li u XML.

<html><head/><body>

{ for $act in doc("hamlet.xml")//ACT

let $speakers := distinct-values($act//SPEAKER) return

<span>

<h1>{ $act/TITLE/text() }</h1> <ul>

{ for $speaker in $speakers return <li>{ $speaker }</li> } </ul>

</span> }

IV.3. Ki/n trúc c a m t C2 s3 d li u XML

IV.3.1. CSDL XML t nhiên và CSDL quan h h* tr XML

CSDL XML t nhiên c thi t k ,c thù cho vi c l u tr và truy c p các tài li u XML. C&ng nh các CSDL khác, các CSDL này h( tr các tính n ng nh giao d ch, an ninh, truy nh p ng th i, API có th l p trình c, ngôn ng truy v n…. Mô hình bên trong c a CSDL d a trên XML ch không ph i là mô hình quan h . Các CSDL quan h h( tr XML và CSDL XML h( tr d li u quan h khác nhau th hi n vi c t!i u hóa các k ho ch th c hi n các câu truy v n. Trong lõi engine

quan h , ó là các thao tác h t nhân nh restriction, projection và join. CSDL XML có các thao tác h t nhân khác phù h p h n v i vi c th c hi n h i quy khi di chuy n

trong m t c u trúc hình cây .

IV.3.2. Các thành ph n c a m t CSDL XML

Thông th ng các CSDL XML th ng m i là các CSDL lai có th x$ lý c cùng các d li u XML và d li u quan h trong cùng m t h th!ng. D li u quan h

c l u d i các c u trúc d ng b ng. D li u XML c l u d i d ng hình cây có tính n s phân c p trong c u trúc các tài li u XML. Có m t lõi CSDL ho t ng trên hai c u trúc d li u này x$ lý c hai d ng d li u. Ngoài ra h th!ng c&ng c#n có các trình phân tích cho SQL và XQuery. C&ng nh CSDL truy n th!ng, h th!ng, CSDL XML c#n có modul t!i u hóa các câu l nh truy v n. Hình 3 ch ra ki n trúc các thành ph#n c a m t CSDL XML thông d ng.

42

IV.3.3. Các yêu c u i v i CSDL XML

M t CSDL XML ph i th c hi n các d ng truy v n c mong i th c hi n trên d li u XML. th c hi n i u ó, CSDL XML c#n áp ng c các yêu c#u v CSDL thông th ng và các yêu c#u ,c thù c a d ng XML, ví d :

H( tr qu n lý các l c nh ngh a c u trúc d li u và s có hi u l c c a d li u vào theo các l c ó.

Cung c p c ch th m, s$a hay xóa n i dung

Cung c p c ch truy nh p nhi u ng i dung, s toàn v5n c a m t giao d ch, phát hi n deadlock, sao l u, h i ph c s c! và sao l,p d li u. Cung c p các kh n ng nh p và xu t d li u theo lô.

Cho phép c u hình v t lý c a CSDL c t!i u hóa thông qua ki m soát s thi t l p các ch s!, kho ng a c ng c s$ d ng, và các ngu n tài nguyên khác.

T!i u các câu truy v n có c vi c th c hi n m t cách t!t nh t.

IV.4. Trao +i d li u và chu4n

có th trao i thông tin m t cách hi u qu , nh t là trong các c quan chính quy n và trong giao d ch th ng m i, chu n thông tin và chu n d li u có t#m quan tr ng ,c bi t.

IV.4.1. Xu th trao i thông tin b+ng các chu n

M t chu n thông tin xác nh các nguyên t c b t bu c mà các t ch c c#n tuân th /quan tâm khi th c hi n các nghi p v tác nghi p. Chu n thông tin cho phép gi m c chi phí s n xu t, nhât là trong các d án l n, t ng kh n ng tích h p gi a các h th!ng, tái s$ d ng c tri th c, nâng cao kh n ng t ng hoá, và t ng kh n ng m r ng c a các h thông ã c xây d ng.

Chu n d li u là m t th-a thu n b"ng v n b n v s th hi n, nh d ng và nh ngh a các d li u ph bi n. Chu n d li u nêu rõ d li u nào c l u tr , d li u

Nh có chu n d li u, các d li u t ng t nhau c t o m t l#n và sau ó c s$ d ng b i nhi u ng d ng khác nhau. Chu n d li u c i thi n ch t l ng và kh n ng chia s2 d li u gi&a các h th!ng b"ng các ph ng th c sau:

Cho phép t ng thích d li u gi a các ng d ng ph#n m m khác nhau. T ng tính nh t quán c a d li u, gi m thi u s d th'a d li u.

IV.4.2. XML và chu n trao i d li u ph bi n

Vi c xây d ng các chu n d li u trên th gi i ho,c do các t ch c tiêu chu n nghiên c u công b! ho,c do các hi p h i công nghi p trong l nh v c thông tin xu t. H#u nh m(i ngành công nghi p có nhi u chu n d a trên cú pháp c a XML và c&ng có nhi u chu n XML liên ngành. Các ánh d u XML ch a các thông tin v d li u trong su!t quá trình x$ lý, vì th d li u có th c l y ra t' nhi u ngu n, t ng h p l i, ch nh s$a theo yêu c#u và chuy n cho b ph n x$ lý m c khác. Nh ng chu n d li u chính c qu!c t n( l c phát tri n hi n nay liên quan n các v n th ng m i i n t$ và các chu n d li u c a Web. Ví d v các chu n công nghi p d a trên XML nh ebXML cho các ho t ng kinh doanh, ACORD – XML cho ngành công nghi p b o hi m, FPML cho các s n ph m tài chính, HL7 cho ch m sóc y t , IFX cho trao i t ng tác tài chính, IXRetail cho ho t ng bán l2, XBRL cho báo cáo kinh doanh/K toán, NewsML cho tin t c/ xu t b n. Các chu n này h( tr cho các m c ích trao i thông tin gi a các !i tác trong m t ngành công nghi p và các thành viên, nh ngh a d li u cho các ho t ng ang di n ra, ,c t c a tài li u,…Ngày càng nhi u các công ty ch p nh n XML hay b b t bu c ch p nh n XML t n t i c nh tranh, c i ti n các i m t n ng trong x$

lý thông tin, giao d ch v i các !i tác và nhà cung c p hay n thu#n ch th c hi n các công vi c hàng ngày. Các chu n trao i d li u ph bi n là:

ebXML (Electronic Business using eXtensible Markup Language) là

nh ng ,c t cho phép các doanh nghi p có th ti n hành th ng m i thông qua Internet. S$ d ng ebXML, các công ty có m t ph ng pháp chu n trao i các thông i p th ng m i, b t tay h p tác th ng m i, trao i d li u theo d a trên v!n t' chu n, nh ngh a và ng ký các quy trình th ng m i. Chu n ebXML c ch p nh n b i ISO và

44

OASIS nh"m cung c p m t c ch ng d ng XML có th c th c hi n m t cách tr c ti p xây d ng các gi i pháp th ng m i i n t$. ebXML có n m m c ,c t c ch p nh n b i ISO 15000 nh sau:

1. ISO 15000-1: ebXML Các th)a thu n v h s c a các i tác c ng tác 2. ISO 15000-2: ebXML c t v d ch v thong i p

3. ISO 15000-3: ebXML Mô hình thông tin cho vi c $ng ký 4. ISO 15000-4: ebXML c t các d ch v $ng ký

5. ISO 15000-5: ebXML c t k* thu t các thành ph n lõi

Chu n XML v thu TaXML là m t chu n m d a trên XML dùng

trao i các thông tin liên quan n thu c trình bày t i

http://www.taxml.org. Vertex Inc., nh m t t ch c trong l nh v c thu ,

ã làm vi c v TaXML trong m t s! n m. Ngoài ra, Microsoft c&ng phát tri n Tax Markup Language (TaxML), ó là m t t p t' v ng c nh ngh a s$ d ng XML cho d li u v thu c dùng trong các tài li u c a Microsoft. T p t' v ng TaML cho phép xác nh rõ rang các thông tin v thu v i các thu t ng c s$ d ng trong l nh v c thu .

Hình 4: M t giao th c FIXML

Giao th c trao i thông tin tài chính FIXML là m t chu n c phát tri n riêng cho các trao i i n t$ th i gian th c c a các giao th c b o m t, nh"m t ng c ng quá trình th ng m i toàn c#u. Các thông

i p FIXML có th c ki m tra tính có giá tr b i các ch ng trình phân tích ng ngh a chu n. FIXML bao g m m t t p các nh ngh a

ki u tài li u (DTD) mô t cách th hi n các thông i p FIXML.

IV.4.3. Siêu d li u và chu n cho siêu d li u

Trong nh ng n m qua, l ng thông tin a ph ng ti n c l u tr trên Internet d ng hình nh, video, âm thanh, v n b n ngày càng t ng, v i ch t l ng hoàn thi n h n. Chính kh!i l ng và tính a ph ng ti n c a các thông tin này d+n n nguy c tràn ng p các h th!ng x$ lý b"ng c các thông tin có ích và không phù.

S c#n thi t c#n xác nh các ngu n tài nguyên i n t$ m t cách chính xác h n nh"m t o i u ki n cho vi c truy nh p thông tin ã thúc y vi c phát tri n các l c

c a siêu d li u (metadata schema) thông th ng c nh ngh a nh “d li u v d li u”. Vi c phát tri n các siêu d li u c th c hi n cho các ng d ng t ng quát, nh Dublin Core, các d ch v cung c p thông tin chính ph (Government Information Locator Service), d ch v cung c p thông tin toàn c#u (Global Information Locator Service), hay ID c a các !i t ng s! (Digital Object Identifier). Ngoài ra c&ng có các l c siêu d li u cho các l nh v c ,c thù nh sáng ki n mã hóa v n b n (Text Encoding Initiative), mô t các b n l u c mã hóa (Encoded Archival Description), chu n n i dung cho siêu d li u a lý s!

(Content Standard for Digital Geospatial Metadata),…Các l c này d a trên các ng ngh a do máy hi u c nh HTML, SGML, và nhi u nh t là trên XML. Các c ch tìm ki m d a trên siêu d li u có th c c chính xác các siêu th ánh d u (metatag) và n i dung c a các tài nguyên s! trong ó siêu d u li u c g n vào trong hay c m t b n ghi siêu d li u ch n.

IV.5. XML và an toàn b#o m5t

áp ng c các yêu c#u b o m t cho tính riêng t , bí m t và nh t quán có vai trò c!t y u cho th ng m i i n t$. Do c ch p nh n nh khuôn d ng cho tài li u và giao th c, các c ch b o m t c&ng c#n c thi t l p cho các gi i pháp XML. Các chu n b o m t c thi t l p cho các t' v ng XML và các lu t dùng x$ lý. Các chu n này s$ d ng các công ngh m t mã có s*n.

46

Các chu n b o m t c a XML bao g m XML Digital Signature cho tính nh t quán và ký các gi i pháp, XML Encryption cho vi c gi bí m t, XML Key Management cho vi c ng ký, ki m nh khóa công khai, Security Assertion Markup Language cho vi c chuy n t i tính nh danh, th m quy n, và vi c xác nh n các thu c tính, XML Access Control Markup Language nh ngh a các lu t ki m soát vào ra, Platform for Privacy Preferences nh ngh a các chính sách cho vi c m b o

riêng t và tham chi u. Các use-case chính bao g m Web Services (WS-Security)

và Digital Rights Management (eXtensible Rights Markup Language 2.0).

M t yêu c#u c#n thi t cho các chu n an ninh b o m t trên là c#n làm vi c m t cách hoàn h o !i v i các n i dung c t o ra b i XML. B o m t cho XML c#n c tích h p v i XML sao cho v+n gi các tính n ng c a XML trong khi b sung các kh n ng an ninh c#n thi t. Yêu c#u này r t c#n cho các giao th c d a trên XML nh XMLProt, SOAP th ng c dùng x$ lý và bi n i các thông i p m t cách tr c ti p. N i dung chi ti t c a các chu n giao th c trên không n"m trong khuôn kh c a tài này và s% c c p n trong các tài li u khác có liên quan.

IV.6. XML và chính ph i n t*

XML ã c nhi u n c trên th gi i ch n là khuôn d ng d li u trao i d li u, thông tin trong Chính ph i n t$. Chính ph i n t$ nh"m h ng t i m c tiêu ph c v các m!i quan h gi a Chính ph v i các ‘khách hàng’ c a Chính ph , bao g m các quan h gi a Chính ph v i Công dân (G2C), v i ng i lao ng (G2E), Chính ph v i doanh nghi p (G2B), và gi a các c quan Chính ph trong n c v i nhau ho,c v i Chính ph , c quan Chính ph c a các n c khác (G2G).

Trong các d ng giao d ch trên, i m c!t y u là các h th!ng có th hi u c nhau. Trong ng c nh này, XML là khuôn d ng d li u phù h p chuy n t i thông tin và ng ngh a gi a các h th!ng thông tin và các ng d ng. V i vai trò nh là ngôn

ng nh d ng các chu n trao i d li u trong nhi u ngành, l nh v c, XML tham

gia vào h#u h t các giao d ch trong h th!ng Chính ph i n t$. Chi ti t v XML trong các d ch công c a Chính ph i n t$ s% c c p trong nghiên c u khác.

Ph n V. CÁC GI I PHÁP CÔNG NGH CSDL

V.1. Các gi#i pháp CSDL c a IBM

Theo i u tra c a Gartner Group vào tháng 3 n m 2006, 19% (27% n u trong vùng châu Á-Thái bình D ng) các doanh nghi p c h-i tr l i mong mu!n tri n khai s n ph m CSDL c a IBM trong t ng lai. i u này nói lên s t ng tr ng th ph#n c a IBM trong l nh v c CSDL các n m s p t i.

Nh"m a công ngh XML vào th ng m i hóa, IBM ã a ra DB2 9 "Viper",

máy ch d li u có công ngh pureXML và công ngh nén d li u XML theo dòng.

DB2 9 là b c chuy n m i trong vi c l u tr và qu n lý d li u XML, có tác ng m nh m% vào th tr ng CSDL.

Tr c khi công ngh này ra i, qu n lý d li u XML th ng theo các cách ti p c n sau ây:

L u các tài li u XML trong các t p h th!ng

a d li u XML vào các LOB c a CSDL quan h Chia nh- d li u XML vào các b ng và các c t quan h

Tách bi t d li u trong các h th!ng CSDL XML chuyên d ng

Theo các cách trên, ph ng pháp qu n lý và chia s2 d li u XML không áp ng

Một phần của tài liệu nghiên cứu đề xuất định hướng công nghệ pháp triển và ứng dụng các hệ thống thông tin và cơ sở dữ liệu (Trang 40 - 59)

Tải bản đầy đủ (PDF)

(94 trang)