LI G II THI U
P hn IV H NG HÁT TRIN CA CSDL HIN NAY
V.2. Các gi i pháp CSDL XML ca Oracle
Oracle là m t công ty truy n th!ng v CSDL quan h . S n ph m c a Oracle n i ti ng v tính b o m t và n nh.
V.2.1. H* tr XML c a Oracle
Khi XML n i lên nh m t nh d ng c a tài li u trong t ng lai, Oracle có m t s!
h( tr XML v i cách chi u các nguyên t! XML vào các b ng quan h . Vì các nguyên t! c a XML có th c coi nh các c t c a b ng, chuy n XML vào các b ng CSDL hay l y các nguyên t! XML t' các b ng có th c th c hi n qua các th t c PL/SQL hay b t c công c nào khác. Oracle a ra Jdeveloper nh là m t giao di n tích h p v i Java. B"ng các th t c l u trên Java (Java Stored
Procedures), các thành ph#n XML/XSLT c a Oracle có th dùng xây d ng các
ng d ng nhi u l p (tier) m nh. XSU (XML-SQL Utility) là m t công c Java
nhúng cho máy ch chuy n i các tài li u XML vào các c t CSDL.
Vi c Oracle a ra phiên b n 9i h( tr m nh m% XML thông qua vi c c ng c!
các mô hình d li u XML, h( tr m nh h n l c XML và DOM. Oracle 9i cho
phép ng ngh a XML giàu h n, l u tr d li u d ng XML, x$ lý tài li u XML g#n m c d li u m b o tính kh m và hi u n ng, gi m chi phí b o trì b"ng cách lo i b- l p x lý XML , h( tr các chu n ng d ng nh W3C, IETF, ANSI/ISO, J2EE, lo i b- các d ng t p hay d ng thông i p dùng riêng.
Phiên b n nh Oracle9i hay 10g c a Oracle h( tr l c XML, tính n ng kho,
XPath,…LOB (Large OBjects) v i Oracle intermedia XML search là m t gi i pháp
khác cho tài li u XML, l u d ng nguyên th y. l n c a tài li u lên n 4 gigabytes và vi c tìm ki m v i index là rât m nh. LOB có th ch a các t p tài li u XML l n, ph c t p .
V.2.2. Các tính n#ng XML chính c a Oracle
H( tr ki u XML nâng cao bao g m l c XML, ph ng th c l u tr
!i t ng-quan h m b o mô hình DOM, qu n lý b nh v i các t p XML l n t ng tính kh m và hi u n ng
Oracle 9i h( tr các thao tác XML chuy n i gi a XML và SQL. Có các modul d ng s*n t ng tác gi a XML và SQL
Tìm ki m và c p nh t theo Xpath, h( tr XSL trong máy ch CSDL B sung XML view t o c nhi u cách bi u di n riêng cho ng i s$ d ng v d li u XML
Có mô hình l p trình m nh, t i máy khách h( tr JDBC và Java Beans Có các ch c n ng XML Repository nh h( tr các giao th c FTP, WebDAV, HTTP chuy n d li u XML vào, ra. Có c ch ki m soát truy c p kho, tìm ki m, và qu n lý phiên b n.
Vi c ánh ch s! theo d ng phân c p h( tr t!t hi u n ng l t c u trúc hình cây c a các tài li u XML
V.3. Các gi#i pháp CSDL XML c a Microsoft
Mô hình d li u XML c Microsoft ch p nh n cùng v i chi n l c . NET c a hãng và tr thành m t trong các h ng tr ng tâm trong vi c phát tri n các ng d ng truy n th!ng c a Microsoft.
V.3.1. H* tr XML trong SQL Server
H( tr XML c th c hi n t' phía máy ch và máy khách trong chi n h c CSDL c a Microsoft.
T i máy ch , d li u XML c t o ra t' các b ng và k t qu truy v n và là lý t ng ng d ng cho trao i d li u và các ng d ng d ch v web. Ch c n ng OpenXML c s$ d ng b i các ng d ng t n các d li u XML vào các b ng
54
H( tr l p trình t i phía máy khách trong SQL Server c g i là SQLXML . Trung tâm c a công ngh này là XML view, ó là m t h tham chi u hai chi u t'
các l c XML vào các b ng quan h . XML view cho phép truy v n b"ng m t t p con c a XPath 1.0 trong ó h tham chi u c s$ d ng d ch các bi u th c
ng d"n (path expression) vào các câu truy v n SQL trên các b ng quan h n"m d i và k t qu truy v n l i c óng gói d ng XML. SQL XML cho phép t o
các m"u xây d ng các tài li u XML có nh ng ph#n ng b"ng các nhúng trong các tài li u này các câu l nh truy v n nh FOR XML và XPath 1.0.
H* tr XML trong SQL Server
Ki u d li u XML t nhiên l u d li u XML
Truy v n theo ki u d li u XML và ch nh s$a d li u XML. H( tr XQuery.
ánh ch s! XML d a trên B+-tree cho d li u chuy n t' d ng XML sang d ng quan h
H( tr các l c XML
Tích h p d li u quan h và XML
H( tr Truy nh p c a máy khách n ki u d li u XML
V.3.2. %ng d ng u cu i v i XML c a Mocrosoft
Microsoft ã tung ra s n ph m Office 2003, m t thành ph#n c!t lõi c a chi n l c XML c a công ty và s% c dung nh m t giao di n cho ng i dung cu!i v i XML. Trong Office 2003, l c c t o ra b i các m+u, và ng i dùng s$ d ng ng tác kéo-th t o ra các l c XML. Trong b ph#n m m ch l c này c a Microsoft, các công c trong Office nh Word, Excel, Access, InfoPath, Visio, FrontPage d a vào XML. T t c các công c ó h( tr nh p và xu t XML. Chi n l c c a Microsoft là mang XML n cho ng i dùng cu!i, m t i m m nh c a dòng s n ph m c a công ty.
Trong ba m c c a m t h th!ng là m c CSDL, m c nghi p v , và trình di n, m c CSDL ã d a trên XML. M c th hai c th c hi n b i SOAPi và các chu n d ch v Web. Office 2003 là m c front-end cho phép có th c và ghi mô hình d li u ch ch!t này.
M t ng d ng m i trong Office 2003 là InfoPath nh ngh a c l c XML thông qua vi c t o m t t p XSD hay b"ng cách n!i v i các d ch v web XML. InfoPath s% t o XSLT bi n i d li u XML. InfoPath có vai trò quan tr ng trong các h th!ng c p nh t d li u, nh s% c c p thêm t i Ph#n VII trang 65.
V.4. Các gi#i pháp CSDL c a s* d1ng ph n m m ngu!n m3 Ph#n m m ngu n m v CSDL c s$ d ng r ng rãi trong môi tr ng khoa h c và trong vi c tri n khai các ng d ng có quy mô nh-. Trong ph#n này s% trình bày các thông tin v các ph#n m m CSDL mã m th ng c s$ d ng nh mySQL, PostgresSQL,…
V.4.1. MySQL
MySQL là m t trong các h qu n tr c s d li u mã ngu n m ph bi n nh t th
gi i và c các nhà phát tri n r t a chu ng trong quá trình phát tri n ng d ng. MySQL mi n phí hoàn toàn, có nhi u phiên b n cho các h i u hành khác nhau nh Windows, Linux, Mac OS X, ...H tr PHP, Perl, và nhi u ngôn ng khác. Hi n nay MySQL có n version 5.0 và c t o b i hai nhánh sau ây:
MySQL Enterprise Server (máy ch MySQL kinh doanh) là m t ph#m m m n n v CSDL c s$ d ng hi n nay và c thi t k , c u hình và ch ng th c chuyên d ng cho các ng d ng kinh doanh.
MySQL Monitoring and Advisor Services (các d ch v ki m soát và t v n MySQL) cung c p cho các nhà phát tri n, các nhà qu n tr CSDL và qu n tr h th!ng m t s h( tr o v qu n tr CSDL cho vi c s$ d ng MySQL m t cách t!t nh t.
56
MySQL còn có phiên b n nhúng (Embedded Database) c dùng trong h n m t tr m nhà s n xu t thi t b g!c (Original Equipment Manufacturers-OEM), các nhà cung c p ph#n m m c l p (Independent Software Vendors - ISV) và các nhà bán l2 v i giá tr gia t ng (Value Added Resellers - VAR). Ph#n m m MySQL nhúng cho phép các nhà s n xu t t p trung ngu n l c vào các tính n ng b n ch t c a s n ph m h n là phân tán vào vi c tri n khai các CSDL riêng, qua ó có s v t tr i v tính n ng nh d a trên s n ph m CSDL ã c ki m th$ t!t nh MySQL, gi m chi phí cho khách hàng c#n mua m t CSDL riêng bi t. Phiên b n MySQL 5.1.5 c&ng h( tr ngôn ng nh d ng XML v i hai hàm ch c n ng cung c p các tính n ng c b n theo ng ngh a c a XPath.
V.4.2. PostGreSQL
PostgreSQL là m t DBMS liên h và !i t ng mã ngu n m d a trên lõi m POSTGRES phát tri n b i i h c Berkeley California. PostgreSQL theo chu n c a SQL99 và có nhi u tính n ng m nh nh :
Câu truy v n ph c t p (complex query) Khóa ngo i (foreign key)
Th t c s ki n (trigger) Các khung nhìn (view)
Tính toàn v5n c a các giao d ch (integrity transactions)
Vi c ki m tra ng th i a phiên b n (multiversion concurrency
control)
PostgresSQL có th t o ra các kh n ng m i nh Ki u d li u, Hàm, Toán t$, Hàm t p h p, …PostgreSQL h( tr XML b"ng m t hàm có tên là XML().
V.4.3. BekerleyDB
ây là m t lõi CSDL mã ngu n m r t g n nh5 và th ng c s$ d ng nhúng trong các ch ng trình th$ nghi m khác. BerkeleyDB s$ d ng các ánh ch s! theo B-tree, tuy nhiên không có ngôn ng truy v n.
V.5. Công c1 thu th5p d li u và qu#n lý bi.u m6u
Trong ph#n này gi i thi u m t công c c a Microsoft có kh n ng thu th p d li u (th ng d ng báo cáo) và qu n lý các bi u m+u (báo cáo) m t cách hi u qu . Microsoft InfoPath (tên #y Microsoft Office InfoPath) là m t ng d ng c dùng phát tri n các bi u m+u d a trên XML, l#n #u tiên c a ra th tr ng trong b Microsoft Office 2003 vào cu!i n m 2003. V i tên ban #u là Xdocs, tính n ng chính c a InfoPath cho phép t o và xem các tài li u XML v i s tr giúp c a các l c XML m nh. InFoPath có th k t n!i v i h th!ng trung tâm thông qua Web services b"ng MSXML và SOAP Toolkit. L p d i và l p gi a c a h th!ng có th c ,t c u hình trao i thông qua các chu n d ch v web nh SOAP, UDDI, và WSDL. Thêm vào ó, b i vì InfoPath l u tài li u d ng XML thô, có th truy n ngay d li u này n các h th!ng x$ lý XML khác.
Microsoft InfoPath có th c s$ d ng trong tình hu!ng sau: ng i s$ d ng i u thông tin vào trong b ng h-i (e-form, xem tài 55-06-KHKT-RD, ph#n portal trong qu n lý hành chính nhà n c) trong khi không k t n!i v i m ng Internet, s$
d ng ph#n m m InfoPath client. InfoPath có th t ng ki m tra tính úng n c a
m t s! tr ng. Sau ó ng i s$ d ngk t n!i v i v i máy ch và g$i t khai d ng XML. T khai này có th c chuy n n ng i có th m quy n phê duy t. Khi ng i s$ d ng k t n!i v i máy ch , d li u t ng ng v i m+u t khai s% c c p nh t m t cách t ng. T ng k t l i, các tính n ng c a Microsoft InfoPath là:
Thu th p thông tin hi u qu và tin c y
Qu n lý và ki m soát các bi u m+u khai báo thông tin m t cách t p trung T ch c h p lý hoá cho các quy trình nghi p v d a trên bi u m+u
S phát tri n m nh m+ c a các thi t b ph n c ng
Ph n VI. CÁC THÁCH TH C TRONG T NG LAI
S bùng n c a thông tin và d li u ã d+n n vi c b n ch t c a kh!i l ng d li u kh ng l xung quanh chúng ta c&ng thay i. i u này ,t ra cho vi c nghiên c u, phát tri n c&ng nh ng d ng công ngh CSDL các thách th c m i.
VI.1. Các thách th0c v qu#n lý d li u trong t 2ng lai
Ph#n c ng là m t thành ph#n không th thi u c tri n khai m i h th!ng thông tin. Sau vài th p k. phát tri n m nh m%, vi c phát minh ra các công ngh c&ng nh ph ng pháp i m i ã làm t ng m nh hi u su t c a ph#n c ng và ph#n m m. Ph#n c ng và ph#n m m ã thay i k t' khi CSDL quan h ra i, tuy nhiên ki n trúc ph ng pháp qu n lý thông tin không thay i k p v i b c ti n này.
T' các máy tính có b CPU v i xung ng h th p, n nay các CPU c a máy tính cá nhân ã v t quá 2+ GigaHertz. T!c tính toán c a CPU t ng m nh kho ng 100% m t n m, trong ó hi u n ng I/O, m t thông s! quan tr ng nh h ng n hi u n ng c a các CSDL c&ng t ng 5% m t n m. Các a c ng c trang b h th!ng RAID và các ph#n m m qu n lý a logíc, v i h th!ng ánh a ch 64bit, b nh RAM ã v t qua 100 GB, h th!ng m ng nh Gigabit Ethernet.
D li u hi n nay c&ng r t a d ng nh audio, video, v n b n,….L ng d li u t ng lên m nh m%, trong ó ph#n l n ( n 85%) d li u là không có c u trúc. Trong s bùng n c a d li u, chi m t ph#n nh- là các d li u do ng i t o ra tr c ti p, nh ng ó là các d li u có giá tr cao. Còn ph#n l n là các d li u c sinh ra t ng, t' các h th!ng thu, các b c m bi n. Các d li u này không thích h p v i các ki n trúc CSDL truy n th!ng. Vi c phát tri n m nh m% c a các công ngh l u tr c&ng làm t ng kh!i l ng d li u c s n sinh ra. M t không gian l u tr
S t$ng công lao ng trong ngành qu n lý thông tin, d li u
d li u t ng 100% sau m(i n m, th m chí giá l u tr còn r2 h n giá gi y in thông th ng. Do ó, kích c3 c a các CSDL c&ng t ng theo, c trình bày trong B ng 7.
Workload N m 2005 N m 2006
Giao d ch 100-500GB 10x
Kho hàng Vài tr$m GB n 10 TB 100x
C a hàng 1-50GB 100x
Di ng Vài tr$m MB 1,000x
CSDL lan t a (pervasive) Vài tr$m KB 10,000x
B ng 7: Kích c, các CSDL
Gi i pháp cho v n này là t ch c d li u theo d ng trùng l p(overlap), h n ch
hay tránh s$ d ng I/O. C th cluster theo nhi u chi u hay s$ d ng RAM a vào các vùng m gi m I/O.
Công lao ng làm vi c trong l nh v c qu n lý d li u t ng lên do nhu c#u công vi c t ng lên. Chi phí nhân công t ng d+n n chi phí phát tri n ng d ng, chi phí qu n lý và qu n tr CSDL.
Kh n ng tính toán t tr (Autonomic computing) là m t gi i pháp gi m chi phí. Kh n ng t tr có trong các s n ph m CSDL c a các hãng l n v i các tính n ng:
S$ d ng h( tr ,t c u hình (Up and running): Hàng ch c thông s! c
,t trong vài ch c giây nh : mô hình x$ lý, optimizer,… T !ng thi t k CSDL v t lý: h( tr l a ch n các index.
Th i gian th c: l a ch n t ng k ho ch truy v n, qu n lý l ng truy v n, ki m soát các câu l nh truy v n ang ch y, t ng i u ch nh t i. H ,t l ch th c hi n: thông qua các o n l nh nh- (scripts).
T s$a l(i, kh n ng d báo
Ki m soát h th!ng: thông báo s ki n qua e-mail, page, SQL. Qu n lý s c!
T ng nh ch s!
T ng phân chia l i trang lá (leaf pages) c a B-tree.
T ng xây d ng h s th!ng kê T i u ch nh sao l u
60 D li u n"m ngoài c s d li u Yêu c u c i thi n ph ng th c truy nh p d li u
Khái ni m các d li u quan tr ng hi n nay ã thay i.