Các gi i pháp CSDL XML ca Oracle

Một phần của tài liệu nghiên cứu đề xuất định hướng công nghệ pháp triển và ứng dụng các hệ thống thông tin và cơ sở dữ liệu (Trang 52)

LI G II THI U

V.2.Các gi i pháp CSDL XML ca Oracle

P hn IV H NG HÁT TRIN CA CSDL HIN NAY

V.2.Các gi i pháp CSDL XML ca Oracle

Oracle là m t công ty truy n th!ng v CSDL quan h . S n ph m c a Oracle n i ti ng v tính b o m t và n nh.

V.2.1. H* tr XML c a Oracle

Khi XML n i lên nh m t nh d ng c a tài li u trong t ng lai, Oracle có m t s!

h( tr XML v i cách chi u các nguyên t! XML vào các b ng quan h . Vì các nguyên t! c a XML có th c coi nh các c t c a b ng, chuy n XML vào các b ng CSDL hay l y các nguyên t! XML t' các b ng có th c th c hi n qua các th t c PL/SQL hay b t c công c nào khác. Oracle a ra Jdeveloper nh là m t giao di n tích h p v i Java. B"ng các th t c l u trên Java (Java Stored

Procedures), các thành ph#n XML/XSLT c a Oracle có th dùng xây d ng các

ng d ng nhi u l p (tier) m nh. XSU (XML-SQL Utility) là m t công c Java

nhúng cho máy ch chuy n i các tài li u XML vào các c t CSDL.

Vi c Oracle a ra phiên b n 9i h( tr m nh m% XML thông qua vi c c ng c!

các mô hình d li u XML, h( tr m nh h n l c XML và DOM. Oracle 9i cho

phép ng ngh a XML giàu h n, l u tr d li u d ng XML, x$ lý tài li u XML g#n m c d li u m b o tính kh m và hi u n ng, gi m chi phí b o trì b"ng cách lo i b- l p x lý XML , h( tr các chu n ng d ng nh W3C, IETF, ANSI/ISO, J2EE, lo i b- các d ng t p hay d ng thông i p dùng riêng.

Phiên b n nh Oracle9i hay 10g c a Oracle h( tr l c XML, tính n ng kho,

XPath,…LOB (Large OBjects) v i Oracle intermedia XML search là m t gi i pháp

khác cho tài li u XML, l u d ng nguyên th y. l n c a tài li u lên n 4 gigabytes và vi c tìm ki m v i index là rât m nh. LOB có th ch a các t p tài li u XML l n, ph c t p .

V.2.2. Các tính n#ng XML chính c a Oracle

H( tr ki u XML nâng cao bao g m l c XML, ph ng th c l u tr

!i t ng-quan h m b o mô hình DOM, qu n lý b nh v i các t p XML l n t ng tính kh m và hi u n ng

Oracle 9i h( tr các thao tác XML chuy n i gi a XML và SQL. Có các modul d ng s*n t ng tác gi a XML và SQL

Tìm ki m và c p nh t theo Xpath, h( tr XSL trong máy ch CSDL B sung XML view t o c nhi u cách bi u di n riêng cho ng i s$ d ng v d li u XML

Có mô hình l p trình m nh, t i máy khách h( tr JDBC và Java Beans Có các ch c n ng XML Repository nh h( tr các giao th c FTP, WebDAV, HTTP chuy n d li u XML vào, ra. Có c ch ki m soát truy c p kho, tìm ki m, và qu n lý phiên b n.

Vi c ánh ch s! theo d ng phân c p h( tr t!t hi u n ng l t c u trúc hình cây c a các tài li u XML

V.3. Các gi#i pháp CSDL XML c a Microsoft

Mô hình d li u XML c Microsoft ch p nh n cùng v i chi n l c . NET c a hãng và tr thành m t trong các h ng tr ng tâm trong vi c phát tri n các ng d ng truy n th!ng c a Microsoft.

V.3.1. H* tr XML trong SQL Server

H( tr XML c th c hi n t' phía máy ch và máy khách trong chi n h c CSDL c a Microsoft.

T i máy ch , d li u XML c t o ra t' các b ng và k t qu truy v n và là lý t ng ng d ng cho trao i d li u và các ng d ng d ch v web. Ch c n ng OpenXML c s$ d ng b i các ng d ng t n các d li u XML vào các b ng

54

H( tr l p trình t i phía máy khách trong SQL Server c g i là SQLXML . Trung tâm c a công ngh này là XML view, ó là m t h tham chi u hai chi u t'

các l c XML vào các b ng quan h . XML view cho phép truy v n b"ng m t t p con c a XPath 1.0 trong ó h tham chi u c s$ d ng d ch các bi u th c

ng d"n (path expression) vào các câu truy v n SQL trên các b ng quan h n"m d i và k t qu truy v n l i c óng gói d ng XML. SQL XML cho phép t o

các m"u xây d ng các tài li u XML có nh ng ph#n ng b"ng các nhúng trong các tài li u này các câu l nh truy v n nh FOR XML và XPath 1.0.

H* tr XML trong SQL Server (adsbygoogle = window.adsbygoogle || []).push({});

Ki u d li u XML t nhiên l u d li u XML

Truy v n theo ki u d li u XML và ch nh s$a d li u XML. H( tr XQuery.

ánh ch s! XML d a trên B+-tree cho d li u chuy n t' d ng XML sang d ng quan h

H( tr các l c XML

Tích h p d li u quan h và XML

H( tr Truy nh p c a máy khách n ki u d li u XML

V.3.2. %ng d ng u cu i v i XML c a Mocrosoft

Microsoft ã tung ra s n ph m Office 2003, m t thành ph#n c!t lõi c a chi n l c XML c a công ty và s% c dung nh m t giao di n cho ng i dung cu!i v i XML. Trong Office 2003, l c c t o ra b i các m+u, và ng i dùng s$ d ng ng tác kéo-th t o ra các l c XML. Trong b ph#n m m ch l c này c a Microsoft, các công c trong Office nh Word, Excel, Access, InfoPath, Visio, FrontPage d a vào XML. T t c các công c ó h( tr nh p và xu t XML. Chi n l c c a Microsoft là mang XML n cho ng i dùng cu!i, m t i m m nh c a dòng s n ph m c a công ty.

Trong ba m c c a m t h th!ng là m c CSDL, m c nghi p v , và trình di n, m c CSDL ã d a trên XML. M c th hai c th c hi n b i SOAPi và các chu n d ch v Web. Office 2003 là m c front-end cho phép có th c và ghi mô hình d li u ch ch!t này.

M t ng d ng m i trong Office 2003 là InfoPath nh ngh a c l c XML thông qua vi c t o m t t p XSD hay b"ng cách n!i v i các d ch v web XML. InfoPath s% t o XSLT bi n i d li u XML. InfoPath có vai trò quan tr ng trong các h th!ng c p nh t d li u, nh s% c c p thêm t i Ph#n VII trang 65.

V.4. Các gi#i pháp CSDL c a s* d1ng ph n m m ngu!n m3 Ph#n m m ngu n m v CSDL c s$ d ng r ng rãi trong môi tr ng khoa h c và trong vi c tri n khai các ng d ng có quy mô nh-. Trong ph#n này s% trình bày các thông tin v các ph#n m m CSDL mã m th ng c s$ d ng nh mySQL, PostgresSQL,…

V.4.1. MySQL

MySQL là m t trong các h qu n tr c s d li u mã ngu n m ph bi n nh t th

gi i và c các nhà phát tri n r t a chu ng trong quá trình phát tri n ng d ng. MySQL mi n phí hoàn toàn, có nhi u phiên b n cho các h i u hành khác nhau nh Windows, Linux, Mac OS X, ...H tr PHP, Perl, và nhi u ngôn ng khác. Hi n nay MySQL có n version 5.0 và c t o b i hai nhánh sau ây:

MySQL Enterprise Server (máy ch MySQL kinh doanh) là m t ph#m m m n n v CSDL c s$ d ng hi n nay và c thi t k , c u hình và ch ng th c chuyên d ng cho các ng d ng kinh doanh.

MySQL Monitoring and Advisor Services (các d ch v ki m soát và t v n MySQL) cung c p cho các nhà phát tri n, các nhà qu n tr CSDL và qu n tr h th!ng m t s h( tr o v qu n tr CSDL cho vi c s$ d ng MySQL m t cách t!t nh t.

56

MySQL còn có phiên b n nhúng (Embedded Database) c dùng trong h n m t tr m nhà s n xu t thi t b g!c (Original Equipment Manufacturers-OEM), các nhà cung c p ph#n m m c l p (Independent Software Vendors - ISV) và các nhà bán l2 v i giá tr gia t ng (Value Added Resellers - VAR). Ph#n m m MySQL nhúng cho phép các nhà s n xu t t p trung ngu n l c vào các tính n ng b n ch t c a s n ph m h n là phân tán vào vi c tri n khai các CSDL riêng, qua ó có s v t tr i v tính n ng nh d a trên s n ph m CSDL ã c ki m th$ t!t nh MySQL, gi m chi phí cho khách hàng c#n mua m t CSDL riêng bi t. Phiên b n MySQL 5.1.5 c&ng h( tr ngôn ng nh d ng XML v i hai hàm ch c n ng cung c p các tính n ng c b n theo ng ngh a c a XPath.

V.4.2. PostGreSQL

PostgreSQL là m t DBMS liên h và !i t ng mã ngu n m d a trên lõi m POSTGRES phát tri n b i i h c Berkeley California. PostgreSQL theo chu n c a SQL99 và có nhi u tính n ng m nh nh :

Câu truy v n ph c t p (complex query) Khóa ngo i (foreign key)

Th t c s ki n (trigger) Các khung nhìn (view)

Tính toàn v5n c a các giao d ch (integrity transactions)

Vi c ki m tra ng th i a phiên b n (multiversion concurrency

control)

PostgresSQL có th t o ra các kh n ng m i nh Ki u d li u, Hàm, Toán t$, Hàm t p h p, …PostgreSQL h( tr XML b"ng m t hàm có tên là XML().

V.4.3. BekerleyDB

ây là m t lõi CSDL mã ngu n m r t g n nh5 và th ng c s$ d ng nhúng trong các ch ng trình th$ nghi m khác. BerkeleyDB s$ d ng các ánh ch s! theo B-tree, tuy nhiên không có ngôn ng truy v n.

V.5. Công c1 thu th5p d li u và qu#n lý bi.u m6u

Trong ph#n này gi i thi u m t công c c a Microsoft có kh n ng thu th p d li u (th ng d ng báo cáo) và qu n lý các bi u m+u (báo cáo) m t cách hi u qu . Microsoft InfoPath (tên #y Microsoft Office InfoPath) là m t ng d ng c dùng phát tri n các bi u m+u d a trên XML, l#n #u tiên c a ra th tr ng trong b Microsoft Office 2003 vào cu!i n m 2003. V i tên ban #u là Xdocs, tính n ng chính c a InfoPath cho phép t o và xem các tài li u XML v i s tr giúp c a các l c XML m nh. InFoPath có th k t n!i v i h th!ng trung tâm thông qua Web services b"ng MSXML và SOAP Toolkit. L p d i và l p gi a c a h th!ng có th c ,t c u hình trao i thông qua các chu n d ch v web nh SOAP, UDDI, và WSDL. Thêm vào ó, b i vì InfoPath l u tài li u d ng XML thô, có th truy n ngay d li u này n các h th!ng x$ lý XML khác. (adsbygoogle = window.adsbygoogle || []).push({});

Microsoft InfoPath có th c s$ d ng trong tình hu!ng sau: ng i s$ d ng i u thông tin vào trong b ng h-i (e-form, xem tài 55-06-KHKT-RD, ph#n portal trong qu n lý hành chính nhà n c) trong khi không k t n!i v i m ng Internet, s$

d ng ph#n m m InfoPath client. InfoPath có th t ng ki m tra tính úng n c a

m t s! tr ng. Sau ó ng i s$ d ngk t n!i v i v i máy ch và g$i t khai d ng XML. T khai này có th c chuy n n ng i có th m quy n phê duy t. Khi ng i s$ d ng k t n!i v i máy ch , d li u t ng ng v i m+u t khai s% c c p nh t m t cách t ng. T ng k t l i, các tính n ng c a Microsoft InfoPath là:

Thu th p thông tin hi u qu và tin c y

Qu n lý và ki m soát các bi u m+u khai báo thông tin m t cách t p trung T ch c h p lý hoá cho các quy trình nghi p v d a trên bi u m+u

S phát tri n m nh m+ c a các thi t b ph n c ng

Ph n VI. CÁC THÁCH TH C TRONG T NG LAI

S bùng n c a thông tin và d li u ã d+n n vi c b n ch t c a kh!i l ng d li u kh ng l xung quanh chúng ta c&ng thay i. i u này ,t ra cho vi c nghiên c u, phát tri n c&ng nh ng d ng công ngh CSDL các thách th c m i.

VI.1. Các thách th0c v qu#n lý d li u trong t 2ng lai

Ph#n c ng là m t thành ph#n không th thi u c tri n khai m i h th!ng thông tin. Sau vài th p k. phát tri n m nh m%, vi c phát minh ra các công ngh c&ng nh ph ng pháp i m i ã làm t ng m nh hi u su t c a ph#n c ng và ph#n m m. Ph#n c ng và ph#n m m ã thay i k t' khi CSDL quan h ra i, tuy nhiên ki n trúc ph ng pháp qu n lý thông tin không thay i k p v i b c ti n này.

T' các máy tính có b CPU v i xung ng h th p, n nay các CPU c a máy tính cá nhân ã v t quá 2+ GigaHertz. T!c tính toán c a CPU t ng m nh kho ng 100% m t n m, trong ó hi u n ng I/O, m t thông s! quan tr ng nh h ng n hi u n ng c a các CSDL c&ng t ng 5% m t n m. Các a c ng c trang b h th!ng RAID và các ph#n m m qu n lý a logíc, v i h th!ng ánh a ch 64bit, b nh RAM ã v t qua 100 GB, h th!ng m ng nh Gigabit Ethernet.

D li u hi n nay c&ng r t a d ng nh audio, video, v n b n,….L ng d li u t ng lên m nh m%, trong ó ph#n l n ( n 85%) d li u là không có c u trúc. Trong s bùng n c a d li u, chi m t ph#n nh- là các d li u do ng i t o ra tr c ti p, nh ng ó là các d li u có giá tr cao. Còn ph#n l n là các d li u c sinh ra t ng, t' các h th!ng thu, các b c m bi n. Các d li u này không thích h p v i các ki n trúc CSDL truy n th!ng. Vi c phát tri n m nh m% c a các công ngh l u tr c&ng làm t ng kh!i l ng d li u c s n sinh ra. M t không gian l u tr

S t$ng công lao ng trong ngành qu n lý thông tin, d li u

d li u t ng 100% sau m(i n m, th m chí giá l u tr còn r2 h n giá gi y in thông th ng. Do ó, kích c3 c a các CSDL c&ng t ng theo, c trình bày trong B ng 7.

Workload N m 2005 N m 2006

Giao d ch 100-500GB 10x

Kho hàng Vài tr$m GB n 10 TB 100x

C a hàng 1-50GB 100x

Di ng Vài tr$m MB 1,000x

CSDL lan t a (pervasive) Vài tr$m KB 10,000x

B ng 7: Kích c, các CSDL

Gi i pháp cho v n này là t ch c d li u theo d ng trùng l p(overlap), h n ch

hay tránh s$ d ng I/O. C th cluster theo nhi u chi u hay s$ d ng RAM a vào các vùng m gi m I/O.

Công lao ng làm vi c trong l nh v c qu n lý d li u t ng lên do nhu c#u công vi c t ng lên. Chi phí nhân công t ng d+n n chi phí phát tri n ng d ng, chi phí qu n lý và qu n tr CSDL.

Kh n ng tính toán t tr (Autonomic computing) là m t gi i pháp gi m chi phí. Kh n ng t tr có trong các s n ph m CSDL c a các hãng l n v i các tính n ng:

S$ d ng h( tr ,t c u hình (Up and running): Hàng ch c thông s! c

,t trong vài ch c giây nh : mô hình x$ lý, optimizer,… T !ng thi t k CSDL v t lý: h( tr l a ch n các index.

Th i gian th c: l a ch n t ng k ho ch truy v n, qu n lý l ng truy v n, ki m soát các câu l nh truy v n ang ch y, t ng i u ch nh t i. H ,t l ch th c hi n: thông qua các o n l nh nh- (scripts).

T s$a l(i, kh n ng d báo

Ki m soát h th!ng: thông báo s ki n qua e-mail, page, SQL. Qu n lý s c! (adsbygoogle = window.adsbygoogle || []).push({});

T ng nh ch s!

T ng phân chia l i trang lá (leaf pages) c a B-tree.

T ng xây d ng h s th!ng kê T i u ch nh sao l u

60 D li u n"m ngoài c s d li u Yêu c u c i thi n ph ng th c truy nh p d li u

Khái ni m các d li u quan tr ng hi n nay ã thay i.

Một phần của tài liệu nghiên cứu đề xuất định hướng công nghệ pháp triển và ứng dụng các hệ thống thông tin và cơ sở dữ liệu (Trang 52)