LI G II THI U
P hn III HIN TR NG NGHIÊN CU VÀ NG D NG CSDL
III.1. Ngành công nghi p qu#n lý d li u trên th/ gi(i
Qu n lý và x$ lý thông tin và d li u là là m t l nh v c thu hút s quan tâm, #u t nghiên c u và tri n khai m nh m% các n c tiên ti n v CNTT, nh t là khi ngành công nghi p n i dung ang n i lên nh m t l nh v c kinh doanh có l i nhu n cao. Các công ngh liên quan n công ngh d li u (data engineering), tìm ki m thông tin (information retrieval), x$ lý d li u (data procesing), CSDL l i (Grid Database)… c nghiên c u h#u nh m i tr ng i h c l n trên th gi i và c h( tr b i m t ngành công nghi p kh ng l a các công ngh này vào ng d ng. Các chính ph c a các n c tiên ti n coi vi c phát tri n và n m b t, ng d ng các công ngh này là công tác s!ng còn trong vi c phát tri n các h t#ng thông tin và ph c v l i ích qu!c gia và phát tri n kinh t .
Có m t s! hi p h i c a các nhà nghiên c u và phát tri n các công ngh , ng d ng qu n lý thông tin và d li u có nh h ng l n trên th gi i. N i ti ng nh t là SIGMOD thu c ACM và Data Engineering c a IEEE, c hai u thu c M) nh ng c công nh n r ng rãi trên toàn th gi i. T i m t s! n c tiên ti n khác c&ng t
ch c các phân h i a ph ng c a các hi p h i này. i u này ch ng t- t#m nh h ng c a các t ch c này trong ngành x$ lý d li u trên th gi i. Ngoài ra các n c c&ng có các t ch c qu!c gia riêng v công ngh x$ lý d li u. Ví d , t i Nh t b n có SIGMOD-Japan và T ch c x$ lý thông tin Japan (Japan Information Processing Society).
III.2. Tình hình nghiên c0u, 0ng d1ng CSDL trong n (c
T i Vi t nam, trong m t th i gian dài, t#m quan tr ng c a thông tin không c ánh giá úng m c trong qu n lý nhà n c và phát tri n kinh t , kinh doanh.
Vi c nghiên c u v CSDL trong m t th i gian dài t p trung vào lý thuy t CSDL nh nghiên c u v mô hình CSDL dùng các công c toán h c. Trong l nh v c ng d ng, m,c dù có không ít các d án xây d ng các CSDL nh ng l nh v c này ch a c nghiên c u ánh giá m t cách t ng th , s$ d ng còn m c ch a khai thác h t t t c các tính n ng c a các công ngh CSDL hi n i.
Gi a lý thuy t và ng d ng là m t kho ng cách l n. 1 t#m v mô chúng ta ch a có các chính sách h( tr phát tri n và qu n lý thông tin, t#m quan tr ng c a vi c qu n lý thông tin ch a c nêu lên hàng #u trong các #u t v CNTT. 1 m c k)
thu t, nghiên c u v các công ngh xây d ng các CSDL, m t b c quan tr ng
n m b t t!t các s n ph m CSDL, ã b b- qua.
Trong m t s! các d án c p qu!c gia ã và ang c th c hi n, các các h ng m c liên quan n thông tin ch a c #u t t ng x ng d+n n d án không mang l i hi u qu nh mong i.
III.2.1. %ng d ng CSDL trong các án tr c ây
M t trong các ch ng phát tri n CSDL l n nh t t' tr c n nay thu c v án 112. M t trong các n i dung c a án này là vi c phát tri n mô hình xây d ng trung tâm tích h p d li u t i các B , Ngành và a ph ng. Tuy nhiên, các trung tâm tích h p d li u ch a c phát tri n theo úng quy mô yêu c#u, ch a liên k t c v i nhau và ch a xây d ng c mô hình k t n!i c v i trung tâm tích h p d li u qu!c gia; Hi n nay, có m t s! ý ki n gi m s! trung tâm tích h p d li u và ch xây d ng m t s! trung tâm d li u qu!c gia dùng chung thông qua k t n!i trên m ng. n th i i m này, v n công ngh quan tr ng nh t là c ch tích h p d li u nh th nào không c gi i quy t rõ.
III.2.2. Tình hình tri n khai các CSDL qu c gia tr c ây
CSDL qu!c gia là là m t thành t! quan tr ng trong vi c xây d ng c ch chia s2
thông tin trong Chính ph i n t$. T i nhi u n c trên th gi i, các CSDL qu!c gia ã c xây d ng.
1 Vi t nam, trong ch ng trình CNTT IT2000, vi c xây d ng h th!ng các c s d li u qu!c gia ã c ,t n n móng v i yêu c#u các c s d li u qu!c gia c#n
28
có kh n ng l u tr và cung c p nhanh chóng, k p th i m i thông tin c#n thi t v tình hình kinh t , v n hoá, xã h i c a t n c,c&ng nh các thông tin liên quan khác, các c quan Nhà n c có c n c xây d ng các quy t nh c a mình. Các CSDL qu!c gia sau ã c xu t xây d ng:
1. CSDL qu!c gia v công dân và dân s!
2. CSDL qu!c gia v ngu n tài nguyên t
3. CSDL qu!c gia v lu t và các v n b n pháp quy 4. CSDL qu!c gia v thông tin kinh t xã h i 5. CSDL qu!c gia v thông tin tài chính 6. CSDL qu!c gia v công ch c nhà n c
Trong ch ng trình h p tác v i Canada VCIT, m t s! kh o sát nghiên c u v kh n ng tri n khai các CSDL qu!c gia ã c ti n hành và m t s! k t qu thu c là nh ng ánh gía còn s b v nhu c#u s$ d ng, các khó kh n trong vi c tri n khai, và các y u t! v an ninh, con ng i,…
Các d án CSDL này còn d'ng giai o n nghiên c u kh thí, thâm chí ti n kh thi, còn ch a ti n hành các b c thi t k và tri n khai. Trong nh ng n m g#n ây, các báo cáo cho th y m t s! ti n tri n trong vi c tri n khai CSDL dân c (công dân) do B công an là n v ch trì.
Các khó kh n chính trong vi c tri n khai các CSDL qu!c gia c t ng k t nh sau:
Kinh phí cho các d án này còn ch a c cung c p #y .
Thi u nh ng nhà qu n lý và ho ch nh chi n l c cho các d án àny. Thi u kinh nghi m qu n lý các d án lo i này t#m qu!c gia. Khó kh n trong k t h p các n v có liên quan
Công ngh xây d ng các CSDL l n còn ch a c hi u th u áo nên ch a ánh giá h t c các y u t! c#n thi t th c hi n các d án l n t#m c3 này.
Sau nhi u n m, vi c xây d ng các CSDL qu!c gia v+n d'ng m c nh h ng ho,c n u có tri n khai thì n l2 các b ngành, ch a có s ph!i k t h p gi a các c quan n v có liên quan. Hi n nay, thay vì xây d ng m t h th!ng CSDL qu!c gia, m t s! B ngành ã xây d ng các CSDL chuyên ngành cho mình nh sau v i tình hình tri n khai nh sau:
H th ng c s d li u qu c gia v tài nguyên n c hi n ã c l p ,t và tri n khai b c #u t i B Tài nguyên và Môi tr ng. H th!ng là công c cho phép trao i, truy c p d li u, thông tin v tài nguyên n c trong ph m vi c n c, b o m các nhu c#u khai thác, s$ d ng d li u, thông tin v tài nguyên n c.
H th ng thông tin v ng ký h t ch, h kh u và h c s d li u dân c
do U. ban dân s!, Gia ình và tr2 em ch trì ph!i h p v i T ng c c Th!ng kê, B t pháp, B công an và các ngành h u quan khác xây d ng trên c s c p nh t và ánh giá thông tin c b n thu th p qua t ng i u tra dân s!. H c s d li u này thu th p, x$ lý và cung c p thông tin, d li u v dân c , h(
tr h th!ng qu n lý và ng ký d li u liên quan n dân c c a các B , Ngành có liên quan.
H th ng c s d li u qu c gia th ng v kê kinh t - xã h i bao g m các c
s d li u vi mô (g m các thông tin ban #u t' các phi u i u tra, t khai, phi u ng ký,..), các c s d li u v mô (g m các b ng bi u ã qua x$ lý t ng h p) và các c s d li u v h th!ng các b ng phân lo i, các b ng danh m c, v h th!ng ch tiêu th!ng kê và ph ng pháp tính. V m,t qu n lý, h th!ng c s d li u qu!c gia bao g m các c s d li u b! trí t i T ng C c th!ng kê và b! trí t i các B , ngành theo nguyên t c:
1. D li u do ngành nào thu th p, ngành ó xây d ng c s d li u.
2. C s d li u th!ng kê c a ngành th!ng kê và các B , ngành thu c h th!ng c s d li u th!ng kê qu!c gia, c truy c p, khai thác theo nh ng quy nh c th phù h p v i t'ng !i t ng s$ d ng.
C s d li u Qu c gia v lu t pháp ang c lên k ho ch xây d ng, a vào khai thác trên m ng Internet ph c v vi c truy c p, tìm ki m các v n
30
b n quy ph m pháp lu t liên quan n ho t ng c a cán b , công ch c t i công s , áp ng nhu c#u c#n gi i quy t công vi c hi u qu cho ng i dân. Hi n t i, CSDL v v n b n pháp quy do B T pháp xây d ng ã c a lên khai thác trên m ng.
H th!ng c s d li u cán b , công ch c t'ng b c chuy n sang qu n lý cán b , công ch c b"ng h th!ng tin h c các c quan hành chính nhà n c
trung ng và a ph ng ang trong quá trình ti n hành t i B N i v . Trong ph#n VII.4. xu t v xây d ng các CSDL qu!c gia s% c p n m t s!
xu t trong l nh v c này.
III.3. Các v&n c a vi c phát tri.n và 0ng d1ng CSDL t'i Vi t Nam
T' nh ng phân tích và kh o sát trên, nh ng có th nh n th y nh ng i m n i b t c a hi n tr ng ng d ng và phát tri n các CSDL t i Vi t nam là:
B ng 2: Các t n t i trong phát tri n và ng d ng CSDL t i Vi t nam
Ch a có chính sách thúc y và qu n lý thông tin
Ch a có các ch d+n ký thu t cho vi c công tác ng d ng công ngh CSDL cho phát tri n KT-XH, nh t là trong vi c tích h p thông tin và trao i thông tinh trong m(i tr ng web.
Ch a có m t t ch c c a các nhà phát tri n cônng ngh và ng d ng x$ lý d li u h( tr và i u ph!i các c! g ng các ho t ng trong l nh v c này.
Ph n IV. H NG PHÁT TRI N C A CSDL HI N NAY
Trên th gi i, s phát tri n trong nh ng n m g#n ây c a CSDL g n li n v i s ra i và s ch p nh n c a công ngh XML trong ngành công nghi p x$ lý d li u. XML cung c p kh n ng qu n lý d li u cho các tài li u và d li u bán c u trúc và
cung c p m t ng ngh a trung l p (neutral syntax) cho v c t ng tác gi a các h
th!ng thông tin thong qua vi c c i ti n x$ lý các #u ra c a CSDL.
Th c t , XML ang thay i c n n công nghi p CSDL. XML c dùng nh m t
khuôn d ng a n ng th hi n m i lo i d li u. Các tài li u tr c kia th ng c
th hi n d i d ng v n b n không c u trúc (plain text), nay chuy n sang c u trúc
XML có th c trao i v i nhau. Ngoài các CSDL quan h ã có trên th tr ng, các CSDL d ng XML ang c xây d ng qu n lý thông tin/d li u d ng XML. V i vi c a vào các l c ph c t p, c ng v i s tri n khai các ngôn ng truy v n riêng cho XML vào trong các CSDL quan h th ng m i d+n n vi c truy v n m m d2o h n s v i CSDL quan h thông th ng.
IV.1. Ngôn ng XML
IV.1.1. Lý do ra i c a XML
XML - ngôn ng ánh d u m r ng (Extensible Markup Language) là ngôn ng
ánh d u v i m c ích chung do W3C ngh . Vi c phát tri n XML c b t #u n m 1996 và ã c W3C khuy n cáo s$ d ng t' tháng 2 n m 1998. XML t n d ng nh ng i m m nh c a các ngôn ng ánh d u tr c ó k t h p v i kinh nghi m có c t' HTML có c kh n ng mô t nhi u lo i d li u khác nhau. kh c ph c c các v n c nêu trong B ng 2: Các t n t i trong phát tri n và ng d ng CSDL t i Vi t nam, phát tri n và ng d ng các CSDL d a trên công ngh XML là m t gi i pháp h p lý.
32
M c ích chính c a XML là n gi n hóa vi c chia s2 d li u gi a các h th!ng khác nhau, ,c bi t là các h th!ng c k t n!i v i Internet.
XML #u tiên c phát tri n l u các tài li u trên web d ng mà d li u và
hình th c trình bày c tách bi t. Tr c ó vi c qu n lý n i dung thông tin c a các trang web khó kh n do có s l+n l n gi a hai khái ni m này, vì th thông tin khó c tái s$ d ng cho các nhóm ng i s$ d ng khác nhau, hay trên các thi t b khác nhau. Ph ng án l u d li u trong CSDL và thêm HTML b c l y d li u ó ch phù h p v i các d li u lo i có c u trúc ch,t ch% và không phù h p v i các
thong tin d ng n i dung, phi c u trúc. 4ng d ng làm cho XML tr nên thành công
là qu n lý n i dung do có cú pháp m m d2o trao i thông tin gi a các ng d ng d ng này. M,c dù, có m t s! ph ng th c khác nh ng XML c ch n vì s n gi n, c ng h r ng rãi và giá phát tri n th p.
IV.1.2. &c i m c a XML
XML mô t thông tin theo m t c u trúc hình cây. M t tài li u XML g m các th c
th (element), m(i th c th th ng là m t ph#n nào ó c a các ký t thu c tài li u, có các th2 ánh d u (markup tag) ký hi u s phân chia thông tin thành m t c u trúc. Ký t trong XML theo nh ngh a c a Unicode (B ký t toàn c u).
B ng 3: Cú pháp c a XML
Tr c XML, có r t ít ngôn ng mô t d li u v i các ,c i m a n ng, thân thi n v i giao th c Internet, d h c và d t o. a s! các nh d ng trao i d li u tr c ây u chuy n d ng, có tính c quy n, và có nh d ng nh phân khó dùng chung gi a các ng d ng ph#n m m khác nhau hay gi a các h n n (platform) khác nhau.
<?xml version="1.0" encoding="UTF-8"?>
<recipe name="bread" prep_time="5 mins" cook_time="3 hours"> <title>Basic bread</title>
<ingredient amount="3" unit="cups">Flour</ingredient> <ingredient amount="0.25" unit="ounce">Yeast</ingredient>
<ingredient amount="1.5" unit="cups" state="warm">Water</ingredient> <ingredient amount="1" unit="teaspoon">Salt</ingredient>
<instructions>
<step>Mix all ingredients together, and knead thoroughly.</step> <step>Cover with a cloth, and leave for one hour in warm room.</step> <step>Knead again, place in a tin, and then bake in the oven.</step> </instructions>
IV.1.3. T o và so n th o tài li u XML
Các ph#n m m h( tr vi c so n th o và b o trì tài li u XML m t cách thu n tiên ã nhanh chóng xu t hi n. M t thu n l i c a XML là cho phép xem d li u mà không c#n ph i có ch ng trình ã t o ra d li u ó.
XML cho phép b n t o ra m t khuôn d ng v n b n m i b"ng cách k t h p hay s$