Cơ sở dữ liệu nguyên gốc XML nguyên gốc là cách dùng của các công nghệ liên quan đến XML mà không pha tạp với các công nghệ phi XML.. Khi so sánh các NXD với RDBMS có hỗ trợ XML, ngườ
Trang 1Company Logo
PURE XML TRONG DB2
GV: TS Nguyễn Hà Nam HV: Luyện Thị Lan Hương
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Trang 2Company Logo
NỘI DUNG
Lý do chọn cơ sở dữ liệu XML
1
Cơ sở dữ liệu nguyên gốc
2
Pure XML
3
Pure XML trong DB2
4
Kết luận
5
Trang 3Company Logo
1 Lý do chọn cơ sở dữ liệu XML
XML có khả năng mô tả cả dữ liệu có cấu trúc và
dữ liệu không có cấu trúc.
XML phù hợp với việc mô tả dữ liệu bán cấu trúc,mà việc duy trì mô hình dữ liệu này khá dễ dàng
XML phù hợp với các tài liệu có lượng dữ liệu ở quy
mô vừa và nhỏ, dữ liệu tĩnh, không cần độc lập, không cần tính toán nhiều
Trang 4Company Logo
2 Cơ sở dữ liệu nguyên gốc
XML nguyên gốc là cách dùng của các công nghệ liên quan đến XML mà không pha tạp với các công nghệ phi XML
Khi so sánh các NXD với RDBMS có hỗ trợ XML, người ta cho rằng một NXD điển hình cũng có thể được phân loại như là một kho chứa tài liệu
NXD dường như nhắm tới tài nguyên theo định hướng
Trang 5Company Logo
2 Cơ sở dữ liệu nguyên gốc
Như vậy, một NXD điển hình lưu trữ các tài liệu XML một cách hiệu quả Nó cung cấp công nghệ XQuery và một lớp mỏng các chức năng kho dữ liệu
Coi dữ liệu như là các tài nguyên đơn lẻ cũng có các yếu điểm của nó
Trang 6Company Logo
3 Pure XML
Tên pureXML được chính thống hóa theo hai cách:
Dữ liệu XML được lưu trữ trong định dạng cây nguyên bản,
tách biệt khỏi dữ liệu quan hệ.
Được phép truy cập tất cả dữ liệu – cả quan hệ và XML
thông qua một giao diện XML đơn nhất.
XQuery 1.0 không bị giới hạn bởi việc truy vấn các tài
liệu XML
DB2 là nền tảng cơ sở dữ liệu nguyên bản
Trang 7Company Logo
Hiện nay có 4 cách truy cập dữ liệu được sử dụng
trong DB2 9 :
Sử dụng SQL để truy nhập dữ liệu quan hệ.
Sử dụng SQL và các mở rộng XML(SQL/ XML) để truy
nhập dữ liệu XML.
Sử dụng Xquery để truy nhập dữ liệu XML.
Sử dụng Xquery để truy nhập dữ liệu quan hệ
Trong DB2, pure XML hỗ trợ các cơ sở dữ liệu được sinh ra dưới cả hai định dạng Unicode và non-Unicode
Trang 8Company Logo
Ưu điểm của công nghệ pure XML:
Có thể nâng cao khả năng sử dụng dữ liệu quan hệ, bằng cách lưu trữ các tài liệu XML trong các cột của các bảng, sử dụng kiểu dữ liệu mới XML
Có thể giảm sự phức tạp của mã lệnh.
Những thay đổi tới lược đồ dễ dàng hơn khi sử dụng XML và công nghệ pureXML
Có thể cải thiện hiệu năng ứng dụng XML.
Trang 9Company Logo
Xpath là một ngôn ngữ có thể được sử dụng để truy
vấn các tài liệu XML
Tương tự với cái lệnh duyệt cây thư mục trong
DOS, với Xpath, ta sử dụng dấu gạch chép (/) để
chuyển từ phần tử này đến phần tử khác trong tài
liệu XML
XQuery là ngôn ngữ truy vấn được tạo ra dành cho
XML XQuery hỗ trợ các biểu thức đường dẫn để duyệt cấu trúc phân cấp của XML
Trang 10Company Logo
XQuery hỗ trợ cả các loại dữ liệu định kiểu và dữ liệu
không định kiểu XQuery không hỗ trợ các giá trị null bởi vì các tài liệu XML mặc nhiên sẽ bỏ qua các dữ liệu không xác định hoặc bị thiếu
Các biểu thức Xquery và Xpath có phân biệt kí tự hoa
và kí tự thường và Xquery sẽ trả về chuỗi dữ liệu
XML tuần tự
XQuery hỗ trợ biểu thức FLWOR
Trang 11Company Logo
Trong DB2 có hai cách để truy vấn dữ liệu XML:
Sử dụng SQL với các mở rộng XML(SQL/XML):
cho phép làm việc với các dòng và các cột
Sử dụng Xquery: là phương pháp truy vấn chính và trong một số trường hợp, ta có thể sử dụng SQL nhúng bên trong hàm Xquery(sử dụng hàm db2-fn:sqlquery) Khi sử dụng XQuery, ta sẽ gọi một số hàm và cũng sẽ
sử dụng biểu thức FLWOR.
Trang 12Company Logo
Đánh chỉ mục
Trong tài liệu XML, các chỉ mục có thể được tạo cho các phần tử, các thuộc tính, hoặc cho các giá trị (text node – các nút văn bản)
Không nên tạo chỉ mục cho tất cả các nút văn bản, vì
sẽ mất rất nhiều chi phí cho việc duy trì chỉ mục cho
các thao tác update, delete, insert và chỉ mục có thể
quá lớn
Trang 13Company Logo
Lược đồ XML
DB2 cho phép chèn một tài liệu XML vào cơ sở dữ liệu nếu nó tuân theo định dạng đúng(wel - formed)
DB2 không đòi hỏi phải kiểm tra tính hợp lệ của tài liệu XML
Trang 14Company Logo
Khi đã đăng ký lược đồ XML trên DB2, có thể kiểm tra tính hợp lệ cho tài liệu XML theo hai cách sau:
Sử dụng hàm XML VALIDATE trong câu lệnh INSERT.
Sử dụng một bẫy sự kiện BEFORE.
Trang 15Company Logo
3 Kêt luận
Lưu trữ tài liệu XML trong cơ sở dữ liệu DB2, có thể
tận dụng lợi thế bảo mật, lợi thế về hiệu năng hoạt
động, lập trình linh hoạt bẳng việc sử dụng pure XML
Pure XML là một công nghệ cho phép lưu trữ các tài
liệu XML theo định dạng phân tích phân cấp, như một cây, và điều này được thực hiện ngay tại thời điểm
chèn cơ sở dữ liệu
Tại thời gian truy vấn, không cần phân tích các tài liệu XML để xây dựng cây trước khi xử lý