Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 25 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
25
Dung lượng
267,98 KB
Nội dung
Hãy khởi đầu nhanh chóng với DB2 9 pureXML, Phần 2: Tạo và điền một cơ sở dữ liệu XML của DB2 Cynthia M. Saracco, Kiến trúc giải pháp cao cấp, IBM Tóm tắt: DB2® V9 cho Linux®, UNIX® và Windows® của IBM® mô tả sự hỗ trợ mới quan trọng để lưu trữ, quản lý và truy vấn dữ liệu XML, được gọi là pureXML®. Bài viết này giúp bạn nhanh chóng nắm vững các tính năng XML mới này thông qua một số bài viết từng bước một giải thích cách hoàn thành các nhiệm vụ cơ bản. Trong bài viết này, hãy tìm hiểu cách tạo các đối tượng cơ sở dữ liệu để quản lý dữ liệu XML của bạn và cách điền dữ liệu XML vào cơ sở dữ liệu DB2 của bạn. [11.03.2010: Được viết lần đầu vào năm 2006, bài viết này luôn được cập nhật để theo kịp với các thay đổi trong phiên bản 9.5 và 9.7 của DB2 Người hiệu đính.] Bạn đã có thể nghe thấy tin đồn về phiên bản V9 của DB2 hệ thống quản lý cơ sở dữ liệu đầu tiên của IBM có hỗ trợ cả hai cấu trúc dữ liệu (dựa vào-SQL) dạng bảng và cấu trúc dữ liệu (dựa vào-XML) phân cấp. Nếu bạn muốn tìm hiểu về sự hỗ trợ nguyên gốc mới của DB2 cho XML và muốn có khởi đầu nhanh chóng, thì bạn đã đến đúng nơi rồi. Để giúp bạn nhanh chóng tăng tốc độ dựa vào các tính năng XML của DB2, bài viết này trình bày một số nhiệm vụ phổ biến, chẳng hạn như: Tạo các đối tượng cơ sở dữ liệu để quản lý dữ liệu XML, bao gồm một cơ sở dữ liệu thử nghiệm, các bảng mẫu và các khung nhìn. Điền dữ liệu XML vào cơ sở dữ liệu bằng các câu lệnh INSERT và IMPORT. Xác nhận hợp lệ dữ liệu XML của bạn. Phát triển và đăng ký các lược đồ XML của bạn với DB2 và sử dụng tùy chọn XMLVALIDATE khi nhập khẩu dữ liệu. Các bài sắp tới sẽ trình bày các chủ đề khác, như là truy vấn, cập nhật và xoá dữ liệu XML của DB2 bằng SQL, truy vấn dữ liệu XML của DB2 bằng XQuery và phát triển các ứng dụng Java và các thành phần web truy cập dữ liệu XML của DB2. Tạo các đối tượng cơ sở dữ liệu Để bắt đầu, hãy tạo một cơ sở dữ liệu Unicode duy nhất của DB2. (Với DB2 phiên bản V9.1, cần có một cơ sở dữ liệu Unicode cho XML. DB2 phiên bản v9.5 và mới hơn không cần có một cơ sở dữ liệu Unicode nữa). Sau đó, bạn sẽ tạo các đối tượng trong cơ sở dữ liệu này để quản lý cả hai dữ liệu XML và các kiểu dữ liệu khác. Tạo một cơ sở dữ liệu thử nghiệm Để tạo ra một cơ sở dữ liệu thử nghiệm Unicode mới của DB2, hãy mở một cửa sổ lệnh DB2 và đưa ra một câu lệnh quy định một bộ mã Unicode và vùng được hỗ trợ, như trong Liệt kê 1. Liệt kê 1. Tạo một cơ sở dữ liệu để lưu trữ dữ liệu XML create database test using codeset UTF-8 territory us Một khi bạn tạo một cơ sở dữ liệu, bạn không cần phải phát hành bất kỳ các lệnh đặc biệt nào hoặc thực hiện bất kỳ hoạt động thêm nào để cho phép DB2 lưu trữ dữ liệu XML theo định dạng phân cấp nguyên gốc của nó. Hệ thống DB2 của bạn đã sẵn sàng để chạy. Tạo các bảng mẫu Để lưu trữ dữ liệu XML, bạn tạo ra các bảng có chứa một hoặc nhiều cột XML. Những bảng này dùng như là các thùng chứa logic cho các bộ sưu tập các tài liệu. Sau hậu trường, DB2 thực sự sử dụng một lược đồ lưu trữ khác cho dữ liệu XML và không-XML. Tuy nhiên, việc sử dụng các bảng như một đối tượng logic để quản lý tất cả các dạng của dữ liệu được hỗ trợ làm đơn giản hóa các vấn đề phát triển ứng dụng và quản trị, đặc biệt là khi cần tích hợp các dạng dữ liệu khác nhau trong một truy vấn duy nhất. Bạn có thể định nghĩa các bảng DB2 để chứa chỉ các cột XML, chỉ các cột theo các kiểu SQL truyền thống hoặc kết hợp cả hai. Bài viết này mô hình hóa cái sau. Ví dụ trong Liệt kê 2 kết nối đến cơ sở dữ liệu thử nghiệm và tạo ra hai bảng. Bảng đầu tiên là một bảng Items (Các mặt hàng), theo dõi thông tin về các mặt hàng để bán và các ý kiến mà khách hàng đã đóng góp về chúng. Bảng thứ hai theo dõi thông tin về Clients (Các khách hàng), bao gồm dữ liệu liên hệ. Lưu ý rằng Comments và Contactinfo (Thông tin liên hệ) được dựa vào kiểu dữ liệu XML mới của DB2, trong khi tất cả các cột khác trong các bảng được dựa vào các kiểu dữ liệu SQL truyền thống. Liệt kê 2. Tạo các bảng cho dữ liệu XML connect to test; create table items ( id int primary key not null, brandname varchar(30), itemname varchar(30), sku int, srp decimal(7,2), comments xml ); create table clients( id int primary key not null, name varchar(50), status varchar(10), contactinfo xml ); Nếu bạn nhìn kỹ vào các ví dụ định nghĩa bảng này, bạn sẽ nhận thấy rằng chẳng có quy định cấu trúc bên trong của các tài liệu XML được lưu trữ trong cột Comments cũng như trong cột Contactinfo. Đây là tính năng DB2 quan trọng. Những người dùng không cần định nghĩa sẵn một cấu trúc dữ liệu XML (hoặc, chính xác hơn, một lược đồ XML) để lưu trữ dữ liệu của họ. Thật vậy, DB2 có thể lưu trữ bất kỳ tài liệu XML đúng định dạng nào trong một cột đơn, có nghĩa là các tài liệu XML của các lược đồ khác nhau (hoặc các tài liệu không liên kết với bất cứ lược đồ đã đăng ký nào) có thể được lưu trữ trong cùng một cột DB2. Bài viết này bàn về tính năng này nhiều hơn khi thảo luận cách lưu trữ dữ liệu trong DB2. Tùy chọn để lưu trữ nội tuyến (inline) các tài liệu XML nhỏ hơn đã được giới thiệu trong phiên bản v9.5. Nếu các tài liệu XML đủ nhỏ để khớp với kích thước trang, thì nó có thể được lưu trữ bằng các phần tử SQL khác. Nếu nó không đủ nhỏ để khớp với một trang, thì nó sẽ được lưu trữ riêng biệt. Cùng với từ khoá nội tuyến, bạn cung cấp kích thước tối đa của XML được nội tuyến. Giá trị này dựa vào vào kích thước trang và kích thước của các cột quan hệ khác. Liệt kê 3 cho thấy đoạn mã thực hiện điều này: Liệt kê 3. Tạo các bảng cho dữ liệu XML bằng tùy chọn nội tuyến connect to test; create table items ( id int primary key not null, brandname varchar(30), itemname varchar(30), sku int, srp decimal(7,2), comments xml inline length 10240 ); Tạo các khung nhìn Theo tùy chọn, bạn có thể tạo ra các khung nhìn trên các bảng đang chứa dữ liệu XML, cũng giống như bạn có thể tạo các khung nhìn trên các bảng chỉ đang chứa các kiểu dữ liệu SQL truyền thống. Ví dụ trong Liệt kê 4 tạo một khung nhìn của các khách hàng có một trạng thái Gold (Vàng): Liệt kê 4. Tạo một khung nhìn chứa dữ liệu XML create view goldview as select id, name, contactinfo from clients where status='Gold'; Lưu ý về các chỉ mục Cuối cùng, lưu ý rằng bạn có thể tạo ra các chỉ mục chuyên dụng trên các cột XML của bạn để tăng tốc các tìm kiếm dữ liệu của bạn. Vì đây là một bài viết giới thiệu và dữ liệu ví dụ nhỏ, nên bài viết này sẽ không trình bày chủ đề đó. Tuy nhiên, trong các môi trường sản xuất, việc định nghĩa các chỉ mục thích hợp có thể rất quan trọng để đạt được hiệu năng tối ưu. Xem phần Tài nguyên để có trợ giúp về cách tìm hiểu thêm về công nghệ lập chỉ mục mới của DB2. Lưu trữ dữ liệu XML Với các bảng đã tạo ra, bây giờ bạn có thể điền dữ liệu vào chúng. Ban hành trực tiếp các câu lệnh SQL INSERT hoặc bằng cách gọi phương tiện IMPORT của DB2, ban hành câu lệnh INSERT sau hậu trường. Với phiên bản v9.5 của DB2, phương tiện LOAD cũng hỗ trợ dữ liệu XML. Sử dụng các câu lệnh INSERT Với INSERT, bạn cung cấp trực tiếp cho DB2 dữ liệu XML thô. Có lẽ đó là cách làm dễ nhất khi bạn đã viết một ứng dụng và đã lưu trữ dữ liệu XML trong một biến. Nhưng nếu bạn chỉ mới bắt đầu với DB2 và không cần viết một ứng dụng, bạn có thể ban hành các câu lệnh INSERT tương tác. (Tôi thấy sử dụng Trình soạn thảo lệnh (DB2 Command Editor) của DB2 là rất thuận tiện, mặc dù bạn cũng có thể sử dụng bộ vi xử lý dòng lệnh, nếu bạn muốn). Để sử dụng DB2 Command Editor, hãy khởi động DB2 Control Center (Trung tâm điều khiển của DB2). Từ trình đơn thả xuống Tools (Các công cụ) ở trên đỉnh, chọn Command Editor. Một cửa sổ riêng biệt xuất hiện, như trong Hình 1. Hình 1. DB2 Command Editor Gõ các câu lệnh sau vào ô bên trên: Liệt kê 5. Chèn dữ liệu XML tương tác connect to test; insert into clients values (77, 'John Smith', 'Gold', '<addr>111 Main St., Dallas, TX, 00112</addr>') Nhấn vào mũi tên màu xanh lá cây ở bên trái để thực hiện lệnh. Trong trường hợp này, tài liệu đầu vào khá đơn giản. Nếu tài liệu lớn hay phức tạp, thì việc nhập dữ liệu XML vào câu lệnh INSERT như đã hiển thị là không thực tế. Trong hầu hết các trường hợp, bạn muốn viết một ứng dụng để chèn dữ liệu bằng một biến lưu trữ trên máy chủ hoặc một dấu tham số. Bạn sẽ thấy một ví dụ mã hóa Java ngắn đi kèm theo bài viết này. Tuy nhiên, hướng dẫn giới thiệu này không trình bày các chủ đề phát triển ứng dụng một cách chi tiết. Thay vào đó, chúng ta sẽ bàn về tùy chọn khác để điền dữ liệu vào các cột XML của DB2 — khi sử dụng phương tiện IMPORT. Sử dụng phương tiện IMPORT của DB2 Nếu bạn đã có dữ liệu XML của mình trong các tệp, phương tiện IMPORT của DB2 cung cấp một cách đơn giản để bạn điền dữ liệu này vào các bảng DB2 của bạn. Bạn không cần viết một ứng dụng. Bạn chỉ cần tạo một tệp ASCII định giới có chứa dữ liệu mà bạn muốn nạp vào bảng của mình. Đối với dữ liệu XML được lưu trữ trong các tệp, có một tham số xác định các tên tệp thích hợp. Bạn có thể tạo tệp ASCII định giới bằng cách sử dụng trình soạn thảo văn bản theo lựa chọn của bạn. (Theo quy ước, các tệp như vậy thường là kiểu .del). Mỗi dòng trong tệp của bạn biểu diễn một hàng dữ liệu được nhập khẩu vào bảng của bạn. Nếu dòng của bạn có chứa một XML Data Specifier (XDS-Trình định rõ dữ liệu XML), thì IMPORT sẽ đọc dữ liệu được chứa trong tệp XML tham chiếu và nhập khẩu dữ liệu đó vào DB2. Ví dụ, dòng đầu tiên trong Liệt kê 6 có thông tin về Ella Kimpton, bao gồm mã định danh ID, tên và trạng thái khách hàng của cô ta. Thông tin liên hệ của cô ta có trong tệp Client3227.xml. Liệt kê 6. Tệp clients.del 3227,Ella Kimpton,Gold,<XDS FIL='Client3227.xml' /> 8877,Chris Bontempo,Gold,<XDS FIL='Client8877.xml' /> 9077,Lisa Hansen,Silver,*lt;XDS FIL='Client9077.xml' /> 9177,Rita Gomez,Standard,<XDS FIL='Client9177.xml' /> 5681,Paula Lipenski,Standard,<XDS FIL='Client5681.xml' /> 4309,Tina Wang,Standard,<XDS FIL='Client4309.xml' /> Nội dung của tệp Client3227.xml được hiển thị trong Liệt kê 7. Tệp này chứa các phần tử XML với địa chỉ, số điện thoại, số fax và email của Ella Kimpton. Liệt kê 7. Tệp Client3227.xml <?xml version="1.0"?> <Client [...]... và xử lý dữ liệu XML theo cách hiệu quả Để giúp bạn khởi đầu nhanh chóng với các tính năng này, bài viết này đã mô tả cách tạo một cơ sở dữ liệu thử nghiệm và các bảng mẫu để lưu trữ các tài liệu XML Nó cũng xem xét cách bạn có thể điền dữ liệu XML vào cơ sở dữ liệu của bạn Cuối cùng, nó đã tóm tắt khả năng của DB2 để xác nhận hợp lệ dữ liệu XML dựa vào các lược đồ XML do người dùng cung cấp và đã đưa... hàng trong cơ sở dữ liệu mẫu của DB2 Nhấn chuột phải vào dự án và chọn Generate > XML Schema Việc này tạo ra một lược đồ XML hợp lệ cho tệp đầu vào riêng của bạn, như trong Hình 2 (ảnh rộng hơn) Sau đó bạn có thể sửa đổi tệp (nếu cần) và đăng ký nó với DB2 Hình 2 Sử dụng phần IBM Rational Software Architect để tạo ra một lược đồ XML từ một tệp XML Giả sử bạn cần tạo lược đồ XML khá linh hoạt của mình... ra tự động DB2 cho phép bất kỳ tài liệu XML đúng định dạng nào được lưu trữ trong một cột XML Nếu bạn muốn xác nhận hợp lệ dữ liệu của mình dựa vào một lược đồ đã đăng ký trước khi lưu trữ, bạn cần phải ra lệnh cho DB2 làm như vậy Bước 3: Nhập dữ liệu XML có xác nhận hợp lệ Với một lược đồ XML được tạo ra và được đăng ký xong trong DB2, bây giờ bạn đã sẵn sàng có DB2 xác nhận hợp lệ dữ liệu XML khi chèn... tra xem dữ liệu có tuân theo một lược đồ XML cụ thể không và do đó cũng không kiểm tra xem có tuân theo một cấu trúc cụ thể không Tuy nhiên, có khả năng chỉ thị cho DB2 làm điều đó Dưới đây là một cách tiếp cận: Bước 1: Tạo một lược đồ XML Để xác nhận hợp lệ dữ liệu XML, bạn cần định nghĩa một lược đồ XML, quy định các phần tử XML có thể chấp nhận được, thứ tự của chúng và các kiểu dữ liệu và v.v Các... FIL='Comment 392 6 .xml' /> 4023,NatureTrail,Back pack,552238,34 .99 , 3641,Dress to Impress,Syutm7811421,1 49. 99, 4272,Classy,Cocktail dress ,98 1140,156 .99 , Với các tệp XML và các tệp ASCII định giới có sẵn của mình, bây giờ bạn đã sẵn sàng sử dụng phương tiện IMPORT của DB2 Câu lệnh trong Liệt kê 9 nhập khẩu các nội dung được quy định trong tệp clients.del vào... lệ dữ liệu XML trước khi chèn nó Cú pháp này tương tự như ví dụ IMPORT vừa được hiển thị trong đó bạn quy định một lược đồ XML đã đăng ký (và đã hoàn thành) khi gọi mệnh đề XMLVALIDATE (Xem bài "Một ví dụ Java đơn giản" để biết thêm thông tin) Tóm tắt DB2 phiên bản V9 cung cấp các khả năng mới quan trọng để hỗ trợ XML, bao gồm một kiểu dữ liệu XML và các thành phần mức-máy cơ bản, tự động lưu trữ và. .. cấp phần mềm độc lập (ISV) cung cấp các công cụ giúp bạn chuyển đổi các định dạng Microsoft® Word, Acrobat PDF và tài liệu khác thành XML để nhập khẩu vào DB2 Xem phần Tài nguyên để biết thêm thông tin về các ISV Xác nhận hợp lệ dữ liệu XML của bạn Các ví dụ INSERT và IMPORT vừa được bàn thảo có thể viết bất kỳ dữ liệu XML đúng định dạng nào vào các bảng của bạn Chúng không xác nhận hợp lệ dữ liệu. .. nhận hợp lệ dữ liệu XML trong khi nhập khẩu nó vào bảng Clients, hãy sử dụng mệnh đề XMLVALIDATE của phương tiện IMPORT của DB2 Câu lệnh trong Liệt kê 14 chỉ thị cho DB2 sử dụng lược đồ XML đã đăng ký sẵn của bạn (user1.mysample) làm XDS mặc định (XML Data Specifier) để xác nhận hợp lệ tệp XML được quy định trong tệp clients.del trước khi chèn chúng vào bảng Clients Liệt kê 14 Nhập dữ liệu XML có xác... xml from C:/XMLFILES xmlvalidate using xds default user1.mysample insert into user1.clients; Nếu DB2 xác định rằng một tài liệu XML không tuân theo lược đồ đã quy định, thì toàn bộ hàng liên kết với tài liệu đó bị loại Liệt kê 15 minh họa đầu ra ví dụ từ một phép toán IMPORT trong đó một hàng trong sáu hàng đã bị loại vì tài liệu XML của nó không phù hợp với lược đồ đã quy định Liệt kê 15 Nhập dữ liệu. .. thấy cách bắt đầu Bây giờ bạn đã học được cách lưu trữ dữ liệu XML bằng cách sử dụng các khả năng XML nguyên gốc của DB2, bạn đã sẵn sàng truy vấn dữ liệu đó Bạn sẽ thấy cách thực hiện điều đó trong các bài viết tiếp theo, sẽ giới thiệu cho bạn về sự hỗ trợ XQuery của DB2 và về các phần mở rộng XML của nó cho SQL (đôi khi gọi là SQL /XML) Lời cảm ơn Cảm ơn Grant Hutchison, Matthias Nicola và Gary Robinson . Hãy khởi đầu nhanh chóng với DB2 9 pureXML, Phần 2: Tạo và điền một cơ sở dữ liệu XML của DB2 Cynthia M. Saracco, Kiến trúc giải pháp cao cấp, IBM Tóm tắt: DB2 V9 cho Linux®, UNIX® và. dữ liệu Để bắt đầu, hãy tạo một cơ sở dữ liệu Unicode duy nhất của DB2. (Với DB2 phiên bản V9.1, cần có một cơ sở dữ liệu Unicode cho XML. DB2 phiên bản v9.5 và mới hơn không cần có một cơ sở. Tạo các đối tượng cơ sở dữ liệu để quản lý dữ liệu XML, bao gồm một cơ sở dữ liệu thử nghiệm, các bảng mẫu và các khung nhìn. Điền dữ liệu XML vào cơ sở dữ liệu bằng các câu lệnh INSERT và