Hãy khởi đầu nhanh chóng với DB2 9 pureXML, Phần 1: XML là lõi docx

23 183 0
Hãy khởi đầu nhanh chóng với DB2 9 pureXML, Phần 1: XML là lõi docx

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Hãy khởi đầu nhanh chóng với DB2 9 pureXML, Phần 1: XML là lõi Cynthia M. Saracco, Kiến trúc giải pháp cao cấp, IBM Tóm tắt: Bản phát hành DB2® 9 của IBM® mô tả một kiến trúc quan trọng là Ideparture khác với các phiên bản trước. Đây là lần đầu tiên kể từ khi ra mắt, DB2 cho Linux®, UNIX®, và Windows® đang cung cấp một ngôn ngữ truy vấn mới, công nghệ lưu trữ mới, công nghệ lập chỉ mục mới và các tính năng khác để hỗ trợ cho dữ liệu XML và cấu trúc phân cấp vốn có của nó. Nhưng đừng lo lắng quá, vì tất cả các tính năng quản lý cơ sở dữ liệu truyền thống của DB2 vẫn còn nguyên, bao gồm cả sự hỗ trợ của nó cho SQL và các cấu trúc dữ liệu dạng bảng. Hãy khám phá công nghệ XML của DB2 9 và tìm hiểu lý do tại sao bây giờ IBM coi DB2 là hệ thống quản lý cơ sở dữ liệu "lai" hoặc đa-cấu trúc (DBMS). Lưu ý: Được viết lần đầu vào năm 2006, bài viết này luôn được cập nhật để theo kịp với các thay đổi sản phẩm trong phiên bản 9.5 và 9.7 của DB2. Mở đầu Quản lý các dạng dữ liệu mới thường để lộ ra nhiều thách thức mới. Nhiều nhà lãnh đạo công nghệ thông tin đã phát hiện ra đó chính là trường hợp khi nói về dữ liệu theo định dạng của Ngôn ngữ đánh dấu mở rộng (XML). Thường, các lựa chọn rõ ràng để quản lý và chia sẻ dữ liệu XML vẫn không cắt bỏ được nó. Các hệ thống tệp đang dùng tốt cho các nhiệm vụ đơn giản, nhưng lại không mở rộng tốt khi bạn cần đương đầu với một lượng lớn tài liệu. Không thể quản lý nổi các vấn đề đồng quy, khôi phục, an ninh và dễ sử dụng. Các hệ thống quản lý cơ sở dữ liệu quan hệ thương mại (DBMS) giải quyết được các vấn đề đó, nhưng lại thất bại trong các lĩnh vực khác. Chúng cung cấp hai tùy chọn thiết kế cơ sở dữ liệu cơ bản lưu trữ từng tài liệu XML nguyên vẹn như là một đối tượng lớn đơn lẻ hoặc thường "băm nhỏ" nó thành nhiều cột trên nhiều bảng. Trong nhiều tình huống, các tùy chọn này đưa vào các vấn đề hiệu năng, các thách thức quản trị, tính phức tạp truy vấn tăng lên và các vấn đề khác. Cuối cùng, các DBMS chỉ cho-XML đưa một môi trường mới hầu như chưa qua thử thách vào cơ sở hạ tầng công nghệ thông tin, làm tăng các mối quan tâm về tích hợp, các kỹ năng nhân viên và khả năng tồn tại lâu dài. Bản phát hành phiên bản 9 của DB2 cho các nền tảng Linux, Unix và Windows giới thiệu tùy chọn khác. Bản phát hành này hỗ trợ dữ liệu XML như là một kiểu lớp hạng nhất. Để làm như vậy, IBM mở rộng DB2 để bao gồm:  Các kỹ thuật lưu trữ mới để quản lý hiệu quả các cấu trúc phân cấp vốn có trong các tài liệu XML.  Công nghệ lập chỉ mục mới để tăng tốc độ các tìm kiếm trên và trong các tài liệu XML.  Sự hỗ trợ ngôn ngữ truy vấn mới (cho XQuery), một trình xây dựng (builder) truy vấn đồ họa mới (cho XQuery) và các kỹ thuật tối ưu hóa truy vấn mới.  Sự hỗ trợ mới để xác nhận hợp lệ dữ liệu XML dựa vào các lược đồ do người dùng cung cấp.  Các khả năng quản trị, bao gồm phần mở rộng cho các tiện ích cơ sở dữ liệu quan trọng.  Tích hợp với các giao diện lập trình ứng dụng phổ biến (các API).  Sự hỗ trợ của XML trong một môi trường kho dữ liệu khi có thêm sự hỗ trợ XML với tính năng phân vùng dữ liệu (DPF), phân vùng phạm vi và phân cụm nhiều chiều (MDC) trong phiên bản V9.7. Điều quan trọng cần lưu ý là sự hỗ trợ "nguyên gốc" của DB2 cho XML nằm ngoài sự hỗ trợ hiện có của nó cho các công nghệ khác, bao gồm cả SQL, các cấu trúc dữ liệu dạng bảng và các tính năng DBMS khác nhau. Kết quả là, những người dùng có thể tạo một đối tượng cơ sở dữ liệu đơn để quản lý cả hai dữ liệu SQL "truyền thống" lẫn các tài liệu XML. Hơn nữa, họ có thể viết một truy vấn đơn để tìm kiếm và tích hợp cả hai dạng dữ liệu. Bài viết này tìm hiểu các tính năng này khi chúng ta đi sâu vào nghiên cứu sự hỗ trợ XML nguyên gốc của DB2. Mặc dù vậy, trước tiên chúng ta hãy xem xét lý do tại sao việc quản lý dữ liệu XML đúng cách lại quan trọng. Các lợi ích tiềm năng Với số lượng các công ty ngày càng tăng đang chuyển sang XML để giúp họ triển khai thực hiện các kiến trúc hướng dịch vụ (SOA), trao đổi dữ liệu giữa các hệ thống và các ứng dụng khác nhau và thích ứng với các điều kiện nghiệp vụ thay đổi nhanh, nhiều nhà lãnh đạo công nghệ thông tin có hiểu biết đang tìm cách chia sẻ, tìm kiếm và quản lý có hiệu quả sự phong phú của các tài liệu và các thông báo XML mà các công ty của họ đang tạo ra. Sự hỗ trợ XML mới của DB2 được thiết kế để giúp cho các doanh nghiệp giảm thiểu thời gian và nỗ lực đã dùng để tiếp tục duy trì và sử dụng dữ liệu XML của họ. Dần dần, điều này có thể làm giảm chi phí phát triển và nâng cao tính linh hoạt nghiệp vụ. Ví dụ, bài "Sử dụng XML nguyên gốc của DB2 với PHP" (developerWorks, 10.2005) minh họa cách hỗ trợ XML mới của DB2 làm giảm tính phức tạp của thiết kế cơ sở dữ liệu và mã ứng dụng cần thiết để hỗ trợ trang web thương mại điện tử. Tương tự như vậy, bài "Quản lý XML để thu được nhiều nhất" (IBM, 11.2005) bàn về những trải nghiệm ban đầu của khách hàng bao gồm các kịch bản thử nghiệm so sánh cũng cho thấy những tiết kiệm nhân công tiềm năng và vòng đời được cải thiện. Có cái gì ở phía sau những lợi ích này? DB2 cho phép những người dùng lưu trữ các tài liệu XML nguyên vẹn với đầy đủ kiến thức của DBMS về cấu trúc bên trong của tài liệu. Điều này loại trừ hoặc giảm thiểu các nhiệm vụ quản trị và lập trình liên quan đến các lựa chọn thay thế khác. Hơn nữa, nó có thể tăng tốc độ các tìm kiếm trên và trong các tài liệu và nó cho phép các khách hàng điều chỉnh các thay đổi dễ dàng hơn theo các yêu cầu nghiệp vụ được phản ánh trong các lược đồ XML. Tổng quan về kiến trúc DB2 cho phép ứng dụng máy khách làm việc với cả hai cấu trúc dữ liệu dạng bảng và XML thông qua ngôn ngữ truy vấn lựa chọn của chúng SQL (bao gồm cả SQL với các phần mở rộng XML, thường được gọi là "SQL/XML") hoặc XQuery. Như trong Hình 1, các thành phần mức-máy trong các truy vấn hỗ trợ DB2 được quy định theo cả hai ngôn ngữ. Hình 1. Kiến trúc của bản phát hành DB2 9 mới Để quản lý có hiệu quả các kiểu dữ liệu SQL truyền thống và dữ liệu XML, DB2 có hai cơ chế lưu trữ riêng biệt. Chúng ta sẽ thảo luận về công nghệ lưu trữ pureXML® ngay. Tuy nhiên, điều quan trọng cần lưu ý là cơ chế lưu trữ cơ bản được sử dụng cho một kiểu dữ liệu cụ thể là trong suốt với ứng dụng. Nói cách khác, ứng dụng không cần quy định rõ ràng cơ chế lưu trữ nào cần sử dụng hoặc quản lý các khía cạnh vật lý của lưu trữ, chẳng hạn như chia nhỏ các phần của tài liệu XML trên nhiều trang cơ sở dữ liệu. Nó chỉ đơn giản là sử dụng các lợi ích hiệu năng thời gian chạy để lưu trữ và truy vấn dữ liệu theo một định dạng có hiệu quả với dữ liệu đích. Hãy nghiên cứu kỹ các tính năng XML của DB2 theo quan điểm người dùng. Lưu trữ hợp lý Các bộ sưu tập các tài liệu XML được lưu trữ trong các bảng DB2 có chứa một hoặc nhiều cột theo kiểu dữ liệu XML mới. Điều này cho phép các quản trị viên sử dụng các câu lệnh của ngôn ngữ định nghĩa dữ liệu (DDL) SQL quen thuộc để tạo các đối tượng cơ sở dữ liệu nhằm tiếp tục sử dụng dữ liệu XML của họ. Tuy nhiên, giao diện quen thuộc này che dấu thực tế là DB2 lưu trữ dữ liệu XML theo cách khác nhau, khi sử dụng công nghệ mới để bảo tồn cấu trúc phân cấp dữ liệu XML và hỗ trợ các tìm kiếm có hiệu quả bao trùm tất cả hoặc một phần dữ liệu XML ban đầu. Để dễ dàng tích hợp các dạng dữ liệu nghiệp vụ truyền thống với dữ liệu XML cho những người dùng, các quản trị viên DB2 có thể tạo ra các bảng có chứa các cột có cả hai kiểu dữ liệu SQL truyền thống lẫn kiểu dữ liệu XML mới. Đây là ví dụ về một bảng như vậy: Liệt kê 1. Tạo một bảng có một cột XML create table items ( id int primary key not null, brandname varchar(30), itemname varchar(30), sku int, srp decimal(7,2), comments xml ) Năm đầu tiên cột của bảng này sử dụng các kiểu dữ liệu SQL truyền thống để theo dõi thông tin về từng mặt hàng để bán, bao gồm số mã định danh ID, tên thương hiệu, tên mặt hàng, mã hàng trong kho (SKU) và giá bán lẻ đề xuất (SRP). Một cột "comments" (các ý kiến) chứa dữ liệu XML có ý kiến phản hồi của khách hàng đã chia sẻ về mặt hàng đó. Lưu ý rằng không quy định cấu trúc bên trong của dữ liệu XML khi tạo một bảng có một cột XML. Đây là do thiết kế. Các tài liệu XML là tự mô tả và cấu trúc bên trong của chúng có thể thay đổi đáng kể. Yêu cầu duy nhất của DB2 để lưu trữ dữ liệu XML là nó phải "đúng định dạng" có nghĩa là, nó phải tuân thủ các quy tắc cú pháp nhất định được quy định trong "tiêu chuẩn W3C cho XML" (xem phần "Tài nguyên"). Cách tiếp cận tự do của DB2 tạo cho người dùng sự linh hoạt đáng kể và dễ dàng lưu trữ các bộ sưu tập của các tài liệu XML có chứa các thuộc tính và cấu trúc bên trong khác nhau tùy theo phát triển các yêu cầu hoặc các tình huống nghiệp vụ ở nơi còn thiếu thông tin hoặc thông tin không phù hợp. Tuy nhiên, những người dùng muốn đảm bảo rằng dữ liệu XML tuân theo các quy tắc cấu trúc riêng của họ có thể ra lệnh cho DB2 xác nhận hợp lệ dữ liệu của họ trước khi lưu trữ. Điều này được thảo luận chi tiết hơn trong bài "Các lược đồ và xác nhận hợp lệ XML." Về cơ bản làm như vậy đòi hỏi tạo ra các lược đồ XML (đó cũng là một phần của tiêu chuẩn XML của W3C) và đăng ký các lược đồ này với DB2. (Xem phần "Tài nguyên" để biết thêm thông tin về các lược đồ XML). Vào lúc này, bạn có thể tự hỏi làm thế nào để những người dùng điền vào một bảng DB2 với dữ liệu XML. Câu trả lời này là đơn giản để làm việc này họ sử dụng một trong ba cơ chế DB2 quen thuộc. Các câu lệnh INSERT của SQL cũng như phương tiện IMPORT của DB2 đều cung cấp dữ liệu XML bên cạnh các kiểu dữ liệu khác. (IMPORT của DB2 ban hành các câu lệnh INSERT sau hậu trường). Load cũng hỗ trợ các câu lệnh chèn của XML, được thêm vào trong DB2 9.5. Nếu bạn đang tự hỏi tại sao DB2 chỉ hỗ trợ các câu lệnh chèn dữ liệu qua SQL mà không qua XQuery, thì câu trả lời đó khá đơn giản, phiên bản đầu tiên của tiêu chuẩn XQuery mới nổi tập trung vào các hoạt động đọc cơ sở dữ liệu, chứ không ghi các hoạt động. Trong trường hợp thiếu một tiêu chuẩn được chấp nhận rõ ràng, IBM đã chọn cung cấp cho người dùng của mình hai phương tiện quen thuộc để tiếp tục sử dụng dữ liệu XML mới. (Xem phần "Tài nguyên" để biết thêm thông tin về các tiêu chuẩn XQuery). Lưu trữ vật lý Do là một vấn đề thực tế, nên hầu hết ngững người dùng chẳng cần bận tâm đến kiến trúc quản lý lưu trữ vật lý mới của DB2 cho dữ liệu XML. Tuy nhiên, để giúp bạn hiểu những gì DB2 đang làm sau hậu trường, chúng ta hãy thảo luận ngắn gọn về cách tiếp cận bên trong của nó để lưu trữ dữ liệu XML. DB2 lưu trữ và thao tác dữ liệu XML theo một định dạng được phân tích cú pháp phản ánh bản chất phân cấp của tài liệu XML ban đầu. Như vậy, nó sử dụng các cây và các nút làm mô hình của mình để lưu trữ và xử lý dữ liệu XML. Nếu những người sử dụng ra lệnh cho DB2 xác nhận hợp lệ dữ liệu XML của họ dựa vào một lược đồ XML đã đăng ký trước khi lưu trữ, thì DB2 sẽ chú thích tất cả các nút trong phân cấp XML với thông tin về các kiểu lược đồ. Dựa vào định nghĩa ở trên về một bảng "items" (các mặt hàng), chúng ta hãy xem xét lại một tài liệu XML mẫu được lưu trữ trong bảng đó. Như trong Liệt kê 2 và được minh họa trong Hình 2, tài liệu XML này chứa nhiều phần tử được biểu diễn theo một hệ thống phân cấp, bao gồm một phần tử gốc Comments và một hay nhiều phần tử con Comment (ý kiến) liên quan đến một mặt hàng cụ thể. Một trình nhận dạng ý kiến được kết hợp với mỗi ý kiến, thông tin về khách hàng có thể bao gồm các phần tử con có tên và địa chỉ email của khách hàng, văn bản thông báo hay ý kiến của khách hàng và một chỉ số về liệu khách hàng có muốn hay không muốn trả lời không. Liệt kê 2. Tài liệu XML mẫu <Comments> <Comment> <CommentID>133</CommentID> <Customer> <Name>John Doe</Name> <Email>johndoe@any_isp.com</Email> </Customer> <Message>Heels on shoes wear out too quickly.</Message> <ResponseRequested>No</ResponseRequested> </Comment> . . . </Comments> Hình 2. Biểu diễn hệ thống phân cấp của tài liệu XML trong Liệt kê 2 [...]... sao DB2 cung cấp cho người dùng tùy chọn đăng ký các lược đồ XML của họ và ra lệnh cho DB2 xác nhận hợp lệ các tài liệu XML dựa vào các lược đồ này trước khi lưu trữ Nếu bạn chưa quen với các lược đồ XML, thì chúng là các tài liệu XML đúng định dạng đơn giản, điều khiển cấu trúc và nội dung của các tài liệu khác Ví dụ, các lược đồ XML quy định các phần tử nào là hợp lệ, thứ tự xuất hiện của các phần. .. đích của mình theo một tập hợp con cụ thể của dữ liệu XML trong trường hợp này, cột COMMENTS của bảng ITEMS Bạn đã giới hạn thêm dữ liệu đích của mình theo một tập hợp con cụ thể của dữ liệu XML cụ thể là, các giá trị của phần tử "Message" (thông báo), là một phần tử con của phần tử "Comment", mà chính phần tử "Comment" lại là một phần tử con của phần tử "Comments" gốc (Xem Hình 2.) Có thể tạo truy... vào trong phiên bản 9. 5 là khả năng tuyến bố "có nén" trong khi tạo hoặc thay đổi bảng và không chỉ nén dữ liệu quan hệ, mà còn nội tuyến cả dữ liệu XML nữa Trong thực tế, DB2 đã tiến một bước xa hơn trong phiên bản 9. 7 — việc thiết lập nén trên một bảng trong phiên bản 9. 7 cũng nén các tài liệu XML trong vùng XDA Lập chỉ mục Cùng với sự hỗ trợ quản lý lưu trữ phân cấp mới cho XML, DB2 mô tả công nghệ... NET của DB2) Vì giao diện lập trình ứng dụng (API) thay đổi theo ngôn ngữ lập trình đang sử dụng, nên bài viết này không xem xét từng phần mở rộng này ở đây Tuy nhiên, bạn có thể đọc một bản tóm tắt về các phần mở rộng này trong một bài viết thảo luận có tên là "Sự hỗ trợ XML nguyên gốc trong cơ sở dữ liệu phổ biến của DB2" (xem phần "Tài nguyên") hoặc đọc bài "Sử dụng XML nguyên gốc của DB2 với PHP."... mang một giá bán lẻ đề xuất (srp) lớn hơn $100 mới được lưu hành làm đầu vào Hơn nữa thông tin XQuery cho thấy rằng DB2 chỉ nên trả về các phần "Message" của các ý kiến như vậy Một số tờ báo và các trang web có thể giúp bạn tăng tốc dựa trên các phần mở rộng SQL /XML của DB2, sự hỗ trợ của DB2 cho XQuery và các tiêu chuẩn XQuery mới nổi (Xem phần "Tài nguyên" về các con trỏ) Cuối cùng, cuộc thảo luận này... trên và tài liệu XML mẫu tương ứng được hiển thị trong Liệt kê 2, một quản trị viên có thể đưa ra câu lệnh sau (xem Liệt kê 3) để lập chỉ mục tất cả các trình định danh ý kiến (các giá trị "CommentID") có chứa trong cột "comments" Nhớ lại rằng phần tử CommentID trong tài liệu mẫu của chúng ta là một phần tử con của phần tử Comment, mà chính phần tử Comment lại là một phần tử con của phần tử Comments... lược đồ XML "cũ") có thể vẫn còn ở đúng chỗ và có thể thêm dữ liệu mới để tuân thủ một hoặc nhiều lược đồ mới Theo cách này, các quản trị viên có thể hỗ trợ các yêu cầu nghiệp vụ mới với chi phí và thời gian triển khai tối thiểu Hơn nữa, để làm như vậy họ không cần phải làm tổn hại đến sự toàn vẹn dữ liệu XML của mình họ có thể chỉ cần cung cấp cho DB2 với thông tin mới về những gì là "hợp lệ" với dữ... là "hợp lệ" với dữ liệu XML của họ Việc đăng ký một lược đồ XML trong kho lưu trữ bên trong của DB2 là đơn giản DB2 cung cấp các thủ tục đã lưu để tự động hóa quá trình hoặc các quản trị viên có thể đưa ra các lệnh tương ứng Có thể sử dụng một lược đồ duy nhất để xác nhận hợp lệ nhiều cột XML trong nhiều bảng, nếu muốn Hỗ trợ quản trị Sự hỗ trợ mới của DB2 cho XML bao gồm các phần mở rộng cho các công... đơn để giới hạn các tìm kiếm với cả hai cột XML và cột không -XML Ví dụ, hãy xem xét câu lệnh XQuery sau đây: Listing 7 Combining SQL and XQuery in one statement xquery db2- fn:sqlquery('select comments from items where srp > 100')/Comments/Comment/Message Mệnh đề db2- fn:sqlquery giới hạn đầu vào cho câu lệnh XQuery rộng hơn, cụ thể là, chỉ có các ý kiến của khách hàng gắn với các mặt hàng mang một giá... kỳ, sử dụng các lệnh xác nhận hợp lệ XML, sử dụng SQL /XML hay XQuery, hoặc nạp khối lượng lớn dữ liệu XML song song Khi bắt đầu với DB2 9. 7, các bảng đã phân vùng có thể bao gồm dữ liệu XML và có thể hưởng lợi từ việc dịch chuyển vào và ra dữ liệu dễ dàng do các chức năng phân vùng bảng cung cấp Ngoài các truy vấn trên dữ liệu quan hệ, các truy vấn trên dữ liệu XML cũng có thể hưởng lợi từ ưu thế về . Hãy khởi đầu nhanh chóng với DB2 9 pureXML, Phần 1: XML là lõi Cynthia M. Saracco, Kiến trúc giải pháp cao cấp, IBM Tóm tắt: Bản phát hành DB2 9 của IBM® mô tả một kiến trúc quan trọng là. XML cụ thể là, các giá trị của phần tử "Message" (thông báo), là một phần tử con của phần tử "Comment", mà chính phần tử "Comment" lại là một phần tử con của phần. xác nhận hợp lệ XML. " Về cơ bản làm như vậy đòi hỏi tạo ra các lược đồ XML (đó cũng là một phần của tiêu chuẩn XML của W3C) và đăng ký các lược đồ này với DB2. (Xem phần "Tài nguyên"

Ngày đăng: 07/08/2014, 09:23

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan