1. Trang chủ
  2. » Công Nghệ Thông Tin

Hướng dẫn SQL & XQuery cho IBM DB2, Phần 7: Giới thiệu về XML và XQuery ppt

41 430 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Hướng dẫn SQL & XQuery cho IBM DB2, Phần 7: Giới thiệu về XML và XQuery Cơ sở của XML và truy vấn XML Jessica Cao, Chuyên viên phát triển các công cụ đào tạo, EMC Bruce Creighton, Chuyên viên lập kế hoạch các phần kỹ năng, EMC Pat Moffatt, Giám đốc Chương trình quản lý thông tin, Sáng kiến học đường, EMC Tóm tắt: Hướng dẫn này giới thiệu pureXML và XQuery, bắt đầu từ một tổng quan cơ bản của các đặc trưng và các lợi thế của kiểu dữ liệu XML, sau đó so sánh nó với các bảng quan hệ tiêu chuẩn. Rồi những người sử dụng được yêu cầu viết các XQuery để lấy ra các phần tử XML, lọc dữ liệu dựa vào các giá trị XML, biến đổi đầu ra XML, và sử dụng nhiều mệnh đề khác nhau để lựa chọn dữ liệu chính xác hơn. Hướng dẫn kết thúc bằng một phần về phối hợp XQuery và SQL. Hướng dẫn này là Phần 7 của loạt bài hướng dẫn SQL & XQuery cho IBM® DB2® . (Chú ý: bạn phải cài đặt DB2 9 để làm các bài tập thực hành trong hướng dẫn này.) Trước khi bạn bắt đầu Về loạt bài này Loạt bài hướng dẫn này dạy các chủ đề SQL từ cơ bản đến nâng cao và các chủ đề XQuery cơ bản. Nó cũng chỉ ra cách diễn đạt các câu hỏi nghiệp vụ thường gặp bằng các truy vấn cơ sở dữ liệu sử dụng các câu truy vấn SQL hay các câu truy vấn XQuery. Những người phát triển ứng dụng và những người quản trị cơ sở dữ liệu có thể sử dụng hướng dẫn này để nâng cao các kỹ năng truy vấn cơ sở dữ liệu của mình. Các thành viên tham gia sáng kiến học đường IBM có thể sử dụng loạt hướng dẫn này như một phần trong chương trình giảng dạy cơ sở dữ liệu của họ. Tất cả các ví dụ trong bài này là dựa trên Aroma, một cơ sở dữ liệu mẫu chứa các dữ liệu doanh thu về các sản phẩm cà phê và chè đã bán trong các cửa hàng trên khắp nước Mỹ. Mỗi ví dụ gồm có ba phần:  Một câu hỏi kinh doanh dưới dạng ngôn ngữ thường ngày  Một hoặc nhiều ví dụ truy vấn , được biểu diễn bằng SQL hay Xquery  Một bảng các kết quả trả về từ cơ sở dữ liệu Hướng dẫn này được thiết kế để cho phép các học viên học tập ngôn ngữ SQL và XQuery. Cũng như học bất cứ cái gì khác, việc bổ sung thêm các bài tập thực hành là rất quan trọng. Dữ liệu và các định nghĩa bảng sẽ tạo điều kiện thuận lợi cho các bài tập thực hành này. Đối với các sinh viên sử dụng tài liệu này như một phần của khoá học, hãy nhận từ thầy hướng dẫn của mình các chỉ dẫn để kết nối tới cơ sở dữ liệu Aroma và tìm hiểu mọi sự khác biệt giữa hướng dẫn và cài đặt tại máy cục bộ của mình. Hướng dẫn này được viết cho Express-C 9 DB2 trên nền UNIX®, Linux® và Windows® (trước đây gọi là Viper). Về hướng dẫn này Hướng dẫn này giới thiệu cho người đọc làm quen với pureXML và XQuery. Vị trí duy nhất nơi XML được sử dụng trong cơ sở dữ liệu Aroma là các cột Comments. Cột này được đề cập trong Phần 1 của loạt bài này và đó là trọng tâm của hướng dẫn này, Phần 7. Hướng dẫn này bắt đầu với một tổng quan cơ bản của các đặc trưng và lợi thế của kiểu dữ liệu XML, sau đó so sánh nó với các bảng quan hệ tiêu chuẩn. Hướng dẫn này yêu cầu người đọc viết các XQuery để lấy ra các phần tử XML, lọc dữ liệu dựa vào các giá trị XML, biến đổi đầu ra XML, và sử dụng nhiều mệnh đề khác nhau để lựa chọn dữ liệu chính xác hơn. Hướng dẫn này kết thúc bằng một phần về phối hợp XQuery và SQL và kết hợp sức mạnh của cả hai ngôn ngữ đó. Kết nối tới một cơ sở dữ liệu Bạn cần kết nối tới một cơ sở dữ liệu trước khi có thể sử dụng các câu lệnh SQL để truy vấn hay xử lý dữ liệu. Lệnh CONNECT kết hợp một kết nối cơ sở dữ liệu với một tên người sử dụng. Thông qua người hướng dẫn tìm ra tên cơ sở dữ liệu bạn cần nối tới. Đối với loạt bài này, tên cơ sở dữ liệu là aromadb. Để kết nối tới cơ sở dữ liệu aromadb, gõ lệnh sau đây vào trong bộ xử lý dòng lệnh DB2: CONNECT TO aromadb USER userid USING password Thay thế "userid" và "password" bằng số ID và mật khẩu của người sử dụng mà bạn đã nhận được từ thầy hướng dẫn. Nếu máy không hỏi userid và password thì chỉ cần gõ vào lệnh sau đây: CONNECT TO aromadb Thông điệp sau báo cho bạn biết rằng đã tạo kết nối thành công: Database Connection Information Database server = DB2/NT 9.0.0 SQL authorization ID = USERID Local database alias = AROMADB Khi đã kết nối được, bạn có thể bắt đầu sử dụng cơ sở dữ liệu. Về XML XML là gì? XML  là chuẩn để trao đổi dữ liệu giữa các hệ thống, các nền tảng, các ứng dụng, và các tổ chức khác nhau  độc lập với nhà cung cấp và nền tảng  có độ linh hoạt cao  phù hợp với tổ hợp bất kỳ các dữ liệu có cấu trúc, không có cấu trúc và nửa cấu trúc  dễ dàng mở rộng có thể định nghĩa các thẻ mới khi cần  có thể dễ dàng được biến đổi thành XML "khác" và thậm chí thành các định dạng khác như HTML  có thể dễ dàng được kiểm tra về sự tuân theo một lược đồ Tất cả những điều này có thể thực hiện được thông qua nhiều công cụ và tiêu chuẩn có sẵn, như các bộ phân tách XML, XSLT, và lược đồ XML. Chúng giải phóng các ứng dụng khỏi gánh nặng giải quyết những nét đặc biệt của các định dạng dữ liệu độc quyền sở hữu. Trong một thời đại mà các định dạng thông báo, các biểu mẫu nghiệp vụ và các dịch vụ thường xuyên thay đổi, XML làm giảm chi phí và thời gian cần thiết để duy trì lôgíc ứng dụng một cách tương ứng. Ngoài việc sử dụng XML để trao đổi dữ liệu, các doanh nghiệp đang giữ một số lượng lớn các dữ liệu kinh doanh quan trọng theo định dạng XML. Điều này có nhiều lý do:  Một số doanh nghiệp phải giữ lại các tài liệu XML theo định dạng nguyên bản của chúng để kiểm toán và tuân thủ các quy định, ví dụ các tài liệu tài chính và tư pháp cũng như eForms (biểu mẫu điện tử), đặc biệt trong khu vực chính phủ  XML có thể là một mô hình dữ liệu thích hợp hơn so với một lược đồ quan hệ. Điều này không chỉ đúng cho các ứng dụng hướng nội dung mà còn cho cả một số ứng dụng hướng dữ liệu nhất định, ví dụ, trong các ứng dụng khoa học đời sống, dữ liệu về bản chất có độ phức tạp và có cấu trúc thứ bậc rất cao và lại còn có thể chứa một lượng đáng kể các thông tin không có cấu trúc. Hầu hết dữ liệu về hệ gen hiện nay vẫn còn được lưu giữ theo các định dạng tệp tin phẳng độc quyền sở hữu, nhưng đang có các nỗ lực để thực hiện chuyển chúng sang XML. Các cơ sở dữ liệu quan hệ đang tạo cơ hội hỗ trợ về lưu trữ, xử lý, tìm kiếm, và lấy ra dữ liệu XML. Điều này thường dựa vào việc lưu trữ các tài liệu XML trong các LOB hoặc chia nhỏ và sắp xếp XML vào một lược đồ quan hệ. Các giải pháp này có các hạn chế cố hữu về chức năng và hiệu năng. Nói chung, việc lưu trữ dựa vào LOB cho phép chèn vào và lấy ra toàn bộ tài liệu nhanh chóng nhưng phải chịu một hiệu năng thấp khi thực hiện tìm kiếm và trích ra, do phải phân tách XML trong khi thực hiện truy vấn. Điều này có thể được cải thiện chút ít nếu các chỉ mục được tạo ra khi chèn tài liệu vào cơ sở dữ liệu. Khi việc tạo chỉ mục đã gánh chịu công việc phân tách XML nói ở trên, nó có thể tăng tốc độ các truy vấn để tìm kiếm các tài liệu phù hợp với các điều kiện tìm kiếm đã cho. Tuy vậy, việc trích ra các đoạn tài liệu và việc cập nhật ở mức dưới tài liệu vẫn đòi hỏi việc phân tách XML tốn kém. Trong các phần trước của loạt bài hướng dẫn này, bạn đã học về SQL bao gồm lệnh SELECT và ngôn ngữ định nghĩa dữ liệu (DDL). XML là một cách tổ chức dữ liệu khác và sử dụng XQuery hay XPath để truy vấn dữ liệu. Dữ liệu quan hệ được trình bày như là các hàng và các cột dữ liệu theo định dạng bảng. Dữ liệu XML bao gồm các thẻ và dữ liệu gắn với nhau. Dữ liệu mẫu <Comments> <comment> <comment_ID>5301</comment_ID> <customer_info> <fname>Scott</fname> <lname>Phillips</lname> <email>Scott_Phillips@hotmail.com</email> </customer_info> <feedback> <type>opinion</type> <content>Gold Tips was highly enjoyable!</content> </feedback> <store_rating> <score>5</score> <out_of>5</out_of> </store_rating> <store_response> <required>no</required> </store_response> </comment> <comment> <comment_ID>5302</comment_ID> <customer_info> <fname>Barbara</fname> <lname>Adams</lname> <phone>6138617611</phone> </customer_info> <feedback> <type>question</type> <content>What are the top teas brands?</content> </feedback> <store_rating> <score>4</score> <out_of>5</out_of> </store_rating> <store_response> <required>yes</required> <completed>yes</completed> <action>Please see our "All About Tea" page at www.aroma.com/tea</action> </store_response> </comment> </Comments> Chỉ dựa vào một mình dữ liệu mẫu, bạn có thể xác định địa chỉ email của Scott Phillips không? Đơn giản là dò theo các mức phân cấp được tạo ra bởi các thẻ lồng vào nhau. Vì XML lưu các thẻ và dữ liệu cùng với nhau, nên dữ liệu tự miêu tả và dễ hiểu. DB2 9 DB2 9 là máy chủ dữ liệu lai đầu tiên, mức công nghiệp để quản lý dữ liệu theo cả định dạng quan hệ lẫn định dạng pureXML. DB2 đã có các tính năng cao trong lưu trữ và truy nhập dữ liệu quan hệ dựa trên SQL tiêu chuẩn và tối ưu lưu trữ dữ liệu, ví dụ như các kỹ thuật phân vùng dữ liệu, chỉ mục cao cấp và tối ưu hóa truy vấn. Bây giờ, DB2 đưa vào thêm một cơ chế lưu trữ dữ liệu được tối ưu hóa cho dữ liệu XML bên cạnh cơ chế quan hệ hiện có. Những người phát triển ứng dụng bây giờ có thể lưu giữ dữ liệu XML trực tiếp bên trong một máy chủ DB2 và hưởng các lợi ích về các giao dịch, khả năng phục hồi nhanh dữ liệu cao cấp, truy nhập an toàn, và tất nhiên là khả năng tìm kiếm một số lượng lớn dữ liệu XML khi sử dụng XQuery. Dữ liệu XML so với dữ liệu quan hệ Ba thuộc tính cơ bản của XML làm cho nó khác với mô hình quan hệ:  XML là tự mô tả. Các tài liệu chứa đựng không chỉ dữ liệu, mà còn có siêu dữ liệu cần thiết. Kết quả là, một tài liệu XML có thể được tìm kiếm hay cập nhật không đòi hỏi một định nghĩa biểu đồ tĩnh. Các mô hình quan hệ, mặt khác, đòi hỏi các định nghĩa biểu đồ tĩnh hơn. Tất cả các hàng của một bảng phải có cùng lược đồ.  XML có phân cấp. Các tài liệu không chỉ trình bày thông tin cơ bản, mà còn cả thông tin về mối quan hệ của các mục dữ liệu với nhau dưới dạng phân cấp. Các mô hình quan hệ yêu cầu biểu diễn tất cả thông tin quan hệ hoặc bằng các mối quan hệ khóa chính hoặc khóa ngoài hay bằng cách trình bày thông tin đó trong bảng quan hệ khác.  XML là hướng chuỗi. Thứ tự sắp xếp là quan trọng. Mô hình quan hệ là hướng tập hợp, thứ tự sắp xếp không quan trọng. Không cái nào trong số các điểm khác biệt ấy biểu thị rằng XML là tốt hơn hơn hay xấu hơn so với các mô hình quan hệ thuần túy. Thật ra, XML và mô hình quan hệ là các giải pháp bổ sung nhau. Một vài dữ liệu vốn đã phân cấp, trong khi dữ liệu khác lại có sẵn theo bảng; một số dữ liệu có lược đồ cứng, trong khi dữ liệu khác có lược đồ ít cứng nhắc hơn; một số dữ liệu cần tuân theo một thứ tự định trước trong khi dữ liệu khác lại không như vậy. Khi nào sử dụng XML Việc trình bày dữ liệu XML có ích trong các hoàn cảnh sau:  Khi lược đồ hay thay đổi. Nếu lược đồ của dữ liệu thường thay đổi, thì việc trình bày dữ liệu dưới dạng quan hệ có thể khá phiền hà do các chi phí và khó khăn khi thay đổi lược đồ quan hệ đi kèm. Bản chất tự mô tả của XML làm cho sự thay đổi lược đồ đơn giản hơn.  Khi dữ liệu vốn đã phân cấp. Một vài dữ liệu có sẵn theo bảng và một mô hình quan hệ làm cho nó có ý nghĩa hơn. Dữ liệu khác có phân cấp tự nhiên, và XML thường trình bày nó tốt nhất.  Khi dữ liệu trình bày các đối tượng nghiệp vụ trong đó các bộ phận hợp thành không còn có ý nghĩa nữa khi bị loại bỏ khỏi bối cảnh của chúng. Ví dụ, xem xét mối quan hệ thông thường giữa một nhân viên và số điện thoại của người đó, trong đó một nhân viên có thể có nhiều số điện thoại: một cho văn phòng, một cho Fax, một cho nhà, và một cho di động. Nếu mẫu sử dùng thường xuyên nhất là để lấy ra các số điện thoại trong bối cảnh của một nhân viên, thì chằng có ý nghĩa gì khi chuẩn hóa dữ liệu và đưa vào hẳn một bảng để theo dõi vô số các số điện thoại liên quan đến một nhân viên. Một sự lựa chọn tốt hơn có thể là giữ các số điện thoại ấy trong bảng nhân viên và trình bày chúng bằng XML.  Khi các ứng dụng có thuộc tính thưa. Một số ứng dụng có một số lượng lớn các thuộc tính có khả năng nhưng hầu hết các thuộc tính đó xuất hiện thưa thớt hay vắng mặt với bất kỳ mục dữ liệu đã cho nào. Một ví dụ kinh điển là một tài liệu danh mục hàng hóa của thương gia; số lượng các thuộc tính khác nhau để theo dõi một mục của tài liệu đã cho là rất lớn, bao gồm kích thước, màu, sắc, kiểu dệt và các yêu cầu về năng lực và một danh sách gần như vô tận về các khía cạnh khác. Đối với đối tượng đã cho bất kỳ, chỉ một tập con của các thuộc tính này có liên quan; kiểu dệt của một áo len làm cho nó có nghĩa nhưng kiểu dệt của một máy cắt cỏ thì chẳng có nghĩa gì. Việc sử dụng một bảng quan hệ để mô tả các đặc tính của đối tượng có thể chi phí đắt và quá phức tạp. Việc trình bày thông tin thuộc tính mô tả ấy như các dữ liệu XML cho phép trình bày tự nhiên hơn cũng như việc tìm kiếm ít phức tạp và ít tốn kém hơn.  Khi dữ liệu khối lượng nhỏ nhưng có cấu trúc cao. Trong nhiều ứng dụng, thông tin có cấu trúc là điều quyết định đối với ứng dụng nhưng nó tồn tại với số lượng rất nhỏ. Dù cho thông tin đó có thể được trình bày theo mô hình quan hệ bình thường, cách tiếp cận này có thể dẫn tới các lược đồ quan hệ cồng kềnh. Việc sử dụng một cột XML với nhiều khung nhìn có thể làm giảm đáng kể số các đối tượng được quản lý trong một cơ sở dữ liệu, và như vậy giảm bớt chi phí về quyền sở hữu. Tạo ra một cơ sở dữ liệu có hỗ trợ XML Trong Phần 1 của loạt tài liệu này, bạn đã tạo ra cơ sở dữ liệu Aroma của mình với một tệp tin batch. Vì bạn có thể muốn tạo ra các cơ sở dữ liệu riêng của mình trong tương lai, phần này hướng dẫn bạn cách tạo ra một cơ sở dữ liệu để hỗ trợ các đặc tính XML. Tạo một cơ sở dữ liệu với Trung tâm điều khiển Trong ứng dụng Trung tâm điều khiển DB2, nhấp chuột phải vào vào thư mục All Databases . ChọnCreate Databse -> Standard. Cửa sổ Create Database Wizard sẽ bật lên. Điền vào tên cơ sở dữ liệu của bạn và chọnt Enable database for XML. [...]... trong SQL nó được dùng để duyệt qua một danh sách các mục và trả về một vài thứ được tính toán từ mỗi mục tùy trường hợp Mặt khác, một biểu thức đường dẫn, dẫn hướng thông qua hệ phân cấp của các phần tử XML và trả về các phần tử tìm thấy ở cuối đường dẫn Giống như một biểu thức SELECT-FROM-WHERE trong SQL, biểu thức XQuery FLWOR có thể chứa vài mệnh đề bắt đầu bằng các từ khóa nhất định Các từ khóa... thức XQuery vào trong SQL, bạn không cần mở đầu chúng bằng từ khóa xquery Khi chạy như một ngôn ngữ mức trên nhất, XQuery cần có một nguồn dữ liệu vào Một cách để một XQuery có thể nhận được dữ liệu vào là gọi một hàm có tên là db2-fn:xmlcolumn có một tham số xác định tên bảng và tên cột của một cột XML trong một bảng DB2 Hàm db2-fn:xmlcolumn trả về chuỗi các tài liệu XML được lưu giữ trong cột đã cho. .. bước dẫn hướng xuống dưới trong hệ phân cấp XML để tìm ra phần tử con của các phần tử do các bước trước trả về Mỗi bước trong một biểu thức đường dẫn có thể cũng chứa một thuộc tính để lọc các phần tử do bước đó trả về, chỉ giữ lại các phần tử thỏa mãn một điều kiện nào đó Ví dụ, đối với dữ liệu mẫu cho trong phần trước, giả thiết rằng biến $comments gắn với một danh sách các tài liệu XML chứa các phần. .. XML Đối với truy vấn đường dẫn, bước đầu tiên gọi hàm db2-fn:xmlcolumn để nhận được một danh sách các tài liệu XML từ cột Comments của bảng aroma.sales Bước thứ hai trả về tất cả các phần tử trong các tài liệu này, bước thứ ba trả về các phần tử > nằm trong các phần tử này, bước thứ tư trả về các phần tử nằm trong các phần tử và bước thứ năm trả về. .. liệu XML bỏ qua dữ liệu thiếu hoặc để thể hiện các giá trị thiếu không được biết hoặc không được biết Trả về các chuỗi dữ liệu XML Trả về các tập hợp kết quả của các kiểu dữ liệu SQL khác nhau Hai loại biểu thức XQuery Hướng dẫn này tập trung vào hai loại biểu thức XQuery quan trọng: các biểu thức "FLWOR" và các biểu thức đường dẫn Biểu thức FLWOR giống như một biểu thức SELECT-FROM-WHERE trong SQL. .. Sencha Về các truy vấn Mệnh đề where của XQuery cũng tương tự như mệnh đề WHERE của SQL Trong truy vấn FLWOR, nó lọc các kết quả dựa vào giá trị của phần tử type (kiểu góp ý) trong các tài liệu XML Mệnh đề for gắn biến $y lần lượt với mỗi phản hồi Mệnh đề where có chứa một biểu thức đường dẫn nhỏ để dẫn hướng từ mỗi phản hồi đến phần tử type nằm trong nó Mệnh đề where là đúng (và nội dung được trả về) ... danh sách trên một dòng Về truy vấn Một mặt rất mạnh của XQuery là khả năng biến đổi đầu ra XML từ một dạng XML này sang dạng khác Ví dụ bạn có thể sử dụng XQuery để lấy ra tất cả hay một phần tài liệu XML đã lưu và biến đổi đầu ra thành HTML để dễ dàng hiển thị trong một trình duyệt Web Ví dụ truy vấn lấy ra và biến đổi các câu trả lời của cửa hàng thành các phần tử XML là một phần của danh sách HTML... Các sự khác nhau giữa các mô hình dữ liệu này dẫn đến một số khác biệt cơ bản trong các ngôn ngữ truy vấn riêng tương ứng của chúng Bảng ở dưới liệt kê một vài ví dụ XQuery SQL Hỗ trợ các biểu thức đường dẫn để cho Không hỗ trợ các biểu phép các lập trình viên dẫn hướng thức đường dẫn thông qua cấu trúc phân cấp của XML Hỗ trợ cả hai dữ liệu có định kiểu và không định kiểu Luôn luôn được định nghĩa... nước: Để giải phóng bộ nhớ cho trình soạn thảo lệnh, nhấp chuột phải vào trong vùng kết quả và chọn Clear Results (Xoá các kết quả) Về các truy vấn Để thực hiện một XQuery trực tiếp trên DB2 9, bạn phải bắt đầu truy vấn với từ khóa xquery Từ khóa này chỉ dẫn cho DB2 triệu gọi bộ phân tách XQuery của nó để xử lý yêu cầu của bạn Chú ý: Bạn chỉ cần làm việc này nếu bạn đang sử dụng XQuery như một ngôn ngữ... liệu XML bằng ngôn ngữ truy vấn riêng của nó có tên là XQuery XQuery khác với SQL về một số phương diện then chốt, phần lớn là do các ngôn ngữ này được thiết kế để làm việc với các mô hình dữ liệu khác nhau, mà các mô hình này có các đặc tính khác nhau Các tài liệu XML có chứa các mức phân cấp và sở hữu một thứ tự có sẵn Các cấu trúc dữ liệu dạng bảng được các DBMS dựa trên SQL hỗ trợ là phẳng và dựa . <store_rating> <score>5</score> <out_of>5</out_of> </store_rating> <store_response> <required>no</required> </store_response> </comment>. </comment> <comment> <comment_ID>5302</comment_ID> <customer_info> <fname>Barbara</fname> <lname>Adams</lname> <phone>6138617611</phone>. <score>4</score> <out_of>5</out_of> </store_rating> <store_response> <required>yes</required> <completed>yes</completed>

Ngày đăng: 07/08/2014, 09:23

Xem thêm: Hướng dẫn SQL & XQuery cho IBM DB2, Phần 7: Giới thiệu về XML và XQuery ppt

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w