Đặc tả nội dung cấu trúc tài liệu XML Đặc tả nội dung cấu trúc tài liệu XML Bởi: Nguyễn Tiến Huy Mở đầu Nội dung tài liệu XML Khái niệm nội dung tài liệu Xml Nội dung tài liệu XML bao gồm phần Nội dung Hệ thống thẻ đánh dấu ( có hay nội dung ) tương ứng với thông tin cần biểu diễn Nội dung phụ Hệ thống thẻ khác có ý nghĩa bổ sung, tăng cường số thông tin tài liệu XML Các thẻ có tác dụng giúp cho việc sử dụng, xử lý tài liệu XML tốt số trường hợp địn Các thẻ bên nội dung phụ bao gồm loại sau - Thẻ khai báo tham số - Thẻ thị xử lý - Thẻ ghi - Thẻ CDATA - Thẻ khai báo cấu trúc - Thẻ khai báo thực thể 1/8 Đặc tả nội dung cấu trúc tài liệu XML Các thẻ khai báo tham số, thẻ thị xử lý,thẻ ghi thẻ CDATA có ý nghĩa sử dụng đơn giản đuợc diễn giải chi tiết phần sau Thẻ khai báo cấu trúc liên quan đến cấu trúc tài liệu XML với nhiều khái niệm khác Thẻ đuợc trình bày chi tiết phần “Đặc tả cấu trúc với DTD” Thẻ khai báo thực thể liên quan đến nhiều kỹ thuật khác có thẻ áp dụng tài liệu XML Thẻ trình bày chi tiết phần “Kỹ thuật đặc tả nội dung tài liệu XML” * Thẻ khai báo tham số Thẻ khai báo tham số Thẻ khai báo tham số cho phép mô tả thêm số thông tin chung (tham số ) tài liệu XML thông tin biểu diễn nội dung Dạng khai báo chung sau Ten_1, Ten_2, … tên tham số Gia_tri_1, Gia_tri_2, … giá trị tương ứng Cho đến có tham số đuợc dùng version, encoding, standalone Tham số version bắt buộc phải có tham số khác đuợc sử dụng Tham số version : Khai báo phiên định chuẩn XML đuợc sử dụng Tài liệu XML thuộc đỉnh chuẩn 1.0 Tham số encoding : Khai báo cách mã hóa ký tự tài liệu Tài liệu XML sử dụng cách mã hóa Unicode ký hiệu utf-8 Tài liệu XML sử dụng cách mã hóa Unicode ký hiệu utf-16 Tham số standalone : Khai báo liên kết tài liệu XML tài liệu khác Tham số có giá trị hợp lệ “yes” , “no” Giá trị định sẳn “no” 2/8 Đặc tả nội dung cấu trúc tài liệu XML Tài liệu XML có liên kết với tài liệu khác Tài liệu XML liên kết với tài liệu khác * Thẻ thị xử lý Thẻ thị xử lý Ý nghĩa chung thẻ thị xử lý cho phép mô tả thêm số thông tin ( liên quan xử lý ) tài liệu XML có ý nghĩa riêng với công cụ xử lý Đây phương pháp cho phép mở rộng, bổ sung xử lý riêng vào lớp tài liệu XML thuộc hệ thống phân lớp Dạng khai báo chung sau Bo_xu_ly ký hiệu xử lý tiến hành số xử lý tài liệu XML Du_lieu thông tin gởi đến Bo_xu_ly Stylesheet type="text/css" href="Dinh_dang.css"?> Là thẻ thị cần xử lý định dạng thể tài liệu XML với “chương trình định dạng ” theo ngôn ngữ css đuợc lưu trữ bên tập tin Dinh_dang.css Thẻ có ý nghĩa với số trình duyệt Web ỊE ( phiên 50 sau ), Netscape ( phiên 6.0 sau) * Thẻ ghi Thẻ ghi Thẻ ghi cho phép bổ sung thông tin ghi có ý nghĩa người hoàn toàn ý nghĩa với hệ thống xử lý tài liệu XML Dạng khai báo chung sau < Nội dung ghi > * Thẻ CDATA 3/8 Đặc tả nội dung cấu trúc tài liệu XML Thẻ CDATA Thẻ CDATA có ý nghĩa yêu cầu phân tích tài liệu XML bỏ qua không phân tích vào nội dung bên thẻ Tác dụng thẻ cho phép sử dụng trực tiếp bên thẻ số ký hiệu không đuợc phép sử dụng bên ( ví dụ ký tự “” , …) Dạng khai báo chung sau Nội dung ]]> Cấu trúc tài liệu XML Khái niệm cấu trúc tài liệu XML - Chỉ tương ứng cấu trúc nội dung - Cách thức tổ chức, xếp thẻ (có hay nội dung) nội dung Khái niệm đặc tả cấu trúc tài liệu XML - Mô tả ngắn gọn, xác cấu trúc tài liệu XML - Mô tả ngắn gọn, xác cách thức tổ chức, xếp thẻ * Ngôn ngữ đặc tả cấu trúc Có nhiều ngôn ngữ đặc tả đuợc đề xuất để mô tả cấu trúc tài liệu Xml DTD, XML Schema, XMl- Data, Schematron , RELAX NG, v,v Trong số có ngôn ngữ thông dụng DTD, XML Schema Đặc điểm DTD - Ra đời sớm - Cho phép mô tả văn có cấu trúc - Đơn giản, dễ học sử dụng - Chỉ cho phép đặc tả số “kiểu liệu đơn giản” nội dung tài liệu XML Đặc điểm XML Schema 4/8 Đặc tả nội dung cấu trúc tài liệu XML - Đuợc đề xuất W3C - Chỉ áp dụng cho tài liệu XML - Khó học sử dụng so với DTD - Cho phép đặc tả chi tiết “kiểu liệu” đuợc sử dụng nội dung tài liệu XML Với tài liệu Xml Đặc tả với DTD Tu_so : Số nguyên // >0 > Mau_so : Số nguyên // >0 > ]> Đặc tả với Xml Schema 5/8 Đặc tả nội dung cấu trúc tài liệu XML targetNamespace= xmlns:xs= * Sử dụng đặc tả cấu trúc Ý nghĩa đặc tả cấu trúc Có trường hợp cần thiết sử dụng tài liệu đặc tả cấu trúc - Trường hợp : Sử dụng cho việc trao đổi thông tin người – người - Trường hợp : Sử dụng cho việc trao đổi thông tin người – hệ thống xử lý 6/8 Đặc tả nội dung cấu trúc tài liệu XML Trường hợp trường hợp thông dụng nhất, với trường hợp tài liệu đặc tả cấu trúc - Được sử dụng phương tiện giao tiếp chuyên viên tin học có liên quan đến tài liệu XML tương ứng - Có thể đuợc lưu trữ theo định dạng thích hợp cho việc sử dụng ( trình bày, xem báo cáo , v.v ) Có thể sử dụng tài liệu đặc tả cấu trúc ( DTD/ XML Schema ) - Hồ sơ thiết kế phần mềm hay giáo trình ( theo dạng tập tin Microsoft Word) - Tài liệu mô tả cách thức trao đổi thông tin chuyên viên tin xây dựng phần mềm tập phân số -Đây trường hợp dễ sử dụng không yêu cầu thật chặt chẽ cú pháp Nếu tài liệu đặc tả cấu trúc có sai sót cú pháp người sử dụng hiểu hay phát trao đổi lại với người tạo lập -Với trường hợp này, tùy vào trường hợp cụ thể với số qui ước riêng mang tính cục nhóm người đó, mở rộng ngôn ngữ đặc tả cấu trúc có để bổ sung thêm từ vựng, cú pháp ngữ nghĩa riêng Trường hợp đuợc sử dụng - Có hệ thống xử lý (phần mềm, hàm , đối tượng thư viện ) “hiểu” thực xử lý tương ứng với tài liệu đặc tả cấu trúc (xử lý thông dụng kiểm tra tài liệu XML có theo cấu trúc đuợc mô tả tài liệu đặc tả cấu trúc hay không.) -Thật có nhu cấu cần đến xử lý hệ thống xử lý nói - Có thể sử dụng tài liệu đặc tả cấu trúc ( DTD/ XML Schema ) với phân tích XmlTextReader VB.NET để yêu cầu phân tích kiểm tra tính hợp lệ tài liệu XML Tuy nhiên, cách tổng quát xử lý kiểm tra không thật cần thiết !!! - Với ứng dụng thương mại điện tử việc trao đổi tài liệu XML liên quan nghiệp vụ thương mại ( thông tin mặt hàng, đơn đặt hàng , phiếu giao hàng, v.v…) đặt nhu cầu thật việc kiểm tra tài liệu XML có theo cấu trúc mong đợi hay không Với ngữ cảnh thiết phải tạo lập sử dụng phân tích cú pháp thích hợp để tiến hành kiểm tra tính hợp lệ xử lý tương ứng -Trường hợp yêu cầu tài liệu đặc tả cấu trúc phải tuân thủ hoàn toàn theo ngôn ngữ đặc tả cấu trúc tương ứng, sai sót cú pháp không đuợc phân tích cú pháp chấp nhận 7/8 Đặc tả nội dung cấu trúc tài liệu XML -Cần cân nhắc sử dụng tài liệu đặc tả cấu trúc trường hợp đặc điểm quan trọng tiếp cận XML “Cho phép đặc tả nội dung mà không thiết đặc tả cấu trúc “ 8/8 ... Cấu trúc tài liệu XML Khái niệm cấu trúc tài liệu XML - Chỉ tương ứng cấu trúc nội dung - Cách thức tổ chức, xếp thẻ (có hay nội dung) nội dung Khái niệm đặc tả cấu trúc tài liệu XML - Mô tả ngắn... trị định sẳn “no” 2/8 Đặc tả nội dung cấu trúc tài liệu XML Tài liệu XML có liên kết với tài liệu khác < ?xml standalone="yes" ?> Tài liệu XML liên kết với tài liệu khác < ?xml version="1.0" standalone="no"... xác cấu trúc tài liệu XML - Mô tả ngắn gọn, xác cách thức tổ chức, xếp thẻ * Ngôn ngữ đặc tả cấu trúc Có nhiều ngôn ngữ đặc tả đuợc đề xuất để mô tả cấu trúc tài liệu Xml DTD, XML Schema, XMl-