Cấu trúc tài liệu XML

Một phần của tài liệu Biễu diễn dữ liệu mờ bằng ngôn ngữ XML và ứng dụng (Trang 36 - 37)

1.4.2.1. Tài liệu XML

Một tài liệu HTML cĩ thể tồn tại một thẻ khơng đúng quy định (trình biên dịch sẽ bỏ qua những thẻ này). Tuy nhiên, với một tài liệu XML thì điều này khơng thể xảy ra. Khi xây dựng một tài liệu XML, nĩ phải tuân thủ theo một số quy luật nào đĩ. Những tài liệu XML tuân thủ đúng những quy luật này được gọi là well-formed (tạm dịch là định dạng đúng). Với một tài liệu khơng phải là well-formed, internet Explorer sẽ thơng báo lỗi khi nạp tài liệu này.

Một tài liệu XML well – formed chưa chắc là một tài liệu hợp lệ. Một tài liệu XML được xem là hợp lệ nếu nĩ đảm bảo những quy tắc đặc tả trong tài liệu Document Type Definition (DTD) hay giản đồ (schema). Một DTD hay schema sẽ định nghĩa mọi thứ từ cấu trúc dữ liệu tới kiểu dữ liệu, những thuộc tính được yêu cầu và những ràng buộc về thành phần và thuộc tính được kết hợp trong tài liệu. Phương thức kiểm tra tài liệu này thường được sử dụng trong giao tiếp giữa ứng dụng - ứng dụng, đảm bảo dữ liệu trao đổi hợp lệ tránh dẫn tới những ảnh hưởng của dữ liệu khơng hợp lệ trên tồn hệ thống.

Tài liệu XML cĩ thể được viết bằng các trình soạn thảo thơng thường như: Notepad,…hay các trình soạn thảo chuyên dụng của XML như: XML Notepad, XML Writer, XML Spy…

1.4.2.2. Cấu trúc của tài liệu XML

Tài liệu XML chỉ chứa đựng dữ liệu và cách lưu trữ dữ liệu mà khơng hề đề cập tới cách thức trình bày dữ liệu. Một tài liệu XML sẽ chứa những đặc tả về cấu trúc dữ liệu. Mỗi cấu trúc gồm nhiều phần tử (element), mỗi thành phần được bắt đầu với một thẻ bắt đầu (Start – tag) và kết thúc với một thẻ kết thúc (End – tag). Giữa Start – tag và End – tag là nội dung của phần tử này. Nội dung cĩ thể bao gồm dữ liệu văn bản hay cĩ thể là một phần tử khác.

Một tài liệu XML cĩ thể được chia thành 2 thành phần chính, mỗi thành phần cĩ thể cĩ các thành phần theo quy định khác nhau.

Phần khởi đầu (PROLOG) chứa các khai báo trong tài liệu XML như khai báo phiên bản sử dụng của XML, cách thức mã hĩa dữ liệu, chỉ thị xử lý, định nghĩa kiểu tư liệu cho tài liệu DTD, các chú thích, các khoảng trắng chuẩn XML khơng

bắt buộc phải khai báo phần mở đầu của XML. Tuy nhiên W3C khuyến khích chúng ta nên sử dụng phần khai báo này, ít nhất cũng là phần khai báo phiên bản sử dụng XML.

Phần thân (BODY) của tài liệu chứ nội dung của dữ liệu bao gồm một hay nhiều thành phần (bắt buộc phải chứa ít nhất một thành phần), những thành phần này bao gồm các phần tử (element). Mỗi phần tử bao gồm một cặp thẻ (thẻ bắt đầu và thẻ kết thúc). Phần tử đầu tiên của tài liệu được coi là phần tử gốc (root element). Tất cả các tài liệu XML được gọi là hợp khuơn dạng nếu chứa đựng duy nhất một phần tử gốc. Phần tử gốc chứa đựng tất cả các phần tư và các cặp thẻ khác trong tài liệu.

Một phần của tài liệu Biễu diễn dữ liệu mờ bằng ngôn ngữ XML và ứng dụng (Trang 36 - 37)

Tải bản đầy đủ (PDF)

(75 trang)