III. Bố cục luận văn
1.2.4. Cấu trúc một tài liệu XML hợp khuôn dạng
Một tài liệu XML được coi là một tài liệu hợp khuôn dạng nếu tuân theo các quy tắc sau[8]:
- Các khai báo XML phải được đặt ở dòng đầu tiên của tài liệu. Khai
báo chỉ thị xử lý XML đầu tiên không bắt buộc, tuy nhiên nếu sử dụng thì phải đặt chúng ở ngay dòng đầu tiên của tài liệu. Nếu không theo yêu cầu này thì tài liệu XML được xem là không hợp lệ.
- Một tài liệu XML chỉ có duy nhất một phần tử gốc, các phần tử khác
nếu có phải là con của phần tử gốc.
- Mọi phần tử XML khác rỗng phải bao gồm đầy đủ thẻ đóng và thẻ mở. Trong tài liệu XML hợp khuôn dạng, mọi thẻ mở (ngoại trừ thẻ rỗng) phải có thẻ đóng tương ứng. Nếu bộ phân tích XML phát hiện một phần tử bị thiếu thẻ đóng hay thẻ mở thì quá trình phân tích, biên dịch tài liệu sẽ bị kết thúc.
- Đóng phần tử rỗng với chuỗi />. Phần tử rỗng là phần tử chỉ có một thẻ. Dấu kết của phần tử rỗng phải là /> nếu không tài liệu sẽ được coi là không hợp khuôn dạng.
- Mọi phần tử trong tài liệu XML khác phần tử gốc đều phải nằm giữa
- Các phần tử lồng nhau phải có thẻ đóng, mở tương ứng đúng vị trí.
- Chỉ nên sử dụng 5 tham chiếu thực thể được định nghĩa trước trong
XML. Trong ngôn ngữ định dạng XML, một số kí tự nhận dạng đặc biệt như <, >, „, “, và & không thể sử dụng trong tài liệu theo cách thể hiện dữ liệu thông thường. Muốn sử những kí hiệu này phải dùng tham chiếu thực thể đã được XML định nghĩa trước như sau:
Bảng 1. 1: Bảng tham chiếu thực thể trong XML
Tham chiếu thực thể Ý nghĩa tƣơng ứng
& &
< <
> >
' „
" “
Ví dụ : Giá trị thời gian là 50‟ 11‟‟
<date time="50'11""/>
- Sử dụng tên thuộc tính là duy nhất. Các thẻ trong thuộc tính không được đặt cùng tên.
Ví dụ : Tài liệu sau vi phạm ràng buộc này
<message text = "Hi there" text = "Hello" >
- Tất cả các giá trị của thuộc tính đều phải nằm trong cặp dấu nháy kép (“) hoặc nháy đơn („).
- Chỉ nên sử dụng kí tự < và & đối với thẻ mở và các thực thể.