Cấu trúc của file XML và tài l iu XML

Một phần của tài liệu Xây dựng ứng dụng tổng hợp tin tức từ các trang tin và chương trình đọc tin trên thiết bị di động Android (Trang 26)

3.1.1. Lịch sử ra đời chuẩn XML, XML là gì?

Trước khi XML ra đời đã có nhiều kiểu định dạng văn bản điện tử như GML (Generalized Markup Language) của IBM, SGML (Standard Generalized Markup Language) của ANSI vào năm 1980 và HTML (Hyper Text Markup Language). Tuy nhiên các phương pháp này có nhiều nhược điểm như GML và SGML không thích hợp để truyền dữ liệu trên Web, HTML chủ yếu chú trọng vào việc làm cách nào hiển thị thông tin hơn là chú trọng nội dung truyền tải. Chính vì vậy XML (eXtensible Markup Language - Ngôn ngữ Đánh dấu Mở rộng) được tạo ra để giải quyết các nhược điểm trên.

Công nghệ XML ra đời là kết quả của các nghiên cứu về dạng biểu diễn thông tin khi cần trao đổi giữa các hệ thống tin học.

Dạng biểu diễn cần thỏa mãn các yêu cầu sau:  Cho phép trao đổi trên phạm vi rộng (Internet).  Dễ dàng trong việc kết xuất và tiếp nhận khi trao đổi.

 Tuân theo một định chuẩn chung được chấp nhận và hỗ trợ của nhiều môi trường phát triển phần mềm.

XML là ngôn ngữ đánh dấu chuẩn do W3C đề nghị, để tạo ra các ngôn ngữ đánh dấu khác. Đây là một tập con đơn giản của SGML, có khả năng mô tả nhiều loại dữ liệu khác nhau. Mục đích chính của XML là đơn giản hóa việc chia sẻ dữ liệu giữa các hệ thống khác nhau, đặc biệt là các hệ thống được kết nối với Internet. Các ngôn ngữ dựa trên XML (ví dụ: RDF, RSS, MathML, XHTML, SVG, GML và cXML) được định nghĩa theo cách thông thường, cho phép các chương trình sửa đổi và kiểm tra hợp lệ bằng các ngôn ngữ này mà không cần có hiểu biết trước về hình thức của chúng.

3.1.2. Cấu trúc của file XML và tài li u XML

17

Hình 3.1. Cấu trúc của một tài liệu XML

Document Prolog: lưu trữ metadata của XML gồm 2 phần: khai báo XML

và khai báo kiểu dữ liệu trong XML. Phần khai báo XML (XML declararion) bao gồm các thông tin về phiên bản (version) của XML, charset, encoding…. Phần khai báo kiểu dữ liệu trong XML (DTD) dùng để khai báo cấu trúc của các thẻ dùng trong XML.

Root element hay còn gọi là Document Element: chứa tất cả các phần tử và

nội dung của nó. Một phần tử của XML phải có thẻ mở và thẻ đóng.

Một phần của tài liệu Xây dựng ứng dụng tổng hợp tin tức từ các trang tin và chương trình đọc tin trên thiết bị di động Android (Trang 26)