XML là từ viết tắt bởi eXtensible Markup Language – tạm dịch là Ngôn ngữ
đánh dấu mở rộng” đƣợc Tổ chức W3C (The World Wide Web Consortium – là một
cộng đồng quốc tế gồm các tổ chức, các thành viên phát triển các chuẩn về web, do người sáng lập web là Tim Berners-Lee và CEO Jeffrey Jaffe lãnh đạo) đề nghị. XML là định dạng văn bản linh hoạt, đơn giản (đƣợc phát triển tiếp từ SGML - ISO 8879, khởi đầu để đáp ứng các thách thức trong việc xuất bản các tài liệu điện tử có quy mô lớn), XML đóng vai trò ngày càng tăng trong việc trao đổi các dữ liệu khác nhau trên mạng web. XML nhằm đơn giản hóa việc chia sẻ dữ liệu giữa các hệ thống khác nhau, đặc biệt là các hệ thống đƣợc kết nối với Internet.
XML là định dạng dựa trên văn bản (text based) để biểu diễn thông tin có cấu trúc: tài liệu, dữ liệu, cấu hình, sách, giao dịch, hóa đơn, và các thông tin khác. Các thông tin đều thể hiện dƣới dạng văn bản và đƣợc sử dụng cùng các thẻ đánh dấu (mark up) để thông tin trở thành có cấu trúc. Đơn vị cơ sở của XML là các ký tự theo định nghĩa của Bộ Ký tự toàn cầu (Universal Character Set). Các ký tự đƣợc kết hợp theo các tổ hợp chuỗi hợp lệ để tạo thành một tài liệu XML. Tài liệu này gồm một hoặc nhiều thực thể, mỗi thực thể thƣờng là một phần nào đó của các ký tự thuộc tài
liệu, đƣợc mã hóa dƣới dạng một chuỗi các bit và lƣu trữ trong một tệp văn bản (text file). Dƣới đây là một ví dụ đơn giản về XML.
<part number="1976">
<name>Windscreen Wiper</name> <description>The Windscreen wiper
automatically removes rain
from your windscreen, if it
should happen to splash there.
It has a rubber <ref part="1977">blade</ref>
which can be ordered separately
if you need to replace it.
</description> </part>
Nhƣ ở trên đã trình bày, XML đƣợc phát triển tiếp từ SGML - ISO 8879, một ứng dụng SGML đƣợc biết đến nhiều nhất trong thực tế và đối với web là ngôn ngữ đánh dấu siêu văn bản HTML (HyperText Markup Language). Các trang web là các tài liệu tài liệu HTML hƣớng đến để hiển thị đƣợc trong bất cứ ứng dụng nào có khả năng hiểu đƣợc HTML (hay còn gọi là các trình duyệt web – web browser).
HTML đƣợc dùng để trình bày, hiển thị dữ liệu còn XML đƣợc thiết kế để trao đổi dữ liệu. HTML đƣợc thiết kế cho một ứng dụng cụ thể để mang thông tin đến ngƣời dùng (thƣờng thì ở dạng trực quan thông qua trình duyệt); XML đƣợc thiết kế không cho một ứng dụng cụ thể nào, nó đƣợc thiết kế cho bất cứ mục đích sử dụng nào bạn cần. Vì thế, có thể tạo ra các tài liệu XML để mô tả bất cứ thông tin gì bạn muốn, nhƣng trƣớc khi tài liệu XML đó trở nên hữu dụng thì phải có các ứng dụng hiểu nó.
XML là nền tảng để tạo các ngôn ngữ khác dựa trên XML nhƣ RDF, RSS, XHTML... Có thể thấy các ứng dụng khác nhau của XML nhƣ:
MathML: Ứng dụng của XML trong toán học
WML: Ứng dụng của XML trong viễn thông-di động ebXML: Ứng dụng của XML trong thƣơng mại điện tử SVG: Ứng dụng của XML trong lĩnh vực đồ họa