* Lược đồ DTD và XML: XML có 2 phƣơng pháp cơ bản để định nghĩa về
cấu trúc tài liệu XML: Định nghĩa kiểu tài liệu (DTD) và lƣợc đồ XML. DTD sử dụng mẫu nội dung đặc trƣng cho từng phần tử. Miêu tả nội dung là một phần của phần tử, đƣợc giới thiệu trong DTD và chỉ định có trật tự số lƣợng của các phần tử mà nó đã đƣợc chứa đựng bên trong phần tử đƣợc giới thiệu; Đó là, DTD sử dụng đặc tính đặc trƣng cho từng phần tử tƣơng tự nhƣ mối quan hệ giữa các phần tử.
Do DTD không hỗ trợ mô hình thông tin phức tạp, nên lƣợc đồ XML đã đƣợc đƣa ra. Về thực chất lƣợc đồ XML là mở rộng các khả năng của XML DTDs.
Lƣợc đồ XML đƣợc xây dựng dựa trên XML, do vậy nó có thể phân tích và tính toán một cách chính xác các kiểu tƣơng tự nhau, nhƣ tài liệu XML thông qua chuẩn API. Lƣợc đồ XML hỗ trợ đƣợc nhiều kiểu tài liệu, trong khi DTD thì chỉ đƣa ra tất cả các chuỗi hoặc các chuỗi liệt kê đƣợc. Lƣợc đồ XML còn cho phép kế thừa các quan hệ giữa các phần tử và không gian tên.
* XSL và XSLT: XSL là ngôn ngữ đánh dấu định nghĩa minh hoạ các
phƣơng pháp để hiển thị tài liệu XML trên Web. Tài liệu XML chỉ miêu tả cấu trúc của nội dung. XSL chỉ ra cách hiển thị của một lớp tài liệu XML, thông qua miêu tả các trƣờng hợp của một lớp đƣợc thay đổi thành tài liệu XML; Đƣợc sử dụng để định dạng từ vựng. Nghĩa là, XSL cho phép XML tạo thành nội dung từ cách hiển thị. XSL chứa đựng 2 phần: Một là ngôn ngữ chuyển đổi tài liệu XML và một là từ vựng XML cho chỉ định dấu hiệu định dạng. Kiểu kỹ thuật bảng có thể chuyển đổi tài liệu là XLST (XSL Transformation). Nó là một trƣờng hợp con của kỹ thuật XSL, nó hỗ trợ đầy đủ việc chuyển đổi của tài liệu XML sang các dạng định dạng khác, giống nhƣ HTML hoặc các kiểu tài liệu XML khác. Lý do để đƣa ra dạng khác XSLT từ XML là do tài liệu XML có thể dễ dàng hiển thị định dạng cho ngƣời sử dụng bằng việc chuyển đổi tài liệu XML mà không cần ngôn ngữ định dạng.
* DOM và SAX: DOM là một ngôn ngữ nền tảng và độc lập với giao diện, nó cho phép chƣơng trình và kịch bản scrips cập nhật và truy cập động nội dung, cấu trúc và kiểu dữ liệu. DOM còn là một API kiểm tra tính hợp lệ HTML và hợp khuôn dạng tài liệu XML. Một API đơn giản cho XML là một xử lý sự kiện và chuỗi truy cập tài liệu XML. DOM phân tích tài liệu XML và tạo cây DOM, giữ cây thực thể trong bộ nhớ tại cùng một thời điểm.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
SAX đọc tài liệu XML thành chuỗi theo thứ tự và tạo ra sự kiện cho từng phần tử cụ thể. Vì vậy, nếu ứng dụng gọi chuỗi truy cập đến tài liệu XML thì SAX có thể thực hiện nhanh hơn các phƣơng thức khác mà không đòi hỏi nhiều liên quan đến hệ thống. Bất cứ khi nào, một sự kiện đƣợc tạo ra, phƣơng thức liên quan tới sự kiện đó sẽ đƣợc xử lý. Xử lý XML sử dụng SAX không tạo ra cấu trúc dữ liệu. Thay vì trong khi truy cập tài liệu XML, thì nó tạo ra các sự kiện giống nhƣ sự bắt đầu và kế thúc của một phần tử. Các ứng dụng có thể xử lý giống nhƣ tên chính, thuộc tính của các phần tử và nắm giữ các sự kiện. Ngoài ra SAX còn là một giao diện cho XML, nó phân tích API từ một cấu trúc dữ liệu và đƣợc sử dụng để phân tích tài liệu XML.
* XPath: Là ngôn ngữ đƣợc sử dụng để nhận dạng các phần cụ thể của một tài
liệu XML. XPath là quy ƣớc, không cú pháp XML, đƣợc sử dụng trong URIs và các giá trị thuộc tính cũng nhƣ các hoạt động trong lý thuyết, cấu trúc logic của tài liệu XML. Mỗi nút trong tài liệu XML cho biết vị trí, kiểu và nội dung sử dụng XPath.
* XQuery và XUpdate: XQuery là ngôn ngữ truy vấn của XML, đƣợc thiết
kế để áp dụng rộng rãi cho tất cả các kiểu dữ liệu nguồn của XML; Nhƣ cấu trúc và cấu trúc chung tài liệu, quan hệ cơ sở dữ liệu và kho dữ liệu. XQuery sử dụng XPath cho biểu thức đƣờng dẫn. Hơn nữa XQuery còn cung cấp các đặc trƣng nhƣ lọc tài liệu, kết nối nhiều nguồn dữ liệu và nhóm nội dung.
- XUpdate là ngôn ngữ cập nhật, nó cung cấp khả năng cập nhật dễ dàng nhƣ chèn, sửa, xoá dữ liệu trong tài liệu XML. Ngôn ngữ XUpdate là mạnh, giống nhƣ hợp khuôn dạng tài liệu XML và sử dụng XPath để lựa chọn các phần tử cũng nhƣ xử lý các điều kiện.
*SOAP: Là một giao thức đơn giản để chuyển đổi thông tin trong môi
trƣờng phân tán . Nó là một giao thức chuẩn XML và bao gồm 3 phần; Thứ nhất là là tổng quan định nghĩa khung làm việc để miêu tả nội dung của thông điệp và làm thế nào để xử lý chúng; Hai là thiết đặt các luật mã hoá cho các trƣờng hợp của định nghĩa kiểu dữ liệu tƣơng ứng; Ba là quy ƣớc cho thủ tục truy cập từ xa đƣợc gọi là phản hồi. SOAP sử dụng XML và HTML hoặc là SMTP để truy cập các dịch vụ.