Công nghệ XML

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Sử dụng chuẩn thiết lập bài giảng và ứng dụng các công cụ để thiết kế bài giảng theo các chuẩn Luận văn ThS. Công nghệ thông tin 1 01 10 (Trang 55 - 57)

CHƢƠNG 1 E-LEARNING

b. Mô hình dữ liệu SCORM RTE

2.5. Công nghệ XML

2.5.1. Giới thiệu

XML được triển khai nhờ sự đóng góp của rất nhiều các cá nhân và tổ chức trong mười năm qua. Trước đó ta có SGML (Standard Generalised Markup Language), một ngôn ngữ quốc tế rất phức tạp, dùng để diễn tả tài liệu đa dạng và có cấu trúc rất phức tạp và khó hiểu mặc dù nó là công cụ rất mạnh.

Sau đó Tim Berners-Lee đã xây dựng lên ngôn ngữ HTML là một phần nhỏ của SGML rất dễ dùng. Sự thành công của HTML đã làm cho cộng đồng WWW phát triển một cách vượt bậc. Tuy nhiên, đến khoảng những năm 1995 người ta bắt đầu thấy sự giới hạn của HTML mặc dù nó được Netscape, Microsoft hỗ trợ rất tốt, và cùng với đó là sự thịnh hành của Web.

Mùa hè 1996, Jon Bosak ở Sun Microsystem khởi đầu nhóm cộng tác (working group) W3C SGML, bấy giờ được gọi là nhóm XML. Mục đích của nhóm là đơn giản hóa SGML để nó dễ dùng như HTML mà đồng thời mạnh mẽ, linh động. Ông muốn XML hội các điều kiện sau:

 Đơn giản đủ cho lập trình viên áp dụng, có thể được xây dựng trên 1 trình soạn thảo bất kỳ

 Không giới hạn trong tiếng Anh của nước Mỹ

 Dễ cho Search Engine (như Yahoo, AltaVista, Infoseek vv...) sắp loại

Bản đặc tả thử nghiệm đầu tiên của XML được phát hành vào tháng 11 năm 1996, và sau đó là rất nhiều phiên bản được ra đời. Tháng 7 năm 1997 Microsoft đưa ra áp dụng thật sự đầu tiên của XML, Channel Definition Format (CDF). Họ dùng CDF để xuất bản các trang Web đến những khách đã đóng tiền tháng (subscribers). CDF là một phần của Internet Explorer 4.0. Tháng năm 1997 Microsoft và Inso Corporation xuất bản XSL (Extensible Style Language) để làm Style Sheet diễn tả cách trình bày một trang XML.

Đến tháng 2 năm 1998 W3C phê chuẩn cho chính thức thi hành phiên bản 1.0 của đặc tả XML.

XML là viết tắt của cụm từ Extensible Markup Language - XML có thể coi là 1 siêu ngôn ngữ khắc phục những hạn chế của HTML trong việc trao đổi dữ liệu và tính phức tạp, khó hiểu của SGML. XML là sự tổng hợp của 3 công nghệ: đánh dấu văn bản, trao đổi dữ liệu, và WWW.

XML là một siêu ngôn ngữ không phải là ngôn ngữ cụ thể, đặc điểm chính của XML là:

 Xác định các luật đánh dấu văn bản như thế nào. XML không định nghĩa trước các thẻ dùng trong đánh dấu văn bản.

 Cung cấp khả năng để quy định một Document Type Definition (DTD) để ràng buộc việc đánh dấu cho phép trong một lớp tài liệu mà thôi.

 Hỗ trợ Unicode hoàn toàn, tức là hỗ trợ tất cả các ngôn ngữ trên thế giới.

 XML có nhiều luật khác nhau mà một một tệp XML bắt buộc phải tuân theo trong đó 3 luật sau quan trọng nhất:

+ Thông tin được biểu diễn thông qua các đơn vị gọi các tài liệu XML.

+ Một tài liệu XML chứa một hay nhiều hơn các thành phần.

+ Một thành phần có tên, nó được xác định trong tài liệu thông qua việc đánh dấu tường minh, nó có thể chứa các thành phần khác và có các thuộc tính đi kèm.

2.5.2. Trang tài liệu XML

Một trang XML là một tập hợp các thẻ tuỳ theo người viết tự định nghĩa. Mặc dù chúng ta có thể đặt ra bao nhiêu thẻ cũng được, nhưng mỗi trang XML cần phải theo một số qui luật định trước để được xem là 1 trang chuẩn và thực thi được. Nếu một trang XML không chuẩn thì coi như không thực thi đuợc, không có chương trình xử lý nào sẽ chịu làm việc với dữ liệu bên trong của nó. Do đó một trang XML cần phải theo đúng các qui luật sau đây:

Trang XML phải bắt đầu bằng câu khai báo XML (XML declaration)

 Mỗi bộ phận, gọi là "element" phải nằm giữa một cặp thẻ (Thẻ pair).

 Một trang XML phải có một element độc nhất chứa tất cả các elements khác. Đó là gốc (root) của cây (tree) biểu diễn trang XML.

 Các cặp thẻ không được xen kẽ nhau.

Và thêm một vài qui luật về cách dùng các mẫu tự đặc biệt. Ngoài ra các Cặp thẻ phải đánh vần đúng y như nhau kể cả chữ hoa, chữ thường, (thí dụ: <STUDENT> và </Student> là bất hợp lệ) và tất cả giá trị các Attribute đều phải nằm giữa hai ngoặc kép (thí dụ: standalone=yes là không hợp lệ, phải dùng standalone="yes" mới được).

XML chứa các dữ kiện bằng cách dùng những cặp thẻ, nhưng tự nó không đòi hỏi các dữ kiện nào cần phải hiện diện hay chúng phải liên hệ với nhau như thế nào. Có một cách để thực hiện việc ấy là ghi vào phần đầu của một trang XML những qui luật ấn định các dữ kiện phải như thế nào để trang XML đuợc xem là có ý nghĩa. Tập hợp các qui luật ấy được gọi là Document Type Definition (DTD).

2.5.3. Định nghĩa kiểu tư liệu – DTD

Chúng ta đã đề cập đến cấu trúc tài liệu XML hợp khuân dạng ở phần trước. Tuy nhiên, tài liệu XML còn cần phải hợp lệ khi định nghĩa kiểu tư liệu (DTD) cho các phần tử trong tài liệu. Tài liệu XML được xem là hợp lệ và có giá trị khi toàn bộ các phần tử trong tài liệu đã định nghĩa kiểu mà nó sẽ chứa. Việc định nghĩa kiểu dữ liệu cho các phần tử thẻ gọi là định nghĩa kiểu tư liệu, viết tắt là DTD.

Cú pháp tổng quát định nghĩa và khai báo kiểu tư liệu cho các phần tử thẻ như sau:

<!DOCTYPE rootName [DTD]>

Trong đó rootName là tên thành phần gốc tài liệu, DTD là các định nghĩa cho phần tử trong tài liệu, nó có thể là định nghĩa nội hoặc ngoại. Sau đây ta sẽ xét cụ thể từng trường hợp.

Một phần của tài liệu (LUẬN VĂN THẠC SĨ) Sử dụng chuẩn thiết lập bài giảng và ứng dụng các công cụ để thiết kế bài giảng theo các chuẩn Luận văn ThS. Công nghệ thông tin 1 01 10 (Trang 55 - 57)

Tải bản đầy đủ (PDF)

(82 trang)