Ngôn ngữ đánh dấu siêu văn bản

Một phần của tài liệu tìm hiểu về trình thu thập web và xây dựng trang web tổng hợp thông tin (Trang 35 - 37)

29

Ngôn ngữ đánh dấu siêu văn bản (Hyper Text Markup Language viết tắt là HTML) là một ngôn ngữ đánh dấu được thiết kế ra để tạo nên các trang web. HTML

được xem như là một ứng dụng của SGML (Standard Generalized Markup Language – một chuẩn ISO định nghĩa các ngôn ngữđánh dấu văn bản tổng quát). HTML được tổ

chức World Wide Web Consortium (W3C, [7]) duy trì và là ngôn ngữđánh dấu cốt lõi của World Wide Web. Phiên bản mới nhất của nó hiện là HTML 4.01. Tuy nhiên HTML hiện không còn được phát triển tiếp mà người ta đã thay thế nó bằng XHTML – một chuẩn HTML mở rộng dựa trên XML và có cú pháp chặt chẽ hơn HTML. Mặc dù vậy nhưng phần lớn các trang web hiện nay vẫn được viết bằng HTML.

Có bốn loại phần tửđánh dấu trong HTML [8]:

• Đánh dấu có cấu trúc miêu tả mục đích của phần văn bản (ví dụ, <h1>VietNam</h1> sẽ điều khiển phần mềm đọc hiển thị “VietNam” là tiêu đề cấp một).

• Đánh dấu trình bày miêu tả phần hiện hình trực quan của phần văn bản bất kể

chức năng của nó là gì (ví dụ <b>in đậm</b> sẽ hiển thị thành in đậm).

• Đánh dấu liên kết ngoài chứa phần liên kết từ trang này đến trang kia. Ví dụ

như <a href="http://www.wikipedia.org/">Wikipedia</a> sẽ hiển thị từ http://www. wikipedia.org/ như là một liên kết ngoài đến http://vi.wikipedia.org/wiki/URL

• Các phần tử thành phần điều khiển giúp tạo ra các đối tượng điều khiển như

các nút bấm, các ô textbox để nhập liệu.

Một tài liệu HTML được tạo nên bởi các phần tử HTML(Element, [2]). Một cách tổng quát, một element bao gồm 3 thành phần: một cặp thẻ (tags) gồm một thẻ bắt đầu và một thẻ kết thúc; các thuộc tính (nằm trong thẻ bắt đầu); và toàn bộ phần ký tự, hình ảnh, nội dung thông tin sẽ được hiển thị lên màn hình. Một element là mọi thứ

nằm giữa hai thẻđầu cuối, tính cả hai thẻ này.

HTML là ngôn ngữ không phân biệt chữ hoa hay chữ thường (hai thẻ <td> và <TD> đều là một). Các phần tử HTML cần có một thẻ mở và một thẻđóng, tuy nhiên

điều này không luôn luôn đúng, có nhiều phần tử không cần thẻ đóng, ví dụ các thẻ<br>, <hr> và <li>. Ngoài ra khi lồng nhau, các phần tử HTML cũng không cần thiết phải lồng nhau theo đúng thứ tự (tức là thẻ nào mở trước thì phải đóng sau).

30

Một phần của tài liệu tìm hiểu về trình thu thập web và xây dựng trang web tổng hợp thông tin (Trang 35 - 37)

Tải bản đầy đủ (PDF)

(60 trang)