Giao thức và ngôn ngữ sử dụng

Một phần của tài liệu Xây dựng công cụ lọc nội dung dịch vụ Web (Trang 46 - 50)

2.1 Phƣơng thức trao đổi thông tin qua dịch vụ Web

2.1.2 Giao thức và ngôn ngữ sử dụng

Để truy cập đến trang web trên các máy chủ www, ngƣời dùng phải sử dụng chƣơng trình Web browser để gửi yêu cầu. Tại máy chủ cũng có phần mềm gọi là Web Server để nhận yêu cầu từ Web Browser và thực hiện yêu cầu đó. Web Browser và Web Server giao tiếp với nhau theo giao thức HTTP

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

(HyperText Transfer Protocol) – một giao thức kiểu Client/Server. Client gửi các yêu cầu tới Server và Server sẽ trả lời các yêu cầu đó.

Dịch vụ Web sử dụng giao thức HTTP để tiếp nhận yêu cầu của trình duyệt Web dƣới dạng một địa chỉ URL của một trang Web và phản hồi lại các yêu cầu bằng cách gửi về cho Web browser nội dung của trang Web tƣơng ứng. Nội dung ấn định trong một trang Web thông thƣờng đƣợc viết bằng ngôn ngữ HTML (Ngôn ngữ liên kết siêu văn bản) hay bằng các ngôn ngữ script khác mà trình duyệt có thể hiểu và biên dịch thành nội dung thông tin của trang web để hiển thị ra màn hình.

HTML khơng đƣa ra bất cứ mơ tả nào về font, hình ảnh đồ họa và chỗ để

đặt chúng. HTML chỉ "gán thẻ" cho nội dung tập tin với những thuộc tính nào đó mà sau đó chúng đƣợc xác định bởi trình duyệt để xem tập tin này. Điều này giống nhƣ một ngƣời đánh dấu bằng tay một số đoạn trên bản tài liệu để chỉ cho ngƣời thƣ ký những việc cần thiết nhƣ: "chỗ này in đậm", "chỗ này in nghiêng", "chỗ này là tiêu đề", "chỗ này sang trang"... HTML gán thẻ cho kiểu chữ, chèn file ảnh đồ họa, âm thanh, video vào văn bản, tạo ra mối liên kết và hình thức gọi là siêu văn bản (hypertext). Siêu văn bản là đặc tính quan trọng nhất của ngơn ngữ HTML. Điều này có nghĩa là một đoạn văn bản hay đồ họa bất kỳ nào cũng có thể liên kết với một tài liệu HTML khác.

Trong thời điểm Internet và các giao dịch, tƣơng tác thông qua Internet phát triển rầm rộ nhƣ hiện nay, hàng loạt các ngôn ngữ và giao thức giao tiếp, thiết kế trang web cũng ra đời phục vụ cho những mục đích nhất định nhƣ liên kết và cập nhật dữ liệu động; thể hiện thơng tin, đồ họa phức tạp... Ngồi ngơn ngữ phổ biến HTML, có thể kể đến nhiều ngơn ngữ khác nhƣ: DHTML, XML, ASP, Java.

DHTML (Dynamic HTML): là phiên bản mở rộng của HTML có phần mở rộng dạng .dhtml. Nó giúp tăng cƣờng tính tƣơng tác của các đối tƣợng điều khiển trong trang HTML tĩnh bằng cách cho phép ngƣời ta dùng các

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

script, vbscript hoặc javascript điều khiển chúng. Ví dụ một thẻ image để nhúng ảnh vào trang web có thể nhận biết khi nào ngƣời dùng di chuyển chuột trên nó bằng cách cài đặt hàm xử lý sự kiện OnMouseOver, khi đó thơng qua những xử lý thích hợp sẽ làm đối tƣợng hình ảnh trở nên sống động hơn. Nhìn chung, bên cạnh những mở rộng nhƣ tạo những hiệu ứng MouseOver, chuỗi chữ di chuyển động, thay đổi màu sắc..., các khía cạnh bảo mật của DHTML tƣơng tự nhƣ HTML vì nó dựa trên nền tảng HTML. Tuy nhiên hiện nay các lập trình viên web ít chọn DHTML vì có một số trình duyệt khơng hỗ trợ tốt cho nó.

XML (Extensible Markup Language) – Ngôn ngữ đánh dấu mở rộng.

XML mới phát triển trong thời gian gần đây và có thể sẽ đƣợc phổ biến rộng rãi trong tƣơng lai. Không giới hạn và định nghĩa sẵn nhƣ HTML, XML cho phép ngƣời dùng tự định nghĩa ra các thành phần riêng và mở rộng tuỳ ý. Tệp dữ liệu XML có phần mở rộng dạng.xml. Bộ phận quan trọng nhất trong ngôn ngữ XML là bảng định nghĩa DTD (Document Type Definitions). DTD dùng để định nghĩa các thẻ mở và đóng của một tệp XML, giúp ngƣời xem có một cái nhìn tổng qt về dữ liệu đang lƣu trữ.

ASP (Active Server Pages): là môi trƣờng ngơn ngữ script phía server

của Microsoft phát triển chủ yếu phục vụ cho các web server IIS (Internet Information Server). ASP có thể đƣợc dùng kết hợp với HTML, mã script và các thành phần ActiveX phía server tạo nên các trang thơng tin có nội dung động; thực thi các lệnh hệ thống, kết nối cơ sở dữ liệu…

Khi khách hàng gửi tới Web Server yêu cầu một tệp.asp (là tệp có chứa các thẻ HTML và chƣơng trình viết bằng ngơn ngữ script nào đó), chƣơng trình ASP sẽ đọc tồn bộ tệp .asp đƣợc u cầu, xác định ngơn ngữ script dùng để viết các câu lệnh đó và gọi chƣơng trình engine tƣơng ứng để thực hiện. ASP hỗ trợ sẵn các phƣơng thức truy nhập cơ sở dữ liệu để đáp ứng yêu cầu của khách hàng. Sau khi thực hiện xong, ASP trả lại kết quả dƣới dạng HTML

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

thuần túy để các browser chuyển cho khách hàng. ASP có ƣu điểm là cho phép kết hợp viết các chƣơng trình bằng nhiều ngơn ngữ khác nhau. Nó tận dụng đƣợc thế mạnh của các ngôn ngữ cũng nhƣ đáp ứng đƣợc nhiều trình độ hiểu biết và kỹ năng lập trình khác nhau. Nếu ngơn ngữ sử dụng là JScript, ASP cịn cho phép kết hợp giữa chƣơng trình chạy trên máy server và trên máy Client từ đó tạo ra các ứng dụng linh hoạt, mềm dẻo. Ðối với các yêu cầu đặc biệt, ASP cịn cho phép tích hợp các tệp khác, kể cả tệp văn bản thuần túy, các tệp CGI, hoặc cho phép viết các thƣ viện liên kết động và gọi từ trong chƣơng trình. Tuy nhiên, ASP cũng có nhƣợc điểm là phụ thuộc vào môi trƣờng Windows.

Java là một ngơn ngữ lập trình của hãng Sun Microsystems. Nó đƣợc thiết kế gọn nhỏ, tin cậy, và có khả năng nhúng. Java là ngơn ngữ lập trình đa mơi trƣờng, có nghĩa là khơng phụ thuộc vào hệ điều hành và có thể chạy trên các hệ nền (platform) khác nhau. Các ứng dụng nhúng của Java (Java applet) cho phép làm sống động các trang Web bằng các đoạn hình ảnh động, trị chơi, tìm kiếm dữ liệu và nhiều tính năng khác. JavaScript là một ngơn ngữ Script đƣợc tạo từ Java. Bằng cách tích hợp các lệnh JavaScript vào một trang Web có thể làm thay đổi cách thể hiện và nội dung theo yêu cầu, kiểm soát hoạt động của Web Server, giao tiếp với các cơ sở dữ liệu trực tuyến. JavaScript có thể đƣợc cài đặt cả trên máy Client lẫn máy server. Tuy nhiên, do Java là một ngôn ngữ mới đƣợc phát triển nên lập trình cịn phức tạp, các cơng cụ hỗ trợ cịn chƣa hồn thiện. Bản thân các tính năng về truy nhập cơ sở dữ liệu cũng còn chƣa mạnh, đang đƣợc tiếp tục phát triển.

Nhƣ vậy, có thể thấy rằng, một trang web có thể đƣợc viết dƣới nhiều ngơn ngữ khác nhau, mỗi ngơn ngữ có những đặc thù riêng của mình. Việc này đem lại sự khó khăn cho q trình lọc nội dung cho giao dịch web. Hiện nay, trên thế giới vấn đề lọc nội dung theo từ khóa mới chỉ dừng lại ở việc lọc các trang siêu văn bản có thơng tin trả về cho trình duyệt dƣới dạng ngơn ngữ HTML.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Một phần của tài liệu Xây dựng công cụ lọc nội dung dịch vụ Web (Trang 46 - 50)

Tải bản đầy đủ (PDF)

(88 trang)