4.3.2.1 Giới thiệu chung về server phát tán thông tin đa ph−ơng tiện
Khác với l−ợng thông tin khá nhỏ nh− thoại và văn bản đ−ợc xử lý bằng ph−ơng tiện thông tin thông th−ờng thì một luợng lớn thông tin số nh− hình ảnh và âm thanh đ−ợc gọi là thông tin đa ph−ơng tiện. Khi thông tin đa ph−ơng tiện gồm văn bản, hình ảnh và âm thanh đ−ợc tổ chức và cung cấp nh− một đơn vị soạn thảo và đ−ợc gọi là các "nội dung".
Các nội dung đ−ợc tạo và cung cấp nh− chỉ ra trong hình 4.12. Phần sau sẽ mô tả chi tiết thêm về vấn đề nàỵ
Hình 4.12 Cấu hình của Server phát tán thông tin đa ph−ơng tiện
B−ớc đầu tiên là tạo ra các nội dung bằng hệ thống sản xuất nội dung. Hệ thống này gồm một bộ mã hóa để số hóa và mã hóa hình ảnh và âm thanh, một công cụ soạn thảo có khả năng tạo ra các nội dung bằng việc kết hợp hình ảnh và âm thanh. Các kỹ thuật mã hóa hình ảnh và âm thanh đã đ−ợc trình bày chi tiết tại phần 4.2. Ngôn ngữ đánh dấu, là cách chỉ dẫn làm thế nào để tổ chức thông tin đa ph−ơng tiện và diễn đạt chúng nh− các nội dung, đ−ợc giải thích cụ thể tại phần 4.3.3
B−ớc tiếp theo là l−u trữ các file đầu ra của bộ mã hóa và công cụ soạn thảo trong server phân phối thông tin đa ph−ơng tiện và phân phát chúng tới các thiết bị đầu cuối dựa trên các yêu cầu từ các thiết bị nàỵ
Thiết bị đầu cuối nhận nội dung này thực hiện giải mã để phát lại hình ảnh và âm thanh theo định dạng tr−ớc khi mã hóạ Sau đó các nội dung đ−ợc cấu hình lại rồi phát lạị
Có hai kỹ thuật phát tán giữa server phân phối thông tin đa ph−ơng tiện và một máy điện thoại di động là kỹ thuật tải xuống (download) và kỹ thuật phát liên tục (streaming). Kỹ thuật download tải tất cả các nội dung vào máy điện thoại di động tr−ớc khi phát lại chúng trên máy di động. Kỹ thuật streaming phát các nội dung theo thứ tự liên tiếp trong khi các nội dung này đang đ−ợc gửi tới điện thoại di động.
Kỹ thuật download chiếm thời gian chờ đợi lâu hơn vì nó tải xuống tất cả các nội dung có thể đ−ợc phân phối một cách hạn chế. Vì toàn bộ các nội dung đã phân phát có
Giải mã Phần mềm máy di động Các nội dung Âm thanh Hình ảnh Dựng lại và phát nội dung Bộ xử lý thông tin Bộ xử lý thông tin Ngôn ngữ đánh dấu Ph−ơng pháp mã hoá Định dạng file Giao thức Mã hoá Hệ thống xây dựng nội dung Hình ảnh Âm thanh Nhận thực Ví dụ Server phát thông tin đa ph−ơng tiện
áp dụng. Mặt khác, kỹ thuật streaming sẽ mất ít thời gian hơn tr−ớc khi các nội dung này đ−ợc phát lại, các nội dung đ−ợc chia ra và đ−ợc gửi trong các đơn vị nhỏ và đ−ợc phát lại một cách tuần tự. Thời gian chờ đợi là tổng của thời gian truyền dẫn và thời gian l−u tại bộ đệm của các đơn vị. Tuy nhiên, kỹ thuật này không phù hợp cho việc l−u trữ và tái tạo các nội dung đã phân phát.
Kỹ thuật download yêu cầu một giao thức truyền thông tin cậy giữa server phát tán thông tin và một thiết bị đầu cuối mặc dù trễ truyền dẫn trong một phạm vi nào đó có thể đ−ợc bỏ quạ Các thủ tục truyền dẫn đáp ứng đ−ợc yêu cầu này gồm HTTP trên TCP/IP và FTP, hiện đang đ−ợc sử dụng rộng rãi trên internet.
Nh− chỉ ra trong hình 4.13, HTTP là một giao thức cấu trúc đ−ợc thực hiện trên TCP/IP . Sau khi dữ liệu mất do lỗi truyền dẫn đ−ợc sửa lại bằng chức năng của TCP/IP, việc download đ−ợc thực hiện bằng HTTP. Tệp tin (file) này đ−ợc tạo bởi thiết bị đầu cuối tải xuống từ server theo thứ tự giữa thiết bị đầu cuối và server, thiết bị đầu cuối này gửi một yêu cầu tới HTTP GET và server đáp ứng bằng HTTP PUT. Mặt khác, với kỹ thuật streaming, các giải pháp từ các nhà cung cấp khác nhau nh− Công nghệ Media Windows của Microsoft và Real System của Real Network là t−ơng thích
với nhau tạo ra một tiêu chuẩn cho internet có tên là de facto. IETF đã soạn thảo một
yêu cầu chú giải (RFC) cho giao thức truyền dữ liệu media theo thời gian thực (RTSP)- các server cho phép nghe nhạc xem phim trực tuyến đều sử dụng giao thức này, ng−ời sử dụng không thể dowload nó mà chỉ có thể nghe hoặc xem trực tuyến- nh− một kỹ thuật streaming.
Hình 4.13 Cấu trúc giao thức HTTP và ví dụ về trình một trình tự
Cấu trúc giao thức Trình tự ví dụ
Thiết bị thuê bao Server phát thông tin đa
ph−ơng tiện
Lớp 1 Lớp 2
HTTP nhận ( yêu cầu tải xuống)
HTTP đáp ứng ( yêu cầu tải xuống)
RTSP sử dụng cấu trúc giao thức nh− trình bày trong hình 4.14. Kỹ thuật phát liên tục (Streaming) yêu cầu trễ truyền dẫn thấp và việc bị mất gói tin có thể đ−ợc bỏ qua trong một giới hạn nào đó. Để đáp ứng đ−ợc yêu cầu này, RTSP đ−ợc thực hiện trên giao thức truyền gói không tin cậy thông qua việc truyền lại ( UDP) và trên giao thức thời gian thực (RTP)- giao thức đ−ợc thiết kế cho truyền dẫn thời gian thực thông tin đa ph−ơng tiện nh− âm thanh, hình ảnh, v.v...Giao thức điều khiển RTP (RTCP), giao thức thông báo cho ng−ời gửi trạng thái nhận của hình ảnh và âm thanh đ−ợc truyền bằng RTP để quản lý chất l−ợng dịch vụ, đ−ợc bổ sung thêm cho RTP. RTSP là một thủ tục truyền thông cho phép quản lý các phiên liên lạc đa ph−ơng tiện. Với RTSP, nó có thể thực hiện các yêu cầu khác nhau nh− tạm dừng hoặc phát liên tục hình ảnh và âm thanh, hoặc tua nhanh và phát chậm. Kỹ thuật phát liên tục dựa trên RTSP sử dụng một trình tự mà server chuẩn bị truyền dẫn với "SET UP " đã đ−ợc tạo ra bởi thiết bị đầu cuối, bắt đầu quá trình truyền dẫn với "PLAY" và kết thúc quá trình truyền dẫn bằng "TEARDOWN".
Hình 4.14 Cấu trúc giao thức RTSP/RTP và ví dụ về trình tự
4.3.2.2 Các ph−ơng pháp l−u trữ thông tin đa ph−ơng tiện
Nh− đã đề cập ở phần 4.3.2.1, để phát tán thông tin đa ph−ơng tiện, tr−ớc hết nội dung thông tin đa ph−ơng tiện đ−ợc tạo ra bởi hệ thống sản xuất nội dung, rồi l−u trữ trong server phát tán thông tin đa ph−ơng tiện, sau đó đ−ợc phát tán đến ng−ời sử dụng. Hệ thống sản xuất nội dung và server phát tán thông tin đa ph−ơng tiện truyền các nội
Trình tự ví dụ Cấu trúc giao thức
Lớp 1 Lớp 2
Thiết bị đầu cuối thuê bao
Máy chủ phát thông
tin đa ph−ơng tiện
SETUP (Chuẩn bị phát liên tục) PLAY (bắt đầu phát liên tục) TEARDOWN (kết thúc phát liên tục)
dung thông tin đa ph−ơng tiện theo một định dạng file cụ thể. Nếu ph−ơng pháp download đ−ợc dùng để truyền thông tin giữa server phát tán thông tin đa ph−ơng tiện và đầu cuối di động thì thiết bị đầu cuối sẽ gọi các nội dung ra từ file nhận đ−ợc bằng HTTP và phát lại chúng. Các định dạng file cho thông tin đa ph−ơng tiện là "Advanced Streaming Format" của Microsoft và "Quick Time" của Apple th−ờng đ−ợc sử dụng. MPEG4 chỉ ra định dạng file MPEG4 (MP4) nh− một định dạng chuẩn.
Hình 4.15 là một ví dụ của định dạng file MP4. MP4 l−u trữ thông tin đa ph−ơng tiện nh− hình ảnh và âm thanh trong vùng "mdat" theo một khuôn dạng tự do và khoảng thời gian giữa các thông tin đa ph−ơng tiện, kích th−ớc dữ liệu, giá trị khoảng
trống từ phần đầu của file và các thông tin khác trong vùng "moov". Mỗi vùng bao
gồm các cấu trúc định h−ớng đối t−ợng đ−ợc gọi là các nguyên tử và mỗi nguyên tử đ−ợc nhận dạng bằng các thẻ (tag) và độ dàị
Hình 4.15 Định dạng file MP4 4.3.3 Các ngôn ngữ đánh dấu nội dung
4.3.3.1 Ngôn ngữ đánh dấu siêu văn bản tích hợp cao (Compact HTML).
HTML tích hợp cao (từ đây về sau gọi là CHTML) là một ngôn ngữ đánh dấu trang đ−ợc thiết kế cho các thiết bị thông tin nhỏ nh− điện thoại di động và CHTML là một tập con của HTML 2.0, HTML 3.2, HTML 4.0. CHTML không hỗ trợ các chức năng đ−ợc cung cấp bởi HTML nh− JPEC, bảng, khung, hình ảnh, bản đồ, đa phông chữ và các kiểu màu và hình ảnh cơ bản cũng nh− các kiểu bảng biểụ
Cấu trúc của một tài liệu CHTML thì giống nh− HTML, bắt đầu bằng thẻ tag <html> và kết thúc bằng tag </html> để chỉ ra rằng tài liệu này đ−ợc viết trong CHTML. Thông tin tiêu đề (nh− tựa đề của trang và các thông tin về server) đ−ợc viết
Các khối truy nhập âm thanh, video, OD,BITF, đặt thời gian
và đan xen …Các phân
giữa <head> và </head> còn nội dung đ−ợc hiển thị trên màn hình giữa <body> và </body> (Hình 4.16).
CHTML cung cấp các khả năng để liên kết tới một số điện thoại đ−ợc gọi là "Phoneto" và để sử dụng các phím số trên điện thoại di động đ−ợc gọi là "Easy Focus". Phoneto thực hiện một cuộc gọi tới số điện thoại đã thiết lập liên kết bằng cách kích vào đ−ờng liên kết này khi số điện thoại này đ−ợc lựa chọn. Ngôn ngữ đánh dấu trang cho dịch vụ i-mode (i-mode t−ơng thích với HTML), dịch vụ đ−ợc khai tr−ơng bởi NTT DoCoMo năm 1999, là dựa trên CHTML.
Hình 4.16 CHTML và ảnh màn hình
4.3.3.2 WML
Ngôn ngữ đánh dấu không dây (WML) là ngôn ngữ đánh dấu trang đ−ợc sử dụng trong WAP phiên bản 1.0. WML đ−ợc dựa trên ngôn ngữ đánh dấu thiết bị cầm tay (HDML) của Phonẹcom. Sau đó phiên bản này đ−ợc nâng cấp từ WAP 1.0 lên 1.1 đặt tên cụ thể cho HDML đã đ−ợc sửa và đ−ợc căn chỉnh bằng HTML.
Một đặc điểm kỹ thuật then chốt của WML là các nội dung đ−ợc mô tả bằng các khái niệm gọi là “card” và “deck” mà cho phép nhiều màn hình download cùng một lúc. Hình 6.20 chỉ ra phần giữa <wml> và </wml> (gọi là deck) đ−ợc tải xuống cùng một lúc. Phần giữa <card> và </card> trong deck này thì đ−ợc gọi là card cấu thành một màn hình. Để gộp nhiều màn hình thì nhiều card phải đ−ợc viết trong một deck. Mỗi card đ−ợc nhận dạng bằng một thuộc tính id.
Card WML có 4 loại là “view text” (xem văn bản), “enter text” (nhập vào nội dung văn bản), “select” (chỉ chọn một từ một danh sách các lựa chọn), “multieslect” ( chọn từ 2 trở lên trong một danh sách các lựa chọn). Với đuôi <setvar> thì các giá trị biến thiên của bốn loại card này có thể đ−ợc chỉ rõ. Việc chuyển đổi giữa các card đ−ợc mô tả bằng đuôi <do> để sử dụng các khóa mềm, đuôi <ạ> để chỉ ra liên kết siêu văn bản, và thuộc tính ontimer để chuyển đổi tự động với bộ đếm thời gian.
(Các card có thể hiểu giống nh− các phần tử cơ bản trong một ứng dụng Window nh− : nút bấm – button(command), ô nhập text (text box) , list box, list view, commbo v.v…)
WML hỗ trợ một giao diện ứng dụng điện thoại (Telephony Application Interface) đ−ợc gọi là Wireless Telephony APL cho phép ng−ời sử dụng gọi đến một số điện thoại hiển thị đ−ợc, đặt tên là Phoneto trong CHTML.
4.3.3.3 XHTML
HTML mở rộng (Extensible HTML-XHTML) là một ngôn ngữ đánh dấu nội dung mới thay thế cho HTML đ−ợc khuyến nghị bởi W3C vào tháng 1/2000, HTML đ−ợc định nghĩa lại trong ngôn ngữ đánh dấu mở rộng (XML). Với XHTM, một định nghĩa linh động các kiểu phần tử, mô tả cấu trúc dữ liệu một cách chính xác đã rất khó khăn với HTML thì nay đã trở nên dễ dàng với XML, tăng c−ờng độ mềm dẻo và mở rộng của các nội dung mô tả. Ngoài ra XHTML cũng có thể sử dụng đồ thị vectơ và ngôn ngữ tích hợp đa ph−ơng tiện đồng bộ hóa (SMIL), SMIL cho phép đồng bộ hóa với hình ảnh video, thoại và văn bản, nâng cao độ diễn cảm của nội dung hơn HTML.
XHTML sử dụng các đuôi HTML để mô tả nội dung nh− một tài liệu XML đúng cú pháp. Điều này là cần thiết để mô tả khoảng trống của tên trong phần tử html, một phần tử gốc trong tài liệu, để chỉ ra rằng các "đuôi" trong tài liệu tuân theo XHTML nh− đ−ợc chỉ ra d−ới đây
<html xmlns = “http://www.w3c.org/1999/xhtml”>
Sự môđun hóa của XHTML theo cách d−ới đây làm cho tập tag mới có thể đ−ợc gán một cách dễ dàng. ý t−ởng này là chia các XHTML tag thành vài môđun và tạo ra
một tag mới bằng việc kết hợp các môđun. Định nghĩa kiểu tài liệu (DTD) của XHTML 1.1 là một bộ s−u tập các khai báo môđun (gọi là bằng) đ−ợc sử dụng.
Một tập tag XHTML điển hình cho các thiết bị đầu cuối thông tin quy −ớc là XHTML Basic khuyến cáo bởi W3C vào tháng 12/2000. XTML Basic bao gồm các môđun sau: Structure (Cấu trúc), Basic Text (Văn bản căn bản), Hypertext (Siêu văn bản), List, Basic Forms (khuôn dạng cơ bản), Basic Tables (Các bảng cơ bản), Image (Hình ảnh), Object (đối t−ợng), Meta information (siêu thông tin), Liknk and Basẹ
Với WAP thế hệ tiếp theo, ngôn ngữ đánh dấu sẽ đ−ợc cấu trúc để sử dụng XHTML Basic làm cốt lõị
4.3.4 Chuẩn hóa Internet di động (WAP)
4.3.4.1 Giới thiệu chung
Diễn đàn WAP (WAP Forum) đ−ợc thành lập vào thàng 1/1998 bởi 4 hãng Phonẹcom (bây giờ là Openware), Nokia, Motorola và Ericsson. Số l−ợng các công ty thành viên đã đạt con số 641 vào tháng 1/2001 (thành viên chính thức: 251 công ty, các công ty liên kết: 390). Đối t−ợng chính của diễn đàn này là tạo ra một nhóm các đặc điểm kỹ thuật tiêu chuẩn hóa mở và mang tính toàn cầu cho việc sử dụng dịch vụ Internet từ mạng không dâỵ WAP Forum đã kết hợp các phần tiêu chuẩn khác của internet và mạng điện thoại nh− W3C, IETF, ECMA (Hiệp hội các nhà sản xuất máy tính Châu Âu), 3GPP1/2, ETSI và MITF (Diễn đàn truy nhập dịch vụ Internet di động) để phát triển các đặc điểm kỹ thuật nàỵ NTT DoCoMo gia nhập Forum này ngay sau lễ khánh thành của nó và đã đã đóng góp nhiều hoạt động tích cực với vai trò là một trong số 13 thành viên ủy ban từ 10/1998.
Với sự ra đời của GPRS và các dịch vụ IMT-2000 đòi hỏi phải phát triển một phiên bản mới về các đặc điểm của WAP, t−ơng thích với mạng di động thế hệ tiếp theọ Để đáp ứng yêu cầu đó, WAP Forum đã bắt đầu việc phát triển các đặc tính mới cho WAP thế hệ tiếp theo để có thể t−ơng thích với mạng di động thế hệ mới (WAP- NG), tập trung chủ yếu để đạt đ−ợc sự hội tụ với internet.
Phần này sẽ trình bày các thành tựu phát triển trong thời gian gần đây của WAP Forum. Đầu tiên là các đặc tính của WAP hiện có (WAP 1.X) và các khả năng mới
đ−ợc thực hiện trong t−ơng laị Sau đó, các yêu cầu đối với mạng thế hệ tiếp theo sẽ đ−ợc tóm tắt bởi một số thông tin cập nhật về tiến trình phát triển các đặc tính của WAP thế hệ saụ
4.3.4.2 Tổng quan về các đặc tính kỹ thuật của WAP hiện tại
WAP 1.0 ra đời vào tháng 6/1998. Với sự ra đời của WAP 1.1 , cấu trúc cơ bản của WAP đ−ợc xác định. Từ đó các đặc tính kỹ thuật này đã đ−ợc nâng cấp 2 lần. Để phân biệt những đặc tính của WAP hiện có với WAP thế hệ sau, WAP hiện có th−ờng đ−ợc xem nh− WAP 1.X. Hình 6.22 mô phỏng mô hình cấu trúc của WAP 1.X
WAP 1.0 gồm các phần tử cơ bản nh− các giao thức, ngôn ngữ đánh dấu và script. Khuôn mẫu của tiêu chuẩn này đ−ợc tổ chức cùng với sự phát triển của WAP 1.1, phiên bản này đã có vài cải tiến so với phiên bản tr−ớc. Ngày nay phiên bản này đ−ợc hỗ trợ bởi rất nhiều MS là WAP1.1. WAP 1.2 đ−ợc xuất bản tháng 1/2000 đã có bổ
sung thêm các khả năng mới nh− phát tin quảng bá và môđun nhận dạng vô tuyến
(WIM). Phiên bản tiếp theo phiên bản này đ−ợc phát hành hai lần trong một năm (tháng 1 và tháng 12), phiên bản mới nhất ngày nay là WAP 2.0. Những đặc tính kỹ thuật này đã đ−ợc phổ biến rộng rãi trên các trang Web của WAP Forum. Cấu trúc của WAP 1.X có hai đặc tr−ng: một là các giao thức vô tuyến đ−ợc tối −u hóa và hai là WML đ−ợc lựa chọn.
Hình 4.17 Mô hình cấu trúc của WAP 1.X
Gateway WAP
CGI: Giao diện Gateway chung WAP: Giao thức ứng dụng vô tuyến
WML: Ngôn ngữ đánh dấu vô tuyến ( ngôn ngữ đánh dấu)
Giao thức biến đổi