1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài tham khảo về Web Course

14 586 1
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 14
Dung lượng 155,19 KB

Nội dung

Bài tham khảo về Web Course

Trang 1

BÀI THAM KHẢO Lập trình ASP với Unicode

Khoa CNTT - ĐHKHTN

Trang 2

Nội dung

1 Các khái niệm về biểu diễn ký tự trong

máy tính

2 Lập trình Web với tiếng việt Unicode

3 Hỗ trợ Unicode của các phần mềm

4 Tổng kết

Trang 3

1 Các khái niệm (1)

bởi 1 số nguyên không âm

1 điểm mã (8, 16, 32,…)

mã của một tập ký tự, gọi là trang mã, bảng

mã, bộ mã.

Trang 4

1 Các khái niệm(2)

‰ Tập ký tự : 0-31 : ký tự điều khiển, 32-127: ký tự ASCII (chữ, số, …)

‰ Điểm mã: 0 – 127 ứng với từng ký tự

‰ Đơn vị mã: 1 byte (8 bit) Mỗi điểm mã mã hóa

bởi 1 đơn vị mã

Trang 5

1 Các khái niệm(3)

„ Bảng mã ASCII mở rộng (128-255) mã hóa cho các ngôn ngữ khác

Code

Page

Upper 128 Eastern

Europe

West Euro Ansi

Trang 6

1 Các khái niệm(3)

(trong bảng mã Vietnamese 1258)

‰ Các từ có dấu tổ hợp từ CHỮ CÁI + THANH

‰ Ví dụ : ế = ê + ́

‰ Mỗi ký tự tiếng việt “ế” biểu diễn đúng bởi 1 điểm

mã (TCVN3-ABC dùng 134 điểm mã)

Trang 7

1 Các khái niệm(4)

‰ Thống nhất mọi ngôn ngữ trong 1 bảng mã

‰ Trên 1 tài liệu có thể biểu diễn nhiều ngôn ngữ

khác nhau

‰ Tập ký tự do Unicode biểu diễn

‰ Cách mã hóa các điểm mã, đơn vị mã

Trang 8

1 Các khái niệm(5)

‰ Mỗi điểm mã biểu diễn bởi 1 đơn vị mã 16 bit

‰ Số lượng điểm mã : 65536 (0 – 65535)

⇒ Là phiên bản Unicode nguyên thủy : UCS-2

‰ Cách biểu diễn các điểm mã theo các đơn vị mã khác nhau

‰ UTF-8 : 1-4 đơn vị mã 8 bit

‰ UTF-16: 1-2 đơn vị mã 16 bit

Trang 9

1 Các khái niệm(6)

‰ 128 kí tự đầu tiên từ điểm mã U+0000 đến

U+007F, được mã hóa thành 1 byte

‰ Từ điểm mã U+0080 đến U+07FF, được mã hóa thành 2 byte

‰ Từ điểm mã U+0800 đến U+FFFF, được mã hóa thành 3 byte

‰ Từ điểm mã U+0800 đến U+FFFF, được mã hóa thành 4 byte

Trang 10

2 Lập trình web Tiếng Việt với

Unicode(1)

‰ <META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=windows-1252">

‰ <META HTTP-EQUIV="Content-Type" CONTENT="text/html; CHARSET=UTF-8">

‰ Cách biểu diễn : &#229; và &#xE5;

‰ VD: trong bảng mã windows-1252

„ “Ti&#7871;ng Vi&#7879;t” -> Ti ế ng Vi ệ t

Trang 11

2 Lập trình web Tiếng Việt với

Unicode(2)

„ Hoạt động của WebServer

‰ Trả dữ liệu về Client :

„ <%Response.Write “hằng chuỗi” %>

„ <%Response.Write Rs(“Field”) %>

‰ Yêu cầu webserver mã hóa dữ liệu và chuyển theo bảng mã

„ <%Session.CodePage=65001%> // Dùng cho toàn bộ các trang trong Session hiện hành

„ <%@CodePage=65001%> // Dùng cho trang hiện hành

Trang 12

2 Lập trình web Tiếng Việt với

Unicode(3)

„ Các bước thực hiện trong lập trình ASP

‰ Soạn và lưu trữ tập tin asp dưới mã hóa UTF-8

‰ Chỉ định bảng mã cho server xử lý trong đầu trang ASP

<%@CODEPAGE=65001%>

<%Session.Codepage=65001%>

<HTML>

<HEAD>

<META HTTP-EQUIV="Content-Type" CONTENT="text/html;

CHARSET=UTF-8">

</HEAD>

<BODY>

</BODY>

</HTML>

Trang 13

2 Lập trình web Tiếng Việt với

Unicode(4)

„ Các bước thực hiện trong lập trình ASP

‰ Sử dụng các HQT CSDL có hỗ trợ Unicode

„ SQL Server 7/2000, Ms Access 2000,…

‰ Lưu ý khi sử dụng SQL Server 7/2000

„ Kiểu dữ liệu Unicode : NCHAR, NVARCHAR, NTEXT,…

„ Khi sử dụng chuỗi hằng thêm N” … “

‰ N”Chuỗi hằng Unicode”

Trang 14

3 Các phần mềm hỗ trợ Unicode

„ Soạn thảo : Notepad, FrontPage 2002, Visual

Studio.Net, DreamWeaver MX 2004,…

„ Phần mềm gõ tiếng Việt : Unikey, Vietkey,…

„ IIS 5.0 không thể đọc được các tập tin lưu dưới dạng UCS-2, không hỗ trợ CodePage của bảng

mã UTF-16 là 1200

„ IIS 4.0 không hỗ trợ CodePage của bảng mã

UTF-8 là 65001.

Ngày đăng: 22/08/2012, 10:37

HÌNH ẢNH LIÊN QUAN

„ Bảng mã – code page: tập hợp những điểm mã của một tập ký tự, gọi là trang mã, bảng  mã, bộmã. - Bài tham khảo về Web Course
Bảng m ã – code page: tập hợp những điểm mã của một tập ký tự, gọi là trang mã, bảng mã, bộmã (Trang 3)
„ VD Bảng mã ASCII - Bài tham khảo về Web Course
Bảng m ã ASCII (Trang 4)
„ Bảng mã ASCII mở rộng (128-255) mã hóa cho các ngôn ngữkhác - Bài tham khảo về Web Course
Bảng m ã ASCII mở rộng (128-255) mã hóa cho các ngôn ngữkhác (Trang 5)
„ Chỉ định bảng mã trong trang Web - Bài tham khảo về Web Course
h ỉ định bảng mã trong trang Web (Trang 10)
„ IIS 4.0 không hỗ trợ CodePage của bảng mã UTF-8 là 65001. - Bài tham khảo về Web Course
4.0 không hỗ trợ CodePage của bảng mã UTF-8 là 65001 (Trang 14)

TỪ KHÓA LIÊN QUAN

w