TCVN 5712:1999

9 32 0
TCVN 5712:1999

Đang tải... (xem toàn văn)

Thông tin tài liệu

Tiêu chuẩn TCVN 5712:1999 quy định một bộ mã 8-bit dùng để biểu diễn, lưu trữ và trao đổi các văn bản tiếng Việt trong công nghệ thông tin. Tiêu chuẩn này quy định cấu trúc của bộ mã nói trên thông qua việc mô tả các tập ký tự thành phần và quy ước mã hóa từng ký tự trong bảng mã. Tiêu chuẩn này không quy định hình dạng cố định và kích thước của các ký tự tiếng Việt, kỹ thuật hiển thị và xử lý những ký tự này.

TIÊU CHUẨN QUỐC GIA TCVN 5712:1999 CÔNG NGHỆ THÔNG TIN - BỘ MÃ KÝ TỰ TIẾNG VIỆT 8-BIT lnformation technology -8-bit coded Vietnamese character set Lời nói đầu TCVN 5712 : 1999 thay TCVN 5712 : 1993 TCVN 5712 : 1999 Ban kỹ thuật tiêu chuẩn TCVN/JTC1 “Công nghệ Thông tin” biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng đề nghị; Bộ Khoa học, Công nghệ Môi trường (nay Bộ Khoa học Công nghệ) ban hành Tiêu chuẩn chuyển đổi năm 2008 từ Tiêu chuẩn Việt Nam số hiệu thành Tiêu chuẩn Quốc gia theo quy định khoản Điều 69 Luật Tiêu chuẩn Quy chuẩn kỹ thuật điểm a khoản Điều Nghị định số 127/2007/NĐ-CP ngày 1/8/2007 Chính phủ quy định chi tiết thi hành số điều Luật Tiêu chuẩn Quy chuẩn kỹ thuật CÔNG NGHỆ THÔNG TIN - BỘ MÃ KÝ TỰ TIẾNG VIỆT 8-BIT lnformation technology - 8-bit coded Vietnamese character set Phạm vi áp dụng 1.1 Tiêu chuẩn quy định mã 8-bit dùng để biểu diễn, lưu trữ trao đổi văn tiếng Việt công nghệ thông tin 1.2 Tiêu chuẩn quy định cấu trúc mã nói thơng qua việc mơ tả tập ký tự thành phần quy ước mã hóa ký tự bảng mã 1.3 Tiêu chuẩn không quy định hình dạng cố định kích thước ký tự tiếng Việt, kỹ thuật hiển thị xử lý ký tự Tính phù hợp Việc mã hóa văn tiếng Việt hệ thống công nghệ thông tin coi phù hợp với tiêu chuẩn có sử dụng tập ký tự quy định điều với mã ký tự tương ứng quy định điều tiêu chuẩn Tài liệu viện dẫn lSO/IEC 646 Công nghệ Thông tin - Bộ mã ký tự 7-bit dùng trao đổi thông tin Thuật ngữ định nghĩa 4.1 Ký tự: thành viên tập hợp phần tử dùng để tổ chức, điều khiển biểu diễn liệu văn 4.2 Mặt chữ: hình dạng nhìn thấy ký tự 4.3 Ký tự khả hiện: ký tự có mặt chữ xác định, nhờ mà nhìn thấy văn 4.4 Ký tự điều khiển: ký tự có chức đặc biệt, dùng để gây hành động có ảnh hưởng trực tiếp đến việc vận hành chương trình thiết bị lưu trữ, xử lý, diễn đạt trao đổi liệu văn 4.5 Tập ký tự: (hoặc vài) nhóm ký tự có số lượng thành phần phù hợp cho việc biểu diễn, lưu trữ trao đổi liệu văn mức độ xác định 4.6 Bit: đơn vị nhỏ thơng tin có hai giá trị nhị phân thường biểu thị số số 4.7 Tổ hợp bit: chuỗi bit xếp thứ tự dùng để biểu diễn (mã hóa) ký tự Tổ hợp bit sử dụng tiêu chuẩn đơn vị thơng tin có độ dài bit gọi octet byte 4.8 Mã ký tự: giá trị tổ hợp bit mã hóa ký tự tương ứng, thường biểu diễn theo số 2, 8, 10 16 4.9 Bộ mã ký tự: vài tập ký tự xác định thành phần cấu trúc với quy tắc rõ ràng thiết lập mối quan hệ - ký tự mã ký tự 4.10 Bảng mã: bảng trình bày ký tự xếp có tọa độ tương ứng với mã chúng 4.11 Vị trí: ô bảng mã có tọa độ xác định số thứ tự cột hàng Các tập ký tự Các tập ký tự quy định tiêu chuẩn bao gồm tập ký tự bản, tập ký tự mở rộng tập ký tự điều khiển 5.1 Tập ký tự Tập ký tự gồm 114 ký tự khả hiện, bao gồm nhóm chữ cái, nhóm dấu thanh, nhóm chữ số, nhóm ký hiệu nhóm dấu câu 5.1.1 Nhóm chữ Có 33 chữ thể 12 nguyên âm 21 phụ âm Mỗi chữ có hai dạng: chữ hoa chữ thường Nhóm chữ bao gồm 33 ký tự chữ hoa 33 ký tự chữ thường (xem Bảng Bảng 2) Tên đầy đủ ký tự nói xem Bảng 10 Bảng - Các ký tự nguyên âm Chữ hoa A Ă Â E Ê I O Ô Ơ U Ư Y Chữ thường a ă â e ê i o ô u y Bảng - Các ký tự phụ âm Chữ hoa B C D Đ F G H J K L M Chữ thường b c d đ f g h j k l m Chữ hoa N P Q R S T V W X Z Chữ thường n p q r s t v w x z 5.1.2 Nhóm dấu Nhóm dấu gồm có ký tự (xem bảng 3) Tên đầy đủ ký tự xem Bảng 10 Bảng - Các dấu 5.1.3 Nhóm chữ số Nhóm chữ số gồm có 10 ký tự (xem Bảng 4) Tên đầy đủ ký tự xem Bảng 10 Bảng - Các chữ số 5.1.4 Nhóm ký hiệu Nhóm ký hiệu gồm có 20 ký tự (xem Bảng 5) Tên đầy đủ ký tự xem Bảng 10 Bảng - Các ký hiệu '' # $ % & ' * + - / < = > @ \ ^ - | ‘ ~ 5.1.5 Nhóm dấu câu Nhóm dấu câu gồm có 13 ký tự (xem Bảng 6) Tên đầy đủ ký tự xem Bảng 10 Bảng - Các dấu câu SP ! ( ) , : ; ? [ ] { } 5.2 Tập ký tự mở rộng Tập ký tự mở rộng gồm có 120 ký tự khả hiện, bao gồm 60 ký tự chữ hoa mang dấu 60 ký tự chữ thường mang dấu Tên đầy đủ ký tự xem Bảng 10 Bảng - Các ký tự mang dấu Chữ hoa À Ả Ã Á Ạ Ằ Ẳ Ẵ Ắ Ặ Chữ thường ả ã ằ ẳ ẵ ắ ặ Chữ hoa Ầ Ẩ Ẫ Ấ Ậ È Ẻ Ẽ É Ẹ Chữ thường ầ ẩ ẫ ấ ậ è ẻ ẽ é ẹ Chữ hoa Ề Ể Ễ Ế Ệ Ì Ỉ Ĩ Í Ị Chữ thường ề ể ễ ế ệ ì ỉ ĩ í ị Chữ hoa Ị Ỏ Õ Ĩ Ọ Ồ Ổ Ỗ Ố Ộ Chữ thường ị ỏ õ ó ọ ổ ỗ ố ộ Chữ hoa Ờ Ở Ỡ Ớ Ợ Ù Ủ Ũ Ú Ụ Chữ thường ỡ ợ ù ủ ũ ú ụ Chữ hoa Ừ Ử Ữ Ứ Ự Ỳ Ỷ Ỹ Ý Ỵ Chữ thường ữ ứ ự ỳ ỷ ỹ ý ỵ 5.3 Tập ký tự điều khiển Tập ký tự điều khiển dùng tiêu chuẩn gồm có 21 ký tự Các ký tự điều khiển khơng có mặt chữ riêng biểu thị chữ viết tắt theo tiêu chuẩn quốc tế ISO/IEC 646 Bảng - Các ký tự điều khiển Ký tự Tên Ký tự Tên NUL KÝ TỰ RỖNG (NULL) DLE THOÁT KẾT NỐI DỮ LIỆU (DATA LINK ESCAPE) ETX CUỐI VĂN BẢN (END OF TEXT) CAN HỦY (CANCEL) BEL RUNG CHUÔNG (BELL) EM CUỐI TỆP (END OF MEDIUM) BS LÙI KÝ TỰ (BACKSPACE) SUB THAY THẾ (SUBSTITUTE) HT NHẢY NGANG (HORIZONTAL TABULATION) ESC THỐT (ESCAPE) LF XUỐNG DỊNG (LINEFEED) FS NGĂN CÁCH TỆP (FILE SEPERATOR) VT NHẢY DỌC (VERTICAL TABULATION) GS NGĂN CÁCH NHÓM (GROUP SEPERATOR) FF SANG TRANG (FORM FEED) RS NGĂN CÁCH BẢN GHI (RECORD SEPERATOR) CR VỀ ĐẦU DÒNG (CARRIAGE RETURN) US NGĂN CÁCH ĐƠN VỊ (UNIT SEPERATTOR) SO THAY ĐỔI NHÓM KÝ TỰ (SHIFT OUT) DEL XÓA (DELETE) SI TRỞ VỀ NHÓM KÝ TỰ GỐC (SHIP IN) Bảng mã tên ký tự 6.1 Bảng mã 8-bit gồm 256 ô xếp theo 16 hàng 16 cột Các hàng (hoặc cột) đánh số thứ tự từ đến F theo số 16 6.2 Vị trí bảng mã xác định tọa độ (x, y), x số cột y số hàng tương ứng ô 6.3 Tọa độ (x, y) ô cho biết mã ký tự đặt dạng số 16 Mỗi ký tự ô xác định mã thập phân gồm ba chữ số ghi 6.4 Tất ký tự quy định điều có mã tương ứng Bảng 6.5 Tên đầy đủ ký tự mã tương ứng chúng trình bày Bảng 10 Bảng - Bảng mã kí tự Bảng 10 - Bảng tên kí tự Mã Kí tự Tên kí tự 00 NUL Kí tự rỗng (null) Mã Kí tự Tên kí tự 18 CAN Hủy (cancel) 01 Ú Chữ U hoa với dấu sắc 19 EM Cuối tệp (end of medium) 02 Ụ Chữ U hoa với dấu nặng 1A SUB Thay (substitute) 1B ESC Thoát (escape) 03 ETX Cuối văn (end of text) 04 Ừ Chữ Ư hoa với dấu huyền 1C FS Ngăn cách tệp (file separator) 05 Ử Chữ Ư hoa với dấu hỏi 1D GS Ngăn cách nhóm (group separator) 06 Ữ Chữ Ư hoa với dấu ngã 1E RS Ngăn cách ghi (record separator) 07 BEL Rung chuông (bell) 1F US Ngăn cách đơn vị (unit separator) 08 BS Lùi kí tự (back space) 20 SP 09 HT Nhảy ngang (horizontal tabulation) 21 Ị Dấu chấm than 0A LF Xuống dòng (line feed) 22 “ Dấu nháy kép 0B VT Nhảy dọc (vertical tabulation) 23 # Dấu rào 0C FF Sang trang (form feed) 24 $ Dấu đô la 0D CR Về đầu dòng (carriage return) 25 % Dấu phần trăm 0E SO Thay đổi nhóm kí tự (shift out) 26 & Dấu 0F SI Trở nhóm kí tự gốc (shift in) 27 ‘ Dấu nháy đơn DLE Thoát kết nối liệu (data link escape) 28 ( Dấu mở ngoặc đơn 10 Dấu cách (SPACE) 11 Ứ Chữ Ư hoa với dấu sắc 29 ) Dấu đóng ngoặc đơn 12 Ự Chữ Ư hoa với dấu nặng 2A * Dấu 13 Ỳ Chữ Y hoa với dấu huyền 2B + Dấu cộng 14 Ỷ Chữ Y hoa với dấu hỏi 2C , Dấu phảy 15 Ỹ Chữ Y hoa với dấu ngã 2D - Dấu trừ 16 Ý Chữ Y hoa với dấu sắc 2E Dấu chấm 17 Ỵ Chữ Y hoa với dấu nặng 2F / Dấu chia Bảng 10 (tiếp theo) Mã Kí tự 30 31 Tên kí tự Mã Kí tự Tên kí tự Chữ số khơng 4A J Chữ J hoa Chữ số 4B K Chữ K hoa 32 Chữ số hai 4C L Chữ L hoa 33 Chữ số ba 4D M Chữ M hoa 34 Chữ số bốn 4E N Chữ N hoa 35 Chữ số năm 4F O Chữ O hoa 36 Chữ số sáu 50 P Chữ P hoa 37 Chữ số bảy 51 Q Chữ Q hoa 38 Chữ số tám 52 R Chữ R hoa 39 Chữ số chín 53 S Chữ S hoa 3A : Dấu hai chấm 54 T Chữ T hoa 3B ; Dấu chấm phẩy 55 U Chữ U hoa 3C < Dấu nhỏ 56 V Chữ V hoa 3D = Dấu 57 W Chữ W hoa 3E > Dấu lớn 58 X Chữ X hoa 3F ? Dấu chấm hỏi 59 Y Chữ Y hoa 40 @ Dấu a vòng 5A Z Chữ Z hoa 41 A Chữ A hoa 5B [ Dấu mở ngoặc vuông 42 B Chữ B hoa 5C \ Dấu sổ ngược 43 C Chữ C hoa 5D ] Dấu đóng ngoặc vuông 44 D Chữ D hoa 5E ^ Dấu mũ 45 E Chữ E hoa 5F _ Dấu gạch 46 F Chữ F hoa 60 ` Dấu trọng âm 47 G Chữ G hoa 61 a Chữ a thường 48 H Chữ H hoa 62 b Chữ b thường 49 I Chữ I hoa 63 c Chữ c thường Bảng 10 (tiếp theo) Mã Kí tự 64 d 65 Tên kí tự Mã Kí tự Tên kí tự Chữ d thường 7C | Dấu sổ đứng e Chữ e thường 7D } Dấu đóng ngoặc nhọn 66 f Chữ f thường 7E ~ Dấu sóng 67 g Chữ g thường 7F 68 h Chữ h thường 80 À Chữ A hoa với dấu huyền 69 i Chữ i thường 81 Ả Chữ A hoa với dấu hỏi 6A j Chữ j thường 82 Ã Chữ A hoa với dấu ngã 6B k Chữ k thường 83 Á Chữ A hoa với dấu sắc 6C i Chữ i thường 84 Ạ Chữ A hoa với dấu nặng 6D m Chữ m thường 85 Ặ Chữ Ă hoa với dấu nặng 6E n Chữ n thường 86 Ậ Chữ Â hoa với dấu nặng 6F o Chữ o thường 87 È Chữ E hoa với dấu huyền 70 p Chữ p thường 88 Ẻ Chữ E hoa với dấu hỏi 71 q Chữ q thường 89 Ẽ Chữ E hoa với dấu ngã 72 r Chữ r thường 8A É Chữ E hoa với dấu sắc 73 s Chữ s thường 8B Ẹ Chữ E hoa với dấu nặng 74 t Chữ t thường 8C Ệ Chữ Ê hoa với dấu nặng 75 u Chữ u thường 8D Ì Chữ I hoa với dấu huyền 76 v Chữ v thường 8E Ỉ Chữ I hoa với dấu hỏi 77 w Chữ w thường 8F Ĩ Chữ I hoa với dấu ngã 78 x Chữ x thường 90 Í Chữ I hoa với dấu sắc 79 y Chữ y thường 91 Ị Chữ I hoa với dấu nặng 7A z Chữ z thường 92 Ò Chữ O hoa với dấu huyền 7B { Dấu mở ngoặc nhọn 93 Ỏ Chữ O hoa với dấu hỏi DEL Dấu xóa (DELETE) Bảng 10 (tiếp theo) Mã Kí tự 94 Õ 95 96 Tên kí tự Mã Kí tự Tên kí tự Chữ O hoa với dấu ngã AC Chữ thường Ó Chữ O hoa với dấu sắc AD Chữ thường Ọ Chữ O hoa với dấu nặng AE đ Chữ đ thường 97 Ộ Chữ Ô hoa với dấu nặng AF 98 Ờ Chữ Ơ hoa với dấu huyền B0 Dấu huyền 99 Ở Chữ Ơ hoa với dấu hỏi B1 Dấu hỏi 9A Ỡ Chữ Ơ hoa với dấu ngã B2 Dấu ngã 9B Ớ Chữ Ơ hoa với dấu sắc B3 Dấu sắc 9C Ợ Chữ Ơ hoa với dấu nặng B4 Dấu nặng 9D Ù Chữ U hoa với dấu huyền B5 Chữ a thường với dấu huyền 9E Ủ Chữ U hoa với dấu hỏi B6 ả Chữ a thường với dấu hỏi 9F Ũ Chữ U hoa với dấu ngã B7 ã Chữ a thường với dấu ngã B8 Chữ a thường với dấu sắc A0 NBSP Dấu không dãn cách (NO BREAK SPACE) Ằ Chữ Ă hoa với dấu huyền A1 Ă Chữ Ă hoa B9 Chữ a thường với dấu nặng A2 Â Chữ Â hoa BA Ẳ Chữ Ă hoa với dấu hỏi A3 Ê Chữ Ê hoa BB ằ Chữ ă thường với dấu huyền A4 Ô Chữ Ô hoa BC ẳ Chữ ă thường với dấu hỏi A5 Ơ Chữ Ơ hoa BD ẵ Chữ ă thường với dấu ngã A6 Ư Chữ Ư hoa BE ắ Chữ ă thường với dấu sắc A7 Đ Chữ Đ hoa BF Ẵ Chữ Ă hoa với dấu ngã A8 ă Chữ ă thường C0 Ắ Chữ Ă hoa với dấu sắc A9 â Chữ â thường C1 Ầ Chữ Â hoa với dấu huyền AA ê Chữ ê thường C2 Ẩ Chữ Â hoa với dấu hỏi AB ô Chữ ô thường C3 Ẫ Chữ Â hoa với dấu ngã Bảng 10 (tiếp theo) Mã Kí tự C4 Ấ C5 Tên kí tự Mã Kí tự Tên kí tự Chữ Â hoa với dấu sắc DD í Chữ i thường với dấu sắc Ề Chữ Ê hoa với dấu huyền DE ị Chữ i thường với dấu nặng C6 ặ Chữ ă thường với dấu nặng DF ò Chữ o thường với dấu huyền C7 ầ Chữ â thường với dấu huyền E0 Ổ Chữ Ô hoa với dấu hỏi C8 ẩ Chữ â thường với dấu hỏi E1 ỏ Chữ o thường với dấu hỏi C9 ẫ Chữ â thường với dấu ngã E2 õ Chữ o thường với dấu ngã CA ấ Chữ â thường với dấu sắc E3 ó Chữ o thường với dấu sắc CB ậ Chữ â thường với dấu nặng E4 ọ Chữ o thường với dấu nặng CC è Chữ e thường với dấu huyền E5 Chữ ô thường với dấu huyền CD Ể Chữ Ê hoa với dấu hỏi E6 ổ Chữ ô thường với dấu hỏi CE ẻ Chữ e thường với dấu hỏi E7 ỗ Chữ ô thường với dấu ngã CF ẽ Chữ e thường với dấu ngã E8 ố Chữ ô thường với dấu sắc D0 é Chữ e thường với dấu sắc E9 ộ Chữ ô thường với dấu nặng D1 ẹ Chữ e thường với dấu nặng EA Chữ thường với dấu huyền D2 ề Chữ ê thường với dấu huyền EB Chữ thường với dấu hỏi D3 ể Chữ ê thường với dấu hỏi EC ỡ Chữ thường với dấu ngã D4 ễ Chữ ê thường với dấu ngã ED Chữ thường với dấu sắc D5 ế Chữ ê thường với dấu sắc EE ợ Chữ thường với dấu nặng D6 ệ Chữ ê thường với dấu nặng EF ù Chữ u thường với dấu huyền D7 ì Chữ i thường với dấu huyền F0 Ỗ Chữ Ô hoa với dấu ngã D8 ỉ Chữ i thường với dấu hỏi F1 ủ Chữ u thường với dấu hỏi D9 Ễ Chữ Ê hoa với dấu ngã F2 ũ Chữ u thường với dấu ngã DA Ế Chữ Ê hoa với dấu sắc F3 ú Chữ u thường với dấu sắc DB Ồ Chữ Ô hoa với dấu huyền F4 ụ Chữ u thường với dấu nặng DC ĩ Chữ i thường với dấu ngã F5 Chữ thường với dấu huyền Mã Kí tự Mã Kí tự F6 Chữ thường với dấu hỏi FB ỷ Chữ y thường với dấu hỏi F7 ữ Chữ thường với dấu ngã FC ỹ Chữ y thường với dấu ngã F8 ứ Chữ thường với dấu sắc FD ý Chữ y thường với dấu sắc F9 ự Chữ thường với dấu nặng FE ỵ Chữ y thường với dấu nặng FA ỳ Chữ y thường với dấu huyền FF Ố Chữ Ô hoa với dấu sắc Tên kí tự Tên kí tự

Ngày đăng: 27/10/2020, 17:38

Hình ảnh liên quan

Bảng 6- Các dấu câu - TCVN 5712:1999

Bảng 6.

Các dấu câu Xem tại trang 3 của tài liệu.
Nhóm dấu câu gồm có 13 ký tự (xem Bảng 6). Tên đầy đủ của các ký tự này xem trong Bảng 10. - TCVN 5712:1999

h.

óm dấu câu gồm có 13 ký tự (xem Bảng 6). Tên đầy đủ của các ký tự này xem trong Bảng 10 Xem tại trang 3 của tài liệu.
6 Bảng mã và tên ký tự - TCVN 5712:1999

6.

Bảng mã và tên ký tự Xem tại trang 4 của tài liệu.
Bảng 10 - Bảng tên các kí tự - TCVN 5712:1999

Bảng 10.

Bảng tên các kí tự Xem tại trang 5 của tài liệu.
Bảng 10 (tiếp theo) - TCVN 5712:1999

Bảng 10.

(tiếp theo) Xem tại trang 6 của tài liệu.
Bảng 10 (tiếp theo) - TCVN 5712:1999

Bảng 10.

(tiếp theo) Xem tại trang 7 của tài liệu.
Bảng 10 (tiếp theo) - TCVN 5712:1999

Bảng 10.

(tiếp theo) Xem tại trang 8 của tài liệu.

Tài liệu cùng người dùng

Tài liệu liên quan