Thông tin tài liệu
B GIÁO DO ĐẠI HỌC ĐÀ NẴNG TRẦN THỊ BÍCH HẰNG NGHIÊN CỨU ỨNG DỤNG ANTLR ĐỂ XỬ LÝ CÁC THÔNG ĐIỆP TRONG PHẦN MỀM ĐA NGỮ Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2013 c hoàn thành ti ĐẠI HỌC ĐÀ NẴNG ng dn khoa hc: PGS.TS. VÕ TRUNG HÙNG Phn bin 1 : TS. HUỲNH HỮU HƯNG Phn bin 2 : PGS.TS. ĐOÀN VĂN BAN Luc bo v c Hng chm Lut nghip th thut hp t i h 2013. Có thể tìm hiểu luận văn tại: - Trung tâm Thông tin - Hc lii Hng 1 MỞ ĐẦU 1. Lý do chọn đề tài h và Trong “Nghiên cứu ứng dụng ANTLR để xử lý các thông điệp trong phần mềm đa ngữ” . 2. Mục tiêu và nhiệm vụ nghiên cứu tiêu cú pháp ANTLR v thuyt v c t hình thc, nghiên c lý thuyt v trình dch, nghiên cu ngôn ng ANTLR, nghiên c lý thuyt n d 3. Đối tượng và phạm vi nghiên cứu i 2 4. Phương pháp nghiên cứu Trong 5. Ý nghĩa khoa học và thực tiễn của đề tài m. 6. Cấu trúc luận văn a 3 CHƯƠNG 1 NGHIÊN CỨU TỔNG QUAN VỀ ĐẶC TẢ PHẦN MỀM, TRÌNH BIÊN DỊCH, PHẦN MỀM ĐA NGỮ 1.1 TỔNG QUAN VỀ ĐẶC TẢ PHẦN MỀM 1.1.1 Khái niệm đặc tả phần mềm (1997): Mô tả thật chi tiết một bộ phận đặc biệt tiêu biểu để làm nổi bật bản chất của toàn thể”. Theo Com sự mô tả chi tiết: Về mặt phần cứng, đặc tả cung cấp thông tin về các thành phần, khả năng và yếu tố kỹ thuật của máy tính. Về mặt phần mềm, đặc tả mô tả môi trường hoạt động và chức năng của chương trình. 1.1.2 Các phương pháp đặc tả Có 1.2 TỔNG QUAN VỀ TRÌNH BIÊN DỊCH 1.2.1 Khái niệm trình biên dịch - ngô language) - png; phân tích cú pháp; phân sinh mã trung gian; ts 1.2.2 Mô hình phân tích- tổng hợp của một trình biên dịch - 4 - - cây cú pháp 1.2.3 Môi trường của trình biên dịch M 1.2.4 Các giai đoạn biên dịch : p phân tích cú pháp, psinh mã trung gian, t 1.2.5 Phân tích từ vựng (Lexical Analysis) 1.2.6 Phân tích cú pháp (Syntax Analysis) : - - 5 tích cú pháp. 1.2.7 Phân tích ngữ nghĩa (Semantic Analysis) Giai n phân tích ng thc hin vic kim tra xem n có cha li v ng p hp thông tin v kin sinh mã v sau. Mt phn quan trng n phân tích ng m tra kiu (type checking) và ép chuyi kiu. 1.2.8 Sinh mã trung gian Sau khi phân tích ng ngha, mt s trình biên dch s to ra mt dng biu din trung gian ca chng trình ngun. Chúng ta có th xem dng biu din này nh mt chng trình dành cho mt máy tru tng. Chúng có 2 c tính quan trng: d sinh và d dch thành ch ích. 1.2.9 Tối ưu mã n t gng ci thin mã trung có th có mã máy thc hit s ng. Có mt khác bit rt ln gia khng tc các trình biên dch khác nhau thc hin. Trong nhng trình biên dch gi là "trình biên dch chuyên tt phn th k n này. 1.2.10 Sinh mã đích Giai n cui cùng ca biên dng là mã máy hoc mã hp ng. Các v trí vùng nh c chn la cho mi bi d th trung gian c dch lt thành chui các ch th mã máy. V quyt nh là vic gán các bin cho các thanh ghi. 1.3 TỔNG QUAN VỀ PHẦN MỀM ĐA NGỮ 1.3.1 Bối cảnh về toàn cầu hóa các phần mềm n mc vit bng 6 ting Anc t có rt nhii trên th gii không th c và hic ting Anh. Có nhii tuy s dc ti vn yêu thích làm vic trên nhng phn mm và website trong ngôn ng m (native language) và mun chuyn sang ngôn ng ting Anh mt nhiu thi gian và công s nhu cu v hóa phn mi. 1.3.2 Khái niệm phần mềm đa ngữ Phn m (Multilingual Software) là phn mm cho i s dng chn la ngôn ng (ví d: ting Anh, ting Pháp, ting Vit .) khi làm vic vi phn mi s dng s chn la ngôn ng s dng cho mình, hi ng phn mc nhu cc s nhiu. 1.3.3 Nhu cầu về đa ngữ hóa phần mềm ng hóa ngôn ng trong các sn phm phn mm là xu ng ca các nhà sn xut phn mm hin nay, bi tính toàn cu ng m rng th ng ra quc t. La chi tác dch chuyên nghi pháp mà các nhà sn xut phn mm s dng. Nhu c hóa phn mt ra mt cách t nhiên. Cùng vi quá trình toàn cu hóa, vi hóa và ba hóa phn m c các nhà khoa hc, các nhà sn xut phn mm quan tâm. 1.3.4 Các mô hình tổ chức quản lý các thông điệp Có 3 mô hình t chc phn m c s dng hin nay là: Mô hình 1: n thc vit gn lin vi mã ngui ta ving Anh, so ra mt bn sao và sa li cho ting Pháp . Mô hình 2: i mã ngui các d liu ngôn ng. Các d liu ngôn ng p, các hàm .) 7 t trong mt tp tin dùng cho tt c các ngôn ng. Mô hình 3: S dg pháp tách ri mã ngun vi các d liu ngôn ng và d liu ca các ngôn ng riêng bit cho mi ngôn ng, ng vi mt ngôn ng là mt tp tin cha d liu ca ngôn ng 1.3.5 Một số công cụ quản lý thông điệp đa ngữ Hin ti có nhng h thCatgets, Ariane-G5, Gettext, dàng nhng tp x lý nhng bii ngôn ng bên trong nhp. 1.4 BỘ CÔNG CỤ GETTEXT 1.4.1 Giới thiệu Gettext Gettext: là mt phn mm mã ngun m phc v ba hóa phn mc dùng cho mt s ngôn ng thông dng. Gettext h tr dch nhp t mt ngôn ng i s dng có th c ngay. Hin ti Gettext h tr bn a hóa cho 12 ngôn ng khác nhau và mi ngôn ng s dng mt h thng mã hóa khác nhau hay có th chuyn mã v mt h thng mã duy nht là UTF-8 (Unicode Transformation Format 8- Bit). 1.4.2 Quy trình xử lý trong Gettext hóa, ta ch yu làm vic vi tp tin: - Tp tin POT (Po u tiên file c to ra khi chúng ta dùng phn m quét mã ngun da vào các marked function bên trên. My ra các language mnh trong mã ngun. - Tp tin c ta s dch toàn b c c 1 sang ngôn ng mà chúng ta mun. - c cui cùng là dch file PO tc s dng. 8 1.4.3 Tạo tập tin mẫu PO Sau khi chun b xong ngun, tin hành to tp tin mu PO, phn này s gii thích cách s dng xgettext cho m Xgettext s to ra mt ti tên nó thành domainname.pot. 1.4.4 Tạo tập tin .PO mới Khi b u mt bn dch mi, s to mt tp tin là t bn sao ca tp tin mu package.pot. Cách d nh thc hin vi d . o ra mt tp tin .PO mi, khi to các thông tin vi giá tr c ly t ng ci s dng. Nu không có tp tin inpc hin ti s tìm kim tp tin .POT. 1.4.5 Cập nhật tập tin PO, gọi chương trình msgmerge c. Tp tin ngun s c tìm kic này, kt qu là tp tin .po s c ghi vào tc hin hành. 1.4.6 Tạo tập tin .MO Offset O và offset T là hai bng mô t chui, mi mô t chui s dng 32 bít s u ca tp tin. Bu tiên cha các mô t v chui chun, và sp xp các chu dn theo th t trong t in. Bng th hai cha các mô t v các chuc dch và nó song song vi bng th nh tìm các chui dng cho phép truy cp ti mng trên mng th hai vi cùng ch s. 1.5 BỘ CÔNG CỤ GETAMSG 1.5.1 Mô hình hóa những thông điệp có chứa biến nhớ và biến thể Trong nh ng gp nh p (message) có cha nhng bin nh (variable). Nhng bin nh này kéo theo nhng bip, nguyên nhân to ra nhng bii này là do s p v ging,
Ngày đăng: 30/12/2013, 22:21
Xem thêm: Nghiên cứu ứng dụng ANTLR để xử lý các thông điệp trong phần mềm đa ngữ , Nghiên cứu ứng dụng ANTLR để xử lý các thông điệp trong phần mềm đa ngữ