Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
835,6 KB
Nội dung
B GIÁO DO ĐẠI HỌC ĐÀ NẴNG TRẦN THỊ BÍCH HẰNG NGHIÊNCỨUỨNGDỤNGANTLRĐỂXỬLÝCÁCTHÔNGĐIỆPTRONGPHẦNMỀMĐANGỮ Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2013 c hoàn thành ti ĐẠI HỌC ĐÀ NẴNG ng dn khoa hc: PGS.TS. VÕ TRUNG HÙNG Phn bin 1 : TS. HUỲNH HỮU HƯNG Phn bin 2 : PGS.TS. ĐOÀN VĂN BAN Luc bo v c Hng chm Lut nghip th thut hp t i h 2013. Có thể tìm hiểu luận văn tại: - Trung tâm Thông tin - Hc lii Hng 1 MỞ ĐẦU 1. Lý do chọn đề tài h và Trong “Nghiên cứuứngdụngANTLRđểxửlýcácthôngđiệptrongphầnmềmđa ngữ” . 2. Mục tiêu và nhiệm vụ nghiêncứu tiêu cú pháp ANTLR v thuyt v c t hình thc, nghiên c lý thuyt v trình dch, nghiên cu ngôn ng ANTLR, nghiên c lý thuyt n d 3. Đối tượng và phạm vi nghiêncứu i 2 4. Phương pháp nghiêncứuTrong 5. Ý nghĩa khoa học và thực tiễn của đề tài m. 6. Cấu trúc luận văn a 3 CHƯƠNG 1 NGHIÊNCỨU TỔNG QUAN VỀ ĐẶC TẢ PHẦN MỀM, TRÌNH BIÊN DỊCH, PHẦNMỀMĐANGỮ 1.1 TỔNG QUAN VỀ ĐẶC TẢ PHẦNMỀM 1.1.1 Khái niệm đặc tả phầnmềm (1997): Mô tả thật chi tiết một bộ phận đặc biệt tiêu biểu để làm nổi bật bản chất của toàn thể”. Theo Com sự mô tả chi tiết: Về mặt phần cứng, đặc tả cung cấp thông tin về các thành phần, khả năng và yếu tố kỹ thuật của máy tính. Về mặt phần mềm, đặc tả mô tả môi trường hoạt động và chức năng của chương trình. 1.1.2 Các phương pháp đặc tả Có 1.2 TỔNG QUAN VỀ TRÌNH BIÊN DỊCH 1.2.1 Khái niệm trình biên dịch - ngô language) - png; phân tích cú pháp; phân sinh mã trung gian; ts 1.2.2 Mô hình phân tích- tổng hợp của một trình biên dịch - 4 - - cây cú pháp 1.2.3 Môi trường của trình biên dịch M 1.2.4 Các giai đoạn biên dịch : p phân tích cú pháp, psinh mã trung gian, t 1.2.5 Phân tích từ vựng (Lexical Analysis) 1.2.6 Phân tích cú pháp (Syntax Analysis) : - - 5 tích cú pháp. 1.2.7 Phân tích ngữ nghĩa (Semantic Analysis) Giai n phân tích ng thc hin vic kim tra xem n có cha li v ng p hp thông tin v kin sinh mã v sau. Mt phn quan trng n phân tích ng m tra kiu (type checking) và ép chuyi kiu. 1.2.8 Sinh mã trung gian Sau khi phân tích ng ngha, mt s trình biên dch s to ra mt dng biu din trung gian ca chng trình ngun. Chúng ta có th xem dng biu din này nh mt chng trình dành cho mt máy tru tng. Chúng có 2 c tính quan trng: d sinh và d dch thành ch ích. 1.2.9 Tối ưu mã n t gng ci thin mã trung có th có mã máy thc hit s ng. Có mt khác bit rt ln gia khng tc các trình biên dch khác nhau thc hin. Trong nhng trình biên dch gi là "trình biên dch chuyên tt phn th k n này. 1.2.10 Sinh mã đích Giai n cui cùng ca biên dng là mã máy hoc mã hp ng. Các v trí vùng nh c chn la cho mi bi d th trung gian c dch lt thành chui các ch th mã máy. V quyt nh là vic gán các bin cho các thanh ghi. 1.3 TỔNG QUAN VỀ PHẦNMỀMĐANGỮ 1.3.1 Bối cảnh về toàn cầu hóa cácphầnmềm n mc vit bng 6 ting Anc t có rt nhii trên th gii không th c và hic ting Anh. Có nhii tuy s dc ti vn yêu thích làm vic trên nhng phn mm và website trong ngôn ng m (native language) và mun chuyn sang ngôn ng ting Anh mt nhiu thi gian và công s nhu cu v hóa phn mi. 1.3.2 Khái niệm phầnmềmđangữ Phn m (Multilingual Software) là phn mm cho i s dng chn la ngôn ng (ví d: ting Anh, ting Pháp, ting Vit .) khi làm vic vi phn mi s dng s chn la ngôn ng s dng cho mình, hi ng phn mc nhu cc s nhiu. 1.3.3 Nhu cầu về đangữ hóa phầnmềm ng hóa ngôn ng trongcác sn phm phn mm là xu ng ca các nhà sn xut phn mm hin nay, bi tính toàn cu ng m rng th ng ra quc t. La chi tác dch chuyên nghi pháp mà các nhà sn xut phn mm s dng. Nhu c hóa phn mt ra mt cách t nhiên. Cùng vi quá trình toàn cu hóa, vi hóa và ba hóa phn m c các nhà khoa hc, các nhà sn xut phn mm quan tâm. 1.3.4 Các mô hình tổ chức quản lýcácthôngđiệp Có 3 mô hình t chc phn m c s dng hin nay là: Mô hình 1: n thc vit gn lin vi mã ngui ta ving Anh, so ra mt bn sao và sa li cho ting Pháp . Mô hình 2: i mã ngui các d liu ngôn ng. Các d liu ngôn ng p, các hàm .) 7 t trong mt tp tin dùng cho tt c các ngôn ng. Mô hình 3: S dg pháp tách ri mã ngun vi các d liu ngôn ng và d liu ca các ngôn ng riêng bit cho mi ngôn ng, ng vi mt ngôn ng là mt tp tin cha d liu ca ngôn ng 1.3.5 Một số công cụ quản lýthôngđiệpđangữ Hin ti có nhng h thCatgets, Ariane-G5, Gettext, dàng nhng tp x lý nhng bii ngôn ng bên trong nhp. 1.4 BỘ CÔNG CỤ GETTEXT 1.4.1 Giới thiệu Gettext Gettext: là mt phn mm mã ngun m phc v ba hóa phn mc dùng cho mt s ngôn ng thông dng. Gettext h tr dch nhp t mt ngôn ng i s dng có th c ngay. Hin ti Gettext h tr bn a hóa cho 12 ngôn ng khác nhau và mi ngôn ng s dng mt h thng mã hóa khác nhau hay có th chuyn mã v mt h thng mã duy nht là UTF-8 (Unicode Transformation Format 8- Bit). 1.4.2 Quy trình xửlýtrong Gettext hóa, ta ch yu làm vic vi tp tin: - Tp tin POT (Po u tiên file c to ra khi chúng ta dùng phn m quét mã ngun da vào các marked function bên trên. My ra các language mnh trong mã ngun. - Tp tin c ta s dch toàn b c c 1 sang ngôn ng mà chúng ta mun. - c cui cùng là dch file PO tc s dng. 8 1.4.3 Tạo tập tin mẫu PO Sau khi chun b xong ngun, tin hành to tp tin mu PO, phn này s gii thích cách s dng xgettext cho m Xgettext s to ra mt ti tên nó thành domainname.pot. 1.4.4 Tạo tập tin .PO mới Khi b u mt bn dch mi, s to mt tp tin là t bn sao ca tp tin mu package.pot. Cách d nh thc hin vi d . o ra mt tp tin .PO mi, khi to cácthông tin vi giá tr c ly t ng ci s dng. Nu không có tp tin inpc hin ti s tìm kim tp tin .POT. 1.4.5 Cập nhật tập tin PO, gọi chương trình msgmerge c. Tp tin ngun s c tìm kic này, kt qu là tp tin .po s c ghi vào tc hin hành. 1.4.6 Tạo tập tin .MO Offset O và offset T là hai bng mô t chui, mi mô t chui s dng 32 bít s u ca tp tin. Bu tiên cha các mô t v chui chun, và sp xp các chu dn theo th t trong t in. Bng th hai cha các mô t v các chuc dch và nó song song vi bng th nh tìm các chui dng cho phép truy cp ti mng trên mng th hai vi cùng ch s. 1.5 BỘ CÔNG CỤ GETAMSG 1.5.1 Mô hình hóa những thôngđiệp có chứa biến nhớ và biến thể Trong nh ng gp nh p (message) có cha nhng bin nh (variable). Nhng bin nh này kéo theo nhng bip, nguyên nhân to ra nhng bii này là do s p v ging,