1. Trang chủ
  2. » Thể loại khác

GIẢI PHÁP PHIÊN ÂM TỪ VỰNG TIẾNG ANH TRONG VĂN BẢN TIẾNG VIỆT LUẬN VĂN THẠC SĨ KỸ THUẬT

58 18 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 58
Dung lượng 2,34 MB

Nội dung

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA TRẦN VĂN NHUỘM GIẢI PHÁP PHIÊN ÂM TỪ VỰNG TIẾNG ANH TRONG VĂN BẢN TIẾNG VIỆT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2017 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA TRẦN VĂN NHUỘM GIẢI PHÁP PHIÊN ÂM TỪ VỰNG TIẾNG ANH TRONG VĂN BẢN TIẾNG VIỆT Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ KỸ THUẬT Người hướng dẫn khoa học: TS Ninh Khánh Duy Đà Nẵng - Năm 2017 i LỜI CAM ĐOAN Tôi cam đoan công trình nghiên cứu riêng tơi Các số liệu, kết nêu luận văn trung thực chưa cơng bố cơng trình khác Tác giả luận văn Trần Văn Nhuộm ii TÓM TẮT LUẬN VĂN GIẢI PHÁP PHIÊN ÂM TỪ VỰNG TIẾNG ANH TRONG VĂN BẢN TIẾNG VIỆT Học viên: Trần Văn Nhuộm Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 Trường Đại học Bách khoa Đà Nẵng Tóm tắt – Trong nghiên cứu xử lý ngôn ngữ tự nhiên, xử lý văn tiếng nói tốn chuẩn hóa văn tiếng Việt vấn đề quan trọng Bởi số văn tiếng Việt thường chứa nhiều từ không chuẩn chữ viết tắt, chữ số từ ngữ nước Luận văn đưa giải pháp phiên âm từ vựng tiếng Anh văn tiếng Việt Thông qua nghiên cứu tương đồng cách phát âm ngữ âm tiếng Anh tiếng Việt Và nghiên cứu cấu trúc âm tiết, quy tắc ghép âm vần, điệu tiếng Việt tiếng Anh Tơi đưa thuật tốn triển khai số thuật toán để tách chuỗi âm vị tiếng Anh thành âm tiết phát âm tiếng Việt tạo ánh xạ từ âm vị tiếng Anh từ điển Carnegie Mellon University (CMU) thành âm vị tiếng Việt Từ đó, xây dựng cơng cụ tự động phiên âm từ vựng tiếng Anh thành từ tiếng Việt Cơng cụ hữu ích tích hợp vào phần mềm chuyển văn thành tiếng nói tiếng Việt Từ khóa – Chuẩn hóa văn bản; phiên âm tiếng Anh; tiếng Việt; từ điển CMU; IPA; t2p INTRODUCES SOLUTION FOR ENGLISH PHONETIC TRANSCRIPTION IN VIETNAMESE TEXT Abstract – In the research of natural language processing, word processing and speech processing, the Vietnamese text normalization is an important problem The cause is Vietnamese language recently contains many non-standard words like abbreviations, numbers and foreign words This thesis introduces solution for English phonetic transcription in Vietnamese text Through the research on the similarity of pronunciation and phonetics and syllabic structure, rules of rhymes, tone in Vietnamese and English, I've come up with the algorithm and establish an algorithm split English phonetic transcription into syllables that is able to be pronounced in Vietnamese and create English phonemes in CMU dictionary to Vietnamese phonemes mapping Then, the automatic tool translates English into Vietnamese vocabulary This tool is very useful to integrate a text into speech software in Vietnamese Key word – Text normalization; English transliteration; Vietnamese; CMU Dictionary; IPA; t2p iii MỤC LỤC LỜI CAM ĐOAN .i TÓM TẮT LUẬN VĂN ii MỤC LỤC iii DANH MỤC CÁC BẢNG v DANH MỤC CÁC HÌNH vi MỞ ĐẦU 1 Lý chọn đề tài Mục đích ý nghĩa đề tài Mục tiêu nhiệm vụ .2 Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Bố cục luận văn .3 Chương TỔNG QUAN .4 1.1 GIỚI THIỆU 1.2 MỘT SỐ ĐỊNH NGHĨA VÀ THUẬT NGỮ .5 1.2.1 Arpabet 1.2.2 International Phonetic Alphabet 1.2.3 Temp .5 1.2.4 t2p Chương NGỮ ÂM VÀ ÂM VỊ HỌC CỦA TIẾNG ANH VÀ TIẾNG VIỆT 2.1 MỞ ĐẦU 2.2 TỔNG QUAN VỀ NGỮ ÂM .6 2.2.1 Ngữ âm gi? 2.2.2 Đơn vị kết cấu ngữ âm 2.3 ÂM TIẾT TIẾNG ANH VÀ TIẾNG VIỆT 2.3.1 Khái niệm .7 2.3.2 Cấu trúc 2.3.3 Đối chiếu cấu trúc âm tiết Việt – Anh 17 2.4 ÂM VỊ TIẾNG ANH VÀ TIẾNG VIỆT 18 2.4.1 Âm vị tiếng Anh 18 2.4.2 Âm vị tiếng Việt 21 2.5 NGUYÊN ÂM TRONG TIẾNG ANH VÀ TIẾNG VIỆT 23 2.5.1 Nguyên âm tiếng Anh 23 iv 2.5.2 Nguyên âm tiếng Việt 24 2.5.3 Đối chiếu 25 2.6 PHỤ ÂM TRONG TIẾNG ANH VÀ TIẾNG VIỆT 27 2.6.1 Phụ âm tiếng Anh .27 2.6.2 Phụ âm tiếng Việt .27 2.6.3 Đối chiếu 28 2.7 KẾT CHƯƠNG 29 Chương CÁC THUẬT TOÁN VÀ CÀI ĐẶT 30 3.1 MỞ ĐẦU 30 3.2 THUẬT TOÁN TỔNG QUAN 30 3.3 THUẬT TỐN TÌM BIÊN ÂM TIẾT DỰA VÀO NGUYÊN ÂM 31 3.4 THUẬT TOÁN THÊM PHỤ ÂM VÀO ĐẦU ÂM TIẾT 32 3.5 THUẬT TOÁN THÊM PHỤ ÂM VÀO CUỐI ÂM TIẾT 33 3.6 THUẬT TOÁN BỔ SUNG NGUYÊN ÂM ĐỂ TẠO ÂM TIẾT MỚI .34 3.7 XỬ LÝ CÁC TRƯỜNG HỢP NGOẠI LỆ VÀ ÁNH XẠ 35 3.7.1 Tiền xử lý ngoại lệ 35 3.7.2 Ánh xạ 36 3.8 KẾT CHƯƠNG 36 Chương THỰC NGHIỆM VÀ ĐÁNH GIÁ 37 4.1 MÔI TRƯỜNG THỰC NGHIỆM 37 4.1.1 Công cụ hỗ trợ .37 4.1.2 Hướng dẫn sử dụng 37 4.2 DỮ LIỆU TỪ ĐIỂN 37 4.3 KẾT QUẢ VÀ ĐÁNH GIÁ 38 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 42 TÀI LIỆU THAM KHẢO .43 QUYẾT ĐỊNH GIAO ĐỀ TÀI BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC PHẢN BIỆN v DANH MỤC CÁC BẢNG Số hiệu bảng Tên bảng Trang 2.1 Cấu trúc âm tiết tiếng Việt 2.2 Hệ thống phụ âm đầu 10 2.3 Hệ thống phụ âm 10 2.4 Hệ thống nguyên âm 12 2.5 Hệ thống nguyên âm 12 2.6 Phụ âm cuối tiếng Việt 14 2.7 Cấu trúc âm tiết tiếng Anh 15 2.8 Âm vị tiếng Anh [3] 18 2.9 Âm vị tiếng Việt [6] 21 2.10 Phụ âm đầu tiếng Anh 27 2.11 Bảng phụ âm tiếng Việt 27 2.12 Phụ âm cuối tiếng Việt 28 3.1 Tổ hợp nguyên âm phụ âm cuối 35 4.1 Thống kê kết thực nghiệm chương trình 38 vi DANH MỤC CÁC HÌNH Số hiệu hình Tên bảng Trang 1.1 Kết định xây dựng t2p [7] 2.1 So sánh âm vị tiếng Việt tiếng Anh [6] 2.2 Thanh điệu 14 3.1 Thuật toán tổng quan 30 3.2 Tìm biên âm tiết 31 3.3 Thêm phụ âm vào đầu âm tiết 32 3.4 Thêm phụ âm vào cuối âm tiết 33 3.5 Bổ sung nguyên âm vào âm tiết 34 4.1 Chương trình phiên âm 37 MỞ ĐẦU Lý chọn đề tài Chuyển văn thành tiếng nói máy tính đạt thành tựu khả quan Đã có nhiều hệ thống tổng hợp tiếng nói nhằm đáp ứng ứng dụng thiết thực xã hội, cụ thể ứng dụng đọc văn hình, hay sở liệu tham gia giao thông cho người khiếm thị,… Tuy nhiên, với phát triển xã hội ngày phương tiện thông tin, phương tiện truyền thông, mạng xã hội, … Chúng ta thường hay bắt gặp từ có nguồn gốc từ tiếng Anh xuất với tần suất ngày nhiều biển báo giao thông, bảng hướng dẫn đường văn tiếng Việt khác,… Trong thời đại hội nhập quốc tế xu khơng tránh khỏi Tuy nhiên, việc xuất từ tiếng Anh gây khó khăn cho cơng nghệ nghiên cứu xử lý ngôn ngữ tự nhiên, xử lý văn xử lý tiếng nói ví dụ hệ thống chuyển văn thành tiếng nói, hệ thống nhận diện tiếng nói, … Trong hệ chuyển văn tiếng Việt thành tiếng nói, từ viết tiếng nước ngồi cần Việt hóa cách phát âm để máy tính chuyển thành tiếng nói người Việt Trong hệ nhận dạng tiếng nói khơng giới hạn từ vựng dành cho người Việt, từ không nằm tập từ vựng hệ (out-of-vocabulary words) cần Việt hóa cách phát âm để máy tính giải mã đoạn tín hiệu âm từ Vì vậy, tơi tiến hành nghiên cứu để tìm “Giải pháp phiên âm từ vựng tiếng Anh văn tiếng Việt” Xây dựng công cụ phiên âm từ vựng tiếng Anh thành từ tiếng Việt, hay nói cánh khác Việt hóa cách phát âm từ vựng tiếng Anh văn tiếng Việt Mục đích ý nghĩa đề tài 2.1 Mục đích Mục đích nghiên cứu đề tài: - Nghiên cứu đề xuất giải pháp phiên âm từ vựng tiếng Anh văn tiếng Việt - Tích hợp giải pháp đề xuất vào hệ thống phiên âm từ vựng tiếng Anh thành từ tiếng Việt 2.2 Ý nghĩa khoa học thực tiễn đề tài Đóng góp mặt phương pháp luận thực nghiệm vào lĩnh vực chuẩn hóa văn bản, nhánh nghiên cứu xử lý ngôn ngữ tự nhiên Cơng cụ Việt hóa từ vựng tiếng Anh nên tích hợp vào hệ thống chuyển văn tiếng Việt thành tiếng nói máy tính giúp cho hệ thống phát huy hiệu Mục tiêu nhiệm vụ 3.1 Mục tiêu - Nghiên cứu, so sánh đối chiếu số vấn đề trọng tâm ngữ âm tiếng Anh tiếng Việt - Nghiên cứu, tổng hợp âm vị tiếng Anh, tiếng Việt - Nghiên cứu xây dựng thuật toán tổng quát để ánh xạ từ âm vị tiếng Anh từ điển CMU thành âm vị tiếng Việt 3.2 Nhiệm vụ Để đạt mục tiêu đề tài nhiệm vụ cần thiết phải làm là: - Tổng hợp tài liệu ngữ âm tiếng Anh, tiếng Việt - Thống kê bảng âm vị tiếng Anh, tiếng Việt - Từ đặc điểm ngữ âm tiếng Anh, tiếng Việt đề xuất thuật toán tách nguyên âm, thêm phụ âm đầu, thêm phụ âm cuối, bổ sung nguyên âm,… - Xây dựng ánh xạ âm vị tiếng Anh thành âm vị tiếng Việt - Hệ thống thuật toán tách nguyên âm, thêm phụ âm đầu, thêm phụ âm cuối, bổ sung nguyên âm,… thành thuật toán tổng quát - Cài đặt thuật toán thực nghiệm với số từ vựng xuất nhiều trang báo điện tử - Dựa kết thực nghiệm để đánh giá kết đề tài Đối tượng phạm vi nghiên cứu - Các từ vựng tiếng Anh văn tiếng Việt - Giải pháp phiên âm từ vựng tiếng Anh thành cách phát âm tiếng Việt Phương pháp nghiên cứu 5.1 Phương pháp lý thuyết - Tìm nghiên cứu tài liệu có liên quan đến xử lý ngôn ngữ tự nhiên, xử lý tiếng nói ngữ âm tiếng Anh, tiếng Việt - So sánh, phân tích đưa giải pháp tối ưu cho yêu cầu đề tài 5.2 Phương pháp thực nghiệm - Tìm, nghiên cứu khai thác cơng cụ phần mềm hỗ trợ - Kiểm tra, thực nghiệm, nhận xét đánh giá kết 36 * Xử lý cặp nguyên âm phụ âm cuối đôi với Trên sở đặc điểm tương đồng cách tương đối phát âm âm vị tiếng Việt, vấn đề xử lý cách thay hai âm vị mọt âm vị có cách phát âm tương đồng Quy tắc sau: AHAX (âơ); NG, ENGEN (ngn); AX, IX, ER, AXR, UH R  AH (ơâ) 3.7.2 Ánh xạ Sau bước tiền xử lý ta thu chuỗi âm tiết hoàn chỉnh, tuân thủ quy tắc ghép âm vần tiếng Việt Bước cuối ánh xạ từ chuỗi âm tiếng Anh thành chuỗi âm tiết phát âm tiếng Việt dựa Bảng 2.8 2.9 âm vị tiếng Anh, tiếng Việt 3.8 KẾT CHƯƠNG Khi bắt đầu nghiên cứu để tìm thuật tốn tổng qt giải toán phiên âm từ vựng tiếng Anh thành từ tiếng Việt cho thấy có nhiều vấn đề vơ khó khăn chúng có tương đồng ngữ âm bên cạnh có khơng khác biệt Vì kết từ thuật tốn tìm mang tính tương đối nhằm góp chút cơng sức cho lĩnh vực nghiên cứu ngơn ngữ tự nhiên nói chung chuẩn hóa văn nói riêng Kết q trình nghiên cứu trình bày cụ thể chương sau 37 Chương – THỰC NGHIỆM VÀ ĐÁNH GIÁ 4.1 MƠI TRƯỜNG THỰC NGHIỆM 4.1.1 Cơng cụ hỗ trợ - Chuẩn bị công cụ t2p thiết lập đường dẫn để chương trình phiên âm gọi trực tiếp - Chương trình phiên âm cài đặt ngôn ngữ Java thử nghiệm hệ điều hành Windows 8.1 4.1.2 Hướng dẫn sử dụng B1 Nhập từ vựng tiếng Anh cần phiên âm B2 Click vào để chương trình thực Hình 4.1: Chương trình phiên âm 4.2 DỮ LIỆU TỪ ĐIỂN Chương trình sử dụng từ điển cmudict_SPHINX_40.dic để xây dựng định cho t2p Đây từ điển dùng cho mục đích nhận dạng tiếng nói Từ điển gồm 133.031 dịng với dòng ứng với từ ký tự tiếng Anh với cách phát âm chúng [9] 38 4.3 KẾT QUẢ VÀ ĐÁNH GIÁ Dựa kết thực nghiệm 100 từ tiếng Anh xuất nhiều báo điện tử việc đánh giá giảng viên giảng dạy chuyên ngành tiếng Anh đánh giá kết đạt chấp nhận Bảng 4.1: Thống kê kết thực nghiệm chương trình TT Từ tiếng Anh Phiên âm tiếng Anh /ˈfeɪsbʊk/ Kết từ công cụ t2p F EY S _ B UH _ KD Phiên âm tiếng Việt phây xơ bút S M AA R T F _ OW N _ xơ mót phon /ˈɛlɪm(ə)nt/ EH L AX M AX N TD e lơ mơn tơ INTERNET /ˈɪntənɛt/ IH N T _ AXR N EH TD in tơ nét MESSENGER /ˈmɛsɪn(d)ʒə/ M EH S _ AX N JH _ AXR me xơn giơ SHOWBIZ /ˈʃəʊbɪz/ _ SH OW _ B IX Z sâu bít ROBOT /ˈrəʊbɒt/ R OW B AA TD râu bót MOBILE /ˈməʊbʌɪl/ M OW B IY L _ mâu biu YOUTUBE /ˈjuːtjuːb/ Y _ UW T UW BD _ diu túp 10 CAMERA /ˈkam(ə)rə/ K AE M EH R AX kha me rơ 11 GAME /ɡeɪm/ G EY M _ gem 12 ARGENTINA /ˌɑːdʒənˈtiːnə/ AA R JH AX N T IY N AX a giơn ti nơ 13 LEAGUE /liːɡ/ L IY _ GD _ _ li gơ 14 FOOTBALL /ˈfʊtbɔːl/ F UH _ TD B AO L _ phút bon 15 CHELSEA /ˈtʃɛlsi/ CH _ EH L S IY _ chen xi 16 APPLE /ˈap(ə)l/ AE P AX L _ a phô 17 GOOGLE /ˈɡuːɡl/ G UW OW G AX L gu gô 18 SERVER /ˈsəːvə/ S _ER V _ AXR xơ vơ 19 CLIENT /ˈklʌɪənt/ K L AY AX N TD khơ lay ơn tơ 20 VIRUS /ˈvʌɪrəs/ V AY R AX S vay rơ xơ 21 PLAY /pleɪ/ P L EY _ phơ lây 22 FULL /fʊl/ F UH L _ phun 23 LINK /lɪŋk/ L IH NG KD ling khơ 24 MODEL /ˈmɒd(ə)l/ M AA DX AX L mo đô 25 STYLIST /ˈstʌɪlɪst/ S T AY L IX S TD xơ tay li xơ tơ FACEBOOK SMARTPHONE /ˈsmɑːtfəʊn/ ELEMENT 39 TT Từ tiếng Anh Kết từ công cụ t2p 27 FAN Phiên âm tiếng Anh /fan/ F AE N Phiên âm tiếng Việt phan 28 CLUB /klʌb/ K L AH BD khơ lấp 29 PAGE /peɪdʒ/ P EY JH _ phây giơ 30 SMART /smɑːt/ S M AA R TD xơ mót 31 WATCH /wɒtʃ/ W AA _ CH _ quo chơ 32 STORE /stɔː/ S T AO R _ xơ to 33 NEWS /njuːz/ N _ UW Z niu giơ 34 PHONE /fəʊn/ F _ OW N _ phon 35 SHOP /ʃɒp/ _ SH AA PD sóp 36 MICROPHONE /ˈmʌɪkrəfəʊn/ M AY K R AX F _ OW N may khơ rơ phon 37 CINEMA /ˈsɪnɪmə/ S IH N AX M AX xi nơ mơ 38 RAPPER /ˈrapə/ R AE P _ _ AXR phơ 39 CHECK /tʃɛk/ CH _ EH _ KD chét 40 IN /ɪn/ IH N in 41 CLIP /klɪp/ K L IH PD khơ líp 42 VOUCHER /ˈvaʊtʃə/ V _ AW CH _ _AXR vau chơ 43 DANCE /dɑːns/ D AE N S đan xơ 44 THAILAND /ˈtʌɪland/ T _ _ AY L AE N DD tay lan 45 TOP /tɒp/ T AA PD tóp 46 LAPTOP /ˈlaptɒp/ L AE PD T AA PD láp tóp 47 CHROME /krəʊm/ K _ R OW M _ khơ rom 48 SCANDAL /ˈskand(ə)l/ S K AE N D AX L xơ khan đô 49 NOTE /nəʊt/ N OW TD _ Nót 50 SEXY /ˈsɛksi/ S EH S IY xe xi 51 TEENS /tiːnz/ T IY _ N Z tin giơ 52 NICKNAME /ˈnɪkneɪm/ N IH _ K N EY M _ ni khơ nem 53 SLOGAN /ˈsləʊɡ(ə)n/ S L OW G AX N xơ lâu gơn 54 MANAGER /ˈmanɪdʒə/ M AE N AX JH _ AXR ma nơ giơ 55 PARK /pɑːk/ P AA R KD 56 INCH /ɪn(t)ʃ/ IH N CH _ in chơ 40 TT Từ tiếng Anh Kết từ công cụ t2p 57 HOT Phiên âm tiếng Anh /hɒt/ Phiên âm tiếng Việt HH AA TD hót 58 VALENTINE /ˈvaləntʌɪn/ V AA L EH N T AY N _ vo len tay 59 MEMBER /ˈmɛmbə/ M EH M B _ AXR mem bơ 60 SPAM /spam/ S P AE M xơ pham 61 BANK /baŋk/ B AE NG KD bang khơ 62 RESORT /rɪˈzɔːt/ R IX Z AO R TD ri giot 63 CACHET /ˈkaʃeɪ/ K AE _ SH _ EY kha sây 64 DIVA /ˈdiːvə/ D IY V AX vơ 65 PICNIC /ˈpɪknɪk/ P IH K N IH KD phi khơ nít 66 STYLE /stʌɪl/ S T AY L _ xơ tay 67 HACKER /ˈhakə/ HH AE _ K _ AXR khơ 68 SPA /spɑː/ S P AA xơ 69 ALBUM /ˈalbəm/ AE L B AX M al bơm 70 COMMENT /ˈkɒmɛnt/ K AX M _ EH N TD khơ men tơ 71 SHOCK /ʃɒk/ _ SH AA _ KD sót 72 IDOL /ˈʌɪd(ə)l/ AY DX AX L ay đô 73 POSE /pəʊz/ P OW Z _ phâu giơ 74 SHARE /ʃɛː/ _ SH EH R _ se rơ 75 NETBOOK /ˈnɛtbʊk/ N EH TD B UH UH KD nét bút 76 FOREVER /fəˈrɛvə/ F _ AXR EH V _ AXR phơ e vơ 77 FREE /friː/ F R IY _ phơ ri 78 EVENT /ɪˈvɛnt/ IY V EH N TD i ven tơ 79 ROCK /rɒk/ R AA _ KD ro khơ 80 PARTY /ˈpɑːti/ P AA R DX IY ti 81 SIZE /sʌɪz/ SAZ_ xay giơ 82 BAR /bɑː/ B AA R ba 83 POSTER /ˈpəʊstə/ P OW S T _ AXR phâu xơ tơ 84 FESTIVAL /ˈfɛstɪv(ə)l/ F EH S T AX V AX L phe xơ tơ vô 85 ADMIN /ˈadmɪn/ AE D M IX N át 86 COTTON /ˈkɒt(ə)n/ K AA T _ AX N kho tơn 41 TT Từ tiếng Anh Kết từ công cụ t2p 87 MARKETING Phiên âm tiếng Anh /ˈmɑːkɪtɪŋ/ 88 OVERNIGHT /ˈəʊvənʌɪt/ OW V _ AXR N AY _ _ TD âu vơ 89 CONTENT /kənˈtɛnt/ K AX N T EH N TD khơn ten tơ 90 ADD /ad/ AE DD _ át 91 RESTART /riːˈstɑːt/ R IY S T AA R TD ri xơ tót 92 CITY /ˈsɪti/ S IH DX IY xi ti 93 FIX /fɪks/ F IH S phi xơ 94 SEND /sɛnd/ S EH N DD xen 95 VOICE /vɔɪs/ V OY _ S _ voy xơ 96 SINGLE /ˈsɪŋɡ(ə)l/ S IH NG G AX L xing gô 97 CONFIRM /kənˈfəːm/ K AA N F _ ER M khon phơm 98 PLAYLIST /ˈpleɪlɪst/ P L EY _ L IX S TD phơ lây li xơ tơ 99 SEARCH /səːtʃ/ S _ _ AXR CH _ xơ chơ 100 TENNIS /ˈtɛnɪs/ T EH N _ IX S te ni xơ M AA R K AX DX IX _ NG Phiên âm tiếng Việt mo khơ ting 42 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN * KẾT LUẬN Qua thời gian dài thực hiện, nghiên cứu gặp khơng khó khăn việc nghiên cứu ứng dụng lý thuyết vào giải pháp phiên âm từ vựng tiếng Anh văn tiếng Việt Thêm vào đó, việc chưa có nhiều kinh nghiệm lĩnh vực nghiên cứu ngôn ngữ nên trình nghiên cứu phải vất vả để vượt qua lỗi hướng tiếp cận Tuy nhiên, với nỗ lực cố gắng, cuối nghiên cứu đạt kết định Về mặt lý thuyết, nghiên cứu nắm đặc trưng quan trọng ngữ âm tiếng Việt tiếng Anh, tìm thuật tốn tổng quan chương trình phiên âm từ vựng tiếng Anh văn tiếng Việt Về mặt ứng dụng, nghiên cứu xây dựng chương trình phiên âm từ vựng tiếng Anh thành từ tiếng Việt, hay nói cánh khác Việt hóa cách phát âm từ vựng tiếng Anh văn tiếng Việt Bên cạnh kết đạt chương trình cịn tồn số nội dung định chương trình chưa tích hợp vào hệ thống đọc văn tiếng Việt, ngôn ngữ đa dạng phức tạp nên số trường hợp ngoại lệ chưa xử lý triệt để mang lại hiệu cao * HƯỚNG PHÁT TRIỂN Với tồn trên, chương trình phiên âm từ vựng tiếng Anh văn tiếng Việt tối ưu nhất, góp phần nhỏ nghiên cứu xử lý ngôn ngữ tự nhiên, xử lý văn xử lý tiếng nói ví dụ hệ thống chuyển văn thành tiếng nói tiếng Việt, hệ thống nhận diện tiếng nói tiếng Việt, … 43 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Võ Xuân Hào (2009) Giáo trình Ngữ âm tiếng Việt Hiện đại Trường Đại học Quy Nhơn, trang – 58 Tiếng Anh [2] John Kominek, “TTS From Zero Building Synthetic Voices for New Languages”, CMU-LTI-09-006 trang 16-18 [3] The CMU Pronouncing Dictionary http://www.speech.cs.cmu.edu/cgi-bin/cmudict [4] Luis Pedro Hurtarte Caceres, “Translation of Poetry´s Structures to Architecture”, trang 26-28, luận văn thạc sĩ [5] Hoang Gia Ngo, Nancy F Chen, Sunil Sivadas, Bin Ma, Haizhou Li, “A MinimalResource Transliteration Framework for Vietnamese”, Proc Interspeech, 2014 [6] Hoang Thi Quynh Hoa, “A Phonological Contrastive Study of Vietnamese and English”, A thesis in English, submitted to the Graduate Faculty of Texas Technological College [7] Kevin Lenzo, “t2p: Text-to-phoneme converter Builder”, retrieved from Carnegie Mellon University: http://www.cs.cmu.edu/afs/cs.cmu.edu/user/lenzo/html/areas/t2p,” 1998, December 28 [8] Thang Tat Vu, Mai Chi Luong, Satoshi Nakamura, “An HMM-based Vietnamese Speech Synthesis System”, Proc Oriental COCOSDA, 2009 [9] The CMU Pronouncing Dictionary, http://svn.code.sf.net/p/cmusphinx/code/trunk /cmudict/sphinxdict

Ngày đăng: 09/03/2021, 23:45

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w