1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận án nghiên cứu ngữ nghĩa và hiện tượng nhập nhằng trong tiếng việt, tiếp cận xử lý vấn đề viết tắt tiếng việt

168 12 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN NHO TÚY ÀNG THỊ MỸ LỆ Chuyên ngành : KHOA HỌC MÁY TÍNH Mã số : 62.48.01.01 LUẬN ÁN TIẾN SĨ KỸ THUẬT Đà Nẵng, năm 2020 i BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN NHO TÚY NGHIÊN CỨU NGỮ NGHĨA VÀ HIỆN TƯỢNG NHẬP NHẰNG TRONG TIẾNG VIỆT, TIẾP CẬN XỬ LÝ VẤN ĐỀ VIẾT TẮT TIẾNG VIỆT Chuyên ngành : KHOA HỌC MÁY TÍNH Mã số : 62.48.01.01 LUẬN ÁN TIẾN SĨ KỸ THUẬT Người hướng dẫn khoa học: PGS.TS PHAN HUY KHÁNH Đà Nẵng, năm 2020 ii LỜI CAM ĐOAN Tôi cam đoan cơng trình nghiên cứu tơi, hướng dẫn trực tiếp PGS TS Phan Huy Khánh, cán giảng dạy Đại học Bách Khoa, Đại học Đà Nẵng Tôi cam đoan kết trình bày luận án trung thực, không chép từ luận án hay nguồn tài liệu khác chưa cơng bố cơng trình khác Mọi trích dẫn tài liệu tham khảo có ghi nguồn gốc xuất xứ rõ ràng Nếu có khơng trung thực, tác giả xin chịu hoàn toàn trách nhiệm Tác giả, Nguyễn Nho Túy iii MỤC LỤC LỜI CAM ĐOAN ii DANH MỤC CÁC CHỮ VIẾT TẮT vii DANH MỤC HÌNH ẢNH ix DANH MỤC BẢNG BIỂU xi MỞ ĐẦU 1 2.1 2.2 2.3 ĐẶT VẤN ĐỀ MỤC TIÊU, ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU Mục tiêu Đối tượng Phạm vi PHƯƠNG PHÁP NGHIÊN CỨU BỐ CỤC CỦA LUẬN ÁN .7 ĐÓNG GÓP CỦA LUẬN ÁN .8 CHƯƠNG VẤN ĐỀ CHỮ VIẾT TẮT TIẾNG VIỆT 11 1.1 NGÔN NGỮ VÀ XỬ LÝ NGÔN NGỮ TỰ NHIÊN 11 1.1.1 Ngôn ngữ xử lý ngôn ngữ 11 1.1.2 Âm, chữ viết vấn đề cải tiến chữ viết .12 1.1.3 Các loại hình ngơn ngữ 13 1.1.4 Xử lý ngôn ngữ tự nhiên 14 1.1.5 Vấn đề xử lý tiếng Việt 16 1.2 NGỮ NGHĨA VÀ NHẬP NHẰNG NGỮ NGHĨA TIẾNG VIỆT .18 1.2.1 Ngữ nghĩa ngữ nghĩa học 18 1.2.2 Phân tích nghĩa từ 19 1.2.3 Sự biến đổi từ vựng ngữ nghĩa 20 1.2.4 Nhập nhằng ngữ nghĩa tiếng Việt .22 1.3 CHỮ VIẾT TẮT TRONG CUỘC SỐNG 25 1.3.1 Chữ viết tắt 25 1.3.2 Lịch sử hình thành chữ Quốc ngữ 26 1.3.3 Tìm hiểu lịch sử chữ viết tắt 27 1.3.4 Sử dụng chữ viết tắt .28 1.3.5 Chữ viết tắt tiếng Việt 31 1.4 NGỮ NGHĨA CHỮ VIẾT TẮT 32 iv 1.4.1 Khái niệm ngữ nghĩa chữ viết tắt 32 1.4.2 Biến đổi ngữ nghĩa chữ viết tắt 33 1.4.3 Nhập nhằng chữ viết tắt 34 1.4.4 Xử lý nhập nhằng chữ viết tắt 35 1.4.5 Đề xuất nghiên cứu chữ viết tắt tiếng Việt 36 1.5 TÓM TẮT CHƯƠNG 37 CHƯƠNG XÂY DỰNG HỆ THỐNG KHAI THÁC CHỮ VIẾT TẮT TIẾNG VIỆT 38 2.1 CÁC TÌNH HUỐNG HÌNH THÀNH CHỮ VIẾT TẮT 38 2.1.1 Mơ hình hình thành chữ viết tắt 38 2.1.2 Đặc điểm hình thành chữ viết tắt tiếng Việt 40 2.1.3 Quy tắc hình thành chữ viết tắt tiếng Việt 41 2.1.4 Những yếu tố khác ảnh hưởng đến thành lập chữ viết tắt 44 2.2 TÌM HIỂU HỆ SINH THÁI PHẦN MỀM 47 2.2.1 Hệ sinh thái phần mềm 47 2.2.2 Mơ hình hóa hệ sinh thái phần mềm 48 2.2.3 Đặc điểm hệ sinh thái phần mềm 50 2.2.4 Lợi ích ứng dụng hệ sinh thái phần mềm 51 2.3 HỆ THỐNG KHAI THÁC CHỮ VIẾT TẮT TIẾNG VIỆT (AMES) 51 2.3.1 Hệ thống khai thác phần mềm 51 2.3.2 Đề xuất xây dựng hệ thống khai thác chữ viết tắt 52 2.3.3 Mơ hình hệ thống khai thác chữ viết tắt .53 2.4 THỰC NGHIỆM XÂY DỰNG AMES 54 2.4.1 Xây dựng nguồn tài nguyên chữ viết tắt tiếng Việt 55 2.4.2 Xây dựng công cụ khai thác chữ viết tắt .55 2.4.3 Xây dựng giải pháp xử lý nhập nhằng chữ viết tắt 55 2.5 TÓM TẮT CHƯƠNG 56 CHƯƠNG XÂY DỰNG NGUỒN TÀI NGUYÊN CHỮ VIẾT TẮT 57 3.1 XÂY DỰNG CƠ SỞ DỮ LIỆU CHỮ VIẾT TẮT 57 3.1.1 Mơ hình quan hệ liệu 57 3.1.2 Triển khai cài đặt 59 3.2 GIẢI PHÁP THU THẬP DỮ LIỆU CHỮ VIẾT TẮT 60 3.2.1 Thu thập liệu thủ công 60 3.2.2 Thu thập liệu tự động 61 v 3.2.3 Đề xuất thuật tốn SENVA tìm kiếm chữ viết tắt 62 3.2.4 Thực nghiệm cài đặt thuật toán SENVA .64 3.3 ỨNG DỤNG KHAI THÁC DỮ LIỆU CHỮ VIẾT TẮT 65 3.3.1 Sử dụng chữ viết tắt CSDL chuyên ngành 65 3.3.2 Ứng dụng chữ viết tắt xây dựng CSDL danh mục 69 3.3.3 Đề xuất sử dụng CVT mã danh mục quốc gia 71 3.4 ĐÁNH GIÁ KẾT QUẢ 73 3.4.1 Kết xây dựng kho ngữ liệu chữ viết tắt 73 3.4.2 Kết ứng dụng khai thác liệu chữ viết tắt 74 3.5 TÓM TẮT CHƯƠNG 76 CHƯƠNG XÂY DỰNG CÔNG CỤ KHAI THÁC CHỮ VIẾT TẮT 77 4.1 XÂY DỰNG THƯ VIỆN CHỮ VIẾT TẮT .77 4.1.1 Lựa chọn cơng cụ lập trình 77 4.1.2 Thiết kế chương trình 77 4.1.3 Kết xây dựng thư viện chữ viết tắt 78 4.2 CÔNG CỤ TƯ VẤN CHỮ VIẾT TẮT THƯƠNG HIỆU 79 4.2.1 Tin nhắn thương hiệu 79 4.2.2 Các bước xây dựng công cụ tư vấn đặt tên Brandname 80 4.2.3 Thuật toán CSBCOM đặt tên tin nhắn thương hiệu 81 4.2.4 Cài đặt chương trình, kết thử nghiệm 87 4.3 XÂY DỰNG TỪ ĐIỂN CHỮ VIẾT TẮT TRÊN MÁY DI ĐỘNG 88 4.3.1 Thiết kế sở liệu chức chương trình 88 4.3.2 Đồng liệu với thư viện chữ viết tắt 89 4.3.3 Đề xuất thuật toán SAOM-FTS xây dựng từ điển 90 4.3.4 Cài đặt kết thực nghiệm 92 4.4 ĐÁNH GIÁ KẾT QUẢ 93 4.4.1 Đánh giá kết thực nghiệm AMES 93 4.4.2 Đánh giá AMES đặc tả theo mô hình UML 94 4.5 TÓM TẮT CHƯƠNG 96 CHƯƠNG XỬ LÝ NHẬP NHẰNG CHỮ VIẾT TẮT 97 5.1 NHẬN DIỆN TÌNH HUỐNG SỬ DỤNG CHỮ VIẾT TẮT 97 5.1.1 Ngữ cảnh sử dụng chữ viết tắt 97 5.1.2 Vấn đề nhận diện chữ viết tắt văn 98 vi 5.1.3 Xây dựng mơ hình nhận diện chữ viết tắt văn 99 5.1.4 Giải pháp xử lý nhập nhằng chữ viết tắt 100 5.2 XÂY DỰNG VỊ TỪ VÀ HÀM NHẬN DIỆN CHỮ VIẾT TẮT 102 5.2.1 Xây dựng miền liệu 102 5.2.2 Xây dựng vị từ hàm 103 5.2.3 Nhận diện tượng nhập nhằng CVT văn 105 5.3 XÂY DỰNG CƠ SỞ LUẬT NHẬN DIỆN CHỮ VIẾT TẮT 106 5.3.1 Xây dựng sở luật 106 5.3.2 Xây dựng máy suy diễn nhận diện chữ viết tắt 109 5.3.3 Thuật toán nhận diện xử lý nhập nhằng chữ viết tắt 110 5.3.4 Kết hợp sở luật nhận diện CVT với xử lý nhập nhằng 112 5.4 TẦN SỐ CHỮ VIẾT TẮT VÀ GIẢI PHÁP XỬ LÝ NHẬP NHẰNG 113 5.4.1 Tần số chữ viết tắt 113 5.4.2 Xây dựng khái niệm tần số, khái niệm tần suất chữ viết tắt 114 5.4.3 Giải pháp đánh giá tần số, suất chữ viết tắt 116 5.4.4 Xây dựng thuật toán AFVAI triển khai thực nghiệm 117 5.4.5 Kết thực nghiệm đánh giá 119 5.4.6 Ứng dụng kết xử lý nhập nhằng chữ viết tắt 123 5.5 TÓM TẮT CHƯƠNG 124 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 125 KẾT LUẬN 125 1.1 Tóm tắt nội dung luận án 125 1.2 Các kết đạt 126 1.3 Hạn chế luận án 128 HƯỚNG PHÁT TRIỂN 129 DANH MỤC CÁC CƠNG TRÌNH ĐÃ CÔNG BỐ CỦA TÁC GIẢ 130 TÀI LIỆU THAM KHẢO 131 PHỤ LỤC vii DANH MỤC CÁC CHỮ VIẾT TẮT TIẾNG VIỆT STT Chữ viết tắt NGHĨA TIẾNG VIỆT BCVT Bưu viễn thơng CĐCN Cao đẳng công nghệ CVT Chữ viết tắt CSDL Cơ sở liệu DBĐT Danh bạ điện thoại DCT Địa tắt ĐTV Điện thoại viên ĐH Đại học ĐHBK Đại học bách khoa 10 ĐHQG Đại học quốc gia 11 GD-ĐT Giáo dục đào tạo 12 HCM Hồ Chí Minh 13 KHCN Khoa học công nghệ 14 KNL Kho ngữ liệu 15 KTQS Kỹ thuật quân 16 KTXH Kinh tế xã hội 17 MTVT Mục từ viết tắt 18 NN&ĐS Ngôn ngữ đời sống 19 NSD Người sử dụng 20 NXB Nhà xuất 21 NCS Nghiên cứu sinh 22 PGS Phó Giáo sư 23 TBT Thuê bao tắt 24 THCN Trung học chuyên nghiệp 25 TS Tiến sỹ 26 TP Thành phố 27 XLTV Xử lý tiếng Việt 28 XLNNTN Xử lý ngôn ngữ tự nhiên 29 VH-TT Văn hóa thơng tin 30 VT-CNTT Viễn thơng - Công nghệ thông tin viii TIẾNG ANH STT Chữ viết tắt API AMES AFVAI NGHĨA TIẾNG ANH NGHĨA TIẾNG VIỆT Application Programming Interface Abbreviations Management Exploit System Assessment frequency Vietnamese abbreviations on the Internet Lập trình giao diện ứng dụng Hệ thống khai thác Chữ viết tắt Ghi nhận tần số chữ viết tắt Internet CSBCOM Consultant SMS brandname to the company I* Modeling Language IM HTML PSTN SENVA 10 SMS 11 SAOM-FTS Instand Message HyperText Markup Language Public Switched Telephone Network Search Engines New Vietnamese Abbreviations Short Message Services Search on mobile abbreviations-used Full Text Search 12 UML 13 VNPT 14 WFST 15 XML Unified Modeling Language VietNam Posts And Telecommunications Group Weighted Finite State Transducer eXtensible Markup Language Tư vấn đặt tên tin nhắn thương hiệu Doanh nghiệp Ngơn ngữ mơ hình hóa Tin nhắn Ngơn ngữ đánh dấu siêu văn Mạng điện thoại chuyển mạch công cộng Máy tìm kiếm chữ viết tắt tiếng Việt Dịch vụ tin nhắn ngắn Tìm kiếm chữ viết tắt máy di động Ngơn ngữ mơ hình hóa thống Tập đồn Bưu Viễn thơng Việt Nam Chuyển đổi trạng thái trọng số hữu hạn Ngôn ngữ đánh dấu mở rộng ix DANH MỤC HÌNH ẢNH STT Hình Chú thích hình ảnh Trang Hình 1.1 Mơ hình tháp nghĩa 18 Hình 1.2 Xu hướng "tắt hóa" 24 Hình 1.3 Tắt hóa chữ viết dân tộc người 30 Hình 2.1 Mơ hình hình thành chữ viết tắt tiếng Việt 35 Hình 2.2 Mơ hình sơ đồi khối hình thành chữ viết tắt tiếng Việt 36 Hình 2.3 Ví dụ Hệ sinh thái phần mềm Microsoft 45 Hình 2.4 Hình 2.5 Hình 2.6 10 Hình 3.1 11 Hình 3.2 Mơ hình UML hệ thống khai thác chữ viết tắt tiếng Việt Mơ hình quan hệ liệu kho ngữ liệu chữ viết tắt tiếng Việt Quan hệ CSDL chữ viết tắt 12 Hình 3.3 Các chức tìm kiếm 65 13 Hình 4.1 Mơ hình hoạt động website tra cứu chữ viết tắt 74 14 Hình 4.2 Trang chủ website thư viện chữ viết tắt 75 15 Hình 4.3 Cây phân tích chuỗi 81 16 Hình 4.4 Cây phân tích chuỗi giá trị trọng số 81 17 Hình 4.5 Mơ hình đồng liệu máy di động 84 18 Hình 4.6 Tiếp cận nghiên cứu hình thành AMES 88 19 Hình 4.7 Kết thực nghiệm AMES 89 20 Hình 5.1 Mơ hình nhận diện CVT văn 95 Sử dụng UML mơ hình hóa sơ đồ hệ sinh thái phần mềm Mơ hình hệ thống khai thác chữ viết tắt tiếng Việt 46 50 51 55 56 VI b) Mã lệnh truy vấn CSDL tất các CVT chứa X: // (SELECT * FROM T1 WHERE T1.CVT MATCH X) String sqlQuery = "" + "SELECT [T].[" + COL_CVT_FTS_ID_CVT + "], \n" + " [C].[" + COL_CVTS_CVT + "], \n" + " CASE [C].[" + COL_CVTS_ID_LANG + "] WHEN THEN [C].[" + COL_CVTS_NGHIAVIET + "] WHEN THEN [C].[" + COL_CVTS_NGHIAANH + "] ELSE [C].[" + COL_CVTS_NGHIAVIET + "] END NGHIA_NGAN, \n" + " [C].[" + COL_CVTS_LUOTXEM + "], \n" + " [C].[" + COL_CVTS_IS_FAVORITE + "] \n" + "FROM [" + TABLE_CVT_FTS + "] [T]\n" + " INNER JOIN [" + TABLE_CVTS + "] [C] ON [C].[" + COL_CVTS_ID_CVT + "] = [T].[" + COL_CVT_FTS_ID_CVT + "]\n" + "WHERE [T].[CVT] MATCH " + DatabaseUtils.sqlEscapeString(StringUtil.convert2SqliteSearchFormat(value)) + " AND [C].[" + COL_CVTS_ENABLED + "] = 1" + " ORDER BY LENGTH([C].[" + COL_CVTS_CVT + "])" + " LIMIT " + QUERY_LIMIT; c) Tăng tần số tần suất truy vấn của CVT X lưu vào liệu thống kê CSDL bảng T1, mã lệnh: // DbAdapter.getResultDetailById() if (idList.size() >0) { //update luotxem – Cập nhật lượt xem, tra cứu CVT String listOfId = TextUtils.join(",", idList); String sqlUpdate = "" + "UPDATE\n" + " [" + TABLE_CVTS + "]\n" + "SET\n" + " [" + COL_CVTS_LUOTXEM + "] = [" + COL_CVTS_LUOTXEM + "] + 1\n" + "WHERE\n" + " [" + COL_CVTS_ID_CVT + "] IN (" + listOfId + ")"; db.execSQL(sqlUpdate); //update thongke – Cập nhật thống kê người sử dụng di động String currentDate = sdfIn.format(new Date()); sqlUpdate = "" + "UPDATE\n" + " [" + TABLE_THONGKE + "]\n" + "SET\n" + VII " [" + COL_THONGKE_TAN_SO + "] = [" + COL_THONGKE_TAN_SO + "] + 1\n" + "WHERE\n" + " [" + COL_THONGKE_NGAY_THANG + "] = " + DatabaseUtils.sqlEscapeString(currentDate) + "\n" + "AND [" + COL_THONGKE_ID_CVT + "] IN (SELECT [F1].[" + COL_CVT_FTS_ID_CVT + "]\n" + "FROM [" + TABLE_CVT_FTS + "] [F1]\n" + "WHERE [F1].[" + COL_CVT_FTS_CVT + "] MATCH (SELECT '\"' || [F].[" + COL_CVT_FTS_CVT + "] || '\"'\n" + " FROM [" + TABLE_CVT_FTS + "] [F]\n" + " WHERE [F].[" + COL_CVT_FTS_ID_CVT + "] = " + idCvt + ")\n" + " AND LENGTH ([F1].[" + COL_CVT_FTS_CVT + "]) = (SELECT LENGTH ([F].[" + COL_CVT_FTS_CVT + "])\n" + " FROM [" + TABLE_CVT_FTS + "] [F]\n" + " WHERE [F].[" + COL_CVT_FTS_ID_CVT + "] = " + idCvt + "))"; db.execSQL(sqlUpdate); //insert new thongke – Chèn bảng thống kê cho người sử dụng di động sqlUpdate = "" + "INSERT OR IGNORE INTO [" + TABLE_THONGKE + "]\n" + " ([" + COL_THONGKE_NGAY_THANG + "], \n" + " [" + COL_THONGKE_ID_CVT + "], \n" + " [" + COL_THONGKE_TAN_SO + "])\n" + " SELECT " + DatabaseUtils.sqlEscapeString(currentDate) + ", \n" + " [F1].[" + COL_CVT_FTS_ID_CVT + "], \n" + " 1\n" + " FROM [" + TABLE_CVT_FTS + "] [F1]\n" + " WHERE [F1].[" + COL_CVT_FTS_CVT + "] MATCH (SELECT '\"' || [F].[" + COL_CVT_FTS_CVT + "] || '\"'\n" + " FROM [" + TABLE_CVT_FTS + "] [F]\n" + " WHERE [F].[" + COL_CVT_FTS_ID_CVT + "] = " + idCvt + ")\n" + " AND LENGTH ([F1].[" + COL_CVT_FTS_CVT + "]) = (SELECT LENGTH ([F].[" + COL_CVT_FTS_CVT + "])\n" + " FROM [" + TABLE_CVT_FTS + "] [F]\n" + " WHERE [F].[" + COL_CVT_FTS_ID_CVT + "] = " + idCvt + ")"; db.execSQL(sqlUpdate); VIII Phụ lục Bảng mã danh mục ứng dụng đề xuất Trong mục 3.3.2 ứng dụng chữ viết tắt xây dựng CSDL danh mục, tác giả xây dựng bảng mã danh mục phần tử mạng điều hành sản xuất kinh doanh, đề xuất ban hành thống nhất, đưa vào áp dụng thực tiễn, quy định lập trình viên đơn vị tuân thủ bảng mã danh mục Ví dụ như: Bảng Danh mục CVT phần tử mạng điều hành sản xuất kinh doanh Chữ viết tắt STT Tên mã Mã tỉnh/thành ABC Theo quy định chung thống Tập đoàn: DNG: Đà Nẵng, QNM: Quảng Nam Mã toán DNG000000001 + Mã tổng đài CSND CNSDxxx xxx: 001 => 999 Tên CSND (=Mã tủ cáp gốc t ại đài) Mã tủ cáp Mã outdoor Mã sợi cáp đồng DAI + Ghi Cáp đồng: DAI001 => DAI999 Cáp quang: DAI001DF => DAI999DF TCxxxAn H001An + + + CSNDxxxDFn + + CSNDxxxn Cáp gốc: + + CSNDxxxA1-n Cáp ngọn: + + IX Bảng Danh mục mã vùng điện thoại STT Tỉnh/TP Tên chữ viết tắt Mã số STT Tỉnh/TP Tên chữ viết tắt Mã số An Giang AGG 76 33 Khánh Hoà KHA 58 Bà Rịa Vũng Tàu BRU 64 34 Kiên Giang KGG 77 10 11 12 13 14 15 16 17 18 19 20 21 21 23 24 25 Bạc Liêu Bắc Kạn Bắc Giang Bắc Ninh Bến Tre Bình Dương Bình Định Bình Phước Bình Thuận Cà Mau Cao Bằng Cần Thơ TP Đà Nẵng ĐắkLắk Đăc Nông Điện Biên Đồng Nai Đồng Tháp Gia Lai Hà Giang Hà Nam Hà Nội Hà Tây BLU BKN BGG BNH BTE BDG BDH BPC BTN CMU CBG CTO DNG DLK DNG DBN DNI DTP GLI HGG HNM HNI HTY 781 281 240 241 75 650 56 651 62 780 26 71 511 50 50 23 61 67 59 19 351 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 KTM LCU LSN LCI LDG LAN NDH NAN NBH NTN PTO PYN QBH QNM QNI QNH QTI STG SLA TNH TBH TNN THA 60 23 25 20 63 72 350 38 30 68 210 57 52 510 55 33 53 79 22 66 36 280 37 26 Hà Tĩnh HTH 39 58 HUE 54 27 28 29 30 31 Hải Dương Hải Phịng Hậu Giang Hồ Bình Hưng Yên TP Hồ Chí Minh HDG HPG HGG HBH HYN 320 31 71 18 321 59 60 61 62 63 Kon Tum Lai Châu Lạng Sơn Lào Cai Lâm Đồng Long An Nam Định Nghệ An Ninh Bình Ninh Thuận Phú Thọ Phú Yên Quảng Bình Quảng Nam Quảng Ngãi Quảng Ninh Quảng Trị Sóc Trăng Sơn La Tây Ninh Thái Bình Thái Ngun Thanh Hố Thừa Thiên Huế Tiền Giang Trà Vinh Tuyên Quang Vĩnh Long Vĩnh Phúc TGG TVH TQG VLG VPC 73 74 27 70 211 HCM 64 Yên Bái YBI 29 32 X Phụ lục Hình ảnh, hình giao diện chức 1) Thống kê mẫu văn của Viễn thông Đà Nẵng Thư viễn biểu mẫu văn sử dụng thông kê loại văn để khảo sát, nhận diện tình sử dụng CVT thực tế đơn vị (mục 3.3.4.) Khảo sát giúp đề xuất giải pháp xử lý nhập nhằng CVT lĩnh vực VT-CNTT đơn vị Hình Thư viện biểu mẫu văn 2) Hình ảnh giao diện kết xây dựng Website Giới thiệu kết xây dựng website thư viện CVT (minh họa thêm cho mục 5.3.3.), đưa vào sử dụng hình 1, hình hình đây: Hình Trang quản trị cấu hình thư viện CVT XI Trang chủ thư viện CVT thiết kế với nhiều chức năng, có liên kết xếp theo vần ABC giúp tra cứu nhanh chóng Hình Trang chủ thư viện chữ viết tắt Chức tra cứu CVT thiết kế cho phép tra cứu xác gần Quá trình tìm kiếm, sử dụng hệ thống website lưu trữ để có số liệu thống kê CVT xem nhiều nhất… Hình Kết tra cứu chữ viết tắt XII 3) Cơng cụ lập trình Android Studio Genymotion giả lập máy di đợng Hình ảnh cơng cụ giả lập để triển khai thực nghiệm lập trình xây dựng từ điển tra CVT máy di động (làm rõ thêm mục 4.3): Hình Sử dụng mơi trường phát triển tích hợp Android Studio lập trình Hình Cơng cụ Genymotion giả lập máy di động Danh mục tệp Java thiết kế cho từ điển CVT máy di đợng XIII Hình Danh mục tệp Java thiết kế 4) Cấu trúc Bộ danh mục mã bưu chính quốc gia Việt Nam Hình Cấu trúc Mã bưu XIV 5) Ứng dụng chạy máy di đợng giả lập máy tính Biên dịch Android Studio, chương trình có biểu tượng ABC Acronym Dictionary (hình 8) Hình ảnh ứng dụng giả lập máy tính (bởi Genymotion), chương trình thường trú nhớ Menu dọc chức năng: Thống kê, cài đặt, cập nhật mới… hình Nhấn hình cảm ứng cụm CVT để chọn khối, sau chọn copy vào vùng nhớ đệm, chương trình copy liệu CVT vùng nhớ đệm, tra cứu hiển thị liệu kết tra cứu hình Biểu tượng: ABC Acronym Dictionary Hình Giao diện chức kết tra cứu CVT Hình Giao diện chức tra cứu thống kê sử dụng CVT XV 6) Ứng dụng thực tế máy di động Samsung Not Sau xây dựng chương trình phần mềm giả lập, thực lệnh Build, ứng dụng có tên là: "ABC Acronym Dictionary" Sao chép tập tin lên máy di động cài đặt biểu tượng ABC Acronym Dictionary Các hình ảnh ứng dụng thực tế chạy trên máy di động Samsung Not hình sau đây: Hình 10 Giao diện chức thống kê sử dụng CVT máy di động Hình 11 Giao diện biểu đồ thống kê sử dụng tra cứu CVT máy di động XVI Về chức tra cứu chạy thực tế máy di động: Tương tự trên, chương trình chạy thường trú, Khi người dùng cần tra cứu trực tiếp CVT file văn bản, email, tin nhắn, website…, nhấn hình cảm ứng máy di động cụm CVT để chọn khối, sau chọn copy vào vùng nhớ đệm, chương trình copy liệu CVT vùng nhớ đệm Tiếp theo NSD nhấn vào biểu tượng tra cứu, chương trình kích hoạt tìm kiếm CVT (ABC Acronym Dictionary), hiển thị liệu kết tra cứu:  Khung cửa sổ phía trên: Kết tra cứu CVT  Khung cửa sổ phía dưới: Vẫn giữ nội dung văn NSD đọc Hình 12 Giao diện tra cứu trực tiếp CVT máy di động XVII 7) Ứng dụng SMS Brandname: Ứng dụng SMS Brandname đưa vào khai thác, có chức nằn: Thiết lập cấu hình, Tư vận trực tiếp/Tự động Brandname cho khách hàng Giao diện hình 13 Hình 13 Giao diện chức cấu hình ứng dụng SMS Brandname Hình 14 Chức tư vấn tự động Brandname XVIII 8) Cấu trúc XML cho CSDL chữ viết tắt Hình 15 ví dụ cách tổ chức CSDL với mục từ viết tắt “VNPT”: 1 VNPT Vi-en-pi-ti VietNam Posts And Telecommunications Group Tập đồn Bưu Viễn thơng Việt Nam 1 - (Công nghệ thông tin Truyền thông) 01 Hình 15 Cấu trúc XML cho CSDL chữ viết tắt 9) CSDL 108 VNPT Đà Nẵng Hình 16 CSDL 108 VNPT Đà Nẵng XIX Hình 17 Minh họa CSDL xây dựng 10) Thực chương trình cập nhật tần số sử dụng CVT Chương trình chạy khung cửa sổ Main (hình 18), chọn nút lệnh Import CSV file, chọn file đầu vào, chọn lựa trình duyệt, sau kích chọn nút Run để thực thu thập liệu tần suất sử dụng CVT Hình 18 Thực chương trình cập nhật tần số sử dụng CVT XX 11) Khảo sát tương quan tần số sử dụng CVT Tần suất xuất cụm CVT (là thương hiệu thức ăn nhanh) ngày 02/04/2016 so sánh với thị phần thương hiệu bàn luận mạng xã hội (bảng hình 19): Bảng Tương quan tần suất xuất CVT bàn luận mạng xã hội STT NGHIAVIET KFC Lotteria McDonald's Burger King Popeyes Jollibee Texas Chicken Carl's Jr Tần suất % Social Media % 146.000 125.000 57.900 32.800 29.700 18.800 7.420 2.760 34,7 29,7 13,8 7,8 7,1 4,5 1,8 0,7 47,0 26,0 10,0 5,0 5,6 4,4 1,0 1,0 420.380 100 100 N_VN1 Hình 19 Biểu đồ thương hiệu thực ăn nhanh thảo luận Internet (theo nguồn số liệu Internet) ... cận xử lý vấn đề viết tắt tiếng Việt? ??, triển khai thực theo nội dung nghiên cứu: 1) Ngữ nghĩa vấn đề nhập nhằng ngữ nghĩa tiếng Việt, tiếp cận vấn đề chữ viết tắt tiếng Việt 2) Tiếp cận xử...i BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN NHO TÚY NGHIÊN CỨU NGỮ NGHĨA VÀ HIỆN TƯỢNG NHẬP NHẰNG TRONG TIẾNG VIỆT, TIẾP CẬN XỬ LÝ VẤN ĐỀ VIẾT TẮT TIẾNG VIỆT Chuyên ngành : KHOA... CVT tiếng Việt 1.1 NGƠN NGỮ VÀ XỬ LÝ NGÔN NGỮ TỰ NHIÊN Nội dung luận án thuộc lĩnh vực XLNNTN, nghiên cứu tượng nhập nhằng xử lý tiếng Việt, tiếp cận xử lý vấn đề CVT tiếng Việt Trước sâu vào

Ngày đăng: 20/12/2021, 12:49

Xem thêm:

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w