(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt

173 3 0
(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt(Luận án tiến sĩ) Nghiên cứu phát triển một số kỹ thuật hỗ trợ phát hiện đạo văn và ứng dụng cho văn bản tiếng Việt

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ NGUYỄN VĂN SƠN NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ KỸ THUẬT HỖ TRỢ PHÁT HIỆN ĐẠO VĂN VÀ ỨNG DỤNG CHO VĂN BẢN TIẾNG VIỆT LUẬN ÁN TIẾN SĨ TOÁN HỌC Hà Nội - 2022 BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHỊNG VIỆN KHOA HỌC VÀ CƠNG NGHỆ QN SỰ NGUYỄN VĂN SƠN NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ KỸ THUẬT HỖ TRỢ PHÁT HIỆN ĐẠO VĂN VÀ ỨNG DỤNG CHO VĂN BẢN TIẾNG VIỆT Chuyên ngành: Cơ sở toán học cho tin học Mã số: 46 01 10 LUẬN ÁN TIẾN SĨ TOÁN HỌC NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS Lê Thanh Hương TS Nguyễn Chí Thành Hà Nội - 2022 i LỜI CAM ĐOAN Tôi xin cam đoan, cơng trình nghiên cứu riêng tơi Những nội dung, số liệu kết trình bày luận án hoàn toàn trung thực chưa có tác giả cơng bố cơng trình khác Các tài liệu tham khảo trích dẫn đầy đủ Hà Nội, ngày 12 tháng 01 năm 2022 Tác giả Nguyễn Văn Sơn ii LỜI CẢM ƠN Luận án thực Viện Công nghệ thông tin, Viện Khoa học Công nghệ quân sự-Bộ Quốc phòng Lời đầu tiên, NCS xin bày tỏ lòng biết ơn sâu sắc tới PGS.TS Lê Thanh Hương, TS Nguyễn Chí Thành tận tình giúp đỡ, trang bị cho NCS phương pháp nghiên cứu, kinh nghiệm, kiến thức khoa học để hoàn thành nội dung luận án NCS xin chân thành cảm ơn Thủ trưởng Viện KH-CN qn sự, Phịng Đào tạo, Viện Cơng nghệ thông tin sở đào tạo đơn vị quản lý tạo điều kiện, hỗ trợ, giúp đỡ NCS trình học tập, nghiên cứu NCS xin bày tỏ lòng biết ơn chân thành tới thầy cô Viện KH-CN quân sự, nhà khoa học quân đội giảng dạy, truyền đạt kiến thức giúp đỡ chuyên môn q trình học tập, nghiên cứu NCS NCS ln ghi nhớ cơng ơn bố mẹ, gia đình xin dành lời cảm ơn đặc biệt tới vợ con, người bên cạnh, động viên chỗ dựa mặt giúp NCS vượt qua khó khăn để hồn thành cơng việc NCS xin chân thành cảm ơn bạn bè, đồng nghiệp nhiều người động viên, chia sẻ, giúp đỡ NCS suốt thời gian qua Tác giả Nguyễn Văn Sơn iii MỤC LỤC Trang DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT v DANH MỤC CÁC BẢNG vi DANH MỤC CÁC HÌNH VẼ vii MỞ ĐẦU CHƯƠNG TỔNG QUAN VỀ BÀI TOÁN PHÁT HIỆN SAO CHÉP 1.1 Tổng quan 1.1.1 Định nghĩa 1.1.2 Các hình thức chép 1.2 Các kiến thức tảng 1.2.1 Một số kiến thức tảng ngôn ngữ tiếng Việt 10 1.2.2 Cơ sở lý thuyết thuật toán LDA 13 1.2.3 Giới thiệu luật kết hợp thuật toán Apriori 14 1.2.4 Giới thiệu mạng nơ ron hồi quy RNN 16 1.2.5 Giới thiệu mạng LSTM xếp chồng 18 1.3 Các nghiên cứu phát chép giới 22 1.3.1 Trích rút từ khóa 24 1.3.2 Phát đoạn chép 28 1.4 Các hướng tiếp cận phát chép nước 35 1.5 Kho ngữ liệu phương pháp đánh giá 36 1.5.1 Kho ngữ liệu thử nghiệm 36 1.5.2 Phương pháp đánh giá 39 1.6 Những vấn đề luận án cần tập trung nghiên cứu giải 41 1.7 Kết luận Chương 42 CHƯƠNG TRÍCH RÚT TỪ KHĨA DỰA TRÊN MƠ HÌNH HỌC SÂU 43 2.1 Đặt vấn đề 43 2.2 Phát biểu tốn tìm tập tài liệu ứng cử tốn trích rút từ khóa 43 2.3 Đề xuất ý tưởng 45 2.4 Trích rút từ khóa dựa kỹ thuật trích rút đặc trưng mơ hình mạng FFNN 46 2.4.1 Nội dung đề xuất 46 2.4.2 Đánh giá thử nghiệm 55 2.5 Kết luận Chương 61 CHƯƠNG PHÁT HIỆN ĐOẠN SAO CHÉP GIỮA HAI TÀI LIỆU DỰA TRÊN CÁC MƠ HÌNH HỌC MÁY 62 3.1 Đặt vấn đề 62 3.2 Phát biểu toán phát đoạn chép 62 3.3 Đề xuất ý tưởng 63 3.4 Mơ hình chủ đề cho toán phát đoạn chép 64 3.4.1 Đề xuất giải pháp 65 iv 3.4.2 Đánh giá thử nghiệm kho ngữ liệu PAN 72 3.5 Kỹ thuật trích rút đặc trưng mơ hình LSTM xếp chồng cho toán phát đoạn chép 76 3.5.1 Mơ hình đề xuất pha đoạn pha từ 78 3.5.2 Đánh giá thử nghiệm kho ngữ liệu PAN 89 3.6 Kết luận Chương 95 CHƯƠNG ỨNG DỤNG CÁC KỸ THUẬT PHÁT HIỆN SAO CHÉP CHO VĂN BẢN TIẾNG VIỆT 97 4.1 Đặt vấn đề 97 4.2 Xây dựng kho ngữ liệu phát đoạn chép tiếng Việt 98 4.2.1 Đề xuất ý tưởng 98 4.2.2 Đề xuất giải pháp xây dựng kho ngữ liệu phát đoạn chép văn tiếng Việt 100 4.2.3 Kết quả, đánh giá kho ngữ liệu 106 4.3 Trích rút từ khóa cho văn tiếng Việt 107 4.3.1 Trích rút từ khóa dựa độ đo TF-IDF cho văn dài tiếng Việt 107 4.3.2 Cải tiến kỹ thuật trích rút từ khóa dựa mơ hình học sâu cho văn tiếng Việt 114 4.4 Ứng dụng kỹ thuật phát đoạn chép cho văn tiếng Việt 116 4.4.1 Cải tiến mơ hình chủ đề cho toán phát đoạn chép văn tiếng Việt 117 4.4.2 Cải tiến kỹ thuật trích rút đặc trưng mơ hình LSTM xếp chồng cho toán phát đoạn chép văn tiếng Việt 120 4.5 Kết luận Chương 122 KẾT LUẬN 123 DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC ĐÃ CƠNG BỐ 125 TÀI LIỆU THAM KHẢO 126 PHỤ LỤC 137 v DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT Thuật toán tối ưu mạng nơ ron (Adaptive Moment Estimation) Mạng nơ ron nhân tạo (Artificial Neural Network) Thuật toán lan truyền ngược liên hồi (Backpropagation Through Time) CNG Chuỗi liên tiếp gồm N ký tự (Character-based N-Gram) CNN Mạng nơ ron tích chập (Convolutional Neural Network) CSDL Cơ sở liệu ĐATN Đồ án tốt nghiệp IDF Nghịch đảo tần suất từ tập văn (Inverse Document Frequency) FFNN Mạng nơ ron truyền thẳng (Feed-forward Neural Network) FSE Thư viện ngôn ngữ Python để tính véc tơ câu (Fast Sentence Embeddings) GCNN Mơ hình mạng nơ ron đồ thị (Graph Convolutional Neural Network) LDA Mơ hình phân phối Dirichlet ẩn (Latent Dirichlet Allocation) LSA Phân tích ngữ nghĩa tiềm ẩn (Latent Semantic Analysis) LSTM Mạng nhớ dài – ngắn (Long Short Term Memory Network) NCS Nghiên cứu sinh PAN Chuỗi kiện thường niên đạo văn (Plagiarism Analysis, Authorship Identification, and Near Duplicate Detection) PHSC Phát chép POS Gán nhãn từ loại (Part of Speech Tagging) RNN Mạng nơ ron hồi quy (Recurrent Neural Network) SVM Máy vector hỗ trợ (Support Vector Machine) TF Tần suất xuất từ văn (Term Frequency) XML Ngôn ngữ đánh dấu mở rộng (eXtensible Markup Language) XLNNTN Xử lý ngôn ngữ tự nhiên WNG Chuỗi liên tiếp gồm N từ (Word-based N-Gram) ADAM ANN BPTT vi DANH MỤC CÁC BẢNG Trang Bảng 1.1 Kết kiểm tra trùng lặp từ hệ thống Coopy Bảng 2.1 Ví dụ 10 kết đầu mơ hình đề xuất 54 Bảng 2.2 Giá trị F-score trích rút 10 từ khóa 57 Bảng 2.3 So sánh với kết nghiên cứu gần 59 Bảng 3.1 Kết thử nghiệm 74 Bảng 3.2 Kết công bố Sanchez-Perez 75 Bảng 3.3 Kết mã hóa đoạn 79 Bảng 3.4 Sự phụ thuộc giá trị k vào độ dài đoạn chép 91 Bảng 3.5 Kết thử nghiệm 93 Bảng 3.6 So sánh kết với nghiên cứu gần 95 Bảng 4.1 Bảng thông tin liệu thu thập 102 Bảng 4.2 Bảng phân bố độ dài đoạn chép 102 Bảng 4.3 Mô tả liệu từ đồng nghĩa 104 Bảng 4.4 Thống kê kho ngữ liệu phát đoạn chép tiếng Việt 106 Bảng 4.5 Tóm tắt thơng tin kho ngữ liệu ĐATN 112 Bảng 4.6 Kết thử nghiệm kho ngữ liệu ĐATN 113 Bảng 4.7 Tóm tắt thơng tin kho ngữ liệu trích rút từ khóa tiếng Việt 115 Bảng 4.8 Kết thử nghiệm với kho ngữ liệu báo tiếng Việt 116 Bảng 4.9 Kết thử nghiệm với thuật toán YAKE! 116 Bảng 4.10 Kết thử nghiệm với kho ngữ liệu tiếng Việt 118 Bảng 4.11 Kết thử nghiệm tác giả Sanchez-Perez 119 Bảng 4.12 Kết thử nghiệm với kho ngữ liệu tiếng Việt 121 vii DANH MỤC CÁC HÌNH VẼ Trang Hình 1.1 Các hình thức chép Hình 1.2 Mơ hình thuật tốn LDA 14 Hình 1.3 Mơ hình mạng RNN 17 Hình 1.4 Sơ đồ biểu diễn kiến trúc bên tế bào LSTM 19 Hình 1.5 Kiến trúc mơ hình LSTM xếp chồng 21 Hình 1.6 Phân loại tiếp cận phát chép 22 Hình 1.7 Mơ hình phát chép toàn cục 23 Hình 1.8 Mối quan hệ S D 39 Hình 1.9 Mơ hình hệ thống phát chép 42 Hình 2.1 Mơ hình tổng qt tốn tìm tập tài liệu ứng cử 44 Hình 2.2 Quy trình tổng quan hệ thống trích rút từ khóa 47 Hình 2.3 Mơ hình trích rút từ khóa dựa mơ hình FFNN 53 Hình 2.4 Mơ hình trích rút từ khóa dựa mơ hình LSTM 54 Hình 2.5 Lược đồ quan hệ độ xác số lần lặp 56 Hình 2.6 Lược đồ quan hệ độ mát số lần lặp 56 Hình 3.1 Quy trình phát đoạn chép dựa mơ hình chủ đề 65 Hình 3.2 Quy trình phát đoạn chép 78 Hình 3.3 Mơ hình phát chép mức đoạn 78 Hình 3.4 Mơ hình phát chép mức từ 84 Hình 3.5 Đoạn kết nằm ngồi đoạn văn chép 90 Hình 3.6 Đoạn kết nằm đoạn văn chép 90 Hình 3.7 Đoạn kết nằm phần đoạn văn chép 90 Hình 3.8 Sự ảnh hưởng đặc trưng đến kết phát chép 93 Hình 4.1 Mơ hình tạo trường hợp chép nguyên văn 103 viii Hình 4.2 Mơ hình tạo trường hợp chép thay từ đồng nghĩa 105 Hình 4.3 Mơ hình tạo trường hợp chép dịch tự động 105 Hình 4.4 Mơ hình trích rút từ khóa 108 P.12 A significant concern for Internet-based service providers is the continued operation and availability of services in the face of outages, whether planned or unplanned In this paper we advocated a cooperative, context-aware approach to data center migration across WANs to deal with outages in a non-disruptive manner We sought to achieve high availability of data center services in the face of both planned and incidental outages of data center facilities We advocated using server virtualization technologies to enable the replication and migration of server functions We proposed new network functions to enable server migration and replication across wide area networks (such as the Internet or a geographically distributed virtual private network), and finally showed the utility of intelligent and dynamic storage replication technology to ensure applications have access to data in the face of outages with very tight recovery point objectives REFERENCES [1] M Abd-El-Malek, W V Courtright II, C Cranor, G R Ganger, J Hendricks, A J Klosterman, M Mesnier, M Prasad, B Salmon, R R Sambasivan, S Sinnamohideen, J D Strunk, E Thereska, M Wachs, and J J Wylie Ursa minor: versatile cluster-based storage USENIX Conference on File and Storage Technologies, December 2005 [2] Mukesh Agrawal, Susan Bailey, Albert Greenberg, Jorge Pastor, Panagiotis Sebos, Srinivasan Seshan, Kobus van der Merwe, and Jennifer Yates Routerfarm: Towards a dynamic, manageable network edge SIGCOMM Workshop on Internet Network Management (INM), September 2006 [3] L Alvisi Understanding the Message Logging Paradigm for Masking Process Crashes PhD thesis, Cornell, January 1996 [4] L Alvisi and K Marzullo Message logging: Pessimistic, optimistic, and causal In Proceedings of the 15th International Conference on Distributed Computing Systems, pages 229-236 IEEE Computer Society, June 1995 266 [5] Paul Barham, Boris Dragovic, Keir Fraser, Steven Hand, Tim Harris, Alex Ho, Rolf Neugebar, Ian Pratt, and Andrew Warfield Xen and the art of virtualization In the Proceedings of the ACM Symposium on Operating Systems Principles (SOSP), October 2003 [6] A Brown and D A Patterson Embracing failure: A case for recovery-oriented computing (roc) 2001 High Performance Transaction Processing Symposium, October 2001 [7] K Brown, J Katcher, R Walters, and A Watson Snapmirror P.13 and snaprestore: Advances in snapshot technology Network Appliance Technical Report TR3043 www ne t app c om/t e c h_ l i br ar y/3043 ht ml [8] C Clark, K Fraser, S Hand, J Hanse, E Jul, C Limpach, I Pratt, and A Warfiel Live migration of virtual machines In Proceedings of NSDI, May 2005 [9] Disaster Recovery Journal Business continuity glossary ht t p: //www dr j c om/gl os s ar y/dr j gl os s ar y ht ml [10] Laura Grit, David Irwin, , Aydan Yumerefendi, and Jeff Chase Virtual machine hosting for networked clusters: Building the foundations for autonomic orchestration In In the First International Workshop on Virtualization Technology in Distributed Computing (VTDC), November 2006 [11] M Ji, A Veitch, and J Wilkes Seneca: Remote mirroring done write USENIX 2003 Annual Technical Conference, June 2003 [12] M Kozuch and M Satyanarayanan Internet suspend and resume In Proceedings of the Fourth IEEE Workshop on Mobile Computing Systems and Applications, Calicoon, NY, June 2002 [13] Xiaotao Liu, Gal Niv, K K Ramakrishnan, Prashant Shenoy, and Jacobus Van der Merwe The case for semantic aware remote replication In Proc 2nd International Workshop on Storage Security and Survivability (StorageSS 2006), Alexandria, VA, October 2006 [14] Michael Nelson, Beng-Hong Lim, and Greg Hutchins Fast Transparent Migration for Virtual Machines In USENIX Annual Technical Conference, 2005 [15] Mendel Rosenblum and Tal Garfinkel Virtual machine monitors: Current technology and future trends Computer, 38(5):39-47, 2005 [16] C Ruemmler and J Wilkes Unix disk access patterns Proceedings of Winter 1993 USENIX, Jan 1993 [17] Paul Ruth, Junghwan Rhee, Dongyan Xu, Rick Kennell, and Sebastien Goasguen Autonomic Live Adaptation of Virtual Computational Environments in a Multi-Domain Infrastructure In IEEE International Conference on Autonomic Computing (ICAC), June 2006 [18] Constantine P Sapuntzakis, Ramesh Chandra, Ben Pfaff, Jim Chow, Monica S Lam, and Mendel Rosenblum Optimizing the migration of virtual computers In Proceedings of the 5th Symposium on Operating Systems Design and P.14 Implementation, December 2002 [19] A Sundararaj, A Gupta, and P Dinda Increasing Application Performance in Virtual Environments through Run-time Inference and Adaptation In Fourteenth International Symposium on High Performance Distributed Computing (HPDC), July 2005 [20] Symantec Corporation Veritas Volume Replicator Administrator"s Guide ht t p: //f t p s uppor t ve r i t as c om/pub/s uppor t / pr oduc t s /Vol ume _ Re pl i c at or /2%83842 pdf , 5.0 edition, 2006 [21] F Travostino, P Daspit, L Gommans, C Jog, C de Laat, J Mambretti, I Monga, B van Oudenaarde, S Raghunath, and P Wang Seamless live migration of virtual machines over the man/wan Elsevier Future Generations Computer Systems, 2006 [22] T Wood, P Shenoy, A Venkataramani, and M Yousif Black-box and gray-box strategies for virtual machine migration In Proceedings of the Usenix Symposium on Networked System Design and Implementation (NSDI), Cambridge, MA, April 2007 [23] A xen way to iscsi virtualization? http://www.internetnews.com/dev-news/article.php/3669246, Tập từ khóa xác định trước Tệp C-20.key thuộc kho ngữ liệu SemEval2010 gồm từ khóa tác giả xác định: internetbased, service, data, center, migration, wan, lan, virtual, server, storage, replication, synchronous, replication, asynchronous, replication, network, support, storage, voiceoverip, voip, database Tập từ khóa ứng cử Kết trích rút tập từ khóa ứng cử lấy từ Cụm danh từ, Thực thể có tên cụm ba từ xuất lặp lại nhiều lần: migration, replication, virtualization, server, live, outages, center, storage, network, virtual, recovery, technologies, data, ramakrishnan, internetbased, application, remote, cooperative, wan, availability, maintenance, services, applications, service, technology, aware, distributed, operation, contextaware, management, approach, continued, centers, context, unplanned, access, providers, P.15 requirements, networks, significant, nondisruptive, business, systems, facilities, shenoy, prashant, intelligent, face, design, advances, objectives, disaster, manner, concern, categories, unanticipated, functions, wide, lan, high, minor, wans, propose, area, computercommunication, dynamic, internet, environment, mechanisms, physical, der, utility, disk, local, networking, functionality, failures, van, asynchronous, tight, ongoing, point, synchronous, jacobus, support, paper, disruptions, catastrophic, effective, current, servers, particular, critical, seamless, connectivity, administrator, tunnel, merwe, subsystems, environments, use, entertainment, operations, general, new, balance, labsresearch, outage, applicationservice, first, operating, second, available, address, users, essential, technical, location, allow, servicesapplications, realtime, building, events, continuous, instantaneous, introduction, milliseconds, sophisticated, reliability, semantics, descriptors, different, number, university, mirroring, machine, components, interactions, frequency, configuration, state, similar, private, system, techniques, abstract, downtime, amount, prior, concerns, underlying, connections, framework, work, changes, same, mission, ip, recent, robust, massachusetts, reasons, tool, contribution, coordinate, fashion, viewpoint, reachability, multiple, level, terms, redundancy, subject, example, failure, presents, challenges, performance, blocks, requirement, disruption, provider, section, http, software, platforms, extensions, write, networkbased, hotswappable, active, traffic, case, redundant, kk, such, today, throughput, robustness, running, shared, practices, knowledge, little, essence, appropriate, capabilities, businessusability, large, individual, needs, tens, consistent, es, addresses, unsolicited, cognizant, implication, necessity, complete, supplies, ability, load, router, nature, process, towards, databases, eg, primary, coordination, becomes, mobility, replicas, unique, experience, checkpoint, optimal, devices, efficiency, desirable, entirety, varies, attractive, difficulty, unresolved, anticipation, entire, san, switchover, observations, convergence, feat, hundreds, logic, constraints, applicationaware, way, main, simultaneous, means, unavailability, localprimary, reason, coalescing, challenge, other, considerations, actions, part, driver, initial, consistency, binding, latency, overhead, extension, whole, desire, weight, switch, latter, preparation, signal, snapshot, anticipated, actual, subset, divergence, space, operators, transfer, localized, enabler, alternative, processor, sessionbased, heavy, protocols, layertwo, discussion, power, phase, vpns, decades, focus, purposes, kind, routers, completion, loss, basic, preestablished, routed, event, site, signals, properties, P.16 consequence, key, recoveryoriented, financial, edge, necessary, communication, impact, perspective, intermediate, virtualized, subsystem, order, convenient, time, previous, switches, routing, orchestrated, reply, approaches, checkpoints, cases, suspend, bulk, information, encapsulate, preferred, modern, efficient, solution, mac, priority, concert, nonlan, manual, years, clusterbased, sans, returns, flexible, need, scales, semanticaware, problem, secondary, occurrence, path, initiation, subsequent, builds, writes, direct, status, metrics, starts, forms, change, situation, exposition, addition, selections, scenarios, resume, gateway, issues, disks, voiceoverip, persistent, affordable, certain, delivery, exposure, copies, successful, block, detail, simplicity, ie, orchestration, snapshots, situations, description, incidental, final, emphasizes, sessions, normal, element, proceeds, checkpointing, effects, customer, periodic, route, commercial, stringent, interfaces, extreme, spectrum, instance, over, blades, principle, processing, foundations, avoidance, arp, scale, manageable, mechanism, datatype, alternate, standbyin, continuity, excellent, snaprestore, technique, versatile, mode, step, downtimes, price, ingress, minimum, fact, prompting, replica, impending, activity, session, taxonomy, advanced, memory, interval, products, numerous, parts, safe, control, view, clients, standby, function, detailed, figure, steps, regards, strategies, dormant, specific, deeper, computers, vs, proxy, monitors, fault, clusters, basis, right, machines, course, details, feature, points, schemes, quick, cold, voip, differs, timing, semantic, incremental, several, tunnels, graybox, patterns, full, hitless, ht, glossary, spirit, causal, international, notion, source, usenix, set, models, others, edition, thesis, topic, ar, single, note, hot, survivability, short, proceedings, trends, autonomic, implementation, pe, grid, warm, core, infrastructure, venkataramani, model, copy, computing, many, 15th, symposium, ml, ce, pages, manwan, computational, routerfarm, conference, y3043, multidomain, transaction, www, os, uppor, transparent, generations, networked, conclusion, ne, december, gl, replicator, art, pdf, adaptation, principles, logging, roc, pes, replistor, 5th, fourteenth, abdelmalek, garfinkel, workshop, dr, related, sebastien, ydr, references, computer, pl, pr, paradigm, crashes, sundararaj, inference, agrawal, appliance, travostino, oudenaarde, cornell, sigcomm, thereska, message, blackbox, prasad, seshan, rpos, ve, security, dragovic, vm, raghunath, society, file, calicoon, mesnier, benghong, june, goasguen, nelson, journal, runtime, winter, annual, cranor, sip, pastor, dongyan, barham, fourth, ieee, report, wilkes, tr3043, future, de, xp, sosp, seneca, volume, unix, wachs, gupta, icac, guide, yousif, wood, gal, mms, phd, dinda, proc, P.17 lim, vtdc, wang, liu, jan, inm, rhee, andrew, hpdc, ii, va, sinnamohideen, niv, monica, xu, tal, ny, satyanarayanan, hp, kobus, re, keir, alexandria, srinivasan, rosenblum, hendricks, storagess, laat, marzullo, courtright, shirako, klosterman, sambasivan, panagiotis, vmware, yumerefendi, corporation, snapmirror, xen, greenberg, bailey, hutchins, constantine, sapuntzakis, patterson, albert, app, harris, jennifer, nsdi, steven, neugebar, warfield, ursa, watson, ibm, paul, susan, chandra, kozuch, brown, vms, ganger, salmon, strunk, katcher, walters, irwin, clark, mukesh, alvisi, limpach, warfiel, emc, fraser, alex, michael, ruemmler, mambretti, chase, junghwan, ramesh, wylie, xiaotao, jorge, sebos, yates, symantec, pratt, cambridge, boris, jeff, tim, kennell, ian, david, oduc, veitch, hand, ho, rick, mendel, hanse, veritas, gommans, laura, aydan, rolf, daspit, grit, acm, lam, ben, jim, pfaff, jul, greg, ji, monga, ruth, chow, vol, jog, ume, ma, rpo Kết xác định độ quan trọng từ Kết dự đoán độ quan trọng từ tập từ khóa ứng cử xếp giảm dần theo độ quan trọng (Các từ in đậm 10 kết nằm tập từ khóa xác định trước) Bảng P1 Kết dự đoán độ quan trọng từ STT 10 11 12 13 14 15 16 17 18 19 20 21 Từ khóa ứng cử migration replication virtualization server live outages center storage network virtual recovery technologies data ramakrishnan internetbased application remote cooperative wan availability maintenance Giá trị y STT 0.840984 382 0.678164 383 0.659803 384 0.618527 385 0.61789 386 0.610963 387 0.606313 388 0.542996 389 0.533428 390 0.490329 391 0.462664 392 0.439565 393 0.439148 394 0.371115 395 0.363683 396 0.32836 397 0.311041 398 0.298606 399 0.260697 400 0.249949 401 0.246622 402 Từ khóa ứng cử resume gateway issues disks voiceoverip persistent affordable certain delivery exposure copies successful block detail simplicity ie orchestration snapshots situations description incidental Giá trị y 0.0045808 0.0045794 0.004577 0.0045655 0.0045531 0.0045473 0.004527 0.0045241 0.0045182 0.0045027 0.0044478 0.0044444 0.0044061 0.0043981 0.0043912 0.0043785 0.0043709 0.00437 0.0043109 0.0042526 0.0042457 P.18 STT 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 Từ khóa ứng cử services applications service technology aware distributed operation contextaware management approach continued centers context unplanned access providers requirements networks significant nondisruptive business systems facilities shenoy prashant intelligent face design advances objectives disaster manner concern categories unanticipated functions wide lan high minor wans propose Giá trị y STT 0.236617 403 0.21758 404 0.208958 405 0.188583 406 0.184637 407 0.184114 408 0.178693 409 0.174755 410 0.16334 411 0.160562 412 0.159632 413 0.151135 414 0.149825 415 0.136594 416 0.135795 417 0.132818 418 0.132789 419 0.131715 420 0.129641 421 0.127865 422 0.126391 423 0.123377 424 0.122692 425 0.113144 426 0.109356 427 0.107079 428 0.10703 429 0.10576 430 0.105361 431 0.103294 432 0.102727 433 0.102325 434 0.101271 435 0.098923 436 0.097049 437 0.097024 438 0.094731 439 0.09354 440 0.091383 441 0.087343 442 0.081532 443 0.081235 444 Từ khóa ứng cử final emphasizes sessions normal element proceeds checkpointing effects customer periodic route commercial stringent interfaces extreme spectrum instance over blades principle processing foundations avoidance arp scale manageable mechanism datatype alternate standbyin continuity excellent snaprestore technique versatile mode step downtimes price ingress minimum fact Giá trị y 0.0042226 0.0042183 0.0041841 0.0041711 0.0041647 0.0041553 0.0041511 0.0041382 0.00413 0.0040518 0.0040377 0.0040179 0.0039577 0.0039557 0.0039349 0.0039304 0.0039263 0.003924 0.0039219 0.0038941 0.0038913 0.0038743 0.0038511 0.0038416 0.0038255 0.0038238 0.0038141 0.0037792 0.0037481 0.0037446 0.0037397 0.0037301 0.0036539 0.0036314 0.0036119 0.0036081 0.0036024 0.0035835 0.0035753 0.0035746 0.0035724 0.0035698 P.19 STT Từ khóa ứng cử Giá trị y STT 64 area 0.075401 445 65 computercommunication 0.071124 446 66 dynamic 0.070823 447 67 internet 0.070188 448 68 environment 0.07006 449 69 mechanisms 0.068699 450 70 physical 0.067211 451 71 der 0.065018 452 72 utility 0.064928 453 73 disk 0.063486 454 74 local 0.062574 455 75 networking 0.062066 456 76 functionality 0.060316 457 77 failures 0.058608 458 78 van 0.056861 459 79 asynchronous 0.055627 460 80 tight 0.055299 461 81 ongoing 0.055233 462 82 point 0.055094 463 83 synchronous 0.055003 464 84 jacobus 0.054747 465 85 support 0.05382 466 86 paper 0.053773 467 87 disruptions 0.053526 468 88 catastrophic 0.052759 469 89 effective 0.052542 470 90 current 0.051912 471 91 servers 0.049387 472 92 particular 0.049132 473 93 critical 0.047906 474 94 seamless 0.046336 475 95 connectivity 0.044587 476 96 administrator 0.043383 477 97 tunnel 0.04324 478 98 merwe 0.041538 479 99 subsystems 0.041409 480 100 environments 0.040257 481 101 use 0.036387 482 102 entertainment 0.036088 483 103 operations 0.03538 484 104 general 0.034748 485 105 new 0.034575 486 Từ khóa ứng cử prompting replica impending activity session taxonomy advanced memory interval products numerous parts safe control view clients standby function detailed figure steps regards strategies dormant specific deeper computers vs proxy monitors fault clusters basis right machines course details feature points schemes quick cold Giá trị y 0.0035426 0.0035229 0.0035184 0.003507 0.0034768 0.0034586 0.0033992 0.0033911 0.0033575 0.0033335 0.0032772 0.0032592 0.0032163 0.0031983 0.0031885 0.0031725 0.0031548 0.0031449 0.0031171 0.0030952 0.0030943 0.0030621 0.0030361 0.0029639 0.0029358 0.0029295 0.0029269 0.0029162 0.0029011 0.0028663 0.00285 0.002828 0.002826 0.0028248 0.0028083 0.0028024 0.0027973 0.0027855 0.0027779 0.0027776 0.0027557 0.0027474 P.20 STT 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 Từ khóa ứng cử balance labsresearch outage applicationservice first operating second available address users essential technical location allow servicesapplications realtime building events continuous instantaneous introduction milliseconds sophisticated reliability semantics descriptors different number university mirroring machine components interactions frequency configuration state similar private system techniques abstract downtime Giá trị y STT 0.034293 487 0.034123 488 0.032523 489 0.0323 490 0.032053 491 0.031873 492 0.031871 493 0.031776 494 0.031016 495 0.030828 496 0.030411 497 0.030131 498 0.029677 499 0.029313 500 0.029243 501 0.029228 502 0.029168 503 0.028764 504 0.028121 505 0.027937 506 0.027788 507 0.027768 508 0.027693 509 0.027484 510 0.02676 511 0.025592 512 0.025459 513 0.025158 514 0.024702 515 0.024501 516 0.024371 517 0.024161 518 0.024085 519 0.023768 520 0.023489 521 0.023362 522 0.023309 523 0.023003 524 0.022504 525 0.021737 526 0.021286 527 0.021142 528 Từ khóa ứng cử voip differs timing semantic incremental several tunnels graybox patterns full hitless ht glossary spirit causal international notion source usenix set models others edition thesis topic ar single note hot survivability short proceedings trends autonomic implementation pe grid warm core infrastructure venkataramani model Giá trị y 0.0027359 0.0027316 0.0026993 0.0026863 0.0026836 0.002665 0.0026577 0.0026532 0.0025977 0.0025534 0.0025488 0.0025404 0.0025208 0.002509 0.0024637 0.002438 0.0024247 0.0024038 0.0023922 0.0023618 0.0023371 0.0023345 0.0022988 0.0022935 0.0022763 0.0022534 0.0022509 0.0022465 0.0022409 0.0022022 0.0021964 0.0021695 0.0021362 0.0021327 0.002083 0.0020795 0.0020748 0.002055 0.0020492 0.0020421 0.0020299 0.0020187 P.21 STT 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 Từ khóa ứng cử amount prior concerns underlying connections framework work changes same mission ip recent robust massachusetts reasons tool contribution coordinate fashion viewpoint reachability multiple level terms redundancy subject example failure presents challenges performance blocks requirement disruption provider section http software platforms extensions write networkbased Giá trị y STT 0.020983 529 0.020438 530 0.020368 531 0.020181 532 0.020169 533 0.019967 534 0.019943 535 0.019746 536 0.019699 537 0.019429 538 0.019258 539 0.018481 540 0.018437 541 0.018398 542 0.018173 543 0.018069 544 0.017874 545 0.017508 546 0.01731 547 0.017007 548 0.016715 549 0.016661 550 0.016497 551 0.016478 552 0.016408 553 0.015692 554 0.015675 555 0.015571 556 0.015501 557 0.015161 558 0.014878 559 0.014839 560 0.014562 561 0.014552 562 0.014527 563 0.014516 564 0.014488 565 0.01448 566 0.014328 567 0.014232 568 0.014197 569 0.014171 570 Từ khóa ứng cử copy computing many 15th symposium ml ce pages manwan computational routerfarm conference y3043 multidomain transaction www os uppor transparent generations networked conclusion ne december gl replicator art pdf adaptation principles logging roc pes replistor 5th fourteenth abdelmalek garfinkel workshop dr related sebastien Giá trị y 0.00194 0.0018993 0.0018784 0.0018723 0.0018621 0.0018518 0.0018451 0.0017967 0.0017894 0.0017754 0.0017595 0.0017545 0.00175 0.0017365 0.0017094 0.0016864 0.0016773 0.0016162 0.0016075 0.0015975 0.0015931 0.0015557 0.0015469 0.0015402 0.0015227 0.0015208 0.0015121 0.0015027 0.001501 0.0014718 0.0014657 0.0014649 0.0014648 0.0014273 0.0014269 0.0014263 0.0014201 0.0014167 0.0014111 0.0013682 0.0013521 0.0013487 P.22 STT 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 Từ khóa ứng cử hotswappable active traffic case redundant kk such today throughput robustness running shared practices knowledge little essence appropriate capabilities businessusability large individual needs tens consistent es addresses unsolicited cognizant implication necessity complete supplies ability load router nature process towards databases eg primary coordination Giá trị y STT 0.013964 571 0.01382 572 0.013746 573 0.013394 574 0.013225 575 0.012854 576 0.01283 577 0.01281 578 0.012766 579 0.012753 580 0.012621 581 0.012589 582 0.012569 583 0.012438 584 0.012241 585 0.012232 586 0.012105 587 0.012089 588 0.011849 589 0.011811 590 0.011753 591 0.011703 592 0.01148 593 0.011461 594 0.011417 595 0.01139 596 0.011261 597 0.011184 598 0.011171 599 0.011126 600 0.011042 601 0.010953 602 0.010771 603 0.010654 604 0.010647 605 0.010615 606 0.010454 607 0.009911 608 0.009863 609 0.009755 610 0.009714 611 0.009567 612 Từ khóa ứng cử ydr references computer pl pr paradigm crashes sundararaj inference agrawal appliance travostino oudenaarde cornell sigcomm thereska message blackbox prasad seshan rpos ve security dragovic vm raghunath society file calicoon mesnier benghong june goasguen nelson journal runtime winter annual cranor sip pastor dongyan Giá trị y 0.0013394 0.0013047 0.0012926 0.0012628 0.0012412 0.0012372 0.0012056 0.001189 0.001188 0.0011803 0.001175 0.0011587 0.0011525 0.0011472 0.00111 0.0011092 0.0011037 0.0011029 0.0010992 0.0010836 0.0010718 0.0010707 0.0010704 0.0010703 0.001057 0.0010229 0.001008 0.0010009 0.0009904 0.0009895 0.000976 0.0009648 0.0009563 0.0009411 0.0009258 0.000911 0.0009097 0.0008994 0.0008817 0.0008663 0.0008657 0.000851 P.23 STT 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 Từ khóa ứng cử becomes mobility replicas unique experience checkpoint optimal devices efficiency desirable entirety varies attractive difficulty unresolved anticipation entire san switchover observations convergence feat hundreds logic constraints applicationaware way main simultaneous means unavailability localprimary reason coalescing challenge other considerations actions part driver initial consistency Giá trị y STT 0.009501 613 0.009493 614 0.009441 615 0.009179 616 0.009144 617 0.009134 618 0.009079 619 0.009068 620 0.009034 621 0.009008 622 0.008996 623 0.008913 624 0.008811 625 0.008741 626 0.008637 627 0.008615 628 0.008518 629 0.008446 630 0.008434 631 0.008378 632 0.008318 633 0.007965 634 0.007892 635 0.00782 636 0.007783 637 0.007772 638 0.00776 639 0.007727 640 0.007708 641 0.007664 642 0.007623 643 0.007621 644 0.007501 645 0.00743 646 0.007417 647 0.007394 648 0.00738 649 0.007338 650 0.007235 651 0.007214 652 0.007191 653 0.007187 654 Từ khóa ứng cử barham fourth ieee report wilkes tr3043 future de xp sosp seneca volume unix wachs gupta icac guide yousif wood gal mms phd dinda proc lim vtdc wang liu jan inm rhee andrew hpdc ii va sinnamohideen niv monica xu tal ny satyanarayanan Giá trị y 0.0008447 0.0008392 0.0008385 0.000827 0.0008237 0.0008223 0.0008174 0.0008126 0.0007982 0.0007951 0.0007899 0.0007782 0.0007777 0.0007764 0.0007693 0.0007677 0.0007181 0.0007099 0.0006844 0.0006833 0.0006742 0.0006715 0.0006558 0.0006469 0.0006428 0.0006254 0.0006206 0.000605 0.0006041 0.000602 0.0005962 0.0005909 0.0005783 0.0005641 0.0005618 0.0005494 0.0005456 0.0005414 0.0005404 0.0005352 0.0005255 0.0004802 P.24 STT 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 Từ khóa ứng cử binding latency overhead extension whole desire weight switch latter preparation signal snapshot anticipated actual subset divergence space operators transfer localized enabler alternative processor sessionbased heavy protocols layertwo discussion power phase vpns decades focus purposes kind routers completion loss basic preestablished routed event Giá trị y STT 0.007176 655 0.007136 656 0.007092 657 0.007062 658 0.007004 659 0.006951 660 0.006927 661 0.006921 662 0.006908 663 0.006881 664 0.006875 665 0.006874 666 0.006833 667 0.006811 668 0.006804 669 0.006801 670 0.006789 671 0.006741 672 0.006687 673 0.006684 674 0.006667 675 0.006654 676 0.00665 677 0.006645 678 0.00664 679 0.006616 680 0.006604 681 0.006598 682 0.006525 683 0.006509 684 0.006507 685 0.006464 686 0.006448 687 0.006413 688 0.006337 689 0.006307 690 0.006291 691 0.006257 692 0.00625 693 0.006211 694 0.006206 695 0.006204 696 Từ khóa ứng cử hp kobus re keir alexandria srinivasan rosenblum hendricks storagess laat marzullo courtright shirako klosterman sambasivan panagiotis vmware yumerefendi corporation snapmirror xen greenberg bailey hutchins constantine sapuntzakis patterson albert app harris jennifer nsdi steven neugebar warfield ursa watson ibm paul susan chandra kozuch Giá trị y 0.0004593 0.0004488 0.0004384 0.0003816 0.0003689 0.0003569 0.0003449 0.0003437 0.0003361 0.0002986 0.0002801 0.0002798 0.0002795 0.0002775 0.0002757 0.0002679 0.0002562 0.0002521 0.0002517 0.0002388 0.0002384 0.0002366 0.0002238 0.000217 0.0002148 0.0002146 0.000214 0.0002124 0.0002115 0.0002076 0.0002048 0.0001985 0.0001931 0.0001924 0.0001916 0.0001906 0.0001886 0.0001831 0.0001793 0.0001779 0.0001771 0.0001758 P.25 STT 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 Từ khóa ứng cử site signals properties consequence key recoveryoriented financial edge necessary communication impact perspective intermediate virtualized subsystem order convenient time previous switches routing orchestrated reply approaches checkpoints cases suspend bulk information encapsulate preferred modern efficient solution mac priority concert nonlan manual years clusterbased sans Giá trị y STT 0.006195 697 0.006155 698 0.006106 699 0.006096 700 0.006056 701 0.006006 702 0.005989 703 0.00598 704 0.00597 705 0.005953 706 0.005874 707 0.005872 708 0.005856 709 0.005826 710 0.00579 711 0.005773 712 0.005768 713 0.005661 714 0.005661 715 0.005652 716 0.005564 717 0.00556 718 0.00556 719 0.005505 720 0.005482 721 0.005471 722 0.005456 723 0.005414 724 0.005397 725 0.005384 726 0.005355 727 0.005348 728 0.005325 729 0.005286 730 0.005283 731 0.005279 732 0.005264 733 0.005264 734 0.005255 735 0.005195 736 0.005181 737 0.005139 738 Từ khóa ứng cử brown vms ganger salmon strunk katcher walters irwin clark mukesh alvisi limpach warfiel emc fraser alex michael ruemmler mambretti chase junghwan ramesh wylie xiaotao jorge sebos yates symantec pratt cambridge boris jeff tim kennell ian david oduc veitch hand ho rick mendel Giá trị y 0.0001757 0.0001715 0.000165 0.0001633 0.0001625 0.0001613 0.000161 0.0001609 0.0001604 0.0001593 0.0001563 0.0001553 0.0001546 0.0001529 0.0001527 0.0001513 0.0001502 0.0001499 0.0001485 0.0001482 0.0001478 0.0001438 0.0001412 0.0001395 0.0001386 0.0001385 0.0001374 0.0001365 0.0001327 0.0001317 0.0001299 0.0001295 0.0001289 0.0001287 0.0001283 0.0001278 0.0001276 0.0001266 0.000125 0.0001217 0.0001214 0.0001195 P.26 STT 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 Từ khóa ứng cử returns flexible need scales semanticaware problem secondary occurrence path initiation subsequent builds writes direct status metrics starts forms change situation exposition addition selections scenarios Giá trị y STT 0.005111 739 0.005098 740 0.005092 741 0.005086 742 0.005044 743 0.004982 744 0.004961 745 0.004953 746 0.004924 747 0.004921 748 0.004894 749 0.004858 750 0.004834 751 0.004823 752 0.004808 753 0.004762 754 0.004734 755 0.004701 756 0.004692 757 0.004689 758 0.004662 759 0.00465 760 0.004642 761 0.004629 762 Từ khóa ứng cử hanse veritas gommans laura aydan rolf daspit grit acm lam ben jim pfaff jul greg ji monga ruth chow vol jog ume ma rpo Giá trị y 0.0001193 0.0001192 0.0001144 0.0001142 0.000114 0.0001129 0.0001003 0.0001001 9.91E-05 9.84E-05 9.84E-05 9.81E-05 9.61E-05 9.06E-05 9.00E-05 8.76E-05 8.70E-05 8.66E-05 8.39E-05 6.78E-05 6.70E-05 5.71E-05 5.24E-05 1.36E-05 ... thiết lý mà luận án lựa chọn đề tài ? ?Nghiên cứu phát triển số kỹ thuật hỗ trợ phát đạo văn ứng dụng cho văn tiếng Việt ” Mục tiêu nghiên cứu - Nghiên cứu, đề xuất số kỹ thuật hỗ trợ phát chép gồm...BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ NGUYỄN VĂN SƠN NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ KỸ THUẬT HỖ TRỢ PHÁT HIỆN ĐẠO VĂN VÀ ỨNG DỤNG CHO VĂN BẢN TIẾNG VIỆT Chuyên... dài tiếng Việt 107 4.3.2 Cải tiến kỹ thuật trích rút từ khóa dựa mơ hình học sâu cho văn tiếng Việt 114 4.4 Ứng dụng kỹ thuật phát đoạn chép cho văn tiếng Việt 116 4.4.1 Cải tiến

Ngày đăng: 25/12/2022, 15:15

Tài liệu cùng người dùng

Tài liệu liên quan