PHÂN LOẠI QUAN ĐIỂM CỦA DU KHÁCH VỚI DU LỊCH PHONG NHA - KẺ BÀNG TỈNH QUẢNG BÌNH LUẬN VĂN THẠC SĨ KỶ THUẬT

69 11 0
PHÂN LOẠI QUAN ĐIỂM CỦA DU KHÁCH VỚI DU LỊCH PHONG NHA - KẺ BÀNG TỈNH QUẢNG BÌNH  LUẬN VĂN THẠC SĨ KỶ THUẬT

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN VĂN HƯỚNG PHÂN LOẠI QUAN ĐIỂM CỦA DU KHÁCH VỚI DU LỊCH PHONG NHA - KẺ BÀNG TỈNH QUẢNG BÌNH Chuyên nghành: Khoa học máy tính Mã số: 8480101 LUẬN VĂN THẠC SĨ KỶ THUẬT Người hướng dẫn khoa học: TS ĐẬU MẠNH HOÀN Đà Nẵng- Năm 2018 LỜI CAM ĐOAN Tôi xin cam đoan: Những nội dung luận văn thực hướng dẫn trực tiếp TS Đậu Mạnh Hoàn Mọi tham khảo dùng luận văn trích dẫn rõ ràng trung thực tên tác giả, tên cơng trình, thời gian địa điểm công bố Mọi chép không hợp lệ, vi phạm quy chế đào tạo, xin chịu hoàn toàn trách nhiệm Tác giả luận văn Nguyễn Văn Hướng MỤC LỤC TRANG BÌA LỜI CAM ĐOAN MỤC LỤC TRANG TÓM TẮT TIẾNG ANH DANH MỤC CÁC CỤM TỪ VIẾT TẮT DANH MỤC CÁC HÌNH MỞ ĐẦU 1 Lý chọn đề tài Mục đích ý nghĩa đề tài 3 Mục tiêu nhiệm vụ đề tài Đối tượng, phạm vi nghiên cứu Phương pháp nghiên cứu CHƯƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1 KHAI PHÁ DỮ LIỆU VÀ MỘT SỐ PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU 1.1.1 Khai phá liệu 1.1.2 Một số phương pháp kỹ thuật khai phá liệu 1.2 KHAI PHÁ QUAN ĐIỂM 10 1.2.1 Khai phá quan điểm 10 1.2.2 Bài toán phân loại quan điểm 11 1.2.3 Cấp độ phân loại quan điểm 12 1.2.4 Kỹ thuật phân loại quan điểm 14 CHƯƠNG 2: PHƯƠNG PHÁP TÁCH TỪ VÀ PHÂN LOẠI VĂN BẢN 18 2.1 MỘT SỐ PHƯƠNG PHÁP TÁCH TỪ TIẾNG VIỆT 18 2.1.1 Tổng quan 18 2.1.2 Phương pháp Maximum Matching 19 2.1.3 Phương pháp Weighted Finite State Transducer mạng Neural 20 2.1.4 Phương pháp MMSeg 20 2.1.5 Phương pháp Maximum Entropy 22 2.1.6 Phương pháp Pointwise 23 2.2 MỘT SỐ PHƯƠNG PHÁP PHÂN LOẠI VĂN BẢN 24 2.2.1 Phương pháp Naive Bayes 24 2.2.2 Phương pháp Linear Least-Squares Fit 25 2.2.3 Phương pháp k–Nearest Neighbor 25 2.2.4 Phương pháp định 27 2.2.5 Phương pháp Mạng Nơron nhân tạo 28 2.2.6 Phương pháp Support Vector Machines 30 2.2.7 Lựa chọn phương pháp 31 CHƯƠNG 3: XÂY DỰNG BÀI TOÁN PHÂN LOẠI QUAN ĐIỂM CỦA DU KHÁCH VỚI DU LỊCH PHONG NHA – KẺ BÀNG 33 3.1 YÊU CẦU CỦA BÀI TOÁN PHÂN LOẠI QUAN ĐIỂM 33 3.2 BÀI TOÁN VÀ MƠ HÌNH CHO BÀI TỐN 33 3.2.1 Mơ tả tốn 33 3.2.2 Mơ hình xử lý tốn 35 3.3 XỬ LÝ BÀI TOÁN 37 3.3.1 Chuẩn bị liệu 37 3.3.2 Tiền xử lý liệu 37 3.3.3 Tách từ 38 3.3.4 Loại bỏ từ Stopwords 38 3.3.5 Chuyển đổi thành câu văn 38 3.3.6 Trích xuất tập đặc trưng biểu diễn văn 38 3.3.7 Đoán nhận cảm xúc câu văn 39 3.3.8 Đánh giá quan điểm đoạn văn 41 3.4 KẾT QUẢ THỰC NGHIỆM 41 3.4.1 Công cụ môi trường 41 3.4.2 Một số kết 41 3.4.3 Đánh giá kết 44 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 47 TÀI LIỆU THAM KHẢO 49 QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (BẢN SAO) BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC PHẢN BIỆN TRANG TÓM TẮT TIẾNG ANH PHÂN LOẠI QUAN ĐIỂM CỦA DU KHÁCH VỚI DU LỊCH PHONG NHA - KẺ BÀNG TỈNH QUẢNG BÌNH Học viên: Nguyễn Văn Hướng Chuyên ngành: Khoa học máy tính Mã số: 8480101 Khóa: K34 Trường Đại học Bách khoa - ĐHĐN Tóm tắt - Phong Nha - Kẻ Bàng điểm đến lý tưởng có nhiều tiềm thu hút khách du lịch, thời gian gần thực trở thành điểm du lịch hấp dẫn du khách nước Để du lịch Quảng Bình nói chung Du lịch Phong Nha - Kẻ Bàng nói riêng phát triển lên ngày nhanh mạnh mẽ hơn, thu hút lượng khách du lịch đến thăm quan nhiều hơn, nâng cao sức cạnh tranh, nâng cao vị du lịch Quảng Bình vấn đề quan trọng cấp thiết cần đưa Việc nghiên cứu đánh giá quan điểm du khách, yếu tố ảnh hưởng đến hài lòng du khách để có giải pháp phù hợp nhằm nâng cao khả thu hút du khách để từ mang lại hiệu kinh tế cao “Phân loại quan điểm du khách với du lịch Phong Nha – Kẻ Bàng tỉnh Quảng Bình” cơng việc cấp thiết, qua cho đề xuất, giải pháp mang tính thực tiễn hỗ trợ du lịch tỉnh Quảng Bình CLASSIFICATION OF VISITORS TO PHONG NHA TOURISM - QUANG BINH PROVINCE Abstract - Phong Nha - Ke Bang is an ideal destination and has great potential in attracting tourists, recently has really become an attractive tourist destination of domestic and foreign tourists Tourism in general and Phong Nha - Ke Bang Tourism in particular to go up fast and stronger, attract more tourists to visit, improve competitiveness The status of Quang Binh tourism is an important and urgent issue that needs to be addressed The study evaluates the views of visitors, as well as the factors that affect the satisfaction of visitors to have appropriate solutions to enhance the ability to attract more visitors from which to bring effective higher economic "Classifying tourists' views on the Phong Nha - Ke Bang tourist site in Quang Binh Province" is an urgent task, thereby providing practical suggestions and solutions to support tourism in Quang Binh DANH MỤC CÁC CỤM TỪ VIẾT TẮT ANN BMM CRFs FMM FN FP GIS IIS KDD kNN LLSF LM LRMM MEM MM Nnet OLAP PIV PMI Aritificial Neural Network Backward Maximum Matching Conditional Random Fields Forward Maximum Matching False Negative False Positive Generalized Iterative Scaling Improved Iterative Scaling Knowledge Discovery in Databases K–Nearest Neighbor Linear Least-Squares Fit Longest Matching Left Right Maximum Matching Maximum Entropy Model Maximum Matching Neural Network On-line analytical processing Position In Word Pointwise Mutual Information SVM TF TP WFST Support Vector Machines Term Frequency True Positive Weighted Finit–State Transducer Mạng nơ – ron nhân tạo Trường ngẫu nhiên có điều kiện Khai phá tri thức sở liệu Mạng nơ-ron Cơng cụ phân tích trực tuyến Kỹ thuật phân tích ngữ nghĩa tiềm ẩn Máy vector hỗ trợ DANH MỤC CÁC HÌNH Hình 3.1: Sơ đồ tổng quát toán phân loại quan điểm 35 Hình 3.2: Mơ hình xử lý toán phân loại quan điểm 36 Hình 3.3: Dữ liệu thực nghiệm 37 Hình 3.4: Cấu trúc mạng Nơron ANN1 40 Hình 3.5: Cấu trúc mạng Nơron ANN2 40 Hình 3.6: Màn hình giao diện 41 Hình 3.7: Chức phân loại liệu từ file 42 Hình 3.8: Chức phân loại đoạn văn 43 Hình 3.9: Chức phân loại câu văn 43 Hình 3.10: Kết thực nghiệm 44 Hình 3.11: Nội dung phân loại thuộc lớp tích cực 45 Hình 3.12: Nội dung phân loại thuộc lớp tiêu cực 45 MỞ ĐẦU LÝ DO CHỌN ĐỀ TÀI Ngày nay, với phát triển mặt đời sống từ văn hóa, giáo dục công nghệ đặc biệt lĩnh vực cơng nghệ thơng tin có bước phát triển chóng mặt Web xem cơng cụ hỗ trợ thương mại truyền thống bối cảnh Việt Nam Do đó, việc khai thác chọn lọc liệu có ích từ lượng liệu khổng lồ việc cần thiết, đóng vai trị định hoạt động Hiện nay, mạng xã hội hay trang Web có đa dạng người sử dụng người truy cập, họ chia ý kiến, đánh giá cách khách quan nhiều chủ đề chủ điểm khác nhau, q trình tích hợp thành nguồn liệu có giá trị Web ngày sử dụng phổ biến nhiều lĩnh vực du lịch, quan tổ chức, trường học Việc tìm kiếm thơng tin phù hợp có giá trị Web chủ đề quan trọng đơn vị, tổ chức có nhu cầu thu thập tìm kiếm thơng tin Internet Từ trang web thu nhiều thông tin liệu Tuy nhiên liệu có liệu có ích liệu khơng có ích, phục vụ cho nhiều mục đích khác Khai phá liệu q trình tính tốn để tìm mẫu liệu lớn liên quan đến phương pháp giao điểm máy học, thống kê hệ thống sở liệu Đây lĩnh vực liên ngành khoa học máy tính Mục tiêu tổng thể q trình khai thác liệu trích xuất thơng tin từ liệu chuyển thành cấu trúc dễ hiểu để sử dụng tiếp Ngồi bước phân tích thơ, cịn liên quan tới sở liệu khía cạnh quản lý liệu, xử lý liệu trước, suy xét mơ hình suy luận thống kê, thước đo thú vị, cân nhắc phức tạp, xuất kết cấu trúc phát hiện, hình hóa cập nhật trực tuyến Khai thác liệu bước phân tích trình khám phá kiến thức sở liệu khai phá tri thức Cùng với kỹ thuật khai phá liệu nói chung, kỹ thuật khai phá Web quan tâm nhằm chắt lọc, trích rút thơng tin phục vụ cho mục đích ứng dụng cần thiết Mặt khác, với mục tiêu tạo môi trường giao lưu, chia sẻ thơng tin đa dạng, phong phú Phân tích tâm lý lĩnh vực nghiên cứu hẹp khai phá liệu, nghiên cứu tính tốn ý kiến người, thái độ, cảm xúc ý kiến người thực thể Các thực thể đại diện cho cá nhân, tổ chức, kiện chủ đề Các vấn đề đưa xem xét bao phủ ý kiến nhiều Mục tiêu phân tích tâm lý tìm xu hướng ý kiến, xác định ý kiến mà họ thể theo khuynh hướng nào, từ phân loại ý kiến phân cực họ thực thể Vì vậy, phân tích tâm lý xem q trình phân loại đặc biệt phân loại văn thường gọi phân loại quan điểm Do việc phân loại quan điểm của người dùng có sức ảnh hưởng mang lại nhiều lợi ích thiết thực mang lại hiệu cho tất hoạt động Du lịch ngành kinh tế quan trọng, ngành kinh tế tổng hợp có tính liên ngành, liên vùng xã hội hóa cao Du lịch khơng có khả tạo nguồn thu nhập lớn cho xã hội mà cịn góp phần thực sách mở cửa, giao lưu văn hoá, thúc đẩy đổi phát triển nhiều ngành kinh tế khác, đồng thời giúp giải nhiều vấn đề mang tính chất xã hội Việt Nam, với tiềm đa dạng phong phú, vừa mang sắc văn hóa dân tộc vừa mang tính đại Đảng - Nhà nước ta xác định: "Phát triển du lịch thật trở thành ngành kinh tế mũi nhọn" sở khai thác triệt để tiềm sẵn có để hội nhập Quảng Bình, vùng đất thiên nhiên ưu ban tặng nhiều tài nguyên quý, độc đáo phục vụ cho việc phát triển ngành du lịch với nhiều loại sản phẩm du lịch, hình thức du lịch phong phú đa dạng Quảng Bình xác định “Du lịch ngành kinh tế mũi nhọn tỉnh” Quảng Bình vùng đất giàu tiềm năng, lợi để phát triển du lịch, nhiên du lịch Quảng Bình cịn nhỏ bé, mức độ phát triển chưa tương xứng với tiềm to lớn thiên nhiên ban tặng Vị Quảng Bình nói chung du lịch Quảng Bình nói riêng thấp so với tỉnh, thành phố nước Vì vậy, để du lịch Quảng Bình nói chung Du lịch Phong Nha - Kẻ Bàng nói riêng phát triển lên ngày nhanh mạnh mẽ hơn, thu hút lượng khách du lịch đến thăm quan nhiều hơn, nâng cao sức cạnh tranh, nâng cao vị du lịch Quảng Bình vấn đề quan trọng cấp thiết cần đưa Vườn quốc gia Phong Nha - Kẻ Bàng vườn quốc gia huyện Bố Trạch tỉnh Quảng Bình, cách thành phố Đồng Hới khoảng 50 km phía Tây Bắc Phong Nha - Kẻ Bàng nằm khu vực núi đá vôi rộng khoảng 200.000 Diện tích vùng lõi vườn quốc gia 85.754 vùng đệm rộng 195.400 Tháng năm 2013, Thủ tướng phủ có định mở rộng vườn quốc gia lên 1.233,26 km2 Đặc trưng vườn quốc gia kiến tạo đá vôi, 300 hang động, sông ngầm hệ động thực vật quý nằm Sách đỏ Việt Nam Sách đỏ giới Các hang động có tổng chiều dài khoảng 80 km Phong Nha - Kẻ Bàng phô diễn chứng ấn tượng lịch sử Trái Đất, mẫu hình riêng biệt đẹp kiến tạo carxtơ phức tạp Đông Nam Á Được UNESCO công nhận Di sản thiên nhiên giới theo tiêu chí địa chất, địa mạo năm 2003, UNESCO công nhận Di sản thiên nhiên giới với tiêu chí đa dạng sinh học, sinh thái vào ngày tháng năm 2015 Phong Nha - Kẻ Bàng điểm đến lý tưởng có nhiều tiềm thu hút khách du lịch, thời gian gần thực trở thành điểm du lịch hấp dẫn du khách nước Tuy nhiên, việc nghiên cứu đánh giá quan điểm du khách, yếu tố ảnh hưởng đến hài lịng du khách để có giải pháp phù hợp nhằm nâng cao khả thu hút du khách để từ mang lại hiệu kinh tế cao Chính lý nên tơi chọn đề tài “Phân loại quan điểm du khách với du lịch Phong Nha – Kẻ Bàng tỉnh Quảng Bình” để nghiên cứu, qua mong muốn đóng góp phần ý nghĩa cho hoạt động du lịch tỉnh nhà MỤC ĐÍCH VÀ Ý NGHĨA CỦA ĐỀ TÀI 2.1 Mục đích Trên sở lý thuyết xử lý ngôn ngữ tự nhiên, phân tích từ vựng đoạn văn tiếng Việt, xây dựng ứng dụng Demo phân tích quan điểm đánh giá từ cụm từ hay đoạn văn Dữ liệu đầu vào chương trình khai thác từ trang Web + Nghiên cứu phương pháp, kỹ thuật khai phá liệu, khai phá văn + Nghiên cứu kỹ thuật phân loại quan điểm tiếng Việt + Phân loại quan điểm du khách điểm du lịch Phong Nha – Kẻ Bàng tỉnh Quảng Bình 2.2 Ý nghĩa khoa học + Nghiên cứu năm bắt kỹ thuật khai phá liệu, khai phá văn Qua vận dụng để khai thác liệu từ trang Web thông qua liệu để đánh giá ý kiến người dùng điểm du lịch Phong Nha – Kẻ Bàng tỉnh Quảng Bình từ sử dụng thơng tin để phục vụ cho công việc, kinh tế, xã hội hay mục đích trị khác tỉnh Quảng Bình + Từ liệu lớn thu thập từ trang mạng rút thơng tin hữu ích + Giải toán phân loại quan điểm từ trang Web + Rút nhận xét có ý nghĩa tốn nghiên cứu 2.3 Ý nghĩa thực tiễn + Thu thập liệu người dùng điểm du lịch Phong Nha - Kẻ Bàng tỉnh Quảng Bình Bước đầu xây dựng công cụ Demo để đánh giá quan điểm từ liệu rút trích từ + Nắm bắt ý kiến người dùng điểm du lịch Phong Nha - Kẻ Bàng tỉnh Quảng Bình từ trang Web Cho đề xuất, giải pháp mang tính thực tiễn hỗ trợ du lịch tỉnh Quảng Bình + Có thể mở rộng nghiên cứu để xây dựng hệ thống đánh giá ý kiến chủ đề khác từ trang mạng xã hội MỤC TIÊU VÀ NHIỆM VỤ ĐỀ TÀI 3.1 Mục tiêu 48 đích mà nhiều nhà nghiên cứu hướng đến Trong tương lai tiếp tục nghiên cứu để xây dựng ứng dụng cụ thể tốt cho trình phân loại nhằm khai thác vào lĩnh vực đời sống xã hội HƯỚNG PHÁT TRIỂN Trong luận văn này, thực nghiệm phân loại đánh giá kỹ thuật học máy Mạng Nơron nhân tạo ANN để giải toán phân loại quan điểm du khách điểm du lịch Phong Nha – Kẻ Bàng tỉnh Quảng Bình mà chưa thử nghiệm phương pháp khác điều phần khách quan trình nghiên cứu Trên sở nghiên cứu hướng đến giải pháp để tiếp tục nghiên cứu nhằm nâng cao hiệu cho toán phân loại quan điểm lựa chọn, xây dựng cơng cụ chuyên nghiệp hỗ trợ cho trình phân loại, nghiên cứu kỹ thuật phân loại mới, tốt Ngoài cần xây dựng liệu lớn đặc biệt vấn đề xử lý từ đa nghĩa, xử lý từ viết tắt để phân tích ý nghĩa văn rõ ràng tiếng Việt./ 49 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Hồng Kiếm - Đỗ Phúc, Giáo trình khai phá liệu - Trung tâm nghiên cứu phát triển công nghệ thông tin, Đại học Quốc gia thành phố Hồ Chí Minh, 2005 [2] Hà Quang Thụy, Phan Xuân Hiếu, Đồn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú, Khai phá Dữ liệu Web, Nhà xuất giáo dục Việt Nam, năm 2009 [3] Hoàng Kiếm - Đỗ Phúc, Giáo trình khai phá liệu, Trung tâm nghiên cứu phát triển công nghệ thông tin, Đại học Quốc gia thành phố Hồ Chí Minh, 2005 [4] Trần Hùng Cường, Ngô Đức Vĩnh, Tổng quan khai phá tri thức khai phá liệu, Khoa Công nghệ thông tin Trường Đại học Công nghiệp Hà Nội đăng Tạp chí khoa học cơng nghệ số 05.2011 [5] Nguyễn Đình Bình, Nghiên cứu khai phá liệu Web ứng dụng tìm kiếm trích chọn thơng tin theo chủ để, Đại học Đà Nẵng, năm 2012 [6] Nguyễn Thu Trà Nghiên cứu áp dụng số kỹ thuật Khai phá liệu với sở liệu ngành thuế Việt Nam Luận văn Thạc sĩ Công nghệ thông tin Trường Đại học Bách khoa Hà Nội 20006 [7] Nguyễn Thị Lan Anh, Nghiên cứu thuật toán học máy SVM ứng dụng toán khai phá ý kiến phản hồi khách hàng Website Luận văn Thạc sĩ Hệ thống thông tin Học viên Công nghệ Bưu Viễn Thơng 2013 [8] Ngơ Thị Hoa, Phân loại quan điểm phương tiện xã hội thảo đề án quốc gia Luận văn Thạc sĩ Công nghệ thông tin Đại học Công nghệ - Đại học Quốc gia Hà Nội, 2015 [9] Phùng Hữu Đoàn, Khai phá liệu từ mạng xã hội để khảo sát ý kiến đánh giá xã hội địa điểm du lịch Đà Nẵng, Luận văn Thạc sĩ Khoa học máy tính Đại học Đà Nẵng, năm 2013 [10] Đậu Mạnh Hồn, Các hướng tiếp cận kỹ thuật phân loại tình cảm Đại học Quảng Bình năm 2017 [11] Đinh Diền Xây dựng khai thác kho ngữ liệu song ngữ Anh – Việt điện tử Đại học KHXH&NV – TPHCM, 2005 [12] Trần Thị Ái Quỳnh, Ứng dụng khai phá liệu để trích rút thông tin theo chủ đề từ mạng xã hội, Luận văn Thạc sĩ Khoa học máy tính Đại học Đà Nẵng, năm 2013 [13] Lưu Tuấn Anh, Yamamoto Kazuhide.Ứng dụng phương pháp Pointwise vào toán tách từ cho tiếng Việt Natural Language Processing Laboratory 50 Department of ElectricalEngineeringNagaoka University of Technology 9402188, Nagaoka City, Niigata, Japan [14] TS Lê Anh Cương, Bài giảng Xử lý ngôn ngữ tự nhiên, Khoa CNTT, Đại học Công nghệ - Đại học Quốc gia Hà Nội, 2007 [15] Trần Thị Oanh Mô hình tách từ, gán nhãn từ loại hướng tiếp cận tích hợp cho tiếng Việt Luận văn Thạc sĩ Công nghệ thông tin Đại học Công nghệ - Đại học Quốc gia Hà Nội 2008 [16] PGS TS Hà Quang Thụy, Ths Trần Mai Vũ Phân tích khai phá mạng xã hội Đại học Công nghệ - Đại học Quốc gia Hà Nội, 2016 Tiếng Anh [17] Yang, Y 1999 An evaluation of statistical approaches to text categorization Inform Retr 1, 1–2, 69–90 [18] Charenpornsawat P Mekanavin, S and B Kijsirikul Feature-based thai words segmentation In Proceedings of the Natural Language Processing Pacific Rim Sympo-sium, pages 41-48 Phuket, Thailand, 1997 [19] C Chan P Wong Chinese word segmentation based on maximum matching and word binding force In Proceedings of Coling 96, pages 200-203, 1996 [20] Chunyu Kit, Haihua Pan, Hongbiao Chen Learning Case-based Knowledge for Disambiguating Chinese Word Segmentation: A Preliminary Study In COLING2002 wordshop: SIGHAN-1, pp 33 – 39 Taipei 2002 [21] Chooi-Ling Goh, Masayuki Asahara, Yuji Matsumoto (2004) Chinese Word Segmentation by Classification of Characters In Proceedings of Third SIGHAN Workshop [22] Richard Sproat, Chilin Shih Corpus – based Methods in Chinese Morphology and Phonology Lecture notes for LSA Summer Institute, Santa Barbara 2001 [23] Dinh Dien, Hoang Kiem, Nguyen Van Toan Vietnamese Word Segmentation Proceedings of NLPPRS’01 (The 6th Natural Language Procesing Pacific Rim Symposium, Tokyo, Japan 2001, pp 749 – 756 2001) [24] Chih-Hao Tsai ,” MMSeg: A Word Identification System for Mandarin Chinese Text Based on two Variants of the Maximum Matching Algorithm” 2000 [25] Dinh Dien, Vu Thuy, A maximum entropy approach for Vietnamese word segmentation , In Proceedings of IEEE International Conference on Research, Innovation and Vision for the Future RIVF 2006, Vietnam, 2006 [26] Maron, M E (1961) “Automatic Indexing: An Experimental Inquiry.”Journal of the Associ-ation for Computing Machinery 8(3): 404–417 51 [27] W.A Gale, K.W Church, and D Yarowsky A method for disambiguating word senses in a large corpus Computers and the Humanities, 26(5):415–439, 1992 [28] Yang, Y And Chute, C G 1994 An example-based mapping method for text categorization and retrieval ACMTrans Inform Syst 12, 3, 252–277 [29] Yang, Y 1999 An evaluation of statistical approaches to text categorization Inform Retr 1, 1–2, 69–90 [30] Quinlan J., C4.5: Programs for Machine Learning, Morgan Kaufman Publishers, 1993 [31] Wiener, E D., Pedersen, J O., And Weigend, A S 1995 A neural network approach to topic spotting In Proceedings of SDAIR-95, 4th Annual Symposium on Document Analysis and Information Retrieval (Las Vegas, NV, 1995), 317–332 [32] Lam, S L And Lee, D L 1999 Feature reduction for neural network based text categorization In Proceedings of DASFAA-99, 6th IEEE International Conference on Database Advanced Systems for Advanced Application (Hsinchu, Taiwan, 1999), 195–202 [33] Wiener, E D., Pedersen, J O., And Weigend, A S 1995 A neural network approach to topic spotting In Proceedings of SDAIR-95, 4th Annual Symposium on Document Analysis and Information Retrieval (Las Vegas, NV, 1995), 317–332 [34] V.Vapnik, “The Nature of Statistical Learning Theory” Springer, New York, 1995 [35] J Platt, “Sequential minimal optimization: A fastalgorithm for training Support Vector Machines”, Technical Report MSR-TR-98-14, MicrosoftResearch, 1998 [36] K S Ziemer, G Korkmaz (2016), Human vs Automated Text Analysis: Estimating Positive and Negative Affect, HT ’16, July 10-13, 2016, Halifax, NS, Canada [37] M Birjali, A Beni-Hssane et al (2017), Machine Learning and Semantic Sentiment Analysis base Algorithms for Suicide Sentiment Prediction in Social Networks, Procedia Computer Science 113, pp 65-72 [38] O Araque, I Corcuera-Platas et al (2017), Enhancing deep learning sentiment analysis with ensemble techniques in social applications, Expert Systems With Applications 77, pp 236-246 [39] Yingxu Wang, Omar Zatarain et al (2016), Quantitative Semantic Analysis and Comprehension by Cognitive Machine Learning, International Journal of Cognitive Informatics and Natural Intelligence, vol 10, pp 1-14 52 Website [40] https://phongnhakebang.vn [41] https://www.quangbinhtravel.vn/dong-phong-nha.html [42] https://www.quangbinhtravel.vn/dong-phong-nha.html [43] https://www.facebook.com/quangbinhtravel.vn/ [44] https://www.facebook.com/dlphongnha/ [45] https://vi.wikipedia.org [46] https://mytour.vn [47] http://dulichkhatvongviet.com [48] https://www.tripadvisor.com.vn

Ngày đăng: 28/03/2021, 23:00

Tài liệu cùng người dùng

Tài liệu liên quan