1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tổng hợp quan điểm trực tuyến của người tiêu dùng theo tính năng của sản phẩm (tt)

20 552 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 20
Dung lượng 883,88 KB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ VŨ THỊ NHẠN TỔNG HỢP QUAN ĐIỂM TRỰC TUYẾN CỦA NGƯỜI TIÊU DÙNG THEO TÍNH NĂNG CỦA SẢN PHẨM Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60 48 01 04 TÓM TẮT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI - 2016 MỞ ĐẦU Chương Tổng quan khai phá quan điểm 1.1 Giới thiệu 1.2 Các thách thức khai phá quan điểm 1.3 Các ứng dụng khai phá quan điểm 1.4 Các toán khai phá quan điểm Chương Các phương pháp tiếp cận toán tổng hợp quan điểm theo tính sản phẩm 2.1 Xác định đối tượng 2.2 Trích xuất khía cạnh 2.3 Nhóm từ tính 2.4 Phân lớp chiều hướng quan điểm 2.5 Loại bỏ quan điểm Spam 3.1 Trích xuất tính 3.2 Nhóm từ nói tính 11 3.3 Tổng hợp quan điểm 12 3.4 Độ đo tính xác hệ thống 12 Chương Thực nghiệm đánh giá 14 4.1 Dữ liệu thực nghiệm cài đặt 14 4.2 Kết thực nghiệm phân tích 14 Chương Kết luận 17 5.1 Những vấn đề giải luận văn 17 5.2 Công việc nghiên cứu tương lai 17 MỞ ĐẦU “Người khác nghĩ gì” câu hỏi đặt cho lần định Khi bạn có nhu cầu mua tivi, bạn có xu hướng tìm hiểu xem người khác nói sản phẩm Với số tiền bỏ ra, bạn lựa chọn sản phẩm có chức đáp ứng yêu cầu bạn cách thích hợp Hay chương trình Ai triệu phú phát sóng truyền hình, có hai ba quyền trợ giúp hỏi ý kiến người khác Người tiêu dùng đánh giá sản phẩm dịch vụ đó, họ đưa ý kiến tổng quan sản phẩm Ví dụ “Chiếc điện thoại Iphone 6s tốt” Nhưng lại có ý kiến đưa để đánh giá chất lượng tính (khía cạnh, đặc trưng) sản phẩm Ví dụ: “Màn hình Iphone 6s đẹp” Các ý kiến phản hồi người tiêu dùng đa dạng phong phú Việc tổng hợp ý kiến thủ công nhiều thời gian sức người Một công cụ tổng hợp ý kiến tự động người tiêu dùng làm giảm thời gian công sức Chính vậy, chọn hướng nghiên cứu tổng hợp quan điểm theo tính sản phẩm người tiêu dùng Việt Nam với liệu chủ yếu lấy diễn đàn công nghệ Trong luận văn mình, trình bày phương pháp tổng hợp quan điểm, sử dụng luật lan truyền kép kết hợp với việc tách câu ghép câu phức thành câu đơn (mỗi câu đơn chứa tính sản phẩm) dựa theo luật để trích xuất tính sản phẩm người tiêu dùng Việt Nam Tiếp theo, sử dụng kiến thức mẫu phổ biến để loại bỏ liệu nhiễu Và cuối cùng, sử dụng phương pháp thống kê để tổng hợp quan điểm đánh giá người tiêu dùng tính sản phẩm Luận văn tổ chức thành chương sau: Chương 1: Trong chương này, trình bày tổng quan khai phá quan điểm số khái niệm liên quan Đồng thời, trình bày khó khăn thách thức khai phá quan điểm nói chung vài lĩnh vực ứng dụng khai phá quan điểm ứng dụng giới Chương 2: Trình bày khái quát số pháp nhà nghiên cứu giới nghiên cứu áp dụng vào việc tổng hợp ý kiến theo tính sản phẩm giới Việt Nam Chương 3: Trong chương này, trình bày cách chi tiết phương pháp tổng hợp ý kiến theo tính sản phẩm nghiên cứu thử nghiệm với liệu tiếng Việt Chương 4: Kết thực nghiệm trình bày chương này, đồng thời đưa đánh giá phương pháp mà đề xuất Chương 5: Kết luận Chương Tổng quan khai phá quan điểm 1.1 Giới thiệu Quan điểm ý kiến cá nhân người đối tượng thời gian định Theo định nghĩa Liu [13 ], quan điểm bao gồm yếu tố (ei, aij, sijkl, hk, tl) ei tên chủ thể, aij đặc trưng ei, sijkl quan điểm đặc trưng aij ei, hk người giữ quan điểm tl thời điểm mà quan điểm đưa hk Quan điểm sijkl tích cực, tiêu cực, trung lập biểu diễn mức độ khác Đối tượng dùng để thực thể (người, sản phẩm, kiện, chủ đề,…) đánh giá Mỗi đối tượng có tập thành phần (components) hay thuộc tính (attributes) gọi chung đặc trưng (tính năng) (features) [12] Mỗi thành phần hay thuộc tính lại có tập thành phần hay thuộc tính Các đặc trưng ẩn hiện: Với đánh giá r bao gồm tập câu r = {s1, s2, … sm} Nếu đặc trưng f xuất r, ta nói f đặc trưng (explicit feature) Ngược lại, ta nói f đặc trưng ẩn (implicit feature) [12] Quan điểm ẩn, hiện: Quan điểm (explicit opinion) đặc trưng f câu thể quan điểm mang tính chủ quan, diễn trả trực tiếp quan điểm tích cực hay tiêu cực tác giả Quan điểm ẩn (implicit opinion) đặc trưng f câu thể quan điểm tích cực hay tiêu cực cách không tường minh [12] Người đánh giá: Là người hay tổ chức cụ thể đưa ý kiến đánh giá cá nhân (tổ chức) Trong trường hợp đánh giá sản phẩm, forum, blog người đánh giá tác giả đánh giá hay viết [12] 1.2 Các thách thức khai phá quan điểm        Những người khác có phong cách viết khác Quan điểm thay đổi theo thời gian Độ mạnh quan điểm Quan điểm theo ngữ cảnh Các câu đánh giá có pha trộn Quan điểm mang tính châm biếm mỉa mai Xử lý ngôn ngữ tự nhiên câu quan điểm 1.3 Các ứng dụng khai phá quan điểm      Nghiên cứu thị trường dành cho người mua bán Cải thiện chất lượng sản phẩm dịch vụ Hệ thống gợi ý Chính quyền thông minh Hỗ trợ đưa định 1.4 Các toán khai phá quan điểm Theo nghiên cứu Liu [7], khai phá quan điểm gồm toán sau:    Phân lớp quan điểm Khai phá quan điểm so sánh Tổng hợp quan điểm 4 Chương Các phương pháp tiếp cận toán tổng hợp quan điểm theo tính sản phẩm Thông thường, tổng hợp quan điểm qua tính sản phẩm gồm bước sau [26]:      Xác định đối tượng Trích xuất tính Nhóm tính Phân lớp quan điểm Lọc quan điểm Spam 2.1 Xác định đối tượng Đầu tiên, trao đổi vấn đề cụ thể trích xuất tên thực thể (đối tượng) lĩnh vực khai phá quan điểm Tên đối tượng, tổ chức người dùng gọi theo nhiều cách khác Ví dụ, “Motorola” viết “Moto” “Mot” Việc dùng từ điển sẵn có để xác định đối tượng tối ưu cách gọi người sử dụng, đưa hết trường hợp theo phương pháp thủ công Vì thế, cần cho hệ thống tự động phát chúng từ sở liệu (trang web đánh giá, blog diễn đàn thảo luận) Ding Liu [12] đề xuất vấn đề giải pháp coreference (sự đồng nghĩa) thực thể khía cạnh Nhiệm vụ nhằm mục đích xác định đề cập đến thực thể khía cạnh Bài báo sử dụng phương pháp học có giám sát Những điểm việc thiết kế thử nghiệm hai tính quan điểm liên quan, phân tích quan điểm sử dụng cho mục đích giải vấn đề coreference[13] Chức dựa phân tích tình cảm câu thông thường câu so sánh, ý tưởng thống tâm lý Ví dụ “Chiếc điện thoại Nokia tốt so với điện thoại Motorola Nó rẻ quá” Ở đây, “nó” có nghĩa “điện thoại Nokia” câu đầu tiên, quan điểm “điện thoại Nokia” theo chiều hướng dương (quan điểm tích cực), chiều hướng âm (quan điểm tiêu cực) cho “điện thoại Motorola”, câu thứ hai tích cực Do đó, kết luận “Nó” “điện thoại Nokia” người ta thường bày tỏ quan điểm cách quán Ở đây, không “Nó” “điện thoại Motorola” Tuy nhiên, thay đổi “Nó rẻ quá” đến “Nó đắt” Trong trường hợp này, “Nó” thay cho “điện thoại Motorola” Để có tính này, hệ thống cần phải có khả xác định ý kiến tích cực tiêu cực thể câu thông thường câu so sánh Tính thứ hai xem xét thực thể khía cạnh sửa đổi theo quan điểm bày tỏ Ví dụ: “Tôi mua điện thoại Nokia ngày hôm qua Chất lượng âm tốt Giá rẻ quá.” Câu hỏi đặt “nó” “chất lượng âm thanh” “điện thoại Nokia.” Rõ ràng, biết “nó” “điện thoại Nokia” “chất lượng âm thanh” “giá rẻ” Để có chức này, hệ thống cần phải xác định từ quan điểm thường kết hợp với thực thể khía cạnh Các mối quan hệ phải khai thác từ ngữ liệu Tuy nhiên, hai chức đặc trưng ngữ nghĩa mà phương pháp giải coreference chung chưa giải [14] 2.2 Trích xuất khía cạnh Sử dụng danh từ cụm danh từ thường xuyên Hu Liu [7] đề xuất phương pháp trích xuất tính sản phẩm dựa theo luật kết hợp Ý tưởng phương pháp tóm tắt qua hai bước Đầu tiên tìm danh từ cụm danh từ coi chúng tính sản phẩm, sau sử dụng mối quan hệ tính từ quan điểm để định nghĩa lại tính Sử dụng mối quan hệ từ quan điểm khía cạnh Năm 2011, Qiu [17] phát triển ý tưởng theo luật lan truyền kép Phương pháp cần từ quan điểm làm điều kiện đầu vào Từ quan điểm nhận khía cạnh khía cạnh định nghĩa từ quan điểm biết Những từ quan điểm khía cạnh trích xuất sử dụng để tìm từ quan điểm khía cạnh Quá trình lan truyền kết thúc tìm thêm từ quan điểm khía cạnh Và trình gọi lan truyền kép Các quy luật trích xuất phát dựa mối quan hệ khác khía cạnh từ quan điểm Mối quan hệ thường thể cấu trúc ngữ pháp câu Mô hình nhóm tác giả Hà Quang Thụy nghiên cứu thực đánh giá người dùng Việt sản phẩm [27] 2.3 Nhóm từ tính Phân nhóm khía cạnh cho thấy khía cạnh có tương đồng ngữ nghĩa cần thiết cho ứng dụng quan điểm Mặc dù từ điển WordNet số từ điển khác hỗ trợ, chúng chưa đầy đủ thực tế, nhiều từ đồng nghĩa miền phụ thuộc lĩnh vực cụ thể Ví dụ, hình ảnh phim từ đồng nghĩa đánh giá phim, chúng từ đồng nghĩa đánh giá máy ảnh kỹ thuật số Hình ảnh có liên quan tới ảnh, phim đề cập đến video Cũng cần lưu ý hầu hết cách thể khía cạnh khác khía cạnh từ đồng nghĩa miền đó, chúng luôn đồng nghĩa Ví dụ, "đắt" "giá rẻ" đểu nói đến khía cạnh giá chúng từ đồng nghĩa giá Năm 2011, nhóm nghiên cứu Hà Quang Thụy sử dụng phương pháp học bán giám sát sử dụng kết hợp mô hình phân cụm HAC (Hierarchical Agglomerative Clustering) phân lớp SVM-kNN (Support Vecto Machine – k Nearest Neighbor) để nhóm từ tính [27] 2.4 Phân lớp chiều hướng quan điểm Nhiệm vụ xác định xem quan điểm tính tiêu cực, tích cực hay trung lập Cách thông thường dựa vào từ quan điểm câu [26] 2.5 Loại bỏ quan điểm Spam Theo Jindal Liu, có loại quan điểm Spam: Loại 1(đánh giá giả mạo): Đây nhận xét sai thật viết không dựa kinh nghiệm hãng nhà phê bình việc sử dụng sản phẩm hay dịch vụ, viết dạng ẩn Họ thường có ý kiến tích cực không xác số đối tượng (các sản phẩm dịch vụ) nhằm quảng cáo cho đối tượng ý kiến tiêu cực sai lệch số đối tượng khác để làm tổn hại danh tiếng họ Loại (đánh giá thương hiệu): Những nhận xét không bình luận sản phẩm dịch vụ cụ thể mà chúng lại cho nhận xét, nhận xét nhãn hiệu nhà sản xuất sản phẩm Chúng coi Spam,chúng không nhắm vào sản phẩm cụ thể thường sai lệch Ví dụ, đánh giá cho máy in HP cụ thể nói: “Tôi ghét HP Tôi không mua sản phẩm chúng” Loại (không đánh giá): Đây đánh giá Có hai phân nhóm chính: (1) quảng cáo (2) văn liên quan khác có chứa ý kiến (ví dụ, câu hỏi, câu trả lời, văn ngẫu nhiên) Mục đích việc loại bỏ quan điểm Spam xác định đánh giá giả, nhà phê bình giả, nhóm phê bình giả Có phương pháp để xác định quan điểm Spam phương pháp học có giám sát học bán giám sát 8 Chương Tổng hợp quan điểm trực tuyến người tiêu dùng Việt Nam theo tính sản phẩm Hình 3.1 Mô hình hệ thống Hình 3.1 mô tả khái quát công việc thực trình tổng hợp quan điểm trực tuyến người tiêu dùng theo tính sản phẩm Hệ thống gồm công việc sau:  Thu thập liệu: Chúng thực thu thập tất ý kiến đánh giá dòng sản phẩm điện thoại nguồn liệu tinhte.vn  Tiền xử lý liệu: Chúng thực gán nhãn từ loại cho từ câu loại bỏ câu câu quan điểm  Tách câu quan điểm: Đầu vào câu đánh giá gán nhãn từ loại đầu câu chứa có tính từ quan điểm  Trích xuất tính sản phẩm: Hệ thống thực trích xuất tính sản phẩm từ câu quan điểm  Tổng hợp quan điểm theo tính sản phẩm: Hệ thống dựa vào tính trích xuất làm để tiến hành tổng hợp quan điểm theo tính sản phẩm 3.1 Trích xuất tính Hình 3.2 Mô hình trích xuất tính sản phẩm Trong hình 3.2, đưa mô hình trích xuất tính cho sản phẩm Đầu vào câu đánh giá Kết trả hệ thống tính trích xuất câu Hệ thống thực trích xuất tính qua bước sau:  Tiền xử lý liệu  Tách câu quan điểm  Trích xuất tính theo luật lan truyền kép Bước 1: Tiền xử lý liệu Trong bước này, thực gán nhãn cho từ loại loại bỏ câu câu quan điểm Chúng sử dụng công cụ JvnTextPro1 dành cho xử lý câu Tiếng Việt để phân đoạn câu, tách câu gán nhãn cho từ loại cho từ, cụm từ câu Tuy nhiên tất câu thu câu quan điểm Câu quan điểm câu có chứa từ quan điểm Hệ thống thực loại bỏ câu câu quan điểm liệu thu thập Bước 2: Tách câu quan điểm Từ câu quan điểm gán nhãn từ loại bước trước, tiến hành tách câu chứa nhiều tính câu chứa có tính từ quan điểm http://jvntextpro.sourceforge.net/ 10 Sau thu thập liệu diễn đàn nhận thấy, người dùng đánh giá sản phẩm, lần đánh giá, họ thường có ý kiến hai, ba hay nhiều tính lúc Chúng thực tách câu phức câu ghép dựa luật câu dựa vào cấu trúc ngữ pháp câu mà thu phân tách câu tiếng Việt Để đơn giản mà đảm bảo tính xác, bỏ qua từ loại khác (động từ, trợ từ,…) câu mà quan tâm vào danh từ (N) (từ tính năng) tính từ (A) (từ quan điểm) từ nối từ phủ định câu Ở đây, coi liên từ (C) từ nối phụ từ (R) từ phủ định câu làm cho kết tách câu không xác Vì vậy, thực xây dựng hai từ điển tay gồm từ nối từ phủ định:  Bộ từ nối (TN): và, nhưng, không những, mà còn, có “+”, “,”,…  Bộ từ phủ định (PD): không, ko, chưa, chẳng, đâu có,… Bảng 3.1 Một số luật câu STT Đầu vào N/Np1-TN-N/Np2- A N/Np1 – A1 - TN- N/Np2 –A2 N/Np1 – A1 - TN - N/Np2 N/Np1 – PD - A1 - TN- N/Np2 –A2 N/Np1 – A1 - TN- N/Np2 - PD–A2 Đầu N/Np1 -A N/Np2 -A N/Np1 – A1 N/Np2 –A2 N/Np1 – A1 N/Np2 N/Np1 – PD - A1 N/Np2 –A2 N/Np1 – A1 N/Np2 –PD - A2 Trong bảng 3.2, đưa số luật áp dụng việc tách câu xử lý liệu Cột số thứ tự luật Cột cấu trúc câu phức câu ghép cần phân tích Cột cấu trúc câu đơn nhằm thu sau phân tích Phương pháp đơn giản chưa tối ưu giải vấn đề quan trọng toán tổng hợp quan điểm theo tính sản phẩm với liệu thực tế lấy từ diễn đàn tách 11 biệt ý kiến đánh giá tính sản phẩm khác Kết thu câu đánh giá chứa tính sản phẩm Bước 3: Trích xuất tính sản phẩm Phần tiếp theo, trình bày phương pháp trích xuất tính sản phẩm theo luật lan truyền kép, sử dụng từ quan điểm mà Qiu xây dựng 2011 [17] Từ quan điểm từ ngữ mà người nêu quan điểm nêu lên ý kiến sản phẩm Theo nghiên cứu Hu & Liu từ quan điểm thường tính từ câu [7] Chúng thực xây dựng từ điển từ quan điểm bao gồm tính từ mà người tiêu dùng Việt Nam sử dụng đánh giá chất lượng sản phẩm, kết hợp với việc gán nhãn từ loại Chúng thực gán nhãn thủ công từ quan điểm Các từ quan điểm mang tính tích cực gán nhãn dương (+); từ quan điểm mang tính tiêu cực gán nhãn âm (-); từ quan điểm mang tính trung lập không gán nhãn Dựa vào từ quan điểm xây dựng, thực trích xuất tính cho sản phẩm câu đánh giá người tiêu dùng theo luật lan truyền kép với số quy tắc câu đánh giá thường gặp diễn đàn Việt Nam Một số cấu trúc câu đánh giá: N-A : Pin tốt N-V-A: Pin dùng bình thường N-R-A: Loa bé N-C-A: Giá ngon 3.2 Nhóm từ nói tính Ngôn ngữ tiếng Việt vốn đa dạng phong phú, mô tả tính người đánh giá khác họ dùng từ khác để nêu lên quan điểm chất lượng sản phẩm Phần lớn, mô tả tính sản phẩm người tiêu dùng thường dùng số từ quan điểm định Chúng dựa kiến thức đồ thị Bipartite Graph để thực nhóm từ quan điểm Đồ thị Bipartite Graph đồ thị mà tập đỉnh chia thành hai tập không giao thỏa mãn điều kiện cạnh nối hai đỉnh thuộc tập Ví dụ mô tả tính pin, người tiêu dùng thường dùng từ quan điểm bền, tốt, lâu Khi hai nhiều danh từ nhận 12 xét từ quan điểm giống 80% đưa danh từ tính lại thành nhóm Căn vào tần suất xuất danh từ tính tập liệu để tìm tính thường xuyên người tiêu dùng đánh giá loại bỏ tính mà người tiêu dùng quan tâm Trên thực tế, tính người tiêu dùng đề cập đến thường chúng không quan trọng không mang nhiều giá trị việc xử lý toán có số lượng liệu lớn Sau loại bỏ danh từ tính người tiêu dùng đưa quan điểm thu tính sản phẩm Tuy nhiên, số trường hợp mà danh từ mô tả tính mang nghĩa chung chung, không rõ ràng, thực lược bỏ thủ công số danh từ mà nhầm lẫn sang miêu tả tính sản phẩm 3.3 Tổng hợp quan điểm Phân cụm câu đánh giá tính Các câu đánh giá đưa ý kiến nhóm tính năng, thực nhóm câu đánh giá lại với để thực tổng hợp ý kiến theo tính cho sản phẩm Phân lớp câu quan điểm Trong phần này, thực phân lớp câu quan điểm nhóm phân loại từ bước trước theo ba chiều hướng tích cực, tiêu cực trung lập Để thực nhiệm vụ này, thực giải thuật phân lớp dựa vào nhãn từ quan điểm câu Nhãn câu tương ứng với nhãn từ quan điểm câu Một số trường hợp riêng:  Đối với câu đánh giá có chứa từ phủ định không, chẳng, chưa, chả thực gán nhãn cho câu ngược lại với nhãn từ quan điểm  Đối với từ quan điểm có nhãn +, có từ phủ định đứng trước gán cho câu quan điểm nhãn -  Đối với từ quan điểm nhãn - không gán nhãn cho câu quan điểm  Đối với từ quan điểm nhãn gán nhãn - cho câu quan điểm 3.4 Độ đo tính xác hệ thống Độ xác P (Percision): 𝑡𝑟𝑢𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒 𝑃= × 100% 𝑡𝑟𝑢𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒 + 𝑓𝑎𝑙𝑠𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒 13 Độ hồi tưởng R (Recall): 𝑡𝑟𝑢𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒 𝑅= × 100% 𝑡𝑟𝑢𝑒 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑒 + 𝑓𝑎𝑙𝑠𝑒 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑒 Độ đo F (F-measure): 2×𝑃×𝑅 𝐹= 𝑃+𝑅 14 Chương Thực nghiệm đánh giá 4.1 Dữ liệu thực nghiệm cài đặt Chúng thực liệu thu thập từ trang tinhte.vn với ý kiến trao đổi dòng điện thoại HTC One E8, Sony Z3 Sony Aqua M4 Bảng 4.1 Số ý kiến đánh giá chuẩn bị làm thực nghiệm Sản phẩm Số Review Số câu HTC One E8 300 389 Sony Z3 216 265 Sony Aqua M4 96 112 4.2 Kết thực nghiệm phân tích Dữ liệu đưa qua tách câu quan điểm để tách câu phức câu ghép thành câu đơn mà xây dựng dựa luật (đã trình bày chương 3) Chúng bỏ qua từ loại khác mà quan tâm đến tính từ danh từ, từ phủ định từ nối Sau tách câu, thu liệu với số câu Kết trả câu đơn phát biểu tính (gồm danh từ tính từ) Bảng 4.2 Kết liệu thu sau tách câu Sản Số Số P R F1 phẩm câu tách câu qua hệ thống tách thực tế HTC 525 562 87,18 90,15 One E8 3,3% % % Sony Z3 332 316 100% 97,9 6.02 % % Sony 159 163 85,27 86,33 Aqua M4 7,42 % % % 15 Hệ thống thực trích xuất tính sản phẩm qua luật câu đưa vào hệ thống dựa vào từ điển xây dựng (gồm khoảng 150 từ quan điểm) Chúng thu danh sách gồm tính sản phẩm giá, pin, cấu hình, hình, loa, vỏ, camera, sóng, âm,, Kết đánh giá thể bảng 4.3 Bảng 4.1 Kết thu sau hệ thống trích chọn tính cho sản phẩm Số Số lượng lượng tính Tên sản tính trích P R F1 phẩm thu xuất qua hệ thống thực tế HTC One E8 45 36 77,78% 97,22% 86,40% Sony Z3 21 16 80,9% 94,44% 87,18% Sony Aqua M4 19 16 73,68% 87,5% 80% 77,45% 93,05% 84,53% Trung bình Trong danh sách tính thu có số tính người tiêu dùng mô tả số danh từ khác Camera mô tả Camera, máy ảnh Hệ thống thực phân nhóm danh từ tính Áp dụng phương pháp GFN thu kết với độ xác 76,6% Phương pháp GFN có độ xác chưa cao số lượng liệu chưa nhiều Tiếp theo, hệ thống dựa vào tần suất xuất danh từ tính năng, chọn độ hỗ trợ tối thiểu (minsup = 4), danh từ có tần số xuất [...]... giá chỉ chứa một tính năng của sản phẩm Bước 3: Trích xuất tính năng của sản phẩm Phần tiếp theo, tôi trình bày phương pháp trích xuất tính năng của sản phẩm theo luật lan truyền kép, sử dụng từ quan điểm mà Qiu đã xây dựng năng 2011 [17] Từ quan điểm là những từ ngữ mà người nêu quan điểm nêu lên ý kiến của mình về sản phẩm đó Theo một nghiên cứu của Hu & Liu thì từ quan điểm thường là tính từ trong... kê để đưa ra được bản tổng hợp quan điểm theo các tính năng của sản phẩm Kết quả hệ thống phân lớp được mô tả qua bảng 4.4 Bảng 4.4 Đánh giá kết quả tổng hợp ý kiến theo tính năng của sản phẩm Tên sản phẩm HTC One E8 Sony Z3 Sony Aqua M4 P R F1 97,58% 100% 98,78% 96,85% 97,03% 100% 99,24% 98,40% 98,12% Bảng tổng hợp các ý kiến đánh giá của người tiêu dùng theo tính năng của sản phẩm HTC One E8 có thể... diễn như hình 4.2 Hình 4.1 .Tổng hợp ý kiến theo tính năng của sản phẩm HTC One E8 17 Chương 5 Kết luận 5.1 Những vấn đề giải quyết được trong luận văn này Luận văn đã tiến hành nghiên cứu bài toán khai phá quan điểm mà cụ thể là tổng hợp quan điểm theo tính năng của sản phẩm Luận văn đã trình bày một số các phương pháp liên quan đến tổng hợp quan điểm theo tính năng của sản phẩm trên thế giới cũng như... phương pháp tổng hợp ý kiến đánh giá trực tuyến của người tiêu dùng Việt Nam đối với các tính năng của sản phẩm Hệ thống đã thực hiện trích xuất tính năng của sản phẩm dựa vào từ quan điểm Đặc biệt, luận văn đã thực hiện tách các câu phức và câu ghép thành các câu đơn Theo đó, mỗi câu đơn chỉ chứa một tính năng của sản phẩm và một từ quan điểm Luận văn cũng thực hiện phân nhóm các câu quan điểm phát... một tính năng và tổng hợp quan điểm theo các từ quan điểm trong câu dựa vào nhãn của từ quan điểm theo chiều hướng tích cực, tiêu cực và trung lập Bên cạnh đó, trong phạm vi của luận văn, luận văn chưa thực hiện được việc trích xuất sản phẩm mà người tiêu dùng đánh giá trong mỗi câu quan điểm và lọc các quan điểm spam Trong quá trình thực hiện luận văn, tôi đã cố gắng tiếp cận phương pháp tổng hợp. .. được người tiêu dùng quan tâm Trên thực tế, các tính năng ít được người tiêu dùng đề cập đến thì thường chúng không quan trọng và không mang nhiều giá trị trong việc xử lý các bài toán có số lượng dữ liệu lớn Sau khi loại bỏ các danh từ chỉ tính năng ít được người tiêu dùng đưa ra quan điểm chúng tôi thu được một bộ các tính năng của sản phẩm Tuy nhiên, vẫn còn một số ít trường hợp mà danh từ mô tả tính. .. và phong phú, cùng mô tả về một tính năng nhưng đối với những người đánh giá khác nhau thì họ dùng những từ khác nhau để nêu lên quan điểm của mình về chất lượng của sản phẩm Phần lớn, khi mô tả về một tính năng của sản phẩm thì người tiêu dùng thường dùng một số từ quan điểm nhất định Chúng tôi dựa trên kiến thức về đồ thị Bipartite Graph để thực hiện nhóm các từ quan điểm Đồ thị Bipartite Graph là... tả về tính năng pin, người tiêu dùng thường dùng các từ quan điểm như bền, tốt, lâu Khi hai hoặc nhiều danh từ đều được nhận 12 xét bằng các từ quan điểm giống nhau trên 80% thì chúng tôi đưa các danh từ chỉ tính năng lại thành một nhóm Căn cứ vào tần suất xuất hiện của các danh từ chỉ tính năng trong tập dữ liệu để tìm các tính năng thường xuyên được người tiêu dùng đánh giá và loại bỏ các tính năng. .. hiện xây dựng bộ từ điển về từ quan điểm bao gồm các tính từ mà người tiêu dùng Việt Nam sử dụng khi đánh giá về chất lượng của một sản phẩm, kết hợp với việc gán nhãn từ loại Chúng tôi thực hiện gán nhãn thủ công trên các từ quan điểm Các từ quan điểm mang tính tích cực được gán nhãn dương (+); các từ quan điểm mang tính tiêu cực được gán nhãn âm (-); các từ quan điểm mang tính trung lập chúng tôi không... tính năng mang nghĩa chung chung, không rõ ràng, chúng tôi thực hiện lược bỏ thủ công một số các danh từ mà được nhầm lẫn sang miêu tả tính năng của sản phẩm 3.3 Tổng hợp quan điểm Phân cụm các câu đánh giá về cùng một tính năng Các câu đánh giá cùng đưa ra ý kiến về một nhóm tính năng, chúng tôi thực hiện nhóm các câu đánh giá lại với nhau để thực hiện tổng hợp ý kiến theo từng tính năng cho sản phẩm

Ngày đăng: 14/09/2016, 23:10

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w