Khóa luận tốt nghiệp Công nghệ thông tin: Hệ thống phân tích cảm xúc theo khía cạnh phản hồi khách hàng về điện thoại thông minh

TÓM TẮT KHÓA LUẬNTrong thời kỳ công nghệ hiện đại phát triển, chúng tôi nhận thức được mức độ quan trong cua dir liệu từ các san thương mại điện tử, các trang web da dạng hướng tới các t

Trang 1

ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA KHOA HỌC VÀ KỸ THUẬT THÔNG TIN

LÊ THỊ PHƯƠNG THANH - 19522231 NGO HO BÍCH TRAM - 19522375

KHOA LUAN TOT NGHIEP

HE THONG PHAN TÍCH CAM XUC THEO KHÍA CANH PHAN HOI KHACH HANG VE ĐIỆN THOẠI

THONG MINH

Aspect Based Sentiment Analysis System For Customer

Feedback About Smartphone

CU NHAN NGANH CONG NGHE THONG TIN

GIANG VIEN HUONG DAN

TS DO TRONG HOP ThS LƯU THANH SON

TP HO CHi MINH, 2023

Trang 2

LỜI CẢM ƠN

Chúng tôi chân thành gửi đến lời cảm ơn sâu sắc đến hai thầy TS Đỗ Trọng

Hợp và ThS Lưu Thanh Sơn, hai người đã luôn đi cùng chúng tôi, luôn hỏi thăm

và động viên, giải đáp mọi thắc mắc, câu hỏi của chúng tôi trong suốt quá trình

làm khóa luận Hai Thầy không chỉ chia sẻ những kiến thức hữu ích mà còn truyền

cảm hứng và động lực vô tận để chúng tôi vững tin và có được thành công nhất

định trong việc làm khóa luận này.

Chúng tôi cũng muốn gửi đến lời cảm ơn đến tất cả các thầy cô giảng viên

ở Trường Đại học Công nghệ Thông tin, đặc biệt là khoa Khoa học và Kỹ thuật

Thông tin, đã tận tâm chỉ bảo, giảng dạy những kiến thức chuyên ngành và các

kỹ năng quan trọng cho chúng tôi khoảng thời gian 4 năm đại học vừa qua Với

những kiến thức chuyên môn được giảng viên truyền đạt đã giúp ích cho chúng

tôi rất nhiều trong quá trình làm đề tài khóa luận.

Cuối cùng, chúng tôi cũng xin được bay tỏ sự tri ân đến gia đình và bạn

bè, vì luôn đồng hành, động viên, hỗ trợ và đưa ra những lời khuyên hữu ích trong

quãng thời gian mà chúng tôi thực hiện khóa luận này.

Xin chân thành cảm ơn!

Nhóm tác giả

Lê Thị Phương Thanh

Ngô Hồ Bích Trâm

Trang 3

MỤC LỤC

Chương 1 TONG QUAN

1.1 Giới thiệu bài toán

1.2 Tầm quan trọng và tính ứng dụng của bài toán

143 Tổng kết

Chương 2 CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN

2.1 Công trình nghiên cứu trên thế giới

2.2 Công trình nghiên cứu ở trong nước

22

24 25

Trang 4

4.4.2.1 Mạng tích chap Convolutional Neural Network 31

4.4.2.2 Mạng hồi quy Long Short-Term Memory 32 4.4.3 Mạng hồi quy hai chiều Bidirectional Long Short-Term Memory 33 4.4.4 Kiến trúc mạng nơ-ron Gated Recurrent Unit 34 Chương 5 CÀI ĐẶT, THU NGHIỆM VÀ ĐÁNH GIA 36 5.1 Cài đặt thông số thử nghiệm 36

5.2 Độ đo đánh giá 36

5.3 Kết quả thực nghiệm 37

5.4 Đề xuất cho hệ thống 38 Chương 6 PHAN TÍCH VA THIET KE HE THONG 39 6.1 Phân tích yêu cầu hệ thong 39

6.1.1 Yêu cầu của người dùng 39 6.1.2 Yêu cầu của hệ thống 39 6.2 Thiết kế hệ thống 40

6.2.1 _ Mô hình hoạt động chung 40

6.2.2 Sơ đồ use case tổng quát 41

6.2.3 Danh sách các use case 42 6.2.4 Đặc tả use case 43

6.2.4.1 Đăng nhập / Đăng ký 43

6.2.4.2 Kết qua phân tích 44 6.2.4.3 In và tải kết quả phân tích 48

Chương 7 KET QUA XÂY DỰNG HE THONG 50

Chương 8 KET LUẬN VA HƯỚNG PHÁT TRIEN 65

8.1 Kếtluận 65

Trang 5

8.2 Hạn chế

8.3 Hướng phát triển

66 66

Trang 6

DANH MỤC HÌNH

Hình 1.1: Hệ thống đánh giá của trang web Thế giới di động ở Việt Nam 8Hình 1.2: Hệ thống đánh giá của Vntrip ở Việt Nam 8Hình 4.1: Quy trình thu thập dữ liệu bằng scrapy 26Hình 4.2: Sơ đồ hoạt động của tiền xử lý đữ liệu 26Hình 4.3: Kiến trúc LSTM tiêu chuan 33Hình 4.4: Kiến trúc của mô hình BiLSTM áp dụng lên ABSA tiếng Việt của Phan

Hình 6.6: Sơ đồ UC04 47

Hình 6.7: Sơ đồ UC05 48Hình 6.8: Sơ đồ UC06 49

Hình 7.1: Màn hình chính 52

Hình 7.2: Màn hình Dashboard 01 53

Hinh 7.3: Man hinh Dashboard 02 53

Hình 7.6: Man hình kết quả tra cứu 01 55Hình 7.7: Màn hình kết quả tra cứu 02 55Hình 7.8: Màn hình kết quả tra cứu 03 55Hinh 7.9: Man hinh két qua tra ctru 04 56Hình 7.10: Màn hình kết quả tra cứu 05 56Hình 7.11: Màn hình in kết quả 58Hình 7.12: Màn hình Download kết quả 58

Trang 8

DANH MỤC BANG

Bang 3.1: Các hướng dẫn chú thích dé ghi nhãn các khía cạnh và cảm xúc tương

ứng của Phan và các cộng sự [23] 20

Bảng 4.1: Ví dụ về đữ liệu trước và sau khi xử lý 27

Bảng 4.2: Kết quả thực nghiệm về nhận điện khía cạnh của Phan và các cộng sự

[23] (%) 28

Bang 4.3: Kết quả thực nghiệm nhận diện cảm xúc cho khía cạnh của Phan và các

cộng sự [23] (%) 29

Bảng 5.1: Kết quả thực nghiệm nhận diện cảm xúc cho khía cạnh (%) 38

Bảng 6.1: Bảng danh sách các actor và mục tiêu 42

Bang 7.1: Bang so sánh tốc độ xử lý của thu thập dir liệu 51

Bảng 7.2: Bảng đo tốc độ xử lý của 5 điện thoại tiêu biểu 51Bảng 7.3: Bảng thông tin chỉ tiết màn hình chính 52

Bảng 7.4: Bảng thông tin chỉ tiết màn Dashboard 54

Bảng 7.5: Bảng thông tin chỉ tiết màn tra cứu kết quả 56

Bảng 7.6: Bảng thông tin chỉ tiết màn in kết quả và màn FAQ 59Bang 7.7: Bảng thông tin chỉ tiết màn đăng nhập, đăng ký, quên mật khâu 61

Bang 7.8: Bang thông tin chỉ tiết man profile 62

Bang 7.9: Bang thông tin chỉ tiết màn so sánh 63

Trang 9

6 BiLSTM Bidirectional Long Short-Term Memory

7 CNN Convolutional Neural Network

8 FE Front End

9 GRU Gated Recurrent Unit

10 GUI Graphical User Interface

11 LSTM Long Short-Term Memory

12 NLP Natural Language Processing

13 OTE Opinion Target Expression

14 SP Sentiment Polarity

Trang 10

TÓM TẮT KHÓA LUẬN

Trong thời kỳ công nghệ hiện đại phát triển, chúng tôi nhận thức được mức độ

quan trong cua dir liệu từ các san thương mại điện tử, các trang web da dạng hướng

tới các thiết bị điện tử đặc biệt là điện thoại di động nên đã quyết định xây dựng hệthống phân tích bình luận cảm xúc của người dùng về điện thoại di động dựa trên tập

dữ liệu tiếng Việt UIT-ViSFD bao gồm 11.122 nhận xét của người dùng dé giải quyết

nhiệm vụ phát hiện khoảng đánh giá trong phân tích tình cảm, cảm xúc dựa trên

phương diện khía cạnh.

Ngoài ra, chúng tôi thực hiện thu thập dir liệu thật, thực hiện tiền xử ly dữ liệu,

sau đó sử dụng lại các phương pháp thuật toán thuộc lĩnh vực học máy và học sâu.

Sau khi thực thi, kết quả vượt trội nhất mà chúng tôi đạt được thuộc về thuật toán

BiGRU + FastText, đạt tỷ lệ Fl-score 72.83% trên tac vụ phân loại cảm xúc cho khía

cạnh Kết qua này đã mang lại sự khích lệ và động lực lớn lao cho chúng tôi trongquá trình phát triển các giải pháp và ứng dụng cho bài toán này Bên cạnh đó, chúng

tôi cũng đưa ra nhiều phương pháp khác dé nâng cấp hệ thống sao cho hoàn thiện

hơn.

Dựa trên những gì đã có được của thuật toán BiGRU, chúng tôi đã xây dựng một hệ thống phân tích bình luận cảm xúc cho nhiều khía cạnh của sản phẩm điện

thoại đi động nhằm cung cấp cái nhìn tổng thê hơn về phân loại cảm xúc và các khía

cạnh liên quan Hệ thống này sẽ hiển thị rõ hơn về tính ứng dụng và tiềm năng của

việc đưa phương pháp phân tích dé giải quyết vấn đề cảm xúc trong lĩnh vực điện

thoại di động.

Trang 11

Việt Nam đứng trong nhóm 10 quốc gia có mức sử dụng điện thoại di động

cao nhất trên thế giới Theo thống kê từ Cục Viễn thông (Bộ TT-TT), tính đếnđến tháng 3/2022, đã có hơn 2 triệu thuê bao mới được đăng ký, nâng tổng số

thuê bao sử dụng điện thoại di động từ 91,3 triệu lên 93,5 triệu Và người ta

dự đoán khoảng 73,5% tỷ lệ người trưởng thành đã và đang sử dụng điện thoại.

Tuy nhiên, để có thể đưa ra lựa chọn thông minh, người dùng cần phải tìmhiểu rõ và có cái nhìn tông quát nhất về sản phâm mà họ quan tâm Nhờ vào

sự tiến bộ của Internet, việc tra cứu và đánh giá các sản phẩm đã trở nên dễ

dàng và thuận tiện hơn Người dùng có thê tìm thấy các bình luận, đánh giá vànhận xét từ nhiều người khác trên các trang web bán lẻ, từ đó có thể đưa rađánh giá, quyết định chính xác hơn về sản phẩm mà họ quan tâm Điều này

không chỉ tạo ra lợi ích cho người dùng mà còn cho các doanh nghiệp và nhà

sản xuất điện thoại di động Thế nhưng, mỗi sản phẩm tương ứng sẽ có rấtnhiều bình luận đánh giá đi kèm, việc thu thập các đánh giá này dé phân tích

và đưa ra lựa chọn cũng phát sinh ra vấn đề khác Có rất nhiều bình luận đánhgiá đến từ nhiều phía người dùng khác nhau, dé phân loại chúng và đánh giá

những bình luận này một cách khách quan thì cũng là cả một quá trình lâu dài.

Hiéu được yêu câu va tính kha dụng của vân đê nay, chúng tôi tiên hành áp

dụng phân tích cảm xúc dựa trên khía cạnh vào Tiếng Việt đặc biệt là những

Trang 12

khía cạnh đến từ các hãng điện thoại khác nhau Hơn thế nữa là mục tiêu hàng

đầu của chúng tôi trong khóa luận này sẽ xây dựng hệ thống phân tích bình

luận cảm xúc của người dùng về điện thoại thông minh dựa trên tập đữ liệu

tiếng Việt, nhằm phục vụ cho việc phân tích cảm xúc dựa trên khía cạnh từcác bình luận về điện thoại thông minh

Mục tiêu khóa luận:

Chúng tôi tập trung xây dựng hệ thống phân tích bình luận cảm xúc của người dùngliên quan đến điện thoại thông minh dựa trên thời gian thực Chúng tôi đã đặt ra các

mục tiêu sau:

- _ Thứ nhất, chúng tôi xây dựng hệ thông phân tích bình luận cảm xúc của người

dùng về điện thoại thông minh dựa trên thời gian thực va do thời gian thực thi

của hệ thống

- Thứ hai, chúng tôi tiễn hành cài dat, thử nghiệm lại các phương pháp học sâu

trên bộ dữ liệu, đánh giá và phân tích kết quả đề tìm ra mô hình nào phù hợpvới hệ thống phân tích cảm xúc cho khía cạnh

- _ Thứ ba, chúng tôi đưa ra một số đề xuất trong tương lai cho bài toán phát hiện

khoảng ý kiến Tiếng Việt và từ đó đưa ra các dé xuất dé cải tiền hệ thống

Doi tượng và phạm vi thực hiện:

Đối tượng: Hệ thống phân tích cảm xúc dựa trên khía cạnh, tổng hợp bình luận, đánhgiá về một sản phẩm điện thoại bất kỳ, đánh giá chất lượng sản phâm

Pham vi thực hiện: Đề tài tập trung chủ yếu vào xây dựng hệ thống phân tích cảmxúc trên tiếng Việt, cụ thể giới hạn trên bài toán phát hiện khoảng ý kiến cho phân

tích cảm xúc dựa trên khía cạnh của bình luận.

Kết quả thực hiện:

Khóa luận của chúng tôi đạt được các kết quả như sau:

- _ Thực hiện crawl dữ liệu thật từ các trang web : thegioididong, fptshop nhằm

thu thập dữ liệu về thông tin điện thoại, tất cả comments từ người dùng

Trang 13

- _ Thực hiện xây dựng hệ thống phân tích bình luận cảm xúc của người dùng về

điện thoại thông minh, thu thập và xử lý dữ liệu trong thời gian thực, đo thời

gian thực thi của hệ thống

- _ Thực hiện cải tiến tiền xử lý dữ liệu và thực thi lại các mô hình chạy trên bộ

dữ liệu UIT-ViSFD về nhận diện cảm xúc cho khía cạnh của bình luận về điện

thoại thông minh, kết quả nhận được cao hơn đáng kê trong đó có mô hình

BiGRU đạt F1-Score 72.83%.

- Dé xuất trong tương lai cho bài toán phát hiện khoảng ý kiến Tiếng Việt và

đánh giá ưu nhược điểm của hệ thống từ đó đưa ra các đề xuất dé cải tiến pháttriển hệ thống

Cấu trúc:

Khóa luận gồm 8 phần với các nội dung chính như sau:

Chương 1: Tổng quan

Mô tả ban đầu về bài toán phân tích cảm xúc dựa trên phương diện khía cạnh, tầm

quan trọng của kỹ thuật phân tích cảm xúc dựa trên khía cạnh và khả năng áp dụng

trong các dịch vụ, hệ thống.

Chương 2: Các công trình nghiên cứu liên quan

Mô tả khái quát một số công trình nghiên cứu nổi bật trong và ngoài nước liên quanđến các cách thức xây dựng dữ liệu và các phương pháp giải quyết bài toán phân tích

cảm xúc dựa trên khía cạnh.

Chương 3: Bộ dữ liệu nghiên cứu

Trình bày khái quát lại về bộ dữ liệu UIT-ViSED

Chương 4: Các phương hướng tiếp cận

Trình bày quá trình thu thập dữ liệu thật, các phần xử lý đữ liệu trước khi trainingmodel và đề xuất các phương pháp sẽ được thực nghiệm

Chương 5: Cài đặt, kiểm tra và đánh giá hiệu qua

Trang 14

Đưa ra các cách đánh giá, các bước cài đặt thông số và phân tích các trường hợp giải

thích cho kết quả đạt được

Chương 6: Phân tích, thiết kế hệ thống

Mô tả hiện trạng, phân tích yêu cầu và cách tạo ra hệ thống, đánh giá hệ thống.

Chương 7: Kết quả triển khai hệ thống

Chúng tôi xây dựng hệ thống phân tích cảm xúc cho nhiều khía cạnh trên điện thoại

thông minh.

Chương 8: Kết luận và hướng phát triển

Tổng hợp kết quả đạt được, từ đó đưa ra các đề xuất, gợi ý một số hướng phát triển

tiêm năng đê nâng cao hiệu suât của hệ thông.

Trang 15

Chương 1 TONG QUAN

1.1 Giới thiệu bài toán

Trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP) có rất nhiều bài toán liên quan trong

đó có bài toán phân tích cảm xúc dựa trên khía cạnh là một lĩnh vực đang được khám

phá và nghiên cứu Nó nhằm mục đích phân tách và hiểu cảm xúc của các đoạn vănbản dựa trên các khía cạnh cụ thé Trong quá trình phân tích cảm xúc truyền thống,

mục tiêu chính là xác định và nhận diện các nhãn cảm xúc chung như tích cực, tiêu

cực hoặc trung lập của một đoạn văn bản Chúng ta thu thập các nhận xét về các khía

cạnh của điện thoại và các cảm xúc của khía cạnh đó từ các bình luận xoay quanh sản

phẩm đó của những người đã và đang sử dụng Người đang có nhu cầu mua có thể

tham khảo những nhận xét đó và lựa chọn được điện thoại sẽ phù hợp với nhu cầucủa họ Hay về phía các công ty sản xuất điện thoại, các nhà phân phối bán lẻ, từ nhậnxét của khách hàng đánh giá liên quan tới sản phẩm, họ có thể đưa ra biện pháp,cảitiễn nhằm khắc phục hay cải thiện những điểm chưa tốt và từ đó cải thiện sản phẩmtốt hơn Bài toán ABSA gồm ba nhiệm vụ chính là: phát hiện khía cạnh (AD), biểuthị mục tiêu ý kiến (OTE) và phân tích cảm xúc (SP) Và bài toán của chúng tôi tậptrung xây dựng hệ thống phân tích bình luận cảm xúc của người dùng về điện thoại

thông minh.

Mô tả bài toán:

Đầu vào: Bình luận của khách hàng về điện thoại thông minh trên nhiều trang web

khác nhau.

Đầu ra: Một hoặc nhiều khía cạnh, mỗi khía cạnh là mang một nhãn cảm xúc (tích

cực, tiêu cực, trung lập) tương ứng trong mỗi bình luận.

1.2 TẦm quan trọng và tính ứng dụng của bài toán

Ngày nay, người dùng đóng vai trò chủ chốt trong trải nghiệm của khách hàng đối

với sản phâm trên các nên tảng, các cửa hàng, các trang mua bán online Nhờ vào kỹ

Trang 16

thuật ABSA, việc thu thập những bình luận đánh giá từ người dùng đối với các sảnphẩm trên các trang này đã trở nên thuận tiện va dé dang hơn bao giờ hết Nếu mộttrang thương mại điện tử có ứng dụng công nghệ ABSA, khách hàng có thé tập trungxem các nhận xét mà họ quan tâm bằng cách lựa chọn khía cạnh mà họ muốn tìmhiểu Thêm vào đó, ABSA cho phép các doanh nghiệp thực hiện các công việc nhưtheo dõi, giám sát và đánh giá chất lượng sản phâm và dịch vụ của doanh nghiệp họ.

Phương pháp ABSA đã được áp dụng rộng rãi trên thế giới để cải thiện trải nghiệm

khách hang như Amazon dùng dé phân tích những đánh giá, nhận xét của khách hàng

đối với sản phẩm và thu thập thông tin về cảm xúc của họ một cách chỉ tiết và đadạng: TripAdvisor tập trung vào việc thu thập những phản hồi và đánh giá của kháchhàng đối với các địa điểm và dịch vụ du lich, Vi vậy, tiềm năng của kỹ thuật ABSAtrong lĩnh vực này là rất lớn Mặt khác, các trang thương mại điện tử ở Việt Nam vẫn

cung cấp khá ít thông tin cho người dùng Đa số các nền tảng ở Việt Nam vẫn dùng

một hệ thong danh gia don gian: khach hang dé lại bình luận trên hệ thống và mộtđánh giá trên thang điểm 5 sao, kèm theo hình ảnh (nếu có) như ví dụ ở hình 1.1.Những nền tảng cung cấp hệ thống như thé có thé ké đến như thegioididong, fptshop,shopee, lazada, Vntrip, một nền tảng đánh giá khách sạn và điểm đến du lịch, đemđến sự khác biệt, mới lạ, độc đáo so với các phần còn lại bằng việc khuyến khíchngười dùng có thé chia sẻ quan điểm của ho và ý kiến cá nhân bằng cách việc dé lại

bình luận và đánh giá trên thang điểm 10 và cung cấp điểm số trên một số khía cạnh

cụ thể (địa điểm, giá cả, chất lượng, nhân viên, dịch vụ và không gian) như ví dụ ở

hình 1.2 Ở lĩnh vực điện thoại thông minh, vẫn chưa có trang web nào có tính năng

đánh giá trên khía cạnh cụ thê và có vô số bình luận đánh giá thường không nhận xét

chú trọng vào sản phẩm mà người dùng chỉ nhận xét mông lung và không nhắc đếnmột khía cạnh nào một cách cụ thé rõ ràng Nhận thấy điều đó, chúng tôi mong muốn

xây dựng hệ thống phân tích bình luận cảm xúc của người dùng cho ABSA, không

chỉ phát hiện về nhiều khía cạnh và cảm xúc mà còn tổng hợp các ý kiến đánh giá của

người dùng về điện thoại đó từ nhiêu nguôn khác nhau.

Trang 17

Đánh giá Điện thoại Samsung Galaxy A53 5G 128GB

f Hữu ích Q Thảo luận

Nguyễn Anh Thư @@ Đã mua tai TGDD

*~x*w#**

Hàng chất lượng

1 Hữu ích Q Thảo luận ã dùnc

Hình 1.1: Hệ thống đánh giá của trang web Thế giới di động ở Việt Nam

+ Lễ tân Duyên nhiệt tình chu đáo.

Ẩn danh

18/09/2021

Rất tốt Tốt Hài lòng

ok kok

*x+*+*%

wk kk

kkk kkk kkk

—

9.5

ake

9.5

+ Phòng nghỉ sạch, đẹp, tiện nghi, giường ngủ siu to khủng lồ &, view ok, nhà tắm trong suốt, di cùng ban trai bao thik, bao phê &, chị Huệ buồng phòng phục vụ

rất tử tế, bạn Duyên lễ tân thì rat ân cần Tuyệt vời, sẽ quay lại để review về hồ bơi và giới thiệu cho nhiều bạn bè khác a i+ &=

Hình 1.2: Hệ thống đánh giá của Vntrip ở Việt Nam

Trang 18

1.3 Tông kết

Trong nhiều lĩnh vực như kinh tế, xã hội và giáo dục thì việc phân nhóm và đánh giácảm xúc trong văn bản đóng một vai trò ngày một quan trọng và có tầm ảnh hưởng

to lớn Trên mạng xã hội, phân loại nhanh chóng các bình luận tiêu cực giúp quản trị

viên tạo môi trường không gian mạng “sạch đẹp” cho người dùng Đồng thời, việckhám phá và sử dụng các phương pháp phân lớp học sâu đóng vai trò cốt lõi trongviệc cải tiến kết quả phân loại và làm giàu nguồn tài nguyên dữ liệu ngôn ngữ tiếngViệt trong cộng đồng nghiên cứu Chính vì vậy, hệ thống của chúng tôi có tiềm nănggiúp đỡ nhiều người va áp dụng không chỉ trong đánh giá điện thoại ma còn cho nhiều

lĩnh vực trong xã hội Với mục tiêu nghiên cứu nay, chúng tôi sẽ thực hiện nghiên

cứu các phương pháp phân lớp học sâu, thực hiện triển khai, áp dụng và tinh chỉnhchúng dé đạt được kết quả phân loại cải thiện hơn

Trang 19

Chương 2 CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN

Với những bước tiến phát triển không ngừng của các kỹ thuật học sâu và học chuyên

tiếp, bài toán phân tích cảm xúc đã đạt được thành tựu nhất định và được coi là hoànthiện Việc này đã thu hút sự quan tâm rộng rãi từ cả cộng đồng học giả và doanhnghiệp đối với việc nghiên cứu và ứng dụng phân tích cảm xúc dựa trên các yếu tốkhác nhau Việc phân tích cảm xúc dựa trên khía cạnh không chỉ mang lại nhiều thách

thức, mà còn có vai trò quan trọng và có ảnh hưởng to lớn trong nhiều lĩnh vực khác

nhau.

2.1 Công trình nghiên cứu trên thế giới

Thay vì sử dụng máy học và xử lý ngôn ngữ tự nhiên, một cách khác dé khai thác ditliệu văn bản là sử dụng phương pháp truy van và phân loại thủ công Trong phương

pháp này, người dùng hoặc nhóm người sẽ thực hiện việc đọc và phân loại các câu

theo chủ đề hoặc nội dung tương ứng Trong quá trình này họ đọc và hiểu nội dung

của mỗi văn bản, sau đó đưa ra các nhãn hoặc phân loại chúng vào các danh mục

tương ứng Ví dụ, nếu bạn đang nghiên cứu về y học, bạn có thể đọc qua các văn bản

y học và phân loại chúng thành các danh mục như "bệnh ly", "phương pháp điều trị",

"nghiên cứu lâm sàng", vv Phương pháp truy vấn và phân loại thủ công tuy tốn nhiều

thời gian và công sức, nhưng nó giúp họ có thể kiểm soát tính chính xác hơn về quá

trình phân loại đữ liệu Điều này đặc biệt có ích khi dữ liệu văn bản không lớn và độchính xác cao là yếu tố quan trọng Tuy nhiên, chúng không thể xử lý được quy mô

lớn hoặc tự động hóa trong quá trình khai thác dữ liệu Vì vậy, việc áp dụng học máy

va xử lý ngôn ngữ tự nhiên vẫn được coi là một phương pháp phổ biến và hiệu quả

hơn.

(1) Trước đây, hầu hết các phương pháp tiếp cận vào đánh giá cảm xúc tong thê

của một câu hoặc một đoạn văn bản mà không xem xét các khía cạnh cụ thé

được dé cập SemEval (Semantic Evaluation) là một hội thao hằng năm trong

lĩnh vực xử lý ngôn ngữ tự nhiên, nơi có mục đích đánh giá và so sánh hiệu

10

Trang 20

quả của các phương pháp và công nghệ trong các tác vụ liên quan với ngôn ngữ Vào năm 2014, SemEval đã giới thiệu nhiệm vu ABSA dựa trên khía

cạnh Mục tiêu của nhiệm vụ này là xác định các khía cạnh của các mục tiêu

cụ thê và phân loại cảm xúc liên quan đến từng khía cạnh SE-ABSA14 [9]cung cấp hai tập dữ liệu, mỗi tập dành riêng cho lĩnh vực máy tính xách tay

và nhà hàng Tập dữ liệu nhà hàng gồm hơn 3.000 câu đánh giá tiếng Anh

từ các bài đánh giá về nhà hàng, được chỉnh sửa và gán nhãn thủ công Tập

dữ liệu máy tính xách tay gồm hơn 3.000 câu đánh giá tiếng Anh từ khách

hàng về máy tính xách tay, chỉ bao gồm nhãn khía cạnh và cảm xúc Năm

2015, nhiệm vụ ABSA của SemEval (SE-ABSA15) [8] tiếp tục tập trung

vào các lĩnh vực nhà hàng và máy tính xách tay Tuy nhiên, khác với

SE-ABSAI4, bộ dữ liệu của SE-ABSA15 bao gồm toàn bộ đoạn văn bản đánh

giá thay vì chỉ các câu đánh giá Mục tiêu là phân tích cảm xúc theo khía

cạnh trong các đoạn văn bản đánh giá Trong năm 2016, nhiệm vụ ABSA

của SemEval (SE-ABSA16) [7] mở rộng bang cách cung cấp bộ dit liệu thửnghiệm mới đa dạng từ nhiều ngành khác nhau như máy tính xách tay, nhà

hàng và khách sạn Ngoài ra, SE-ABSA16 cũng đưa ra bộ dữ liệu được đa

ngôn ngữ hóa, không chỉ giới hạn trong tiếng Anh được áp dụng cho mọingôn ngữ trong từng miền

Các nhiệm vu ABSA của SemEval đã tạo điều kiện cho các chuyên gia nghiên

cứu tham gia thử nghiệm và đánh giá tính hiệu quả của các phương pháp này.

(2) Một phương pháp được đề xuất bởi Wang và đồng nghiệp [15] đã sử dụng

mô hình LSTM với cơ chế chú ý (attention-based LSTM) đề thực hiện phânloại cảm xúc ở cấp độ khía cạnh Trong nghiên cứu này, LSTM được thiết

kế dé học cách nhúng thông tin về khía cạnh và đồng thời đánh giá mức độ

quan trọng của chúng trong việc phân loại cảm xúc Nghiên cứu này đã dùng

tập dữ liệu SE-ABSA14, gồm hơn 6.000 câu đánh giá được gan nhãn thủ

công trong lĩnh vực máy tính xách tay và nhà hàng Kết quả đạt được cho

nhiệm vụ phân loại cảm xúc ở cap độ khía cạnh là 84% độ chính xác Đôi

11

Trang 21

với việc phân loại cảm xúc cho các thuật ngữ khía cạnh, LSTM đạt kết quả

77,2% độ chính xác trên dữ liệu nhà hàng và 68,9% trên dữ liệu máy tính

xách tay.

Kết quả của nghiên cứu nay đã minh chứng tính hiệu qua đáng ké của mô hìnhLSTM kết hợp với cơ chế chú ý trong việc phân loại cảm xúc ở cấp độ khíacạnh Phương pháp này đã có sự đóng góp rất nhiều vào việc cải thiện khả năng

hiểu và phân tích cảm xúc trong các văn bản, có thể ứng dụng rộng rãi trong

nhiều lĩnh vực, bao gồm đánh giá sản phâm, phản hồi từ khách hang và quản lý

quan điêm công chúng.

(3) Trong nghiên cứu của Sun và đồng nghiệp [2], họ đã giới thiệu một phương

pháp khác đề phân loại cảm xúc theo cặp câu trong bài toán ABSA Phươngpháp này chuyên trọng tâm từ việc phân tích từng khía cạnh đơn lẻ sang việcxây dựng câu bồ trợ từ khía cạnh và thực hiện phân loại cảm xúc dựa trêncác cặp câu Họ đã tinh chỉnh mô hình BERT dé thích ứng với nhiệm vụ

phân loại theo cặp câu trên hai bộ dữ liệu là SentiHood và SE-ABSA14 Với

SE-ABSA14, phương pháp đạt được 92,18% Fl-score cho việc phát hiện

khía cạnh Ở bộ đữ liệu SentiHood, phương pháp đạt được 87,9% F1-scorecho việc phát hiện khía cạnh Các phương pháp mới và tiếp cận sáng tạo nhưviệc sử dụng BERT và xây dựng câu bồ trợ từ khía cạnh đã đạt được nhữngkết quả đáng chú ý, tăng cường hiệu suất và cải thiện độ chính xác trong việcphân loại cảm xúc ở cấp độ khía cạnh

Điều này thể hiện tầm quan trọng và tiềm năng trong việc hiểu và phân tích ýkiến người dùng từ các nguồn dữ liệu văn bản

(4) Tác giả Yang và đồng nghiệp [16] đã tiến hành đề xuất một phương pháp

tiên tiến để xử lý vấn đề trích xuất khía cạnh thuật ngữ trong phân tích cảm

tính Thay vì chỉ sử dụng một mô hình nơ-ron duy nhất, họ đã kết hợp hai

mô hình khác nhau dé tận dụng thông tin cú pháp Y tưởng cốt lõi là sử dụngconstituency tree để nhận thông tin cú pháp rõ ràng Từ constituency tree,

các mạng câu thành được trích xuât và mã hóa trong hai mô hình nơ-ron

12

Trang 22

khác nhau: BiLSTM-CRF và BERT Mô hình BiLSTM-CRF được sử dụng

để mã hóa thông tin cú pháp từ các cụm từ khía cạnh Đây là một mô hìnhthần kinh nhúng được sử dụng đề xử lý chuỗi và dự đoán nhãn theo trình tự

Mô hình này giúp trích xuất các cụm từ khía cạnh và xác định nhãn phù hợpcho chúng Mô hình BERT dùng để mã hóa thông tin cú pháp từ cây phântích cú pháp Bằng cách sử dụng BERT, ta có thể khai thác thông tin về ngữ

nghĩa và cú pháp dé trích xuất khía cạnh Kết qua cho thay phương pháp củaYang và đồng nghiệp vượt qua các phương pháp hiện đại khác với độ chính

xác cao đạt được F1-Measure 1,35 điểm

(5) Yukun Ma và đồng nghiệp [11] đã giới thiệu một phương pháp tiên tiến để

vượt lên trên các thách thức trong việc phân tích tình cảm dựa trên khía cạnh

và phân tích tình cảm có mục tiêu bằng cách khai thác kiến thức chung.Trong nghiên cứu này, họ đã đưa ra một giải pháp độc đáo gắn kết kiến thứcthông thường vào một mạng bộ nhớ dài ngắn (LSTM) có cơ chế chú ý, tậptrung vào cấp độ mục tiêu và cấp độ câu Ý tưởng chính là tích hợp tri thứcthông thường vào quá trình phân tích tình cam dé cung cấp cho mô hình mộthiểu biết rộng hơn về thé giới thực và từ đó cải thiện khả năng dự đoán tìnhcảm Dé tích hợp kiến thức chung vào quá trình mã hóa, nhóm tác giả đã đềxuất phiên bản mở rộng của LSTM, gọi là Sentic LSTM Thử nghiệm đã

được thực hiện trên hai bộ dữ liệu công khai và đã cho thấy những kết quả

thực sự tốt Sự kết hợp giữa kiến trúc chú ý được đề xuất và Sentic LSTM

đã vượt qua các phương pháp hiện đại khác trong việc phân tích tình cảm

dựa trên khía cạnh.

(6) Trong nghiên cứu của Hu và các cộng sự [6], được lấy cảm hứng từ các bước

tiến trong lĩnh vực đọc hiểu tự động và trả lời câu hỏi [10], họ đề xuất một

framework trích xuất-sau đó phân loại dựa trên khoảng cho phân tích tìnhcảm dựa trên khía cạnh Ý tưởng chủ đạo của nghiên cứu là tận đụng phương

pháp trích xuất và phân loại dựa trên khoảng trong các ngữ cảnh đữ liệu mở

Cụ thể, họ tập trung vào việc trích xuất các khoảng ý kiến mục tiêu từ văn

13

Trang 23

bản, sau đó phân loại cảm xúc tương ứng của chúng Có ba cách tiếp cận

bao gồm mô hình pipeline, mô hình joint và mô hình thu gọn, mỗi mô hình

có cách tiếp cận và quy trình riêng Công trình này mang lại những ứng dụng

quan trọng từ các tiến bộ trong lĩnh vực đọc hiểu tự động và trả lời câu hỏi.Mục tiêu nhằm phát hiện khoảng trong văn bản mà có thé trở thành câu trả

lời cho câu hỏi được đặt ra [12], [21].

(7) Liu và các cộng su [5] tập trung vào việc phân loại tình cảm dựa trên khía

cạnh bằng cách sử dụng hai cơ chế tăng cường chú ý Các cơ chế này bao

gồm cơ chế chú ý cấp độ câu và cơ chế chú ý ngữ cảnh, nhằm nắm bắt thôngtin quan trọng về các khía cạnh từ quan điểm toàn cầu và xem xét thứ tự vàmỗi liên kết giữa các từ Mô hình được đề xuất các cơ chế phân loại tình cảm

dựa trên khía cạnh trước đây, tập trung vào xác định các từ cảm xúc hoặc

chuyên đổi mà không xem xét mức độ liên quan của chúng đối với các khíacạnh cụ thể trong câu Điều này tạo ra thách thức khi xử lý các câu đa nghĩa

và câu có cấu trúc phức tạp Đề giải quyết thách thức này, họ đã tích hợp các

cơ chế chú ý cấp độ câu và chú ý ngữ cảnh vào mô hình, cho phép modeltập trung vào mức độ liên quan của từng từ đối với các khía cạnh đã chotrong câu Thông qua việc tích hợp các cơ chế chú ý đề xuất, mô hình đãvượt qua các mô hình phố biến hiện có và đem đến kết quả tốt hơn trong

việc phân loại tình cảm theo khía cạnh, như đã được minh chứng qua các

thử nghiệm Các cơ chế chú ý trong model đóng vai trò thiết yêu trong việcnăm bắt thông tin liên quan và xử lý các câu có tính đa nghĩa và cấu trúc

phức tạp Nghiên cứu này có ý nghĩa quan trọng đối với việc phát triển trong

lĩnh vực phân loại tình cảm dựa trên khía cạnh bằng cách đề xuất các cơ chế

chú ý hiệu quả.

2.2 Công trình nghiên cứu ở trong nước

Trong thời gian gần đây, Việt Nam đã va đang day mạnh công cuộc phát triển trong

ngành công nghệ dữ liệu lớn Dữ liệu văn bản ngày càng trở nên phô biên rong rãi và

14

Trang 24

đa dạng, xuất hiện trên nhiều nguồn thông tin như thương mại điện tử, mạng xã hội,

website và các khảo sát Điều này tạo ra một kho tài nguyên quý giá có những thông

tin hữu ích, nhưng song song với đó cũng tạo ra một thách thức khó khăn trong việc

hiệu quả hóa quá trình trích xuất và phân loại dữ liệu văn bản Ở Việt Nam, việc xử

lý ngôn ngữ tự nhiên đang tập trung vào hai vấn đề chính: phân loại và quản lý bìnhluận trên mạng xã hội, cùng với phân tích dit liệu khách hàng trong lĩnh vực mua sắmonline Nói về khía cạnh nguồn di liệu, Tiếng Việt chưa có số lượng lớn các bộ dữ

liệu được khai thác và chia sẻ trong cộng đồng nghiên cứu Đồng thời, dé thích ứng

và ứng dụng các thuật toán và mô hình một cách hiệu quả, cần tiếp tục nghiên cứu vàtối ưu hóa dé đáp ứng yêu cầu đặc thù của Tiếng Việt và cấu trúc phức tạp của ngônngữ này Tuy nhiên đã có không ít nghiên cứu nổi bật trong lĩnh vực này có thé kế

đến như:

(1) Mai và cộng sự [24] đã tập trung vào việc phân tích cảm xúc dựa trên các

nguyên tắc cơ bản của ABSA cho tiếng Việt Trong nghiên cứu này, họ đã tiếnhành cùng nhau thu thập một tập dé liệu chứa đánh giá của người dùng về điệnthoại thông minh Sau đó, họ đã xây dựng một bộ dữ liệu ABSA tiếng Việt vớitong cộng 2.098 câu nhằm mục đích trích xuất mục tiêu ý kiến (OTE) va phântích cảm xúc Trong phần thực hiện, tác giả đã đề xuất một phương pháp sửdụng sơ đồ gắn nhãn trình tự kết hợp với BRNN va CRF Phương pháp nàynhằm mục đích trích xuất các mục tiêu ý kiến đồng thời phát hiện cảm xúc

tương ứng của ý kiến Qua các thử nghiệm trên bộ dữ liệu này, model

BRNN-CRF đã đạt được độ chính xác cao, với điểm F1-15 đạt 71,79%, vượt trội hơn

so với phương pháp CRF sử dụng các đặc trưng được thiết kế thủ công, với

điểm F1-score chỉ đạt 54,91%

(2) Trong nghiên cứu của Dang va đồng nghiệp [26], họ đưa ra một bộ dữ liệu độc

dao ở mức độ câu được chú thích có mức đồng thuận cao, nhằm phân tích tìnhcảm dựa trên nhiều khía cạnh trong lĩnh vực nhà hàng và khách sạn bằng tiếng

Việt Kho tài liệu mà nhóm nghiên cứu xây dựng gồm 10.005 câu đánh giá vềkhách sạn và 9.737 câu đánh giá về nhà hàng Nghiên cứu này cũng phát hiện

15

Trang 25

hiệu quả của các mô hình học máy đa nhiệm và đơn nhiệm, trong đó kiến trúc BERT đạt kết quả tốt nhất với F1-score lần lượt là 86,96% và 79,10% trong phát hiện khía cạnh, và F1-score lần lượt là 74,88% và 73,69% trong phân loại

cảm xúc Ngoài ra, còn có bộ dữ liệu VLSP 2018 [20] từ cuộc thi ABSA shared-task tổ chức bởi VLSP vào năm 2018, cũng tập trung vào lĩnh vực nhà hàng và khách sạn.

(3) Năm 2018, VLSP (The Vietnamese Language and Speech Processing) đã giới

thiệu nhiệm vụ ABSA (Aspect-Based Sentiment Analysis) đầu tiên tại Việt Nam [20] Nhiệm vụ này tập trung vào việc phân tích tình cảm dựa trên khía

cạnh trong lĩnh vực nhà hàng và khách sạn VLSP 2018 đã thu thập một bộ dữ liệu ABSA tiếng Việt từ một trang web đánh giá online, bao gồm các đánh giá

về nhà hang và khách sạn Bộ dit liệu ABSA của VLSP 2018 được chia thành

6 nhãn cho các đối tượng và 5 nhãn cho các thuộc Tuy nhiên, bộ dữ liệu này

chỉ tập trung vào việc phân loại entity# attribute và cảm xúc, bỏ qua nhiệm vụ phát hiện opinion target Tổng quan, VLSP 2018 đã đóng góp quan trọng trong việc xử lý ngôn ngữ tự nhiên tiếng Việt, đặc biệt là trong lĩnh vực ABSA.

(4) Binh Le-Minh và các cộng sự [19] đã hợp tác dé xây dựng bộ đữ liệu VECD

cho bài toán ABSA trên lĩnh vực công nghệ và Mẹ & bé Bộ dữ liệu này bao gồm tổng cộng 12,240 câu được thu thập từ hai trang mua sắm online Shopee

va Tiki Trong VECD, họ đã thu thập 3,016 câu về lĩnh vực Mẹ & bé từ Shopee

và 2,986 câu từ Tiki Đối với lĩnh vực công nghệ, họ đã thu thập 3,002 câu từ

Shopee và 3,236 câu từ Tiki Quá trình xây dựng bộ dữ liệu VECD được thực hiện bằng tay Sau khi xây dựng VECD, nhóm nghiên cứu đã áp dụng các mô

hình học sâu kết hợp với các lớp phân loại của các mô hình khác như Random

Forest, Decision Tree và SVM Kết quả cao nhất đạt được trên hai độ đo

Micro-Avg và Macro-Avg là 95% Ngoài ra, họ cũng đã kết hợp phoBERT

với các model học sâu khác như CNN Phương pháp kết hợp giữa các mô hình học sâu và các lớp phân loại khác nhau đã mang lại kết quả ấn tượng, và hiệu

16

Trang 26

quả của việc kết hợp phoBERT với mô hình CNN cũng được chứng minh

trong việc phân tích ý kiến và đánh giá

(5) Phan và các cộng sự [23] đã tiễn hành nghiên cứu về phân tích cảm xúc dựa

trên khía cạnh (ABSA) bằng cách xây dựng bộ dit liệu UIT-ViSFD Ho đã sửdụng bộ dữ liệu này dé huấn luyện và đánh giá hiệu suất của SA2SL SA2SL

sử dụng một kiến trúc học sâu (Deep Learning) có tên là BiLSTM kết hợp vớifastText word embedding dé thực hiện phân tích cảm xúc và phát hiện khíacạnh trong các bình luận về điện thoại đi động trên các nên tảng thương mại

online Kết quả nhận được của SA2SL cho thay hiệu suất tốt với F1-score đạtđược là 84,48% về phát hiện khía cạnh và 63,06% về phát hiện cảm xúc theokhía cạnh trên bộ dữ liệu UIT-ViSFD Hệ thống SA2SL được hy vọng sẽ demlai lợi ích đáng kể trong việc phân tích dữ liệu xã hội và cung cấp các thôngtin giá trị cho các doanh nghiệp trong quá trình ra quyết định va theo kip xu

hướng thị trường.

(6) Nguyễn và các cộng sự [25] nhận thấy rằng việc có một bộ dữ liệu đủ lớn và

chính xác là một yếu tố tiềm năng dé phát triển và đánh giá các phương phápphân tích cảm xúc theo khía cạnh trong tiếng Việt Vì vậy, họ đã tạo ra một

corpus (tập dữ liệu) được chú thích thủ công, với mục đích là đem đến một

nguôn tài nguyên đáng tin cậy cho cộng đồng nghiên cứu trong lĩnh vực này

Corpus chứa 7.828 ý kiến đánh giá về những khía cạnh cụ thé trong các lĩnh

vực như nhà hàng, khách sạn, điện tử, thời trang và nhiều lĩnh vực khác Mỗiđánh giá trong corpus được chú thích thủ công để xác định các khía cạnh cảm

xúc mà người dùng nhắc đến và các phân cực cảm xúc tương ứng Sau khi xâydựng corpus, các tác giả đã tiến hành thực hiện một phương pháp học có giám

sát với các tính năng đa dạng để phân tích cảm xúc theo khía cạnh Kết quảthử nghiệm cho thấy độ chính xác của phương pháp đạt được điểm FI là87,13% cho nhiệm vụ phát hiện khía cạnh và điểm F1 là 59,20% cho nhiệm

vụ phát hiện phân cực cảm xúc Nghiên cứu này đóng vai trò quan trọng trong

17

Trang 27

việc cải tiến và nâng cao phương pháp phân tích cảm xúc theo khía cạnh trong

tiếng Việt

(7) Nguyễn và các cộng sự [22] đã tập trung vào một bài toán quan trọng trong

lĩnh vực xử lý ngôn ngữ tự nhiên, đó là ABSA trong tiếng Việt Mục tiêu của

công trình nay là xác định các khía cạnh cảm xúc trong văn ban va xác định

cảm xúc phù hợp với từng khía cạnh đó Các tác giả đã công bố một tap dirliệu mới cho phân tích cảm xúc theo khía cạnh trong Tiếng Việt Tập dữ liệu

này gồm tổng cộng 35.396 khoảng ý kiến được chú thích bằng tay từ 11.122

bình luận của người dùng Trong bài báo này, các tác giả đã đề xuất giới thiệumột hệ thống sử dụng mô hình BILSTM-CRE (Bidirectional LSTM withConditional Random Fields) dé thực hiện phát hiện đoạn văn bản chứa ý kiến

Hệ thống này sử dụng các đặc trưng được trích xuất từ các embedding, bao

gồm syllable embedding, character embedding và XLM-RoBERTaembedding Két qua tốt nhất dat được là 62,76 điềm F1 macro cho nhiệm vu

phát hiện đoạn văn bản chứa ý kiến khi sử dụng mô hình BiLSTM-CRF kếthợp với các embedding đã nêu Kết quả nghiên cứu đóng góp vào việc hiểu vàphân tích ý kiến đánh giá của người dùng về từng khía cạnh cụ thê của loại sảnphẩm và dịch vụ trong ngữ cảnh tiếng Việt

Các bài toán về ABSA vẫn còn thách thức và tiếp tục nghiên cứu nhiều hơn đề pháttriển mô hình tốt Cần tạo ra, xây dựng bộ dữ liệu đa dạng và tiếp tục áp dụng côngnghệ mới Thách thức hiện nay là sự công hiến và hợp tác từ cộng đồng nghiên cứu

và doanh nghiệp đề đạt tiễn bộ và ứng dụng ABSA hiệu quả

2.3 Kết luận

Dữ liệu lớn đã và đang trở nên là một kho tàng quý hiện nay, và việc số hóa đã thúcđây sự quan tâm đối với các nghiên cứu công nghệ thông tin Trong số đó, bài toánphân tích cảm xúc đóng vai trò đặc biệt quan trọng và đang tiếp tục đối mặt với nhiềuthách thức đáng kể

18

Trang 28

Trên thế giới, đã có một số công trình nghiên cứu xây dựng các bộ dữ liệu phục vụcho việc phân tích cảm xúc trên các khía cạnh cụ thể, như đánh giá nhà hàng, kháchsạn, laptop, điện thoại thông minh và thiết bị điện tử Tuy nhiên, với ngôn ngữ tiếngViệt, tài nguyên nghiên cứu vẫn còn rat hạn chế, chỉ có một số bộ đữ liệu với quy môtrung bình và nhỏ được công bố, đặc biệt là trong lĩnh vực nhà hàng, khách sạn và

điện thoại thông minh.

Hơn nữa, các bộ dữ liệu ABSA tiếng Việt hiện tại hầu như chỉ tập trung vào hai nhiệm

vụ phụ, đó là phát hiện khía cạnh và phân tích cảm xúc, trong khi phần quan trọng

khác như phát hiện ý kiến mục tiêu (OTE) chưa được nghiên cứu đầy đủ Điều này

có liên quan đến hạn chế về dit liệu để phục vụ cho việc phát hiện ý kiến người dùng

trong bai toán ABSA tiếng Việt

Vì vậy, để giải quyết những thách thức trên và nâng cao hiệu quả của các mô hìnhABSA, cần đầu tư nhiều nghiên cứu hơn trong tương lai, cung cấp tài nguyên dữ liệuphong phú và cải tiến thêm nhiều phương pháp mới Điều này sẽ góp phan vào việcxây dựng các hệ thong thông tin hỗ trợ kinh doanh và xã hội hiệu qua hơn

19

Trang 29

Chương 3 BỘ DỮ LIỆU NGHIÊN CỨU UIT-ViSFD

3.1 Mô tả bộ dữ liệu

Bộ dữ liệu chúng tôi sử dụng do Phan và các cộng sự [23] xây dựng từ các bình luận,

nhận xét trên trang web mua ban điện thoại online: thegioididong.com Bộ dữ liệu

gồm 11,122 bình luận đánh giá về điện thoại thông minh từ những thương hiệu diđộng nồi tiếng trên thegioididong Bộ dit liệu được gán nhãn theo bài toán phân tíchcảm xúc dựa trên khía cạnh Bộ dữ liệu gồm 10 nhãn khía cạnh của điện thoại, đây là

những khía cạnh mà người dùng tập trung đánh giá Cùng với 10 khía cạnh đó là ba

phân cực cảm xúc, ngoài ra còn có | khía cạnh đặc biệt nằm ngoài 10 khía cạnh trên

và không có đi kèm đánh giá cảm xúc.

Bang 3.1: Các hướng dẫn chú thích dé ghi nhãn các khía cạnh và cảm xúc tương

Người dùng tham khảo các

tính năng, cảm biên vân tay,

Trang 30

Nhận xét mô tả dung lượng Pin , pin trâu Tích cực

pin và chat lượng pin

Cac bai đánh gia mô ta dung

; lượng khủng, chip xử ly, cau hình có thé

Hiệu suât , , Trung lap

hiệu suât sử dụng và độ châp nhận được

mượt mà của điện thoại.

mm Các bài đánh giá đề cập đến | điện thoại thiết kế |

Thiét kê ' — Tiêu cực

kiêu dáng, thiệt kê và vỏ thô

; Các bình luận trình bay giá | giá cả ở mức tương

Gia : ; ; h Trung lập

cụ thê của điện thoại đôi

; Cac binh luan nhan xét ` Đánh giá chung = moi thứ déu ok Tich cuc

chung về điện thoại.

Các nhận xét đề cập đến ;

nhan vién hoa

Dich vu & phu | dich vu ban hang, bao hanh ` ,

; ; đông, tư vân nhiệt | Tích cực kiện và xem xét các phụ kiện của

điện thoại.

tình

3.2 Quy trình xây dựng bộ dữ liệu

Đề xây dựng bộ dữ liệu, Phan và các cộng sự [23] đã tuân theo một quy trình gồm 4

bước chính Đầu tiên, họ đã tìm kiếm các nguồn thông tin, số liệu chất lượng Họ đãlựa chọn các nguồn dé liệu đáng tin cậy và phù hợp với những gi nghiên cứu hướngđên Sau đó, tiên hành gan nhãn dt liệu băng cách xác định đặc điểm khía cạnh và

phân loại tình cảm, cảm xúc tương ứng trong moi câu Quá trình nay đã doi hỏi sự

thảo luận và đạt đồng thuận giữa các người tham gia Nếu độ đồng thuận chưa đạt

mức mong muôn, họ sẽ xem xét lại và điêu chỉnh hướng dân đê đảm bảo sự nhât quán

21

Trang 31

trong quá trình gán nhãn Khi đạt được độ đồng thuận trên 80%, họ đã tiến hành gánnhãn độc lập bằng cách yêu cầu nhiều người tham gia gán nhãn cho cùng một tập dữ

liệu Điều này giúp dam bảo sự khách quan và đa dang trong quá trình thực hiện gan

nhãn Cuối cùng, thực hiện việc thống kê bộ đữ liệu dé dữ liệu dé đạt được cái nhìn

toàn diện và sâu hơn.

3.2.1 Thu thập dữ liệu

Quy trình thu thập đữ liệu bao gồm hai giai đoạn chính Đầu tiên, Phan và các cộng

sự [23] đã tìm va lựa chọn trang web thegioididong, nơi có một đa dạng các

“comment” đánh giá từ người dùng về trải nghiệm điện thoại thông minh Tổng cộng

họ đã thu thập được 13,092 bình luận từ 125 loại điện thoại đến từ 9 thương hiệu nồitiếng trên trang web này Bước tiếp theo là xây dựng một bộ hướng dan gan nhãn dé

đảm bảo sự thống nhất và chính xác trong quy trình gán nhãn dữ liệu Điều này chắc

chan răng dữ liệu thu thập được có chất lượng cao và đáp ứng tốt cho mục đích nghiên

"Neutral" (trung lập) và "Negative" (tiêu cực) Điều này giúp họ tiếp cận thông tin

chỉ tiết về sự đánh giá của người dùng đối với các phương diện khác nhau của điện

thoại Qua quá trình này, họ đã xây dựng bộ dữ liệu gán nhãn chất lượng và đáng tin

cậy dé sử dụng trong các nhiệm vụ phân loại va phân tích câu văn liên quan đến điện

thoại di động.

3.2.3 Quá trình gán nhãn

Sau khi hoàn thành bộ hướng dẫn gán sơ bộ, Phan và các cộng sự [23] tiến hành gán

nhãn 1.200 bình luận ngẫu nhiên từ bộ dữ liệu Họ chia chúng thành 6 phần, mỗi phần

gồm 200 bình luận, và các nhãn được gán độc lập bởi các người gán nhãn khác nhau

22

Trang 32

để tính độ đồng thuận Phan và các cộng sự [23] đã sử dụng độ đồng thuận Cohen's Kappa dé đo lường sự đồng thuận giữa các người gan nhãn Dé tính độ đồng thuận,

họ tính toán trung bình của 10 cặp người gán nhãn (do nhóm có 5 người) sau mỗi

vòng gán nhãn 200 bình luận Kết quả đồng thuận trung bình tăng dần và ồn định qua

mỗi vòng gán Chỉ khi độ đồng thuận đạt mức 80.00%, họ tiến hành gán nhãn toàn

bộ dữ liệu độc lập Bộ hướng dẫn gán nhãn sẽ được điều chỉnh và liên tục mở rộng

trong quá trình gán nhãn Phan và các cộng sự [23] đã nhận thấy rằng các bình luận

có độ dài hơn 250 từ thường không có nói lên cảm nhận hoặc nhận xét về sản phẩm.

Do đó, họ đã xóa các bình luận có hơn 250 từ thủ công trong quá trình gan nhãn dé giảm nhiễu và cải thiện chất lượng bộ dữ liệu.

Kết quả độ đồng thuận của các khía cạnh trong 6 vòng gán nhãn cho thấy nhãn

"BATTERY" (Pin) luôn có độ đồng thuận cao nhất trong các vòng gán nhãn, đạt 97.35% cho phan gan khía cạnh và 93.80% cho phần gan cảm xúc Điều này là do các bình luận về khía cạnh pin có từ ngữ rõ ràng và thường liên quan đến các van đề

phổ biến của người dùng, dễ dàng để nhận biết và gán nhãn Trái lại, nhãn

"STORAGE" (Bộ nhớ), "OTHERS" (Khác) và "SERVICE&ACCESSORIES" (SER&ACC) (Dịch vụ & Phụ kiện) có độ đồng thuận chưa cao bằng các nhãn khác

(dưới 80.00%) Đối với nhãn "STORAGE" (Bộ nhớ), số lượng bình luận về khía cạnh

này trong bộ dữ liệu khá ít, dẫn đến việc một hoặc hai câu gán sai có thể làm giảm độ đồng thuận Ban đầu, nhãn "OTHERS" (Khác) bao gồm cả định nghĩa của nhãn

"OTHERS" (Khác) và nhãn "SER&ACC" (Dịch vụ & Phụ kiện) Tuy nhiên, sau ba

vòng gán nhãn, nhận thấy có nhiều bình luận đánh giá chất lượng dịch vụ và phụ kiện.

Vì vậy, Phan và các cộng sự [23] đã tách nhãn "OTHERS" (Khác) thành hai nhãn

riêng biệt là "OTHERS" (Khác) và "SER&ACC" (Dịch vụ & Phụ kiện) Trong ba

vòng gán nhãn đầu tiên, nhãn "SER&ACC" (Dịch vụ & Phụ kiện) chưa được gán và

độ đồng thuận có giá tri NaN Sau khi tách riêng, nhãn "OTHERS" (Khác) không có

phần gán cảm xúc vì vậy các vòng gán nhãn sau không có độ đồng thuận cảm xúc cho nhãn này và có giá trị NaN.

23

Trang 33

Sau khi hoàn tất quá trình huấn luyện và hướng dẫn gán, Phan và các cộng sự [23] tiến hành gán nhãn song song cho toàn bộ bộ dữ liệu Để tăng hiệu quả và tiện lợi cho quá trình gan nhãn, họ đã tạo ra một nền tảng gắn nhãn cho bộ dữ liệu này.

3.2.4 Phân tích bộ dữ liệu

Bộ dữ liệu của Phan và các cộng sự [23] chứa 11,122 câu bình luận va bao gồm 4

thuộc tính chính: câu bình luận (comments), số sao đánh giá (n_star), thời gian bình

luận (date_ time) và nhãn của câu bình luận (label) Họ đã chia ngẫu nhiên bộ dữ liệu

thành ba phần: tập huấn luyện (Train), tập phát triển (Dev) và tập kiểm tra (Test) Trung bình, mỗi câu bình luận có 3 khía cạnh và khoảng 36 từ Tuy nhiên, số lượng khía cạnh không được phân bó đồng đều Vi dụ, khía cạnh GENERAL (đánh giá chung) chiếm 6,936 câu bình luận trong khi khía cạnh STORAGE chỉ có 132 câu Diéu này tạo ra sự mat cân bằng trong khi xây dựng model dự đoán, khiến mô hình

khó nhận diện các từ thuộc khía cạnh STORAGE do số lượng quá ít Ngoài ra, cũng

có sự tách biệt giữa các label cam xúc Cụ thé, tỷ lệ nhãn Positive là 56.13%, Negative

là 31.70% và Neutral là 12.17%.

Dựa vào biểu đồ, ta thây sắc thái cảm xúc tích cực chiếm tỷ lệ cao nhất trong đa số

các nhãn, tiếp theo là sắc thái tiêu cực và trung lập Điều này phản ánh phần đông người dùng có xu hướng nhận diện các khía cạnh là tích cực hoặc tiêu cực, trong khi

ít người có xu hướng đánh giá các khía cạnh mang tính trung lập Tuy nhiên, nhãn

PRICE (giá) có tỷ lệ sắc thái trung lập cao hơn hai nhãn còn lại.

Tập dữ liệu của Phan và các cộng sự [23] đã mở ra một cánh cửa mới dé chia sẻ thông

tin về ABSA và hỗ trợ việc áp dụng phương pháp phân tích tình cảm, cảm xúc cho các phương diện khía cạnh trên các hệ thống mua bán online, sản thương mại online.

24

Trang 34

Chương 4 CÁC PHƯƠNG PHÁP TIẾP CẬN

4.1 Thu thập dữ liệu

Dé có nguồn dữ liệu phù hợp và đáng tin cậy, chúng tôi đã xem xét và tìm ra những

trang web uy tín như ViettelStore, fptshop, thegioididong, didongviet, cellphoneS Tuy có rất nhiều nguồn dữ liệu nhưng do thời gian có hạn nên chúng tôi đã lựa chọn

ra 2 trang web thegioididong và fptshop trong nhiều trang web trên.

Nhận thấy rằng các trang web này có cấu trúc và dữ liệu phức tạp nên chúng tôi đã

sử dụng công cụ Scrapy - được viết bằng python hỗ trợ thu thập dữ liệu (còn được

gọi là web scraping) và crawling (tự động duyệt và truy xuất dữ liệu từ các trang web) Nó là một framework cung cấp các tính năng mạnh mẽ có thể lấy toàn bộ dữ

liệu html, văn bản, hình ảnh trên nhiều trình duyệt khác nhau như Chrome, Safari,

Eirefox Ngoài ra còn hỗ trợ cho xác thực, xử lý cookie, chạy đa luồng, đa truyền dẫn,

lập lịch và xử lý lỗi.

Trong quá trình thu thập dữ liệu, nhận thấy rằng các trang web hiện nay là các trang web động có sử dụng JavaScript, khi ấy Scrapy thông thường sẽ không xử lý được,

Vi thế chúng tôi đã tìm hiểu và kết hợp Scrapy và Playwright thành công dé thu thập

di liệu ở các trang web có sử dụng JavaScript.

Playwright là một công cụ tự động hóa trình duyệt mã nguồn mở, được phát triển bởi Microsoft Cung cấp khả năng kiểm soát và tương tác với trình duyệt web, cho phép

bạn thực hiện các hoạt động như điều hướng đến URL, tương tác với các phan tử trên

trang Sự kết hợp giữa Scrapy và Playwright có thé mang lại lợi ích lớn trong việc tự động hóa công việc khai thác dữ liệu trên web, nhân đôi khả năng trích xuất cơ bản

và tương tác phức tạp từ trình duyệt.

25

Trang 35

Xóa các thẻ dang Chuân hóa các

HTML | ký tự Unicode

Xóa các dạng ký Q Tach câu thành | Chuyên toàn bộ từ ngữ câu

tự không can thiệt các từ, cụm từ văn thành chữ thường.

Hình 4.2: Sơ đồ hoạt động của tiền xử lý dữ liệu

- Xóa các thẻ dang html: trong hệ thông mà chúng tôi định xây dựng sẽ có việc

crawl đữ liệu từ nhiều trang web bán thiết bị di động vì thế sẽ có thể có các thẻ tin có dang html Khi các thẻ này HTML này được loại bỏ thì chúng ta nhận được đoạn văn bản đã được xử lý chỉ còn lại nội dung văn bản thông

thường.

- Xóa các dang ký tự không cần thiết: sử dụng biểu thức chính quy để xóa các

ky tự không cần thiết có trong chuỗi như “?”, “!”, “\”

- Chuẩn hóa các ký tự Unicode: trong văn ban bằng tiếng việt sẽ có những ký

tự không chuẩn ở các bang mã khác nhau như "â", "đ", "ô", "ơ", "ự", Khi ấy

sẽ dùng dang chuẩn hóa này chuyển về các ký tự tương ứng trong bang mã

26

Trang 36

UTF-8 Dam bảo tính nhất quán và đồng nhất trong việc chuẩn hóa các văn

bản có chứa các ký tự Unicode.

- Chuẩn hóa các từ viết tắt, teencode: người việt hiện nay thường viết nhiều từ

ngữ, câu văn văn tắt hoặc sử dụng teencode để ngắn gọn hơn Vì vậy chúng tôi đã sử dụng bộ chuẩn hóa từ được nghiên cứu trước đó của Đặng và các

cộng sự [26], việc chuẩn hóa này làm cho các từ viết tắt và các từ lóng trong

một chuỗi văn bản thành các từ đầy đủ và chuẩn mực tương ứng.

-_ Chuyên toàn bộ từ ngữ câu văn thành chữ thường: thực hiện việc chuyền đổi

tat cả các ký tự sang chữ thường dé đồng nhất định dang và dé dàng xử lý văn

bản.

- _ Tách câu thành các từ, cum từ: trong dé tài này, chúng tôi sử dụng thư viện

VnCoreNLP dé phan loại câu, từ, cum từ hoặc cu pháp được sử dụng trong câu.

Bảng 4.1: Ví dụ về dữ liệu trước và sau khi xử lý

Trước khi xử lý Sau khi xử lý

<p>Đây là một dòng điện thoại l

Đây là một dòng điện Xóa thẻ html cực kỳ <strong>dep</strong> l

thoại cực kỳ đẹp

</p>

l : ` , Dién thoai Sam Sung cam Dién thoai Sam Sung cam tay rat :

Xóa ký tự không tay rat sang trọng Xai một

cần thiết sang trọng!!! Xài một ngày mà pin

vẫn chưa xuống đến 20% ngày mà pin vẫn chưa

27

Trang 37

: l Dùng ok, hàng chính

Chuân hóa từ Dùng oki, hàng chính hãng có os

oe X hãng có khác, sẽ tiêp tục việt tat, teencode | khác, sẽ tiếp tục ủng hộ sop

ủng hộ cửa hàng

Chuyên đôi l điện thoại sam sung này

Điện thoại Sam Sung đợt này pin thành chữ l co pin không trâu, xài mau

không trâu, xài mau hêt pin thuong hét pin

ca Sau | tháng sử dụng thì Sau 1 tháng sử dụng thi tôi thay on

l tôi thay điện thoại dùng điện thoại dùng rât ok, câu hình l ,

Tách từ rat ok, câu hình máy

máy mạnh, camera chụp hình rât

mạnh, camera chụp hình đẹp Ĩ

rât đẹp

4.3 Phương pháp sử dụng

Phan và các cộng sự [23] đã đề xuất một loạt phương pháp học máy và học sâu đề

nhận diện khía cạnh và cảm xúc Họ đã tiễn hành thử nghiệm với hai mục đích chính, bao gồm nhận diện khía cạnh và nhận diện cảm xúc cho khía cạnh Sản phẩm nhận

được từ Bảng 2 và Bảng 3 đã cho thấy một cách trực quan sự khác biệt rõ rệt giữa hai

phương thức nhận diện này Đáng chú ý, sau khi áp dụng nhiều phương pháp học

máy truyền thống và học sâu, BiLSTM là mô hình vượt trội khi đạt được kết quả

Trang 38

Naive bayes 63.06 35.16 39.97

CNN + fastText 59.01 47.47 50.02

Học sâu | LSTM + fastText 65.17 55.02 58.81

BiLSTM + fastText 66.53 61.64 63.48

Dua trén hai bang két quả thực nghiệm, cĩ thể thấy rằng hiện tại, việc nhận diện cảm

xúc cho khía cạnh vẫn chưa đạt được mức độ cao như mong đợi Đối với các phương

pháp học máy truyền thống thì kết quả khơng được hiệu quả khi thực nghiệm chỉ đạt kết quả dưới 50% Fl-Score Cịn các phương pháp học sâu trong đĩ cĩ mơ hình

BiLSTM vẫn cho thấy tiềm năng hơn.

Đồng thời, với mục tiêu chính của chúng tơi là xây dựng một hệ thống phân tích tình

cảm cho nhiều khía cạnh của một sản phẩm điện ở mỗi bình luận tương ứng, vì vậy

sẽ triển khai lại các mơ hình học sâu LSTM và BiLSTM Cùng với đĩ chúng tơi cũng

áp dụng thêm mơ hình Nạve Bayes, CNN, GRU song song để cĩ thể quan sát, mở

29

Trang 39

rộng và chính xác hơn cho việc phân tích sau này Bằng việc kế thừa những mô hình trước đó, chúng tôi mong muốn kết quả sẽ khả quan, tối ưu và hoàn thiện nhất.

4.4 Các mô hình cơ sở

4.4.1 Học máy truyền thống

Thuật toán Naive Bayes Classification (NBC) [21] là một thuật toán phân loại trong

lĩnh vực máy học, đặc biệt được sử dụng một cách phổ biến trong việc phân loại văn

bản Thuật toán này dựa trên tính toán xác suất và áp dụng định lý Bayes của nhà toán học Thomas Bayes.

Thuật toán NBC giả định rằng các đặc trưng (features) của dữ liệu độc lập tuyến tính

và ảnh hưởng riêng biệt đến kết quả phân loại Điều này làm cho NBC trở thành một thuật toán đơn giản mà hiệu quả.

Quá trình huấn luyện cho thuật toán NBC gồm hai giai đoạn chính: huấn luyện (training) và kiểm tra (testing) Trong giai đoạn huấn luyện, NBC sẽ tính toán các xác suất xảy ra của từng lớp (class) dựa trên tập dữ liệu huấn luyện NBC sử dụng phân phối xác suất của các đặc trưng trong từng lớp dé tính toán xác suất điều kiện P(x|c),

trong đó x là các đặc trưng và c là lớp tương ứng Các xác suất này được ước lượng

từ tập dữ liệu huấn luyện.

Sau khi giai đoạn huấn luyện hoàn thành, NBC sẽ sử dụng các xác suất đã được ước lượng đề phân loại các mẫu dữ liệu mới Trong giai đoạn kiểm tra, NBC tính toán xác

suất hậu nghiệm P(c|x) cho mỗi lớp c dựa trên định lý Bayes Lớp có chỉ số xác suất

hậu nghiệm cao nhất sẽ được chọn là kết quả phân loại của mẫu dữ liệu đó.

Công thức tính xác suất hậu nghiệm P(c|x) dựa trên định ly Bayes :

Tiêu đề	Hệ thống phân tích cảm xúc theo khía cạnh phản hồi khách hàng về điện thoại thông minh
Tác giả	Lê Thị Phương Thanh, Ngô Hồ Bích Trâm
Người hướng dẫn	TS. Đỗ Trọng Hợp, ThS. Lưu Thanh Sơn
Trường học	Trường Đại học Công nghệ Thông tin
Chuyên ngành	Công nghệ thông tin
Thể loại	Khóa luận tốt nghiệp
Năm xuất bản	2023
Thành phố	TP. Hồ Chí Minh

Định dạng
Số trang	79
Dung lượng	32,29 MB

Khóa luận tốt nghiệp Công nghệ thông tin: Hệ thống phân tích cảm xúc theo khía cạnh phản hồi khách hàng về điện thoại thông minh

KET LUẬN VA HUONG PHAT TRIEN