TÓM TẮT KHÓA LUẬNTrong thời kỳ công nghệ hiện đại phát triển, chúng tôi nhận thức được mức độ quan trong cua dir liệu từ các san thương mại điện tử, các trang web da dạng hướng tới các t
Trang 1ĐẠI HỌC QUỐC GIA TP HÒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA KHOA HỌC VÀ KỸ THUẬT THÔNG TIN
LÊ THỊ PHƯƠNG THANH - 19522231 NGO HO BÍCH TRAM - 19522375
KHOA LUAN TOT NGHIEP
HE THONG PHAN TÍCH CAM XUC THEO KHÍA CANH PHAN HOI KHACH HANG VE ĐIỆN THOẠI
THONG MINH
Aspect Based Sentiment Analysis System For Customer
Feedback About Smartphone
CU NHAN NGANH CONG NGHE THONG TIN
GIANG VIEN HUONG DAN
TS DO TRONG HOP ThS LƯU THANH SON
TP HO CHi MINH, 2023
Trang 2LỜI CẢM ƠN
Chúng tôi chân thành gửi đến lời cảm ơn sâu sắc đến hai thầy TS Đỗ Trọng
Hợp và ThS Lưu Thanh Sơn, hai người đã luôn đi cùng chúng tôi, luôn hỏi thăm
và động viên, giải đáp mọi thắc mắc, câu hỏi của chúng tôi trong suốt quá trình
làm khóa luận Hai Thầy không chỉ chia sẻ những kiến thức hữu ích mà còn truyền
cảm hứng và động lực vô tận để chúng tôi vững tin và có được thành công nhất
định trong việc làm khóa luận này.
Chúng tôi cũng muốn gửi đến lời cảm ơn đến tất cả các thầy cô giảng viên
ở Trường Đại học Công nghệ Thông tin, đặc biệt là khoa Khoa học và Kỹ thuật
Thông tin, đã tận tâm chỉ bảo, giảng dạy những kiến thức chuyên ngành và các
kỹ năng quan trọng cho chúng tôi khoảng thời gian 4 năm đại học vừa qua Với
những kiến thức chuyên môn được giảng viên truyền đạt đã giúp ích cho chúng
tôi rất nhiều trong quá trình làm đề tài khóa luận.
Cuối cùng, chúng tôi cũng xin được bay tỏ sự tri ân đến gia đình và bạn
bè, vì luôn đồng hành, động viên, hỗ trợ và đưa ra những lời khuyên hữu ích trong
quãng thời gian mà chúng tôi thực hiện khóa luận này.
Xin chân thành cảm ơn!
Nhóm tác giả
Lê Thị Phương Thanh
Ngô Hồ Bích Trâm
Trang 3MỤC LỤC
Chương 1 TONG QUAN
1.1 Giới thiệu bài toán
1.2 Tầm quan trọng và tính ứng dụng của bài toán
143 Tổng kết
Chương 2 CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN
2.1 Công trình nghiên cứu trên thế giới
2.2 Công trình nghiên cứu ở trong nước
22
22
22
24 25
Trang 44.4.2.1 Mạng tích chap Convolutional Neural Network 31
4.4.2.2 Mạng hồi quy Long Short-Term Memory 32 4.4.3 Mạng hồi quy hai chiều Bidirectional Long Short-Term Memory 33 4.4.4 Kiến trúc mạng nơ-ron Gated Recurrent Unit 34 Chương 5 CÀI ĐẶT, THU NGHIỆM VÀ ĐÁNH GIA 36 5.1 Cài đặt thông số thử nghiệm 36
5.2 Độ đo đánh giá 36
5.3 Kết quả thực nghiệm 37
5.4 Đề xuất cho hệ thống 38 Chương 6 PHAN TÍCH VA THIET KE HE THONG 39 6.1 Phân tích yêu cầu hệ thong 39
6.1.1 Yêu cầu của người dùng 39 6.1.2 Yêu cầu của hệ thống 39 6.2 Thiết kế hệ thống 40
6.2.1 _ Mô hình hoạt động chung 40
6.2.2 Sơ đồ use case tổng quát 41
6.2.3 Danh sách các use case 42 6.2.4 Đặc tả use case 43
6.2.4.1 Đăng nhập / Đăng ký 43
6.2.4.2 Kết qua phân tích 44 6.2.4.3 In và tải kết quả phân tích 48
Chương 7 KET QUA XÂY DỰNG HE THONG 50
Chương 8 KET LUẬN VA HƯỚNG PHÁT TRIEN 65
8.1 Kếtluận 65
Trang 58.2 Hạn chế
8.3 Hướng phát triển
66 66
Trang 6DANH MỤC HÌNH
Hình 1.1: Hệ thống đánh giá của trang web Thế giới di động ở Việt Nam 8Hình 1.2: Hệ thống đánh giá của Vntrip ở Việt Nam 8Hình 4.1: Quy trình thu thập dữ liệu bằng scrapy 26Hình 4.2: Sơ đồ hoạt động của tiền xử lý đữ liệu 26Hình 4.3: Kiến trúc LSTM tiêu chuan 33Hình 4.4: Kiến trúc của mô hình BiLSTM áp dụng lên ABSA tiếng Việt của Phan
Hình 6.6: Sơ đồ UC04 47
Hình 6.7: Sơ đồ UC05 48Hình 6.8: Sơ đồ UC06 49
Hình 7.1: Màn hình chính 52
Hình 7.2: Màn hình Dashboard 01 53
Hinh 7.3: Man hinh Dashboard 02 53
Hinh 7.4: Man hinh Dashboard 03 53
Hinh 7.5: Man hinh Dashboard 04 54
Hình 7.6: Man hình kết quả tra cứu 01 55Hình 7.7: Màn hình kết quả tra cứu 02 55Hình 7.8: Màn hình kết quả tra cứu 03 55Hinh 7.9: Man hinh két qua tra ctru 04 56Hình 7.10: Màn hình kết quả tra cứu 05 56Hình 7.11: Màn hình in kết quả 58Hình 7.12: Màn hình Download kết quả 58
Trang 8DANH MỤC BANG
Bang 3.1: Các hướng dẫn chú thích dé ghi nhãn các khía cạnh và cảm xúc tương
ứng của Phan và các cộng sự [23] 20
Bảng 4.1: Ví dụ về đữ liệu trước và sau khi xử lý 27
Bảng 4.2: Kết quả thực nghiệm về nhận điện khía cạnh của Phan và các cộng sự
[23] (%) 28
Bang 4.3: Kết quả thực nghiệm nhận diện cảm xúc cho khía cạnh của Phan và các
cộng sự [23] (%) 29
Bảng 5.1: Kết quả thực nghiệm nhận diện cảm xúc cho khía cạnh (%) 38
Bảng 6.1: Bảng danh sách các actor và mục tiêu 42
Bang 7.1: Bang so sánh tốc độ xử lý của thu thập dir liệu 51
Bảng 7.2: Bảng đo tốc độ xử lý của 5 điện thoại tiêu biểu 51Bảng 7.3: Bảng thông tin chỉ tiết màn hình chính 52
Bảng 7.4: Bảng thông tin chỉ tiết màn Dashboard 54
Bảng 7.5: Bảng thông tin chỉ tiết màn tra cứu kết quả 56
Bảng 7.6: Bảng thông tin chỉ tiết màn in kết quả và màn FAQ 59Bang 7.7: Bảng thông tin chỉ tiết màn đăng nhập, đăng ký, quên mật khâu 61
Bang 7.8: Bang thông tin chỉ tiết man profile 62
Bang 7.9: Bang thông tin chỉ tiết màn so sánh 63
Trang 96 BiLSTM Bidirectional Long Short-Term Memory
7 CNN Convolutional Neural Network
8 FE Front End
9 GRU Gated Recurrent Unit
10 GUI Graphical User Interface
11 LSTM Long Short-Term Memory
12 NLP Natural Language Processing
13 OTE Opinion Target Expression
14 SP Sentiment Polarity
Trang 10TÓM TẮT KHÓA LUẬN
Trong thời kỳ công nghệ hiện đại phát triển, chúng tôi nhận thức được mức độ
quan trong cua dir liệu từ các san thương mại điện tử, các trang web da dạng hướng
tới các thiết bị điện tử đặc biệt là điện thoại di động nên đã quyết định xây dựng hệthống phân tích bình luận cảm xúc của người dùng về điện thoại di động dựa trên tập
dữ liệu tiếng Việt UIT-ViSFD bao gồm 11.122 nhận xét của người dùng dé giải quyết
nhiệm vụ phát hiện khoảng đánh giá trong phân tích tình cảm, cảm xúc dựa trên
phương diện khía cạnh.
Ngoài ra, chúng tôi thực hiện thu thập dir liệu thật, thực hiện tiền xử ly dữ liệu,
sau đó sử dụng lại các phương pháp thuật toán thuộc lĩnh vực học máy và học sâu.
Sau khi thực thi, kết quả vượt trội nhất mà chúng tôi đạt được thuộc về thuật toán
BiGRU + FastText, đạt tỷ lệ Fl-score 72.83% trên tac vụ phân loại cảm xúc cho khía
cạnh Kết qua này đã mang lại sự khích lệ và động lực lớn lao cho chúng tôi trongquá trình phát triển các giải pháp và ứng dụng cho bài toán này Bên cạnh đó, chúng
tôi cũng đưa ra nhiều phương pháp khác dé nâng cấp hệ thống sao cho hoàn thiện
hơn.
Dựa trên những gì đã có được của thuật toán BiGRU, chúng tôi đã xây dựng một hệ thống phân tích bình luận cảm xúc cho nhiều khía cạnh của sản phẩm điện
thoại đi động nhằm cung cấp cái nhìn tổng thê hơn về phân loại cảm xúc và các khía
cạnh liên quan Hệ thống này sẽ hiển thị rõ hơn về tính ứng dụng và tiềm năng của
việc đưa phương pháp phân tích dé giải quyết vấn đề cảm xúc trong lĩnh vực điện
thoại di động.
Trang 11Việt Nam đứng trong nhóm 10 quốc gia có mức sử dụng điện thoại di động
cao nhất trên thế giới Theo thống kê từ Cục Viễn thông (Bộ TT-TT), tính đếnđến tháng 3/2022, đã có hơn 2 triệu thuê bao mới được đăng ký, nâng tổng số
thuê bao sử dụng điện thoại di động từ 91,3 triệu lên 93,5 triệu Và người ta
dự đoán khoảng 73,5% tỷ lệ người trưởng thành đã và đang sử dụng điện thoại.
Tuy nhiên, để có thể đưa ra lựa chọn thông minh, người dùng cần phải tìmhiểu rõ và có cái nhìn tông quát nhất về sản phâm mà họ quan tâm Nhờ vào
sự tiến bộ của Internet, việc tra cứu và đánh giá các sản phẩm đã trở nên dễ
dàng và thuận tiện hơn Người dùng có thê tìm thấy các bình luận, đánh giá vànhận xét từ nhiều người khác trên các trang web bán lẻ, từ đó có thể đưa rađánh giá, quyết định chính xác hơn về sản phẩm mà họ quan tâm Điều này
không chỉ tạo ra lợi ích cho người dùng mà còn cho các doanh nghiệp và nhà
sản xuất điện thoại di động Thế nhưng, mỗi sản phẩm tương ứng sẽ có rấtnhiều bình luận đánh giá đi kèm, việc thu thập các đánh giá này dé phân tích
và đưa ra lựa chọn cũng phát sinh ra vấn đề khác Có rất nhiều bình luận đánhgiá đến từ nhiều phía người dùng khác nhau, dé phân loại chúng và đánh giá
những bình luận này một cách khách quan thì cũng là cả một quá trình lâu dài.
Hiéu được yêu câu va tính kha dụng của vân đê nay, chúng tôi tiên hành áp
dụng phân tích cảm xúc dựa trên khía cạnh vào Tiếng Việt đặc biệt là những
Trang 12khía cạnh đến từ các hãng điện thoại khác nhau Hơn thế nữa là mục tiêu hàng
đầu của chúng tôi trong khóa luận này sẽ xây dựng hệ thống phân tích bình
luận cảm xúc của người dùng về điện thoại thông minh dựa trên tập đữ liệu
tiếng Việt, nhằm phục vụ cho việc phân tích cảm xúc dựa trên khía cạnh từcác bình luận về điện thoại thông minh
Mục tiêu khóa luận:
Chúng tôi tập trung xây dựng hệ thống phân tích bình luận cảm xúc của người dùngliên quan đến điện thoại thông minh dựa trên thời gian thực Chúng tôi đã đặt ra các
mục tiêu sau:
- _ Thứ nhất, chúng tôi xây dựng hệ thông phân tích bình luận cảm xúc của người
dùng về điện thoại thông minh dựa trên thời gian thực va do thời gian thực thi
của hệ thống
- Thứ hai, chúng tôi tiễn hành cài dat, thử nghiệm lại các phương pháp học sâu
trên bộ dữ liệu, đánh giá và phân tích kết quả đề tìm ra mô hình nào phù hợpvới hệ thống phân tích cảm xúc cho khía cạnh
- _ Thứ ba, chúng tôi đưa ra một số đề xuất trong tương lai cho bài toán phát hiện
khoảng ý kiến Tiếng Việt và từ đó đưa ra các dé xuất dé cải tiền hệ thống
Doi tượng và phạm vi thực hiện:
Đối tượng: Hệ thống phân tích cảm xúc dựa trên khía cạnh, tổng hợp bình luận, đánhgiá về một sản phẩm điện thoại bất kỳ, đánh giá chất lượng sản phâm
Pham vi thực hiện: Đề tài tập trung chủ yếu vào xây dựng hệ thống phân tích cảmxúc trên tiếng Việt, cụ thể giới hạn trên bài toán phát hiện khoảng ý kiến cho phân
tích cảm xúc dựa trên khía cạnh của bình luận.
Kết quả thực hiện:
Khóa luận của chúng tôi đạt được các kết quả như sau:
- _ Thực hiện crawl dữ liệu thật từ các trang web : thegioididong, fptshop nhằm
thu thập dữ liệu về thông tin điện thoại, tất cả comments từ người dùng
Trang 13- _ Thực hiện xây dựng hệ thống phân tích bình luận cảm xúc của người dùng về
điện thoại thông minh, thu thập và xử lý dữ liệu trong thời gian thực, đo thời
gian thực thi của hệ thống
- _ Thực hiện cải tiến tiền xử lý dữ liệu và thực thi lại các mô hình chạy trên bộ
dữ liệu UIT-ViSFD về nhận diện cảm xúc cho khía cạnh của bình luận về điện
thoại thông minh, kết quả nhận được cao hơn đáng kê trong đó có mô hình
BiGRU đạt F1-Score 72.83%.
- Dé xuất trong tương lai cho bài toán phát hiện khoảng ý kiến Tiếng Việt và
đánh giá ưu nhược điểm của hệ thống từ đó đưa ra các đề xuất dé cải tiến pháttriển hệ thống
Cấu trúc:
Khóa luận gồm 8 phần với các nội dung chính như sau:
Chương 1: Tổng quan
Mô tả ban đầu về bài toán phân tích cảm xúc dựa trên phương diện khía cạnh, tầm
quan trọng của kỹ thuật phân tích cảm xúc dựa trên khía cạnh và khả năng áp dụng
trong các dịch vụ, hệ thống.
Chương 2: Các công trình nghiên cứu liên quan
Mô tả khái quát một số công trình nghiên cứu nổi bật trong và ngoài nước liên quanđến các cách thức xây dựng dữ liệu và các phương pháp giải quyết bài toán phân tích
cảm xúc dựa trên khía cạnh.
Chương 3: Bộ dữ liệu nghiên cứu
Trình bày khái quát lại về bộ dữ liệu UIT-ViSED
Chương 4: Các phương hướng tiếp cận
Trình bày quá trình thu thập dữ liệu thật, các phần xử lý đữ liệu trước khi trainingmodel và đề xuất các phương pháp sẽ được thực nghiệm
Chương 5: Cài đặt, kiểm tra và đánh giá hiệu qua
Trang 14Đưa ra các cách đánh giá, các bước cài đặt thông số và phân tích các trường hợp giải
thích cho kết quả đạt được
Chương 6: Phân tích, thiết kế hệ thống
Mô tả hiện trạng, phân tích yêu cầu và cách tạo ra hệ thống, đánh giá hệ thống.
Chương 7: Kết quả triển khai hệ thống
Chúng tôi xây dựng hệ thống phân tích cảm xúc cho nhiều khía cạnh trên điện thoại
thông minh.
Chương 8: Kết luận và hướng phát triển
Tổng hợp kết quả đạt được, từ đó đưa ra các đề xuất, gợi ý một số hướng phát triển
tiêm năng đê nâng cao hiệu suât của hệ thông.
Trang 15Chương 1 TONG QUAN
1.1 Giới thiệu bài toán
Trong lĩnh vực xử lý ngôn ngữ tự nhiên (NLP) có rất nhiều bài toán liên quan trong
đó có bài toán phân tích cảm xúc dựa trên khía cạnh là một lĩnh vực đang được khám
phá và nghiên cứu Nó nhằm mục đích phân tách và hiểu cảm xúc của các đoạn vănbản dựa trên các khía cạnh cụ thé Trong quá trình phân tích cảm xúc truyền thống,
mục tiêu chính là xác định và nhận diện các nhãn cảm xúc chung như tích cực, tiêu
cực hoặc trung lập của một đoạn văn bản Chúng ta thu thập các nhận xét về các khía
cạnh của điện thoại và các cảm xúc của khía cạnh đó từ các bình luận xoay quanh sản
phẩm đó của những người đã và đang sử dụng Người đang có nhu cầu mua có thể
tham khảo những nhận xét đó và lựa chọn được điện thoại sẽ phù hợp với nhu cầucủa họ Hay về phía các công ty sản xuất điện thoại, các nhà phân phối bán lẻ, từ nhậnxét của khách hàng đánh giá liên quan tới sản phẩm, họ có thể đưa ra biện pháp,cảitiễn nhằm khắc phục hay cải thiện những điểm chưa tốt và từ đó cải thiện sản phẩmtốt hơn Bài toán ABSA gồm ba nhiệm vụ chính là: phát hiện khía cạnh (AD), biểuthị mục tiêu ý kiến (OTE) và phân tích cảm xúc (SP) Và bài toán của chúng tôi tậptrung xây dựng hệ thống phân tích bình luận cảm xúc của người dùng về điện thoại
thông minh.
Mô tả bài toán:
Đầu vào: Bình luận của khách hàng về điện thoại thông minh trên nhiều trang web
khác nhau.
Đầu ra: Một hoặc nhiều khía cạnh, mỗi khía cạnh là mang một nhãn cảm xúc (tích
cực, tiêu cực, trung lập) tương ứng trong mỗi bình luận.
1.2 TẦm quan trọng và tính ứng dụng của bài toán
Ngày nay, người dùng đóng vai trò chủ chốt trong trải nghiệm của khách hàng đối
với sản phâm trên các nên tảng, các cửa hàng, các trang mua bán online Nhờ vào kỹ
Trang 16thuật ABSA, việc thu thập những bình luận đánh giá từ người dùng đối với các sảnphẩm trên các trang này đã trở nên thuận tiện va dé dang hơn bao giờ hết Nếu mộttrang thương mại điện tử có ứng dụng công nghệ ABSA, khách hàng có thé tập trungxem các nhận xét mà họ quan tâm bằng cách lựa chọn khía cạnh mà họ muốn tìmhiểu Thêm vào đó, ABSA cho phép các doanh nghiệp thực hiện các công việc nhưtheo dõi, giám sát và đánh giá chất lượng sản phâm và dịch vụ của doanh nghiệp họ.
Phương pháp ABSA đã được áp dụng rộng rãi trên thế giới để cải thiện trải nghiệm
khách hang như Amazon dùng dé phân tích những đánh giá, nhận xét của khách hàng
đối với sản phẩm và thu thập thông tin về cảm xúc của họ một cách chỉ tiết và đadạng: TripAdvisor tập trung vào việc thu thập những phản hồi và đánh giá của kháchhàng đối với các địa điểm và dịch vụ du lich, Vi vậy, tiềm năng của kỹ thuật ABSAtrong lĩnh vực này là rất lớn Mặt khác, các trang thương mại điện tử ở Việt Nam vẫn
cung cấp khá ít thông tin cho người dùng Đa số các nền tảng ở Việt Nam vẫn dùng
một hệ thong danh gia don gian: khach hang dé lại bình luận trên hệ thống và mộtđánh giá trên thang điểm 5 sao, kèm theo hình ảnh (nếu có) như ví dụ ở hình 1.1.Những nền tảng cung cấp hệ thống như thé có thé ké đến như thegioididong, fptshop,shopee, lazada, Vntrip, một nền tảng đánh giá khách sạn và điểm đến du lịch, đemđến sự khác biệt, mới lạ, độc đáo so với các phần còn lại bằng việc khuyến khíchngười dùng có thé chia sẻ quan điểm của ho và ý kiến cá nhân bằng cách việc dé lại
bình luận và đánh giá trên thang điểm 10 và cung cấp điểm số trên một số khía cạnh
cụ thể (địa điểm, giá cả, chất lượng, nhân viên, dịch vụ và không gian) như ví dụ ở
hình 1.2 Ở lĩnh vực điện thoại thông minh, vẫn chưa có trang web nào có tính năng
đánh giá trên khía cạnh cụ thê và có vô số bình luận đánh giá thường không nhận xét
chú trọng vào sản phẩm mà người dùng chỉ nhận xét mông lung và không nhắc đếnmột khía cạnh nào một cách cụ thé rõ ràng Nhận thấy điều đó, chúng tôi mong muốn
xây dựng hệ thống phân tích bình luận cảm xúc của người dùng cho ABSA, không
chỉ phát hiện về nhiều khía cạnh và cảm xúc mà còn tổng hợp các ý kiến đánh giá của
người dùng về điện thoại đó từ nhiêu nguôn khác nhau.
Trang 17Đánh giá Điện thoại Samsung Galaxy A53 5G 128GB
f Hữu ích Q Thảo luận
Nguyễn Anh Thư @@ Đã mua tai TGDD
*~x*w#**
Hàng chất lượng
1 Hữu ích Q Thảo luận ã dùnc
Hình 1.1: Hệ thống đánh giá của trang web Thế giới di động ở Việt Nam
+ Lễ tân Duyên nhiệt tình chu đáo.
Ẩn danh
18/09/2021
Rất tốt Tốt Hài lòng
ok kok
*x+*+*%
wk kk
kkk kkk kkk
—
9.5
ake
9.5
+ Phòng nghỉ sạch, đẹp, tiện nghi, giường ngủ siu to khủng lồ &, view ok, nhà tắm trong suốt, di cùng ban trai bao thik, bao phê &, chị Huệ buồng phòng phục vụ
rất tử tế, bạn Duyên lễ tân thì rat ân cần Tuyệt vời, sẽ quay lại để review về hồ bơi và giới thiệu cho nhiều bạn bè khác a i+ &=
Hình 1.2: Hệ thống đánh giá của Vntrip ở Việt Nam
Trang 181.3 Tông kết
Trong nhiều lĩnh vực như kinh tế, xã hội và giáo dục thì việc phân nhóm và đánh giácảm xúc trong văn bản đóng một vai trò ngày một quan trọng và có tầm ảnh hưởng
to lớn Trên mạng xã hội, phân loại nhanh chóng các bình luận tiêu cực giúp quản trị
viên tạo môi trường không gian mạng “sạch đẹp” cho người dùng Đồng thời, việckhám phá và sử dụng các phương pháp phân lớp học sâu đóng vai trò cốt lõi trongviệc cải tiến kết quả phân loại và làm giàu nguồn tài nguyên dữ liệu ngôn ngữ tiếngViệt trong cộng đồng nghiên cứu Chính vì vậy, hệ thống của chúng tôi có tiềm nănggiúp đỡ nhiều người va áp dụng không chỉ trong đánh giá điện thoại ma còn cho nhiều
lĩnh vực trong xã hội Với mục tiêu nghiên cứu nay, chúng tôi sẽ thực hiện nghiên
cứu các phương pháp phân lớp học sâu, thực hiện triển khai, áp dụng và tinh chỉnhchúng dé đạt được kết quả phân loại cải thiện hơn
Trang 19Chương 2 CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN
Với những bước tiến phát triển không ngừng của các kỹ thuật học sâu và học chuyên
tiếp, bài toán phân tích cảm xúc đã đạt được thành tựu nhất định và được coi là hoànthiện Việc này đã thu hút sự quan tâm rộng rãi từ cả cộng đồng học giả và doanhnghiệp đối với việc nghiên cứu và ứng dụng phân tích cảm xúc dựa trên các yếu tốkhác nhau Việc phân tích cảm xúc dựa trên khía cạnh không chỉ mang lại nhiều thách
thức, mà còn có vai trò quan trọng và có ảnh hưởng to lớn trong nhiều lĩnh vực khác
nhau.
2.1 Công trình nghiên cứu trên thế giới
Thay vì sử dụng máy học và xử lý ngôn ngữ tự nhiên, một cách khác dé khai thác ditliệu văn bản là sử dụng phương pháp truy van và phân loại thủ công Trong phương
pháp này, người dùng hoặc nhóm người sẽ thực hiện việc đọc và phân loại các câu
theo chủ đề hoặc nội dung tương ứng Trong quá trình này họ đọc và hiểu nội dung
của mỗi văn bản, sau đó đưa ra các nhãn hoặc phân loại chúng vào các danh mục
tương ứng Ví dụ, nếu bạn đang nghiên cứu về y học, bạn có thể đọc qua các văn bản
y học và phân loại chúng thành các danh mục như "bệnh ly", "phương pháp điều trị",
"nghiên cứu lâm sàng", vv Phương pháp truy vấn và phân loại thủ công tuy tốn nhiều
thời gian và công sức, nhưng nó giúp họ có thể kiểm soát tính chính xác hơn về quá
trình phân loại đữ liệu Điều này đặc biệt có ích khi dữ liệu văn bản không lớn và độchính xác cao là yếu tố quan trọng Tuy nhiên, chúng không thể xử lý được quy mô
lớn hoặc tự động hóa trong quá trình khai thác dữ liệu Vì vậy, việc áp dụng học máy
va xử lý ngôn ngữ tự nhiên vẫn được coi là một phương pháp phổ biến và hiệu quả
hơn.
(1) Trước đây, hầu hết các phương pháp tiếp cận vào đánh giá cảm xúc tong thê
của một câu hoặc một đoạn văn bản mà không xem xét các khía cạnh cụ thé
được dé cập SemEval (Semantic Evaluation) là một hội thao hằng năm trong
lĩnh vực xử lý ngôn ngữ tự nhiên, nơi có mục đích đánh giá và so sánh hiệu
10
Trang 20quả của các phương pháp và công nghệ trong các tác vụ liên quan với ngôn ngữ Vào năm 2014, SemEval đã giới thiệu nhiệm vu ABSA dựa trên khía
cạnh Mục tiêu của nhiệm vụ này là xác định các khía cạnh của các mục tiêu
cụ thê và phân loại cảm xúc liên quan đến từng khía cạnh SE-ABSA14 [9]cung cấp hai tập dữ liệu, mỗi tập dành riêng cho lĩnh vực máy tính xách tay
và nhà hàng Tập dữ liệu nhà hàng gồm hơn 3.000 câu đánh giá tiếng Anh
từ các bài đánh giá về nhà hàng, được chỉnh sửa và gán nhãn thủ công Tập
dữ liệu máy tính xách tay gồm hơn 3.000 câu đánh giá tiếng Anh từ khách
hàng về máy tính xách tay, chỉ bao gồm nhãn khía cạnh và cảm xúc Năm
2015, nhiệm vụ ABSA của SemEval (SE-ABSA15) [8] tiếp tục tập trung
vào các lĩnh vực nhà hàng và máy tính xách tay Tuy nhiên, khác với
SE-ABSAI4, bộ dữ liệu của SE-ABSA15 bao gồm toàn bộ đoạn văn bản đánh
giá thay vì chỉ các câu đánh giá Mục tiêu là phân tích cảm xúc theo khía
cạnh trong các đoạn văn bản đánh giá Trong năm 2016, nhiệm vụ ABSA
của SemEval (SE-ABSA16) [7] mở rộng bang cách cung cấp bộ dit liệu thửnghiệm mới đa dạng từ nhiều ngành khác nhau như máy tính xách tay, nhà
hàng và khách sạn Ngoài ra, SE-ABSA16 cũng đưa ra bộ dữ liệu được đa
ngôn ngữ hóa, không chỉ giới hạn trong tiếng Anh được áp dụng cho mọingôn ngữ trong từng miền
Các nhiệm vu ABSA của SemEval đã tạo điều kiện cho các chuyên gia nghiên
cứu tham gia thử nghiệm và đánh giá tính hiệu quả của các phương pháp này.
(2) Một phương pháp được đề xuất bởi Wang và đồng nghiệp [15] đã sử dụng
mô hình LSTM với cơ chế chú ý (attention-based LSTM) đề thực hiện phânloại cảm xúc ở cấp độ khía cạnh Trong nghiên cứu này, LSTM được thiết
kế dé học cách nhúng thông tin về khía cạnh và đồng thời đánh giá mức độ
quan trọng của chúng trong việc phân loại cảm xúc Nghiên cứu này đã dùng
tập dữ liệu SE-ABSA14, gồm hơn 6.000 câu đánh giá được gan nhãn thủ
công trong lĩnh vực máy tính xách tay và nhà hàng Kết quả đạt được cho
nhiệm vụ phân loại cảm xúc ở cap độ khía cạnh là 84% độ chính xác Đôi
11
Trang 21với việc phân loại cảm xúc cho các thuật ngữ khía cạnh, LSTM đạt kết quả
77,2% độ chính xác trên dữ liệu nhà hàng và 68,9% trên dữ liệu máy tính
xách tay.
Kết quả của nghiên cứu nay đã minh chứng tính hiệu qua đáng ké của mô hìnhLSTM kết hợp với cơ chế chú ý trong việc phân loại cảm xúc ở cấp độ khíacạnh Phương pháp này đã có sự đóng góp rất nhiều vào việc cải thiện khả năng
hiểu và phân tích cảm xúc trong các văn bản, có thể ứng dụng rộng rãi trong
nhiều lĩnh vực, bao gồm đánh giá sản phâm, phản hồi từ khách hang và quản lý
quan điêm công chúng.
(3) Trong nghiên cứu của Sun và đồng nghiệp [2], họ đã giới thiệu một phương
pháp khác đề phân loại cảm xúc theo cặp câu trong bài toán ABSA Phươngpháp này chuyên trọng tâm từ việc phân tích từng khía cạnh đơn lẻ sang việcxây dựng câu bồ trợ từ khía cạnh và thực hiện phân loại cảm xúc dựa trêncác cặp câu Họ đã tinh chỉnh mô hình BERT dé thích ứng với nhiệm vụ
phân loại theo cặp câu trên hai bộ dữ liệu là SentiHood và SE-ABSA14 Với
SE-ABSA14, phương pháp đạt được 92,18% Fl-score cho việc phát hiện
khía cạnh Ở bộ đữ liệu SentiHood, phương pháp đạt được 87,9% F1-scorecho việc phát hiện khía cạnh Các phương pháp mới và tiếp cận sáng tạo nhưviệc sử dụng BERT và xây dựng câu bồ trợ từ khía cạnh đã đạt được nhữngkết quả đáng chú ý, tăng cường hiệu suất và cải thiện độ chính xác trong việcphân loại cảm xúc ở cấp độ khía cạnh
Điều này thể hiện tầm quan trọng và tiềm năng trong việc hiểu và phân tích ýkiến người dùng từ các nguồn dữ liệu văn bản
(4) Tác giả Yang và đồng nghiệp [16] đã tiến hành đề xuất một phương pháp
tiên tiến để xử lý vấn đề trích xuất khía cạnh thuật ngữ trong phân tích cảm
tính Thay vì chỉ sử dụng một mô hình nơ-ron duy nhất, họ đã kết hợp hai
mô hình khác nhau dé tận dụng thông tin cú pháp Y tưởng cốt lõi là sử dụngconstituency tree để nhận thông tin cú pháp rõ ràng Từ constituency tree,
các mạng câu thành được trích xuât và mã hóa trong hai mô hình nơ-ron
12
Trang 22khác nhau: BiLSTM-CRF và BERT Mô hình BiLSTM-CRF được sử dụng
để mã hóa thông tin cú pháp từ các cụm từ khía cạnh Đây là một mô hìnhthần kinh nhúng được sử dụng đề xử lý chuỗi và dự đoán nhãn theo trình tự
Mô hình này giúp trích xuất các cụm từ khía cạnh và xác định nhãn phù hợpcho chúng Mô hình BERT dùng để mã hóa thông tin cú pháp từ cây phântích cú pháp Bằng cách sử dụng BERT, ta có thể khai thác thông tin về ngữ
nghĩa và cú pháp dé trích xuất khía cạnh Kết qua cho thay phương pháp củaYang và đồng nghiệp vượt qua các phương pháp hiện đại khác với độ chính
xác cao đạt được F1-Measure 1,35 điểm
(5) Yukun Ma và đồng nghiệp [11] đã giới thiệu một phương pháp tiên tiến để
vượt lên trên các thách thức trong việc phân tích tình cảm dựa trên khía cạnh
và phân tích tình cảm có mục tiêu bằng cách khai thác kiến thức chung.Trong nghiên cứu này, họ đã đưa ra một giải pháp độc đáo gắn kết kiến thứcthông thường vào một mạng bộ nhớ dài ngắn (LSTM) có cơ chế chú ý, tậptrung vào cấp độ mục tiêu và cấp độ câu Ý tưởng chính là tích hợp tri thứcthông thường vào quá trình phân tích tình cam dé cung cấp cho mô hình mộthiểu biết rộng hơn về thé giới thực và từ đó cải thiện khả năng dự đoán tìnhcảm Dé tích hợp kiến thức chung vào quá trình mã hóa, nhóm tác giả đã đềxuất phiên bản mở rộng của LSTM, gọi là Sentic LSTM Thử nghiệm đã
được thực hiện trên hai bộ dữ liệu công khai và đã cho thấy những kết quả
thực sự tốt Sự kết hợp giữa kiến trúc chú ý được đề xuất và Sentic LSTM
đã vượt qua các phương pháp hiện đại khác trong việc phân tích tình cảm
dựa trên khía cạnh.
(6) Trong nghiên cứu của Hu và các cộng sự [6], được lấy cảm hứng từ các bước
tiến trong lĩnh vực đọc hiểu tự động và trả lời câu hỏi [10], họ đề xuất một
framework trích xuất-sau đó phân loại dựa trên khoảng cho phân tích tìnhcảm dựa trên khía cạnh Ý tưởng chủ đạo của nghiên cứu là tận đụng phương
pháp trích xuất và phân loại dựa trên khoảng trong các ngữ cảnh đữ liệu mở
Cụ thể, họ tập trung vào việc trích xuất các khoảng ý kiến mục tiêu từ văn
13
Trang 23bản, sau đó phân loại cảm xúc tương ứng của chúng Có ba cách tiếp cận
bao gồm mô hình pipeline, mô hình joint và mô hình thu gọn, mỗi mô hình
có cách tiếp cận và quy trình riêng Công trình này mang lại những ứng dụng
quan trọng từ các tiến bộ trong lĩnh vực đọc hiểu tự động và trả lời câu hỏi.Mục tiêu nhằm phát hiện khoảng trong văn bản mà có thé trở thành câu trả
lời cho câu hỏi được đặt ra [12], [21].
(7) Liu và các cộng su [5] tập trung vào việc phân loại tình cảm dựa trên khía
cạnh bằng cách sử dụng hai cơ chế tăng cường chú ý Các cơ chế này bao
gồm cơ chế chú ý cấp độ câu và cơ chế chú ý ngữ cảnh, nhằm nắm bắt thôngtin quan trọng về các khía cạnh từ quan điểm toàn cầu và xem xét thứ tự vàmỗi liên kết giữa các từ Mô hình được đề xuất các cơ chế phân loại tình cảm
dựa trên khía cạnh trước đây, tập trung vào xác định các từ cảm xúc hoặc
chuyên đổi mà không xem xét mức độ liên quan của chúng đối với các khíacạnh cụ thể trong câu Điều này tạo ra thách thức khi xử lý các câu đa nghĩa
và câu có cấu trúc phức tạp Đề giải quyết thách thức này, họ đã tích hợp các
cơ chế chú ý cấp độ câu và chú ý ngữ cảnh vào mô hình, cho phép modeltập trung vào mức độ liên quan của từng từ đối với các khía cạnh đã chotrong câu Thông qua việc tích hợp các cơ chế chú ý đề xuất, mô hình đãvượt qua các mô hình phố biến hiện có và đem đến kết quả tốt hơn trong
việc phân loại tình cảm theo khía cạnh, như đã được minh chứng qua các
thử nghiệm Các cơ chế chú ý trong model đóng vai trò thiết yêu trong việcnăm bắt thông tin liên quan và xử lý các câu có tính đa nghĩa và cấu trúc
phức tạp Nghiên cứu này có ý nghĩa quan trọng đối với việc phát triển trong
lĩnh vực phân loại tình cảm dựa trên khía cạnh bằng cách đề xuất các cơ chế
chú ý hiệu quả.
2.2 Công trình nghiên cứu ở trong nước
Trong thời gian gần đây, Việt Nam đã va đang day mạnh công cuộc phát triển trong
ngành công nghệ dữ liệu lớn Dữ liệu văn bản ngày càng trở nên phô biên rong rãi và
14
Trang 24đa dạng, xuất hiện trên nhiều nguồn thông tin như thương mại điện tử, mạng xã hội,
website và các khảo sát Điều này tạo ra một kho tài nguyên quý giá có những thông
tin hữu ích, nhưng song song với đó cũng tạo ra một thách thức khó khăn trong việc
hiệu quả hóa quá trình trích xuất và phân loại dữ liệu văn bản Ở Việt Nam, việc xử
lý ngôn ngữ tự nhiên đang tập trung vào hai vấn đề chính: phân loại và quản lý bìnhluận trên mạng xã hội, cùng với phân tích dit liệu khách hàng trong lĩnh vực mua sắmonline Nói về khía cạnh nguồn di liệu, Tiếng Việt chưa có số lượng lớn các bộ dữ
liệu được khai thác và chia sẻ trong cộng đồng nghiên cứu Đồng thời, dé thích ứng
và ứng dụng các thuật toán và mô hình một cách hiệu quả, cần tiếp tục nghiên cứu vàtối ưu hóa dé đáp ứng yêu cầu đặc thù của Tiếng Việt và cấu trúc phức tạp của ngônngữ này Tuy nhiên đã có không ít nghiên cứu nổi bật trong lĩnh vực này có thé kế
đến như:
(1) Mai và cộng sự [24] đã tập trung vào việc phân tích cảm xúc dựa trên các
nguyên tắc cơ bản của ABSA cho tiếng Việt Trong nghiên cứu này, họ đã tiếnhành cùng nhau thu thập một tập dé liệu chứa đánh giá của người dùng về điệnthoại thông minh Sau đó, họ đã xây dựng một bộ dữ liệu ABSA tiếng Việt vớitong cộng 2.098 câu nhằm mục đích trích xuất mục tiêu ý kiến (OTE) va phântích cảm xúc Trong phần thực hiện, tác giả đã đề xuất một phương pháp sửdụng sơ đồ gắn nhãn trình tự kết hợp với BRNN va CRF Phương pháp nàynhằm mục đích trích xuất các mục tiêu ý kiến đồng thời phát hiện cảm xúc
tương ứng của ý kiến Qua các thử nghiệm trên bộ dữ liệu này, model
BRNN-CRF đã đạt được độ chính xác cao, với điểm F1-15 đạt 71,79%, vượt trội hơn
so với phương pháp CRF sử dụng các đặc trưng được thiết kế thủ công, với
điểm F1-score chỉ đạt 54,91%
(2) Trong nghiên cứu của Dang va đồng nghiệp [26], họ đưa ra một bộ dữ liệu độc
dao ở mức độ câu được chú thích có mức đồng thuận cao, nhằm phân tích tìnhcảm dựa trên nhiều khía cạnh trong lĩnh vực nhà hàng và khách sạn bằng tiếng
Việt Kho tài liệu mà nhóm nghiên cứu xây dựng gồm 10.005 câu đánh giá vềkhách sạn và 9.737 câu đánh giá về nhà hàng Nghiên cứu này cũng phát hiện
15
Trang 25hiệu quả của các mô hình học máy đa nhiệm và đơn nhiệm, trong đó kiến trúc BERT đạt kết quả tốt nhất với F1-score lần lượt là 86,96% và 79,10% trong phát hiện khía cạnh, và F1-score lần lượt là 74,88% và 73,69% trong phân loại
cảm xúc Ngoài ra, còn có bộ dữ liệu VLSP 2018 [20] từ cuộc thi ABSA shared-task tổ chức bởi VLSP vào năm 2018, cũng tập trung vào lĩnh vực nhà hàng và khách sạn.
(3) Năm 2018, VLSP (The Vietnamese Language and Speech Processing) đã giới
thiệu nhiệm vụ ABSA (Aspect-Based Sentiment Analysis) đầu tiên tại Việt Nam [20] Nhiệm vụ này tập trung vào việc phân tích tình cảm dựa trên khía
cạnh trong lĩnh vực nhà hàng và khách sạn VLSP 2018 đã thu thập một bộ dữ liệu ABSA tiếng Việt từ một trang web đánh giá online, bao gồm các đánh giá
về nhà hang và khách sạn Bộ dit liệu ABSA của VLSP 2018 được chia thành
6 nhãn cho các đối tượng và 5 nhãn cho các thuộc Tuy nhiên, bộ dữ liệu này
chỉ tập trung vào việc phân loại entity# attribute và cảm xúc, bỏ qua nhiệm vụ phát hiện opinion target Tổng quan, VLSP 2018 đã đóng góp quan trọng trong việc xử lý ngôn ngữ tự nhiên tiếng Việt, đặc biệt là trong lĩnh vực ABSA.
(4) Binh Le-Minh và các cộng sự [19] đã hợp tác dé xây dựng bộ đữ liệu VECD
cho bài toán ABSA trên lĩnh vực công nghệ và Mẹ & bé Bộ dữ liệu này bao gồm tổng cộng 12,240 câu được thu thập từ hai trang mua sắm online Shopee
va Tiki Trong VECD, họ đã thu thập 3,016 câu về lĩnh vực Mẹ & bé từ Shopee
và 2,986 câu từ Tiki Đối với lĩnh vực công nghệ, họ đã thu thập 3,002 câu từ
Shopee và 3,236 câu từ Tiki Quá trình xây dựng bộ dữ liệu VECD được thực hiện bằng tay Sau khi xây dựng VECD, nhóm nghiên cứu đã áp dụng các mô
hình học sâu kết hợp với các lớp phân loại của các mô hình khác như Random
Forest, Decision Tree và SVM Kết quả cao nhất đạt được trên hai độ đo
Micro-Avg và Macro-Avg là 95% Ngoài ra, họ cũng đã kết hợp phoBERT
với các model học sâu khác như CNN Phương pháp kết hợp giữa các mô hình học sâu và các lớp phân loại khác nhau đã mang lại kết quả ấn tượng, và hiệu
16
Trang 26quả của việc kết hợp phoBERT với mô hình CNN cũng được chứng minh
trong việc phân tích ý kiến và đánh giá
(5) Phan và các cộng sự [23] đã tiễn hành nghiên cứu về phân tích cảm xúc dựa
trên khía cạnh (ABSA) bằng cách xây dựng bộ dit liệu UIT-ViSFD Ho đã sửdụng bộ dữ liệu này dé huấn luyện và đánh giá hiệu suất của SA2SL SA2SL
sử dụng một kiến trúc học sâu (Deep Learning) có tên là BiLSTM kết hợp vớifastText word embedding dé thực hiện phân tích cảm xúc và phát hiện khíacạnh trong các bình luận về điện thoại đi động trên các nên tảng thương mại
online Kết quả nhận được của SA2SL cho thay hiệu suất tốt với F1-score đạtđược là 84,48% về phát hiện khía cạnh và 63,06% về phát hiện cảm xúc theokhía cạnh trên bộ dữ liệu UIT-ViSFD Hệ thống SA2SL được hy vọng sẽ demlai lợi ích đáng kể trong việc phân tích dữ liệu xã hội và cung cấp các thôngtin giá trị cho các doanh nghiệp trong quá trình ra quyết định va theo kip xu
hướng thị trường.
(6) Nguyễn và các cộng sự [25] nhận thấy rằng việc có một bộ dữ liệu đủ lớn và
chính xác là một yếu tố tiềm năng dé phát triển và đánh giá các phương phápphân tích cảm xúc theo khía cạnh trong tiếng Việt Vì vậy, họ đã tạo ra một
corpus (tập dữ liệu) được chú thích thủ công, với mục đích là đem đến một
nguôn tài nguyên đáng tin cậy cho cộng đồng nghiên cứu trong lĩnh vực này
Corpus chứa 7.828 ý kiến đánh giá về những khía cạnh cụ thé trong các lĩnh
vực như nhà hàng, khách sạn, điện tử, thời trang và nhiều lĩnh vực khác Mỗiđánh giá trong corpus được chú thích thủ công để xác định các khía cạnh cảm
xúc mà người dùng nhắc đến và các phân cực cảm xúc tương ứng Sau khi xâydựng corpus, các tác giả đã tiến hành thực hiện một phương pháp học có giám
sát với các tính năng đa dạng để phân tích cảm xúc theo khía cạnh Kết quảthử nghiệm cho thấy độ chính xác của phương pháp đạt được điểm FI là87,13% cho nhiệm vụ phát hiện khía cạnh và điểm F1 là 59,20% cho nhiệm
vụ phát hiện phân cực cảm xúc Nghiên cứu này đóng vai trò quan trọng trong
17
Trang 27việc cải tiến và nâng cao phương pháp phân tích cảm xúc theo khía cạnh trong
tiếng Việt
(7) Nguyễn và các cộng sự [22] đã tập trung vào một bài toán quan trọng trong
lĩnh vực xử lý ngôn ngữ tự nhiên, đó là ABSA trong tiếng Việt Mục tiêu của
công trình nay là xác định các khía cạnh cảm xúc trong văn ban va xác định
cảm xúc phù hợp với từng khía cạnh đó Các tác giả đã công bố một tap dirliệu mới cho phân tích cảm xúc theo khía cạnh trong Tiếng Việt Tập dữ liệu
này gồm tổng cộng 35.396 khoảng ý kiến được chú thích bằng tay từ 11.122
bình luận của người dùng Trong bài báo này, các tác giả đã đề xuất giới thiệumột hệ thống sử dụng mô hình BILSTM-CRE (Bidirectional LSTM withConditional Random Fields) dé thực hiện phát hiện đoạn văn bản chứa ý kiến
Hệ thống này sử dụng các đặc trưng được trích xuất từ các embedding, bao
gồm syllable embedding, character embedding và XLM-RoBERTaembedding Két qua tốt nhất dat được là 62,76 điềm F1 macro cho nhiệm vu
phát hiện đoạn văn bản chứa ý kiến khi sử dụng mô hình BiLSTM-CRF kếthợp với các embedding đã nêu Kết quả nghiên cứu đóng góp vào việc hiểu vàphân tích ý kiến đánh giá của người dùng về từng khía cạnh cụ thê của loại sảnphẩm và dịch vụ trong ngữ cảnh tiếng Việt
Các bài toán về ABSA vẫn còn thách thức và tiếp tục nghiên cứu nhiều hơn đề pháttriển mô hình tốt Cần tạo ra, xây dựng bộ dữ liệu đa dạng và tiếp tục áp dụng côngnghệ mới Thách thức hiện nay là sự công hiến và hợp tác từ cộng đồng nghiên cứu
và doanh nghiệp đề đạt tiễn bộ và ứng dụng ABSA hiệu quả
2.3 Kết luận
Dữ liệu lớn đã và đang trở nên là một kho tàng quý hiện nay, và việc số hóa đã thúcđây sự quan tâm đối với các nghiên cứu công nghệ thông tin Trong số đó, bài toánphân tích cảm xúc đóng vai trò đặc biệt quan trọng và đang tiếp tục đối mặt với nhiềuthách thức đáng kể
18
Trang 28Trên thế giới, đã có một số công trình nghiên cứu xây dựng các bộ dữ liệu phục vụcho việc phân tích cảm xúc trên các khía cạnh cụ thể, như đánh giá nhà hàng, kháchsạn, laptop, điện thoại thông minh và thiết bị điện tử Tuy nhiên, với ngôn ngữ tiếngViệt, tài nguyên nghiên cứu vẫn còn rat hạn chế, chỉ có một số bộ đữ liệu với quy môtrung bình và nhỏ được công bố, đặc biệt là trong lĩnh vực nhà hàng, khách sạn và
điện thoại thông minh.
Hơn nữa, các bộ dữ liệu ABSA tiếng Việt hiện tại hầu như chỉ tập trung vào hai nhiệm
vụ phụ, đó là phát hiện khía cạnh và phân tích cảm xúc, trong khi phần quan trọng
khác như phát hiện ý kiến mục tiêu (OTE) chưa được nghiên cứu đầy đủ Điều này
có liên quan đến hạn chế về dit liệu để phục vụ cho việc phát hiện ý kiến người dùng
trong bai toán ABSA tiếng Việt
Vì vậy, để giải quyết những thách thức trên và nâng cao hiệu quả của các mô hìnhABSA, cần đầu tư nhiều nghiên cứu hơn trong tương lai, cung cấp tài nguyên dữ liệuphong phú và cải tiến thêm nhiều phương pháp mới Điều này sẽ góp phan vào việcxây dựng các hệ thong thông tin hỗ trợ kinh doanh và xã hội hiệu qua hơn
19
Trang 29Chương 3 BỘ DỮ LIỆU NGHIÊN CỨU UIT-ViSFD
3.1 Mô tả bộ dữ liệu
Bộ dữ liệu chúng tôi sử dụng do Phan và các cộng sự [23] xây dựng từ các bình luận,
nhận xét trên trang web mua ban điện thoại online: thegioididong.com Bộ dữ liệu
gồm 11,122 bình luận đánh giá về điện thoại thông minh từ những thương hiệu diđộng nồi tiếng trên thegioididong Bộ dit liệu được gán nhãn theo bài toán phân tíchcảm xúc dựa trên khía cạnh Bộ dữ liệu gồm 10 nhãn khía cạnh của điện thoại, đây là
những khía cạnh mà người dùng tập trung đánh giá Cùng với 10 khía cạnh đó là ba
phân cực cảm xúc, ngoài ra còn có | khía cạnh đặc biệt nằm ngoài 10 khía cạnh trên
và không có đi kèm đánh giá cảm xúc.
Bang 3.1: Các hướng dẫn chú thích dé ghi nhãn các khía cạnh và cảm xúc tương
Người dùng tham khảo các
tính năng, cảm biên vân tay,
Trang 30Nhận xét mô tả dung lượng Pin , pin trâu Tích cực
pin và chat lượng pin
Cac bai đánh gia mô ta dung
; lượng khủng, chip xử ly, cau hình có thé
Hiệu suât , , Trung lap
hiệu suât sử dụng và độ châp nhận được
mượt mà của điện thoại.
mm Các bài đánh giá đề cập đến | điện thoại thiết kế |
Thiét kê ' — Tiêu cực
kiêu dáng, thiệt kê và vỏ thô
; Các bình luận trình bay giá | giá cả ở mức tương
Gia : ; ; h Trung lập
cụ thê của điện thoại đôi
; Cac binh luan nhan xét ` Đánh giá chung = moi thứ déu ok Tich cuc
chung về điện thoại.
Các nhận xét đề cập đến ;
nhan vién hoa
Dich vu & phu | dich vu ban hang, bao hanh ` ,
; ; đông, tư vân nhiệt | Tích cực kiện và xem xét các phụ kiện của
điện thoại.
tình
3.2 Quy trình xây dựng bộ dữ liệu
Đề xây dựng bộ dữ liệu, Phan và các cộng sự [23] đã tuân theo một quy trình gồm 4
bước chính Đầu tiên, họ đã tìm kiếm các nguồn thông tin, số liệu chất lượng Họ đãlựa chọn các nguồn dé liệu đáng tin cậy và phù hợp với những gi nghiên cứu hướngđên Sau đó, tiên hành gan nhãn dt liệu băng cách xác định đặc điểm khía cạnh và
phân loại tình cảm, cảm xúc tương ứng trong moi câu Quá trình nay đã doi hỏi sự
thảo luận và đạt đồng thuận giữa các người tham gia Nếu độ đồng thuận chưa đạt
mức mong muôn, họ sẽ xem xét lại và điêu chỉnh hướng dân đê đảm bảo sự nhât quán
21
Trang 31trong quá trình gán nhãn Khi đạt được độ đồng thuận trên 80%, họ đã tiến hành gánnhãn độc lập bằng cách yêu cầu nhiều người tham gia gán nhãn cho cùng một tập dữ
liệu Điều này giúp dam bảo sự khách quan và đa dang trong quá trình thực hiện gan
nhãn Cuối cùng, thực hiện việc thống kê bộ đữ liệu dé dữ liệu dé đạt được cái nhìn
toàn diện và sâu hơn.
3.2.1 Thu thập dữ liệu
Quy trình thu thập đữ liệu bao gồm hai giai đoạn chính Đầu tiên, Phan và các cộng
sự [23] đã tìm va lựa chọn trang web thegioididong, nơi có một đa dạng các
“comment” đánh giá từ người dùng về trải nghiệm điện thoại thông minh Tổng cộng
họ đã thu thập được 13,092 bình luận từ 125 loại điện thoại đến từ 9 thương hiệu nồitiếng trên trang web này Bước tiếp theo là xây dựng một bộ hướng dan gan nhãn dé
đảm bảo sự thống nhất và chính xác trong quy trình gán nhãn dữ liệu Điều này chắc
chan răng dữ liệu thu thập được có chất lượng cao và đáp ứng tốt cho mục đích nghiên
"Neutral" (trung lập) và "Negative" (tiêu cực) Điều này giúp họ tiếp cận thông tin
chỉ tiết về sự đánh giá của người dùng đối với các phương diện khác nhau của điện
thoại Qua quá trình này, họ đã xây dựng bộ dữ liệu gán nhãn chất lượng và đáng tin
cậy dé sử dụng trong các nhiệm vụ phân loại va phân tích câu văn liên quan đến điện
thoại di động.
3.2.3 Quá trình gán nhãn
Sau khi hoàn thành bộ hướng dẫn gán sơ bộ, Phan và các cộng sự [23] tiến hành gán
nhãn 1.200 bình luận ngẫu nhiên từ bộ dữ liệu Họ chia chúng thành 6 phần, mỗi phần
gồm 200 bình luận, và các nhãn được gán độc lập bởi các người gán nhãn khác nhau
22
Trang 32để tính độ đồng thuận Phan và các cộng sự [23] đã sử dụng độ đồng thuận Cohen's Kappa dé đo lường sự đồng thuận giữa các người gan nhãn Dé tính độ đồng thuận,
họ tính toán trung bình của 10 cặp người gán nhãn (do nhóm có 5 người) sau mỗi
vòng gán nhãn 200 bình luận Kết quả đồng thuận trung bình tăng dần và ồn định qua
mỗi vòng gán Chỉ khi độ đồng thuận đạt mức 80.00%, họ tiến hành gán nhãn toàn
bộ dữ liệu độc lập Bộ hướng dẫn gán nhãn sẽ được điều chỉnh và liên tục mở rộng
trong quá trình gán nhãn Phan và các cộng sự [23] đã nhận thấy rằng các bình luận
có độ dài hơn 250 từ thường không có nói lên cảm nhận hoặc nhận xét về sản phẩm.
Do đó, họ đã xóa các bình luận có hơn 250 từ thủ công trong quá trình gan nhãn dé giảm nhiễu và cải thiện chất lượng bộ dữ liệu.
Kết quả độ đồng thuận của các khía cạnh trong 6 vòng gán nhãn cho thấy nhãn
"BATTERY" (Pin) luôn có độ đồng thuận cao nhất trong các vòng gán nhãn, đạt 97.35% cho phan gan khía cạnh và 93.80% cho phần gan cảm xúc Điều này là do các bình luận về khía cạnh pin có từ ngữ rõ ràng và thường liên quan đến các van đề
phổ biến của người dùng, dễ dàng để nhận biết và gán nhãn Trái lại, nhãn
"STORAGE" (Bộ nhớ), "OTHERS" (Khác) và "SERVICE&ACCESSORIES" (SER&ACC) (Dịch vụ & Phụ kiện) có độ đồng thuận chưa cao bằng các nhãn khác
(dưới 80.00%) Đối với nhãn "STORAGE" (Bộ nhớ), số lượng bình luận về khía cạnh
này trong bộ dữ liệu khá ít, dẫn đến việc một hoặc hai câu gán sai có thể làm giảm độ đồng thuận Ban đầu, nhãn "OTHERS" (Khác) bao gồm cả định nghĩa của nhãn
"OTHERS" (Khác) và nhãn "SER&ACC" (Dịch vụ & Phụ kiện) Tuy nhiên, sau ba
vòng gán nhãn, nhận thấy có nhiều bình luận đánh giá chất lượng dịch vụ và phụ kiện.
Vì vậy, Phan và các cộng sự [23] đã tách nhãn "OTHERS" (Khác) thành hai nhãn
riêng biệt là "OTHERS" (Khác) và "SER&ACC" (Dịch vụ & Phụ kiện) Trong ba
vòng gán nhãn đầu tiên, nhãn "SER&ACC" (Dịch vụ & Phụ kiện) chưa được gán và
độ đồng thuận có giá tri NaN Sau khi tách riêng, nhãn "OTHERS" (Khác) không có
phần gán cảm xúc vì vậy các vòng gán nhãn sau không có độ đồng thuận cảm xúc cho nhãn này và có giá trị NaN.
23
Trang 33Sau khi hoàn tất quá trình huấn luyện và hướng dẫn gán, Phan và các cộng sự [23] tiến hành gán nhãn song song cho toàn bộ bộ dữ liệu Để tăng hiệu quả và tiện lợi cho quá trình gan nhãn, họ đã tạo ra một nền tảng gắn nhãn cho bộ dữ liệu này.
3.2.4 Phân tích bộ dữ liệu
Bộ dữ liệu của Phan và các cộng sự [23] chứa 11,122 câu bình luận va bao gồm 4
thuộc tính chính: câu bình luận (comments), số sao đánh giá (n_star), thời gian bình
luận (date_ time) và nhãn của câu bình luận (label) Họ đã chia ngẫu nhiên bộ dữ liệu
thành ba phần: tập huấn luyện (Train), tập phát triển (Dev) và tập kiểm tra (Test) Trung bình, mỗi câu bình luận có 3 khía cạnh và khoảng 36 từ Tuy nhiên, số lượng khía cạnh không được phân bó đồng đều Vi dụ, khía cạnh GENERAL (đánh giá chung) chiếm 6,936 câu bình luận trong khi khía cạnh STORAGE chỉ có 132 câu Diéu này tạo ra sự mat cân bằng trong khi xây dựng model dự đoán, khiến mô hình
khó nhận diện các từ thuộc khía cạnh STORAGE do số lượng quá ít Ngoài ra, cũng
có sự tách biệt giữa các label cam xúc Cụ thé, tỷ lệ nhãn Positive là 56.13%, Negative
là 31.70% và Neutral là 12.17%.
Dựa vào biểu đồ, ta thây sắc thái cảm xúc tích cực chiếm tỷ lệ cao nhất trong đa số
các nhãn, tiếp theo là sắc thái tiêu cực và trung lập Điều này phản ánh phần đông người dùng có xu hướng nhận diện các khía cạnh là tích cực hoặc tiêu cực, trong khi
ít người có xu hướng đánh giá các khía cạnh mang tính trung lập Tuy nhiên, nhãn
PRICE (giá) có tỷ lệ sắc thái trung lập cao hơn hai nhãn còn lại.
Tập dữ liệu của Phan và các cộng sự [23] đã mở ra một cánh cửa mới dé chia sẻ thông
tin về ABSA và hỗ trợ việc áp dụng phương pháp phân tích tình cảm, cảm xúc cho các phương diện khía cạnh trên các hệ thống mua bán online, sản thương mại online.
24
Trang 34Chương 4 CÁC PHƯƠNG PHÁP TIẾP CẬN
4.1 Thu thập dữ liệu
Dé có nguồn dữ liệu phù hợp và đáng tin cậy, chúng tôi đã xem xét và tìm ra những
trang web uy tín như ViettelStore, fptshop, thegioididong, didongviet, cellphoneS Tuy có rất nhiều nguồn dữ liệu nhưng do thời gian có hạn nên chúng tôi đã lựa chọn
ra 2 trang web thegioididong và fptshop trong nhiều trang web trên.
Nhận thấy rằng các trang web này có cấu trúc và dữ liệu phức tạp nên chúng tôi đã
sử dụng công cụ Scrapy - được viết bằng python hỗ trợ thu thập dữ liệu (còn được
gọi là web scraping) và crawling (tự động duyệt và truy xuất dữ liệu từ các trang web) Nó là một framework cung cấp các tính năng mạnh mẽ có thể lấy toàn bộ dữ
liệu html, văn bản, hình ảnh trên nhiều trình duyệt khác nhau như Chrome, Safari,
Eirefox Ngoài ra còn hỗ trợ cho xác thực, xử lý cookie, chạy đa luồng, đa truyền dẫn,
lập lịch và xử lý lỗi.
Trong quá trình thu thập dữ liệu, nhận thấy rằng các trang web hiện nay là các trang web động có sử dụng JavaScript, khi ấy Scrapy thông thường sẽ không xử lý được,
Vi thế chúng tôi đã tìm hiểu và kết hợp Scrapy và Playwright thành công dé thu thập
di liệu ở các trang web có sử dụng JavaScript.
Playwright là một công cụ tự động hóa trình duyệt mã nguồn mở, được phát triển bởi Microsoft Cung cấp khả năng kiểm soát và tương tác với trình duyệt web, cho phép
bạn thực hiện các hoạt động như điều hướng đến URL, tương tác với các phan tử trên
trang Sự kết hợp giữa Scrapy và Playwright có thé mang lại lợi ích lớn trong việc tự động hóa công việc khai thác dữ liệu trên web, nhân đôi khả năng trích xuất cơ bản
và tương tác phức tạp từ trình duyệt.
25
Trang 35Xóa các thẻ dang Chuân hóa các
HTML | ký tự Unicode
Xóa các dạng ký Q Tach câu thành | Chuyên toàn bộ từ ngữ câu
tự không can thiệt các từ, cụm từ văn thành chữ thường.
Hình 4.2: Sơ đồ hoạt động của tiền xử lý dữ liệu
- Xóa các thẻ dang html: trong hệ thông mà chúng tôi định xây dựng sẽ có việc
crawl đữ liệu từ nhiều trang web bán thiết bị di động vì thế sẽ có thể có các thẻ tin có dang html Khi các thẻ này HTML này được loại bỏ thì chúng ta nhận được đoạn văn bản đã được xử lý chỉ còn lại nội dung văn bản thông
thường.
- Xóa các dang ký tự không cần thiết: sử dụng biểu thức chính quy để xóa các
ky tự không cần thiết có trong chuỗi như “?”, “!”, “\”
- Chuẩn hóa các ký tự Unicode: trong văn ban bằng tiếng việt sẽ có những ký
tự không chuẩn ở các bang mã khác nhau như "â", "đ", "ô", "ơ", "ự", Khi ấy
sẽ dùng dang chuẩn hóa này chuyển về các ký tự tương ứng trong bang mã
26
Trang 36UTF-8 Dam bảo tính nhất quán và đồng nhất trong việc chuẩn hóa các văn
bản có chứa các ký tự Unicode.
- Chuẩn hóa các từ viết tắt, teencode: người việt hiện nay thường viết nhiều từ
ngữ, câu văn văn tắt hoặc sử dụng teencode để ngắn gọn hơn Vì vậy chúng tôi đã sử dụng bộ chuẩn hóa từ được nghiên cứu trước đó của Đặng và các
cộng sự [26], việc chuẩn hóa này làm cho các từ viết tắt và các từ lóng trong
một chuỗi văn bản thành các từ đầy đủ và chuẩn mực tương ứng.
-_ Chuyên toàn bộ từ ngữ câu văn thành chữ thường: thực hiện việc chuyền đổi
tat cả các ký tự sang chữ thường dé đồng nhất định dang và dé dàng xử lý văn
bản.
- _ Tách câu thành các từ, cum từ: trong dé tài này, chúng tôi sử dụng thư viện
VnCoreNLP dé phan loại câu, từ, cum từ hoặc cu pháp được sử dụng trong câu.
Bảng 4.1: Ví dụ về dữ liệu trước và sau khi xử lý
Trước khi xử lý Sau khi xử lý
<p>Đây là một dòng điện thoại l
Đây là một dòng điện Xóa thẻ html cực kỳ <strong>dep</strong> l
thoại cực kỳ đẹp
</p>
l : ` , Dién thoai Sam Sung cam Dién thoai Sam Sung cam tay rat :
Xóa ký tự không tay rat sang trọng Xai một
cần thiết sang trọng!!! Xài một ngày mà pin
vẫn chưa xuống đến 20% ngày mà pin vẫn chưa
27
Trang 37: l Dùng ok, hàng chính
Chuân hóa từ Dùng oki, hàng chính hãng có os
oe X hãng có khác, sẽ tiêp tục việt tat, teencode | khác, sẽ tiếp tục ủng hộ sop
ủng hộ cửa hàng
Chuyên đôi l điện thoại sam sung này
Điện thoại Sam Sung đợt này pin thành chữ l co pin không trâu, xài mau
không trâu, xài mau hêt pin thuong hét pin
ca Sau | tháng sử dụng thì Sau 1 tháng sử dụng thi tôi thay on
l tôi thay điện thoại dùng điện thoại dùng rât ok, câu hình l ,
Tách từ rat ok, câu hình máy
máy mạnh, camera chụp hình rât
mạnh, camera chụp hình đẹp Ĩ
rât đẹp
4.3 Phương pháp sử dụng
Phan và các cộng sự [23] đã đề xuất một loạt phương pháp học máy và học sâu đề
nhận diện khía cạnh và cảm xúc Họ đã tiễn hành thử nghiệm với hai mục đích chính, bao gồm nhận diện khía cạnh và nhận diện cảm xúc cho khía cạnh Sản phẩm nhận
được từ Bảng 2 và Bảng 3 đã cho thấy một cách trực quan sự khác biệt rõ rệt giữa hai
phương thức nhận diện này Đáng chú ý, sau khi áp dụng nhiều phương pháp học
máy truyền thống và học sâu, BiLSTM là mô hình vượt trội khi đạt được kết quả
Trang 38Naive bayes 63.06 35.16 39.97
CNN + fastText 59.01 47.47 50.02
Học sâu | LSTM + fastText 65.17 55.02 58.81
BiLSTM + fastText 66.53 61.64 63.48
Dua trén hai bang két quả thực nghiệm, cĩ thể thấy rằng hiện tại, việc nhận diện cảm
xúc cho khía cạnh vẫn chưa đạt được mức độ cao như mong đợi Đối với các phương
pháp học máy truyền thống thì kết quả khơng được hiệu quả khi thực nghiệm chỉ đạt kết quả dưới 50% Fl-Score Cịn các phương pháp học sâu trong đĩ cĩ mơ hình
BiLSTM vẫn cho thấy tiềm năng hơn.
Đồng thời, với mục tiêu chính của chúng tơi là xây dựng một hệ thống phân tích tình
cảm cho nhiều khía cạnh của một sản phẩm điện ở mỗi bình luận tương ứng, vì vậy
sẽ triển khai lại các mơ hình học sâu LSTM và BiLSTM Cùng với đĩ chúng tơi cũng
áp dụng thêm mơ hình Nạve Bayes, CNN, GRU song song để cĩ thể quan sát, mở
29
Trang 39rộng và chính xác hơn cho việc phân tích sau này Bằng việc kế thừa những mô hình trước đó, chúng tôi mong muốn kết quả sẽ khả quan, tối ưu và hoàn thiện nhất.
4.4 Các mô hình cơ sở
4.4.1 Học máy truyền thống
Thuật toán Naive Bayes Classification (NBC) [21] là một thuật toán phân loại trong
lĩnh vực máy học, đặc biệt được sử dụng một cách phổ biến trong việc phân loại văn
bản Thuật toán này dựa trên tính toán xác suất và áp dụng định lý Bayes của nhà toán học Thomas Bayes.
Thuật toán NBC giả định rằng các đặc trưng (features) của dữ liệu độc lập tuyến tính
và ảnh hưởng riêng biệt đến kết quả phân loại Điều này làm cho NBC trở thành một thuật toán đơn giản mà hiệu quả.
Quá trình huấn luyện cho thuật toán NBC gồm hai giai đoạn chính: huấn luyện (training) và kiểm tra (testing) Trong giai đoạn huấn luyện, NBC sẽ tính toán các xác suất xảy ra của từng lớp (class) dựa trên tập dữ liệu huấn luyện NBC sử dụng phân phối xác suất của các đặc trưng trong từng lớp dé tính toán xác suất điều kiện P(x|c),
trong đó x là các đặc trưng và c là lớp tương ứng Các xác suất này được ước lượng
từ tập dữ liệu huấn luyện.
Sau khi giai đoạn huấn luyện hoàn thành, NBC sẽ sử dụng các xác suất đã được ước lượng đề phân loại các mẫu dữ liệu mới Trong giai đoạn kiểm tra, NBC tính toán xác
suất hậu nghiệm P(c|x) cho mỗi lớp c dựa trên định lý Bayes Lớp có chỉ số xác suất
hậu nghiệm cao nhất sẽ được chọn là kết quả phân loại của mẫu dữ liệu đó.
Công thức tính xác suất hậu nghiệm P(c|x) dựa trên định ly Bayes :