Trang 1 HỌC VIỆN CễNG NGHỆ BƯU CHÍNH VIỄN THễNGKHOA CễNG NGHỆ THễNG TIN- Đẩ TÀIHỖ TRỢ LỰA CHỌN SAN PHAM Trang 2 Khoỏ luận tốt nghiệp Đại học Chương |: Đỏnh giỏ trực tuyếnHỌC VIỆN CễNG N
Damh gia 0n án Ả
Lịch sử của Đánh giá trực tuyẾn - ¿55c 2+ 2xx 2 xEEEEEEErEkrrkerkrree 5
Bài đánh giá trực tuyến đầu tiên Đánh giá trực tuyến đầu tiên xuất hiện vào năm 1999 Ban đầu, những đánh giá chủ yếu được chứa trên các trang web bán hàng cu thé như eBay, nhưng sau đó có 3 đối thủ chính cạnh tranh với nhau: Epinions, RateltAll và Deja Họ đã tạo ra tổng cộng 1.146.201 đánh giá trực tuyến về các sản pham và ngành giải trí khác nhau Tuy nhiên, cuối cùng những trang này đã bị các tập đoàn lớn hơn tiếp quản hoặc mua lại.
Năm 2001, trang Yellow Pages and City Search đã thêm tính năng đánh giá trực tuyến vào trang của họ, cho phép người dùng xem xếp hạng trước khi trở thành khách quen của các doanh nghiệp địa phương Vào thời điểm này, ít ai có thé lường trước được sự gia tăng đáng kinh ngạc không chỉ về độ chỉ tiết trong đánh giá người tiêu dùng cung cấp mà còn về số lượng đánh giá được tạo ra Và không mat quá nhiều thời gian dé lượng thông tin đó trở nên quan trọng trong cuộc sống hàng ngày của chúng ta.
Pham Trung Kiên — DI7CNPMS 5
Khoá luận tốt nghiệp Đại học Chương 1: Đánh giá trực tuyến
Deja trở thành Google Groups
Vào năm 2002, Google đã mua lại công nghệ tìm kiếm Usenet từ Deja, về cơ bản, công nghệ này đã cấp cho họ quyền sở hữu đối với tất cả các nhóm thảo luận trực tuyến của Usenet Diễn đàn này chứa một công cụ tìm kiếm, cho phép người dùng tìm thông tin liên quan bằng cách tìm kiếm một chủ đề hoặc vị tri quan tâm cụ thể và xem các nhóm thảo luận đã lưu trữ.
Trước đây, các nhóm nay là tư nhân và chủ yếu được sử dụng dé thảo luận về kinh doanh, nhưng vào năm 1999, nó đã biến thành nơi để người mua hàng so sánh các công ty và sản phâm Người tiêu dùng giờ đây có thé thu thập thông tin về một công ty trước khi mua hàng của họ, cũng như dé lại nhận xét của họ Khi Google sở hữu công nghệ nay, nó được đổi tên thành groups.google.com và trang Deja ban đầu đã bị đóng của.
Tương tự như Deja, Epinions là một trang web được thành lập vào năm 1999 va được sử dụng như một trang web đánh giá cho người tiêu dùng Vào năm 2003,
DealTime, còn được gọi là shopping.com, đã tiếp quản Epinions với mục tiêu giúp người mua sắm lựa chọn những sản phẩm tốt nhất bằng cách cung cấp quyền truy cập vào các bài đánh giá hiện tại và quá khứ Cuối cùng chúng đã được mua lại một lần nữa bởi eBay vào năm 2005 và tất cả các tính năng của Epinions đã hoàn toàn ngừng hoạt động vào năm 2018 Tuy nhiên, thông tin từ Epinions vẫn có thé được tìm thấy vì các URL cũ được chuyền hướng đến shopping.com.
Các tiện ích được sử dụng để làm nỗi bật các đánh giá tích cực
Vào năm 2007, RateItAll và MuseStorm đã hợp tac dé tạo ra các widget có thé được đặt trên các trang web của công ty Với sự bé sung này, một công ty có thé tự hào hiển thị danh sách các đánh giá tích cực trên trang web của mình nơi người mua tiềm năng có thé dé dàng nhìn thấy ma không cần phải tiễn hành tìm kiếm.
Vào năm 2009, Yelp đã thêm một tính năng cho phép các công ty trả lời các bài đánh giá về doanh nghiệp của họ Điều này tạo cơ hội cho họ sửa chữa các vấn đề và giải thích các đánh giá tiêu cực Nhiều người đánh giá đánh giá cao tính năng phản hồi đối và việc nhà cung cấp tìm cách giải quyết van đề Với các đánh giá do người tiêu dùng tao ra và phản hồi của công ty, cả hai bên hiện đã có thé trao đổi dé có thé đưa tới một phương án giải quyết thích hợp.
Khi quá trình đánh giá trực tuyến tiếp tục phát triển, đã có năm công ty chính nồi lên như những nhà lãnh đạo rõ ràng trong lĩnh vực kinh doanh trực tuyến Yelp, Amazon,
Google, Facebook va TripAdvisor đã có được ảnh hưởng rộng rãi và có tác động to lớn đến sự phát triển của các bai đánh giá trực tuyến.
Pham Trung Kiên — DI7CNPMS 6
Khoá luận tốt nghiệp Đại học Chương 1: Đánh giá trực tuyến
Từ năm 2012 đến năm 2016, Facebook dẫn đầu về đánh giá kinh doanh trực tuyến với Yelp đứng sau và cả hai đều duy trì sự tăng trưởng 6n định Tuy nhiên, vào năm
2017, Google đã tăng vọt trước đối thủ TripAdvisor liên tục đứng ở vị trí thứ tư và vẫn là nguồn thông tin đáng tin cậy cho khách du lịch, trong khi Amazon thu thập các bài đánh giá cho các sản phẩm cụ thé. Đó là một vài mốc thời gian trong suốt quá trình hình thành và phát triển của Đánh giá trực tuyến Từ khi xuất hiện, chức năng này đã nhận được sự phản hồi tích cực từ cả người dùng và các doanh nghiệp có sàn giao dịch điện tử Trở thành một công cụ hữu ich cho người tiêu dùng dé có cái nhìn tổng quan nhất về sản phẩm, dich vụ.
Ảnh hưởng của Đánh giá trực tuyến đến khách hàng - 2-2 +¿ 7
Nói ngắn gọn thì Đánh giá của khách hàng hay Đánh giá trực tuyến, chính là các phản hôi từ khách hàng sau một thời gian sử dụng sản phẩm Các đánh giá này sẽ được hién thị trên các giao diện của sàn thương mại điện tử Từ đó, có thé làm tư liệu cho các khách hàng đến sau tham khảo dé có cái nhìn tổng quan về sản phẩm và đưa ra quyết định mua hàng.
Tai nghe xin lãm luônnnn
Rất là kín tai nên hiệu quả nghe âm thanh rất chất lượngg bass hay Chơi game nghe nhạc nét từng âm rất là thích.
Gọn gàng dễ sử dụng Sạc tốt, pin trâu
Hình 1.4 Đánh giá sản phẩm trên Shopee [15]
Thông thường người mua sử dụng các bài đánh giá ở cuối kênh bán hàng, khi họ đã quyết định những gi họ cần Đánh giá sản phẩm hoặc dịch vụ giúp họ đưa ra quyết định cuối cùng và lựa chọn giữa các ưu đãi tương tự từ các thương hiệu khác nhau. Đánh giá trực tuyến đóng một vai trò quan trọng trong mua sắm trực tuyến Một đánh giá tốt có thê tăng doanh số bán hàng và lòng trung thành của khách hàng bằng cách ảnh hưởng đến hành vi của người tiêu dùng.
Khi tỷ trọng thương mại điện tử trên thị trường tiếp tục tăng, các bài đánh giá có thê giúp sản phâm có được một cái nhìn tích cực đôi với cả khách hàng mới và khách hàng cũ dé trở nên nôi bật so với các đôi thủ cạnh tranh.
Pham Trung Kiên — DI7CNPMS 7
Khoá luận tốt nghiệp Đại học Chương 1: Đánh giá trực tuyến
Sau khi đọc các bài đánh giá, người tiêu dùng thường đưa ra lựa chọn của họ:
Thêm vào giỏ hàng sản phâm dé thanh toán, hoặc bỏ đi tìm nơi khác Điều này chứng minh rang dé khách hàng đi đến giỏ hàng và mua hàng việc đánh giá giá sản phẩm ảnh hưởng đến 90%.
Từ đó, đánh giá của những người dùng đã sử dụng, trải nghiệm sản phâm trở nên vô cùng quan trọng.
Tại sao lại như vậy, ta có thể hiểu đơn giản là do hiệu ứng đám đông — một hành vi trong marketing Con người thường có xu hướng tin tưởng những người đi trước, cụ thể là những người đã sử dụng và có những đánh giá về sản phâm, dịch vụ nào đó, nếu những người khác đang làm việc đó, tôi cũng muốn làm điều đó.
Thông thường, hầu hết người tiêu dùng đọc ít nhất ba đến bốn đánh giá từ nhiều nguôn khác nhau trước khi hoàn tat mua hàng Hau het thời gian, người tiêu dùng tìm kiếm các đánh giá ngang hàng hoặc ý kiến của các chuyên gia hàng đầu trong ngành. Điêu nảy giúp họ có cái nhìn sâu sắc hơn về các tính năng và chức năng của sản phâm cũng như trải nghiệm và sự hai lòng của người dùng Ngoài ra khi họ sử dụng xong sản phâm, nêu mang lại kêt quả hơn mong đợi, họ sẽ tiép tục bình luận tot.
Một số điểm tích cực mà Đánh giá trực tuyến đem lại có thê ké đến như:
- Giúp người dùng có cái nhìn tong quan về sản phẩm dựa vào những đánh giá của người dùng trước Việc này giúp người tiêu dùng tiết kiệm được rất nhiều thời gian Thay vì tìm những người đã sử dụng sản phẩm, chỉ cần bỏ ra chưa đến 1 tiếng, người tiêu dùng có thé tim được thông tin mình mong muốn ở phần đánh giá sản phâm Vì thế, người dùng còn có thé tránh được những sản phâm có chất lượng kém, hoặc không phục vụ được mục đích sử dụng.
- _ Người dùng có tác động đến sản phẩm khi họ có thé trực tiếp dé lại đánh giá của mình trên các nền tang giao dịch Điều nay nâng cao tam quan trọng và sức ảnh hưởng của người tiêu dùng lên sản phẩm.
- _ Về phía người bán, những đánh giá có ảnh hưởng trực tiếp lên sản phâm cũng như doanh số Nhờ những đánh giá của khách hàng, sản phẩm của doanh nghiệp có thể được quảng bá rộng rãi hơn, được nhiều người tin dùng hơn, và có khả năng cao những người đó sẽ tiếp tục quay lại đánh giá tốt cho sản phẩm Ngược lại, những đánh giá tiêu cực có thé giúp doanh nghiệp nhận ra sai sót trong sản phẩm của mình.
Tuy vậy, không thé ké đến một số hạn chế như:
- _ Một số mặt hàng có sự khan hiếm về đánh giá Ví dụ với một số mặt hang đắt tiền như ô tô, xe máy, lượng đánh giá về các sản phẩm này chưa thực sự phong phú dé người tiêu dùng có thể tham khảo.
- - Một số mặt hàng lại có lượng đánh giá quá nhiều, đơn cử như điện thoại di động.
Có thể có tới hàng nghìn, thậm chí chục nghìn đánh giá chỉ tính trên Shopee về một chiếc điện thoại Người dùng sẽ phải tốn rất nhiều thời gian dé có thé có được thông tin mình mong muốn từ số lượng đánh giá nhiều như thé.
Pham Trung Kiên — DI7CNPMS 8
Khoá luận tốt nghiệp Đại học Chương 1: Đánh giá trực tuyến
- - Đánh giá giả đến từ doanh nghiệp Trường hợp này không phải là hiếm khi doanh nghiệp muốn tạo ấn tượng tốt với người tiêu dùng Người tiêu dùng sẽ phải thật thận trọng và tinh ý dé có thé phát hiện ra những đánh giá này.
Hiện nay, các nền tảng thương mại điện tử ở nước ta đều đã cung cấp những chức năng dé người dùng có thé đăng tải đánh giá của mình về sản phẩm Những đánh giá này đêu được hiện thị với tat cả người dùng.
Đánh giá trực tuyến hiện nay ¿-2¿- 2222222 2EE2EEEEEEE2E221E221E21E2212Excrkreeg 9
Hiện nay, các nền tảng thương mại điện tử ở nước ta đều đã cung cấp chức năng Đánh giá trực tuyến Shopee, Tiki hay Lazada đều đang sử dụng phương thức đánh giá và bình chọn sao (từ 1 đến 5 sao) về sản phẩm.
Thay vì chỉ đơn thuần bao gồm đánh giá về sản phẩm, giờ đây khách hàng có thể đánh giá theo “sao” Mỗi sản phẩm sẽ có 1 số sao nhất định trên thang 5 Số sao này sẽ được quyết định băng trung bình cộng của các đánh giá mà người dùng để lại.
Ngoài ra, người dùng còn có thé thêm ảnh, video vào đánh giá của mình dé làm tăng tính thuyết phục của đánh giá. Đánh Giá Sản Phẩm
Kim Nanye Ipliers chuyên cat chi tiết mô hình có kèm bao đựng - GundamGDC
(2) Thêm Hình anh Ed Thêm Video Đánh gia an danh
Hình 1.5 Giao diện đánh giá sản phẩm cua Shopee [15]
Khoá luận tốt nghiệp Đại học Chương 1: Đánh giá trực tuyến ĐÁNH GIÁ SẢN PHẢM
4 2vêng Tất Cả 5§ao(104) | 4 Sao (18) 3 Sao (16) 2 Sao (4) 1 Sao (16)
*+*w+**‹: Có Bình Luận (78) Có Hình Ảnh / Video (43) ngolinh17032001
Ao màu nhạt hơn, mỏng hơn so với hình Chiều dài không dài lắm và mũ cũng hơi nhỏ Nên cân nhắc khi mua
Hình 1.6 Đánh giá trên Shopee [15] ww & ww Cực kỉ hài lòng
Mới nhận hồi chiều vào đánh giá nhận xu luôn Đồng hồ thời trang rất đẹp Thiết kế dây thép lụa cảm giác đeo rất dễ chịu và trẻ nữa Chỉnh độ dài ngăn hoi khó xíu cơ mà shop gửi hướng dan thì đã làm được ngay Có hộp màu đỏ rất đẹp có thể mua làm qua tặng được luôn Sản phẩm rất đẹp mình rất ưng y mặc dù giá rất rẻ nhưng có vẻ rất ổn Đồng hồ ok mua được nhé các ban. Đánh giá vào 4 ngày trước - Đã dùng 4 giờ
Hình 1.7 Đánh gia trên Tiki [18]
Với chức năng như trên, người dùng sau khi mua và trai nghiệm san phâm, có thê đê lại đánh giá giàu thông tin với sô diém đánh giá, hình ảnh và video.
Khoá luận tốt nghiệp Đại học Chương 1: Đánh giá trực tuyến
Người dùng còn có thé đánh dấu một đánh giá khác là “Hữu ích” hoặc “Thích”.
Chức năng này tương tự như nút Thích ở mạng xã hội Các đánh giá có lượt “Hữu ích”/
“Thich” cao sẽ được hiển thị đầu tiên. Đánh giá & Nhận xét Samsung Galaxy A12 4GB-128GB Đánh Giá Trung Bình ce 2
4* a Ban đã dùng sản phẩm này?
3/ 5 3x mm 3 : 2+ Gửi đánh giá của bạn
Hue Mới nhất 4 kk kkk mua chưa nổi 1th thì đèn nháy như đi bar, dem di sửa bảo 10days lấy được, đến ngày t8 minh cần đt để làm việc gọi hỏi thi bảo sẽ giục bên kỹ thuật, rồi k biết có giục k mà k thấy động tĩnh gì, trạng thái bảo hành vẫn đang ở TTBH chẳng biết cái lỗi nháy màn sửa tốn thời gian như nào mà shop phải ngâm cho đủ 10 ngày mới chịu nói chung mua phí tiền chẳng biết đánh giá khen sản phẩm là thật hay tự shop cmt, hoặc cũng có thể số mình nhọ
Sử dụng được 1 tháng thi thấy máy hoi do, cảm ứng chậm Nhắn hỏi nhân viên tư van thi không trả lời Hơi thất vọng
Nguyễn Đình Kiên kkkkk 4/07 /202 Điện thoại tốt, nhân viên tận tinh, chu đáo, lịch sự
*ewx+** 4/202 Điện thoại này có chế độ Smart View kết nối với tivi ko? té Thích (118)
Hình 1.8 Tương tác với đánh giá của người dùng khác [9]
Ngoài ra, người bán hàng có thể tương tác với người mua thông qua đánh giá. Bằng cách này, người bán có thê phản hồi kịp thời những thắc mắc cũng như khiếu nại của người mua hang.
Phân loại hàng: AMOI F9 PRO ĐEN
Kén kém qua a, sạc chưa được 1 lần day tai nghe: Tai nghe trái nghe lâu hơn tai phải 30%; âm thanh cũng lệch nữa
Phản Hồi Của Người Ban
Chao bạn, bạn lưu ý sạc day cho dock sạc trước khi sử dụng nhé Trường hợp tai trai nghe lâu hơn tai phải là do tai trái làm nhiệm vụ kết nối bluetooth với điện thoại bạn nhé!
Hình 1.9 Tương tác thông qua đánh giá giữa người ban và người mua [15]
Khoá luận tốt nghiệp Đại học Chương 1: Đánh giá trực tuyến
Cách đánh giá trực tuyến làm này đem lại rất nhiều lợi ích cho người tiêu dùng:
Cung cấp cho người dùng phương thức đánh giá trực quan, sinh động và bao quát nhờ sự kết hợp giữa đánh giá điểm (sao), đánh giá và hình ảnh Người dùng khi vừa lựa chọn xem sản phẩm có thê thấy ngay số lượng đánh giá cũng như số sao mà sản phẩm đang có Số lượng sao chính là phản ánh trực tiếp của tất cả đánh giá trên trang về sản phẩm Ảnh đính kèm sản phẩm khi nhận về cũng là một thông tin rất hữu ích đối với người tiêu dùng Một đánh giá sẽ trở nên tinh cậy hơn nếu có hình ảnh chứng minh sản phẩm.
Từ những góc nhìn của các người dùng khác nhau về sản phẩm, người mua hàng có thé giảm rủi ro khi mua hàng trực tuyến Ké cả khi những đánh giá chứa it thông tin hữu ích, một sản phâm có nhiều đánh giá tích cực cũng tao cảm giác uy tín hơn các sản phẩm khác Người mua hàng có thể dựa vào những thông tin đó dé quyết định mua sắm.
Tang kha năng tương tác giữa người mua với người ban và giữa người mua với người mua Nhờ vào tính năng Trả lời đánh giá, người bán có thê giải quyết những vấn đề khúc mắc về sản phẩm cho người mua, giúp giải quyết những vẫn dé nay sinh dé dang hơn Một số trang còn cho phép người dùng trả lời bình luận của người dùng khác, tăng sự tương tác xã hội trên nền tảng mua sắm.
Tuy nhiên, cách làm này van còn tôn tại một sô han chê:
Lượng thông tin phải xử lý đôi khi là quá nhiều Một sản phâm có thể có đến hàng trăm hàng nghìn đánh giá từ các người dùng Mặc dù nhìn số điểm (sao) của sản phẩm cao, nhưng nhìn vào những đánh giá, người dùng vẫn có thể bị choáng ngợp bởi lượng thông tin phải xử lý quá nhiêu.
Các đánh giá không tập trung vào sản phẩm Giả sử người mua muốn tìm hiểu thông tin về màn hình của một chiếc điện thoại Nhưng trong phần đánh giá chỉ bao gồm những đánh giá như: “Sản phẩm ok”, “Giao hàng nhanh, xịn”, sẽ rat khó cho người dùng có thể xác định được chất lượng sản pham từ những đánh giá như vậy. ee mtuyen_02
Tai nghe cũng rat Ok
Hình 1.10 Đánh giá không chứa nhiêu thông tin [15]
Lượng thông tin rác không được xử lý triệt dé Lấy Shopee làm ví dụ, họ có chương trình tặng khuyến mại cho những người dùng sau khi mua sản phẩm và
Pham Trung Kiên — DI7CNPMS 12
Khoá luận tốt nghiệp Đại học Chương 1: Đánh giá trực tuyến để lại đánh giá Điều nay sẽ thúc day người dùng dé lại đánh giá cho sản phẩm, làm tăng độ tin cậy cho sản pham Tuy nhiên chính vì việc người dùng chỉ cần dé lại đánh giá là đã có thể nhận ưu đãi, nên họ có thé dé lại bat kỳ đánh giá gì. Đôi khi chỉ là những đánh giá 5 sao không đi kèm nhận xét Đôi khi lại là những đánh giá dé lay đủ số lượng ký tự như hình Điều này cũng gây khó khăn không nhỏ cho những người mua hàng sau đó trong việc quyết định có nên mua sản phẩm hay không. hiepnef2002
Hình 1.11 Đánh giả spam cua người dùng [15] Ở một số trang thương mại điện tử như eBay hay FPT Shop, họ cung cấp chức năng so sánh các sản phâm với nhau Chức năng này trở nên vô cùng tiện lợi khi người mua muốn so sánh hai hay nhiều sản phẩm với nhau.
So sánh Samsung Galaxy A52 vs OPPO Reno6 Z 5G
€© Nhận đến 1 khuyến mãi © Nhận đến 1 khuyến mãi ao 9 # 9 © 9 &
Xem thêm Video Trong hộp Ảnh 360 Xem thêm Video Trong hộp Ảnh 360
17 ảnh trên tay có gì độ 19 ảnh trên tay có gi độ
Xemchỉ tiết › Xem chỉ tiết
Hình 1.12 Chức năng so sánh sản phẩm của FPT Shop [9]
Chức năng này so sánh các thuộc tính của sản phâm với nhau Ví dụ với mặt hàng điện thoại, các thuộc tính có thê kê đên như:
Khoá luận tốt nghiệp Đại học Chương 1: Đánh giá trực tuyến
Những thông tin này sẽ được đặt song song với nhau giữa 2 mặt hàng dé người dùng có thê quan sát.
External Memory Card Slot Operating System
5,8" dual edge Super AMOLED-Display
Hình 1.13 So sánh san pham trên sàn thương mại điện tử eBay [7]
Khoá luận tốt nghiệp Đại học Chương 1: Đánh giá trực tuyến
Có Có Không Có Không Có
Có Có Không Có Không Không
Hình 1.14 So sánh thuộc tính sản phẩm của FPT Shop [9]
Mục tiêu và tổng quan hệ thống 2-2 2 £+E++E+EE+EE+EE+EEEEZEerEerkerkerkrrkee 15
Mục tiêu của hệ thống -2- ©2222 22E2EE2EEE2EE2E122112211221 21121121 crxee l6
Từ góc độ người dùng, hệ thống sẽ phải đáp ứng đầy đủ chức năng của một san thương mại điện tử khi hién thị sản phẩm Thông tin của sản phẩm cần được hiền thị day đủ, ngoài những thông tin chính, người dùng sẽ có thé thay được tông quan đánh giá của sản phẩm (được đánh giá tích cực hay tiêu cực, có bao nhiêu đánh giá) cùng với tất cả đánh giá của những người dùng khác về sản phẩm. Ứng dụng sẽ phải đáp ứng được chức năng như một không gian mạng xã hội cho người tiêu dùng, mà ở đó, người dùng có thé đưa ra đánh giá về một sản phẩm, và đánh giá đó, chắc chắn sẽ có ảnh hưởng đến sản phẩm trên nền tang.
Từ góc độ người quản lý và hệ thống, dé những phải hồi của người dùng có ảnh hưởng đến sản phâm, hệ thống sẽ cần phân tích những phải hồi, và đưa những thông tin phân tích được đó đem hién thị lên giao diện thông tin sản phẩm Việc này sẽ giúp cho những người dùng sau nắm bắt được khái quát chất lượng của sản phẩm.
Người quản lý cũng sẽ phải có khả năng quản lý những thông tin trên hệ thống như sản phẩm, tài khoản, loại mặt hàng cũng như những bình luận của mặt hàng Đặc biệt là những đặc tính được trích ra từ bình luận.
Tổng quan hệ thong - 2-2 £+EE+EE£2EE+EE£EE£EEE2EEEEEEEEEEEEZEEEEErrkerrree 16
Đề đáp ứng được những tiêu chí trên, ứng dụng cần có những chức năng như: e Ứng dụng có thông tin của các sản phẩm trên thị trường, người dùng có thé tìm kiêm sản phâm va xem thông tin chi tiệt của bat kỳ sản phâm nao. e Ứng dụng nên chia sản phẩm theo danh mục hoặc hãng dé khách hàng thuận tiện khi tra cứu. e Ứng dụng cung cấp cho người dùng có cái nhìn tổng quan về đánh giá/trải nghiệm của người dùng về sản phẩm, từ đó có thé đưa ra quyết định mua hang đúng đắn. e Ứng dụng sẽ tong hợp được số lượng các đánh giá Tích cực và tiêu cực của sản phẩm, sau đó hién thị ở phan thông tin sản phẩm. e Ung dung sé hién thi những đặc tinh được trích ra từ đánh giá như: “rất bền”,
“mẫu mã đẹp”, “chất lượng tốt”, dé người dùng có thé có cái nhìn tổng quan về sản phâm.
Pham Trung Kiên — DI7CNPMS 16
Khoá luận tốt nghiệp Đại học Chương 1: Đánh giá trực tuyến e Ung dụng được cai đặt va phat trién trén nén tang website Phuc vu đối tượng khách hàng muốn mua, có dự định mua sản phẩm online/mua trực tiếp tại cửa hàng. e Ung dụng sẽ lưu lại lịch sử đánh gia của người dùng dé họ có thé thuận tiện tra cứu cũng như xem lại những gì mình đã đánh giá về sản phâm. ® Ưng dụng nên có ứng dụng con riêng đê xử lý các đánh giá của người dùng Việc se Ú e Ú chia công việc ra như vậy sẽ giảm tai cho hệ thống khi nhận 1 lượng truy cập lớn.
Ing dụng cần có trang riêng biệt cho người quan lý dé có thé thuận tiện cho việc cập nhật, sửa, xoá các thông tin trên hệ thống. ing dụng cung cấp cho người quản lý khả năng xem thống kê về sản phẩm, đánh giá và ty lệ đánh gia của các sản phâm. Đó là các chức năng mà ứng dụng sẽ cần phải đáp ứng được dé có thể thực hiện được nhiệm vụ làm một diễn đàn cho người tiêu dùng chia sẻ đánh giá của sản phẩm và giúp đỡ nhau chọn được một sản phâm phù hợp.
Qua chương 1, đồ án đã trình bày đặc điểm của Đánh giá trực tuyến và làm rõ ý tưởng và mục tiêu xây dựng hệ thống hỗ trợ lựa chọn sản phẩm cho người tiêu dùng.
Chương 2 sẽ trình bày về thuật toán được sử dung dé xây dung mô hình phân tích đánh giá của người dùng đồng thời phân tích các ưu điểm, nhược điểm của thuật toán.
Pham Trung Kiên — DI7CNPMS 17
Khoá luận tốt nghiệp Đại học Chương 2: Thuật toán Suy giảm độ đốc ngẫu nhiên SGD
Thuật toán suy giảm độ dốc ngẫu nhiên SGŒD
Thuật toán Suy giảm độ dốc (Gradient Descen†) . - - s- scxes+xezvrxerxseeree 19
Gradient, theo thuật ngữ đơn giản có nghĩa là độ dốc hoặc độ nghiêng của bề mặt.
Vì vậy, Gradient Descent theo nghĩa đen có nghĩa là đi xuống một độ dốc đề đến điểm thấp nhất trên bề mặt đó Ví dụ:
Hình 2.2 Ví dụ điểm cực tiểu của hàm 1 biến [12]
Trong đồ thị ở trên, điểm thấp nhất trên parabol xảy ra tại x = -2 Mục tiêu của thuật toán giảm độ doc là tìm giá tri của “x” sao cho “y” là nhỏ nhat “Y” ở đây được gọi là hàm mục tiêu mà thuật toán giảm độ doc hoạt động dựa trên, đê giảm xuông diém thấp nhất. Điêm cực tiêu x”của hàm sô là điêm có đạo hàm f’(x*) bang 0 Hon thê nữa, trong lân cận của nó, đạo hàm của các điêm phía bên trái x” là không dương, đạo hàm của các điêm phía bên phải x* là không âm.
Pham Trung Kiên — DI7CNPMS 19
Khoá luận tốt nghiệp Đại học Chương 2: Thuật toán Suy giảm độ dốc ngẫu nhiên SGD Đường tiếp tuyến VỚI đồ thị hàm số đó tại 1 điểm bat kỳ có hệ số góc chính bằng đạo ham của hàm sô tại diém đó.
Trong hình 2.2, các điêm bên trái của diém cực tiêu màu xanh lục có đạo ham âm, các điêm bên phải có đạo hàm dương Và đôi với hàm sô này, càng xa vê phía trái của diém cực tiêu thì đạo ham cảng âm, càng xa về phía phải thì đạo hàm càng dương.
Trong các bài toán tối ưu, chúng ta thường tìm giá trị nhỏ nhất của 1 hàm số nào đó, mà hàm số đạt giá trị nhỏ nhất khi đạo hàm bằng 0 Nhưng đâu phải lúc nào đạo hàm hàm số cũng được, đối với các hàm số nhiều biến thì đạo hàm rất phức tạp, thậm chí là bat khả thi Nên thay vào đó người ta tìm điểm gan với điểm cực tiêu nhất và xem đó là nghiệm bai toán Hướng tiếp cận ở đây là chọn 1 nghiệm ngẫu nhiên cứ sau mỗi vòng lặp (hay epoch) thì cho nó tiến dan đến điểm cần tìm.
Các điểm cực tiêu là nghiệm của phương trình đạo hàm băng 0 Nếu bằng một cách nào đó có thê tìm được toàn bộ (hữu hạn) các điểm cực tiểu, ta chỉ cần thay từng điểm cực tiểu đó vào hàm số rồi tìm điểm làm cho hàm có giá trị nhỏ nhất Tuy nhiên, trong hầu hết các trường hợp, việc giải phương trình dao hàm bằng 0 là bất khả thi. Nguyên nhân có thể đến từ sự phức tạp của dạng của đạo hàm, từ việc các điểm dữ liệu có số chiều lớn, hoặc từ việc có quá nhiều điểm đữ liệu.
Hướng tiếp cận phổ biến nhất là xuất phát từ một điểm mà chúng ta coi là gần với nghiệm của bài toán, sau đó dùng một phép toán lặp dé tiến dần đến điểm cần tìm, tức đến khi đạo hàm gần với 0 Gradient Descent và các biến thé của nó là một trong những phương pháp được dùng nhiều nhất.
Gradient Descent là một thuật toán lặp lại, bắt đầu từ một điểm ngẫu nhiên trên một hàm va di xuống theo độ đốc của nó theo từng bước cho đến khi nó đạt đến điểm thấp nhất của hàm đó.
Gradient Descent cho hàm một biến
Giả SỬ X; là điểm ta tìm được sau vòng lặp thứ t Ta cần tìm một thuật toán để đưa x, về càng gần x*cang tốt.
Trong hình đầu tiên, ta thấy:
1 Nếu đạo hàm của ham số tại x¿: f’ (x" ) > 0 thì x, nằm về bên phải SO VỚI X” (và ngược lại) Dé điểm tiếp theo x;„; gần với x* hon, chúng ta cần di chuyền X¡ VỀ phía bên trái, tức về phía âm Nói các khác, chúng ta cần di chuyên ngược dấu với đạo hàm [12]:
Trong đó A là một đại lượng ngược dau với đạo hàm f'(x*)
2 x, càng xa x” về phớa bờn phải thỡ f’(ô*) càng lớn hơn 0 (và ngược lại) Vậy, lượng di chuyên A, một cách trực quan nhật, là tỉ lệ thuận với —f'(x*)
Pham Trung Kiên — DI7CNPMS 20
Khoá luận tốt nghiệp Đại học Chương 2: Thuật toán Suy giảm độ đốc ngẫu nhiên SGD
Hai nhận xét phía trên cho chúng ta một cách cập nhật đơn giản là [12]:
Trong đó 1 (eta) là một số đương được gọi là learning rate (tốc độ học) Dấu trừ thé hiện việc chúng ta phải đi ngược với đạo ham Các quan sat đơn giản phía trên, mặc dù không phải đúng cho tất cả các bài toán, nhưng là nền tảng cho rất nhiều phương pháp tối ưu nói chung và thuật toán Machine Learning nói riêng.
Hình 2.3 Hình minh họa về Suy giảm độ dốc trên một loạt các cấp độ [15]
Quá trình tìm điểm cực tiểu được minh họa trong hình trên Ở đây, F được giả định là xác định trên mặt phẳng và đồ thị của nó có dang hình bát Các đường cong mau xanh lam là các đường đồng mức, nghĩa là các vùng mà giá tri của F là không đổi Mũi tên màu đỏ bắt nguồn từ một điểm cho biết hướng của gradient âm tại điểm đó Lưu ý rang gradient (âm) tại một điểm là trực giao với đường đồng mức di qua điểm đó Chúng ta thấy rằng sự giảm dần gradient dẫn chúng ta đến đáy của cái bát, nghĩa là, đến điểm mà giá trị của hàm F là nhỏ nhất.
Pham Trung Kiên — DI7CNPMS 21
Khoá luận tốt nghiệp Đại học Chương 2: Thuật toán Suy giảm độ đốc ngẫu nhiên SGD
Gradient Descent cho hàm nhiều biến
Giả sử ta cần tìm điểm mà hàm số đạt giá trị nhỏ nhất cho hàm f (8) trong đó 0 (theta) là một vector, thường được dùng dé ký hiệu tập hợp các tham sô của một mô hình cân tối ưu (trong Linear Regression thì các tham sô chính là hệ số w) Đạo hàm của hàm số đó tai một điểm 0 bat kỳ được ký hiệu là Vạƒ() (V: nabla) Tương tự như ham 1 biến, thuật toán GD cho hàm nhiều biến cũng bắt đầu bằng một điểm dự đoán Oo, sau đó, ở vòng lặp thứ t, quy tắc cập nhật là [12]:
Go41 = ỉ, —nVaƒ(9;) (2.3) Hoặc viết dưới dang đơn giản hon [12]:
8= 0—nVaƒ() (24) Quy tắc cần nhớ: luôn luôn đi ngược hướng với đạo hàm.
Gradient dưới góc nhìn vật lý
Thuật toán GD thường được vi với tác dụng cua trọng lực lên một hòn bi đặt trên một mặt có dạng như hình một thung lũng giống như hình 2.4a dưới đây Bat kể ta đặt hòn bi ở A hay B thì cuối cùng hòn bi cũng sẽ lăn xuống và kết thúc ở vị trí C.
Hình 2.4 Minh hoạ thuật toán GD đưới góc nhìn vật lý [ I2]
Tuy nhiên, nếu như bề mặt có hai đáy thung lũng như hình 2.4b thì tùy vào việc đặt bi ở A hay B, vị trí cuối cùng của bi sẽ ở C hoặc D Điểm D là một điểm cực tiểu chúng ta không mong muốn.
Nếu suy nghĩ một cách vật lý hơn, vẫn trong hình 2.4b, nếu vận tốc ban đầu của bi khi ở điểm B đủ lớn, khi bi lăn đến điểm D, theo đà, bi có thé tiếp tục di chuyên lên dốc phía bên trái của D Và nếu giả sử vận tốc ban đầu lớn hơn nữa, bi có thé vượt dốc tới điểm E rồi lăn xuống C như trong hình 2.4c Đây chính là điều chúng ta mong muốn.
Pham Trung Kiên — DI7CNPMS 22
Khoá luận tốt nghiệp Đại học Chương 2: Thuật toán Suy giảm độ dốc ngẫu nhiên SGD
Dựa trên hiện tượng này, một thuật toán được ra đời nhằm khắc phục việc nghiệm của GD rơi vào một điểm cực tiểu không mong muốn Thuật toán đó có tên là
Nesterov accelerated gradient (NAÀ) HH HH ng HH Hư 23
Trong vi dụ ở hình 2.4, Momentum giúp hòn bi vượt qua được dốc điểm cực tiểu, tuy nhiên, có một hạn chế chúng ta có thể thây: Khi tới gần đích, momemtum vẫn mắt khá nhiều thời gian trước khi dừng lại Lý do lại cũng chính là vì có đà Có một phương pháp khác tiếp tục giúp khắc phục điều này, phương pháp đó mang tên Nesterov accelerated gradient (NAG), giúp cho thuật toán hội tụ nhanh hon. Ý tưởng chính Ý tưởng cơ bản là dự đoán hướng đi trong tương lai, tức nhìn trước một bước!
Cụ thể, nếu sử dụng s6 hang momentum yv; — 1 dé cập nhật thi ta có thể xấp xỉ được vị trớ tiếp theo của hũn bi là ỉ —yv, — 1 (chỳng ta khụng đớnh kốm phan gradient ở đõy vì sẽ sử dụng nó trong bước cuối cùng) Vậy, thay vì sử dụng gradient của điểm hiện tại, NAG đi trước một bước, sử dung gradient của điểm tiếp theo.
Pham Trung Kiên — DI7CNPMS 23
Khoá luận tốt nghiệp Đại học Chương 2: Thuật toán Suy giảm độ đốc ngẫu nhiên SGD
Momentum update Nesterov momentum update
“lookahead” gradient step (bit different than original) momentum step momentum step actual step actual step
Hình 2.5 Ý tưởng cua Nesterov accelerated gradient [12] ô V6i momentum thụng thường: lượng thay đổi là tụng của hai vector: momentum vector và gradient ở thời diém hiện tai. se Voi Nesterove momentum: lượng thay đôi là tông của hai vector: momentum vector và gradient ở thời điêm được xâp xi là điêm tiêp theo.
Công thức cập nhật của NAG được cho như sau [12]:
Dưới đây là ví dụ so sánh Momentum va NAG cho bài toán Linear Regression:
Hình bên trái là đường đi của nghiệm với phương pháp Momentum nghiệm đi khá là zigzag và mât nhiêu vòng lặp hơn Hình bên phải là đường đi của nghiệm với phương pháp NAG, nghiệm hội tụ nhanh hon, và đường di ít zigzag hon.
Từ đó ta có thé tom gon được những ưu và nhược điểm của GD: Ưu điểm:
- Thuật toán Suy giảm độ dốc cơ bản, dé hiểu.
Pham Trung Kiên — DI7CNPMS 24
Khoá luận tốt nghiệp Đại học Chương 2: Thuật toán Suy giảm độ dốc ngẫu nhiên SGD
- Thuật toán đã giải quyết được vấn đề tối ưu mô hình Mạng nơ-ron nhân tạo bằng cách cập nhật trọng số sau mỗi vòng lặp.
- Vì đơn giản nên thuật toán Suy giảm độ dốc còn nhiều hạn chế như phụ thuộc vào nghiệm khởi tạo ban đầu và Tốc độ học.
- Ví dụ 1 hàm số có 2 giá trị nhỏ nhất toàn cục thì tùy thuộc vào 2 điểm khởi tạo ban đầu sẽ cho ra 2 nghiệm cuối cùng khác nhau.
- Tốc độ học quá lớn sẽ khiến cho thuật toán không hội tụ, quanh quân bên đích vì bước nhảy quá lớn; hoặc tốc độ học nhỏ ảnh hưởng đến tốc độ huấn luyện.
Suy giảm độ dốc ngẫu nhiên SŒD - 2-22 2£ E+2E££E£EE£EEtEEEEzExrrkerkerree 25
Thông thường, có ba biến thé Thuật toán Suy giảm độ dốc:
- _ Suy giảm độ đốc theo lô (Batch Gradient Descent)
- Suy giảm độ đốc ngẫu nhiên (Stochastic Gradient Descent)
- _ Suy giảm độ đốc theo lô nhỏ (Mini-batch Gradient Descent)
Nhưng trong phạm vị đồ án này, ta sẽ chỉ tìm hiểu về Suy giảm độ dốc ngẫu nhiên.
Trong thuật toán này, tai | thời điểm, ta chỉ tinh đạo hàm của ham mat mát dựa trên chỉ một điểm dữ liệu x; rồi cập nhật 0 dựa trên đạo hàm này Việc nay được thực hiện với từng điểm trên toàn bộ dữ liệu, sau đó lặp lại quá trình trên Thuật toán rất đơn giản này trên thực tế lại làm việc rất hiệu quả.
Mỗi lần duyệt một lượt qua tat cả các điểm trên toàn bộ dit liệu được gọi là một epoch Với GD thông thường thì mỗi epoch ứng với 1 lần cập nhật 0, với SGD thì mỗi epoch ứng với N lần cập nhật 0 với N là số điểm dữ liệu Nhìn vào một mặt, việc cập nhật từng điểm một như thế này có thể làm giảm đi tốc độ thực hiện 1 epoch.
Nhưng nhìn vào một mặt khác, SGD chỉ yêu cầu một lượng epoch rất nhỏ (thường là 10 cho lần đầu tiên, sau đó khi có đữ liệu mới thì chỉ cần chạy dưới một epoch là đã có nghiệm tốt) Vì vậy SGD phủ hợp với các bài toán có lượng cơ sở dữ liệu lớn (chủ yếu là Deep Learning) và các bài toán yêu cầu mô hình thay đổi liên tục, tức online learning.
Thứ tự lựa chọn điểm dữ liệu
Một điểm cần lưu ý đó là: sau mỗi epoch, chúng ta cần xáo trộn thứ tự của các dữ liệu dé dam bảo tính ngau nhiên Việc này cũng ảnh hưởng tới hiệu năng của SGD.
Một cách toán học, quy tắc cập nhật của SGD là [12]:
Pham Trung Kiên — DI7CNPMS 25
Khoá luận tốt nghiệp Đại học Chương 2: Thuật toán Suy giảm độ đốc ngẫu nhiên SGD trong đó PaJ(6; x;; y¡) là hàm mat mát với chỉ 1 cặp điểm đữ liệu (input, label) là Vo] (8; x¡; y¡)
Chúng ta hoàn toàn có thé áp dung các thuật toán tăng tốc GD như Momentum,
Với bài toỏn Linear Regression ỉ8 = w, hàm mất mỏt tại một điểm dữ liệu là [12]:
Dao ham theo w tuong tng 1a [12]:
Nói tóm lại, khi toc độ học tap 7 giảm với một ty lệ thích hợp, đường giảm độ dôc ngau nhiên gân như chắc chăn hội tụ vê mức tôi thiêu toàn cục khi hàm mục tiêu là lôi hoặc giả lôi, và nêu không thì gân như hội tụ chắc chăn ở mức tôi thiêu cục bộ.
Hình 2.7 Đường di của nghiệm với SGD
Stochastic Gradient Descent Gradient Descent
Hình 2.8 So sánh đường đi giữa SGD và GD [19]
Pham Trung Kiên — DI7CNPMS 26
Khoá luận tốt nghiệp Đại học Chương 2: Thuật toán Suy giảm độ dốc ngẫu nhiên SGD
Nhìn vào 2 hình trên, ta thấy SGD có đường đi khá là zic zắc, không mượt như
GD Dễ hiểu điều đó vì 1 điểm đữ liệu không thé đại diện cho toàn bộ dữ liệu.
GD có hạn chế đối với cơ sở đữ liệu lớn (vài triệu dữ liệu) thì việc tính toán đạo hàm trên toàn bộ dit liệu qua mỗi vòng lặp trở nên cồng kénh Bên cạnh đó GD không phù hợp với online learning Online learning là khi dữ liệu cập nhật liên tục (ví dụ như thêm người dùng đăng ký) thì mỗi lần thêm dữ liệu ta phải tính lại đạo hàm trên toàn bộ dữ liệu —› thời gian tính toán lâu, thuật toán không online nữa.
SGD ra đời dé giải quyết van dé đó, mỗi lần thêm đữ liệu mới vào, ta chỉ cần cập nhật trên 1 diém đữ liệu đó thôi, phù hợp với online learning. Ưu điểm:
SGD thường hội tụ nhanh hơn nhiều so với GD:
Thuật toán rất đơn giản này trên thực tế lại làm việc rất hiệu quả SGD chỉ yêu cầu một lượng epoch rất nhỏ (thường là 10 cho lần đầu tiên, sau đó khi có dit liệu mới thì chỉ cần chạy dưới một epoch là đã có nghiệm tốt) Do đó, nếu số lượng mẫu đào tạo lớn, thực tế là rất lớn, thì việc sử dụng GD có thé mat nhiều thời gian vì trong mỗi lần lặp khi ta phải cập nhật các giá trị của các tham số và đang chạy qua tập huấn luyện hoàn chỉnh Mặt khác, sử dụng SGD sẽ nhanh hơn vì ta chỉ sử dụng một mẫu đào tạo và nó bắt đầu tự cải thiện ngay từ mẫu đầu tiên.
Vì vậy SGD phù hợp với các bài toán có lượng cơ sở dt liệu lớn và các bài toán yêu câu mô hình thay đôi liên tục, tức online learning.
Thuật toán vẫn chưa giải quyết được 2 nhược điểm lớn của Suy giảm độ dốc (Tốc độ học và điểm dữ liệu ban đầu).
Một nhược điểm có lẽ là đường dẫn đến tối ưu (giả sử nó sẽ luôn luôn tối ưu như nhau) không được “mượt” như GD Vì vậy, thay vì một đường cong mat mịn đẹp, cho thấy lỗi giảm xuống như thé nao trong mỗi lần lặp của GD, với SGD, ta sẽ có đường đi zic zac (như hình 2.8)
Kết luận -: 222+t22 tt HH HH re 27 Chương 3: Thử nghiệm và đánh giá - - Sc 231 SH rriet 28
Qua chương 2, đồ án đã trình bày đặc điểm của thuật toán SGD cũng như tại sao nên sử dụng thuật toán này dé ứng dụng vào xây dựng hệ thống.
Trong chương 3, đồ án sẽ trình bày thực nghiệm và đánh giá giữa thuật toán SGD và 2 thuật toán khác dé chứng minh độ hiệu quả.
Pham Trung Kiên — DI7CNPMS 27
Thu thap niìg 0n
Chương 3: Thứ nghiệm và đánh giá
Trong chương này, đồ án sẽ trình bày quá trình các bước thử nghiệm và đánh giá thuật toán áp dụng vào mô hình phân tích đánh giá Thuật toán SGD sẽ được so sánh với 2 thuật toán khác đó là Naive Bayes và SVM Quá trình thu thập đữ liệu và chuẩn hoá dữ liệu cũng sẽ được trình bày đầy đủ trong chương này.
3.1.1 Thu thập và phân tích đặc điểm dữ liệu
Dữ liệu đánh giá đồ án sẽ lay từ Shopee vì đây là 1 nền tảng thương mại điện tử lớn, có sẵn lượng dữ liệu và phong phú về ngành hàng. Đặc thù của bình luận trên các sản thương mại điện tử là bao gôm phân đánh giá theo “sao” va lời bình luận “5 sao” sẽ là các bình luận tích cực (Positive), ngược lai “1 sao” sẽ là các bình luận tiêu cực (Negative).
Lợi dụng đặc điểm đó, chương trình sẽ thu thập dữ liệu dựa theo sỐ lượng “sao” của bình luận Các bình luận “5 sao” sẽ được gan nhãn Positive, các bình luận “1 sao” sẽ được gán nhãn Negative. ĐÁNH GIÁ SAN PHAM
49 trờn ử Tất Cả 5 Sao (578) 4 Sao (24) 3 Sao (6) 2 Sao (1) 1 Sao (6)
**w+*+* Có Bình Luận (343) Có Hinh Ảnh / Video (267)
Moi nhận rửa sơ rồi test thử nè Thịt nướng 180 độ 12phut như ảnh nha Chao tăng kèm day đủ Tks shop
Hình 3.1 Các đánh gia tích cực [15]
Pham Trung Kiên — DI7CNPMS 28
Khoá luận tốt nghiệp Đại học Chương 3: Thử nghiệm và đánh giá ĐÁNH GIÁ SAN PHAM
49 trên 5 Tất Cả 5 Sao (578) 4 Sao (24) 3 Sao (6) 2 Sao (1)
**+++x* Có Bình Luận (343) Có Hình Ảnh / Video (267) ee mushcz Ị een
Thái độ nhân viên hỗ trợ rất kém Ra yêu sách với khách
Hình 3.2 Các đánh giả tiêu cực [15]
Dé có thé lọc được các phản hồi từ giao điện của Shopee, đầu tiên, chương trình sẽ lây sô lượng bình luận hiên thị, đê có thể tính được số lần lặp qua các trang.
Sau đó công việc còn lại là lấy từng bình luận và lưu vào trang tính kèm theo nhãn của của bình luận đó (Positive: 1, Negative: -1).
Vì đôi khi sẽ xuất hiện các bình luận mang tính spam, hoặc các đánh giá bị ân bởi người bán hoặc hệ thống, vì thế chương trình cũng sẽ lọc bớt các bình luận này trước khi lưu vào file Các bình luận bị lọc là các bình luận chứa các từ như “lay xu”, “đánh giá bị an”,
Dé có được lượng đánh giá đa dạng về ý kiến và ngành hàng, đồ án sẽ thu thập data đánh giá từ các nhãn hàng như “máy tinh bảng”, “tivi”, “điều hoà”, “tai nghe”, với số lượng 10000 đánh giá tích cực, 10000 đánh giá tiêu cực. Ở mỗi mặt hàng, đồ án sẽ lấy 60 sản phẩm sắp xếp theo hướng giảm dần của doanh thu, mỗi sản phẩm đồ án sẽ lấy hết các đánh giá “5 sao” và “1 sao” Kết quả thu được:
Pham Trung Kiên — DI7CNPMS 29
Khoá luận tốt nghiệp Đại học Chương 3: Thử nghiệm và đánh giá
Bang 3.1 Danh sách một số đánh giá sau khi thu thập
Sac dk 2 lần là ko sac dk nữa -]
Hàng kém Sạc mãi k lên -1
Dùng dc 2 ngày đã vỡ qá chán -1
Op k ôm điện thoại cầm k chắc tay, -1
Giày đẹp, giữ được form Uom thử thấy êm chân Chỉ hơi tiếc là phần 1 mép gân đê giày bị môc nhẹ với mùi dép hơi nông.
Sản phẩm đẹp Chất lượng ok 1
Sản pham đúng với mô ta lai dé dang sử dung, đóng gói chắc chắn 1 Điện thoại nhỏ xinh, bỏ vừa vào cái ví nhỏ của mình luôn, nghe gọi, nt 1 cting oki, pin thi ko dung gi dé tam 2,3 ngay oki.
Cac nhãn được sử dụng bao gồm:
-_1(Positive): đánh giá mang tinh chất ủng hộ, khen, hài lòng với sản phẩm hoặc đánh giá có ý kiên tích cực nhiêu hơn tiêu cực.
- -1 (Negative): đánh giá tiêu cực, chê san pham, báo sản phẩm lỗi hoặc có nhiêu đánh giá tiêu cực hơn là tích cực.
Dựa vào những kết quả phân tích dữ liệu thô, ta tiến hành bước tiếp theo là tiền xử lý dữ liệu.
3.1.2 Tiền xử lý dữ liệu
Bộ dữ liệu lay từ danh sách các đánh giá trên trang chủ của Shopee, qua quá trình sàng lọc và đánh giá, đồ án nhận thấy dữ liệu có những đặc điểm cần xử lý như sau:
- _ Từ viết tắt sử dụng nhiều.
- Đánh giá có chèn link quảng cáo.
Pham Trung Kiên — DI7CNPMS 30
Khoá luận tốt nghiệp Đại học Chương 3: Thử nghiệm và đánh giá Đánh giá có các từ dài, lặp âm tiết dé lay “xu” trên Shopee. Đánh giá có chứa các ký tự đặc biệt
~ ~ dụng sao đc shop ơi.Giờ lại bảo gửi hàng để bao hànhĐáng nhé gửi hàng khác lên cho người giỏ tiộn cũng tốt nd đứ
Ban phím ok Đánh rất êmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmmm
Hình 3.3 Một số đánh giá can duoc chudn hod
Ngoài việc xử ly thủ công khi gan nhãn, ta cần thêm 1 số tiền xử ly co bản như:
Chuẩn hóa về chữ thường Thay thế các url trong dit liệu bởi nhãn link_spam Loại bỏ dấu câu và các ký tự đặc biệt sử dụng regex
Tach từ với word_tokenizer của underthesea Sau khi tách từ, đồ án sẽ thay thé dấu cách (space) bằng “_” dé dé dang phân biệt với dau cách trong câu.
Chuẩn hóa các từ viết tắt cơ bản (Ví dụ: k, ko, k0 > không, bt > bình thường, ), sử dụng một mang các từ viết tắt dé thay thế các từ đó khi tìm thay trong chuỗi Ví dụ như ‘ko’ = ‘Khong’, “đc” = “được”, ‘mk’ = ‘minh’,
Sau đó đữ liệu sẽ được lưu vao file pre_ data.xÌsx:
Sau khi thực hiện tuần tự và đầy đủ theo quy trình trên, ta thu được bộ dữ liệu sạch cho pha tiếp theo của mô hình.
Pham Trung Kiên — DI7CNPMS 31
Khoá luận tốt nghiệp Đại học Chương 3: Thử nghiệm và đánh giá
Bang 3.2 Các bình luận mang nhãn Negative (-1)
Comments Label sạc rất chậm - sạc được 2 lần là không sạc được nữa -] hàng kém sạc mãi không lên -1 dùng được 2 ngày đã vỡ quá chán -1 ốp không ôm điện thoại cầm không chắc tay -1 lừa đảo dây hỏng không sac được -1 sạc không vào đóng_ gói không tốt -1 không tự động ngắt khi sạc day chức_năng không giống miéu_ta -1
Bang 3.3 Các bình luận mang nhãn Positive (1)
Comments Label đẹp như hình luôn 1 giày đẹp giữ được form udm thử thay êm chân chỉ hơi tiếc là phần mép 1 gân đê giày bị môc nhẹ với mùi dép hơi nông san_pham đẹp chất_ lượng ok 1 san_pham đúng với m6_ta lại dé_dang sử dụng đóng gói chac_chan 1 và giao hàng shop đóng _ gói rất cân_ thận ful box luôn uy_tin 1 đã thử các tinh _năng của máy và rất hài_lòng sẽ ủng_hộ shop tiếp lần 1 sau san_pham đẹp tư_ vấn nhiệt tinh 1
Pham Trung Kiên — DI7CNPMS 32
Khoá luận tốt nghiệp Đại học Chương 3: Thử nghiệm và đánh giá
Sau khi xử lý, ta có bảng thông tin đánh giá thu thập được như sau:
Bang 3.4 Thuộc tính tập dữ liệu Đánh giá trực tuyến
Tổng số đánh giá 34.059 đánh giá Đánh giá tích cực 11.107 đánh giá Đánh giá tiêu cực 23.952 đánh giá Độ dài trung bình của đánh giá 81 ký tự Đánh giá dài nhất 305 ký tự
Nội dung: “Hý hửng đợi nhận hàng, đến khi mở hộp sản phẩm tìm mãi không thấy cái áo tặng kèm đâu cả Tut hết cả cảm xúc Chat với shop cũng ko giải quyết kêu do không chọn sản phâm tặng kèm Trong khi đó mình chọn rồi và chọn áo size L. Vào kiểm tra đơn hàng thì chỉ thấy mỗi đôi giày nên chịu chết vì không có chứng” Đánh giá ngắn nhất 2 ký tự:
Dé sử dung Naive Bayes của thư viện NLTK, ta cần chia đữ liệu đã được tiền xử lý vào các gói riêng biệt cho từng nhãn.
Ta duyệt qua tất cả đữ liệu đã được tiền xử lý để phân chia đữ liệu vào các list riêng biệt dựa vào label Positive hoặc Negative.
Dựa vào dir liệu ban đâu đã chuân hóa, các từ sẽ được tách với nhau bởi dau cach
(space), riêng các từ đôi sẽ nôi với nhau bởi
Kết luận +-++++2E k2 LH TH TH TH 36 Chương 4: Phát triển ứng dụng 2-2 £+S+EE£EE£EEC2EEEEEEEEEEEEErrkrrkrrkrres 37
Chương 3 của đồ án này đã trình bày cách thu thập dữ liệu cũng như cách đánh giá thuật toán đề tìm ra thuật toán thích hợp nhất.
Qua quá trình thử nghiệm và đánh giá, ta đã chon ra được SGD là mô hình thích hợp nhất với tap dit liệu. Ở chương 4, ta sẽ làm rõ cấu trúc của hệ thống và cách đưa mô hình vào ứng dụng trong hệ thống trên nền tảng web.
Pham Trung Kiên — DI7CNPMS 36
Khoá luận tốt nghiệp Đại học Chương 4: Phát triển ứng dụng
Chương 4: Phát triển ứng dụng
Trong chương này, đồ án sẽ trình bày tổng quan về cau trúc của hệ thống, công nghệ được sử dụng để xây dựng hệ thống và giao diện của hệ thống sau khi triển khai. Quá trình áp dụng mô hình phân tích đánh giá đã phân tích ở chương 3 vào hệ thống cũng sẽ được trình bày ở trong chương này.
Tổng quan về hệ thống 2-22 2£ +©+£+EE++EE+EEEEEEEEEEEEEEEEEEEErEEkrrkrrrkrsrkee 37
Các chức năng chính của hệ thống Ứng dụng “Hỗ trợ lựa chọn sản phẩm theo phản hồi của người dùng” hoạt động trên nền tảng Web, có khả năng cung cấp thông tin tổng quan về sản phâm/mặt hàng mà người dùng tìm kiếm Ngoài ra, ứng dung sẽ cung cấp đánh giá sản pham tổng quan dựa trên những phản hồi của người dùng trước đó.
Các chức năng chính có thể ké đến như: e Ứi ng dụng có thông tin của các sản phẩm trên thị trường, người dùng có thê tìm kiểm sản phẩm và xem thông tin chỉ tiết của bất kỳ sản phẩm nao. e Ứng dụng cung cấp cho người dùng có cái nhìn tổng quan về đánh giá/trải nghiệm của người dùng về sản phẩm, từ đó có thé đưa ra quyết định mua hang đúng đắn. e Ứng dụng sẽ tong hợp được số lượng các đánh giá Tích cực và tiêu cực của sản phâm, sau đó hiên thi ở phan thông tin san phâm. ° Ứng dụng sẽ hiển thị những đặc tính được trích ra từ đánh giá như: “rất bền”,
“mẫu mã đẹp”, “chất lượng tốt”, để người dùng có thé có cái nhìn tổng quan về sản phẩm. e Ứng dụng sẽ lưu lại lịch sử đánh giá của người dùng để họ có thê thuận tiện tra cứu cũng như xem lại những gì mình đã đánh giá về sản pham. e Người dùng có thé chọn dé so sánh các sản phẩm với nhau Nhưng tiêu chí dé so sánh các sản phâm sẽ là các đánh giá của người dùng về sản phâm đó. e Ứng dụng cần có trang riêng biệt cho người quản lý dé có thé thuận tiện cho việc cập nhật, sửa, xoá các thông tin trên hệ thông. e Ứng dụng cung cấp cho người quan lý kha năng xem thống kê về sản phẩm, đánh giá và ty lệ đánh giá của các sản phâm.
Người dùng sẽ có được 1 cái nhìn tổng quan về chất lượng của sản phẩm Bên cạnh đó, với mỗi sản phẩm, dựa vào những phản hồi trước đó của người dùng, ứng dụng sẽ lọc những đặc tinh được đánh giá tốt/không tốt và hién thị ở thông tin chi tiết của sản phâm, người dùng có thê dựa vào đó mà quyêt định lựa chọn mua hàng dựa theo nhu cầu và đặc tính của sản phẩm. Ứng dụng sẽ có 4 phần chính:
- Giao điện noi Client sẽ trực tiếp tương tác.
Pham Trung Kiên — DI7CNPMS 37
Khoá luận tốt nghiệp Đại học Chương 4: Phát triển ứng dụng
- Server nhận request và cung cấp tài nguyên cho client Ứng dụng này sẽ được xây dựng bằng Java Spring Boot.
- Ung dụng phân tích đánh giá (Comment Analysis API) Một API thực hiện việc phân tích đánh giá của người dùng Được xây dựng bằng Django.
- _ Cơ sở dt liệu (database) được xây dựng bang MySQL, là noi lưu trữ dữ liệu của toàn bộ ứng dụng.
Nhận yêu cầu xem sản pham
A ơ ~ * z ửi yêu cou |_—Truy van đến database Tim sản pham
Phan chia cac danh giá theo nhãn
Tìm đánh giá của sản pham
Tim cac thudc tinh của danh giả
Khi người dùng gửi 1 yêu cầu xem thông tin của sản phẩm, một yêu cầu sẽ được gửi đến server Khi server nhận được yêu cầu này, nó sẽ thực hiện truy vấn vào cơ sở dữ liệu dé lấy thông tin sản phẩm, đánh giá của sản phâm cũng như những thuộc tinh của đánh giá đó Sau đó toàn bộ những thông tin này sẽ được phân chia theo các nhãn
(Tích cực hoặc Tiêu cực) và hiển thị lại cho người dùng.
Pham Trung Kiên — DI7CNPMS 38
Client Va 51-0⁄:fAùỤùẦùẦùmIùẶỤùQQVQOấáẶ
Kiểm tra Z & Sung Hiễn thị thông báo lỗi
Gửi kết qua đánh giá
= Hiễn thị đánh giá vả
Hình 4.2 Tổng quan hoạt động của hệ thong khi người dùng gửi đánh giá
Khi người dùng gửi đánh giá lên hệ thống, đánh giá đó sẽ được lưu vào cơ sở dữ liệu, đồng thời gửi cho API phân tích đánh giá dé phân tích.
Sau khi kết quả phân tích được trả lại, hệ thống sẽ dựa vào kết quả, cập nhật đánh giá của sản phẩm trên cở sở đữ liệu, đồng thời hiển thị đánh giá đó cũng với những thuộc tính đặc trưng lên giao diện.
4.2.1 Cấu trúc chính Ứng dụng hoạt động trên nền tảng web sẽ được xây dựng bằng Spring Boot, gồm các thành phần sau:
Pham Trung Kiên — DI7CNPMS 39
Khoá luận tốt nghiệp Đại học Chương 4: Phát triển ứng dụng
File dữ liệu đánh giá
Hình 4.3 Tổng quan cấu trúc của ứng dụng
- Controller: trả về View (có chứa data sẵn, dạng HTML), hoặc Model thể hiện dưới dạng API cho View.
- Service: chứa các code tính toán, xử lý Khi Controller yêu cau, thì Service tương ứng sé tiêp nhận và cho ra dữ liệu trả cho Controller (trả về Model) Controller sẽ gửi vê View như trên.
- Repository: Service còn có thé tương tác với service khác, hoặc dùng Repository để gọi Database Repository trực tiếp tương tác, đọc ghi đữ liệu trong Database và trả cho service.
- Model chỉ đơn giản là các đối tượng được Service tính toán xong trả về cho
- View là 1 file HTML có data rồi Lúc này Controller sẽ pass dit liệu vào View va
“return” về (Trong ứng dụng này sẽ sử dụng Thymeleaf dé xử ly đưa dit liệu vào view).
- Ngoài ra, về database, ứng dung sé sử dung MySQL dé xây dung và truy van dữ liệu.
Nhiệm vụ chính của ứng dụng web này là cung cấp dich vụ dé người dùng có thé thực hiện tương tác Mọi thao tác xem sản phẩm, đánh giá hay quản lý sản phẩm (đối với admin) đều được xử lý qua ứng dụng Có thể mô tả quá trình đó như sau:
Pham Trung Kiên — DI7CNPMS 40
Khoá luận tốt nghiệp Đại học Chương 4: Phát triển ứng dụng
- Dau tiên, user sẽ vào View đê xem, tương tac.
- Khi user bắt đầu load dir liệu (truy cập vào trang), thi 1 request từ View gửi cho
- Controller nhận được yêu câu, dựa vào annotation sẽ gọi đên service (hay method cua service).
- Service nhận được yêu cầu từ Controller, đối với các code đơn giản như hiển thị giao điện thi có thể return luôn giao điện Nhưng các thao tác cần truy cập tới database thì Service phải gọi Repository để lấy dữ liệu trong database
- Repository nhận được yêu cau từ Service, sẽ thao tác với database Data lay ra trong database được hệ thống ORM (như JPA hoặc Hibernate) mapping thành các object (trong Java) Cac object này gọi là Entity.
Và bây giờ sẽ là đi ngược lại trả vê cho user:
- Service nhận các Entity được Repository trả về, biến đôi nó Biến đổi ở đây là có thé thực hiện tính toán, thêm bớt các field, và cuối cùng biến Entity thành
Model Model sẽ được trả lại cho Controller.
- Controller nhận được Model, nó sẽ return cho View Có 2 cách, một là dùng template engine pass dữ liệu Model vào trang HTML, rồi trả về cục HTML (đã có data) cho client (Sử dụng Thymeleaf) Cách 2 là gửi qua API, View tự parse ra và hiển thị tương ứng (hién thi thé nào tùy View).
- Khi View hiên thị xong, user sẽ thay giao diện được hiên thị với dữ liệu mong muốn.
Một phan quan trong trong ứng dung này, đó là gọi API dé xử lý đánh giá va nhận về kết quả xử lý Đề thực hiện được việc này, ta sử dụng RestTemplate.
RestTemplate là một trong những thành phan cốt lõi của Spring framework cho phép thực thi các HTTP request và nhận các các response tương ứng Ban than
RestTemplate là một high-level API cho phép loại bỏ các mã code nhàm chán dé cau hình một java.net.HttpURLConnection sử dung dé gửi và nhận các request/response ma Java SDK cung cấp.
Sử dụng RestTemplate sẽ giúp chúng ta rút gan được những công việc sau:
- Chuyén déi HTTP response sang Java Object.
Pham Trung Kiên — DI7CNPMS 4I
Khoá luận tốt nghiệp Đại học Chương 4: Phát triển ứng dụng
4.3 Ứng dụng phân tích đánh giá Ứng dụng phân tích đánh giá (Comment Analysis API CAA) là một API giup xu ly danh gia của người dùng va gửi về nhãn của đánh giá cùng với những đặc tính nồi bật được nhắc đến trong đánh giá đó.
Việc sử dụng 1 API riêng sẽ giảm bớt lượng thông tin cần xử lý cho server mà khách hang đang sử dụng dé xem sản phẩm và gửi đánh giá Khi có nhiều khách hang cùng gửi đánh giá đồng thời, lượng thông tin cần xử lý sẽ trở nên rất lớn, nếu chỉ sử dụng 1 server cho cả việc xử ly và phân tích đánh giá, server có thé trở nên đình trệ. Thêm vào đó, nếu lượng tải lớn dẫn đến có lỗi xảy ra, server vẫn có thể hoạt động, người dùng vẫn có thể gửi đánh giá, việc phân tích đánh giá có thể xảy ra sau khi API đã được phục hồi.
Ta cùng di sâu vào cách hoạt động của API:
Input của API sẽ là 1 JSON có chứa đánh giá của người dùng.
API sẽ lay nội dung đánh giá, tiền xử lý (loại bỏ link, kí tự đặc biệt, chuan hoá, thay thế dấu cách, ) và sau đó đưa vào mô hình SGD đã huấn luyện ở Chương 3. Đối với phần trích ra các đặc tính nồi bật được nhắc đến trong đánh giá, nhờ vào
POS Tagging của thư viện underthesea, sau khi các từ trong đánh giá đã được gan nhãn là danh từ, tính từ, động từ, ta có thê lây ra các từ dựa vao vi trí của chúng.
Giao diện và chạy Ứng Ụng - - - c1 1v HH ng ngờ 4
SHAREPINION Trangchủ iPhone 12 Pro 64Gb
Hình 4.5 Giao diện trang thông tin sản phẩm (1) Ở giao diện thông tin sản phẩm, ngoài những thông tin về sản phẩm, số lượng đánh giá tích cực và tiêu cực cũng sẽ được liệt kê Đông thời, những đặc tính được trích ra từ những đánh giá tích cực/tiêu cực đó cũng sẽ được hiên thị.
Pham Trung Kiên — DI7CNPMS 44
Khoá luận tốt nghiệp Đại học Chương 4: Phát triển ứng dụng Đánh giá sản phẩm
2022-01-01 18:39:36 Âm thanh xịn, máy đẹp
Pin khoẻ, tốc độ cao
L3 Lì L3 L3 L2 Hình 4.6 Giao diện trang thông tin sản phẩm (2) Ở phần đánh giá san phâm, ngoài danh sách các đánh giá của người dùng trên trang trực tiếp đánh giá về sản phẩm, ứng dụng còn cung cấp đánh giá từ trang thương mại điện tử khác (Shopee) dé người dùng có thể tham khảo.
#2 So sảnh với sản phẩm khác
Giao diện thông tin sản phẩm còn cung cấp chức năng giúp người sử dụng có thé lựa chọn sản phẩm dé so sánh với sản phẩm khác cùng loại Người dùng có thé tìm kiếm sản phâm mình mong muốn (nhưng phải cùng loại sản phẩm, không thé so sánh một chiếc bàn với một chiếc điện thoại).
Pham Trung Kiên — DI7CNPMS 45
Khoá luận tốt nghiệp Đại học Chương 4: Phát triển ứng dụng
Kh Ở giao diện so sánh sản phâm này, 2 sản phâm sẽ được đặt song song đề so sánh Những thuộc tính được trích ra từ đánh giá của người dùng về từng sản phẩm sẽ được hiền thị và chia thành từng phần theo thuộc tính Ví dụ với sản phẩm là điện thoại, các thuộc tính sẽ được chia thành các phần như:
Các thuộc tính khác: bao gồm các thuộc tính không thuộc các thuộc tính trên.
Khi người dùng di chuột vào một thanh đánh giá, các thuộc tính chi tiết sẽ được hiển thị:
Pham Trung Kiên — DI7CNPMS 46
Khoá luận tốt nghiệp Đại học Chương 4: Phát triển ứng dụng
6 Le) Chưa có đánh gia! màn hình đẹp màn hình nét màn hình xấu Độ bền ngành gói Hình 4.9 Hiển thị độ chênh lệch giữa đặc tính
Các phân thuộc tính cũng sẽ hiên thị sô lượng chênh lệch giữa các thuộc tính tích cực và tiêu cực đê người dùng có thê so sảnh và có cái nhìn tông quan vê đặc điêm cua sản phâm. Đối với người quản lý trang, ứng dụng cũng cung cấp những tinh năng dé quản lý trang cơ bản như them thành viên, thêm sản phẩm và quản lý đánh giá,
Hình 4.10 Giao diện chính của trang quản lý
Sau khi đăng nhập bằng tài khoản của người quản lý, giao diện chính của trang quan lý sẽ hiển thị với các thống kê về sản phẩm và đánh giá trên trang.
ADMINISTRATION san lý thành viên h yQuản lý sản phẩm Thêm đánh giá sản phẩm
Thêm đánh giá sản phẩm
Hình 4.11 Giao diện thêm đánh giá sản phẩm
Người quản lý ngoài khả năng thêm/sửa/xoá sản phẩm, họ có thể thêm đánh giá từ các nguồn khác nhau cho sản pham Người quản lý có thé tải lên 1 file excel chứa các đánh giá, ứng dụng sẽ lấy các đánh giá, gửi lên API và sau đó lưu vào CSDL như một đánh giá của sản phẩm.
Pham Trung Kiên — DI7CNPMS 47
Khoá luận tốt nghiệp Đại học Chương 4: Phát triển ứng dụng
Ngoài ra, ở trang quản lý đánh giá, người dùng có thé thấy được thông tin của số lượng đánh giá đang có trong mô hình phân tích cũng như số đánh giá mới chưa được đưa vào dit liệu của mô hình Khi lượng đánh giá mới vượt quá 10% số lượng đánh giá trong mô hình, ứng dụng sẽ hiển thị tin nhắn thông báo người dùng nên chạy lại huấn luyện mô hình.
Q Quản lý thành viên @Danh sách đánh giá
Số lượng đánh giá mới Số lượng đánh giá 48 huấn luyện
ID Sản phẩm Nội dung Phân loại Huấn luyện Hành động
1 iPhone 12 Pro 64Gb Sản phẩm tuyệt vời, mẫu mã đẹp Tích cực Chưa huấn luyện [z|x|
Hình 4.12 Trang quản lý đánh giá
Qua chương 4, ta đã có một cái nhìn tổng quan về cấu trúc hệ thống ứng dụng cũng như cách đưa mô hình thuật toán đã huấn luyện vào ứng dụng.
Ngoài ra, đồ án cũng đã chỉ ra được hoạt động của ứng dụng khi triển khai áp dụng thực tiễn.
Pham Trung Kiên — DI7CNPMS 48
Khoá luận tốt nghiệp Đại học Kết luận
Qua ứng dụng này, ta có thé thay được lợi ích của việc sử dụng Machine Learning vào thương mại, đặc biệt là thương mại điện tử Không chỉ có lợi cho các doanh nghiệp trong việc định hướng và đem sản phâm gần hơn đối với người dùng, khi áp dụng đúng cách, Machine Learning còn giúp ích rất nhiều cho khách hàng trong việc đưa ra lựa chọn sản phẩm phù hợp với nhu cầu mua sắm. Ứng dụng đã đáp ứng được:
Thu thập được lượng đánh giá đa dạng trên nền tảng thương mại điện tử
- Dé huấn luyện mô hình phân tích đánh giá, đồ án đã thu thập được bộ dit liệu với tong số 34.059 đánh giá (23.952 đánh giá tích cực và 11.107 đánh giá tiêu cực) đã gắn nhãn cho từng đánh giá.
- _ Những đánh giá này, sau khi trải qua xử lý, đã trở thành nền tang dé huấn luyện và xây dựng mô hình phân tích đánh giá cho ứng dụng.
- - Những đánh giá thu thập được cũng trở thành lượng thông tin tham khảo tương đối tin cậy cho người dùng dé có thể thấy được những đặc điểm nỗi bật của sản phẩm.
- Tap dữ liệu đánh giá có thể được sử dụng dé huấn luyện cho các mô hình khác trong lĩnh vực Deep Learning.
Thử nghiệm đánh giá các thuật toán và chọn được thuật toán thích hợp
- Tir tập dữ liệu phong phú đã thu thập được, đồ án đã tiến hành thử nghiệm va đánh giá với 3 thuật toán phổ biến là SGD, SVM va Naive Bayes.
- Qua quá trình thử nghiệm, đồ án đã lựa chọn thuật toán SGD dé xây dựng mô hình dựa trên chỉ số fl (~94.23%) Hai thuật toán còn lại cũng đạt được chỉ số fl tương đối cao: SVM (86.52%) và Naive Bayes (93.24%).