TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG VIỆN KINH TẾ VÀ KINH DOANH QUỐC TẾ ---***---TIỂU LUẬN PHÂN TÍCH DỮ LIỆU TRONG KINH DOANH NGHIÊN CỨU NHỮNG TÁC ĐỘNG ĐẾN SỰ YÊU THÍCH CỦA NGƯỜI TIÊU DÙNG VỚI CÁ
Trang 1TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG VIỆN KINH TẾ VÀ KINH DOANH QUỐC TẾ
-*** -TIỂU LUẬN PHÂN TÍCH DỮ LIỆU TRONG KINH DOANH
NGHIÊN CỨU NHỮNG TÁC ĐỘNG ĐẾN SỰ YÊU THÍCH CỦA NGƯỜI TIÊU DÙNG VỚI CÁC SẢN PHẨM THƯƠNG HIỆU SEPHORA
Giảng viên hướng dẫn : TS Phạm Thị Cẩm Anh
Hà Nội, tháng 3 năm 2024 DANH SÁCH THÀNH VIÊN NHÓM 4
Trang 2STT Họ và tên MSV
Tỷ lệ đóng góp
2 Lê Sỹ Nhật Minh 2215510902 14.3%
Rút insight charts
Đề xuất giải pháp Lời mở đầu
Hoàn thiện tiểu luận
Xây dựng giả thuyết
Đề xuất giải pháp.Làm sạch dữ liệu
4 Đào Khánh Xuân 2215510131 14.3% Tổng quan bộ dữ liệu
Trực quan hoá dữ liệu
5 Nguyễn Thị Thư 2214510149 14.3%
Xây dựng giả thuyếtTrực quan hoá dữ liệu.Hoàn thiện kết luận
6 Đào Thị Huyền Trang 2215510121 14.3% Xây dựng giả thuyết.
Trang 3MỤC LỤC
LỜI MỞ ĐẦU 1
CHƯƠNG I TỔNG QUAN BỘ DỮ LIỆU 2
1 Giới thiệu bộ dữ liệu 2
2 Mục tiêu, đối tượng, phạm vi, phương pháp nghiên cứu 5
2.1 Mục tiêu nghiên cứu 5
2.2 Đối tượng nghiên cứu 5
2.3 Phạm vi nghiên cứu 6
2.4 Phương pháp nghiên cứu 6
3 Xây dựng giả thuyết 6
3.1 Cơ sở lý thuyết 6
3.2 Giả thuyết nghiên cứu 8
3.3 Xây dựng mô hình giả thuyết 11
CHƯƠNG II QUÁ TRÌNH PHÂN TÍCH DỮ LIỆU 13
1 Làm sạch dữ liệu 13
1.1 Dữ liệu thiếu thông tin 13
1.2 Dữ liệu trùng lặp 14
1.3 Dữ liệu mang giá trị ngoại lai 14
2 Phân tích mô tả thống kê bộ dữ liệu 17
2.1 Loves_count 17
2.2 Price_usd 18
2.3 Rating 18
2.4 Reviews 19
2.5 Child_count 19
2.6 Limited_edition 20
2.7 New 21
2.8 Online_only 21
2.9 Out_of_ stock 22
2.10 Sephora_exclusive 23
Trang 43 Trực quan hoá dữ liệu 23
3.1 Mối tương quan giữa các biến 23
3.2 Mối tương quan giữa 2 biến 25
3.3 Top 10 sản phẩm có lượt yêu thích nhiều nhất 34
3.4 Trung bình số lượt yêu thích của mỗi danh mục 35
CHƯƠNG III PHÂN TÍCH MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐA BIẾN 37
1 Xây dựng mô hình hồi quy mẫu: 37
2 Xây dựng giả thuyết và kiểm định giả thuyết: 38
2.1 Rating 38
2.2 Reviews 39
2.3 Price_usd 39
2.4 Limited_edition 39
2.5 New 40
2.6 Online_only 40
2.7 Out_of_stock 40
2.8 Sephora_exclusive 41
2.9 Child_count 41
3 Kiểm định và khắc phục các khuyết tật trong mô hình: 42
3.1 Kiểm định các khuyết tật trong mô hình 42
3.2 Khắc phục khuyết tật mô hình 45
CHƯƠNG IV PHÂN TÍCH KẾT QUẢ VÀ ĐỀ XUẤT GIẢI PHÁP 48
1 Phân tích kết quả 48
2 Đề xuất giải pháp 49
2.1 Đẩy mạnh những sản phẩm độc quyền của Sephora 49
2.2 Giảm giá để kích cầu, tăng loves_count 50
2.3 Đẩy mạnh chiến dịch bán hàng online 50
2.4 Tăng số lượng biến thể của sản phẩm 50
2.5 Đẩy mạnh số lượng đánh giá sản phẩm từ khách hàng 51
Trang 52.6 Phát huy thế mạnh với một số danh mục hàng cụ thể, đồng thời cải thiện mức độ yêu thích của khách hàng với một số danh mục hàng được yêu thích ít hơn 51
KẾT LUẬN 53 TÀI LIỆU THAM KHẢO 54
Trang 6DANH MỤC HÌNH
Hình 1: Biểu đồ Boxplots của biến Loves_count 15
Hình 2: Biểu đồ Boxplots của biến Rating 15
Hình 3: Biểu đồ Boxplots của biến Reviews 16
Hình 4: Biểu đồ Boxplots của biến Price_usd 16
Hình 5: Thống kê mô tả các chỉ số của biến loves_count 17
Hình 6: Thống kê mô tả các chỉ số của biến price_usd 18
Hình 7: Thống kê mô tả các chỉ số của biến rating 18
Hình 8: Thống kê mô tả các chỉ số của biến Reviews 19
Hình 9: Thống kê mô tả các chỉ số của biến Child_count 19
Hình 10: Tỷ lệ phiên bản giới hạn 20
Hình 11: Tỷ lệ sản phẩm mới của Sephora 21
Hình 12: Tỷ lệ bán hàng trực tuyến 21
Hình 13: Tỷ lệ có sẵn của sản phẩm 22
Hình 14: Tỷ lệ các sản phẩm độc quyền Sephora 23
Hình 15: Ma trận tương quan 23
Hình 16: Biểu đồ Scatterplots của biến Reviews và Loves_count 25
Hình 17: Biểu đồ Scatterplots của biến Rating và Loves_count 26
Hình 18: Biểu đồ Scatterplots của biến Child_count và Loves_count 27
Hình 19: Biểu đồ Scatterplots của biến Price_usd và Loves_count 28
Hình 20: Biểu đồ Boxplots của biến Online_only và Loves_count 29
Hình 21: Biểu đồ Boxplots của biến Limited_edition và Loves_count 30
Hình 22: Biểu đồ Boxplots của biến New và Loves_count 31
Hình 23: Biểu đồ Boxplots của biến Sephora_exclusive và Loves_count 32
Hình 24: Biểu đồ Boxplot của biến Out_of_stock và Loves_count 33
Hình 25: Biểu đồ top 10 sản phẩm có lượt yêu thích nhiều nhất 34
Hình 26: Biểu đồ trung bình số lượt yêu thích của mỗi danh mục 35
Trang 7DANH MỤC BẢNG
Bảng 1: Bảng kết quả dữ liệu thiếu thông tin 13
Bảng 2: Bảng thống kê cơ bản bộ dữ liệu qua STATA 14
Bảng 3 Bảng kết quả phân tích dữ liệu từ STATA 38
Bảng 4 Kết quả kiểm định bỏ sót biến 42
Bảng 5 Kết quả kiểm định đa cộng tuyến 43
Bảng 6 Kết quả kiểm định phương sai sai số 44
Bảng 7 Kết quả kiểm định phân phối chuẩn của nhiễu 45
Bảng 8 Kết quả ước lượng mô hình sử dụng phương pháp Robust Standard Error 46
Trang 8LỜI MỞ ĐẦU
Cùng với sự phát triển của toàn cầu hóa, hiện đại hóa, công nghiệp hóa,ngày càng có nhiều doanh nghiệp lựa chọn mở rộng thị trường sang các quốcgia khác Việc thâm nhập vào thị trường với đem lại nhiều lợi ích cho doanhnghiệp, tuy nhiên, cùng cần nghiên cữu kỹ lưỡng thị trường mới và đưa rachiến lược phù hợp để những sai lầm đáng tiếc khi mở rộng hoạt động trongthị trường mới Bởi vậy việc thấu hiểu thị hiếu và tính chất của người mua hàngtheo đặc trưng khu vực là điều vô cùng quan trọng mà các doanh nghiệp nêntập trung nghiên cứu
Việc nghiên cứu các tác động có ảnh hưởng đến sự yêu thích của ngườitiêu dùng đối với các sản phẩm, đặc biệt là các thương hiệu mỹ phẩm lớn rấtquan trọng trong việc hình thành chiến lược và định hướng phát triển phù hợpvới doanh nghiệp Được thành lập vào năm 1969 bởi Dominique Mandonaud ởParis, Pháp, Sephora đã trải qua lịch sử hình thành lâu dài, trở thành mộtthương hiệu mỹ phẩm nổi tiếng, Sephora luôn tìm cách để thu hút sự chú ýkhách hàng thông qua cách tiếp cận độc đáo va mang lại các trải nghiệm muasắm tuyệt vời cho khách hàng
Với bộ dữ liệu được cung cấp các thông số chi tiết từng dòng sản phẩmcủa Sephora, nhóm 4 chúng em xin được gửi tới thầy cô bài tiểu luận về việcnghiên cứu các yếu tố tác động đến sự yêu thích của khách hàng tới các dòngsản phẩm của Sephora dành cho cả nam và nữ Bài tiểu luận của nhóm 4 gồm 3chương:
Chương 1: Tổng quan bộ dữ liệu
Chương 2: Quá trình phân tích dữ liệu
Chương 3: Phân tích mô hình hồi quy tuyến tính đa biến
Chương 4: Phân tích kết quả và đề xuất giải pháp
Trang 9Do trình độ nghiên cứu còn hạn chế nên không tránh khỏi những sai sót,chúng em rất mong nhận được sự góp ý của cô để hoàn thiện bài tiểu luận củanhóm mình Chúng em xin chân thành cảm ơn giảng viên TS Phan Thị Cẩm Anh
đã tận tâm truyền dạy những kiến thức quý báu để nhóm có thể hoàn thànhbài tiểu luận này
2
Trang 10CHƯƠNG I TỔNG QUAN BỘ DỮ LIỆU I.1 Giới thiệu bộ dữ liệu
Tệp dữ liệu được thu thập từ sephora.com thông qua Python Scraper, baogồm cả dữ liệu định lượng và định tính Tệp dữ liệu là tổ hợp thông tin về cácsản phẩm làm đẹp trên cửa hàng trực tuyến của Sephora, bao gồm tên thươnghiệu, giá cả, thành phần, danh mục và các đặc điểm khác Đồng thời bao gồm
dữ liệu về xếp hạng, đánh giá và sự yêu thích của khách hàng của từng sảnphẩm
Tệp dữ liệu có tất cả 2804 quan sát và 25 biến gồm product id, product_name,brand_id, brand _name, loves_count, rating, reviews, size,variation type,variation _value, variation_desc, price_usd, sale_price_usd, limited_edition,new, online_only, out_of_ _stock, sephora_exclusive, highlights,primary_category, secondary_category, tertiary_category, child_count,child_max_price, child_min_price
Mô tả bộ dữ liệu:
- product_id: mã sản phẩm
- product_name: tên sản phẩm
- brand_id: mã thương hiệu
- brand_name: tên thương hiệu
- loves_count: số lượng người đánh dấu sản phẩm là yêu thích (số lượngngười yêu thích sản phẩm)
- rating: đánh giá trung bình của sản phẩm dựa trên nhận xét của ngườidùng
- reviews: số lượng người dùng đánh giá sản phẩm (Số lượng review sảnphẩm)
- size: kích thước của sản phẩm (có thể tính bằng oz, ml, g, gói, (tùythuộc vào sản phẩm))
Trang 11- variation_type: tham số biến thể cho sản phẩm (ví dụ: kích thước, màusắc)
- variation_value: Giá trị cụ thể của tham số biến thể cho sản phẩm (ví dụ:
100 mL, cát vàng)
- variation_desc: mô tả về tham số biến thể cho sản phẩm (ví dụ: tone cho
da trắng nhất)
- price_usd: giá của sản phẩm (tính theo đơn vị USD)
- sale_price_usd: giá của sản phẩm sau khi áp dụng một chương trình giảmgiá, khuyến mãi hoặc ưu đãi đặc biệt (tính theo đơn vị USD)
- limited_edition: cho biết sản phẩm có phải là phiên bản giới hạn haykhông (1-đúng, 0-sai)
- new: cho biết sản phẩm có phải là mới hay không (1-đúng, 0-sai)
- online_only: cho biết sản phẩm chỉ được bán trực tuyến hay không đúng, 0-sai)
(1 out_of_ stock: cho biết sản phẩm hiện đã hết hàng hay chưa (1(1 đúng, 0(1 sai)
0 sephora_exclusive: cho biết sản phẩm có phải là độc quyền tại Sephorakhông (1-đúng, 0-sai)
- highlights: Các nhãn hoặc đặc điểm nổi bật của sản phẩm
- primary_category: Danh mục đầu tiên trong breadcrumb
- secondary_category: Danh mục thứ hai trong breadcrumb
- tertiary_category: Danh mục thứ ba trong breadcrumb
- child_count: số lượng biến thể của sản phẩm
- child_max_price: Giá cao nhất trong các biến thể của sản phẩm
- child_min_price Giá thấp nhất trong các biến thể của sản phẩm
Giới thiệu các biến
a Biến phụ thuộc
4
Trang 12Loves count : Số lượng người đánh dấu sản phẩm là yêu thích Đây là tín
hiệu để doanh nghiệp xem xét có nên tiếp tục đầu tư và phát triển dòng sảnphẩm này hay không, đồng thời nắm bắt xu hướng thị hiếu thông qua Lovescount giúp doanh nghiệp tạo ra sản phẩm đáp ứng nhu cầu khách hàng, tạo lợithế cạnh tranh so với đối thủ Ngoài ra, doanh nghiệp cũng có thể dựa vào sốlượt yêu thích để thiết lập các chiến lược marketing, quảng cáo phù hợp, thuhút khách hàng tiềm năng
b Biến độc lập
Rating: Lượt đánh giá trung bình của sản phẩm (dựa trên lượt phản hồi
của người tiêu dùng) Rating là yếu tố quan trọng để nhãn hàng có thế xem xétlại về sản phẩm và đưa và những biện pháp điều chinh phù hợp, ví dụ nếu lượtrating thấp thì nhãn hàng có thể nghiên cứu các vấn đề dẫn tới rating thấp từ
đó đưa ra biện pháp khắc phục và cải thiện, nếu lượt rating cao thì có thể họchỏi các điểm mạnh, điểm tốt của sản phẩm ấy, tìm hiểu tại sao người tiêu dùnglại yêu thích đặc điểm ấy của sản phẩm và cách thức duy trì trên những sảnphẩm sau này
Reviews: là số lượt đánh giá của người dùng về một sản phẩm
Reviews là nguồn thông tin quý giá giúp khách hàng tiềm năng hình dung vềsản phẩm qua trải nghiệm thực tế của người đã mua đồng thời góp phần tạodựng giá trị cảm nhận (perceived value) của khách hàng về sản phẩm, bao gồmxếp hạng (rating) và số lượng yêu thích (loves count)
Price_usd: Giá của sản phẩm bằng đô la Mỹ Price usd là một trong những
biến độc lập trong bài nghiên cứu Theo quy luật cung cầu cơ bản, giá cả ảnhhưởng trực tiếp đến quyết định mua hàng, mặt khác, còn ảnh hướng đến sựyêu thích của khách hàng đối với một sản phẩm
Limited_edition: Cho biết sản phẩm có phải là phiên bản giới hạn hay
không Limited edition có mối quan hệ giống như new tới các biến phụ thuộc.Con người thường có xu hướng thích những sản phẩm giới hạn và chất lượng,
Trang 13bao bì của những sản phẩm ấy cũng sẽ có phần nào đấy tốt hoặc độc đáo hơnnhững sản phẩm đại trà Do đó, các sản phẩm là phiên bản giới hạn thường sẽđược săn đón dẫn tới love count sẽ cao.
New: Cho biết sản phẩm có mới hay không Biến new giữ vai trò quan
trọng trong việc mua hàng, đặc biệt là trong ngành mỹ phẩm và chăm sóc sắcđẹp Tương tự như limited edition, sản phẩm mới sẽ nhận được sự yêu thíchcủa khách hàng hơn, dẫn tới việc lượng love count của những sản phẩm mới sẽcao
Online_only: Sản phẩm chỉ bán trực tuyến Biến này cho biết liệu sản
phẩm chỉ được bán trực tuyến qua các nền tảng website, sàn thương mại điện
tử hay không Vì bản chất bộ dữ liệu được khai thác thông qua trang web
"Makeup, Skincare, Fragrance, Hair & Beauty Products | Sephora" nên việc đặtOnline only là biến phụ thuộc của Loves count là hoàn toàn cần thiết
Out_of_stock: Sản phẩm hết hàng Biến này cho biết sản phẩm đã được
bán hết hay chưa Khách hàng có thể dễ dàng thấy được chỉ số này trên trangweb "Makeup, Skincare, Fragrance, Hair & Beauty Products | Sephora" nên dựavào đó có thể đánh giá liệu sản phẩm này có đáng để sử dụng hay không.Thông qua đó có thể ảnh hưởng tới Loves count
Sephora_exclusive: Sản phẩm độc quyền của Sephora Biến này cho biết
sản phẩm có phải sản phẩm độc quyền của Sephora hay không Luôn có sự ưu
ái nhất định đối với các sản phẩm độc quyền của Sephora, cùng với đó là uy tín
do Sephora bảo hộ nên biến này có thế có ảnh hưởng tới Loves count
Child_count: Số lượng biến thể Biến này cho biết số lượng biến thể của
từng sản phẩm Việc có nhiều biến thể hoặc không, số lượng biến thể nhiều hay
ít có thể ảnh hưởng tới Loves count
6
Trang 14I.2 Mục tiêu, đối tượng, phạm vi, phương pháp nghiên cứu
I.2.1 Mục tiêu nghiên cứu
Mục tiêu chung: Phân tích các yếu tố ảnh hưởng đến sự yêu thích củangười tiêu dùng đối với các sản phẩm của Sephora
Mục tiêu cụ thể: Xác định các yếu tố chính ảnh hưởng đến sự yêu thíchcủa người tiêu dùng như số lượng người đã đánh dấu yêu thích sản phẩm,điểm trung bình của sản phẩm dựa trên đánh giá của người tiêu dùng, giá cả, Tiếp theo, đánh giá mức độ ảnh hưởng của từng yếu tố đến sự yêu thích củakhách hàng Qua đó đề xuất các giải pháp và đẩy mạnh các yếu tố tăng cường
sự yêu thích của người tiêu dùng đối với các sản phẩm của Sephora
I.2.2 Đối tượng nghiên cứu
Đối tượng nghiên cứu: Các yếu tố tác động đến sự yêu thích sản phẩmSephora của người tiêu dùng: rating, reviews, price_usd, limited_edition, new,limited_edition, online_only, out_of_ stock, sephora_exclusive
I.2.3 Phạm vi nghiên cứu
Phạm vi nghiên cứu: Bộ dữ liệu được thu thập qua Python vào tháng 3năm 2023, gồm 2804 quan sát chứa thông tin về tất cả sản phẩm làm đẹp từhơn 8000 cửa hàng trực tuyến của sephora
I.2.4 Phương pháp nghiên cứu
Nhóm tiến hành sử dụng phương pháp thống kê mô tả, trực quan hóa dữ liệu bằng các biểu đồ và phân tích hồi quy tuyến tính để xác định mối quan hệ
của các biến: Rating (số lượt bình chọn), Reviews (số lượt nhận xét, đánh giá), Price_usd (giá của sản phẩm), Limited_edition (Phiên bản giới hạn), New (Sản phẩm mới), Online_only (Sản phẩm được bán trực tuyến), Out_of_ stock (Sản phẩm đã được bán hết), Sephora_exclusive (Sản phẩm độc quyền của Sephora), Child_count (Số lượng biến thể) lên biến Loves_count (Số lượt yêu thích) thông
Trang 15qua Excel và phần mềm Stata Từ đó, nhóm phân tích bộ dữ liệu và kết quả nhận được, kiểm tra ý nghĩa thống kê của các hệ số hồi quy ước lượng và đồng thời kiểm định khuyết tật của mô hình.
I.3 Xây dựng giả thuyết
I.3.1 Cơ sở lý thuyết
Thuộc tính sản phẩm được định nghĩa là các đặc điểm hoặc thông tin mô
tả về sản phẩm đó, giúp người tiêu dùng hiểu rõ hơn về chất lượng, tính năng,
và các đặc điểm khác của sản phẩm Các thuộc tính sản phẩm có thể bao gồmnhững thông tin như kích thước, màu sắc, chất liệu, xuất xứ, thương hiệu, giá
cả, đánh giá từ người dùng, tính năng đặc biệt, và các yếu tố khác mà có thể
ảnh hưởng đến quyết định mua hàng của người tiêu dùng Trong nghiên cứu “ Influence of Product Attributes on Customer’s Choice” tác giả Vytautas
LIESIONIS, Lina PILELIENĖ1, các nhà tiếp thị cần phải nắm bắt được các phảnứng của người tiêu dùng đối với các sản phẩm họ cung cấp cho thị trường Mộtnhà tiếp thị nên biết những thuộc tính nào làm cho sản phẩm trở nên hấp dẫn
và mức giá mà người tiêu dùng sẵn sàng trả tiền cho một sản phẩm hoặc chomột tính năng cụ thể của sản phẩm
Số lượt yêu thích sản phẩm (loves_count) là số người đánh dấu sản phẩm
là yêu thích, thể hiện sự quan tâm, tương tác và thái độ tích cực của kháchhàng đối với sản phẩm Việc phân tích mối quan hệ giữa các thuộc tính sảnphẩm và số lượt yêu thích sản phẩm (love count) có thể giúp các nhà tiếp thị cóthể hiểu hơn về sự ảnh hưởng của các thuộc tính sản phẩm đối với sự yêu thíchsản phẩm của khách hàng và từ đó, cải thiện chất lượng sản phẩm và trảinghiệm khách hàng
1
https://www.researchgate.net/profile/Lina-Pileliene/publication/255996924_Influence_of_Product_Attri butes_on_Customer'S_Choice/links/57dea08208aeea19593b4c1c/Influence-of-Product-Attributes-on- CustomerS-Choice.pdf
8
Trang 16Theo Anjana, S.S (2018)2, nghiên cứu về các yếu tố ảnh hưởng đến hành
vi mua mỹ phẩm của người tiêu dùng cho thấy, nhiều yếu tố như chất lượng,thương hiệu, giá cả, quảng cáo, bao bì đều có ảnh hưởng rất lớn đến hành vimua hàng của người tiêu dùng Tariq, Muhammad Usman (2021) trong nghiên
cứu “Sephora Smart Customer’s Experience Enhancement” cũng đã chỉ ra chiến
lược để đạt được sự trung thành của khách hàng đối với Sephora và nâng caotrải nghiệm khách hàng thông qua việc tận dụng công nghệ hiện đại Trong
nghiên cứu “Analysis of Sephora’s Market”, tác giả Xiyuan Chen cũng đã đề cập
về sự kết hợp giữa đổi mới và cách tiếp cận lấy khách hàng làm trung tâm,Sephora đã có thể tạo sự khác biệt so với các đối thủ cạnh tranh và xây dựngđược một thế mạnh vững chắc về nhận diện thương hiệu
Những nghiên cứu đi trước đã đều phân tích các yếu tố ảnh hưởng đếnhành vi mua hàng của người tiêu dùng hoặc sự hài lòng của khách hàng sau khimua hàng Tuy nhiên, nhóm tác giả nhận thấy vẫn chưa có nghiên cứu nào tậptrung về yếu tố thuộc tính sản phẩm và sự ảnh hưởng của các yếu tố đó đối vớihành vi của người tiêu dùng ở Sephora Trên cơ sở đó, nhóm tác giả tiến hànhphân tích dữ liệu về mối quan hệ giữa các thuộc tính sản phẩm của Sephora vớibiến số lượt yêu thích sản phẩm Từ đó có thể kết luận thuộc tính nào cần pháttriển hơn để có thể thu hút sự yêu thích của khách hàng và nâng cao trảinghiệm tiêu dùng của khách hàng nhiều hơn
I.3.2 Giả thuyết nghiên cứu
I.3.2.1 Số lượt đánh giá từ khách hàng (Reviews)
Nghiên cứu “Local Consumer Review Survey” của BrightLocal (2018) đã chỉ
ra rằng đánh giá từ khách hàng có ảnh hưởng đáng kể đến các lựa chọn mongmuốn của khách hàng, với khoảng 91% người trong độ tuổi 18-34 tin tưởng vàocác đánh giá trực tuyến và các đề xuất cá nhân
2 Anjana,S.S (2018) A study on factors influencing cosmetic buying behavior of
Trang 17H1: Lượt đánh giá người dùng (Reviews) có tác động trực tiếp cùng chiềuvới lượt người thích sản phẩm (Loves_count)
I.3.2.2 Giá của sản phẩm (Price_usd)
Hành vi mua hàng của người tiêu dùng bị ảnh hưởng phần lớn bởi giá cảcủa sản phẩm Các nghiên cứu cho thấy giá của sản phẩm là yếu tố cơ bản màkhách hàng cân nhắc trước khi đưa ra quyết định mua hàng hoặc thêm mặthàng vào danh sách mong muốn (Kotler và cộng sự, 2015) Khách hàng có xuhướng cho rằng giá cao hơn đi kèm với chất lượng tốt hơn và ngược lại(Monroe, 2003)
H2: Giá của sản phẩm (price_usd) có tác động trực tiếp cùng chiều với lượtngười thích sản phẩm (Loves_count)
I.3.2.3 Sản phẩm mới (New)
Tính mới của một sản phẩm có ảnh hưởng lớn đến hành vi khách hàng(Guiltinan, 1997) Thông qua các chiến lược tiếp thị nhằm làm nổi bật các tínhmới của sản phẩm sẽ có thể thúc đẩy sự quan tâm và ý định mua hàng củangười tiêu dùng
H3: Sản phẩm là sản phẩm mới (New) có tác động trực tiếp ngược chiềuvới lượt người thích sản phẩm
I.3.2.4 Sản phẩm chỉ bán trực tuyến (Online_only)
Trong nghiên cứu “Multichannel customer management: Understanding the research-shopper phenomenon” của Verhoef và cộng sự (2007) đã chỉ ra
rằng sản phẩm chỉ bán trực tuyến có tác động đáng kể đến hành vi của ngườitiêu dùng Tính độc quyền của những sản phẩm này, đi cùng với sự thuận tiện,
đa dạng và chi phí thấp hơn khi mua sắm trực tuyến, từ đó tăng thêm sức hấpdẫn của chúng (Chen và cộng sự, 2002) Ngoài ra, người tiêu dùng đánh giá caotính độc đáo và số lượng giới hạn của các sản phẩm chỉ bán trực tuyến, điều
10
Trang 18này càng khiến các sản phẩm này trở nên hấp dẫn hơn (Wang và cộng sự,2016).
H4: Sản phẩm chỉ bán trực tuyến (Online_only) tác động trực tiếp cùngchiều với lượt người thích sản phẩm (Loves_count)
I.3.2.5 Sản phẩm hết hàng (Out_of_ stock)
Sự sẵn có của sản phẩm, đặc biệt là các trường hợp hết hàng, có thể gâyảnh hưởng lớn đến hành vi của người tiêu dùng Nghiên cứu chỉ ra rằng tìnhtrạng hết hàng có thể gây ra nhiều phản ứng khác nhau, từ việc chuyển đổinhãn hiệu, cửa hàng đến trì hoãn hoặc thậm chí từ bỏ hoàn toàn việc mua hàng(Campo và cộng sự, 2000) Ngoài ra, tình trạng hết hàng có thể tác động tiêucực đến nhận thức của người tiêu dùng về chất lượng dịch vụ của nhà bán lẻ,
từ đó dễ gây tổn hại đến mối quan hệ giữa người tiêu dùng và doanh nghiệp(Zinn & Liu, 2008)
H5: Sản phẩm hết hàng (out_of_ stock) có tác động ngược chiều với lượtngười thích sản phẩm (Loves_count)
I.3.2.6 Sản phẩm độc quyền của Sephora (Sephora_exclusive)
Sự độc quyền của thương hiệu có ảnh hưởng rất lớn đến quyết định muahàng của người tiêu dùng Các nghiên cứu chỉ ra rằng các sản phẩm độc quyềngắn liền với một thương hiệu sẽ nâng cao nhận thức về tính độc đáo và vị thếcủa sản phẩm, từ đó tác động đến ý định mua hàng (Jin và cộng sự, 2014).Ngoài ra, tính độc quyền của thương hiệu tạo ra hiệu ứng khan hiếm, làm tăngthêm mong muốn của người tiêu dùng và nâng cao giá trị cảm nhận của sảnphẩm (Lynn, 1991)
H6: Sản phẩm độc quyền của Sephora (Sephora_exclusive) có tác độngtrực tiếp cùng chiều với lượt người thích sản phẩm (Loves_count)
Trang 19I.3.2.7 Sản phẩm là phiên bản giới hạn (Limited_edition)
Những sản phẩm giới hạn có thể tạo ra hiệu ứng khan hiếm trongmarketing, từ đó khiến tâm lý khách hàng bị thôi thúc nhanh chóng chọn muasản phẩm Khi mua một mặt hàng khan hiếm, các cá nhân tạo ra nhận thức tíchcực về sản phẩm bằng cách thỏa mãn khao khát của họ về sự độc đáo hoặckhác biệt (Snyder & Fromkin, 1980)3 và tạo ra cảm giác được chọn (Brock &Mazzocco, 2004)4 Lúc này, giá trị sản phẩm đem lại cho khách hàng không chỉ
là công dụng hay chất lượng mà còn là giá trị sưu tầm, trải nghiệm được cá biệthóa theo từng chiến dịch, từ đó tạo cho khách hàng tâm lý giá trị nhận lại lớnhơn nhiều so với số tiền bỏ ra và dẫn đến việc cho điểm đánh giá tích cực
H7: Sản phẩm là phiên bản giới hạn (Limited_edition) có tác động trực tiếpcùng chiều với lượt người thích sản phẩm (Loves_count)
I.3.2.8 Điểm đánh giá trung bình (rating)
Đánh giá của khách hàng trực tuyến (Online customer reviews - OCRs) cóthể được chia thành hai nhóm: OCRs định tính và định lượng (Sridhar &Srinivasan, 2012).5 Trong trường hợp OCRs định lượng, khách hàng buộc phảitóm tắt đánh giá của mình theo một xếp hạng (rating) hoặc cấp độ (grade) duynhất OCRs có mặt trên phần lớn các trang web và khách hàng sử dụng OCRs đểtìm sản phẩm phù hợp với sở thích của họ (Chen & Xie, 2008)6 và đáp ứng nhucầu tìm kiếm thông tin chất lượng (Zhu & Zhang, 2010)7 Vì vậy, nhóm tác giả
3 Snyder, C R., & Fromkin, H L (1980) Uniqueness: The hu-man pursuit of difference New York: Plenum Press
4 Brock, T C., & Mazzocco, P J (2004) Responses to scarcity: A commodity theory perspective on reactance and rumination In R Wright, J Greenberg, & S Brehm (Eds.), Motivational analyses of social behavior: Building on Jack Brehm’s contributions to psychology (pp 129–148) Mah-wah, NJ: Lawrence Erlbaum.
5 Sridhar, S., & Srinivasan, R (2012) Social influence effects in online product ratings Journal
of Marketing, 76(5), 70-88
6 Chen, Y & Xie, J (2008) Online consumer review: Word-of-mouth as a new element of
marketing communication mix Management Science, 54(3), 477-491.
7 Zhu, F., & Zhang, X M (2010) Impact of online consumer reviews on sales: the moderating
role of product and consumer characteristics Journal of Marketing, 74(2), 133-148
12
Trang 20cho rằng OCR là nguồn thông tin thứ cấp ảnh hưởng đến quyết định mua hàng
và số lượt yêu thích sản phẩm của khách hàng
H8: Điểm đánh giá trung bình (rating) có ảnh hưởng cùng chiều đến sốlượt yêu thích sản phẩm (love count)
I.3.2.9 Số lượng biến thể của sản phẩm (Child count)
Số lượng biến thể của sản phẩm có thể ảnh hưởng đến số lượt yêu thíchsản phẩm
H9: Số lượng biến thể của sản phẩm (Child count) có tác động trực tiếpcùng chiều với lượt người thích sản phẩm (Loves_count)
I.3.3 Xây dựng mô hình giả thuyết
Dựa vào những nghiên cứu và lý thuyết kinh tế đã được chứng minh, môhình được sử dụng trong tiểu luận này được xây dựng nhằm kiểm tra mức độảnh hưởng của những yếu tố liên quan đến sự yêu thích của người tiêu dùngvới các sản phẩm của Sephora
Loves_count=f(reviews, price_usd, limited_edition, new, online_only, out_of_stock, Sephora_exclusive, rating, child_count)
Trong đó:
- Reviews: số lượng người dùng đánh giá sản phẩm
- price_usd: Giá của sản phẩm (USD)
- New: Cho biết sản phẩm mới hay không (1-Có 0-Không)
- Online_only: cho biết sản phẩm chỉ được bán trực tuyến hay không
Trang 210 Sephora_exclusive: Cho biết sản phẩm có phải là sản phẩm độc quyềncủa Sephora hay không (1-Có, 0-Không)
- Rating: Điểm đánh giá trung bình của sản phẩm dựa trên lượt phản hồicủa người tiêu dùng
- Child count: Cho biết số lượng biến thể của từng sản phẩm
Mô hình hồi quy tuyến tính đa biến:
Ln(Loves_count) = 𝛽0 + 𝛽1Reviews + 𝛽2price_usd+ 𝛽3new + 𝛽4online_only + 𝛽5limited edition + 𝛽6Out of stocki + 𝛽7Sephora exclusive+ 𝛽8Rating +
𝛽9Child count + u
Trong đó:
- Loves_count: biến phụ thuộc
- Reviews, price_usd, new, online_only, limited edition, out of stock,Sephora exclusive, Rating, Childcount: biến độc lập
- β0: Hệ số chặn của mô hình
- βi: Hệ số góc của mô hình
- u: Sai số ngẫu nhiên của tổng thể, đại diện cho các yếu tố khác ảnhhưởng đến Loves count nhưng không được đề cập trong mô hình
14
Trang 22CHƯƠNG II QUÁ TRÌNH PHÂN TÍCH DỮ LIỆU II.1 Làm sạch dữ liệu
II.1.1 Dữ liệu thiếu thông tin
Để làm sạch các dữ liệu thiếu thông tin, nhóm nghiên cứu thực hiện 4 bước sau:
Bước 1: Chọn các cột cần làm sạch dữ liệu
Bước 2: Sử dụng hàm “COUNTBLANK” để tìm cột thiếu dữ liệu và sốlượng quan sát thiếu
Bước 3: Sử dụng lệnh “Filter” trên Header của mỗi cột
Bước 4: Chọn “Blanks”, thực hiện xoá các quan sát bị thiếu dữ liệu
Kết quả: Nhóm thực hiện kiểm tra các cột dữ liệu: loves_count, rating,
reviews, price_usd, limited_edition, new, online_only, out_of_ stock,sephora_exclusive, child_count và thu về kết quả như sau:
Bảng 1: Bảng kết quả dữ liệu thiếu thông tin
Tên cột Số lượng dữ liệu thiếu Tỷ trọng so với dữ liệu gốc
Trang 23“product_id” và nhận được kết quả không có lỗi trùng lặp trong bộ dữ liệu này.
II.1.3 Dữ liệu mang giá trị ngoại lai
Để tìm kiếm giá trị ngoại lai, nhóm tính toán các giá trị thống kê cơ bảncủa bộ dữ liệu Các giá trị thống kê trên cho thấy không có sự bất thường nào
Bảng 2: Bảng thống kê cơ bản bộ dữ liệu qua STATA
Sau đó, nhóm trực quan hóa bằng Boxplots để xác định những giá trị bấtthường Mặc dù phát hiện một số giá trị ngoại lai trong một số biến, nhómnhận thấy chúng liên quan đến sự yêu thích của người tiêu dùng đối với sảnphẩm Những giá trị này vẫn hợp lý về mặt thực tế Để đảm bảo tính thực tế vàminh bạch, nhóm quyết định không loại bỏ những giá trị đó
16
Trang 24Hình 1: Biểu đồ Boxplots của biến Loves_count
Hình 2: Biểu đồ Boxplots của biến Rating
Trang 25Hình 3: Biểu đồ Boxplots của biến Reviews
Hình 4: Biểu đồ Boxplots của biến Price_usd
Kết luận: Sau khi lọc và làm sạch các dữ liệu thiếu, dữ liệu trùng lặp và dữ
liệu ngoại lai gây ảnh hưởng đến kết quả mô hình, bộ dữ liệu còn 2804 quan sát Nhóm tiến hành trực quan hoá dữ liệu và đề xuất giải pháp nhằm giúp hoạtđộng kinh doanh của Sephora hiệu quả hơn nữa
18
Trang 26II.2 Phân tích mô tả thống kê bộ dữ liệu
Các bảng đo lường xu thế trung tâm dưới đây được thực hiện bằng phần mềm excel nhờ công cụ data analysis
II.2.1 Loves_count
Hình 5: Thống kê mô tả các chỉ số của biến loves_count
Biến Loves_count: Số người yêu thích sản phẩm của sephora đạt giá trịcao nhất là 1400555 người, đạt giá trị thấp nhất là 513 người và trung bình là
47062 Các sản phẩm của các thương hiệu khác nhau có sự chênh lệch đáng kể
về lượng khách hàng yêu thích, mức độ phân tán lớn với độ lệch chuẩn đạt93900
Phần lớn các sản phẩm có lượng người yêu thích từ 500-100500 chiếm88%, rất ít sản phẩm có lượt yêu thích trên 1 triệu người
Trang 27II.2.2 Price_usd
Hình 6: Thống kê mô tả các chỉ số của biến price_usd
Sephora cung cấp nhiều mức giá khác nhau, từ bình dân (2 USD) đến caocấp (425 USD) Nhờ vậy, khách hàng có thể dễ dàng lựa chọn sản phẩm phùhợp với nhu cầu và khả năng tài chính của mình Mặc dù có sản phẩm giá rẻ,nhưng Sephora tập trung nhiều hơn vào phân khúc giá cao Giá trung bình chocác sản phẩm của Sephora là 50,7 USD cao hơn đáng kể so với giá thấp nhất.Skewness = 3,3 > 0 cho thấy phân phối dữ liệu lệch sang trái, nhìn vào biểu đồ
ta có thể thấy rõ điều này
II.2.3 Rating
Hình 7: Thống kê mô tả các chỉ số của biến rating
20
Trang 28Các sản phẩm của hãng đạt trung bình đánh giá là 4,23 sao, đây là mứcđánh giá khá tốt Biểu đồ có xu hướng lệch sang phải do skewness = -1,29 < 0,cho thấy đa số sản phẩm của Sephora nhận được đánh giá khá cao từ ngườitiêu dùng Lượng đánh giá 4 sao là nhiều nhất, cho thấy nhiều người tiêu dùnghài lòng với sản phẩm.
II.2.4 Reviews
Hình 8: Thống kê mô tả các chỉ số của biến Reviews
Phạm vi đánh giá trải dài trên một quãng rất rộng, số lượng đánh giá caonhất là 21281 và thấp nhất chỉ là 1 Điểm trung bình là 713,04 cho thấy đa sốđánh giá đều ở mức cao Tuy nhiên, độ lệch chuẩn 1514,40 rất cao, sự phân tánrộng trong các đánh giá Điều này có thể do số lượng người đánh giá được thuthập từ nhiều thương hiệu, sản phẩm của sephora
Trang 29II.2.5 Child_count
Hình 9: Thống kê mô tả các chỉ số của biến Child_count
Histogram cho thấy phần lớn dữ liệu tập trung ở phía trái, giá trị trungbình đạt 3,66 Giá trị cao nhất là 78, thấp nhất là 0 vì vậy phạm vi của biến thểtrải dài trên khoảng rất rộng Độ lệch chuẩn đạt 7,74 (cao hơn giá trị trung bìnhrất nhiều) vì vậy có mức độ phân tán rất lớn
II.2.6 Limited_edition
Hình 10: Tỷ lệ phiên bản giới hạn
22
Trang 30Biến limited_edition: Sản phẩm phiên bản giới hạn chỉ có 47 chiếm gần2% tổng số sản phẩm của sephora Hãng chú tâm sản xuất các phiên bản giớihạn thông thường để tiếp cận nhiều tệp khách hàng hơn Nhưng cũng đồngthời sản xuất giới hạn một số ít sản phẩm để tạo ra sự khan hiếm kích thíchngười tiêu dùng mua sản phẩm để định vị bản thân.
II.2.7 New
Hình 11: Tỷ lệ sản phẩm mới của Sephora
Biến new: chỉ có 179/2084 sản phẩm của sephora là sản phẩm mới chiếm6,38%
II.2.8 Online_only
Trang 31Hình 12: Tỷ lệ bán hàng trực tuyến
Biến online_only: Các sản phẩm của sephora được bán trên cả 2 nềntảng là trực tuyến và trực tiếp, trong đó sản phẩm chỉ bán online là 447 chiếm16%
Khách hàng vẫn quen với việc trực tiếp mua sắm tại các cửa hàng, tuy nhiên cóthể dự đoán xu hướng mua hàng trực tuyến đang dần gia tăng
II.2.9 Out_of_ stock
24
Trang 33Biến sephora_exclusive: Có 839 sản phẩm là độc quyền của sephora chiếm gần 30%.
II.3 Trực quan hoá dữ liệu
II.3.1 Mối tương quan giữa các biến
- r(Loves_count, child count)=0,3693: mức độ tương quan trung bình, hệ
số tương quan dương, mối quan hệ giữa 2 biến cùng chiều
- r(Loves_count, new)=-0,0563: mức độ tương quan thấp, hệ số tươngquan mang dấu âm, mối quan hệ giữa 2 biến ngược chiều
- r(Loves_count, limited_edition)=-0,0017: mức độ tương quan rất thấp,
hệ số tương quan mang dấu âm, mối quan hệ giữa 2 biến ngược chiều
26
Trang 34- r(Loves_count, online_only)=-0,1484: mức độ tương quan thấp, hệ sốtương quan âm, mối quan hệ giữa 2 biến ngược chiều.
- r(Loves_count, out_of_ stock)=-0,0449: mức độ tương quan thấp, hệ sốtương quan âm, mối quan hệ giữa 2 biến ngược chiều
- r(loves_count, sephora_exclusive)=0,0274: mức độ tương quan thấp, hệ
số tương quan dương, mối quan hệ giữa 2 biến cùng chiều