1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Tiểu luận phân tích dữ liệu trong kinh doanh nghiên cứu những tác Động Đến sự yêu thích của người tiêu dùng với các sản phẩm thương hiệu sephora

68 3 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên Cứu Những Tác Động Đến Sự Yêu Thích Của Người Tiêu Dùng Với Các Sản Phẩm Thương Hiệu Sephora
Tác giả Phạm Thị Phương Ly, Lê Sỹ Nhật Minh, Đỗ Thị Ngọc, Đào Khánh Xuân, Nguyễn Thị Thư, Đào Thị Huyền Trang, Hà Thị Như Nguyệt
Người hướng dẫn TS. Phạm Thị Cẩm Anh
Trường học Trường Đại Học Ngoại Thương
Chuyên ngành Phân Tích Dữ Liệu Trong Kinh Doanh
Thể loại tiểu luận
Năm xuất bản 2024
Thành phố Hà Nội
Định dạng
Số trang 68
Dung lượng 2,39 MB

Nội dung

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG VIỆN KINH TẾ VÀ KINH DOANH QUỐC TẾ ---***---TIỂU LUẬN PHÂN TÍCH DỮ LIỆU TRONG KINH DOANH NGHIÊN CỨU NHỮNG TÁC ĐỘNG ĐẾN SỰ YÊU THÍCH CỦA NGƯỜI TIÊU DÙNG VỚI CÁ

Trang 1

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG VIỆN KINH TẾ VÀ KINH DOANH QUỐC TẾ

-*** -TIỂU LUẬN PHÂN TÍCH DỮ LIỆU TRONG KINH DOANH

NGHIÊN CỨU NHỮNG TÁC ĐỘNG ĐẾN SỰ YÊU THÍCH CỦA NGƯỜI TIÊU DÙNG VỚI CÁC SẢN PHẨM THƯƠNG HIỆU SEPHORA

Giảng viên hướng dẫn : TS Phạm Thị Cẩm Anh

Hà Nội, tháng 3 năm 2024 DANH SÁCH THÀNH VIÊN NHÓM 4

Trang 2

STT Họ và tên MSV

Tỷ lệ đóng góp

2 Lê Sỹ Nhật Minh 2215510902 14.3%

Rút insight charts

Đề xuất giải pháp Lời mở đầu

Hoàn thiện tiểu luận

Xây dựng giả thuyết

Đề xuất giải pháp.Làm sạch dữ liệu

4 Đào Khánh Xuân 2215510131 14.3% Tổng quan bộ dữ liệu

Trực quan hoá dữ liệu

5 Nguyễn Thị Thư 2214510149 14.3%

Xây dựng giả thuyếtTrực quan hoá dữ liệu.Hoàn thiện kết luận

6 Đào Thị Huyền Trang 2215510121 14.3% Xây dựng giả thuyết.

Trang 3

MỤC LỤC

LỜI MỞ ĐẦU 1

CHƯƠNG I TỔNG QUAN BỘ DỮ LIỆU 2

1 Giới thiệu bộ dữ liệu 2

2 Mục tiêu, đối tượng, phạm vi, phương pháp nghiên cứu 5

2.1 Mục tiêu nghiên cứu 5

2.2 Đối tượng nghiên cứu 5

2.3 Phạm vi nghiên cứu 6

2.4 Phương pháp nghiên cứu 6

3 Xây dựng giả thuyết 6

3.1 Cơ sở lý thuyết 6

3.2 Giả thuyết nghiên cứu 8

3.3 Xây dựng mô hình giả thuyết 11

CHƯƠNG II QUÁ TRÌNH PHÂN TÍCH DỮ LIỆU 13

1 Làm sạch dữ liệu 13

1.1 Dữ liệu thiếu thông tin 13

1.2 Dữ liệu trùng lặp 14

1.3 Dữ liệu mang giá trị ngoại lai 14

2 Phân tích mô tả thống kê bộ dữ liệu 17

2.1 Loves_count 17

2.2 Price_usd 18

2.3 Rating 18

2.4 Reviews 19

2.5 Child_count 19

2.6 Limited_edition 20

2.7 New 21

2.8 Online_only 21

2.9 Out_of_ stock 22

2.10 Sephora_exclusive 23

Trang 4

3 Trực quan hoá dữ liệu 23

3.1 Mối tương quan giữa các biến 23

3.2 Mối tương quan giữa 2 biến 25

3.3 Top 10 sản phẩm có lượt yêu thích nhiều nhất 34

3.4 Trung bình số lượt yêu thích của mỗi danh mục 35

CHƯƠNG III PHÂN TÍCH MÔ HÌNH HỒI QUY TUYẾN TÍNH ĐA BIẾN 37

1 Xây dựng mô hình hồi quy mẫu: 37

2 Xây dựng giả thuyết và kiểm định giả thuyết: 38

2.1 Rating 38

2.2 Reviews 39

2.3 Price_usd 39

2.4 Limited_edition 39

2.5 New 40

2.6 Online_only 40

2.7 Out_of_stock 40

2.8 Sephora_exclusive 41

2.9 Child_count 41

3 Kiểm định và khắc phục các khuyết tật trong mô hình: 42

3.1 Kiểm định các khuyết tật trong mô hình 42

3.2 Khắc phục khuyết tật mô hình 45

CHƯƠNG IV PHÂN TÍCH KẾT QUẢ VÀ ĐỀ XUẤT GIẢI PHÁP 48

1 Phân tích kết quả 48

2 Đề xuất giải pháp 49

2.1 Đẩy mạnh những sản phẩm độc quyền của Sephora 49

2.2 Giảm giá để kích cầu, tăng loves_count 50

2.3 Đẩy mạnh chiến dịch bán hàng online 50

2.4 Tăng số lượng biến thể của sản phẩm 50

2.5 Đẩy mạnh số lượng đánh giá sản phẩm từ khách hàng 51

Trang 5

2.6 Phát huy thế mạnh với một số danh mục hàng cụ thể, đồng thời cải thiện mức độ yêu thích của khách hàng với một số danh mục hàng được yêu thích ít hơn 51

KẾT LUẬN 53 TÀI LIỆU THAM KHẢO 54

Trang 6

DANH MỤC HÌNH

Hình 1: Biểu đồ Boxplots của biến Loves_count 15

Hình 2: Biểu đồ Boxplots của biến Rating 15

Hình 3: Biểu đồ Boxplots của biến Reviews 16

Hình 4: Biểu đồ Boxplots của biến Price_usd 16

Hình 5: Thống kê mô tả các chỉ số của biến loves_count 17

Hình 6: Thống kê mô tả các chỉ số của biến price_usd 18

Hình 7: Thống kê mô tả các chỉ số của biến rating 18

Hình 8: Thống kê mô tả các chỉ số của biến Reviews 19

Hình 9: Thống kê mô tả các chỉ số của biến Child_count 19

Hình 10: Tỷ lệ phiên bản giới hạn 20

Hình 11: Tỷ lệ sản phẩm mới của Sephora 21

Hình 12: Tỷ lệ bán hàng trực tuyến 21

Hình 13: Tỷ lệ có sẵn của sản phẩm 22

Hình 14: Tỷ lệ các sản phẩm độc quyền Sephora 23

Hình 15: Ma trận tương quan 23

Hình 16: Biểu đồ Scatterplots của biến Reviews và Loves_count 25

Hình 17: Biểu đồ Scatterplots của biến Rating và Loves_count 26

Hình 18: Biểu đồ Scatterplots của biến Child_count và Loves_count 27

Hình 19: Biểu đồ Scatterplots của biến Price_usd và Loves_count 28

Hình 20: Biểu đồ Boxplots của biến Online_only và Loves_count 29

Hình 21: Biểu đồ Boxplots của biến Limited_edition và Loves_count 30

Hình 22: Biểu đồ Boxplots của biến New và Loves_count 31

Hình 23: Biểu đồ Boxplots của biến Sephora_exclusive và Loves_count 32

Hình 24: Biểu đồ Boxplot của biến Out_of_stock và Loves_count 33

Hình 25: Biểu đồ top 10 sản phẩm có lượt yêu thích nhiều nhất 34

Hình 26: Biểu đồ trung bình số lượt yêu thích của mỗi danh mục 35

Trang 7

DANH MỤC BẢNG

Bảng 1: Bảng kết quả dữ liệu thiếu thông tin 13

Bảng 2: Bảng thống kê cơ bản bộ dữ liệu qua STATA 14

Bảng 3 Bảng kết quả phân tích dữ liệu từ STATA 38

Bảng 4 Kết quả kiểm định bỏ sót biến 42

Bảng 5 Kết quả kiểm định đa cộng tuyến 43

Bảng 6 Kết quả kiểm định phương sai sai số 44

Bảng 7 Kết quả kiểm định phân phối chuẩn của nhiễu 45

Bảng 8 Kết quả ước lượng mô hình sử dụng phương pháp Robust Standard Error 46

Trang 8

LỜI MỞ ĐẦU

Cùng với sự phát triển của toàn cầu hóa, hiện đại hóa, công nghiệp hóa,ngày càng có nhiều doanh nghiệp lựa chọn mở rộng thị trường sang các quốcgia khác Việc thâm nhập vào thị trường với đem lại nhiều lợi ích cho doanhnghiệp, tuy nhiên, cùng cần nghiên cữu kỹ lưỡng thị trường mới và đưa rachiến lược phù hợp để những sai lầm đáng tiếc khi mở rộng hoạt động trongthị trường mới Bởi vậy việc thấu hiểu thị hiếu và tính chất của người mua hàngtheo đặc trưng khu vực là điều vô cùng quan trọng mà các doanh nghiệp nêntập trung nghiên cứu

Việc nghiên cứu các tác động có ảnh hưởng đến sự yêu thích của ngườitiêu dùng đối với các sản phẩm, đặc biệt là các thương hiệu mỹ phẩm lớn rấtquan trọng trong việc hình thành chiến lược và định hướng phát triển phù hợpvới doanh nghiệp Được thành lập vào năm 1969 bởi Dominique Mandonaud ởParis, Pháp, Sephora đã trải qua lịch sử hình thành lâu dài, trở thành mộtthương hiệu mỹ phẩm nổi tiếng, Sephora luôn tìm cách để thu hút sự chú ýkhách hàng thông qua cách tiếp cận độc đáo va mang lại các trải nghiệm muasắm tuyệt vời cho khách hàng

Với bộ dữ liệu được cung cấp các thông số chi tiết từng dòng sản phẩmcủa Sephora, nhóm 4 chúng em xin được gửi tới thầy cô bài tiểu luận về việcnghiên cứu các yếu tố tác động đến sự yêu thích của khách hàng tới các dòngsản phẩm của Sephora dành cho cả nam và nữ Bài tiểu luận của nhóm 4 gồm 3chương:

Chương 1: Tổng quan bộ dữ liệu

Chương 2: Quá trình phân tích dữ liệu

Chương 3: Phân tích mô hình hồi quy tuyến tính đa biến

Chương 4: Phân tích kết quả và đề xuất giải pháp

Trang 9

Do trình độ nghiên cứu còn hạn chế nên không tránh khỏi những sai sót,chúng em rất mong nhận được sự góp ý của cô để hoàn thiện bài tiểu luận củanhóm mình Chúng em xin chân thành cảm ơn giảng viên TS Phan Thị Cẩm Anh

đã tận tâm truyền dạy những kiến thức quý báu để nhóm có thể hoàn thànhbài tiểu luận này

2

Trang 10

CHƯƠNG I TỔNG QUAN BỘ DỮ LIỆU I.1 Giới thiệu bộ dữ liệu

Tệp dữ liệu được thu thập từ sephora.com thông qua Python Scraper, baogồm cả dữ liệu định lượng và định tính Tệp dữ liệu là tổ hợp thông tin về cácsản phẩm làm đẹp trên cửa hàng trực tuyến của Sephora, bao gồm tên thươnghiệu, giá cả, thành phần, danh mục và các đặc điểm khác Đồng thời bao gồm

dữ liệu về xếp hạng, đánh giá và sự yêu thích của khách hàng của từng sảnphẩm

Tệp dữ liệu có tất cả 2804 quan sát và 25 biến gồm product id, product_name,brand_id, brand _name, loves_count, rating, reviews, size,variation type,variation _value, variation_desc, price_usd, sale_price_usd, limited_edition,new, online_only, out_of_ _stock, sephora_exclusive, highlights,primary_category, secondary_category, tertiary_category, child_count,child_max_price, child_min_price

Mô tả bộ dữ liệu:

- product_id: mã sản phẩm

- product_name: tên sản phẩm

- brand_id: mã thương hiệu

- brand_name: tên thương hiệu

- loves_count: số lượng người đánh dấu sản phẩm là yêu thích (số lượngngười yêu thích sản phẩm)

- rating: đánh giá trung bình của sản phẩm dựa trên nhận xét của ngườidùng

- reviews: số lượng người dùng đánh giá sản phẩm (Số lượng review sảnphẩm)

- size: kích thước của sản phẩm (có thể tính bằng oz, ml, g, gói, (tùythuộc vào sản phẩm))

Trang 11

- variation_type: tham số biến thể cho sản phẩm (ví dụ: kích thước, màusắc)

- variation_value: Giá trị cụ thể của tham số biến thể cho sản phẩm (ví dụ:

100 mL, cát vàng)

- variation_desc: mô tả về tham số biến thể cho sản phẩm (ví dụ: tone cho

da trắng nhất)

- price_usd: giá của sản phẩm (tính theo đơn vị USD)

- sale_price_usd: giá của sản phẩm sau khi áp dụng một chương trình giảmgiá, khuyến mãi hoặc ưu đãi đặc biệt (tính theo đơn vị USD)

- limited_edition: cho biết sản phẩm có phải là phiên bản giới hạn haykhông (1-đúng, 0-sai)

- new: cho biết sản phẩm có phải là mới hay không (1-đúng, 0-sai)

- online_only: cho biết sản phẩm chỉ được bán trực tuyến hay không đúng, 0-sai)

(1 out_of_ stock: cho biết sản phẩm hiện đã hết hàng hay chưa (1(1 đúng, 0(1 sai)

0 sephora_exclusive: cho biết sản phẩm có phải là độc quyền tại Sephorakhông (1-đúng, 0-sai)

- highlights: Các nhãn hoặc đặc điểm nổi bật của sản phẩm

- primary_category: Danh mục đầu tiên trong breadcrumb

- secondary_category: Danh mục thứ hai trong breadcrumb

- tertiary_category: Danh mục thứ ba trong breadcrumb

- child_count: số lượng biến thể của sản phẩm

- child_max_price: Giá cao nhất trong các biến thể của sản phẩm

- child_min_price Giá thấp nhất trong các biến thể của sản phẩm

Giới thiệu các biến

a Biến phụ thuộc

4

Trang 12

Loves count : Số lượng người đánh dấu sản phẩm là yêu thích Đây là tín

hiệu để doanh nghiệp xem xét có nên tiếp tục đầu tư và phát triển dòng sảnphẩm này hay không, đồng thời nắm bắt xu hướng thị hiếu thông qua Lovescount giúp doanh nghiệp tạo ra sản phẩm đáp ứng nhu cầu khách hàng, tạo lợithế cạnh tranh so với đối thủ Ngoài ra, doanh nghiệp cũng có thể dựa vào sốlượt yêu thích để thiết lập các chiến lược marketing, quảng cáo phù hợp, thuhút khách hàng tiềm năng

b Biến độc lập

Rating: Lượt đánh giá trung bình của sản phẩm (dựa trên lượt phản hồi

của người tiêu dùng) Rating là yếu tố quan trọng để nhãn hàng có thế xem xétlại về sản phẩm và đưa và những biện pháp điều chinh phù hợp, ví dụ nếu lượtrating thấp thì nhãn hàng có thể nghiên cứu các vấn đề dẫn tới rating thấp từ

đó đưa ra biện pháp khắc phục và cải thiện, nếu lượt rating cao thì có thể họchỏi các điểm mạnh, điểm tốt của sản phẩm ấy, tìm hiểu tại sao người tiêu dùnglại yêu thích đặc điểm ấy của sản phẩm và cách thức duy trì trên những sảnphẩm sau này

Reviews: là số lượt đánh giá của người dùng về một sản phẩm

Reviews là nguồn thông tin quý giá giúp khách hàng tiềm năng hình dung vềsản phẩm qua trải nghiệm thực tế của người đã mua đồng thời góp phần tạodựng giá trị cảm nhận (perceived value) của khách hàng về sản phẩm, bao gồmxếp hạng (rating) và số lượng yêu thích (loves count)

Price_usd: Giá của sản phẩm bằng đô la Mỹ Price usd là một trong những

biến độc lập trong bài nghiên cứu Theo quy luật cung cầu cơ bản, giá cả ảnhhưởng trực tiếp đến quyết định mua hàng, mặt khác, còn ảnh hướng đến sựyêu thích của khách hàng đối với một sản phẩm

Limited_edition: Cho biết sản phẩm có phải là phiên bản giới hạn hay

không Limited edition có mối quan hệ giống như new tới các biến phụ thuộc.Con người thường có xu hướng thích những sản phẩm giới hạn và chất lượng,

Trang 13

bao bì của những sản phẩm ấy cũng sẽ có phần nào đấy tốt hoặc độc đáo hơnnhững sản phẩm đại trà Do đó, các sản phẩm là phiên bản giới hạn thường sẽđược săn đón dẫn tới love count sẽ cao.

New: Cho biết sản phẩm có mới hay không Biến new giữ vai trò quan

trọng trong việc mua hàng, đặc biệt là trong ngành mỹ phẩm và chăm sóc sắcđẹp Tương tự như limited edition, sản phẩm mới sẽ nhận được sự yêu thíchcủa khách hàng hơn, dẫn tới việc lượng love count của những sản phẩm mới sẽcao

Online_only: Sản phẩm chỉ bán trực tuyến Biến này cho biết liệu sản

phẩm chỉ được bán trực tuyến qua các nền tảng website, sàn thương mại điện

tử hay không Vì bản chất bộ dữ liệu được khai thác thông qua trang web

"Makeup, Skincare, Fragrance, Hair & Beauty Products | Sephora" nên việc đặtOnline only là biến phụ thuộc của Loves count là hoàn toàn cần thiết

Out_of_stock: Sản phẩm hết hàng Biến này cho biết sản phẩm đã được

bán hết hay chưa Khách hàng có thể dễ dàng thấy được chỉ số này trên trangweb "Makeup, Skincare, Fragrance, Hair & Beauty Products | Sephora" nên dựavào đó có thể đánh giá liệu sản phẩm này có đáng để sử dụng hay không.Thông qua đó có thể ảnh hưởng tới Loves count

Sephora_exclusive: Sản phẩm độc quyền của Sephora Biến này cho biết

sản phẩm có phải sản phẩm độc quyền của Sephora hay không Luôn có sự ưu

ái nhất định đối với các sản phẩm độc quyền của Sephora, cùng với đó là uy tín

do Sephora bảo hộ nên biến này có thế có ảnh hưởng tới Loves count

Child_count: Số lượng biến thể Biến này cho biết số lượng biến thể của

từng sản phẩm Việc có nhiều biến thể hoặc không, số lượng biến thể nhiều hay

ít có thể ảnh hưởng tới Loves count

6

Trang 14

I.2 Mục tiêu, đối tượng, phạm vi, phương pháp nghiên cứu

I.2.1 Mục tiêu nghiên cứu

Mục tiêu chung: Phân tích các yếu tố ảnh hưởng đến sự yêu thích củangười tiêu dùng đối với các sản phẩm của Sephora

Mục tiêu cụ thể: Xác định các yếu tố chính ảnh hưởng đến sự yêu thíchcủa người tiêu dùng như số lượng người đã đánh dấu yêu thích sản phẩm,điểm trung bình của sản phẩm dựa trên đánh giá của người tiêu dùng, giá cả, Tiếp theo, đánh giá mức độ ảnh hưởng của từng yếu tố đến sự yêu thích củakhách hàng Qua đó đề xuất các giải pháp và đẩy mạnh các yếu tố tăng cường

sự yêu thích của người tiêu dùng đối với các sản phẩm của Sephora

I.2.2 Đối tượng nghiên cứu

Đối tượng nghiên cứu: Các yếu tố tác động đến sự yêu thích sản phẩmSephora của người tiêu dùng: rating, reviews, price_usd, limited_edition, new,limited_edition, online_only, out_of_ stock, sephora_exclusive

I.2.3 Phạm vi nghiên cứu

Phạm vi nghiên cứu: Bộ dữ liệu được thu thập qua Python vào tháng 3năm 2023, gồm 2804 quan sát chứa thông tin về tất cả sản phẩm làm đẹp từhơn 8000 cửa hàng trực tuyến của sephora

I.2.4 Phương pháp nghiên cứu

Nhóm tiến hành sử dụng phương pháp thống kê mô tả, trực quan hóa dữ liệu bằng các biểu đồ và phân tích hồi quy tuyến tính để xác định mối quan hệ

của các biến: Rating (số lượt bình chọn), Reviews (số lượt nhận xét, đánh giá), Price_usd (giá của sản phẩm), Limited_edition (Phiên bản giới hạn), New (Sản phẩm mới), Online_only (Sản phẩm được bán trực tuyến), Out_of_ stock (Sản phẩm đã được bán hết), Sephora_exclusive (Sản phẩm độc quyền của Sephora), Child_count (Số lượng biến thể) lên biến Loves_count (Số lượt yêu thích) thông

Trang 15

qua Excel và phần mềm Stata Từ đó, nhóm phân tích bộ dữ liệu và kết quả nhận được, kiểm tra ý nghĩa thống kê của các hệ số hồi quy ước lượng và đồng thời kiểm định khuyết tật của mô hình.

I.3 Xây dựng giả thuyết

I.3.1 Cơ sở lý thuyết

Thuộc tính sản phẩm được định nghĩa là các đặc điểm hoặc thông tin mô

tả về sản phẩm đó, giúp người tiêu dùng hiểu rõ hơn về chất lượng, tính năng,

và các đặc điểm khác của sản phẩm Các thuộc tính sản phẩm có thể bao gồmnhững thông tin như kích thước, màu sắc, chất liệu, xuất xứ, thương hiệu, giá

cả, đánh giá từ người dùng, tính năng đặc biệt, và các yếu tố khác mà có thể

ảnh hưởng đến quyết định mua hàng của người tiêu dùng Trong nghiên cứu “ Influence of Product Attributes on Customer’s Choice” tác giả Vytautas

LIESIONIS, Lina PILELIENĖ1, các nhà tiếp thị cần phải nắm bắt được các phảnứng của người tiêu dùng đối với các sản phẩm họ cung cấp cho thị trường Mộtnhà tiếp thị nên biết những thuộc tính nào làm cho sản phẩm trở nên hấp dẫn

và mức giá mà người tiêu dùng sẵn sàng trả tiền cho một sản phẩm hoặc chomột tính năng cụ thể của sản phẩm

Số lượt yêu thích sản phẩm (loves_count) là số người đánh dấu sản phẩm

là yêu thích, thể hiện sự quan tâm, tương tác và thái độ tích cực của kháchhàng đối với sản phẩm Việc phân tích mối quan hệ giữa các thuộc tính sảnphẩm và số lượt yêu thích sản phẩm (love count) có thể giúp các nhà tiếp thị cóthể hiểu hơn về sự ảnh hưởng của các thuộc tính sản phẩm đối với sự yêu thíchsản phẩm của khách hàng và từ đó, cải thiện chất lượng sản phẩm và trảinghiệm khách hàng

1

https://www.researchgate.net/profile/Lina-Pileliene/publication/255996924_Influence_of_Product_Attri butes_on_Customer'S_Choice/links/57dea08208aeea19593b4c1c/Influence-of-Product-Attributes-on- CustomerS-Choice.pdf

8

Trang 16

Theo Anjana, S.S (2018)2, nghiên cứu về các yếu tố ảnh hưởng đến hành

vi mua mỹ phẩm của người tiêu dùng cho thấy, nhiều yếu tố như chất lượng,thương hiệu, giá cả, quảng cáo, bao bì đều có ảnh hưởng rất lớn đến hành vimua hàng của người tiêu dùng Tariq, Muhammad Usman (2021) trong nghiên

cứu “Sephora Smart Customer’s Experience Enhancement” cũng đã chỉ ra chiến

lược để đạt được sự trung thành của khách hàng đối với Sephora và nâng caotrải nghiệm khách hàng thông qua việc tận dụng công nghệ hiện đại Trong

nghiên cứu “Analysis of Sephora’s Market”, tác giả Xiyuan Chen cũng đã đề cập

về sự kết hợp giữa đổi mới và cách tiếp cận lấy khách hàng làm trung tâm,Sephora đã có thể tạo sự khác biệt so với các đối thủ cạnh tranh và xây dựngđược một thế mạnh vững chắc về nhận diện thương hiệu

Những nghiên cứu đi trước đã đều phân tích các yếu tố ảnh hưởng đếnhành vi mua hàng của người tiêu dùng hoặc sự hài lòng của khách hàng sau khimua hàng Tuy nhiên, nhóm tác giả nhận thấy vẫn chưa có nghiên cứu nào tậptrung về yếu tố thuộc tính sản phẩm và sự ảnh hưởng của các yếu tố đó đối vớihành vi của người tiêu dùng ở Sephora Trên cơ sở đó, nhóm tác giả tiến hànhphân tích dữ liệu về mối quan hệ giữa các thuộc tính sản phẩm của Sephora vớibiến số lượt yêu thích sản phẩm Từ đó có thể kết luận thuộc tính nào cần pháttriển hơn để có thể thu hút sự yêu thích của khách hàng và nâng cao trảinghiệm tiêu dùng của khách hàng nhiều hơn

I.3.2 Giả thuyết nghiên cứu

I.3.2.1 Số lượt đánh giá từ khách hàng (Reviews)

Nghiên cứu “Local Consumer Review Survey” của BrightLocal (2018) đã chỉ

ra rằng đánh giá từ khách hàng có ảnh hưởng đáng kể đến các lựa chọn mongmuốn của khách hàng, với khoảng 91% người trong độ tuổi 18-34 tin tưởng vàocác đánh giá trực tuyến và các đề xuất cá nhân

2 Anjana,S.S (2018) A study on factors influencing cosmetic buying behavior of

Trang 17

H1: Lượt đánh giá người dùng (Reviews) có tác động trực tiếp cùng chiềuvới lượt người thích sản phẩm (Loves_count)

I.3.2.2 Giá của sản phẩm (Price_usd)

Hành vi mua hàng của người tiêu dùng bị ảnh hưởng phần lớn bởi giá cảcủa sản phẩm Các nghiên cứu cho thấy giá của sản phẩm là yếu tố cơ bản màkhách hàng cân nhắc trước khi đưa ra quyết định mua hàng hoặc thêm mặthàng vào danh sách mong muốn (Kotler và cộng sự, 2015) Khách hàng có xuhướng cho rằng giá cao hơn đi kèm với chất lượng tốt hơn và ngược lại(Monroe, 2003)

H2: Giá của sản phẩm (price_usd) có tác động trực tiếp cùng chiều với lượtngười thích sản phẩm (Loves_count)

I.3.2.3 Sản phẩm mới (New)

Tính mới của một sản phẩm có ảnh hưởng lớn đến hành vi khách hàng(Guiltinan, 1997) Thông qua các chiến lược tiếp thị nhằm làm nổi bật các tínhmới của sản phẩm sẽ có thể thúc đẩy sự quan tâm và ý định mua hàng củangười tiêu dùng

H3: Sản phẩm là sản phẩm mới (New) có tác động trực tiếp ngược chiềuvới lượt người thích sản phẩm

I.3.2.4 Sản phẩm chỉ bán trực tuyến (Online_only)

Trong nghiên cứu “Multichannel customer management: Understanding the research-shopper phenomenon” của Verhoef và cộng sự (2007) đã chỉ ra

rằng sản phẩm chỉ bán trực tuyến có tác động đáng kể đến hành vi của ngườitiêu dùng Tính độc quyền của những sản phẩm này, đi cùng với sự thuận tiện,

đa dạng và chi phí thấp hơn khi mua sắm trực tuyến, từ đó tăng thêm sức hấpdẫn của chúng (Chen và cộng sự, 2002) Ngoài ra, người tiêu dùng đánh giá caotính độc đáo và số lượng giới hạn của các sản phẩm chỉ bán trực tuyến, điều

10

Trang 18

này càng khiến các sản phẩm này trở nên hấp dẫn hơn (Wang và cộng sự,2016).

H4: Sản phẩm chỉ bán trực tuyến (Online_only) tác động trực tiếp cùngchiều với lượt người thích sản phẩm (Loves_count)

I.3.2.5 Sản phẩm hết hàng (Out_of_ stock)

Sự sẵn có của sản phẩm, đặc biệt là các trường hợp hết hàng, có thể gâyảnh hưởng lớn đến hành vi của người tiêu dùng Nghiên cứu chỉ ra rằng tìnhtrạng hết hàng có thể gây ra nhiều phản ứng khác nhau, từ việc chuyển đổinhãn hiệu, cửa hàng đến trì hoãn hoặc thậm chí từ bỏ hoàn toàn việc mua hàng(Campo và cộng sự, 2000) Ngoài ra, tình trạng hết hàng có thể tác động tiêucực đến nhận thức của người tiêu dùng về chất lượng dịch vụ của nhà bán lẻ,

từ đó dễ gây tổn hại đến mối quan hệ giữa người tiêu dùng và doanh nghiệp(Zinn & Liu, 2008)

H5: Sản phẩm hết hàng (out_of_ stock) có tác động ngược chiều với lượtngười thích sản phẩm (Loves_count)

I.3.2.6 Sản phẩm độc quyền của Sephora (Sephora_exclusive)

Sự độc quyền của thương hiệu có ảnh hưởng rất lớn đến quyết định muahàng của người tiêu dùng Các nghiên cứu chỉ ra rằng các sản phẩm độc quyềngắn liền với một thương hiệu sẽ nâng cao nhận thức về tính độc đáo và vị thếcủa sản phẩm, từ đó tác động đến ý định mua hàng (Jin và cộng sự, 2014).Ngoài ra, tính độc quyền của thương hiệu tạo ra hiệu ứng khan hiếm, làm tăngthêm mong muốn của người tiêu dùng và nâng cao giá trị cảm nhận của sảnphẩm (Lynn, 1991)

H6: Sản phẩm độc quyền của Sephora (Sephora_exclusive) có tác độngtrực tiếp cùng chiều với lượt người thích sản phẩm (Loves_count)

Trang 19

I.3.2.7 Sản phẩm là phiên bản giới hạn (Limited_edition)

Những sản phẩm giới hạn có thể tạo ra hiệu ứng khan hiếm trongmarketing, từ đó khiến tâm lý khách hàng bị thôi thúc nhanh chóng chọn muasản phẩm Khi mua một mặt hàng khan hiếm, các cá nhân tạo ra nhận thức tíchcực về sản phẩm bằng cách thỏa mãn khao khát của họ về sự độc đáo hoặckhác biệt (Snyder & Fromkin, 1980)3 và tạo ra cảm giác được chọn (Brock &Mazzocco, 2004)4 Lúc này, giá trị sản phẩm đem lại cho khách hàng không chỉ

là công dụng hay chất lượng mà còn là giá trị sưu tầm, trải nghiệm được cá biệthóa theo từng chiến dịch, từ đó tạo cho khách hàng tâm lý giá trị nhận lại lớnhơn nhiều so với số tiền bỏ ra và dẫn đến việc cho điểm đánh giá tích cực

H7: Sản phẩm là phiên bản giới hạn (Limited_edition) có tác động trực tiếpcùng chiều với lượt người thích sản phẩm (Loves_count)

I.3.2.8 Điểm đánh giá trung bình (rating)

Đánh giá của khách hàng trực tuyến (Online customer reviews - OCRs) cóthể được chia thành hai nhóm: OCRs định tính và định lượng (Sridhar &Srinivasan, 2012).5 Trong trường hợp OCRs định lượng, khách hàng buộc phảitóm tắt đánh giá của mình theo một xếp hạng (rating) hoặc cấp độ (grade) duynhất OCRs có mặt trên phần lớn các trang web và khách hàng sử dụng OCRs đểtìm sản phẩm phù hợp với sở thích của họ (Chen & Xie, 2008)6 và đáp ứng nhucầu tìm kiếm thông tin chất lượng (Zhu & Zhang, 2010)7 Vì vậy, nhóm tác giả

3 Snyder, C R., & Fromkin, H L (1980) Uniqueness: The hu-man pursuit of difference New York: Plenum Press

4 Brock, T C., & Mazzocco, P J (2004) Responses to scarcity: A commodity theory perspective on reactance and rumination In R Wright, J Greenberg, & S Brehm (Eds.), Motivational analyses of social behavior: Building on Jack Brehm’s contributions to psychology (pp 129–148) Mah-wah, NJ: Lawrence Erlbaum.

5 Sridhar, S., & Srinivasan, R (2012) Social influence effects in online product ratings Journal

of Marketing, 76(5), 70-88

6 Chen, Y & Xie, J (2008) Online consumer review: Word-of-mouth as a new element of

marketing communication mix Management Science, 54(3), 477-491.

7 Zhu, F., & Zhang, X M (2010) Impact of online consumer reviews on sales: the moderating

role of product and consumer characteristics Journal of Marketing, 74(2), 133-148

12

Trang 20

cho rằng OCR là nguồn thông tin thứ cấp ảnh hưởng đến quyết định mua hàng

và số lượt yêu thích sản phẩm của khách hàng

H8: Điểm đánh giá trung bình (rating) có ảnh hưởng cùng chiều đến sốlượt yêu thích sản phẩm (love count)

I.3.2.9 Số lượng biến thể của sản phẩm (Child count)

Số lượng biến thể của sản phẩm có thể ảnh hưởng đến số lượt yêu thíchsản phẩm

H9: Số lượng biến thể của sản phẩm (Child count) có tác động trực tiếpcùng chiều với lượt người thích sản phẩm (Loves_count)

I.3.3 Xây dựng mô hình giả thuyết

Dựa vào những nghiên cứu và lý thuyết kinh tế đã được chứng minh, môhình được sử dụng trong tiểu luận này được xây dựng nhằm kiểm tra mức độảnh hưởng của những yếu tố liên quan đến sự yêu thích của người tiêu dùngvới các sản phẩm của Sephora

Loves_count=f(reviews, price_usd, limited_edition, new, online_only, out_of_stock, Sephora_exclusive, rating, child_count)

Trong đó:

- Reviews: số lượng người dùng đánh giá sản phẩm

- price_usd: Giá của sản phẩm (USD)

- New: Cho biết sản phẩm mới hay không (1-Có 0-Không)

- Online_only: cho biết sản phẩm chỉ được bán trực tuyến hay không

Trang 21

0 Sephora_exclusive: Cho biết sản phẩm có phải là sản phẩm độc quyềncủa Sephora hay không (1-Có, 0-Không)

- Rating: Điểm đánh giá trung bình của sản phẩm dựa trên lượt phản hồicủa người tiêu dùng

- Child count: Cho biết số lượng biến thể của từng sản phẩm

Mô hình hồi quy tuyến tính đa biến:

Ln(Loves_count) = 𝛽0 + 𝛽1Reviews + 𝛽2price_usd+ 𝛽3new + 𝛽4online_only + 𝛽5limited edition + 𝛽6Out of stocki + 𝛽7Sephora exclusive+ 𝛽8Rating +

𝛽9Child count + u

Trong đó:

- Loves_count: biến phụ thuộc

- Reviews, price_usd, new, online_only, limited edition, out of stock,Sephora exclusive, Rating, Childcount: biến độc lập

- β0: Hệ số chặn của mô hình

- βi: Hệ số góc của mô hình

- u: Sai số ngẫu nhiên của tổng thể, đại diện cho các yếu tố khác ảnhhưởng đến Loves count nhưng không được đề cập trong mô hình

14

Trang 22

CHƯƠNG II QUÁ TRÌNH PHÂN TÍCH DỮ LIỆU II.1 Làm sạch dữ liệu

II.1.1 Dữ liệu thiếu thông tin

Để làm sạch các dữ liệu thiếu thông tin, nhóm nghiên cứu thực hiện 4 bước sau:

Bước 1: Chọn các cột cần làm sạch dữ liệu

Bước 2: Sử dụng hàm “COUNTBLANK” để tìm cột thiếu dữ liệu và sốlượng quan sát thiếu

Bước 3: Sử dụng lệnh “Filter” trên Header của mỗi cột

Bước 4: Chọn “Blanks”, thực hiện xoá các quan sát bị thiếu dữ liệu

Kết quả: Nhóm thực hiện kiểm tra các cột dữ liệu: loves_count, rating,

reviews, price_usd, limited_edition, new, online_only, out_of_ stock,sephora_exclusive, child_count và thu về kết quả như sau:

Bảng 1: Bảng kết quả dữ liệu thiếu thông tin

Tên cột Số lượng dữ liệu thiếu Tỷ trọng so với dữ liệu gốc

Trang 23

“product_id” và nhận được kết quả không có lỗi trùng lặp trong bộ dữ liệu này.

II.1.3 Dữ liệu mang giá trị ngoại lai

Để tìm kiếm giá trị ngoại lai, nhóm tính toán các giá trị thống kê cơ bảncủa bộ dữ liệu Các giá trị thống kê trên cho thấy không có sự bất thường nào

Bảng 2: Bảng thống kê cơ bản bộ dữ liệu qua STATA

Sau đó, nhóm trực quan hóa bằng Boxplots để xác định những giá trị bấtthường Mặc dù phát hiện một số giá trị ngoại lai trong một số biến, nhómnhận thấy chúng liên quan đến sự yêu thích của người tiêu dùng đối với sảnphẩm Những giá trị này vẫn hợp lý về mặt thực tế Để đảm bảo tính thực tế vàminh bạch, nhóm quyết định không loại bỏ những giá trị đó

16

Trang 24

Hình 1: Biểu đồ Boxplots của biến Loves_count

Hình 2: Biểu đồ Boxplots của biến Rating

Trang 25

Hình 3: Biểu đồ Boxplots của biến Reviews

Hình 4: Biểu đồ Boxplots của biến Price_usd

Kết luận: Sau khi lọc và làm sạch các dữ liệu thiếu, dữ liệu trùng lặp và dữ

liệu ngoại lai gây ảnh hưởng đến kết quả mô hình, bộ dữ liệu còn 2804 quan sát Nhóm tiến hành trực quan hoá dữ liệu và đề xuất giải pháp nhằm giúp hoạtđộng kinh doanh của Sephora hiệu quả hơn nữa

18

Trang 26

II.2 Phân tích mô tả thống kê bộ dữ liệu

Các bảng đo lường xu thế trung tâm dưới đây được thực hiện bằng phần mềm excel nhờ công cụ data analysis

II.2.1 Loves_count

Hình 5: Thống kê mô tả các chỉ số của biến loves_count

Biến Loves_count: Số người yêu thích sản phẩm của sephora đạt giá trịcao nhất là 1400555 người, đạt giá trị thấp nhất là 513 người và trung bình là

47062 Các sản phẩm của các thương hiệu khác nhau có sự chênh lệch đáng kể

về lượng khách hàng yêu thích, mức độ phân tán lớn với độ lệch chuẩn đạt93900

Phần lớn các sản phẩm có lượng người yêu thích từ 500-100500 chiếm88%, rất ít sản phẩm có lượt yêu thích trên 1 triệu người

Trang 27

II.2.2 Price_usd

Hình 6: Thống kê mô tả các chỉ số của biến price_usd

Sephora cung cấp nhiều mức giá khác nhau, từ bình dân (2 USD) đến caocấp (425 USD) Nhờ vậy, khách hàng có thể dễ dàng lựa chọn sản phẩm phùhợp với nhu cầu và khả năng tài chính của mình Mặc dù có sản phẩm giá rẻ,nhưng Sephora tập trung nhiều hơn vào phân khúc giá cao Giá trung bình chocác sản phẩm của Sephora là 50,7 USD cao hơn đáng kể so với giá thấp nhất.Skewness = 3,3 > 0 cho thấy phân phối dữ liệu lệch sang trái, nhìn vào biểu đồ

ta có thể thấy rõ điều này

II.2.3 Rating

Hình 7: Thống kê mô tả các chỉ số của biến rating

20

Trang 28

Các sản phẩm của hãng đạt trung bình đánh giá là 4,23 sao, đây là mứcđánh giá khá tốt Biểu đồ có xu hướng lệch sang phải do skewness = -1,29 < 0,cho thấy đa số sản phẩm của Sephora nhận được đánh giá khá cao từ ngườitiêu dùng Lượng đánh giá 4 sao là nhiều nhất, cho thấy nhiều người tiêu dùnghài lòng với sản phẩm.

II.2.4 Reviews

Hình 8: Thống kê mô tả các chỉ số của biến Reviews

Phạm vi đánh giá trải dài trên một quãng rất rộng, số lượng đánh giá caonhất là 21281 và thấp nhất chỉ là 1 Điểm trung bình là 713,04 cho thấy đa sốđánh giá đều ở mức cao Tuy nhiên, độ lệch chuẩn 1514,40 rất cao, sự phân tánrộng trong các đánh giá Điều này có thể do số lượng người đánh giá được thuthập từ nhiều thương hiệu, sản phẩm của sephora

Trang 29

II.2.5 Child_count

Hình 9: Thống kê mô tả các chỉ số của biến Child_count

Histogram cho thấy phần lớn dữ liệu tập trung ở phía trái, giá trị trungbình đạt 3,66 Giá trị cao nhất là 78, thấp nhất là 0 vì vậy phạm vi của biến thểtrải dài trên khoảng rất rộng Độ lệch chuẩn đạt 7,74 (cao hơn giá trị trung bìnhrất nhiều) vì vậy có mức độ phân tán rất lớn

II.2.6 Limited_edition

Hình 10: Tỷ lệ phiên bản giới hạn

22

Trang 30

Biến limited_edition: Sản phẩm phiên bản giới hạn chỉ có 47 chiếm gần2% tổng số sản phẩm của sephora Hãng chú tâm sản xuất các phiên bản giớihạn thông thường để tiếp cận nhiều tệp khách hàng hơn Nhưng cũng đồngthời sản xuất giới hạn một số ít sản phẩm để tạo ra sự khan hiếm kích thíchngười tiêu dùng mua sản phẩm để định vị bản thân.

II.2.7 New

Hình 11: Tỷ lệ sản phẩm mới của Sephora

Biến new: chỉ có 179/2084 sản phẩm của sephora là sản phẩm mới chiếm6,38%

II.2.8 Online_only

Trang 31

Hình 12: Tỷ lệ bán hàng trực tuyến

Biến online_only: Các sản phẩm của sephora được bán trên cả 2 nềntảng là trực tuyến và trực tiếp, trong đó sản phẩm chỉ bán online là 447 chiếm16%

Khách hàng vẫn quen với việc trực tiếp mua sắm tại các cửa hàng, tuy nhiên cóthể dự đoán xu hướng mua hàng trực tuyến đang dần gia tăng

II.2.9 Out_of_ stock

24

Trang 33

Biến sephora_exclusive: Có 839 sản phẩm là độc quyền của sephora chiếm gần 30%.

II.3 Trực quan hoá dữ liệu

II.3.1 Mối tương quan giữa các biến

- r(Loves_count, child count)=0,3693: mức độ tương quan trung bình, hệ

số tương quan dương, mối quan hệ giữa 2 biến cùng chiều

- r(Loves_count, new)=-0,0563: mức độ tương quan thấp, hệ số tươngquan mang dấu âm, mối quan hệ giữa 2 biến ngược chiều

- r(Loves_count, limited_edition)=-0,0017: mức độ tương quan rất thấp,

hệ số tương quan mang dấu âm, mối quan hệ giữa 2 biến ngược chiều

26

Trang 34

- r(Loves_count, online_only)=-0,1484: mức độ tương quan thấp, hệ sốtương quan âm, mối quan hệ giữa 2 biến ngược chiều.

- r(Loves_count, out_of_ stock)=-0,0449: mức độ tương quan thấp, hệ sốtương quan âm, mối quan hệ giữa 2 biến ngược chiều

- r(loves_count, sephora_exclusive)=0,0274: mức độ tương quan thấp, hệ

số tương quan dương, mối quan hệ giữa 2 biến cùng chiều

Ngày đăng: 16/11/2024, 15:51

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w