Đồng th i vi c phân tích các bi n ờ ệ ếtrên còn giúp cho doanh nghiệp phân khúc được nhóm khách hàng chính hay các dòng s n phả ẩm được yêu thích,.... Đề tài “Các nhân tố tác động đến do
CHƯƠNG MỞ ĐẦU
Lý do ch ọn đề tài
Lý do nhóm chúng em l a chự ọn đề tài này là do các siêu th ngày càng ị được m r ng và là dở ộ ần thay thế cho các ch truyền thợ ống để buôn bán các m t ặ hàng nhu y u ph m c n thiế ẩ ầ ết cho con người Vì v y chúng em muậ ốn làm đề tài nhằm có th giúp các nhà quể ản trị hay các văn phòng ban liên quan để có th tể ừ đó đưa ra các quyết định quan trọng giúp cho siêu thị có thể hoạt động một cách trơn tru và mượt mà nh t ấ
Đối tượng và phạm vi nghiên cứ u
1.1 Lý do chọn đề tài
Lý do nhóm chúng em l a chự ọn đề tài này là do các siêu th ngày càng ị được m r ng và là dở ộ ần thay thế cho các ch truyền thợ ống để buôn bán các m t ặ hàng nhu y u ph m c n thiế ẩ ầ ết cho con người Vì v y chúng em muậ ốn làm đề tài nhằm có th giúp các nhà quể ản trị hay các văn phòng ban liên quan để có th tể ừ đó đưa ra các quyết định quan trọng giúp cho siêu thị có thể hoạt động một cách trơn tru và mượt mà nh t ấ
Mục tiêu đề ra là có th s d ng các ki n thể ử ụ ế ức đã học ở bộ môn Th ng Kê ố Ứng Dụng nh m phân tích d liệu trên các biến s dụng các phương pháp như ằ ữ ử thống kê mô tả và th ng kê suy diố ễn nhằm biểu diễn độ ph thu c cụ ộ ủa các biến vào nhau và các bi n ế ảnh hưởng như thế nào đến doanh thu chung c a các chi ủ nhánh khác nhau c a siêu th T ủ ị ừ đó có thể đưa ra các quyết định c p qu n tr phù ấ ả ị hợp cho t ng chia nhánh khác nhau ừ
Thực hiện th ng kê mô t và thố ả ống kê suy diễn nh m hiằ ểu được tình trạng doanh thu c a các chi nhánh khác nhau c a siêu th nh m mủ ủ ị ằ ục đích có thể đưa doanh thu của các chi nhánh đó lên mứ ối đa Đồc t ng th i vi c phân tích các bi n ờ ệ ế trên còn giúp cho doanh nghiệp phân khúc được nhóm khách hàng chính hay các dòng s n phả ẩm được yêu thích, Từ đó có thể ự th c hi n các bi n pháp phù h p ệ ệ ợ cho từng chi nhánh khác nhau để có th ể đạt hi u qu cao trong quá trình th c hi n ệ ả ự ệ kinh doanh c a doanh nghi p ủ ệ
1.3 Đối tượng và ph m vi nghiên c u ạ ứ
Sự ảnh hưởng tới nhau của 7 yếu tố (Branch - Chi nhánh, Customer type - Loại khách hàng, Gender - Gi i tính, Tax - Thu , Product line - Dòng s n ph m, ớ ế ả ẩ
COGS - Giá v n hàng bán, Rating - ố Đánh giá) đến doanh thu c a 3 chi nhánh có ủ trong b d li u cho s n ộ ữ ệ ẵ
Ba chi nhánh c a siêu th ủ ị được ch n A, B, C ọ
Câu hỏi nghiên cứ u
Câu h i nghiên c u 1:ỏ ứ Đánh giá mức độ ảnh hưởng của 7 y u t (Branch - ế ố Chi nhánh, Customer type - Lo i khách hàng, Gender - Gi i tính, Tax - Thu , ạ ớ ế Product line - Dòng s n ph m, COGS - Giá v n hàng bán, Rating - ả ẩ ố Đánh giá) đến doanh thu c a siêu th ủ ị
Câu h i nghiên c u 2:ỏ ứ Trong các y u t trên, y u t nào là y u t quan ế ố ế ố ế ố trọng nhất đố ới vi c quyi v ệ ết định doanh thu c a siêu th ? ủ ị
Câu h i nghiên c u 3:ỏ ứ T viừ ệc xác định xu hướng hành động trong quá trình mua hàng và ph n h i cả ồ ủa khách hàng, đưa ra dự đoán về ế k t qu và hi u ả ệ suất c a siêu th ủ ị trong tương lai.
Phương pháp nghiên cứu
Với các mục tiêu đã đề ra đố ới đề tài này cũng như dựa trên đối tượi v ng và ph m vi nghiên cạ ứu đã được nêu ở trên Đề tài “Các nhân tố tác động đến doanh thu c a siêu thủ ị” được nhóm tác gi nghiên c u ả ứ thông qua 2 phương pháp chính là nghiên cứu định lượng và nghiên cứu định tính
Trong đề tài này, nhóm tác giả sử dụng bộ dữ liệu thứ cấp supermarket_sales đã được thu thập từ những công trình nghiên cứu trước đó
Bộ dữ liệu supermarket_sale mô t l ch sả ị ử bán hàng c a chuủ ỗi siêu thị được ghi nhận 3 chi nhánh khác nhau trong ph m vi th i gian là 3 tháng Dở ạ ờ ữ liệu được thu thập dướ ại d ng s h c hoố ọ ặc được lượng hóa để ph c v cho mụ ụ ục đích thống kê, phân tích Thông qua vi c s b d li u này, nhóm tác gi s ti n hành mô tệ ử ộ ữ ệ ả ẽ ế ả và d báo các m i quan h gi a các bi n ph thu c và biự ố ệ ữ ế ụ ộ ến tác động (biến độc lập) hay nói cách khác là m i quan h gi a các nhân t ố ệ ữ ố tác động và doanh thu c a ủ chuỗi siêu th Bị ằng cách đưa ra các giả thuyết v nguyên nhân, kề ết qu v các ả ề
5 nhân tố ảnh hưởng, các d li u hi n có sữ ệ ệ ẽ đượ ổc t ng hợp và đối chiếu để tăng hiệu suất nghiên cứu và ph c v mụ ụ ục đích của vấn đề nghiên cứu
Từ cơ sở c a các k t luủ ế ận cũng như những con s thố ống kê có ý nghĩa được đưa ra thông qua phương pháp định lượng, phương pháp nghiên cứu định tính sẽ được s dử ụng để tiếp tục phân tích và đánh giá dữ li u nhệ ằm rút ra th c trự ạng của khách hàng t i chu i siêu thạ ỗ ị Qua đó, việc đánh giá, đưa ra kết luận được th c ự hiện và cu i cùng là rút ra nhố ững kiến nghị, đề xuất nhằm nâng cao cơ sở khách hàng c a doanh nghi p ủ ệ
Ý nghĩa của đề tài nghiên cứu
Với đề tài “Các nhân tố tác động đến doanh thu c a siêu thủ ị”, nhóm sẽ th c ự hiện các phương pháp thống kê mô t , th ng kê suy diả ố ễn để xác nh mđị ức độ ảnh hưởng của các yếu t (Branch - Chi nhánh, Customer type - Loại khách hàng, ố Gender - Gi i tính, Tax - Thu , Product line - Dòng s n ph m, COGS - Giá v n ớ ế ả ẩ ố hàng bán, Rating - Đánh giá) đến doanh thu c a siêu thủ ị, sau đó đưa ra kết lu n ậ về y u tế ố tác động m nh m nhạ ẽ ất đến doanh thu c a siêu th này D a trên vi c ủ ị ự ệ phân tích các d li u trong quá kh , vi c phân tích dữ ệ ứ ệ ự đoán sẽ giúp ch nhân và ủ các nhà đầu tư của siêu thị giải quyết các khó khăn hiện tại và nhận định được các cơ hội mới Thông qua đó, siêu th có th tị ể ối ưu hóa các chiến d ch marketing ị để có thể thu hút, gi chân và phát tri n khách hàng tiữ ể ềm năng và điều chỉnh nguồn lực phù h p M t khác, vi c phân tích d ợ ặ ệ ự đoán còn giúp doanh nghiệp lập kế ho ch phân ph i hàng hóa, tạ ố ối ưu hóa giá cả, đánh giá các chương trình khuyến mãi hướng đến người dùng
Hướng dẫn sử dụng phần mềm Stata -…
Chapter 7 Zvi Bodie Alex Kane Alan J.…
SƠ ĐỒ ÔN THI MÔN
TKUD - bài tập nhómThống kê
DỮ LIỆU VÀ KẾT QUẢ NGHIÊN CỨU
D ữ liệu và thang đo
Bộ dữ li u nghiên cệ ứu đượ ấ ừc l y t Kaggle (Link) B d li u này t p trung ộ ữ ệ ậ vào s liố ệu liên quan đến doanh thu c a m t siêu th , bao g m 1000 hàng và 17 ủ ộ ị ồ cột v i các thuớ ộc tính như bảng sau:
STT Cột Ý nghĩa Dữ liệu
1 Invoice ID Mã đơn hàng Định tính
2 Branch Chi nhánh Định tính
3 City Thành phố Định tính
4 Customer Loại khách hàng Định tính
5 Gender Giới tính Định tính
6 Product line Dòng sản phẩm Định tính
7 Unit price Giá bán đơn vị Định lượng
8 Quantity Số lượng bán Định lượng
10 Total Tổng giá trị đơn hàng Định lượng
11 Date Ngày mua hàng Định tính
12 Time Giờ thanh toán Định tính
13 Payment Phương thức thanh toán Định tính
14 Cogs Giá vốn hàng bán Định lượng
15 Gross margin percentage Tỷ suất lợi nhuận gộp Định lượng
16 Gross income Tổng thu nhập Định lượng
17 Rating Đánh giá của khách hàng trên thang điểm 100 Định lượng
Bảng: Mô t d li u cho b d li u ả ữ ệ ộ ữ ệ
2.1.2 Thang đo của dữ li u ệ
Bảng: Thang đo cho dữ liệu
Phân tích s li ố ệ u
2.2.1 Xử lý s li u ố ệ a Mã hóa lại các thu c tính c a các biộ ủ ến định tính b ng các s ằ ố
- Siêu th thu c chi nhánh A gị ộ ắn nhãn 1
- Siêu th thu c chi nhánh B g n nhãn 2 ị ộ ắ
- Siêu th thu c chi nhánh C g n nhãn 3 ị ộ ắ encode branch, gen(branch_a) tab branch_a, nolabel
- Chi nhánh thu c thành ph Mandalay g n nhãn 1 ộ ố ắ
- Chi nhánh thu c thành ph Naypyitaw g n nhãn 2 ộ ố ắ
- Chi nhánh thu c thành ph Yangon g n nhãn 3 ộ ố ắ encode city, gen(city_a) tab city_a, nolabel
- Loại khách hàng là thành viên (Member) gắn nhãn 1
- Loại khách hàng không là thành viên (Normal) gắn nhãn 2 encode customertype, gen(customertype_a) tab customertype_a, nolabel
- Khách hàng có giới tính nữ gắn nhãn 1
- Khách hàng có giới tính nam gắn nhãn 2 encode gender, gen(gender_a) tab gender_a, nolabel
- Sản phẩm được bán thuộc dòng Phụ kiện điện tử gắn nhãn 1
- Sản phẩm được bán thuộc dòng Phụ kiện thời trang gắn nhãn 2
- Sản phẩm được bán thuộc dòng Thức ăn và đồ uống gắn nhãn 3
- Sản phẩm được bán thuộc dòng Sức khỏe và sắc đẹp gắn nhãn 4
- Sản phẩm được bán thuộc dòng Nhà cửa và cuộc sống gắn nhãn 5
- Sản phẩm được bán thuộc dòng Thể thao và du lịch gắn nhãn 6 encode productline, gen(productline_a) tab productline_a, nolabel
- Khách thanh toán bằng cash gắn nhãn 1
- Khách thanh toán bằng Credit card gắn nhãn 2
- Khách thanh toán bằng Ewallet gắn nhãn 3 encode Payment, gen(Payment_a) tab Payment_a, nolabel
- Giá v n hàng bán t 908 t i giá vố ừ ớ ốn hàng bán l n nh t g n nhãn 10 ớ ấ ắ recode cogs (min/109=1) (109/208=2) (208/308=3) (308/408=4) (408/508=5) (508/608=6) (608/708=7) (708/808=8) (808/908=9) (908/max) tab cogs
- Tổng thu nh p nh nhậ ỏ ất đến 10 g n nhãn 1 ắ
- Tổng thu nh p t ậ ừ 10 đến 20 g n nhãn 2 ắ
- Tổng thu nh p t ậ ừ 20 đến 30 g n nhãn 3 ắ
- Tổng thu nh p t ậ ừ 30 đến 40 g n nhãn 4 ắ
- Tổng thu nh p t ậ ừ 40 đến 50 g n nhãn 5 ắ recode gross_income (min/10=1) (10/20=2) (20/30=3) (30/40=4) (40/50=5) tab gross_income
- Đánh giá từ giá trị thấp nhất tới 5 đánh số 1
- Đánh giá từ 5 tới 6 đánh số 2
- Đánh giá từ 6 tới 7 đánh số 3
- Đánh giá trừ 7 tới 8 đánh số 4
- Đánh giá từ 8 tới 9 đánh số 5
- Đánh giá từ 9 tới giá trị lớn nhất đánh số 5 recode Rating (min/5=1) (5/6=2) (6/7=3) (7/8=4) (8/9=5) (9/max=6) tab Rating b Phát hiện missing value (nếu có)
2.2.2 Thống kê mô tả a Lập các bảng tần số của từng biến sau và cho nhận xét chi tiết về các bảng tần số trên b Dùng đồ thị phù hợp mô tả tất cả các biến có trong bộ dữ liệu và cho nhận xét c Tính toán các trị thống kê mô tả đặc trưng của tất cả các biến có trong dữ liệu Từ đó, hãy cho nhận xét về hình dáng phân phối dữ liệu của các biến trên?
(2,3) Bi n Branch và Bi n City ế ế
Từ b ng phân ph i t n s ả ố ầ ố đồng th i c a 2 bi n Branch và City, ta biờ ủ ế ết được rằng chi nhánh Yangon n m ằ ở thành ph A, chi nhánh Mandalay thu c thành ph ố ộ ố
B và chi nhánh còn l i Naypyitaw thu c thành ph C ạ ộ ố
Mặt khác, t b ng phân phừ ả ối t n s c a bi n Branch và b ng phân ph i t n ầ ố ủ ế ả ố ầ số c a biủ ến City được th c hi n ự ệ ở bước mã hóa d li u cùng v i biữ ệ ớ ểu đồ tròn và thanh phía trên, ta nh n th y r ng t n sở ậ ấ ằ ầ ố các đơn hàng được ghi nh n 3 chi ậ ở nhánh Yangon, Mandalay, Naypyitaw (lần lượt thu c thành ph A,B,C) gộ ố ần như là b ng nhau v i t n s l n ằ ớ ầ ố ầ lượt là 340 (34%), 332 (33,2%) và 328 (32,8%) trên tổng s ố 1000 đơn hàng được thống kê
(4,5) Bi n Customer và Bi n Gender ế ế
Quan sát s li u t b ng phân ph i và biố ệ ừ ả ố ểu đồ trên, ta nh n th y r ng t l ậ ấ ằ ỉ ệ khách hàng n ữ và nam đặt các hàng là như nhau; tương tự, tỉ lệ đơn đặt hàng đến từ khỏch hàng là thành viờnãvà khụng là thành viờn cũng xấp xỉ nhau (499 và
501) M t khác, s ặ ố lượng khách hàng n là thành viên siêu th ữ ị cũng tương đương với số lượng khách hàng nam Điều này ch ng t sứ ỏ ố lượng các đơn đặt hàng không ph thu c vào gi i tính hay lo i khách hàng ụ ộ ớ ạ
Biểu đồ trên cho chúng ta th y r ng, s ấ ằ ố lượng các đơn hàng được ghi nh n ậ có sự đa dạng v các lo i hình s n ph m ề ạ ả ẩ (Productline), trong đó loại hình s n ả phẩm Ph ki n thụ ệ ời trang (Fashion accessories) được ghi nh n vậ ới s ố lượng được bán ra cao nhất (178 đơn hàng), chênh lệch 26 đơn hàng so với lo i hình s n ph m ạ ả ẩ bán được ít nhất - Sức khỏe và sắc đẹp (Health and beauty) Tuy nhiên, dễ dàng nhận ra rằng giữa các dòng sản ph m không có sẩ ự chênh l ch quá nhiệ ều v sề ố lượng đơn hàng được tiêu thụ, tức là chuỗi siêu thị được nghiên cứu có mức độ phổ biến cao về đa dạng các lo i mạ ặt hàng
Các lo i m t hàng thu c các dòng s n phạ ặ ộ ả ẩm được bán v i giá trung bình ớ khoảng 55$, x p x v i giá tr trung v ghi nhấ ỉ ớ ị ị ận được (55,23$) trong 1000 mẫu sản phẩm được xem xét Giá tiền đơn vị cao nh t là 99,96$ và th p nh t là 10,08$ ấ ấ ấ với kho ng bi n thiên 89,88$ Bên cả ế ạnh đó, do trung bình và trung v cị ủa bi n ế unitprice có giá tr ị tương đương nhau nên đồ thị có hình dáng phân ph i chu n ố ẩ
Xét với từng dòng sản phẩm, giá bán đơn vị của sản phẩm dao động trong khoảng (50,60), trong đó cao nhất là dòng sản phẩm Thể thao và du lịch (Sports and travel) với giá trị 59 và dòng sản phẩm Phụ kiện điện tử (Electronic accessories) có trung bình thấp nhất Tuy nhiên, đối với tất cả các dòng sản phẩm thì độ chênh lệch của giá thành đơn vị là không nhiều, điều này được thể hiện ở biểu đồ trên
Số sản phẩm trong mỗi đơn hàng thường nằm trong khoảng từ 1 đến 10 sản phẩm Trong đó, số đơn hàng mua 10 sản phẩm là nhiều nhất, tiếp đến là số đơn hàng mua 1 sản phẩm Dao động giữa giá trị cao nhất và giá trị thấp nhất là 9, một con số không quá lớn
Bởi vì giá tr trung bình và trung vị ị c a bi n quantity chênh lủ ế ệch không đáng kể (0.51) nên hình dáng của đồ ị khá cân đối th
Giá trị thuế của sản phẩm được tính bằng 5% giá thành đơn vị, vậy nên các giá trị của biến tax phụ thuộc vào biến unitprice Độ chênh lệch giữa tiền thuế cao nhất và tiền thuế thấp nhất là gần 50$, đây là một con số khá lớn với giá trị cao nhất và giá trị thấp nhất được ghi nhận là 49,65$ và 0,5085$
Do kho ng bi n thiên khá l n nên bi n tax có m t s giá tr ngo i l n m ả ế ớ ế ộ ố ị ạ ệ ằ ngoài đồ thị hộ –p râu
Mặt khác, giá trị trung vị của biến tax được ghi nhận bé hơn giá trị trung bình nên đồ thị bị lệch phải
Tổng giá tr mị ỗi đơn hàng (bao gồm cả giá thành các s n ph m và thu ) có ả ẩ ế giá tr trung bình kho ng 323$ và t ng giá tr t p trung trong kho ng (130, 450) ị ả ổ ị ậ ảDao động gi a giá tr l n nh t (1042.65) và giá tr nh nh t (10.6785) là 1031.972, ữ ị ớ ấ ị ỏ ấ đây là một giá trị khá l n V y nên biớ ậ ểu đồ ộ h p s xu t hi n các giá tr ngo i l ẽ ấ ệ ị ạ ệ
Như ta dễ dàng nhìn th y, trung bình lấ ớn hơn trung vị nên đồ ị l ch ph i th ệ ả
Hình: Bi u ể đồ thu c tính c a bi n Date ộ ủ ế
Từ đồ th và b ng phân ph i có th th y bi n Date có gi i giá tr không ị ả ố ể ấ ế ả ị đồng nh t v i mỗi ngày khác nhau s có sấ ớ ẽ ố lượng khách hàng mua khác nhau Với giá tr mua l n nh t vào ngày 7/2/2019 ị ớ ấ
Ta có th th y các cách thanh toán c a khách hàng không khác nhau là m y ể ấ ủ ấ với ti n m t là 34,4 %, th tín d ng là 31,1% và E Wallet là 34,5% ề ặ ẻ ụ
Ta có th th y giá v n hàng bán gi m d n t 1 t i 10 liên t c gi m V y ta ể ấ ố ả ầ ừ ớ ụ ả ậ có th th y siêu thể ấ ị có xu hướng nh p hàng có giá v n nh và r t ít lo i giá v n ậ ố ỏ ấ ạ ố hàng bán là 7, 8, 9 10
Có th th y doanh thu c a m c 1 là l n nh t vể ấ ủ ứ ớ ấ ới hơn 400 đơn vị và nhỏ nhất là mức 5 dưới 100 đơn vị
Từ biểu đồ trên ta có th th y rể ấ ằng các điểm đánh giá của khách hàng cho các thương hiệu là khá tương đồng nhau và mỗi khoảng điểm cũng không quá chênh l ch nhau ệ Ở thương hiệu A khoảng điểm được đánh giá đó là khoảng điểm số 4 t c 7 tứ ới 8 điểm Ở thương hiệu B khoảng điểm được đánh giá nhiều nhất đó là kho ng 3 t c t 6 tả ứ ừ ới 7 điểm Ở thương hiệu C các khoảng điểm khá cân b ng ằ nhau các kho ng t 2 tả ừ ới 6 đều trên 54 đánh giá.
Gi ả thuyết nghiên cứu và thống kê suy diễ n
2.3 Giả thuy t nghiên c u và th ng kê suy di n ế ứ ố ễ
2.3.1 Các gi thuyả ết nghiên c u ứ
Dựa vào ph n phân tích d li u và th c hi n th ng kê mô t , nhóm chúng ầ ữ ệ ự ệ ố ả em đã đưa ra một số giả thuyết nghiên c u cứ ần được đánh giá bao gồm:
(1) Không có s khác bi t trong s ự ệ ố lượng đơn hàng giữa các ngành hàng (Branch)
(2) Khách hàng thành viên (Member) đem lại trung bình doanh thu nhiều hơn so với khách hàng thông thường (Normal)
(3) Trung bình doanh thu c a khách hàng nam (Male) nhiủ ều hơn khách hàng n (Female) ữ
(4) Dòng s n ph m Ph ki n thả ẩ ụ ệ ời trang (Fashion accessories) được bán chạy nhất và đem lại nguồn doanh thu cao nh t ấ
(5) Khách hàng ưa chuộng thanh toán bằng thẻ tín dụng (Credit Card) hơn các loại hình thanh toán khác
(6) Đánh giá xếp hạng (Rating) có trung bình trên 7.5
(7) Các bi n giá (Unitprice), sế ố lượng (Quantity), thu 5% (Tax5), giá ế vốn (cogs) là nhân t chính ố ảnh hưởng đến doanh thu
Trước khi đi vào phân tích, kiểm định các giả thuy t, chúng ta c n cế ầ ần đối dữ liệu doanh thu để việc phân tích d ễ dàng và chính xác hơn, sau khi cân đối dữ liệu ta được:
Hình: Trước khi cân đối doanh thu
Hình: Sau khi cân đối doanh thu
(1) Không có sự khác bi t trong sệ ố lượng đơn hàng giữa các ngành hàng
- Để kiểm định không có sự khác biệt giữa số lượng các đơn hàng của các ngành, tương ứng số lượng mỗi ngành sẽ chiếm 33.333% (⅓) Thực hiện kiểm định trên Branch B và Branch C với mức ý nghĩa, ta được:
Vậy sau khi thực hiện kiểm định cho rằng không có sự khác biệt về số lượng đơn hàng giữa các ngành hàng với mức ý nghĩa 5%, ta có thể thấy giả thuyết trên hoàn toàn được chấp nhận vì giá trị p_value > (alpha) hay 0.7205 > 0.05 Chính vì thế, có thể cho rằng ngành hàng không phải là nhân tố ảnh hưởng tới doanh thu vì nó phân bổ đều theo số lượng đơn hàng
(2) Khách hàng thành viên (Member) đem lại trung bình doanh thu nhiều hơn so với khách hàng thông thường (Normal)
• Khách hàng thông thường Normal → mã hóa thành 0
• Khách hàng thành viên Member → mã hóa thành 1
Vậy sau khi th c hi n kiự ệ ểm định gi thuyả ết khách hàng thành viên đem lại doanh thu nhiều hơn với mức ý nghĩa 5% ta thấy gi thuy t này b bác b vì giá ả ế ị ỏ trị p_value > (alpha) hay 0.3006>0.05 nên ch p nh n gi thuy t trung bình doanh ấ ậ ả ế thu mà các 2 nhóm khách hàng này mang l i là b ng nhau Ta có th k t luạ ằ ể ế ận, đối tượng khách hàng không ảnh hưởng đến doanh thu
(3) Trung bình doanh thu của khách hàng nam (Male) nhiều hơn khách hàng n (Female) ữ
• Khách hàng nam → mã hóa thành 0
• Khách hàng nữ → mã hóa thành 1
Vậy thực hiện kiểm định giả thuyết trung bình doanh thu khách hàng nam nhiều hơn nữ với mức ý nghĩa 5% cho thấy giả thuyết bị bác bỏ vì giá trị p_value
> (alpha) hay 0.9392>0.05 Nhìn vào phân tích ta có thể cho rằng, trung bình doanh thu khách hàng nam và nữ bằng nhau nhưng có xu hướng nghiên về khách hàng nữ vì nếu tăng mức ý nghĩa lên 10% thì có thể chấp nhận giả thuyết trung bình khách hàng nữ lớn hơn nam do p_value = 0.0608 < 0.1 Chính vì thế, giới tính sẽ có tác động yếu doanh thu
(4) Dòng s n ph m Phả ẩ ụ ki n thệ ời trang (Fashion accessories) được bán chạy nhất và đem lại nguồn doanh thu cao nh t ấ
• Dòng sản phẩm Healthy and beauty, → mã hóa thành 0
• Dòng sản phẩm Electronic accessories → mã hóa thành 1
• Dòng sản phẩm Home and lifestyle → mã hóa thành 2
• Dòng sản phẩm Sports and travel → mã hóa thành 3
• Dòng sản phẩm Fashion accessories → mã hóa thành 4
• Dòng sản phẩm Food and beverages → mã hóa thành 5
Mô t d li u d th y hả ữ ệ ễ ấ ầu như các dòng hàng có số ợng đơn hàng không lư có nhi u k t qu chênh lề ế ả ệch giao động từ 15% đến 17% Trung bình doanh thu của mỗi dòng hàng cũng không có sự khác biệt với mức trung bình kho ng 5.83 ả Đặt ra hoài nghi cho r ng trung bình doanh thu mà các dòng hàng mang l i không ằ ạ có s khác bi t ự ệ
- Mã hóa dữ liệu lần 2:
• Dòng sản phẩm Fashion accessories → mã hóa thành 1
• Các dòng sản phẩm còn lại → mã hóa thành 0
Thực hiện kiểm định với giả thuyết cho rằng trung bình doanh thu của dòng sản phẩm Fashion accessories lớn nhất với mức ý nghĩa 5% cho thấy giả thuyết bị bác bỏ bởi p_value > (alpha) hay 0.2155>0.05 nên có thể cho rằng không có sự khác biệt trung bình doanh thu giữa các dòng hàng Chính vì thế, các dòng hàng không phải là nhân tố ảnh hưởng đến doanh thu
(5) Khách hàng ưa chuộng thanh toán bằng ví điện tử (Ewallet) hơn các loại hình thanh toán khác
• Thanh toán ví điện tử (Ewallet) → mã hóa thành 0
• Thanh toán tiền mặt (Cash), thẻ tín dụng (Credit Card) → mã hóa thành 1
Thực hiện kiểm định trung bình doanh thu của khách hàng thanh toán bằng ví điện tử với mức ý nghĩa 5% ta được kết quả không có sự khác biệt trung bình doanh thu giữa các loại hình sản phẩm hay giả thuyết bị bác bỏ vì giá trị p_value
> (alpha) hay 0.5291 > 0.05 Chính vì thế, loại hình thanh toán không phải là nhân tố ảnh hưởng đến doanh thu
(6) Đánh giá xếp hạng (Rating) có trung bình trên 7.5
Với mức ý nghĩa 5%, kiểm định giả thuyết cho rằng đánh giá xếp hạng các đơn hàng trên 7.5 ta được kết quả bác bỏ giả thuyết vì giá trị p_value > (alpha) hay 1>0 Kết quả phân tích cho thấy các trung bình mức đánh giá của các đơn hàng dưới 7.5
(7) Các biến giá (Unitprice), số lượng (Quantity), thuế 5% (Tax5), giá vốn (cogs) là nhân tố chính ảnh hưởng đến doanh thu
Thực hiện phân tích Linear Regession và đánh cho thấy giá gị p_value < (alpha) hay 0