1. Trang chủ
  2. » Luận Văn - Báo Cáo

tiểu luận đề tài lập trình phân tích số lượng hàng bán trênsàn điện tử tiki của mặt hàng thời trang

50 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề LẬP TRÌNH PHÂN TÍCH SỐ LƯỢNG HÀNG BÁN TRÊN SÀN ĐIỆN TỬ TIKI CỦA MẶT HÀNG THỜI TRANG
Tác giả Võ Minh Đạt, Trần Gia Dung, Trương Gia Hào, Lưu Quang Huy, Bùi Lê Khang
Người hướng dẫn TS. Nguyễn An Tế
Trường học ĐẠI HỌC UEH
Chuyên ngành Lập trình phân tích dữ liệu
Thể loại BÁO CÁO NHÓM
Năm xuất bản 2023
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 50
Dung lượng 5,43 MB

Nội dung

41 Hình 56: Kiểm định Shapiro-Wilk kiểm tra phân phối chuẩn của number_of_images...42 Hình 57: Kết quả sau khi thực hiện kiểm định Shapiro_Wilk...42 Hình 58: Tạo hàm thực hiện kiểm định

Trang 1

ĐẠI HỌC UEH TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ

KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH

-🖎🕮✍

-BÁO CÁO NHÓM

ĐỀ TÀI: LẬP TRÌNH PHÂN TÍCH SỐ LƯỢNG HÀNG BÁN TRÊN SÀN ĐIỆN TỬ TIKI CỦA MẶT HÀNG THỜI TRANG

TP Hồ Chí Minh, Ngày 15 tháng 11 năm 2023

Trang 2

MỤC LỤC

I TỔNG QUAN 7

1.1 Tổng quan đề tài: 7

1.1.1 Lý do chọn đề tài: 7

1.1.2 Các giả thuyết được đặt ra: 7

1.2 Tổng quan về bộ dữ liệu: 7

1.2.1 Nguồn gốc: 7

1.2.2 Định dạng lưu trữ: 8

1.2.3 Import dữ liệu: 9

II TIỀN XỬ LÝ DỮ LIỆU: 9

2.1 Kiểm tra kiểu dữ liệu của thuộc tính và dữ liệu bị thiếu (Missing value): 9

2.2 Kiểm tra dữ liệu ngoại lai (Outliers): 10

2.2.1 Hàm trực quan dữ liệu để tìm Outliers bằng biểu đồ Boxplot: 10

2.2.2 Hàm trực quan phân phối dữ liệu bằng biểu đồ Histogram: 12

2.3 Lập hàm xử lý dữ liệu: 17

III BIỂU ĐỒ TRỰC QUAN PHÂN TÍCH DỮ LIỆU: 19

3.1 Biểu đồ tương quan giữa số lượng reviews “review_counts” và điểm đánh giá trung bình “raitng_average”: 19

3.1.1 Tạo hàm biểu diễn biểu đồ tương quan: 19

3.1.2 Kết quả: 20

3.2 Biểu đồ tỷ lệ giữa nhóm có video quảng cáo và không có video quảng cáo “has_video”. 20 3.2.1 Tạo hàm biểu diễn biểu đồ tỷ lệ: 20

3.2.2 Kết quả: 21

3.3 Tỷ lệ sản phẩm được hoàn tiền: 22

3.3.1 Tạo hàm biểu diễn tỷ lệ sản phẩm được hoàn tiền: 22

3.3.2 Kết quả: 22

3.4 Tỷ lệ các sản phẩm được hỗ trợ chương trình mua ngay trả sau: 23

3.4.1 Tạo hàm biểu diễn tỷ lệ sản phẩm được hỗ trợ mua ngay trả sau 23

3.4.2 Kết quả: 23

3.5 Biểu đồ tương quan giữa giá “price” và số lượng bán “quanity_sold” 24

3.5.1 Tạo hàm biểu diễn biểu đồ tương quan giữa giá “price” và số lượng bán “quanity_sold”: 24

3.5.2 Kết quả: 25

3.6 Biểu đồ tương quan giữa điểm đánh giá trung bình “rating_average” và giá bán “price” 25

3.6.1 Tạo hàm biểu diễn biểu đồ tương quan giữa “rating_average” và “price”: 25

Trang 3

3.6.2 Kết quả: 25

3.7 Top 10 sản phẩm giày nam bán chạy nhất: 26

3.7.1 Tạo hàm biểu diễn biểu đồ top 10 giày nam: 26

3.7.2 Kết quả: 26

3.8 Phân phối giá bán của sản phẩm giày nam: 27

3.8.1 Tạo hàm biểu diễn phân phối giá bán của giày nam: 27

3.8.2 Kết quả: 27

3.9 Top 10 thương hiệu giày nam trên Tiki: 28

3.9.1 Tạo hàm biểu diễn top 10 thương hiệu giày nam: 28

3.9.2 Kết quả: 28

3.10 So sánh top 10 thương hiệu giày nam với top 10 thương hiệu giày nữ trên Tiki: 29

3.10.1 Tạo hàm biểu diễn biểu đồ: 29

3.10.2 Kết quả: 30

3.11 Điểm trung bình đánh giá của sản phẩm (rating_average) theo hình thức vận chuyển (fulfillment_type): 30

3.11.1 Code tạo biểu đồ bar cho điểm trung bình theo hình thức vận chuyển 30

3.11.2 Kết quả: 31

IV KIỂM ĐỊNH GIẢ THUYẾT: 31

4.1 Có sự khác nhau giữa trung bình của hai biến orginal_price và price: 31

4.1.1 Biểu đồ trực quan tần suất của hai biến: 31

4.1.2 Kiểm định với độ tin cậy 99%: 32

4.2 Lượng hàng bán được (quanity_sold) trung bình của giày nữ nhiều hơn giày nam: 33

4.2.1 Biểu đồ trực quan về phân phối của hai biến: 33

4.2.2 Kiểm định T-test phía phải với độ tin cậy 95%: 35

4.3 Có sự khác nhau về lượng hàng bán được (quanity_sold) trung bình giữa bốn mặt hàng giày nữ, giày nam, phụ kiện, backpack suitcase: 35

4.3.1 Biểu đồ QQ-plot kiểm tra phân phối: 35

4.3.2 Kiểm định phi tham số Kruskal_Wallis với độ tin cậy 95%: 37

4.3.3 Kiểm định Post-hoc với độ tin cậy 95%: 38

4.4 Có sự khác nhau giữa trung bình số lượng hình ảnh giữa bốn mặt hàng giày nam, giày nữ, phụ kiện và backpack suitcases 39

4.4.1 Biểu đồ QQ-plot kiểm tra phân phối chuẩn: 39

4.4.2 Kiểm định Shapiro-Wilk để kiểm tra phân phối chuẩn với độ tin cậy 95%: 41

Trang 4

4.5.1 Biểu đồ trực quan tần suất của hai biến: 44

4.5.2 Kiểm định T-test hai phía với độ tin cậy 95% 45

V KẾT LUẬN: 46

VI PHỤ LỤC: 47

VII PHÂN CÔNG: 47

Too long to read on your phone? Save

to read later on your computer

Save to a Studylist

Trang 5

Mục lục hình ảnh

Hình 1: Đoạn code lập trình import dữ liệu vào Colab 9

Hình 2: Kiểm tra dữ liệu bị thiếu của bộ dữ liệu 10

Hình 3: Code tạo hàm trực quan dữ liệu tìm Outliers bằng biểu đồ Boxplot 11

Hình 4: Biểu đồ Box-plot của cột 'original_price' và 'price’ 11

Hình 5: Biểu đồ Box-plot của cột 'review_count', 'rating_average', 'number_of_images' và 'quanity_sold' 12

Hình 6:Code tạo hàm trực quan phân phối dữ liệu bằng biểu đồ Histogram 13

Hình 7: Code biểu diễn biểu đồ Histogram 13

Hình 8: Biểu đồ Histogram kiểm tra phân phối dữ liệu 14

Hình 9: Code tạo hàm tóm tắt tỷ lệ của Outliers 15

Hình 10: Tóm tắt tỷ lệ Outliers của các cột 'original_price', 'price' và 'review_count' 15

Hình 11: Tóm tắt tỷ lệ Outliers của các cột ' rating_average', 'number_of_images', 'quanity_sold' 16

Hình 12: Code tạo hàm tóm tắt Outliers có trong các cột 16

Hình 13: Kết quả tổng số Outliers trong mỗi cột 17

Hình 14: Tạo hàm xử lý Outliers theo quy tắt 3 sigma 17

Hình 15: Tạo hàm Pipelibe xử lý dữ liệu 18

Hình 16: Code hàm xử lý dữ liệu 18

Hình 17: So sánh phân phối trước và sau khi xử lý dữ liệu 19

Hình 18: Code tạo hàm biểu diên biểu đồ trực quan 20

Hình 19: Biểu đồ thể hiện mối tương quan giữa "reivew_count" và "rating_average" 20

Hình 20: Code tạo biểu đồ tròn biểu diễn tỷ lệ 21

Hình 21: Biểu đồ thể hiện tỷ lệ giữa sản phẩm có video quảng cáo và không có video quảng cáo 21

Hình 22: Code tạo biểu diễn biểu đồ tỷ lệ các sản phẩm được hoàn tiền 22

Hình 23: Biểu đồ thể hiện tỷ lệ sản phẩm được hoàn tiền 22

Hình 24: Code tạo biểu đồ biểu diễn tỷ lệ sản phẩm được hỗ trợ "mua ngay trả sau" 23

Hình 25: Biểu đồ biểu diễn tỷ lệ sản phẩm được hỗ trợ chương trình "mua ngay trả sau" 24

Hình 26: Code biểu đồ tương quan giữa "price" và "quanity_sold" 24

Hình 27: Biểu đồ thể hiện tương quan giữa giá bán “price” và số lượng bán “quanity_sold” 25

Hình 28: Code biểu diễn biểu đồ tương quang giữa "rating_average" và "price" 25

Hình 29: Biểu đồ tương quan giữa "rating_average" và "price", 26

Hình 30: Code tạo hàm biẻu diễn biểu đồ top 10 sản phẩm bán chạy 26

Hình 31: Biểu đồ thể hiện top 10 sản phẩm giáy nam bán chạy nhất 27

Hình 32: Code biểu diễn biểu đồ phân phối giá bán 27

Hình 33: Biểu đồ thê hiện phân phối giá bán của giày nam 28

Hình 34: Code biểu diễn biểu đồ top 10 thương hiệu giày nam 28

Hình 35: Biểu đồ thể hiện top 10 thương hiệu giày nam trên Tiki 29

Hình 36:Code tạo biểu đồ biểu diễn top 10 thương hiệu của giày nam và giày nữ 30

Hình 37: So sánh giữa top 10 thương hiệu giày nam và top 10 thương hiệu giày nữ trên Tiki 30

Hình 38: Code tạo biểu đồ cho điểm đánh giá trung bình theo hình thức vận chuyển 31

Hình 39: Biểu đồ thể hiện giữa rating_average và fulfillment_type 31

Hình 40: Code tạo biểu đồ trực quan tần suất 32

Trang 6

Hình 45: Biểu đồ kiểm tra phân phối của biến “quanity_sold” của giày nữ và giày nam 34

Hình 46: Code tạo hàm kiểm định T-test cho biến "quanity_sold" 35

Hình 47: Kết quả kiểm định T-test của giả thuyết có sự khác biệt trung bình lượng bán “quanity_sold”của giày nữ và nam 35

Hình 48: Code tạo biểu đồ QQ-plot để kiểm tra phân phối chuẩn 36

Hình 49: Biểu đồ kiểm tra phân phối của lượng hàng bán trung bình của bốn mặt hàng giày nam, giày nữ, phụ kiện, backpack suitcase 37

Hình 50: Code tạo hàm kiểm định phi tham số Kruskal_Wallis 38

Hình 51: Kết quả kiểm định có sự khác biệt của quanity_sold trong các nhóm mặt hàng 38

Hình 52: Sử dụng kiểm định Dunn’s Test kiểm tra có sự khác biệt của quanity_sold giữa vác mặt hàng 39

Hình 53: Kết quả kiểm định 39

Hình 54: Code vẽ biểu đồ QQ-plot kiểm tra phân phối chuẩn 40

Hình 55: Biểu đồ kiểm tra phân phối của số lượng hình ảnh “number_of_images” giữa bốn mặt hàng 41

Hình 56: Kiểm định Shapiro-Wilk kiểm tra phân phối chuẩn của number_of_images 42

Hình 57: Kết quả sau khi thực hiện kiểm định Shapiro_Wilk 42

Hình 58: Tạo hàm thực hiện kiểm định Kruskal-Wallis 43

Hình 59: Kết quả thực hiện kiểm định Kruskal-Wallis về giả thuyết các mặt hàng đều giốgng nhau về só lượng hình ảnh 43

Hình 60: Sử dụng kiểm định Dunn’s Test kiểm tra có sự khác biệt của “number_of_images” giữa các mặt hàng 44

Hình 61: Kết quả sau khi thực hiện kiểm định 44

Hình 62: Code tạo biểu đồ kiểm tra phân phối của 'review_count' của mặt hành phụ kiện và giày nữ 45

Hình 63: Kết quả biểu đồ kiểm tra phân phối cho giả thuyết có sự khác biệt của 'review_count' ở giày nữ và phụ kiện 45

Trang 7

Tại Việt Nam, các sàn thương mại điện tử đang phát triển rất mạnh nhằm đáp ứng nhu cầu của người tiêu dùng khi họ đang bắt đầu chuyển sang hình thức mua hàng online thay vì đến trực tiếp các cửa hàng Bên cạnh các sàn thương mại đang có trụ sở chính ở nước ngoài ví dụ như: Shopee, Lazada, Amazon, thì ở nước ta Tiki-một trong những sàn thương mại điện tử lớn của Việt Nam cũng được người tiêu dùng tin tưởng.

Bên cạnh những sản phẩm gia dụng, điện tử, sách, ta thường thấy đượcbày bán trên Tiki thì mặt hàng thời trang cũng có được mối quan tâm rất lớn từ phía người tiêu dùng Do đó, nhóm quyết định chọn đề tài: “Lập trình phân tích số lượng hàng bán trên sàn thương mại điện tử Tiki của mặt hàng thời trang” để có thể tìm hiểu kĩ hơn về giá bán, lượng bán trung bình, mức độ hài lòng của khách hàng thông qua môn Biểu diễn trựcquan dữ liệu Qua đó, nhóm có thể đưa ra được một số kết luận và đề xuất

để người mua hàng có trải nghiệm tốt hơn khi mua hàng trên Tiki nói chung và mặt hàng thời trang của Tiki nói riêng

I.1.2 Các giả thuyết được đặt ra:

- Có sự khác nhau giữa “original_price” và “price”

- Lượng hàng bán được “quanity_sold” trung bình của giày nữ nhiều hơngiày nam

- Có sự khác nhau về lượng hàng bán được “quanity_sold” trung bình giữa bốn mặt hàng giày nữ, giày nam, phụ kiện, backpack suitcase

- Có sự khác nhau giữa số lượng hình ảnh “number_of_images” giữa bốn mặt hàng giày nam, giày nữ, phụ kiện và backpack suitcases

- Có sự khác nhau giữa trung bình số lượng reviews “review_count” của mặt hàng phụ kiện và mặt hàng giày nữ

I.2 Tổng quan về bộ dữ liệu:

I.2.1 Nguồn gốc:

- Dữ liệu được crawl từ sàn thương mại điện tử Tiki, một trong những

Trang 8

- Vì số lượng mặt hàng thời trang trên sàn thương mại điện tử Tiki rất khổng lồ, nên bộ dữ liệu chỉ thu thập những mặt hàng thời trang phổ biến nhất.

- Ngôn ngữ chính là tiếng Việt UTF-8

- Tiền tệ được sử dụng là Vietnam Dong (vnd)

I.2.2 Định dạng lưu trữ:

- Dataset lưu trữ các tập tin CSV, mỗi tập tin đại diện cho một nhóm (category)

- Các tập tin có cùng format, cùng số lượng feature cũng như header

- Giải thích thuộc tính dữ liệu

Tên biến Loại dữ liệu Ý nghĩa

original_price Định lượng chưa áp dụng giảm giáGiá của sản phẩm khi

price Định lượng Giá hiện tại (Có thể hoặckhông áp dụng giảm giá)

OEM hoặc registeredbrand (OEM nghĩa làoriginal equipmentmanufacturer hoặc hiểuđơn giản là 'no brand')

favorite_count Định lượng Số người thêm sản phẩmnày vào mục yêu thích

Trang 9

current_seller Định danh Tên của người bán

number_of_images Định lượng Số lượng hình ảnh của sảnphẩm được đăng lên

vnd_cashback Định lượng Số tiền hoàn lại (đơn vị:VND)

has_video Định tính True nếu có video clip,False nếu không có

B'ng 1: Gi'i thích các thuộc tính có trong data

I.2.3 Import dữ liệu:

Hình 1: Đoạn code lập trình import dữ liệu vào Colab

II TIỀN XỬ LÝ DỮ LIỆU:

II.1 Kiểm tra kiểu dữ liệu của thuộc tính và dữ liệu bị thiếu (Missing value):

Trang 10

Hình 2: Kiểm tra dữ liệu bị thiếu của bộ dữ liệu.

Nhận xét: Kiểu dữ liệu đã chính xác Không cần chỉnh sửa kiểu dữ liệu của các

thuộc tính Có một số dữ liệu bị thiếu ở cột “brand”, “fulfillment_type”

II.2 Kiểm tra dữ liệu ngoại lai (Outliers):

II.2.1 Hàm trực quan dữ liệu để tìm Outliers bằng biểu đồ Boxplot:

Trang 11

Hình 3: Code tạo hàm trực quan dữ liệu tìm Outliers bằng biểu đồ Boxplot.

Kết quả trực quan:

Trang 12

Hình 5: Biểu đồ Box-plot của cột 'review_count', 'rating_average',

'number_of_images' và 'quanity_sold'

Nhận xét:Ta quan sát được phần lớn dữ liệu trong các cột đều có Outliers.II.2.2 Hàm trực quan phân phối dữ liệu bằng biểu đồ Histogram:

Trang 13

Hình 6:Code tạo hàm trực quan phân phối dữ liệu bằng biểu đồ Histogram.

Kết quả trực quan:

Hình 7: Code biểu diễn biểu đồ Histogram

Trang 14

Hình 8: Biểu đồ Histogram kiểm tra phân phối dữ liệu.

Nhận xét: Ta khó nhìn ra được phân phối của dữ liệu vì dữ liệu bị ảnh hưởng

nặng nề bởi các Outliers

II.2.3 Hàm tóm tắt Outliers:

Hàm tóm tắt tỷ lệ của Outliers trên tổng giá trị thuộc tính:

Trang 15

Hình 9: Code tạo hàm tóm tắt tỷ lệ của Outliers.

- Kết quả:

Hình 10: Tóm tắt tỷ lệ Outliers của các cột 'original_price', 'price' và 'review_count'

Trang 16

Hình 11: Tóm tắt tỷ lệ Outliers của các cột ' rating_average', 'number_of_images',

'quanity_sold'

Nhận xét: Ta quan sát được dữ liệu bị ảnh hưởng nặng bởi Outliers ở các cột

‘original price’, ‘price’, ‘review count’, nhất là ở cột ‘quantity sold’ Vì thế, nhóm sẽ tiến hành tóm tắt số Ouliers có trong các cột và xử lý Outliers theo quy tắc 3 sigma

Tạo hàm tóm tắt số Ouliers có trong các cột:

Hình 12: Code tạo hàm tóm tắt Outliers có trong các cột

Trang 17

- Kết quả sau khi tạo hàm:

Hình 13: Kết qu' tổng số Outliers trong mỗi cột

II.3 Lập hàm xử lý dữ liệu:

Nhóm tiến hành xử lý dữ liệu qua các bước:

- Xóa dữ liệu trùng lặp (Duplicate Data)

- Loại bỏ dòng trắng (Blank rows)

- Loại bỏ dữ liệu bị thiếu (Missing Data)

- Loại bỏ Outliers theo quy tắt 3 sigma

II.3.1 Tạo hàm xử lý Outliers theo quy tắt 3 sigma:

Hình 14: Tạo hàm xử lý Outliers theo quy tắt 3 sigma

II.3.2 Tạo Pipelibe xử lý dữ liệu:

Trang 18

Hình 15: Tạo hàm Pipelibe xử lý dữ liệu.

II.4 Dữ liệu trước và sau khi xử lý:

Xử lý dữ liệu:

Hình 16: Code hàm xử lý dữ liệu

So sánh phân phối dữ liệu trước và sau khi xử lý:

Trang 19

Hình 17: So sánh phân phối trước và sau khi xử lý dữ liệu.

III BIỂU ĐỒ TRỰC QUAN PHÂN TÍCH DỮ LIỆU:

III.1.Biểu đồ tương quan giữa số lượng reviews “review_counts” và điểm đánh giá trung bình “raitng_average”:

III.1.1 Tạo hàm biểu diễn biểu đồ tương quan:

Trang 20

Hình 18: Code tạo hàm biểu diên biểu đồ trực quan.

III.1.2 Kết quả:

Hình 19: Biểu đồ thể hiện mối tương quan giữa "reivew_count" và "rating_average"

Nhận xét: Để thể hiện mối tương quan giữa hai biến “review_count” và

“rating_average”, đầu tiên nhóm đã sử dụng thư viện ploty.express và tiến hành xác định cột chứa dữ liệu của hai biến trên, tạo figure và vẽ biểu đồ Scatter plot để biểu diễn tương quan rõ nhất

Có thể thấy số lượng các sản phẩm được đánh giá khá ít Phần lớn những sản phẩm được đánh giá đều ở mức từ 4 đến 5 điểm Điều này cho thấy, có thể người tiêu dùng đều hài lòng khi sử dụng các sản phẩm được mua trên Tiki

III.2.Biểu đồ tỷ lệ giữa nhóm có video quảng cáo và không có video quảng cáo “has_video”.

III.2.1.Tạo hàm biểu diễn biểu đồ tỷ lệ:

Trang 21

Hình 20: Code tạo biểu đồ tròn biểu diễn tỷ lệ.

Trang 22

Tỷ lệ sản phẩm có quảng cáo bằng khoảng 1/10 tỷ lệ không quảng cáo cho thấyhiện nay các nhãn hàng vẫn chưa chú trọng vào các video quảng cáo trên các nền tảng thương mại điện tử Các nhãn hàng cần thêm video quảng cáo để khách hàng có thể tiếp cận được nhiều thông tin về sản phẩm hơn.

III.3.Tỷ lệ sản phẩm được hoàn tiền:

III.3.1 Tạo hàm biểu diễn tỷ lệ sản phẩm được hoàn tiền:

Hình 22: Code tạo biểu diễn biểu đồ tỷ lệ các s'n phẩm được hoàn tiền

III.3.2 Kết quả:

Hình 23: Biểu đồ thể hiện tỷ lệ s'n phẩm được hoàn tiền

Trang 23

Nhận xét: Nhóm đã lọc và tạo hai nhóm sản phẩm được hoàn tiền và không

được hoàn tiền dựa trên dữ liệu của cột “vnd_cashback”, sau đó tính toán số lượng mẫu trong từng nhóm Vì đây là biểu đồ thể hiện tỷ lệ giữa 2 nhóm, nên ta sẽ dùng biểu đồ tròn sau đó tiến hành set cấu hình và hiển thị biểu đồ

Có thể nhận thấy xu hướng các sản phẩm có hoàn tiền chỉ chiếm khoảng 20%

so với tổng số sản phẩm được bán trên hệ thống Tiki Điều này cho thấy các nhãn hàng cũng như sàn thương mại điện tử chưa có những ưu đãi hoàn tiền cho người tiêu dùng Tiki cần có nhiều ưu đãi để giữ chân người tiêu dùng với sự cạnh tranh từ các đối thủ

III.4.Tỷ lệ các sản phẩm được hỗ trợ chương trình mua ngay trả sau:

III.4.1 Tạo hàm biểu diễn tỷ lệ sản phẩm được hỗ trợ mua ngay trả sau

Hình 24: Code tạo biểu đồ biểu diễn tỷ lệ s'n phẩm được hỗ trợ "mua ngay tr' sau"

III.4.2 Kết quả:

Trang 24

Hình 25: Biểu đồ biểu diễn tỷ lệ s'n phẩm được hỗ trợ chương trình "mua ngay tr'

sau"

Nhận xét: Nhóm đã lọc và tạo hai nhóm sản phẩm được hỗ trợ chương trình và

không được hỗ trợ dựa trên dữ liệu của cột “pay_latter”, sau đó tính toán số lượng mẫu trong từng nhóm Vì đây là biểu đồ thể hiện tỷ lệ giữa 2 nhóm, nên ta sẽ dùng biểu đồ tròn sau đó tiến hành set cấu hình và hiển thị biểu đồ

Trong tổng số hơn 33044 nghìn mẫu được thu thập thì có thể thấy tỷ lệ số lượng các sản phẩm không hỗ trợ không có chênh lệch quá nhiều với số lượng sản phẩm có hỗ trợ Qua đó, ta có thể thấy Tiki đã và đang chú trọng tới việc kích cầu người tiêu dùng bằng hình thức trên Tuy nhiên, khi người mua đã sử dụng chương trình mua trước trả sau này thì sẽ không thể dùng các khuyến mãi khác, nên đây có thể

là nguyên do khiến tỷ lệ có sự chênh lệch

III.5.Biểu đồ tương quan giữa giá “price” và số lượng bán “quanity_sold”.

III.5.1 Tạo hàm biểu diễn biểu đồ tương quan giữa giá “price” và số lượng bán “quanity_sold”:

Hình 26: Code biểu đồ tương quan giữa "price" và "quanity_sold"

Trang 25

III.5.2 Kết quả:

Hình 27: Biểu đồ thể hiện tương quan giữa giá bán “price” và số lượng bán

“quanity_sold”

Nhận xét: Để thể hiện rõ sự tương quan giữa hai biến, nhóm đã dùng biểu đồ

Scatter Plot, với biến x là “price” và y là “quanity_sold” Sau đó tiến hành set các title

Ngày đăng: 20/06/2024, 16:46

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w