41 Hình 56: Kiểm định Shapiro-Wilk kiểm tra phân phối chuẩn của number_of_images...42 Hình 57: Kết quả sau khi thực hiện kiểm định Shapiro_Wilk...42 Hình 58: Tạo hàm thực hiện kiểm định
Trang 1ĐẠI HỌC UEH TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ
KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH
-🖎🕮✍
-BÁO CÁO NHÓM
ĐỀ TÀI: LẬP TRÌNH PHÂN TÍCH SỐ LƯỢNG HÀNG BÁN TRÊN SÀN ĐIỆN TỬ TIKI CỦA MẶT HÀNG THỜI TRANG
TP Hồ Chí Minh, Ngày 15 tháng 11 năm 2023
Trang 2MỤC LỤC
I TỔNG QUAN 7
1.1 Tổng quan đề tài: 7
1.1.1 Lý do chọn đề tài: 7
1.1.2 Các giả thuyết được đặt ra: 7
1.2 Tổng quan về bộ dữ liệu: 7
1.2.1 Nguồn gốc: 7
1.2.2 Định dạng lưu trữ: 8
1.2.3 Import dữ liệu: 9
II TIỀN XỬ LÝ DỮ LIỆU: 9
2.1 Kiểm tra kiểu dữ liệu của thuộc tính và dữ liệu bị thiếu (Missing value): 9
2.2 Kiểm tra dữ liệu ngoại lai (Outliers): 10
2.2.1 Hàm trực quan dữ liệu để tìm Outliers bằng biểu đồ Boxplot: 10
2.2.2 Hàm trực quan phân phối dữ liệu bằng biểu đồ Histogram: 12
2.3 Lập hàm xử lý dữ liệu: 17
III BIỂU ĐỒ TRỰC QUAN PHÂN TÍCH DỮ LIỆU: 19
3.1 Biểu đồ tương quan giữa số lượng reviews “review_counts” và điểm đánh giá trung bình “raitng_average”: 19
3.1.1 Tạo hàm biểu diễn biểu đồ tương quan: 19
3.1.2 Kết quả: 20
3.2 Biểu đồ tỷ lệ giữa nhóm có video quảng cáo và không có video quảng cáo “has_video”. 20 3.2.1 Tạo hàm biểu diễn biểu đồ tỷ lệ: 20
3.2.2 Kết quả: 21
3.3 Tỷ lệ sản phẩm được hoàn tiền: 22
3.3.1 Tạo hàm biểu diễn tỷ lệ sản phẩm được hoàn tiền: 22
3.3.2 Kết quả: 22
3.4 Tỷ lệ các sản phẩm được hỗ trợ chương trình mua ngay trả sau: 23
3.4.1 Tạo hàm biểu diễn tỷ lệ sản phẩm được hỗ trợ mua ngay trả sau 23
3.4.2 Kết quả: 23
3.5 Biểu đồ tương quan giữa giá “price” và số lượng bán “quanity_sold” 24
3.5.1 Tạo hàm biểu diễn biểu đồ tương quan giữa giá “price” và số lượng bán “quanity_sold”: 24
3.5.2 Kết quả: 25
3.6 Biểu đồ tương quan giữa điểm đánh giá trung bình “rating_average” và giá bán “price” 25
3.6.1 Tạo hàm biểu diễn biểu đồ tương quan giữa “rating_average” và “price”: 25
Trang 33.6.2 Kết quả: 25
3.7 Top 10 sản phẩm giày nam bán chạy nhất: 26
3.7.1 Tạo hàm biểu diễn biểu đồ top 10 giày nam: 26
3.7.2 Kết quả: 26
3.8 Phân phối giá bán của sản phẩm giày nam: 27
3.8.1 Tạo hàm biểu diễn phân phối giá bán của giày nam: 27
3.8.2 Kết quả: 27
3.9 Top 10 thương hiệu giày nam trên Tiki: 28
3.9.1 Tạo hàm biểu diễn top 10 thương hiệu giày nam: 28
3.9.2 Kết quả: 28
3.10 So sánh top 10 thương hiệu giày nam với top 10 thương hiệu giày nữ trên Tiki: 29
3.10.1 Tạo hàm biểu diễn biểu đồ: 29
3.10.2 Kết quả: 30
3.11 Điểm trung bình đánh giá của sản phẩm (rating_average) theo hình thức vận chuyển (fulfillment_type): 30
3.11.1 Code tạo biểu đồ bar cho điểm trung bình theo hình thức vận chuyển 30
3.11.2 Kết quả: 31
IV KIỂM ĐỊNH GIẢ THUYẾT: 31
4.1 Có sự khác nhau giữa trung bình của hai biến orginal_price và price: 31
4.1.1 Biểu đồ trực quan tần suất của hai biến: 31
4.1.2 Kiểm định với độ tin cậy 99%: 32
4.2 Lượng hàng bán được (quanity_sold) trung bình của giày nữ nhiều hơn giày nam: 33
4.2.1 Biểu đồ trực quan về phân phối của hai biến: 33
4.2.2 Kiểm định T-test phía phải với độ tin cậy 95%: 35
4.3 Có sự khác nhau về lượng hàng bán được (quanity_sold) trung bình giữa bốn mặt hàng giày nữ, giày nam, phụ kiện, backpack suitcase: 35
4.3.1 Biểu đồ QQ-plot kiểm tra phân phối: 35
4.3.2 Kiểm định phi tham số Kruskal_Wallis với độ tin cậy 95%: 37
4.3.3 Kiểm định Post-hoc với độ tin cậy 95%: 38
4.4 Có sự khác nhau giữa trung bình số lượng hình ảnh giữa bốn mặt hàng giày nam, giày nữ, phụ kiện và backpack suitcases 39
4.4.1 Biểu đồ QQ-plot kiểm tra phân phối chuẩn: 39
4.4.2 Kiểm định Shapiro-Wilk để kiểm tra phân phối chuẩn với độ tin cậy 95%: 41
Trang 44.5.1 Biểu đồ trực quan tần suất của hai biến: 44
4.5.2 Kiểm định T-test hai phía với độ tin cậy 95% 45
V KẾT LUẬN: 46
VI PHỤ LỤC: 47
VII PHÂN CÔNG: 47
Too long to read on your phone? Save
to read later on your computer
Save to a Studylist
Trang 5Mục lục hình ảnh
Hình 1: Đoạn code lập trình import dữ liệu vào Colab 9
Hình 2: Kiểm tra dữ liệu bị thiếu của bộ dữ liệu 10
Hình 3: Code tạo hàm trực quan dữ liệu tìm Outliers bằng biểu đồ Boxplot 11
Hình 4: Biểu đồ Box-plot của cột 'original_price' và 'price’ 11
Hình 5: Biểu đồ Box-plot của cột 'review_count', 'rating_average', 'number_of_images' và 'quanity_sold' 12
Hình 6:Code tạo hàm trực quan phân phối dữ liệu bằng biểu đồ Histogram 13
Hình 7: Code biểu diễn biểu đồ Histogram 13
Hình 8: Biểu đồ Histogram kiểm tra phân phối dữ liệu 14
Hình 9: Code tạo hàm tóm tắt tỷ lệ của Outliers 15
Hình 10: Tóm tắt tỷ lệ Outliers của các cột 'original_price', 'price' và 'review_count' 15
Hình 11: Tóm tắt tỷ lệ Outliers của các cột ' rating_average', 'number_of_images', 'quanity_sold' 16
Hình 12: Code tạo hàm tóm tắt Outliers có trong các cột 16
Hình 13: Kết quả tổng số Outliers trong mỗi cột 17
Hình 14: Tạo hàm xử lý Outliers theo quy tắt 3 sigma 17
Hình 15: Tạo hàm Pipelibe xử lý dữ liệu 18
Hình 16: Code hàm xử lý dữ liệu 18
Hình 17: So sánh phân phối trước và sau khi xử lý dữ liệu 19
Hình 18: Code tạo hàm biểu diên biểu đồ trực quan 20
Hình 19: Biểu đồ thể hiện mối tương quan giữa "reivew_count" và "rating_average" 20
Hình 20: Code tạo biểu đồ tròn biểu diễn tỷ lệ 21
Hình 21: Biểu đồ thể hiện tỷ lệ giữa sản phẩm có video quảng cáo và không có video quảng cáo 21
Hình 22: Code tạo biểu diễn biểu đồ tỷ lệ các sản phẩm được hoàn tiền 22
Hình 23: Biểu đồ thể hiện tỷ lệ sản phẩm được hoàn tiền 22
Hình 24: Code tạo biểu đồ biểu diễn tỷ lệ sản phẩm được hỗ trợ "mua ngay trả sau" 23
Hình 25: Biểu đồ biểu diễn tỷ lệ sản phẩm được hỗ trợ chương trình "mua ngay trả sau" 24
Hình 26: Code biểu đồ tương quan giữa "price" và "quanity_sold" 24
Hình 27: Biểu đồ thể hiện tương quan giữa giá bán “price” và số lượng bán “quanity_sold” 25
Hình 28: Code biểu diễn biểu đồ tương quang giữa "rating_average" và "price" 25
Hình 29: Biểu đồ tương quan giữa "rating_average" và "price", 26
Hình 30: Code tạo hàm biẻu diễn biểu đồ top 10 sản phẩm bán chạy 26
Hình 31: Biểu đồ thể hiện top 10 sản phẩm giáy nam bán chạy nhất 27
Hình 32: Code biểu diễn biểu đồ phân phối giá bán 27
Hình 33: Biểu đồ thê hiện phân phối giá bán của giày nam 28
Hình 34: Code biểu diễn biểu đồ top 10 thương hiệu giày nam 28
Hình 35: Biểu đồ thể hiện top 10 thương hiệu giày nam trên Tiki 29
Hình 36:Code tạo biểu đồ biểu diễn top 10 thương hiệu của giày nam và giày nữ 30
Hình 37: So sánh giữa top 10 thương hiệu giày nam và top 10 thương hiệu giày nữ trên Tiki 30
Hình 38: Code tạo biểu đồ cho điểm đánh giá trung bình theo hình thức vận chuyển 31
Hình 39: Biểu đồ thể hiện giữa rating_average và fulfillment_type 31
Hình 40: Code tạo biểu đồ trực quan tần suất 32
Trang 6Hình 45: Biểu đồ kiểm tra phân phối của biến “quanity_sold” của giày nữ và giày nam 34
Hình 46: Code tạo hàm kiểm định T-test cho biến "quanity_sold" 35
Hình 47: Kết quả kiểm định T-test của giả thuyết có sự khác biệt trung bình lượng bán “quanity_sold”của giày nữ và nam 35
Hình 48: Code tạo biểu đồ QQ-plot để kiểm tra phân phối chuẩn 36
Hình 49: Biểu đồ kiểm tra phân phối của lượng hàng bán trung bình của bốn mặt hàng giày nam, giày nữ, phụ kiện, backpack suitcase 37
Hình 50: Code tạo hàm kiểm định phi tham số Kruskal_Wallis 38
Hình 51: Kết quả kiểm định có sự khác biệt của quanity_sold trong các nhóm mặt hàng 38
Hình 52: Sử dụng kiểm định Dunn’s Test kiểm tra có sự khác biệt của quanity_sold giữa vác mặt hàng 39
Hình 53: Kết quả kiểm định 39
Hình 54: Code vẽ biểu đồ QQ-plot kiểm tra phân phối chuẩn 40
Hình 55: Biểu đồ kiểm tra phân phối của số lượng hình ảnh “number_of_images” giữa bốn mặt hàng 41
Hình 56: Kiểm định Shapiro-Wilk kiểm tra phân phối chuẩn của number_of_images 42
Hình 57: Kết quả sau khi thực hiện kiểm định Shapiro_Wilk 42
Hình 58: Tạo hàm thực hiện kiểm định Kruskal-Wallis 43
Hình 59: Kết quả thực hiện kiểm định Kruskal-Wallis về giả thuyết các mặt hàng đều giốgng nhau về só lượng hình ảnh 43
Hình 60: Sử dụng kiểm định Dunn’s Test kiểm tra có sự khác biệt của “number_of_images” giữa các mặt hàng 44
Hình 61: Kết quả sau khi thực hiện kiểm định 44
Hình 62: Code tạo biểu đồ kiểm tra phân phối của 'review_count' của mặt hành phụ kiện và giày nữ 45
Hình 63: Kết quả biểu đồ kiểm tra phân phối cho giả thuyết có sự khác biệt của 'review_count' ở giày nữ và phụ kiện 45
Trang 7Tại Việt Nam, các sàn thương mại điện tử đang phát triển rất mạnh nhằm đáp ứng nhu cầu của người tiêu dùng khi họ đang bắt đầu chuyển sang hình thức mua hàng online thay vì đến trực tiếp các cửa hàng Bên cạnh các sàn thương mại đang có trụ sở chính ở nước ngoài ví dụ như: Shopee, Lazada, Amazon, thì ở nước ta Tiki-một trong những sàn thương mại điện tử lớn của Việt Nam cũng được người tiêu dùng tin tưởng.
Bên cạnh những sản phẩm gia dụng, điện tử, sách, ta thường thấy đượcbày bán trên Tiki thì mặt hàng thời trang cũng có được mối quan tâm rất lớn từ phía người tiêu dùng Do đó, nhóm quyết định chọn đề tài: “Lập trình phân tích số lượng hàng bán trên sàn thương mại điện tử Tiki của mặt hàng thời trang” để có thể tìm hiểu kĩ hơn về giá bán, lượng bán trung bình, mức độ hài lòng của khách hàng thông qua môn Biểu diễn trựcquan dữ liệu Qua đó, nhóm có thể đưa ra được một số kết luận và đề xuất
để người mua hàng có trải nghiệm tốt hơn khi mua hàng trên Tiki nói chung và mặt hàng thời trang của Tiki nói riêng
I.1.2 Các giả thuyết được đặt ra:
- Có sự khác nhau giữa “original_price” và “price”
- Lượng hàng bán được “quanity_sold” trung bình của giày nữ nhiều hơngiày nam
- Có sự khác nhau về lượng hàng bán được “quanity_sold” trung bình giữa bốn mặt hàng giày nữ, giày nam, phụ kiện, backpack suitcase
- Có sự khác nhau giữa số lượng hình ảnh “number_of_images” giữa bốn mặt hàng giày nam, giày nữ, phụ kiện và backpack suitcases
- Có sự khác nhau giữa trung bình số lượng reviews “review_count” của mặt hàng phụ kiện và mặt hàng giày nữ
I.2 Tổng quan về bộ dữ liệu:
I.2.1 Nguồn gốc:
- Dữ liệu được crawl từ sàn thương mại điện tử Tiki, một trong những
Trang 8- Vì số lượng mặt hàng thời trang trên sàn thương mại điện tử Tiki rất khổng lồ, nên bộ dữ liệu chỉ thu thập những mặt hàng thời trang phổ biến nhất.
- Ngôn ngữ chính là tiếng Việt UTF-8
- Tiền tệ được sử dụng là Vietnam Dong (vnd)
I.2.2 Định dạng lưu trữ:
- Dataset lưu trữ các tập tin CSV, mỗi tập tin đại diện cho một nhóm (category)
- Các tập tin có cùng format, cùng số lượng feature cũng như header
- Giải thích thuộc tính dữ liệu
Tên biến Loại dữ liệu Ý nghĩa
original_price Định lượng chưa áp dụng giảm giáGiá của sản phẩm khi
price Định lượng Giá hiện tại (Có thể hoặckhông áp dụng giảm giá)
OEM hoặc registeredbrand (OEM nghĩa làoriginal equipmentmanufacturer hoặc hiểuđơn giản là 'no brand')
favorite_count Định lượng Số người thêm sản phẩmnày vào mục yêu thích
Trang 9current_seller Định danh Tên của người bán
number_of_images Định lượng Số lượng hình ảnh của sảnphẩm được đăng lên
vnd_cashback Định lượng Số tiền hoàn lại (đơn vị:VND)
has_video Định tính True nếu có video clip,False nếu không có
B'ng 1: Gi'i thích các thuộc tính có trong data
I.2.3 Import dữ liệu:
Hình 1: Đoạn code lập trình import dữ liệu vào Colab
II TIỀN XỬ LÝ DỮ LIỆU:
II.1 Kiểm tra kiểu dữ liệu của thuộc tính và dữ liệu bị thiếu (Missing value):
Trang 10Hình 2: Kiểm tra dữ liệu bị thiếu của bộ dữ liệu.
Nhận xét: Kiểu dữ liệu đã chính xác Không cần chỉnh sửa kiểu dữ liệu của các
thuộc tính Có một số dữ liệu bị thiếu ở cột “brand”, “fulfillment_type”
II.2 Kiểm tra dữ liệu ngoại lai (Outliers):
II.2.1 Hàm trực quan dữ liệu để tìm Outliers bằng biểu đồ Boxplot:
Trang 11Hình 3: Code tạo hàm trực quan dữ liệu tìm Outliers bằng biểu đồ Boxplot.
Kết quả trực quan:
Trang 12Hình 5: Biểu đồ Box-plot của cột 'review_count', 'rating_average',
'number_of_images' và 'quanity_sold'
Nhận xét:Ta quan sát được phần lớn dữ liệu trong các cột đều có Outliers.II.2.2 Hàm trực quan phân phối dữ liệu bằng biểu đồ Histogram:
Trang 13Hình 6:Code tạo hàm trực quan phân phối dữ liệu bằng biểu đồ Histogram.
Kết quả trực quan:
Hình 7: Code biểu diễn biểu đồ Histogram
Trang 14Hình 8: Biểu đồ Histogram kiểm tra phân phối dữ liệu.
Nhận xét: Ta khó nhìn ra được phân phối của dữ liệu vì dữ liệu bị ảnh hưởng
nặng nề bởi các Outliers
II.2.3 Hàm tóm tắt Outliers:
Hàm tóm tắt tỷ lệ của Outliers trên tổng giá trị thuộc tính:
Trang 15Hình 9: Code tạo hàm tóm tắt tỷ lệ của Outliers.
- Kết quả:
Hình 10: Tóm tắt tỷ lệ Outliers của các cột 'original_price', 'price' và 'review_count'
Trang 16Hình 11: Tóm tắt tỷ lệ Outliers của các cột ' rating_average', 'number_of_images',
'quanity_sold'
Nhận xét: Ta quan sát được dữ liệu bị ảnh hưởng nặng bởi Outliers ở các cột
‘original price’, ‘price’, ‘review count’, nhất là ở cột ‘quantity sold’ Vì thế, nhóm sẽ tiến hành tóm tắt số Ouliers có trong các cột và xử lý Outliers theo quy tắc 3 sigma
Tạo hàm tóm tắt số Ouliers có trong các cột:
Hình 12: Code tạo hàm tóm tắt Outliers có trong các cột
Trang 17- Kết quả sau khi tạo hàm:
Hình 13: Kết qu' tổng số Outliers trong mỗi cột
II.3 Lập hàm xử lý dữ liệu:
Nhóm tiến hành xử lý dữ liệu qua các bước:
- Xóa dữ liệu trùng lặp (Duplicate Data)
- Loại bỏ dòng trắng (Blank rows)
- Loại bỏ dữ liệu bị thiếu (Missing Data)
- Loại bỏ Outliers theo quy tắt 3 sigma
II.3.1 Tạo hàm xử lý Outliers theo quy tắt 3 sigma:
Hình 14: Tạo hàm xử lý Outliers theo quy tắt 3 sigma
II.3.2 Tạo Pipelibe xử lý dữ liệu:
Trang 18Hình 15: Tạo hàm Pipelibe xử lý dữ liệu.
II.4 Dữ liệu trước và sau khi xử lý:
Xử lý dữ liệu:
Hình 16: Code hàm xử lý dữ liệu
So sánh phân phối dữ liệu trước và sau khi xử lý:
Trang 19Hình 17: So sánh phân phối trước và sau khi xử lý dữ liệu.
III BIỂU ĐỒ TRỰC QUAN PHÂN TÍCH DỮ LIỆU:
III.1.Biểu đồ tương quan giữa số lượng reviews “review_counts” và điểm đánh giá trung bình “raitng_average”:
III.1.1 Tạo hàm biểu diễn biểu đồ tương quan:
Trang 20Hình 18: Code tạo hàm biểu diên biểu đồ trực quan.
III.1.2 Kết quả:
Hình 19: Biểu đồ thể hiện mối tương quan giữa "reivew_count" và "rating_average"
Nhận xét: Để thể hiện mối tương quan giữa hai biến “review_count” và
“rating_average”, đầu tiên nhóm đã sử dụng thư viện ploty.express và tiến hành xác định cột chứa dữ liệu của hai biến trên, tạo figure và vẽ biểu đồ Scatter plot để biểu diễn tương quan rõ nhất
Có thể thấy số lượng các sản phẩm được đánh giá khá ít Phần lớn những sản phẩm được đánh giá đều ở mức từ 4 đến 5 điểm Điều này cho thấy, có thể người tiêu dùng đều hài lòng khi sử dụng các sản phẩm được mua trên Tiki
III.2.Biểu đồ tỷ lệ giữa nhóm có video quảng cáo và không có video quảng cáo “has_video”.
III.2.1.Tạo hàm biểu diễn biểu đồ tỷ lệ:
Trang 21Hình 20: Code tạo biểu đồ tròn biểu diễn tỷ lệ.
Trang 22Tỷ lệ sản phẩm có quảng cáo bằng khoảng 1/10 tỷ lệ không quảng cáo cho thấyhiện nay các nhãn hàng vẫn chưa chú trọng vào các video quảng cáo trên các nền tảng thương mại điện tử Các nhãn hàng cần thêm video quảng cáo để khách hàng có thể tiếp cận được nhiều thông tin về sản phẩm hơn.
III.3.Tỷ lệ sản phẩm được hoàn tiền:
III.3.1 Tạo hàm biểu diễn tỷ lệ sản phẩm được hoàn tiền:
Hình 22: Code tạo biểu diễn biểu đồ tỷ lệ các s'n phẩm được hoàn tiền
III.3.2 Kết quả:
Hình 23: Biểu đồ thể hiện tỷ lệ s'n phẩm được hoàn tiền
Trang 23Nhận xét: Nhóm đã lọc và tạo hai nhóm sản phẩm được hoàn tiền và không
được hoàn tiền dựa trên dữ liệu của cột “vnd_cashback”, sau đó tính toán số lượng mẫu trong từng nhóm Vì đây là biểu đồ thể hiện tỷ lệ giữa 2 nhóm, nên ta sẽ dùng biểu đồ tròn sau đó tiến hành set cấu hình và hiển thị biểu đồ
Có thể nhận thấy xu hướng các sản phẩm có hoàn tiền chỉ chiếm khoảng 20%
so với tổng số sản phẩm được bán trên hệ thống Tiki Điều này cho thấy các nhãn hàng cũng như sàn thương mại điện tử chưa có những ưu đãi hoàn tiền cho người tiêu dùng Tiki cần có nhiều ưu đãi để giữ chân người tiêu dùng với sự cạnh tranh từ các đối thủ
III.4.Tỷ lệ các sản phẩm được hỗ trợ chương trình mua ngay trả sau:
III.4.1 Tạo hàm biểu diễn tỷ lệ sản phẩm được hỗ trợ mua ngay trả sau
Hình 24: Code tạo biểu đồ biểu diễn tỷ lệ s'n phẩm được hỗ trợ "mua ngay tr' sau"
III.4.2 Kết quả:
Trang 24Hình 25: Biểu đồ biểu diễn tỷ lệ s'n phẩm được hỗ trợ chương trình "mua ngay tr'
sau"
Nhận xét: Nhóm đã lọc và tạo hai nhóm sản phẩm được hỗ trợ chương trình và
không được hỗ trợ dựa trên dữ liệu của cột “pay_latter”, sau đó tính toán số lượng mẫu trong từng nhóm Vì đây là biểu đồ thể hiện tỷ lệ giữa 2 nhóm, nên ta sẽ dùng biểu đồ tròn sau đó tiến hành set cấu hình và hiển thị biểu đồ
Trong tổng số hơn 33044 nghìn mẫu được thu thập thì có thể thấy tỷ lệ số lượng các sản phẩm không hỗ trợ không có chênh lệch quá nhiều với số lượng sản phẩm có hỗ trợ Qua đó, ta có thể thấy Tiki đã và đang chú trọng tới việc kích cầu người tiêu dùng bằng hình thức trên Tuy nhiên, khi người mua đã sử dụng chương trình mua trước trả sau này thì sẽ không thể dùng các khuyến mãi khác, nên đây có thể
là nguyên do khiến tỷ lệ có sự chênh lệch
III.5.Biểu đồ tương quan giữa giá “price” và số lượng bán “quanity_sold”.
III.5.1 Tạo hàm biểu diễn biểu đồ tương quan giữa giá “price” và số lượng bán “quanity_sold”:
Hình 26: Code biểu đồ tương quan giữa "price" và "quanity_sold"
Trang 25III.5.2 Kết quả:
Hình 27: Biểu đồ thể hiện tương quan giữa giá bán “price” và số lượng bán
“quanity_sold”
Nhận xét: Để thể hiện rõ sự tương quan giữa hai biến, nhóm đã dùng biểu đồ
Scatter Plot, với biến x là “price” và y là “quanity_sold” Sau đó tiến hành set các title