Internet không chỉ góp phần thay đổi một số cách thức sinh hoạt và làm việc hàng ngày của con người mà còn kéo theo sự phát triển nhanh chóng của một trong những thị trường đang rất được
Trang 1KHOA TOÁN KINH TẾ
CHUYEN DE TỐT NGHIỆP - TOÁN KINH TE
`ˆ^ `
DE TAI; áp DỤNG MÔ HÌNH HOI QUY LOGISTICS VÀ THUẬT TOÁN
RANDOM FOREST ĐỂ ĐÁNH GIÁ KHẢ NĂNG RỜI BỎ DỊCH VỤ THƯƠNG MẠI
Trang 2HÀ NỘI - 2022
MỤC LỤC DANH MỤC HINH ANH vessssssessssssessesssssvessssssessesssessesssessessesssssscesssssesuesanesscsasesseeneessseseenees 2 DANH MỤC BANG BIEU -o e<©ce©cs£EeeExeEEsEEteEEEEseEteErserketterserkerrsrrkerreerserssre 2
820090585 3
MO DAU vesssssssssssssssssssssssssssssssssssssssssssscssssssssecssssssssssssssssssesssssssssesssssssssesssssssssesssssssnsesesssesnee 4
Ly do CNON 1/1 0N 0A aAaaaẢ ÔÔ 4
MUC ti€U NQNIEN CUU 00088 - 5
Đối tượng HghÏÊH CÚP eresereccrescseserecssesssesssecssecssscssesssesessssnssssssssessasesssssasssasesuscsssssasssasesseessees 5
CGU hỏi NGHIEN CÍPH So <5 < Họ TH HH II 0000 000000100 0 5 Phương pháp NGNIEN CWUU co- << 5 < TH cọ 00 000 06096 6
Kết cấu CHUYEN Ae ecsecsesssecsesssesvesrsessessesrsssvessesssessesssessesssessesnessscssesnssssesaesasesscsasessceneensseseenees 6 Chương 1: — Cơ sở lý thuyết và tổng quan Nghién CỨU -° se se scsese 7
1.1 _ Cơ sở lý thuyết về kha năng rời bó của khách hàng -e-s°-s°ssesssess=s 7
1.2, Phương pháp nghiên cứu sss5s<css=ssetsesEserenssssessse
1.2.1 Mô hình hoi quy LogIstics se.
1.2.2 Thuat todn Random Forest 0177 4
1.3 Tống quan nghiên CWU csssesssessssscesssesssesssssesssecsssssesssecasscsssssesesscsssssesssecssessessseensees 16
Chương 2: Thực trạng ngành Thương mại Điện tử trên Thế giới và Việt Nam T8
2.1 Cade đặc điểm của thương mại điện tứ 2< se setxsetssezsserserssee 18
2.2 Thực trạng và xu hướng phát triển của của thương mại điện tử
2.2.1 Thực trang chung trên toàn thê giới -c ccccrreerrierriee "
2.2.2 Thực trạng phát triên ngành Thương mại Điện tử tại Việt NÑam 55-555 <5<<++
Chương 3: Két quả nghiên cứu và kẾt luẬn -e cecceecceecesereeeceeee 26
3.1 Dữliệu 26
3.1.1 Nguôn dữ liệu 26 3.1.2 Thông tin chi tiết vê bộ dữ LU - E112 11111211 19111111111 11111 HH ng re 26
3.2 Xử lý dữ liệu - e5 Ăn HH HH HH TH ng 0001 030000384000040003040100500000056 28
3.3 Dự báo kha năng rời bỏ của khách hàng bằng mô hình hồi quy Logistics
3.4 Dự báo khả năng rời bỏ của khách hang bằng thuật toán Random Forest
3.5 Khuyến nghị và giải pháp s ssc-sccssecsse Error! Bookmark not defined.
KEt UG NNannaanneeeeeee - 38 TAI LIEU THAM KHAO.sesssssssssssssssssssssssssssssssssssssssssssssssnsssnsssssssnsssasssasssasssasesssesasesaeesss 40
Trang 3CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
DANH MỤC HÌNH ẢNH
HÌNH 2 - MÔ TẢ CÁC BƯỚC HOẠT ĐỘNG CUA THUẬT TOÁN RANDOM FOREST ¿+ 25+ *+*+t£++t£eEetstxexetrerske 13 HÌNH 3 - TONG QUAN NGANH THƯƠNG MẠI ĐIỆN TỬ NĂM 2021 (NGUON: REPUTA) - 5222252 +e£+x+esersrresrs 22 HÌNH 4 - PAIR PLOT DOI VỚI CÁC BIEN ĐỊNH LƯỢNG S2 221115111 151511121151 111111111111 11111 111 0 1111 111111 1111 30
HÌNH 5 - KET QUA MÔ HÌNH HOI QUY OGISTICS, - t1 9% 135191 9191 E911 11 1 1 11T TT Tàn Hàng 31
HÌNH 6 - KET QUA MÔ HÌNH RANDOM FOREST - G c 1 2112112211211 911211 0112 11011 g1 01H g1 TH TH TH hờn 34
HÌNH 7 - MA TRAN NHAM LAN CUA MÔ HÌNH RANDOM FOREST
HÌNH 8 - DO THỊ MÔ TẢ GINI CUA MÔ HÌNH KHI BO ĐI MỘT BIEN SO 5c 2c 223221231511 1E 1211211818111 11 1111 x2 36
DANH MỤC BANG BIEU
BANG | - CÁC ĐẶC DIEM CUA MÔ HÌNH RANDOM FOREST 14
BANG 2 - /(0áv.Ve.\e:)))00:19)1e8:v0900)2000000n88 27 BANG 3 - THONG KE MÔ TẢ CÁC BIEN ĐỊNH TINH cccscecesesseseseseeseseseesescecesesceceseeeesesescesesecsesesseseseeseseeeeseeeseaeeeeseaees 28 BANG 4 - THONG KE MÔ TẢ CÁC BIEN ĐỊNH LUONG seecescssesescseeseseeeseseeceseecceseeceseseeceaeeecsesecseseeeeseseeeeseeeeeeaeeeeaeiees 30
BANG 5 - MA TRAN NHAM LAN DOI VỚI MÔ HÌNH HOI QUY LOGISTICS :.ccscessesscesscesceseceseesecesecseeessessceseenseeseesseens 32
Trang 4CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
LỜI CẢM ƠN
Để hoàn thành khóa luận này, em xin tỏ lòng biết ơn sâu sắc đến Ths Nguyễn Thị Liên
đã tận tình hướng dẫn trong suốt quá trình viết Chuyên đ ềtốt nghiệp.
Em chân thành cảm ơn quý thẦy, cô trong khoa Toán Kinh tế, Trường Đại Học Kinh tếQuốc dân đã tận tình truy ‘fn đạt kiến thức trong những năm em học tập Với vốn kiến thứcđược tiếp thu trong quá trình học không chi là nề tảng cho quá trình nghiên cứu khóa luận
mà còn là hành trang quý để báu để em bước vào đời một cách vững chắc và tự tin.
Cuối cùng em kính chúc cô d` dào sức khỏe và thành công trong sự nghiệp tr ng người
cao quý.
Em xin chân thành cảm ơn cô!
Trang 5CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
2 A
MO DAU
Ly do chọn đ étai
Trong những năm g%n đây, thế giới đã chứng kiến sự phát triển bùng nổ cả v échat lượng
và số lượng người sử dụng mạng Internet Tính đến tháng 1/2021, trên thế giới có tới 4.66 tỷngười dùng, tương đương với tỷ lệ thâm nhập Internet trên toàn cu ở mức 59.5% Riêng tạiViệt Nam, số người sử dụng Internet là khoảng 68.72 triệu người, chiếm 70.3% dân số
Internet không chỉ góp phần thay đổi một số cách thức sinh hoạt và làm việc hàng ngày của
con người mà còn kéo theo sự phát triển nhanh chóng của một trong những thị trường đang
rất được các nhà du tư, doanh nghiệp cũng như người tiêu dùng quan tâm — Thương mại
điện tử Báo cáo Chỉ số thương mại điện tử Việt Nam 2021 của Hiệp hội Thương mại điện tử
Việt Nam chỉ ra rằng nước ta có nhi`âi tiên năng v`ềphát triển thương mại điện tử Theo đó,
thương điện tử Việt Nam năm 2020 tăng 16% và đạt quy mô trên 14 tỷ USD, đáng chú ý nhất
là lĩnh vực bán lẻ hàng hoá trực tuyến (tăng 46%) Báo cáo này cũng dự đoán tốc độ tăng
trưởng trung bình giai đoạn 2020 — 2025 là 29% và tới năm 2025 quy mô thương mại điện tửnước ta đạt 52 tỷ USD
Với tốc độ phát triển nhanh như vậy đòi hỏi các công ty phải biết đổi mới và nâng cao
chất lượng dịch vụ chăm sóc khách hàng Vấn đ ềnắm bắt thị hiếu, sở thích của người tiêu
dùng khi đó trở thành một vấn đ`ềcó tính nền tảng, sống còn của ngành mà bất kì người bánnào nếu muốn tân tại trên thị trường di cn phải giải quyết thật tốt Trước kia, những
người bán lẻ đã thực hiện nhi`âi biện pháp để ghi nhận thói quen của người tiêu dùng như sử
dụng các hóa đơn bán hàng để xem xét các mặt hàng thường được mua sắm cùng nhau,
phỏng vấn người mua v`ềsở thích mua sắm của họ để từ đó đưa ra những biện pháp giúp tối
đa hóa doanh thu, tối ưu hóa chi phí của doanh nghiệp Ví dụ, khi đi vào một cửa hàng sách
quen thuộc, chủ cửa hàng sẽ giới thiệu cho người khách một vài quyển sách hoặc tờ báo màngười khách đó có thể quan tâm dựa trên sở thích hoặc thói quen của khách hàng Nhưng
với thương mại điện tử, hình thức mà người mua và người bán không cH gặp gỡ trực tiếp
và họ giao dịch với nhau trên các trang web, việc xây dựng một trợ lý bán hàng tự động là vôcùng quan trọng và cũng chính là một thách thức lớn Vấn đ`ềnày có thể được giải quyết
bằng việc tích hợp các Hệ thông gợi ý (Recommender Systems) trong các website bán hàng.
Với lượng thông tin đ`ồsộ xuất hiện tran lan trên các website, người tiêu dùng không thể có
đủ thời gian để xem xét tất cả các sản phẩm, dịch vụ Khi đó, hệ thống gợi ý như một chuyên
Trang 6CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
gia tư vấn, dự đoán thông minh sở thích của khách hàng và cung cấp những thông tin mà họ
thực sự quan tâm.
Các kỹ thuật hệ gợi ý đã và đang được nghiên cứu, ứng dụng một cách mạnh mẽ và manglại lợi ích cho cả người cung cấp dịch vụ và người sử dụng dịch vụ “Trong lĩnh vực xây
dựng hệ gợi ý có hai nhiệm vụ cơ bản ch được giải quyết là dự đoán xếp hạng cho từng mặt
hàng và gợi ý danh sách mặt hàng Nhiệm vụ dự đoán xếp hạng (rating prediction) nhằm mục
tiêu tối ưu hóa dự đoán mức độ ưa thích của người dùng đối với từng mặt hàng cụ thể, trong
khi đó nhiệm vụ gợi ý danh sách mặt hàng (ranking) nhằm giải quyết vấn đ gợi ý cho người
dùng danh sách mặt hàng mà họ nhi&u khả nang có tương tác nhất Trong hai nhiệm vụ nói
trên, nhiệm vụ dự đoán xếp hạng của người dùng cho sản phẩm đóng vai trò quan trọng vì
điểm xếp hạng của người dùng phản ánh mức độ hài lòng của người dùng đối với sản
phẩm/dịch vụ” Hi hết các trang thương mại lớn trên thế giới, như: Amazon.com,
Alibaba.com, ebay.com đ`âi sử dụng các kỹ thuật gợi ý trong website của mình để nâng cao
trải nghiệm cho khách hàng, nâng cao chất lượng dịch vụ và thu lại lợi nhuận tốt hơn
G3 đây, nhờ có các công cụ mới phát triển dựa trên Machine Learning, như kỹ thuật gợi
ý dựa trên nội dung hay lọc cộng tác đã giúp xây dựng các hệ gợi ý cá nhân hóa, nâng cao trải
nghiệm khách hàng Vậy nên, chuyên đ`ềsẽ tập trung tìm hiểu và Ứng dụng một số thuật
toán Machine Learning trong việc dự báo khả năng rời bỏ của khách hàng sử dụng dịch
vụ thương mại điện tử.
Mục tiêu nghiên cưu
Tìm ra được các nhân tố ảnh hưởng mạnh đến khả năng rời bỏ của khách hàng sử dụng
dịch vụ thương mại điện tử Từ đó, tiến hành xác định xác suất khách hàng rời bỏ sản phẩm.Đồng thời, phân nhóm hoặc xếp hạng các khách hàng rời bỏ sản phẩm để tìm ra chính sách
phù hợp giữ chân khách hàng tiếp tục sử dụng sản phẩm
Đối tượng nghiên cứu
Đối tượng nghiên cứu của chuyên đ`ềlà các khách hàng sử dung dịch vụ thương mại điện
tử của công ty Target Corporation trong năm 2019
^ 2e oA ⁄
Cau hỏi nghiên cưu
— Sự roi bỏ của khách hàng là gì? Vì sao họ roi bỏ
— Các nhân tố ảnh hưởng đến khả năng rời bỏ là những nhân tố nào? Nhân tố nào tác động
Nguyễn Thuy Dương — MSV: 11191283 — Toán Kinh tế
Trang 7CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
— Mô hình Machine Learning có khả năng dự báo khả năng rời bỏ tốt không?
Phương pháp nghiên cứu
Chuyên đ`ềphân tích định tính, phân tích các thống kê mô tả kết quả các khách hàng sửdụng dịch vụ Từ đó đánh giá, phân loại khách hàng, sau đó áp dụng thuật toán học máy
Random Forest để dự báo việc khách hàng có rời bỏ dịch vụ hay không nhằm đi ân chỉnh kế
hoạch Marketing, quảng cáo sản phẩm
Kết cau chuyên đ ê
Chuyên đ tốt nghiệp có kết cấu 04 chương như sau:
— Chương 1: Cơ sở lý thuyết và tổng quan nghiên cứu
— Chương 2: Thực trạng ngành Thương mại Điện tử trên Thế giới và Việt Nam
— Chương 3: Kết quả nghiên cứu
— Chương 4: Kết luận và khuyến nghị
Trang 8CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
Chương 1: Cơ sở lý thuyết và tổng quan nghiên cứu
1.1 Cơ sở lý thuyết v €kha năng rời bỏ của khách hang
Phân tích sự roi bỏ của khách hàng có thể được định nghĩa là công việc phân tích, thực
hiện v €kha năng khách hang rời khỏi một sản phẩm hoặc dich vụ Theo định nghĩa đơn giản
nhất, đi`âi đó có nghĩa là khách hang từ bỏ khi lựa chọn công ty vì sự cạnh tranh
(Ñettleton.D, 2014) Mục đích là để xác định tình huống này trước khi khách hàng rời bỏ sảnphẩm hoặc dịch vụ và sau đó thực hiện một số hành động phòng ngừa vấn đ`ềnày
Theo Jill Avery, tỷ lệ khách hàng rời bỏ (customer churn rate) là một chỉ số đo lường tỷ
lệ phần trăm số người chấm dứt quan hệ khách hàng với một doanh nghiệp trong một giai
đoạn cụ thể Thông thường, tỷ lệ rời bỏ được tính theo tháng, quý hoặc năm, tùy thuộc vào
ngành hang và sản phẩm của doanh nghiệp Tỷ lệ hang năm là đơn vị mặc định cho hu hết
các công ty, tuy nhiên có nhi`âi công ty như nhà cung cấp dịch vụ điện thoại di động, phòng
tập gyms, hay công ty ph m`ồn, sé theo dõi tỷ lệ nay theo tháng Một số công ty có tỷ lệ
khách hàng rời bỏ dịch vụ rất lớn, kéo theo việc để mất khách hàng sẽ ảnh hưởng rất lớn
đến việc đánh giá tỷ lệ này hàng tháng”.
Tuy nhiên, không chỉ có những người làm marketing mới xem xét tỷ lệ này, rất nhi`â! nha
di tư cũng sử dụng chi số này để đánh giá những tin năng thực sự của một công ty nào đó
Tỷ lệ rời bỏ khách hàng của công ty càng cao sẽ kéo theo nghi vấn v €kha năng duy trì vat‘tại của công ty đó càng lớn
Theo Frederick Reichained (2006), người phát minh ra chỉ số đo lường sự hài lòng, khi tỷ
lệ giữ chân khách hang tăng 5%, lợi nhuận của công ty sẽ tăng từ 25% đến 95% Và chi phí
để có một khách hàng mới thường cao thường vượt xa so với việc duy trì một khách hàng
hiện có Thông thường, các công ty chi nhi hơn 7 Lần cho việc có được khách hàng mới sovới việc giữ chân khách hang và giá trị trung bình toàn cầi của một khách hàng bị mất là 243
đô la Rõ ràng, sự roi bỏ của khách hàng gây tốn kém rất lớn cho các doanh nghiệp
Vi tỷ lệ khách hàng rời bỏ chi đơn giản là tỷ lệ phần trăm khách hang chấm dứt quan hệ
mua hàng với công ty trong một khoảng thời gian nhất định, nên việc tính toán nó khá đơn
giản Ta có thể lấy tổng số khách hàng rời bỏ doanh nghiệp trong một khoảng thoi gian chia
cho tổng số khách hàng ở đ`ầi kỳ Có thể thấy, đây là một chi báo chậm (lagging indicator),
Trang 9CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
nghĩa là doanh nghiệp chỉ có thể xem lại những xu hướng đã diễn ra, cũng là một trong những
nhược điểm của nó
— Vai trò của việc phân tích sự roi bỏ của khách hàng
Phân tích sự rời bỏ của khách hàng đặc biệt quan trọng trong việc tính toán của doanh
nghiệp trong các lĩnh vực như bảo hiểm, viễn thông hoặc ngân hàng Theo Kotler, P., &
Keller, K L (2009), việc giành được khách hàng mới trong đi`êi kiện cạnh tranh ngày nay
tốn kém hơn tới 10 In so với việc giữ chân khách hàng hiện tại Đây là một phương pháp
phân tích được sử dụng trong các vấn đ`ềnhư xác định h`ồsơ của khách hàng hiện tại, phân
tích các khách hang rời bỏ và ước tính sự roi bỏ của khách hàng
Hơn nữa, theo Poel, V D., Lariviére (2004), giá trị của các doanh nghiệp này tỷ lệ thuận
với số lượng khách hang còn hoạt động Do đó, nhi`âi chỉ số như chi phí, lợi nhuận, quy mô,
năng lực đi tư, dòng tin của doanh nghiệp phụ thuộc vào số lượng khách hang va do đó
phụ thuộc vào sự trung thành của khách hàng Ngoài ra, nghiên cứu đã chỉ ra rằng lợi nhuận
của khách hàng các dài hạn cao hơn so với khách hàng vãng lai
— Một số sai lần khi phân tích v`ềkhách hang rời bỏ
Avery trong bài viết “The Value of Keeping the Right Customers” đã chỉ ra 4 sai lần mà
nhà quản lý của các công ty thường mắc phải khi xem xét tỷ lệ rời bỏ của khách hàng.
Thứ nhất là việc sử dụng tỷ lệ rời bỏ như một chỉ số bị động chứ không phải là một cơ
hội trong thực tế Khi bạn nhận ra tỷ lệ khách hang rởi bỏ mình tăng lên, đó đã là 6-8 tháng
sau thời điểm bạn thực sự đánh mất khách hàng của mình Nếu chỉ số khách hàng rời bỏ dịch
vụ là thước đo duy nhất bạn sử dụng để đánh giá mức độ hài lòng của khách hàng, thì bạn
luôn luôn đi sau thời thế những 6 tháng và vô phương tác động đến tương lai
Thứ hai là xem tỷ lệ này đơn giản là một con số hoặc dữ liệu chứ không phải là một chỉ
số v €hanh vi của khách hàng Các công ty nên tự đặt ra câu hỏi: Công ty chúng ta dang làm
gì để tạo ra doanh thu từ khách hàng? Những khách hàng của chúng ta vì sao lại quyết định
rời đi? Lam thế nào để có thể quản ly quan hệ khách hàng hiệu quả hơn để đảm bảo sự rời bỏ
đó không xảy ra? Phân tích thông tin thực sự dang sau những con số sẽ giúp bạn xác định cn
phải làm gì để thay đổi tình hình
bỏ chấp nhận được là hoàn toàn khác nhau tùy theo từng mô hình kinh doanh và phụ thuộc
Trang 10CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
rất nhi&u vào khả năng công ty có được khách hàng nhanh chóng và hiệu quả như thế nào
trong ngắn hạn và dài hạn Một số mô hình kinh doanh vẫn phát triển tốt bất chấp tỷ lệ khách
hang rời bỏ doanh nghiệp cao và một số khác cân dựa vào tỷ lệ rời bỏ dịch vụ thấp
Thay vì ấn định một con số nhất định, những nhà quản lý giỏi nhất sẽ nhìn vào các thông
số của họ vào năm ngoái và tự hỏi làm thế nào họ có thể làm tốt hơn Chỉ số này thực sự cho
thấy công ty đang quản lý các mối quan hệ khách hàng của mình tốt đến đâu và công ty luôn
có thể cải thiện hiệu quả của nó
Sai lần cuối cùng là việc không nhìn thấy được rang tỷ lệ khách hàng rời bỏ cao thưởng
là kết quả của việc thu hút khách hàng không hiệu quả Theo Avery, nhi& công ty đã và dang
thu hút sai đối tượng khách hang Họ nhận thấy sai lần nay ở những ngành tập trung đẩy
mạnh ưu đãi vềgiá cả Ho thu hút những người tìm kiếm giá hoi Những người này ra sẽ
rời bỏ doanh nghiệp nhanh chóng khi tìm được những giao dịch tốt hơn đối với doanh
nghiệp khác Vấn đ`ềnày được thể hiện rất rõ qua mô hình kinh doanh groupon (mua theo
nhóm để có được giá thành rẻ) Những giao dịch đó có thể đã mang lại nhi‘u khách hang mới
cho doanh nghiệp, nhưng họ thường là những khách hàng điển hình có tỷ lệ rời bỏ cao và
chẳng bao giờ lượn lờ mua những món hàng khác nếu không có giảm giá lớn.
Bài viết cũng chỉ ra rằng: mục tiêu chính của doanh nghiệp là thu hút và giữ chân những
khách hàng mà doanh nghiệp có thể mang lại giá trị cho họ và ngược lại, họ trở thành những
khách hàng đáng giá của doanh nghiệp.
Trang 11CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
1.2 Phương pháp nghiên cứu
1.2.1 Mô hình hồi quy Logistics
Một phương pháp phổ biến nhất góp mặt trong hi hết các nghiên cứu định lượng v`ề
khả năng vỡ nợ của khách hàng chính là mô hình h`õ quy Logistic
Mô hình h ` quy Logistic (Logistic Regression — Maddala, 1984) là một loại mô hình
tuyến tính tổng quát dùng để dự báo phân loại các biến nhị phân theo xác suất Việc phân loại
này được thực hiện bằng cách sử dụng hàm logit để ước tính xác suất xảy ra của biến phụ thuộc, với các nhãn của biến này được thay thế bằng các mã hóa giả (0 và 1).
Ví dụ như chúng ta muốn dự báo khả năng vỡ nợ của một khách hàng thì biến phụ
thuộc sẽ là khả năng vỡ nợ ứng với hai giá trị vỡ nợ hoặc không vỡ nợ
Vào năm 1980, Wiginton đã thực hiện so sánh h quy Logistic và phương pháp MDA.
Ông đã đưa ra kết luận rằng Logistic đem lại những kết quả phân loại tốt hơn trong việc chấm
điểm tín dụng
— Dạng mô hình và lý thuyết toán học của mô hình
Gọi biến phụ thuộc là Y (Y là biến nhị phân), khi đó hai giá trị của Y được mã hóa
thành 0 và 1 Với các biến độc lập là những biến có tác động đến khả năng Y = 1 được ký hiệu
là: x4, X2,X3, 0) Xp
Ý tưởng của mô hình h‘G quy Logistic là dự báo xác suất để Y = 1 (P(Y = 1)) Như vậy
Phương trình h'ã quy Logistic có dạng:
c024n1142%° -tđnXn
PUY = | x)= A FAX Fag Xa F Fan Xp
l+e
trong đó e là hằng số Euler (2/718), P e [0;1]
Nhiệm vụ của bài toán này là thực hiện hồ quy các hệ số AQ 1 › :› Ay dựa trên
phương pháp ước lượng hợp lý tối đa
Tuy nhiên, rất khó để đánh giá tác động của các biến phụ thuộc lên biến độc lập dựa
trên dạng mô hình trên, vì vậy, người ta đánh giá chúng thông qua một tỷ số được gọi là tỷ số
nguy cơ (odds ratio):
Trang 12CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
— Nguyên lý hoạt động của mô hình
Mô hình Logistic hoạt động tốt nhất khi nó đạt được độ phân loại cao nhất hay nói cách
khác sai số dự báo là bé nhất Thật vậy, giả sử như một đối tượng nhận giá trị ', = |, vay ta
kỳ vọng rang Y, càng g3 1 càng tốt, hay nói cách khác là xác suất để ¥ = 1 càng cao càng tốt Ngược lại, nếu đối tượng này nhận giá trị Y, = 0, vậy ta kỳ vọng rang Y, càng g3 0 càng
tốt, hoặc xác suất để Y, = | càng thấp càng tốt.
Vậy nên, ta cần một hàm để đánh giá độ tốt của kết quả dự báo được gọi là “Hàm mất
mat — Loss Function”.
Với mỗi đối tượng (x’ , Y;), ta có ham Loss được biểu diễn dưới dạng:
L = ~Œ, x In(f) + (1~ Y,) x In(1 — Ÿ))
Trong đó: Y, giá trị dự báo của Y;
Từ đó ta có thể kết luận rằng, khi kết quả dự báo càng g`Ầ với thực tế thì giá trị hàm
Loss càng nhỏ Vậy bài toán trở thành tìm giá trị nhỏ nhất của hàm Loss
— Ưu điểm của mô hình:
+ Mô hình Logistic là một mô hình định lượng nên kết quả trở lên có cơ sở và khách
quan hơn những phương pháp định tính
+ Mô hình khá đơn giản cho việc đo lường rủi ro và dễ thực hiện.
+ Có thể phân tích được tác động của các biến độc lập lên khả năng vỡ nợ của khách
hàng.
tín dụng Thông qua kết quả từ mô hình, chúng ta có thể ước lượng được xác suất vỡ
nợ của khách hàng, từ đó Ngân hàng có thể xác định được khách hàng nào đang nằm trong vùng cảnh báo, khách hàng nào đang nằm trong vùng an toàn và giúp ngân hàng
chủ động trong việc đưa ra những biện pháp phòng ngừa rủi ro tín dụng
— Nhược điểm của mô hình
+ Mô hình hoạt động không hiệu qua với số liệu nhi`ềi chi
+ Chỉ hoạt động với dữ liệu dạng số
+ Không phải là một mô hình mạnh khi dữ liệu có nhi nhiễu
Trang 13CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
+ Mô hình phụ thuộc nhi& vào độ tin cậy từ các ngu Ân tin thu thập được và khả năng
dự báo của nhân viên tín dụng
1.2.2 Thuật toán Random Forest
Như tên gọi của nó, Random Forest - rừng ngẫu nhiên: đây là phương pháp tạo dựng một
tập hợp có nhi`âi cây quyết định, sau đó dùng phương pháp bỏ phiếu trong bài toán phân loại
để đưa ra quyết định v`êbiến target ch được dự báo, còn đối với rừng ngẫu nhiên h` quy
thì lấy trung bình Random Forest được coi là một trong những thuật toán Machine Learning
dễ sử dụng và linh hoạt nhất Một khu rừng bao g ‘tm cây cối, người ta nói rằng càng có
nhiên cây thì rừng càng mạnh Random Forest tạo ra cây quyết định (decision tree) trên các
mẫu dữ liệu được chọn ngẫu nhiên, được dự đoán từ mỗi cây và chọn giải pháp tốt nhất bang
cách bỏ phiếu Nó cũng cung cấp một chỉ báo khá tốt v`êt`ần quan trọng của tính năng
Random Forest có nhi ứng dụng, chẳng hạn như công cụ đềxuất, phân loại hình anh và lựa
chọn tính năng.
V`ềmặt toán học, thuật toán có thể được giải thích như sau: Random Forest là một tập
hợp của hàng trăm cây quyết định, trong đó từng cây lại được tạo nên ngẫu nhiên bằng việc
tái chọn mẫu (chon random 1 ph của data để xây dựng) và random các biến từ toàn bộ các biến trong dif liệu, bằng cách sử dụng chỉ báo chọn thuộc tính như tăng thông tin, tỷ lệ tăng
và chỉ số Gini cho từng thuộc tính Mỗi cây phụ thuộc vào một mẫu ngẫu nhiên độc lập.
Trong bài toán phân loại, mỗi phiếu b`â! chọn và lớp phổ biến nhất được chọn là kết qua
cuối cùng Trong trưởng hợp h ` quy, mức trung bình của tất cả các kết quả du ra của câyđược coi là kết quả cuối cùng Nó đơn giản và mạnh mẽ hơn so với các thuật toán phân loại
phi tuyến tính khác Với một cơ chế như vậy, Random Forest cho ta một kết quả chính xác
rất cao nhưng đánh đổi bằng việc ta không thể hiểu cơ chế hoạt động của thuật toán này do
cấu trúc quá phức tạp của mô hình này - do vậy thuật toán này là một trong những phương
thức Black Box - tức ta sẽ cho tay vào trong hộp và rút ra được kết quả chứ không thể giải
thích được cơ chế hoạt động của mô hình
Thuật toán
Trang 14CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
quyết định, không bị van đ `
overfitting Thuật toán
thưởng được dùng cho cả
hai bài toán phân loại và h`Ñ
quy Random Forest còn có
quan trọng của tính năng
tương đối, giúp chọn các
Thời gian huấn luyện của
mô hình có thể kéo dài tùy
vào số cây cây quyết định
và số thuộc tính phân chia.
Mô hình khó hiểu hơn so
với cây quyết định, nơi bạn
có thể dễ dàng đưa ra quyết
định bằng cách đi theo đường dẫn trong cây.
Đối với bài toán phân lớp,
dữ liệu huấn luyện cn được
đa dạng hóa và cân bằng v`ề
số nhãn lớp Việc không cân
thay thế thì theo ước tính có
khoảng 1/3 các ph‘ tử
không có nằm trong mẫu
này Dia này có nghĩa là
chỉ có khoảng 2/3 các phần
tử trong tập huấn luyện
tham gia vào trong các tính
toán, và 1/3 các ph` tử này
được gọi là dữ liệu bag Dữ liệu out-of-bag
out-of-được sử dụng để ước lượng
lỗi tạo ra từ việc kết hợp các
kết quả từ các cây tổng hợp
trong Random Forest cũng
Trang 15tính năng đóng góp nhi`âI như dùng để ước tính độ
nhất cho việc phân loại quan trọng thuộc tính.
Bảng 1 - Các đặc điểm của mô hình Random Forest
Áp dụng thuật toán Random Forest vào bài toán dự báo trong lĩnh vực kinh tế.
Dự báo có nghĩa là dự đoán các sự kiện trong tương lai, thưởng dựa trên cơ sở của các
báo cáo, dữ liệu trước đó Trong một thời gian dài, các mô hình thống kê thường được sử
dụng để tiến hành các dự đoán Vai trò của Học máy đã được tổng quát hóa, trong trường
hợp khi một sản phẩm hoặc cửa hàng mới được giới thiệu, hiệu ứng này có thể được sử dụng
để đưa ra các dự báo bán hàng vi sự hạn chế của lịch sử dit liệu cho một chuỗi thời gian cụ
thể
Một số thuật toán của Học máy thường được ứng dụng trong các mô hình dự báo hiện
nay như: HG quy tuyến tính, HG quy Gradient Boosting, H quy Support Vector, HG quy
Rừng ngẫu nhiên Các thuật toán Học máy có thể giúp các nhà kinh doanh dễ dàng tìm ra kết
quả tốt hơn so với các kỹ thuật phân tích truy n thống của chuỗi thời gian Trong đó, thuật
toán Random Forest hay còn gọi Rừng ngẫu nhiên được coi là thuật toán thích hợp nhất để áp
dụng vào việc đánh giá xu hướng và đưa ra các ước tính hoặc dự báo trong kinh doanh Cụ
thể như sau:
— Đánh giá xu hướng và ước tính doanh thu
Nếu doanh số bán hàng của một công ty tang du đặn hàng tháng trong vài nam qua, việc
tiến hành phân tích h` quy dữ liệu sẽ tạo ra một mô hình mô tả xu hướng tăng, giảm của
doanh thu Sau đó, công ty có thể sử dụng mô hình để dự báo doanh số bán hàng cho các
tháng, quý tiếp theo.
— Phân tích tác động của biến động giá
H8 quy rừng ngẫu nhiên cũng có thể được sử dụng để phân tích ảnh hưởng của việc định
giá đối với hành vi của người tiêu dùng Chẳng hạn: Nếu một công ty thay đổi giá của một
sản phẩm nhất định nhi`âi LẦn, công ty có thể ghi lại số lượng bán ra cho mỗi mức giá và sau
đó thực hiện h`õ quy với số lượng bán là biến phụ thuộc và giá là biến giải thích Kết quả sé
là một đường mô tả mức độ mà người tiêu dùng giảm tiêu thụ sản phẩm khi giá thành tăng,
đi `! này có thể giúp định hướng các quyết định v`ềgiá trong tương lai
Trang 16CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
— Đánh giá rủi ro
thường trên mỗi khách hàng theo độ tuổi và phát hiện ra rằng khách hàng lớn tuổi có xu
hướng yêu c`âi bảo hiểm sức khỏe nhi`âi hơn Kết quả của việc phân tích như vậy có thể
hướng dẫn các quyết định kinh doanh quan trọng được đưa ra để tính đến rủi ro.
Ngoài ra, thuật toán Random Forest còn được ứng dụng trong một số lĩnh vực khác nhưkhí tượng, y học, cụ thể là ứng dụng vào việc dự báo các vị trí tim ẩn nguy cơ xảy ra lũ quét
cho các tỉnh min núi; hay áp dụng vào dự báo khả năng mắc bệnh tim của bệnh nhân thông
qua các biến dự báo là các biểu hiện như: cân nặng, lưu lượng máu, tức ngực, động mạch bị
chặn.
Trang 17CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
1.3 Tổng quan nghiên cứu
Nhìn chung, các nghiên cứu v €sw rời bỏ của khách hàng trong lĩnh vực Thương mại điện
tử chủ yếu xoay quanh các mô hình với nguyên gốc từ mô hình H` quy Logistics hoặc các
mô hình Machine Learning kinh điển khác Điểm khác biệt ở chỗ: Cách thức xử lý dữ liệu để
tính toán ra các nhân tố tác động đến việc rời bỏ của khách hàng
Tại Trung Quốc, một nhóm nghiên cứu đến từ Trường Đại học Bắc Kinh v`ềkhả năng rời
bỏ khách hàng trong việc sử dụng dịch vụ E-Commerce đã cho thấy rằng: ngay cả với
phương pháp n là h` quy Logistics cũng cho được kết quả dự báo chính xác đến hơn
90% Dữ liệu mà nhóm nghiên cứu thu thập được cung cấp từ CNINC - Trung tâm mạng
lưới Internet Trung Quốc được thu thập trong năm 2016 Nhóm nghiên cứu này sử dụng mô
hình EBURM - bằng cách sử dụng phương pháp phân tích nhân tố, thời lượng trực tuyến của
người dùng, số In đăng nhập, sự chú ý và các yếu tố hành vi người dùng khác đã được phântích để đưa ra kết luận v €yéu tố ảnh hưởng đến việc người dùng rời bỏ dich vụ Các nhân tốđược lựa chọn đểh'ð quy là các tỉ số được tính toán từ các chỉ tiêu gốc Các tiêu chí để đánh
giá Performance của mô hình bao g ‘Gm Accuracy, Precision, Recall va Gini
Một nghiên cứu khác cũng tại Trung Quốc do Xiaojun Wu và Sufang Meng tai Dai học
Thuong Hải thực hiện cũng sử dụng bộ dữ liệu do CNINC cung cấp vào năm 2015 Trong bộ
dt liệu này, tỷ lệ rời bỏ khách hàng thương mại điện tử cao và bộ dữ liệu v`êkhách hàng rời
bỏ đang mất cân bằng nghiêm trọng Để cải thiện độ chính xác dự đoán của khách hàng rời
bỏ cũng như tăng cường xác định khách hàng không rời bỏ, bài báo này trình bày mô hình dựđoán roi bỏ khách hàng thương mại điện tử dựa trên thuật toán improved SMOTE va
AdaBoost Đi tiên, xử lý dữ liệu rời bỏ bang improved SMOTE, kết hợp các phương pháp lấy mẫu quá mức (oversampling) và lấy mẫu dưới mức (undersampling) để giải quyết vấn
đềmất cân bằng, sau đó tích hợp thuật toán AdaBoost để dự đoán Cuối cùng, nghiên cứu
thực nghiệm trên nf tảng thương mại điện tử B2C chứng minh rằng mô hình này có hiệu
quả và độ chính xác tốt hon so với các thuật toán dự đoán roi bỏ khách hàng trưởng thành
Nhi& công trình nghiên cứu dự đoán rời bỏ người dùng cũng tập trung đặc biệt vào các
vấn đ thực tế xảy ra trên các tập dữ liệu ứng dụng V`ềvấn đ`êmất cân bằng tập dữ liệu,
nhóm nghiên cứu của Vladislav Lazarov va Marius Capota cung cấp so sánh nhi phương
pháp học máy thường được sử dụng để dự đoán sự thay đổi Công việc của họ khẳng định
tính ưu việt của mang neural network trong lĩnh vực này Còn đối với Abbasimehr et al, các
Trang 18CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
kỹ thuật lấy mẫu đơn giản đạt được kết quả tốt hơn so với các phương pháp phức tạp hơn để cân bằng tập dữ liệu.
Việc giữ chân người dùng Yahoo Answers đã được nghiên cứu bởi Dror, G., Pelleg và
các cộng sự vào năm 2012 Các tác giả tập trung vào người dùng mới trong những ngày dutiên họ sử dụng ứng dụng Mục tiêu của họ là dự đoán tỷ lệ rời bỏ của họ trong tu‘ dM tiên
sử dụng ứng dụng Họ đã đ`ềxuất một mô hình phức tạp bao g`ân bốn loại thuộc tính, mô tả:câu hỏi mà người dùng đã trả lời, câu trả lời được cung cấp, phản hồ cho câu trả lời và nhânkhẩu học của người dùng Các tác giả đã sử dụng mô hình để so sánh độ chính xác của dự
đoán rời bỏ đạt được bằng nhi`âi phương pháp học máy Mặc dù thuật toán Random Forest
dat được dự đoán chính xác nhất (75,8% ROC AUC), các tác giả ưu tiên sử dụng h` quy
tuyến tính nhanh hơn với kết quả tương đương
Một số cách tiếp cận xem xét nhi loại hành động của người dùng đã được đ`xuất chocác tác vụ phân loại hoặc cá nhân hóa, ví dụ: hệ số hóa ma trận tập thể trong nghiên cứu của
Yin, D., Guo và các cộng sự Tuy nhiên, khả năng giải thích của các phương pháp tin ẩn
như vậy là khá thấp Hơn nữa, việc dự đoán người dùng rời đi trong phiên thực tế của họ (để
có thể thực hiện các hành động) là rất hữu ích và do đó, các vấn d€v €hiéu suất là cực kỳ
quan trọng.
Tóm lại, các mô hình người dùng bao g ồn các bộ thuộc tính khác nhau dường như hoạt
động tốt hơn trong ngữ cảnh của nhiệm vụ dự đoán rời bỏ Các bộ này thường được bắt
ngu Ân từ một mi kiến thức v`Šứng dụng cu thể Các thuộc tính và mô hình người dùng
thường được biểu diễn dưới dạng một vectơ, đại diện và/hoặc mô hình hóa các tùy chọn của
người dùng Trong số các phương pháp được sử dụng để phân loại, mạng nơ-ron, SVM hoặc
hổ quy tuyến tinh được sử dụng nhiên nhất
Trang 19CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
.Z.e `
Chương 2: Thực trạng ngành Thương mại Điện tử trên Thế giới và
Việt Nam
2.1 Các đặc điểm của thương mại điện tử
So với các hoạt động thương mại truy thống, thương mại điện tử có một số điểm khácbiệt cơ bản như sau:
— Các bên tiến hành giao dịch trong thương mại điện tử không tiếp xúc trực tiếp với nhau
và không đòi hỏi phải biết nhau từ trước
yếu theo nguyên tắc vật lý như chuyển tin, séc hóa đơn, vận đơn, gửi báo cáo Các phương
tiện viễn thông như: fax, telex, chỉ được sử dụng để trao đổi số liệu kinh doanh Việc sử
dụng các phương tiện điện tử trong thương mại truy & thống chi để truy Ên tải thông tin mộtcách trực tiếp giữa các đối tác trong cùng một giao dịch, cho phép mọi người tham gia tu các
vùng xa xôi hẻo lánh đến các khu đô thị lớn, tạo đi kiện cho tất cả mọi người ở khắp mọi
nơi đề có cơ hội ngang nhau tham gia vào thị trường giao dịch toàn cf và không đòi hỏi
nhất thiết phải có mối quan hệ quen biết với nhau
— Các giao dịch thương mại truy thống được thực hiện với sự t` tại của khái niệm biên
giới quốc gia, còn thương mại điện tử được thực hiện trong một thị trưởng không có biêngiới (thị trưởng thống nhất toàn c`â1) Thương mại điện tử trực tiếp tác động tới môi
trưởng cạnh tranh toàn ci
Việc thương mại điện tử phát triển giúp cho máy tính cá nhân trở thành cửa sổ cho doanh
nghiệp hướng ra ngoài thị trường trên khấp thế giới.
— Trong hoạt động giao dịch thương mại điện tử đ`âi có sự tham ra của ít nhất ba chủ thể,
trong đó có một bên không thể thiếu được là người cung cấp dịch vụ mạng, các cơ quanchứng thực
Trong thương mại điện tử, ngoài các chủ thể tham gia quan hệ giao dịch giống như giao
dịch thương mại truy â thống đã xuất hiện một bên thứ ba đó là nhà cung cấp dịch vụ mạng,các cơ quan chứng thực là những người tạo môi trường cho các giao dịch thương mại điệntử.Nhà cung cấp dịch vụ mạng và cơ quan chứng thực có nhiệm vụ chuyển đi, lưu giữ các
Trang 20CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
thông tin giữa các bên tham gia giao dịch thương mại điện tử, dng thời họ cũng xác nhận độtin cậy của các thông tin trong giao dịch thương mại điện tử
— Đối với thương mại truy Ê thống thì mạng lưới thông tin chỉ là phương tiện để trao đổi
dv liệu”, còn đối với thương mại điện tử thì mạng lưới thông tin chính là thị trưởng.
Nhi loại hình kinh doanh mới được hình thành thông qua Thương mại điện tử Các
trang web phổ biến như Yahoo hay Google đóng một vai trò quan trọng trong việc cung cấp
thông tin trên mạng, trở thành “khu chợ khổng I'ổ trên Internet Hoạt động thương mại điện
tử diễn ra trên hình thức online có nghĩa người bán muốn bán được sản phẩm của mình thì
bắt buộc phải có hệ thống thông tin của sản phẩm cũng như dịch vụ chăm sóc khách hàng để
người mua có thể tiếp cận được dịch vụ một cách tốt nhất trước khi quyết định mua chúng
Những đặc điểm trên đây của thương mại điện tử giúp cho các đơn vị có thể dễ dàng tìmđược đối tác tốt hay những sản phẩm ưng ý nhất nhờ đặc điểm phi khoảng cách, phi thời
gian của nó, di€ đó làm tăng khả năng tiếp cận của thị trường và đặc biệt là khả năng xử lýgiao dịch nhanh chóng, tối ưu hóa, đem đến những trải nghiệm người dùng tốt nhất
Trang 21CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
2.2 Thực trạng và xu hướng phát triển của của thương mại điện tử
2.2.1 Thực trạng chung trên toàn thế giới
Dưới sự ảnh hưởng nặng n`của dai dịch COVID-19, trong khi nhi`âi ngành kinh tế khác
khó khăn, chật vật xoay sở thì thương mại điện tử lại có những điểm sáng và tiếp tục ghi
nhận sự tăng trưởng doanh thu ấn tượng Thị trường thương mại điện tử toàn c`âi được dự
báo sẽ tiếp tục có những bước tăng trưởng mạnh mẽ v`ềdoanh thu trong những năm tới
Nhận định này một 1 nữa được nhấn mạnh trong Sách trắng Thương mại điện tử Việt Nam
năm 2021 vừa được Cục Thương mại điện tử và Kinh tế số công bố Theo đó, doanh thu
thương mại điện tử B2C toàn ci năm 2020 đạt 4.280 USD Con số nay được dự đoán là sẽtiếp tục tang lên là 4.891 tỷ USD vào năm 2021 và cán mốc 6.388 tỷ USD vào năm 2024
Trung Quốc và Hoa Kỳ được kỳ vọng là hai trong số các quốc gia có mức tăng trưởng doanh
thu thương mại điện tử B2C an tượng, dự báo sẽ đạt 3.565 tỷ USD va 1.204 tỷ USD vào nam
2024.
Khu vực Đông Nam A, cũng được đánh giá sẽ có những bứt phá v`ềtăng trưởng doanh
thu và quy mô thị trường Báo cáo kinh tế Internet khu vực Đông Nam Á năm 2020 của
Google, Temasek và Bain&Company dự báo đến năm 2025, doanh thu thương mại điện tử
khu vực sẽ cán mốc 172 tỷ USD Con số này năm 2020 là 62 tỷ USD và năm 2019 là 38 tỷ
USD Một số nước như Indonesia, Thái Lan và Phillipines được dự báo có mức doanh thu
thương mại điện tử tắng trưởng vượt bậc trong những năm tới Năm 2020, mức doanh thu ởIndonesia là 32 tỷ USD và Thái Lan là 9 tỷ USD nhưng tới năm 2025, con số này sẽ đạt mức
83 ty USD và 24 tỷ USD Cũng theo báo cáo này, dịch bệnh Covid-19 đã tạo cú huých mạnh
tới phát triển thương mại điện tử tại Việt Nam nói riêng Tỷ lệ người mua sắm trực tuyến
mới trong tổng số người mua sắm trực tuyến tại Việt Nam chiếm tỷ lệ cao nhất (khoảng
41%) Tỷ lệ này trung bình ở cả khu vực Đông Nam Á là khoảng 36%, Indonesia và
Phillipines cùng 37%, Malaysia 36%, Singapore và Thái Lan cùng 30%.
Trong tương lai, thương mại điện tử được dự đoán sẽ phát triển mạnh mẽ nhờ sự hỗ trợ
của công nghệ học máy (Machine Learning) với những xu hướng chính như sau:
— Nâng cao hiệu quả hoạt động nội bộ
Hoạt động của các cửa hàng thương mại điện tử có thể được thực hiện hiệu quả hơn nhờ
học máy Bên cạnh việc quan lý dữ liệu v €doanh số bán hàng, chi phí lưu kho, các thuật toán
hoc máy còn giúp dự đoán chính xác các biến động v`êcung cM theo thời gian thực Việc chủ
Trang 22CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE
động nắm bắt được xu hướng sẽ giúp các cửa hàng giành ưu thế trước các đối thủ Thêm vào
đó, học máy còn giúp xây dựng các hệ thống phát hiện gian lận trong thương mại điện tử
— Xây dựng các chiến dịch tiếp thị phù hợp hơn
Một chiến dịch tiếp thị sẽ là tốt nếu nó có thể tiếp cận được với những đối tượng kháchhàng phù hợp nhất với chiến dịch Nói cách khách đây chính là bài toán tìm kiếm khách hàngtiềm năng Trong thời đại dữ liệu như hiện nay, các cửa hàng thương mại điện tử có quy `
truy cập được lượng thông tin lớn hơn bao giờ hết Từ các mẫu thu thập được như những
sản phẩm mà khách hàng thể hiện quan tâm hoặc lượt truy cập của khách hàng với trang web,
phân loại khách hàng tiềm năng dựa theo sở thích của họ, từ đó giúp đề xuất xây dựng những chiến dịch tiếp thị phù hợp cho từng nhóm khách hàng.
— Cải thiện dịch vụ khách hàng
Với thương mại điện tử, việc giao dịch được thực hiện bất kể không gian và thời gian
Do đó, việc cung cấp các hỗ trợ đa kênh hoạt động 24/7 cho khách hàng là rất cm thiết.
Không c3 phải thuê thêm một lực lượng lao động để xây dựng thực hiện công việc hỗ trợ
này, các thuật toán học máy cho phép cải thiện dịch vụ khách hàng thông qua Chatbots Đây
là hướng tiếp cận dang được rất nhi&u website thực hiện khi nó giúp giải quyết các truy vấn
phổ biến và hướng khách hàng đến các sản phẩm cụ thể giống như một người trợ lý ảo Cácphản h‘“G cũng được thu thập va dùng để đi`âi chỉnh nâng cấp hệ thống trong tương lai, giúp
các thông tin đem tới cho khách hàng là tốt nhất
— Tăng cường chuyển đổi
Tỷ lệ chuyển đổi từ những khách hàng truy`& thống thành những người mua sắm trực
tuyến là vấn đ`ềmà bất kỳ trang web thương mại điện tử nào cũng đề quan tâm Các kỹ
thuật học máy hiện nay giúp gia tăng tỷ lệ này bằng cách cải thiện các công cụ tìm kiếm tại
chỗ va các đ`Êxuất sản phẩm Thông qua xử lý ngôn ngữ tự nhiên, hệ thống có thể hiểu được
những øì khách hàng nhập trên thanh tìm kiếm Sau đó, nó sử dụng những gì đã được huấn
luyện từ trước để hiển thị những gì mà khách hàng thực sự muốn tìm kiếm, ngay cả khi họ
không nhập tên của một sản phẩm cụ thể hoặc một mô tả chính xác Các đ`ềxuất sản phẩm
được hỗ trợ bởi công nghệ học máy cũng thông minh hơn khi nó có thể phân tích hành vi của
khách hàng từ dữ liệu truy cập website thương mại điện tử của họ và giới thiệu những sản