1. Trang chủ
  2. » Luận Văn - Báo Cáo

Chuyên đề tốt nghiệp: Áp dụng mô hình hồi quy logistics và thuật toán random forest để đánh giá khả năng rời bỏ dịch vụ thương mại điện tử của khách hàng

45 2 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 45
Dung lượng 10,86 MB

Nội dung

Internet không chỉ góp phần thay đổi một số cách thức sinh hoạt và làm việc hàng ngày của con người mà còn kéo theo sự phát triển nhanh chóng của một trong những thị trường đang rất được

Trang 1

KHOA TOÁN KINH TẾ

CHUYEN DE TỐT NGHIỆP - TOÁN KINH TE

`ˆ^ `

DE TAI; áp DỤNG MÔ HÌNH HOI QUY LOGISTICS VÀ THUẬT TOÁN

RANDOM FOREST ĐỂ ĐÁNH GIÁ KHẢ NĂNG RỜI BỎ DỊCH VỤ THƯƠNG MẠI

Trang 2

HÀ NỘI - 2022

MỤC LỤC DANH MỤC HINH ANH vessssssessssssessesssssvessssssessesssessesssessessesssssscesssssesuesanesscsasesseeneessseseenees 2 DANH MỤC BANG BIEU -o e<©ce©cs£EeeExeEEsEEteEEEEseEteErserketterserkerrsrrkerreerserssre 2

820090585 3

MO DAU vesssssssssssssssssssssssssssssssssssssssssssscssssssssecssssssssssssssssssesssssssssesssssssssesssssssssesssssssnsesesssesnee 4

Ly do CNON 1/1 0N 0A aAaaaẢ ÔÔ 4

MUC ti€U NQNIEN CUU 00088 - 5

Đối tượng HghÏÊH CÚP eresereccrescseserecssesssesssecssecssscssesssesessssnssssssssessasesssssasssasesuscsssssasssasesseessees 5

CGU hỏi NGHIEN CÍPH So <5 < Họ TH HH II 0000 000000100 0 5 Phương pháp NGNIEN CWUU co- << 5 < TH cọ 00 000 06096 6

Kết cấu CHUYEN Ae ecsecsesssecsesssesvesrsessessesrsssvessesssessesssessesssessesnessscssesnssssesaesasesscsasessceneensseseenees 6 Chương 1: — Cơ sở lý thuyết và tổng quan Nghién CỨU -° se se scsese 7

1.1 _ Cơ sở lý thuyết về kha năng rời bó của khách hàng -e-s°-s°ssesssess=s 7

1.2, Phương pháp nghiên cứu sss5s<css=ssetsesEserenssssessse

1.2.1 Mô hình hoi quy LogIstics se.

1.2.2 Thuat todn Random Forest 0177 4

1.3 Tống quan nghiên CWU csssesssessssscesssesssesssssesssecsssssesssecasscsssssesesscsssssesssecssessessseensees 16

Chương 2: Thực trạng ngành Thương mại Điện tử trên Thế giới và Việt Nam T8

2.1 Cade đặc điểm của thương mại điện tứ 2< se setxsetssezsserserssee 18

2.2 Thực trạng và xu hướng phát triển của của thương mại điện tử

2.2.1 Thực trang chung trên toàn thê giới -c ccccrreerrierriee "

2.2.2 Thực trạng phát triên ngành Thương mại Điện tử tại Việt NÑam 55-555 <5<<++

Chương 3: Két quả nghiên cứu và kẾt luẬn -e cecceecceecesereeeceeee 26

3.1 Dữliệu 26

3.1.1 Nguôn dữ liệu 26 3.1.2 Thông tin chi tiết vê bộ dữ LU - E112 11111211 19111111111 11111 HH ng re 26

3.2 Xử lý dữ liệu - e5 Ăn HH HH HH TH ng 0001 030000384000040003040100500000056 28

3.3 Dự báo kha năng rời bỏ của khách hàng bằng mô hình hồi quy Logistics

3.4 Dự báo khả năng rời bỏ của khách hang bằng thuật toán Random Forest

3.5 Khuyến nghị và giải pháp s ssc-sccssecsse Error! Bookmark not defined.

KEt UG NNannaanneeeeeee - 38 TAI LIEU THAM KHAO.sesssssssssssssssssssssssssssssssssssssssssssssssnsssnsssssssnsssasssasssasssasesssesasesaeesss 40

Trang 3

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

DANH MỤC HÌNH ẢNH

HÌNH 2 - MÔ TẢ CÁC BƯỚC HOẠT ĐỘNG CUA THUẬT TOÁN RANDOM FOREST ¿+ 25+ *+*+t£++t£eEetstxexetrerske 13 HÌNH 3 - TONG QUAN NGANH THƯƠNG MẠI ĐIỆN TỬ NĂM 2021 (NGUON: REPUTA) - 5222252 +e£+x+esersrresrs 22 HÌNH 4 - PAIR PLOT DOI VỚI CÁC BIEN ĐỊNH LƯỢNG S2 221115111 151511121151 111111111111 11111 111 0 1111 111111 1111 30

HÌNH 5 - KET QUA MÔ HÌNH HOI QUY OGISTICS, - t1 9% 135191 9191 E911 11 1 1 11T TT Tàn Hàng 31

HÌNH 6 - KET QUA MÔ HÌNH RANDOM FOREST - G c 1 2112112211211 911211 0112 11011 g1 01H g1 TH TH TH hờn 34

HÌNH 7 - MA TRAN NHAM LAN CUA MÔ HÌNH RANDOM FOREST

HÌNH 8 - DO THỊ MÔ TẢ GINI CUA MÔ HÌNH KHI BO ĐI MỘT BIEN SO 5c 2c 223221231511 1E 1211211818111 11 1111 x2 36

DANH MỤC BANG BIEU

BANG | - CÁC ĐẶC DIEM CUA MÔ HÌNH RANDOM FOREST 14

BANG 2 - /(0áv.Ve.\e:)))00:19)1e8:v0900)2000000n88 27 BANG 3 - THONG KE MÔ TẢ CÁC BIEN ĐỊNH TINH cccscecesesseseseseeseseseesescecesesceceseeeesesescesesecsesesseseseeseseeeeseeeseaeeeeseaees 28 BANG 4 - THONG KE MÔ TẢ CÁC BIEN ĐỊNH LUONG seecescssesescseeseseeeseseeceseecceseeceseseeceaeeecsesecseseeeeseseeeeseeeeeeaeeeeaeiees 30

BANG 5 - MA TRAN NHAM LAN DOI VỚI MÔ HÌNH HOI QUY LOGISTICS :.ccscessesscesscesceseceseesecesecseeessessceseenseeseesseens 32

Trang 4

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

LỜI CẢM ƠN

Để hoàn thành khóa luận này, em xin tỏ lòng biết ơn sâu sắc đến Ths Nguyễn Thị Liên

đã tận tình hướng dẫn trong suốt quá trình viết Chuyên đ ềtốt nghiệp.

Em chân thành cảm ơn quý thẦy, cô trong khoa Toán Kinh tế, Trường Đại Học Kinh tếQuốc dân đã tận tình truy ‘fn đạt kiến thức trong những năm em học tập Với vốn kiến thứcđược tiếp thu trong quá trình học không chi là nề tảng cho quá trình nghiên cứu khóa luận

mà còn là hành trang quý để báu để em bước vào đời một cách vững chắc và tự tin.

Cuối cùng em kính chúc cô d` dào sức khỏe và thành công trong sự nghiệp tr ng người

cao quý.

Em xin chân thành cảm ơn cô!

Trang 5

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

2 A

MO DAU

Ly do chọn đ étai

Trong những năm g%n đây, thế giới đã chứng kiến sự phát triển bùng nổ cả v échat lượng

và số lượng người sử dụng mạng Internet Tính đến tháng 1/2021, trên thế giới có tới 4.66 tỷngười dùng, tương đương với tỷ lệ thâm nhập Internet trên toàn cu ở mức 59.5% Riêng tạiViệt Nam, số người sử dụng Internet là khoảng 68.72 triệu người, chiếm 70.3% dân số

Internet không chỉ góp phần thay đổi một số cách thức sinh hoạt và làm việc hàng ngày của

con người mà còn kéo theo sự phát triển nhanh chóng của một trong những thị trường đang

rất được các nhà du tư, doanh nghiệp cũng như người tiêu dùng quan tâm — Thương mại

điện tử Báo cáo Chỉ số thương mại điện tử Việt Nam 2021 của Hiệp hội Thương mại điện tử

Việt Nam chỉ ra rằng nước ta có nhi`âi tiên năng v`ềphát triển thương mại điện tử Theo đó,

thương điện tử Việt Nam năm 2020 tăng 16% và đạt quy mô trên 14 tỷ USD, đáng chú ý nhất

là lĩnh vực bán lẻ hàng hoá trực tuyến (tăng 46%) Báo cáo này cũng dự đoán tốc độ tăng

trưởng trung bình giai đoạn 2020 — 2025 là 29% và tới năm 2025 quy mô thương mại điện tửnước ta đạt 52 tỷ USD

Với tốc độ phát triển nhanh như vậy đòi hỏi các công ty phải biết đổi mới và nâng cao

chất lượng dịch vụ chăm sóc khách hàng Vấn đ ềnắm bắt thị hiếu, sở thích của người tiêu

dùng khi đó trở thành một vấn đ`ềcó tính nền tảng, sống còn của ngành mà bất kì người bánnào nếu muốn tân tại trên thị trường di cn phải giải quyết thật tốt Trước kia, những

người bán lẻ đã thực hiện nhi`âi biện pháp để ghi nhận thói quen của người tiêu dùng như sử

dụng các hóa đơn bán hàng để xem xét các mặt hàng thường được mua sắm cùng nhau,

phỏng vấn người mua v`ềsở thích mua sắm của họ để từ đó đưa ra những biện pháp giúp tối

đa hóa doanh thu, tối ưu hóa chi phí của doanh nghiệp Ví dụ, khi đi vào một cửa hàng sách

quen thuộc, chủ cửa hàng sẽ giới thiệu cho người khách một vài quyển sách hoặc tờ báo màngười khách đó có thể quan tâm dựa trên sở thích hoặc thói quen của khách hàng Nhưng

với thương mại điện tử, hình thức mà người mua và người bán không cH gặp gỡ trực tiếp

và họ giao dịch với nhau trên các trang web, việc xây dựng một trợ lý bán hàng tự động là vôcùng quan trọng và cũng chính là một thách thức lớn Vấn đ`ềnày có thể được giải quyết

bằng việc tích hợp các Hệ thông gợi ý (Recommender Systems) trong các website bán hàng.

Với lượng thông tin đ`ồsộ xuất hiện tran lan trên các website, người tiêu dùng không thể có

đủ thời gian để xem xét tất cả các sản phẩm, dịch vụ Khi đó, hệ thống gợi ý như một chuyên

Trang 6

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

gia tư vấn, dự đoán thông minh sở thích của khách hàng và cung cấp những thông tin mà họ

thực sự quan tâm.

Các kỹ thuật hệ gợi ý đã và đang được nghiên cứu, ứng dụng một cách mạnh mẽ và manglại lợi ích cho cả người cung cấp dịch vụ và người sử dụng dịch vụ “Trong lĩnh vực xây

dựng hệ gợi ý có hai nhiệm vụ cơ bản ch được giải quyết là dự đoán xếp hạng cho từng mặt

hàng và gợi ý danh sách mặt hàng Nhiệm vụ dự đoán xếp hạng (rating prediction) nhằm mục

tiêu tối ưu hóa dự đoán mức độ ưa thích của người dùng đối với từng mặt hàng cụ thể, trong

khi đó nhiệm vụ gợi ý danh sách mặt hàng (ranking) nhằm giải quyết vấn đ gợi ý cho người

dùng danh sách mặt hàng mà họ nhi&u khả nang có tương tác nhất Trong hai nhiệm vụ nói

trên, nhiệm vụ dự đoán xếp hạng của người dùng cho sản phẩm đóng vai trò quan trọng vì

điểm xếp hạng của người dùng phản ánh mức độ hài lòng của người dùng đối với sản

phẩm/dịch vụ” Hi hết các trang thương mại lớn trên thế giới, như: Amazon.com,

Alibaba.com, ebay.com đ`âi sử dụng các kỹ thuật gợi ý trong website của mình để nâng cao

trải nghiệm cho khách hàng, nâng cao chất lượng dịch vụ và thu lại lợi nhuận tốt hơn

G3 đây, nhờ có các công cụ mới phát triển dựa trên Machine Learning, như kỹ thuật gợi

ý dựa trên nội dung hay lọc cộng tác đã giúp xây dựng các hệ gợi ý cá nhân hóa, nâng cao trải

nghiệm khách hàng Vậy nên, chuyên đ`ềsẽ tập trung tìm hiểu và Ứng dụng một số thuật

toán Machine Learning trong việc dự báo khả năng rời bỏ của khách hàng sử dụng dịch

vụ thương mại điện tử.

Mục tiêu nghiên cưu

Tìm ra được các nhân tố ảnh hưởng mạnh đến khả năng rời bỏ của khách hàng sử dụng

dịch vụ thương mại điện tử Từ đó, tiến hành xác định xác suất khách hàng rời bỏ sản phẩm.Đồng thời, phân nhóm hoặc xếp hạng các khách hàng rời bỏ sản phẩm để tìm ra chính sách

phù hợp giữ chân khách hàng tiếp tục sử dụng sản phẩm

Đối tượng nghiên cứu

Đối tượng nghiên cứu của chuyên đ`ềlà các khách hàng sử dung dịch vụ thương mại điện

tử của công ty Target Corporation trong năm 2019

^ 2e oA ⁄

Cau hỏi nghiên cưu

— Sự roi bỏ của khách hàng là gì? Vì sao họ roi bỏ

— Các nhân tố ảnh hưởng đến khả năng rời bỏ là những nhân tố nào? Nhân tố nào tác động

Nguyễn Thuy Dương — MSV: 11191283 — Toán Kinh tế

Trang 7

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

— Mô hình Machine Learning có khả năng dự báo khả năng rời bỏ tốt không?

Phương pháp nghiên cứu

Chuyên đ`ềphân tích định tính, phân tích các thống kê mô tả kết quả các khách hàng sửdụng dịch vụ Từ đó đánh giá, phân loại khách hàng, sau đó áp dụng thuật toán học máy

Random Forest để dự báo việc khách hàng có rời bỏ dịch vụ hay không nhằm đi ân chỉnh kế

hoạch Marketing, quảng cáo sản phẩm

Kết cau chuyên đ ê

Chuyên đ tốt nghiệp có kết cấu 04 chương như sau:

— Chương 1: Cơ sở lý thuyết và tổng quan nghiên cứu

— Chương 2: Thực trạng ngành Thương mại Điện tử trên Thế giới và Việt Nam

— Chương 3: Kết quả nghiên cứu

— Chương 4: Kết luận và khuyến nghị

Trang 8

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

Chương 1: Cơ sở lý thuyết và tổng quan nghiên cứu

1.1 Cơ sở lý thuyết v €kha năng rời bỏ của khách hang

Phân tích sự roi bỏ của khách hàng có thể được định nghĩa là công việc phân tích, thực

hiện v €kha năng khách hang rời khỏi một sản phẩm hoặc dich vụ Theo định nghĩa đơn giản

nhất, đi`âi đó có nghĩa là khách hang từ bỏ khi lựa chọn công ty vì sự cạnh tranh

(Ñettleton.D, 2014) Mục đích là để xác định tình huống này trước khi khách hàng rời bỏ sảnphẩm hoặc dịch vụ và sau đó thực hiện một số hành động phòng ngừa vấn đ`ềnày

Theo Jill Avery, tỷ lệ khách hàng rời bỏ (customer churn rate) là một chỉ số đo lường tỷ

lệ phần trăm số người chấm dứt quan hệ khách hàng với một doanh nghiệp trong một giai

đoạn cụ thể Thông thường, tỷ lệ rời bỏ được tính theo tháng, quý hoặc năm, tùy thuộc vào

ngành hang và sản phẩm của doanh nghiệp Tỷ lệ hang năm là đơn vị mặc định cho hu hết

các công ty, tuy nhiên có nhi`âi công ty như nhà cung cấp dịch vụ điện thoại di động, phòng

tập gyms, hay công ty ph m`ồn, sé theo dõi tỷ lệ nay theo tháng Một số công ty có tỷ lệ

khách hàng rời bỏ dịch vụ rất lớn, kéo theo việc để mất khách hàng sẽ ảnh hưởng rất lớn

đến việc đánh giá tỷ lệ này hàng tháng”.

Tuy nhiên, không chỉ có những người làm marketing mới xem xét tỷ lệ này, rất nhi`â! nha

di tư cũng sử dụng chi số này để đánh giá những tin năng thực sự của một công ty nào đó

Tỷ lệ rời bỏ khách hàng của công ty càng cao sẽ kéo theo nghi vấn v €kha năng duy trì vat‘tại của công ty đó càng lớn

Theo Frederick Reichained (2006), người phát minh ra chỉ số đo lường sự hài lòng, khi tỷ

lệ giữ chân khách hang tăng 5%, lợi nhuận của công ty sẽ tăng từ 25% đến 95% Và chi phí

để có một khách hàng mới thường cao thường vượt xa so với việc duy trì một khách hàng

hiện có Thông thường, các công ty chi nhi hơn 7 Lần cho việc có được khách hàng mới sovới việc giữ chân khách hang và giá trị trung bình toàn cầi của một khách hàng bị mất là 243

đô la Rõ ràng, sự roi bỏ của khách hàng gây tốn kém rất lớn cho các doanh nghiệp

Vi tỷ lệ khách hàng rời bỏ chi đơn giản là tỷ lệ phần trăm khách hang chấm dứt quan hệ

mua hàng với công ty trong một khoảng thời gian nhất định, nên việc tính toán nó khá đơn

giản Ta có thể lấy tổng số khách hàng rời bỏ doanh nghiệp trong một khoảng thoi gian chia

cho tổng số khách hàng ở đ`ầi kỳ Có thể thấy, đây là một chi báo chậm (lagging indicator),

Trang 9

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

nghĩa là doanh nghiệp chỉ có thể xem lại những xu hướng đã diễn ra, cũng là một trong những

nhược điểm của nó

— Vai trò của việc phân tích sự roi bỏ của khách hàng

Phân tích sự rời bỏ của khách hàng đặc biệt quan trọng trong việc tính toán của doanh

nghiệp trong các lĩnh vực như bảo hiểm, viễn thông hoặc ngân hàng Theo Kotler, P., &

Keller, K L (2009), việc giành được khách hàng mới trong đi`êi kiện cạnh tranh ngày nay

tốn kém hơn tới 10 In so với việc giữ chân khách hàng hiện tại Đây là một phương pháp

phân tích được sử dụng trong các vấn đ`ềnhư xác định h`ồsơ của khách hàng hiện tại, phân

tích các khách hang rời bỏ và ước tính sự roi bỏ của khách hàng

Hơn nữa, theo Poel, V D., Lariviére (2004), giá trị của các doanh nghiệp này tỷ lệ thuận

với số lượng khách hang còn hoạt động Do đó, nhi`âi chỉ số như chi phí, lợi nhuận, quy mô,

năng lực đi tư, dòng tin của doanh nghiệp phụ thuộc vào số lượng khách hang va do đó

phụ thuộc vào sự trung thành của khách hàng Ngoài ra, nghiên cứu đã chỉ ra rằng lợi nhuận

của khách hàng các dài hạn cao hơn so với khách hàng vãng lai

— Một số sai lần khi phân tích v`ềkhách hang rời bỏ

Avery trong bài viết “The Value of Keeping the Right Customers” đã chỉ ra 4 sai lần mà

nhà quản lý của các công ty thường mắc phải khi xem xét tỷ lệ rời bỏ của khách hàng.

Thứ nhất là việc sử dụng tỷ lệ rời bỏ như một chỉ số bị động chứ không phải là một cơ

hội trong thực tế Khi bạn nhận ra tỷ lệ khách hang rởi bỏ mình tăng lên, đó đã là 6-8 tháng

sau thời điểm bạn thực sự đánh mất khách hàng của mình Nếu chỉ số khách hàng rời bỏ dịch

vụ là thước đo duy nhất bạn sử dụng để đánh giá mức độ hài lòng của khách hàng, thì bạn

luôn luôn đi sau thời thế những 6 tháng và vô phương tác động đến tương lai

Thứ hai là xem tỷ lệ này đơn giản là một con số hoặc dữ liệu chứ không phải là một chỉ

số v €hanh vi của khách hàng Các công ty nên tự đặt ra câu hỏi: Công ty chúng ta dang làm

gì để tạo ra doanh thu từ khách hàng? Những khách hàng của chúng ta vì sao lại quyết định

rời đi? Lam thế nào để có thể quản ly quan hệ khách hàng hiệu quả hơn để đảm bảo sự rời bỏ

đó không xảy ra? Phân tích thông tin thực sự dang sau những con số sẽ giúp bạn xác định cn

phải làm gì để thay đổi tình hình

bỏ chấp nhận được là hoàn toàn khác nhau tùy theo từng mô hình kinh doanh và phụ thuộc

Trang 10

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

rất nhi&u vào khả năng công ty có được khách hàng nhanh chóng và hiệu quả như thế nào

trong ngắn hạn và dài hạn Một số mô hình kinh doanh vẫn phát triển tốt bất chấp tỷ lệ khách

hang rời bỏ doanh nghiệp cao và một số khác cân dựa vào tỷ lệ rời bỏ dịch vụ thấp

Thay vì ấn định một con số nhất định, những nhà quản lý giỏi nhất sẽ nhìn vào các thông

số của họ vào năm ngoái và tự hỏi làm thế nào họ có thể làm tốt hơn Chỉ số này thực sự cho

thấy công ty đang quản lý các mối quan hệ khách hàng của mình tốt đến đâu và công ty luôn

có thể cải thiện hiệu quả của nó

Sai lần cuối cùng là việc không nhìn thấy được rang tỷ lệ khách hàng rời bỏ cao thưởng

là kết quả của việc thu hút khách hàng không hiệu quả Theo Avery, nhi& công ty đã và dang

thu hút sai đối tượng khách hang Họ nhận thấy sai lần nay ở những ngành tập trung đẩy

mạnh ưu đãi vềgiá cả Ho thu hút những người tìm kiếm giá hoi Những người này ra sẽ

rời bỏ doanh nghiệp nhanh chóng khi tìm được những giao dịch tốt hơn đối với doanh

nghiệp khác Vấn đ`ềnày được thể hiện rất rõ qua mô hình kinh doanh groupon (mua theo

nhóm để có được giá thành rẻ) Những giao dịch đó có thể đã mang lại nhi‘u khách hang mới

cho doanh nghiệp, nhưng họ thường là những khách hàng điển hình có tỷ lệ rời bỏ cao và

chẳng bao giờ lượn lờ mua những món hàng khác nếu không có giảm giá lớn.

Bài viết cũng chỉ ra rằng: mục tiêu chính của doanh nghiệp là thu hút và giữ chân những

khách hàng mà doanh nghiệp có thể mang lại giá trị cho họ và ngược lại, họ trở thành những

khách hàng đáng giá của doanh nghiệp.

Trang 11

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

1.2 Phương pháp nghiên cứu

1.2.1 Mô hình hồi quy Logistics

Một phương pháp phổ biến nhất góp mặt trong hi hết các nghiên cứu định lượng v`ề

khả năng vỡ nợ của khách hàng chính là mô hình h`õ quy Logistic

Mô hình h ` quy Logistic (Logistic Regression — Maddala, 1984) là một loại mô hình

tuyến tính tổng quát dùng để dự báo phân loại các biến nhị phân theo xác suất Việc phân loại

này được thực hiện bằng cách sử dụng hàm logit để ước tính xác suất xảy ra của biến phụ thuộc, với các nhãn của biến này được thay thế bằng các mã hóa giả (0 và 1).

Ví dụ như chúng ta muốn dự báo khả năng vỡ nợ của một khách hàng thì biến phụ

thuộc sẽ là khả năng vỡ nợ ứng với hai giá trị vỡ nợ hoặc không vỡ nợ

Vào năm 1980, Wiginton đã thực hiện so sánh h quy Logistic và phương pháp MDA.

Ông đã đưa ra kết luận rằng Logistic đem lại những kết quả phân loại tốt hơn trong việc chấm

điểm tín dụng

— Dạng mô hình và lý thuyết toán học của mô hình

Gọi biến phụ thuộc là Y (Y là biến nhị phân), khi đó hai giá trị của Y được mã hóa

thành 0 và 1 Với các biến độc lập là những biến có tác động đến khả năng Y = 1 được ký hiệu

là: x4, X2,X3, 0) Xp

Ý tưởng của mô hình h‘G quy Logistic là dự báo xác suất để Y = 1 (P(Y = 1)) Như vậy

Phương trình h'ã quy Logistic có dạng:

c024n1142%° -tđnXn

PUY = | x)= A FAX Fag Xa F Fan Xp

l+e

trong đó e là hằng số Euler (2/718), P e [0;1]

Nhiệm vụ của bài toán này là thực hiện hồ quy các hệ số AQ 1 › :› Ay dựa trên

phương pháp ước lượng hợp lý tối đa

Tuy nhiên, rất khó để đánh giá tác động của các biến phụ thuộc lên biến độc lập dựa

trên dạng mô hình trên, vì vậy, người ta đánh giá chúng thông qua một tỷ số được gọi là tỷ số

nguy cơ (odds ratio):

Trang 12

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

— Nguyên lý hoạt động của mô hình

Mô hình Logistic hoạt động tốt nhất khi nó đạt được độ phân loại cao nhất hay nói cách

khác sai số dự báo là bé nhất Thật vậy, giả sử như một đối tượng nhận giá trị ', = |, vay ta

kỳ vọng rang Y, càng g3 1 càng tốt, hay nói cách khác là xác suất để ¥ = 1 càng cao càng tốt Ngược lại, nếu đối tượng này nhận giá trị Y, = 0, vậy ta kỳ vọng rang Y, càng g3 0 càng

tốt, hoặc xác suất để Y, = | càng thấp càng tốt.

Vậy nên, ta cần một hàm để đánh giá độ tốt của kết quả dự báo được gọi là “Hàm mất

mat — Loss Function”.

Với mỗi đối tượng (x’ , Y;), ta có ham Loss được biểu diễn dưới dạng:

L = ~Œ, x In(f) + (1~ Y,) x In(1 — Ÿ))

Trong đó: Y, giá trị dự báo của Y;

Từ đó ta có thể kết luận rằng, khi kết quả dự báo càng g`Ầ với thực tế thì giá trị hàm

Loss càng nhỏ Vậy bài toán trở thành tìm giá trị nhỏ nhất của hàm Loss

— Ưu điểm của mô hình:

+ Mô hình Logistic là một mô hình định lượng nên kết quả trở lên có cơ sở và khách

quan hơn những phương pháp định tính

+ Mô hình khá đơn giản cho việc đo lường rủi ro và dễ thực hiện.

+ Có thể phân tích được tác động của các biến độc lập lên khả năng vỡ nợ của khách

hàng.

tín dụng Thông qua kết quả từ mô hình, chúng ta có thể ước lượng được xác suất vỡ

nợ của khách hàng, từ đó Ngân hàng có thể xác định được khách hàng nào đang nằm trong vùng cảnh báo, khách hàng nào đang nằm trong vùng an toàn và giúp ngân hàng

chủ động trong việc đưa ra những biện pháp phòng ngừa rủi ro tín dụng

— Nhược điểm của mô hình

+ Mô hình hoạt động không hiệu qua với số liệu nhi`ềi chi

+ Chỉ hoạt động với dữ liệu dạng số

+ Không phải là một mô hình mạnh khi dữ liệu có nhi nhiễu

Trang 13

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

+ Mô hình phụ thuộc nhi& vào độ tin cậy từ các ngu Ân tin thu thập được và khả năng

dự báo của nhân viên tín dụng

1.2.2 Thuật toán Random Forest

Như tên gọi của nó, Random Forest - rừng ngẫu nhiên: đây là phương pháp tạo dựng một

tập hợp có nhi`âi cây quyết định, sau đó dùng phương pháp bỏ phiếu trong bài toán phân loại

để đưa ra quyết định v`êbiến target ch được dự báo, còn đối với rừng ngẫu nhiên h` quy

thì lấy trung bình Random Forest được coi là một trong những thuật toán Machine Learning

dễ sử dụng và linh hoạt nhất Một khu rừng bao g ‘tm cây cối, người ta nói rằng càng có

nhiên cây thì rừng càng mạnh Random Forest tạo ra cây quyết định (decision tree) trên các

mẫu dữ liệu được chọn ngẫu nhiên, được dự đoán từ mỗi cây và chọn giải pháp tốt nhất bang

cách bỏ phiếu Nó cũng cung cấp một chỉ báo khá tốt v`êt`ần quan trọng của tính năng

Random Forest có nhi ứng dụng, chẳng hạn như công cụ đềxuất, phân loại hình anh và lựa

chọn tính năng.

V`ềmặt toán học, thuật toán có thể được giải thích như sau: Random Forest là một tập

hợp của hàng trăm cây quyết định, trong đó từng cây lại được tạo nên ngẫu nhiên bằng việc

tái chọn mẫu (chon random 1 ph của data để xây dựng) và random các biến từ toàn bộ các biến trong dif liệu, bằng cách sử dụng chỉ báo chọn thuộc tính như tăng thông tin, tỷ lệ tăng

và chỉ số Gini cho từng thuộc tính Mỗi cây phụ thuộc vào một mẫu ngẫu nhiên độc lập.

Trong bài toán phân loại, mỗi phiếu b`â! chọn và lớp phổ biến nhất được chọn là kết qua

cuối cùng Trong trưởng hợp h ` quy, mức trung bình của tất cả các kết quả du ra của câyđược coi là kết quả cuối cùng Nó đơn giản và mạnh mẽ hơn so với các thuật toán phân loại

phi tuyến tính khác Với một cơ chế như vậy, Random Forest cho ta một kết quả chính xác

rất cao nhưng đánh đổi bằng việc ta không thể hiểu cơ chế hoạt động của thuật toán này do

cấu trúc quá phức tạp của mô hình này - do vậy thuật toán này là một trong những phương

thức Black Box - tức ta sẽ cho tay vào trong hộp và rút ra được kết quả chứ không thể giải

thích được cơ chế hoạt động của mô hình

Thuật toán

Trang 14

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

quyết định, không bị van đ `

overfitting Thuật toán

thưởng được dùng cho cả

hai bài toán phân loại và h`Ñ

quy Random Forest còn có

quan trọng của tính năng

tương đối, giúp chọn các

Thời gian huấn luyện của

mô hình có thể kéo dài tùy

vào số cây cây quyết định

và số thuộc tính phân chia.

Mô hình khó hiểu hơn so

với cây quyết định, nơi bạn

có thể dễ dàng đưa ra quyết

định bằng cách đi theo đường dẫn trong cây.

Đối với bài toán phân lớp,

dữ liệu huấn luyện cn được

đa dạng hóa và cân bằng v`ề

số nhãn lớp Việc không cân

thay thế thì theo ước tính có

khoảng 1/3 các ph‘ tử

không có nằm trong mẫu

này Dia này có nghĩa là

chỉ có khoảng 2/3 các phần

tử trong tập huấn luyện

tham gia vào trong các tính

toán, và 1/3 các ph` tử này

được gọi là dữ liệu bag Dữ liệu out-of-bag

out-of-được sử dụng để ước lượng

lỗi tạo ra từ việc kết hợp các

kết quả từ các cây tổng hợp

trong Random Forest cũng

Trang 15

tính năng đóng góp nhi`âI như dùng để ước tính độ

nhất cho việc phân loại quan trọng thuộc tính.

Bảng 1 - Các đặc điểm của mô hình Random Forest

Áp dụng thuật toán Random Forest vào bài toán dự báo trong lĩnh vực kinh tế.

Dự báo có nghĩa là dự đoán các sự kiện trong tương lai, thưởng dựa trên cơ sở của các

báo cáo, dữ liệu trước đó Trong một thời gian dài, các mô hình thống kê thường được sử

dụng để tiến hành các dự đoán Vai trò của Học máy đã được tổng quát hóa, trong trường

hợp khi một sản phẩm hoặc cửa hàng mới được giới thiệu, hiệu ứng này có thể được sử dụng

để đưa ra các dự báo bán hàng vi sự hạn chế của lịch sử dit liệu cho một chuỗi thời gian cụ

thể

Một số thuật toán của Học máy thường được ứng dụng trong các mô hình dự báo hiện

nay như: HG quy tuyến tính, HG quy Gradient Boosting, H quy Support Vector, HG quy

Rừng ngẫu nhiên Các thuật toán Học máy có thể giúp các nhà kinh doanh dễ dàng tìm ra kết

quả tốt hơn so với các kỹ thuật phân tích truy n thống của chuỗi thời gian Trong đó, thuật

toán Random Forest hay còn gọi Rừng ngẫu nhiên được coi là thuật toán thích hợp nhất để áp

dụng vào việc đánh giá xu hướng và đưa ra các ước tính hoặc dự báo trong kinh doanh Cụ

thể như sau:

— Đánh giá xu hướng và ước tính doanh thu

Nếu doanh số bán hàng của một công ty tang du đặn hàng tháng trong vài nam qua, việc

tiến hành phân tích h` quy dữ liệu sẽ tạo ra một mô hình mô tả xu hướng tăng, giảm của

doanh thu Sau đó, công ty có thể sử dụng mô hình để dự báo doanh số bán hàng cho các

tháng, quý tiếp theo.

— Phân tích tác động của biến động giá

H8 quy rừng ngẫu nhiên cũng có thể được sử dụng để phân tích ảnh hưởng của việc định

giá đối với hành vi của người tiêu dùng Chẳng hạn: Nếu một công ty thay đổi giá của một

sản phẩm nhất định nhi`âi LẦn, công ty có thể ghi lại số lượng bán ra cho mỗi mức giá và sau

đó thực hiện h`õ quy với số lượng bán là biến phụ thuộc và giá là biến giải thích Kết quả sé

là một đường mô tả mức độ mà người tiêu dùng giảm tiêu thụ sản phẩm khi giá thành tăng,

đi `! này có thể giúp định hướng các quyết định v`ềgiá trong tương lai

Trang 16

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

— Đánh giá rủi ro

thường trên mỗi khách hàng theo độ tuổi và phát hiện ra rằng khách hàng lớn tuổi có xu

hướng yêu c`âi bảo hiểm sức khỏe nhi`âi hơn Kết quả của việc phân tích như vậy có thể

hướng dẫn các quyết định kinh doanh quan trọng được đưa ra để tính đến rủi ro.

Ngoài ra, thuật toán Random Forest còn được ứng dụng trong một số lĩnh vực khác nhưkhí tượng, y học, cụ thể là ứng dụng vào việc dự báo các vị trí tim ẩn nguy cơ xảy ra lũ quét

cho các tỉnh min núi; hay áp dụng vào dự báo khả năng mắc bệnh tim của bệnh nhân thông

qua các biến dự báo là các biểu hiện như: cân nặng, lưu lượng máu, tức ngực, động mạch bị

chặn.

Trang 17

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

1.3 Tổng quan nghiên cứu

Nhìn chung, các nghiên cứu v €sw rời bỏ của khách hàng trong lĩnh vực Thương mại điện

tử chủ yếu xoay quanh các mô hình với nguyên gốc từ mô hình H` quy Logistics hoặc các

mô hình Machine Learning kinh điển khác Điểm khác biệt ở chỗ: Cách thức xử lý dữ liệu để

tính toán ra các nhân tố tác động đến việc rời bỏ của khách hàng

Tại Trung Quốc, một nhóm nghiên cứu đến từ Trường Đại học Bắc Kinh v`ềkhả năng rời

bỏ khách hàng trong việc sử dụng dịch vụ E-Commerce đã cho thấy rằng: ngay cả với

phương pháp n là h` quy Logistics cũng cho được kết quả dự báo chính xác đến hơn

90% Dữ liệu mà nhóm nghiên cứu thu thập được cung cấp từ CNINC - Trung tâm mạng

lưới Internet Trung Quốc được thu thập trong năm 2016 Nhóm nghiên cứu này sử dụng mô

hình EBURM - bằng cách sử dụng phương pháp phân tích nhân tố, thời lượng trực tuyến của

người dùng, số In đăng nhập, sự chú ý và các yếu tố hành vi người dùng khác đã được phântích để đưa ra kết luận v €yéu tố ảnh hưởng đến việc người dùng rời bỏ dich vụ Các nhân tốđược lựa chọn đểh'ð quy là các tỉ số được tính toán từ các chỉ tiêu gốc Các tiêu chí để đánh

giá Performance của mô hình bao g ‘Gm Accuracy, Precision, Recall va Gini

Một nghiên cứu khác cũng tại Trung Quốc do Xiaojun Wu và Sufang Meng tai Dai học

Thuong Hải thực hiện cũng sử dụng bộ dữ liệu do CNINC cung cấp vào năm 2015 Trong bộ

dt liệu này, tỷ lệ rời bỏ khách hàng thương mại điện tử cao và bộ dữ liệu v`êkhách hàng rời

bỏ đang mất cân bằng nghiêm trọng Để cải thiện độ chính xác dự đoán của khách hàng rời

bỏ cũng như tăng cường xác định khách hàng không rời bỏ, bài báo này trình bày mô hình dựđoán roi bỏ khách hàng thương mại điện tử dựa trên thuật toán improved SMOTE va

AdaBoost Đi tiên, xử lý dữ liệu rời bỏ bang improved SMOTE, kết hợp các phương pháp lấy mẫu quá mức (oversampling) và lấy mẫu dưới mức (undersampling) để giải quyết vấn

đềmất cân bằng, sau đó tích hợp thuật toán AdaBoost để dự đoán Cuối cùng, nghiên cứu

thực nghiệm trên nf tảng thương mại điện tử B2C chứng minh rằng mô hình này có hiệu

quả và độ chính xác tốt hon so với các thuật toán dự đoán roi bỏ khách hàng trưởng thành

Nhi& công trình nghiên cứu dự đoán rời bỏ người dùng cũng tập trung đặc biệt vào các

vấn đ thực tế xảy ra trên các tập dữ liệu ứng dụng V`ềvấn đ`êmất cân bằng tập dữ liệu,

nhóm nghiên cứu của Vladislav Lazarov va Marius Capota cung cấp so sánh nhi phương

pháp học máy thường được sử dụng để dự đoán sự thay đổi Công việc của họ khẳng định

tính ưu việt của mang neural network trong lĩnh vực này Còn đối với Abbasimehr et al, các

Trang 18

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

kỹ thuật lấy mẫu đơn giản đạt được kết quả tốt hơn so với các phương pháp phức tạp hơn để cân bằng tập dữ liệu.

Việc giữ chân người dùng Yahoo Answers đã được nghiên cứu bởi Dror, G., Pelleg và

các cộng sự vào năm 2012 Các tác giả tập trung vào người dùng mới trong những ngày dutiên họ sử dụng ứng dụng Mục tiêu của họ là dự đoán tỷ lệ rời bỏ của họ trong tu‘ dM tiên

sử dụng ứng dụng Họ đã đ`ềxuất một mô hình phức tạp bao g`ân bốn loại thuộc tính, mô tả:câu hỏi mà người dùng đã trả lời, câu trả lời được cung cấp, phản hồ cho câu trả lời và nhânkhẩu học của người dùng Các tác giả đã sử dụng mô hình để so sánh độ chính xác của dự

đoán rời bỏ đạt được bằng nhi`âi phương pháp học máy Mặc dù thuật toán Random Forest

dat được dự đoán chính xác nhất (75,8% ROC AUC), các tác giả ưu tiên sử dụng h` quy

tuyến tính nhanh hơn với kết quả tương đương

Một số cách tiếp cận xem xét nhi loại hành động của người dùng đã được đ`xuất chocác tác vụ phân loại hoặc cá nhân hóa, ví dụ: hệ số hóa ma trận tập thể trong nghiên cứu của

Yin, D., Guo và các cộng sự Tuy nhiên, khả năng giải thích của các phương pháp tin ẩn

như vậy là khá thấp Hơn nữa, việc dự đoán người dùng rời đi trong phiên thực tế của họ (để

có thể thực hiện các hành động) là rất hữu ích và do đó, các vấn d€v €hiéu suất là cực kỳ

quan trọng.

Tóm lại, các mô hình người dùng bao g ồn các bộ thuộc tính khác nhau dường như hoạt

động tốt hơn trong ngữ cảnh của nhiệm vụ dự đoán rời bỏ Các bộ này thường được bắt

ngu Ân từ một mi kiến thức v`Šứng dụng cu thể Các thuộc tính và mô hình người dùng

thường được biểu diễn dưới dạng một vectơ, đại diện và/hoặc mô hình hóa các tùy chọn của

người dùng Trong số các phương pháp được sử dụng để phân loại, mạng nơ-ron, SVM hoặc

hổ quy tuyến tinh được sử dụng nhiên nhất

Trang 19

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

.Z.e `

Chương 2: Thực trạng ngành Thương mại Điện tử trên Thế giới và

Việt Nam

2.1 Các đặc điểm của thương mại điện tử

So với các hoạt động thương mại truy thống, thương mại điện tử có một số điểm khácbiệt cơ bản như sau:

— Các bên tiến hành giao dịch trong thương mại điện tử không tiếp xúc trực tiếp với nhau

và không đòi hỏi phải biết nhau từ trước

yếu theo nguyên tắc vật lý như chuyển tin, séc hóa đơn, vận đơn, gửi báo cáo Các phương

tiện viễn thông như: fax, telex, chỉ được sử dụng để trao đổi số liệu kinh doanh Việc sử

dụng các phương tiện điện tử trong thương mại truy & thống chi để truy Ên tải thông tin mộtcách trực tiếp giữa các đối tác trong cùng một giao dịch, cho phép mọi người tham gia tu các

vùng xa xôi hẻo lánh đến các khu đô thị lớn, tạo đi kiện cho tất cả mọi người ở khắp mọi

nơi đề có cơ hội ngang nhau tham gia vào thị trường giao dịch toàn cf và không đòi hỏi

nhất thiết phải có mối quan hệ quen biết với nhau

— Các giao dịch thương mại truy thống được thực hiện với sự t` tại của khái niệm biên

giới quốc gia, còn thương mại điện tử được thực hiện trong một thị trưởng không có biêngiới (thị trưởng thống nhất toàn c`â1) Thương mại điện tử trực tiếp tác động tới môi

trưởng cạnh tranh toàn ci

Việc thương mại điện tử phát triển giúp cho máy tính cá nhân trở thành cửa sổ cho doanh

nghiệp hướng ra ngoài thị trường trên khấp thế giới.

— Trong hoạt động giao dịch thương mại điện tử đ`âi có sự tham ra của ít nhất ba chủ thể,

trong đó có một bên không thể thiếu được là người cung cấp dịch vụ mạng, các cơ quanchứng thực

Trong thương mại điện tử, ngoài các chủ thể tham gia quan hệ giao dịch giống như giao

dịch thương mại truy â thống đã xuất hiện một bên thứ ba đó là nhà cung cấp dịch vụ mạng,các cơ quan chứng thực là những người tạo môi trường cho các giao dịch thương mại điệntử.Nhà cung cấp dịch vụ mạng và cơ quan chứng thực có nhiệm vụ chuyển đi, lưu giữ các

Trang 20

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

thông tin giữa các bên tham gia giao dịch thương mại điện tử, dng thời họ cũng xác nhận độtin cậy của các thông tin trong giao dịch thương mại điện tử

— Đối với thương mại truy Ê thống thì mạng lưới thông tin chỉ là phương tiện để trao đổi

dv liệu”, còn đối với thương mại điện tử thì mạng lưới thông tin chính là thị trưởng.

Nhi loại hình kinh doanh mới được hình thành thông qua Thương mại điện tử Các

trang web phổ biến như Yahoo hay Google đóng một vai trò quan trọng trong việc cung cấp

thông tin trên mạng, trở thành “khu chợ khổng I'ổ trên Internet Hoạt động thương mại điện

tử diễn ra trên hình thức online có nghĩa người bán muốn bán được sản phẩm của mình thì

bắt buộc phải có hệ thống thông tin của sản phẩm cũng như dịch vụ chăm sóc khách hàng để

người mua có thể tiếp cận được dịch vụ một cách tốt nhất trước khi quyết định mua chúng

Những đặc điểm trên đây của thương mại điện tử giúp cho các đơn vị có thể dễ dàng tìmđược đối tác tốt hay những sản phẩm ưng ý nhất nhờ đặc điểm phi khoảng cách, phi thời

gian của nó, di€ đó làm tăng khả năng tiếp cận của thị trường và đặc biệt là khả năng xử lýgiao dịch nhanh chóng, tối ưu hóa, đem đến những trải nghiệm người dùng tốt nhất

Trang 21

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

2.2 Thực trạng và xu hướng phát triển của của thương mại điện tử

2.2.1 Thực trạng chung trên toàn thế giới

Dưới sự ảnh hưởng nặng n`của dai dịch COVID-19, trong khi nhi`âi ngành kinh tế khác

khó khăn, chật vật xoay sở thì thương mại điện tử lại có những điểm sáng và tiếp tục ghi

nhận sự tăng trưởng doanh thu ấn tượng Thị trường thương mại điện tử toàn c`âi được dự

báo sẽ tiếp tục có những bước tăng trưởng mạnh mẽ v`ềdoanh thu trong những năm tới

Nhận định này một 1 nữa được nhấn mạnh trong Sách trắng Thương mại điện tử Việt Nam

năm 2021 vừa được Cục Thương mại điện tử và Kinh tế số công bố Theo đó, doanh thu

thương mại điện tử B2C toàn ci năm 2020 đạt 4.280 USD Con số nay được dự đoán là sẽtiếp tục tang lên là 4.891 tỷ USD vào năm 2021 và cán mốc 6.388 tỷ USD vào năm 2024

Trung Quốc và Hoa Kỳ được kỳ vọng là hai trong số các quốc gia có mức tăng trưởng doanh

thu thương mại điện tử B2C an tượng, dự báo sẽ đạt 3.565 tỷ USD va 1.204 tỷ USD vào nam

2024.

Khu vực Đông Nam A, cũng được đánh giá sẽ có những bứt phá v`ềtăng trưởng doanh

thu và quy mô thị trường Báo cáo kinh tế Internet khu vực Đông Nam Á năm 2020 của

Google, Temasek và Bain&Company dự báo đến năm 2025, doanh thu thương mại điện tử

khu vực sẽ cán mốc 172 tỷ USD Con số này năm 2020 là 62 tỷ USD và năm 2019 là 38 tỷ

USD Một số nước như Indonesia, Thái Lan và Phillipines được dự báo có mức doanh thu

thương mại điện tử tắng trưởng vượt bậc trong những năm tới Năm 2020, mức doanh thu ởIndonesia là 32 tỷ USD và Thái Lan là 9 tỷ USD nhưng tới năm 2025, con số này sẽ đạt mức

83 ty USD và 24 tỷ USD Cũng theo báo cáo này, dịch bệnh Covid-19 đã tạo cú huých mạnh

tới phát triển thương mại điện tử tại Việt Nam nói riêng Tỷ lệ người mua sắm trực tuyến

mới trong tổng số người mua sắm trực tuyến tại Việt Nam chiếm tỷ lệ cao nhất (khoảng

41%) Tỷ lệ này trung bình ở cả khu vực Đông Nam Á là khoảng 36%, Indonesia và

Phillipines cùng 37%, Malaysia 36%, Singapore và Thái Lan cùng 30%.

Trong tương lai, thương mại điện tử được dự đoán sẽ phát triển mạnh mẽ nhờ sự hỗ trợ

của công nghệ học máy (Machine Learning) với những xu hướng chính như sau:

— Nâng cao hiệu quả hoạt động nội bộ

Hoạt động của các cửa hàng thương mại điện tử có thể được thực hiện hiệu quả hơn nhờ

học máy Bên cạnh việc quan lý dữ liệu v €doanh số bán hàng, chi phí lưu kho, các thuật toán

hoc máy còn giúp dự đoán chính xác các biến động v`êcung cM theo thời gian thực Việc chủ

Trang 22

CHUYEN DE TOT NGHIỆP - CHUYÊN NGÀNH TOÁN KINH TE

động nắm bắt được xu hướng sẽ giúp các cửa hàng giành ưu thế trước các đối thủ Thêm vào

đó, học máy còn giúp xây dựng các hệ thống phát hiện gian lận trong thương mại điện tử

— Xây dựng các chiến dịch tiếp thị phù hợp hơn

Một chiến dịch tiếp thị sẽ là tốt nếu nó có thể tiếp cận được với những đối tượng kháchhàng phù hợp nhất với chiến dịch Nói cách khách đây chính là bài toán tìm kiếm khách hàngtiềm năng Trong thời đại dữ liệu như hiện nay, các cửa hàng thương mại điện tử có quy `

truy cập được lượng thông tin lớn hơn bao giờ hết Từ các mẫu thu thập được như những

sản phẩm mà khách hàng thể hiện quan tâm hoặc lượt truy cập của khách hàng với trang web,

phân loại khách hàng tiềm năng dựa theo sở thích của họ, từ đó giúp đề xuất xây dựng những chiến dịch tiếp thị phù hợp cho từng nhóm khách hàng.

— Cải thiện dịch vụ khách hàng

Với thương mại điện tử, việc giao dịch được thực hiện bất kể không gian và thời gian

Do đó, việc cung cấp các hỗ trợ đa kênh hoạt động 24/7 cho khách hàng là rất cm thiết.

Không c3 phải thuê thêm một lực lượng lao động để xây dựng thực hiện công việc hỗ trợ

này, các thuật toán học máy cho phép cải thiện dịch vụ khách hàng thông qua Chatbots Đây

là hướng tiếp cận dang được rất nhi&u website thực hiện khi nó giúp giải quyết các truy vấn

phổ biến và hướng khách hàng đến các sản phẩm cụ thể giống như một người trợ lý ảo Cácphản h‘“G cũng được thu thập va dùng để đi`âi chỉnh nâng cấp hệ thống trong tương lai, giúp

các thông tin đem tới cho khách hàng là tốt nhất

— Tăng cường chuyển đổi

Tỷ lệ chuyển đổi từ những khách hàng truy`& thống thành những người mua sắm trực

tuyến là vấn đ`ềmà bất kỳ trang web thương mại điện tử nào cũng đề quan tâm Các kỹ

thuật học máy hiện nay giúp gia tăng tỷ lệ này bằng cách cải thiện các công cụ tìm kiếm tại

chỗ va các đ`Êxuất sản phẩm Thông qua xử lý ngôn ngữ tự nhiên, hệ thống có thể hiểu được

những øì khách hàng nhập trên thanh tìm kiếm Sau đó, nó sử dụng những gì đã được huấn

luyện từ trước để hiển thị những gì mà khách hàng thực sự muốn tìm kiếm, ngay cả khi họ

không nhập tên của một sản phẩm cụ thể hoặc một mô tả chính xác Các đ`ềxuất sản phẩm

được hỗ trợ bởi công nghệ học máy cũng thông minh hơn khi nó có thể phân tích hành vi của

khách hàng từ dữ liệu truy cập website thương mại điện tử của họ và giới thiệu những sản

Ngày đăng: 20/05/2024, 01:17

HÌNH ẢNH LIÊN QUAN

Hình 1 - Mô tả các bước hoạt động của thuật toán Random Forest - Chuyên đề tốt nghiệp: Áp dụng mô hình hồi quy logistics và thuật toán random forest để đánh giá khả năng rời bỏ dịch vụ thương mại điện tử của khách hàng
Hình 1 Mô tả các bước hoạt động của thuật toán Random Forest (Trang 14)
Hình 2 - Tổng quan ngành Thương mại điện tử năm 2021 (nguén: Reputa) - Chuyên đề tốt nghiệp: Áp dụng mô hình hồi quy logistics và thuật toán random forest để đánh giá khả năng rời bỏ dịch vụ thương mại điện tử của khách hàng
Hình 2 Tổng quan ngành Thương mại điện tử năm 2021 (nguén: Reputa) (Trang 23)
Bảng 2 - Mô tả các biến trong bộ dữ liệu - Chuyên đề tốt nghiệp: Áp dụng mô hình hồi quy logistics và thuật toán random forest để đánh giá khả năng rời bỏ dịch vụ thương mại điện tử của khách hàng
Bảng 2 Mô tả các biến trong bộ dữ liệu (Trang 28)
Bảng 3 - Thống kê mô tả các biến định tính - Chuyên đề tốt nghiệp: Áp dụng mô hình hồi quy logistics và thuật toán random forest để đánh giá khả năng rời bỏ dịch vụ thương mại điện tử của khách hàng
Bảng 3 Thống kê mô tả các biến định tính (Trang 29)
Hình 3 - Pair plot đối với các biến định lượng - Chuyên đề tốt nghiệp: Áp dụng mô hình hồi quy logistics và thuật toán random forest để đánh giá khả năng rời bỏ dịch vụ thương mại điện tử của khách hàng
Hình 3 Pair plot đối với các biến định lượng (Trang 31)
Bảng 4 - Thong kê mô tả các biến định lượng - Chuyên đề tốt nghiệp: Áp dụng mô hình hồi quy logistics và thuật toán random forest để đánh giá khả năng rời bỏ dịch vụ thương mại điện tử của khách hàng
Bảng 4 Thong kê mô tả các biến định lượng (Trang 31)
Hình 4 - Kết quả mô hình hồi quy Logistics - Chuyên đề tốt nghiệp: Áp dụng mô hình hồi quy logistics và thuật toán random forest để đánh giá khả năng rời bỏ dịch vụ thương mại điện tử của khách hàng
Hình 4 Kết quả mô hình hồi quy Logistics (Trang 32)
Bảng 5 - Ma trận nhằm lẫn đối với mô hình hôi quy Logistics - Chuyên đề tốt nghiệp: Áp dụng mô hình hồi quy logistics và thuật toán random forest để đánh giá khả năng rời bỏ dịch vụ thương mại điện tử của khách hàng
Bảng 5 Ma trận nhằm lẫn đối với mô hình hôi quy Logistics (Trang 33)
Hình 5 - Kết quả mô hình Random Forest - Chuyên đề tốt nghiệp: Áp dụng mô hình hồi quy logistics và thuật toán random forest để đánh giá khả năng rời bỏ dịch vụ thương mại điện tử của khách hàng
Hình 5 Kết quả mô hình Random Forest (Trang 35)
Hình 6 - Ma trận nhằm lẫn của mô hình Random - Chuyên đề tốt nghiệp: Áp dụng mô hình hồi quy logistics và thuật toán random forest để đánh giá khả năng rời bỏ dịch vụ thương mại điện tử của khách hàng
Hình 6 Ma trận nhằm lẫn của mô hình Random (Trang 36)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w