đồ án 2 dự báo tồn kho bán lẻ với deep learning trong doanh nghiệp bán lẻ hàng điện tử

57 0 0
Tài liệu đã được kiểm tra trùng lặp
đồ án 2 dự báo tồn kho bán lẻ với deep learning trong doanh nghiệp bán lẻ hàng điện tử

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Trang 1

ĐẠI HỌC QUỐC GIA TP.HCM

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ PHẦN MỀM

ĐỒ ÁN 2

DỰ BÁO TỒN KHO BÁN LẺ VỚI DEEP

LEARNING TRONG DOANH NGHIỆP BÁN LẺHÀNG ĐIỆN TỬ

Giảng viên hướng dẫn : ThS Nguyễn Công Hoan

Sinh viên thực hiện 1 : Lê Quang TrungMã sinh viên 1 : 20520333

Sinh viên thực hiện 2 : Hà Phi HùngMã sinh viên 2 : 20520526

Tp HCM, tháng 12 năm 2023

Trang 2

ĐỀ CƯƠNG CHI TIẾT

TÊN ĐỀ TÀI:

Dự báo tồn kho bán lẻ với Deep Learning trong doanh nghiệp bán lẻ hàng điện tử

Tên đề tài tiếng Anh:

Inventory forecasting with Deep Learning in electronics retail business

Cán bộ hướng dẫn: ThS Nguyễn Công Hoan

Thời gian thực hiện: Từ ngày 21/09/2023 đến ngày 30/12/2023Sinh viên thực hiện:

Lê Quang Trung – 20520333

Đã có rất nhiều mô hình dự báo tồn kho được đề ra và áp dụng Hồi quy tuyến tính và trung bình trượt là một số mô hình truyền thống đã được sử dụng từ rất lâu và vẫn còn phổ biến ngày nay Gần đây, các mô hình máy học (Machine

Trang 3

learning) đã có độ chính xác cao hơn các mô hình truyền thống và ngày càng đượcứng dụng nhiều hơn.

Trong thế kỷ 21, các nhà nghiên cứu đã có những bước tiến lớn trong các mô hình máy học sử dụng mạng nơ-ron nhân tạo, hay còn gọi là các mô hình học sâu (Deep learning) Các mô hình này có khả năng nắm bắt các đặc điểm và hình thái phức tạp trong dữ liệu huấn luyện và cho ra các kết quả dự báo chính xác hơn các mô hình máy học thông thường, đặc biệt là khi có rất nhiều dữ liệu Các mô hình học sâu đã dẫn đến nhiều tiến bộ trong nhận diện, xử lý, và tổng hợp hình ảnh, âm thanh, văn bản và dữ liệu có cấu trúc như dữ liệu về hàng tồn kho.

Trong lĩnh vực bán lẻ điện tử, dữ liệu hàng tồn kho thường có các hình thái và đặc trưng phức tạp do ảnh hưởng từ đối thủ cạnh tranh, xu hướng xã hội,… Điều này khiến học sâu rất phù hợp cho việc dự báo hàng tồn kho trong lĩnh vực này.

Vì triển vọng và sức mạnh của học sâu, trong đề tài này, ta sẽ xây dựng và đánh giá một mô hình dự báo nhu cầu hàng tồn kho trong bán lẻ điện tử sử dụng học sâu.

Trang 4

3 Phương pháp thực hiện:

 Tìm hiểu tổng quát về hàng tồn kho, hàng tồn kho trong lĩnh vực bán lẻ điện tử.

 Tìm hiểu tổng quát về dự báo hàng tồn kho.

 Tìm hiểu mô hình hồi quy tuyến tính và trung bình trượt tự hồi quy tích hợp. Tìm hiểu học sâu sử dụng mạng nơron hồi quy dạng bộ nhớ dài-ngắn hạn  Khảo sát và đánh giá một số mô hình dự báo dùng dữ liệu thực nghiệm có

luận về mô hình học sâu.

4 Kết quả mong đợi

 Có kiến thức về lĩnh vực hàng tồn kho và dự báo hàng tồn kho trong bán lẻ điện tử.

 Có kiến thức về các mô hình dự báo tồn kho đã có.

 Đánh giá được một số mô hình dự báo sử dụng dữ liệu thực nghiệm có sẵn trên Kaggle.

 Xây dựng được một mô hình học sâu sử dụng dữ liệu thực nghiệm. Đánh giá và so sánh mô hình học sâu với các mô hình khác.

Trang 5

Kế hoạch thực hiện:

Thời gian Nội dung

21/09/2023 – 01/10/2023 Tìm hiểu về hàng tồn kho và bán lẻ điện tử.02/10/2023 – 10/11/2023 Tìm hiểu về dự báo hàng tồn kho và học sâu.11/11/2023 – 20/11/2023 Khảo sát một số mô hình có sẵn trên Kaggle.20/11/2023 – 10/12/2023 Xây dựng các mô hình.

10/12/2023 – 15/12/2023 Đánh giá các mô hình.15/12/2023 – 30/12/2023 Kết luận và viết báo cáo.

Xác nhận của GVHD

(Ký tên và ghi rõ họ tên)

ThS Nguyễn Công Hoan

Tp HCM, ngày 30 tháng 12 năm 2023 Sinh viên Sinh viên

(Ký tên và ghi rõ họ tên) (Ký tên và ghi rõ họ tên)

Lê Quang Trung Hà Phi Hùng

Trang 6

LỜI CẢM ƠN

Đầu tiên, nhóm thực hiện đề tài “Dự báo tồn kho bán lẻ với Deep Learning trong doanh nghiệp bán lẻ hàng điện tử” xin gửi lời cảm ơn đến quý thầy cô đã đang giảng dạy chúng em ở ngôi trường Đại học Công nghệ Thông tin – Đại học Quốc gia TP.HCM những kiến thức nền tảng vững chắc để nhóm có thể tự tìm hiểu và hoàn thiện đề tài này một cách tốt nhất.

Đặc biệt, chúng em xin gửi lời cảm ơn tới thầy Nguyễn Công Hoan vì sự tận tình hướng dẫn cũng như những góp ý, đề xuất quý báu của thầy dành cho nhóm trong quá trình thực hiện đồ án.

Trong suốt thời gian qua, nhóm đã tự tìm hiểu các kiến thức mới và kết hợp với những kiến thức nền tảng trong quá trình học tập, nghiên cứu và vận dụng để thực hiện đề tài này Với quỹ thời gian có hạn cũng như kinh nghiệm xây dựng sản phẩm còn thiếu, sản phẩm đồ án cuối cùng có thể sẽ mắc phải một số sai sót và chúng em rất mong sẽ nhận được những góp ý của thầy để bổ sung, cải tiến sản phẩm cũng như nâng cao kiến thức để xây dựng các sản phẩm tiếp theo chỉn chu, hoàn thiện hơn và tích luỹ thêm cho mình những kinh nghiệm quý giá để đáp ứng tốt cho những công việc thực tế trong tương lai

Một lần nữa, xin cảm ơn thầy vì đã đồng hành cùng chúng em trong suốt học kỳ I của năm học này.

Sinh viên thực hiện

Lê Quang Trung – Hà Phi Hùng

Trang 7

NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN

Trang 8

MỤC LỤC

Chương 1: HÀNG TỒN KHO VÀ QUẢN LÝ HÀNG TỒN KHO 7

1.1 Hàng tồn kho là gì? 7

1.2 Ý nghĩa của hàng tồn kho 7

1.3 Hàng tồn kho trong lĩnh vực bán lẻ điện tử 8

1.4 Quản lý hàng tồn kho 8

1.5 Các dữ liệu dùng trong quản lý hàng tồn kho bán lẻ 10

Chương 2: DỰ BÁO HÀNG TỒN KHO 12

2.1 Tổng quan về dự báo hàng tồn kho 12

2.2 Các dạng của chuỗi thời gian nhu cầu 13

2.3 Phân tích nhu cầu 15

2.4 Các mô hình dự báo nhu cầu 17

2.5 Đánh giá mô hình dự báo nhu cầu 18

2.6 Dự báo nhu cầu cho nhiều SKU 19

2.7 Dự báo tổng nhu cầu của các nhóm SKU 20

2.8 Dự báo nhu cầu trong lĩnh vực bán lẻ hàng điện tử 21

Chương 3: TỔNG QUAN VỀ MỘT SỐ MÔ HÌNH DỰ BÁO TRUYỀN THỐNG 22

3.1 Hồi quy tuyến tính 22

3.2 Tự hồi quy kết hợp trung bình trượt mùa vụ 23

Chương 4: TỔNG QUAN VỀ HỌC SÂU 26

4.1 Mạng nơ-ron sâu 26

Trang 9

4.2 Mạng nơ-ron hồi quy 27

4.3 Bộ nhớ dài-ngắn hạn 28

Chương 5: KHẢO SÁT VÀ ĐÁNH GIÁ MỘT SỐ MÔ HÌNH DỰ BÁO HÀNG TỒN KHO CÓ SẴN 31

5.1 Dự báo nhu cầu hàng tồn kho bánh dùng gradient boosting 31

5.2 Dự báo nhu cầu hàng tồn kho thiết bị cắm trại dùng LSTM 32

5.3 Dự báo tổng nhu cầu hàng tồn kho thiết bị cắm trại của các cửa hàng dùng SARIMA 34

Chương 6: XÂY DỰNG MÔ HÌNH DỰ BÁO HÀNG TỒN KHO HỌC SÂU 36

6.1 Bộ dữ liệu dùng để xây mô hình 36

6.2 Phân tích bộ dữ liệu 38

6.3 Xây dựng mô hình học sâu 41

6.4 Xây dựng mô hình hồi quy tuyến tính và ARIMA để so sánh 42

6.5 Đánh giá và so sánh 44

KẾT LUẬN 51

TÀI LIỆU THAM KHẢO 52

Trang 10

Chương 1: HÀNG TỒN KHO VÀ QUẢN LÝ HÀNG TỒN KHO

1.1 Hàng tồn kho là gì?

Hàng tồn kho là các tài sản của một doanh nghiệp được lưu trữ trong kho để bán hay dùng trong sản xuất Hàng tồn kho bao gồm các nguyên vật liệu và bán thành phẩm dùng trong sản xuất cũng như các thành phẩm cuối cùng để bán cho khách hàng.

Tùy vào cách phân loại, hàng tồn kho có các loại như nguyên vật liệu, bán thành phẩm, thành phẩm, vật tư tiêu hao (consumable), hàng đệm/an toàn

(buffer/safety stock), hàng mong đợi (anticipatory stock), hàng MRO (hàng bảo trì, thay thế, điều hành cung cấp), hàng đang vận chuyển (transit inventory),…

Một đối tượng hàng nằm tại một vị trí cụ thể nào đó trong kho được gọi là một SKU (Stock-keeping Unit).

1.2 Ý nghĩa của hàng tồn kho

Hàng tồn kho được dùng trong cả doanh nghiệp bán lẻ, sản xuất và phân phối/hậu cần Nhiều doanh nghiệp cần giữ hàng tồn kho để phòng ngừa các thay đổitrong nhu cầu khách hàng, giá cả và sự cố từ nhà cung cấp Hàng tồn kho cũng giúp quá trình sản xuất dễ dự đoán hơn Ngoài ra, nhiều doanh nghiệp cũng giữ hàng tồn kho vì họ mua với số liệu nhiều từ nhà cung cấp để được giảm giá Tóm lại, các doanh nghiệp cần giữ hàng tồn kho để giúp giảm thiểu các rủi ro về sản xuất và kinh doanh cũng như làm các công việc hoạch định và quản lý dễ dàng hơn.

Hàng tồn kho mang theo nó nhiều chi phí khác nhau Khi giữ hàng tồn kho, một doanh nghiệp có thể phải trả tiền thuê kho, mặt bằng kho, tiền cho nhân sự và các thiết bị trong kho, Hàng tồn kho giữ quá lâu cũng có thể bị hỏng, lạc hậu hay giảm giá trị dẫn đến các chi phí cơ hội và tiêu hủy Đây gọi chung là chi phí giữ hàng Chi phí mua hàng từ nhà cung cấp nhằm bổ sung kho và chi phí cho bộ phận

Trang 11

thu mua, vận chuyển và nhập kho cũng được tính là một loại chi phí của hàng tồn kho Đây gọi là chi phí mua hàng.

Vì tầm quan trọng và các chi phí đi kèm của hàng tồn kho, ta cần phải quản lý nó một cách hiệu quả để không làm gián đoạn quá trình kinh doanh và ảnh hưởngđến uy tín doanh nghiệp và niềm tin khách hàng.

1.3 Hàng tồn kho trong lĩnh vực bán lẻ điện tử

Hàng tồn kho trong các lĩnh vực kinh doanh khác nhau sẽ có các đặc thù khác nhau mà ta cần lưu ý khi làm việc với chúng Trong lĩnh vực bán lẻ điện tử, các sản phẩm điện tử rất đa dạng về mẫu, dòng,… Sản phẩm điện tử thường có vòng đời ngắn vì mỗi năm các doanh nghiệp tung ra thị trường những mẫu mới Thông số (Vd: Kích thước màn hình, lượng RAM,…) và hãng của sản phẩm điện tửcó sự ảnh hưởng mạnh hơn đến quyết định của khách hàng so với các chủng loại sản phẩm khác Một số loại sản phẩm điện tử như điện thoại thông minh có nhu cầu mua rất cao ngay sau ngày ra mắt rồi giảm dần từ lúc đó trở đi

Các đặc thù này có sự ảnh hưởng đến nghiệp vụ quản lý hàng tồn kho, đặc biệt là nghiệp vụ dự báo nhu cầu để lấy lượng hàng phù hợp Sự ảnh hưởng này sẽ được nói nhiều hơn trong mục 2.4.

1.4 Quản lý hàng tồn kho

Quản lý hàng tồn kho bao gồm công việc kiểm toán số lượng và giá trị hàng, quản lý vị trí để hàng, nhận dạng hàng, bổ sung hàng và hoạch định nhu cầu Trong đề tài này, nghiệp vụ mà ta chú ý đến sẽ là hoạch định nhu cầu (demand planning) và bổ sung hàng (stock replenishment).

Một mô hình để quản lý bổ sung hàng phải đảm bảo không xảy ra tình trạng hết hàng (out-of-stock) và đảm bảo cân bằng giữa chi phí giữ hàng và chu phí mua hàng Nếu mua hàng nhiều lần, mỗi lần mua ít thì sẽ giảm được chi phí giữ hàng nhưng tăng chi phí mua hàng Ngược lại, nếu mua hàng ít lần, mỗi lần mua nhiều

Trang 12

thì giảm chi phí mua hàng nhưng tăng chi phí giữ hàng Một mô hình quản lý bổ sung phải giúp các nhà quản lý tối ưu hóa quá trình bổ sung hàng để giảm thiểu tổng chi phí nhất có thể Tùy theo sự phụ thuộc lẫn nhau về nhu cầu của các SKU, ta có có mô hình quản lý khác nhau.

Với hàng tồn kho có nhu cầu độc lập như thành phẩm/sản phẩm trong phân phối và bán lẻ, mô hình Điểm đặt hàng lại (Reorder Point hay ROP) hay được dùng.Với hàng tồn kho có nhu cầu phụ thuộc như nguyên vật liệu và bán thành phẩm trong sản xuất, ta có mô hình Hoạch định nhu cầu vật liệu (Material Requirement Planning hay MRP) Ngoài ra còn có mô hình Sản xuất tức thời (Just-in-Time hay JIT).

Với ROP, ta tính một mức mà nếu số lượng của một SKU rơi xuống mức đó,ta tiến hành bổ sung nó Công thức tính mức này là:

ROP = Lượng an toàn + (Lượng dùng tháng x Thời gian bổ sung)

Để tính lượng hàng cần bổ sung sao cho tiết kiệm cả chi phí giữ hàng và muahàng, ta dùng công thức Số lượng Đặt hàng Kinh tế (Economic Order Quantity hay EOQ):

Q=2 DSH

Trong đó:

Q là số lượng hàng hóa tối ưu để đặt.

D là nhu cầu trong một khoảng thời gian cụ thể (thường là nhu cầu

theo năm).

S là chi phí mua hàng cho mỗi lần đặt hàng.

H là tỷ lệ chi phí giữ hàng, thường là tỷ lệ năm, được áp dụng cho giá

trị hàng tồn kho.

Về lý thuyết, lượng dùng tháng và thời gian bổ sung hàng trong ROP là

Trang 13

không đổi nhưng trên thực tế, chúng luôn thay đổi theo thời gian Để tăng hiệu quả quản lý, ta cần dự báo lượng dùng (hay còn gọi là nhu cầu) và thời gian bổ sung trong tương lai của các SKU.

1.5 Các dữ liệu dùng trong quản lý hàng tồn kho bán lẻ

Trong quản lý hàng tồn kho, cụ thể là quản lý bổ sung cho hàng tồn kho trong bán lẻ, các dữ liệu sau đây thường được lưu trữ, tính toán và sử dụng:

Lịch sử nhu cầu của SKU: Một hệ thống quản lý kho sẽ lưu các đơn đặt

hàng từ kho Mỗi đơn đặt hàng sẽ chứa các SKU được đặt và số lượng đặt Nhu cầu (demand) x(t) của một SKU tại thời điểm t thường được định nghĩa là tổng số lượngd(i,t) của SKU trong n(t) đơn hàng i trong thời điểm t:

x (t )=d(1 ,t )+…+d(n(t),t )

Thời điểm t có thể là năm, tháng, tuần, ngày, thậm chí giờ Lịch sử nhu cầu của một SKU là một chuỗi thời gian (time series) các x(t) với 1 <= t <= N N là thờiđiểm cuối cùng trong lịch sử, thường là thời điểm ngay trước thời điểm hiện tại.

Dữ liệu này được dùng chủ yếu cho dự báo nhu cầu (demand forecast) và là dữ liệu chính trong đề tài này.

Nhu cầu hiện tại của SKU: Nhu cầu x(t) với t = N + 1 được gọi là nhu cầu

hiện tại (demand-to-date) Nhu cầu này sẽ thay đổi khi có những đơn hàng mới trong thời điểm hiện tại Dữ liệu này có ích để xác định độ chính xác của dự báo đã làm cho thời điểm hiện tại.

Lịch sử nhu cầu khuyến mãi của SKU: Là một chuỗi thời gian các nhu cầu

xp(t) của SKU ở các thời điểm t khi có các chương trình khuyến mãi hay chiêu thị diễn ra Đi kèm là tỉ lệ thời gian chương trình khuyến mãi diễn ra p(t) trong thời điểm t Dữ liệu này có ích khi việc dự báo nhu cầu cần tích hợp ảnh hưởng của các chương trình khuyến mãi.

Lịch sử nhu cầu trả hàng của SKU: Là một chuỗi thời gian các số lượng

Trang 14

trả về xr(t) của SKU ở các thời điểm t SKU có thể bị trả về do hỏng hóc, sai sót khi lấy hàng,… Dữ liệu này được dùng để loại bỏ ảnh hưởng của hàng bị trả trong lịch sử nhu cầu.

Lịch sử nhu cầu đặt trước của SKU: Là một chuỗi thời gian các số lượng

đặt trước xa(t) của SKU ở các thời điểm t > thiện tại Dữ liệu này được dùng để điều chỉnh các nhu cầu tương lai trong dự báo.

Lịch sử thời gian bổ sung của SKU: Là danh sách các thời gian để giao và

nhập kho (lead time) của các lần bổ sung SKU Dữ liệu này được dùng để dự báo thời gian bổ sung.

Các dữ liệu kinh tế vĩ mô: Khi dự báo, ta có thể sử dụng các dữ liệu kinh tế

vĩ mô như tăng trưởng GDP, giá dầu, chỉ số niềm tin tiêu dùng,… để tích hợp ảnh hưởng của điều kiện kinh tế.

Trang 15

Chương 2: DỰ BÁO HÀNG TỒN KHO

2.1Tổng quan về dự báo hàng tồn kho

Dự báo hàng tồn kho bao gồm dự báo nhu cầu (demand forecasting) và dự báo thời gian bổ sung (lead time forecasting) Trong đề tài này, ta sẽ tập trung vào dự báo nhu cầu Dự báo nhu cầu là một bài toán dự báo chuỗi thời gian Ta ước tínhnhu cầu x(t) của các SKU ở các t > thiện tại Tùy vào lượng dữ liệu đang có, có hai phương pháp dự báo nhu cầu:

Dự báo định lượng: Là sử dụng các số liệu quá khứ để dự báo tương lai Ta

có thể mô hình hóa bài toán này như sau:

Dự báo định tính: Là sử dụng kiến thức miền của các chuyên gia để phán

đoán tương lai Ta dùng phương pháp này khi không có đủ số liệu để dự báo định lượng ở độ chính xác chấp nhận được Dự báo nhu cầu của một sản phẩm mới, sự gia nhập của một đối thủ mới vào thị trường hay các thay đổi mới trong điều kiện thị trường và kinh tế là một số trường hợp mà ta không có đủ hoặc hoàn toàn không có số liệu quá khứ để dự báo định lượng Phương pháp này cũng có thể được dùng để điều chỉnh dự báo định lượng trước các sự kiện mới Dự báo định tính mang tính chủ quan và có các hạn chế Tuy nhiên, có các cách tiếp cận có hệ thống và khoa học để giảm thiểu các hạn chế này và cải thiện độ chính xác.

Trang 16

2.2Các dạng của chuỗi thời gian nhu cầu

Chuỗi thời gian nhu cầu của một SKU có các hình dạng điển hình của một chuỗi thời gian:

Dạng ngang (horizontal): Nhu cầu chỉ biến động nhẹ quanh một mức nhất

định mà không có xu hướng hay mùa Trung bình của nhu cầu khá ổn định Đồ thị nằm ngang Gọi a là nhu cầu trung bình, có thể mô tả hình dạng này như sau:

x (t )=a

Xu hướng (trend): Nhu cầu tăng hay giảm dần theo thời gian Đồ thị có thể

(nhưng không nhất thiết) là một đường thẳng có độ dốc b và cắt trục tung ở a Có thể mô tả hình dạng này như sau:

x (t )=a+bt

Mùa vụ (seasonal): Nhu cầu biến động lặp lại theo mùa Đồ thị dao động

lên xuống với chu kì khá cố định Gọi a, b như phương trình xu hướng và r(t) là hệ số mùa ở thời điểm t, có thể mô tả hình dạng này như sau:

x (t )=(a+bt )r (t)

r(t) = 1 nếu không có ảnh hưởng mùa, r(t) > 1 nếu ảnh hưởng mùa làm x(t) cao hơn xu hướng, r(t) < 1 nếu ảnh hưởng mùa làm x(t) thấp hơn xu hướng.

Chu kỳ (cyclic): Nhu cầu còn có thể biến động tăng giảm với tần suất không

cố định gây ra bởi các điều kiện kinh tế như suy thoái, bùng nổ, và thường liên quan đến chu kì kinh doanh (business cycle) Thời gian của các biến động này thường tối thiểu là 2 năm.

Trong thực tế, chuỗi thời gian nhu cầu sẽ có sự hiện diện của tất cả các hình dạng này Giá trị x của một chuỗi thời gian tại thời điểm t có thể được phân rã thànhcác thành phần như sau:

x=xtrend −cycle+xseason+xresidual

Với xtrend-cycle là thành phần xu hướng-chu kì, xseason là thành phần mùa vụ,

Trang 17

xresidual là thành phần còn lại (biến động ngẫu nhiên và từ các yếu tố không được xét).Tùy vào khối lượng bán (sales volume) mà hình dạng nào sẽ phổ biến hơn Nếu khối lượng thấp, hình dạng ngang thường sẽ mạnh hơn Nếu khối lượng trung bình hay cao thì thường sẽ có tất cả các dạng trên.

Hình 2.1 Chuỗi thời gian có mùa vụ và chu kỳ

Hình 2.2 Chuỗi thời gian có mùa vụ và xu hướng

Trang 18

2.3Phân tích nhu cầu

Để dự báo chuỗi thời gian nhu cầu của một SKU, trước hết ta cần thu thập chuỗi thời gian nhu cầu quá khứ của SKU đó (như đã định nghĩa ở mục 1.5) Sau đó, ta cần phân tích bằng các phương pháp số học và trực quan (dùng các loại đồ thị) Vì một chuỗi thời gian thường sẽ xuất hiện nhiều hình dạng, ta có thể dùng các kỹ thuật như phân rã STL (Phân tích mùa vụ-xu hướng bằng LOESS) để tách mỗi dạng ra thành một đồ thị để có thể thấy rõ xu hướng, mùa vụ, và các biến động bất thường hơn.

Trang 19

Hình 2.3 Phân rã chuỗi thời gian dùng STL để phân tích xu hướng, mùa vụ và biếnđộng bất thường.

Khi phân rã bằng STL, ta tính được các thông số sau:

Độ mạnh xu hướng (từ 0 là không có xu hướng đến 1 là chỉ có xu hướng):

Trang 20

hướng tại thời điểm t.

Ngoài ra, còn có các thông số như thời điểm mạnh mùa nhất, thời điểm yếu mùa nhất, độ gai của thành phần còn lại, độ tuyến tính và độ cong của xu hướng

Ta cũng có thể phân tích hàm tự tương quan (ACF) của chuỗi thời gian để xác định xu hướng và mùa vụ:

t =k+1T

(yt− ´y)( yt−k− ´y )

t =1T

Với yt là giá trị chuỗi tại thời điểm t, ´y là giá trị trung bình của chuỗi Trong đồ thị ACF, các cột càng xa càng giảm biểu thị xu hướng, các cột cao tại các điểm cách đều biểu thị mùa vụ.

Hình 2.4 Đồ thị ACF của một chuỗi thời gian tháng có xu hướng và mùa vụ

Các thông số xác suất thống kê truyền thống như trung bình (mean), trung vị (median), các bách phân vị (percentile),… cũng có ích khi phân tích chuỗi thời gian.

2.4Các mô hình dự báo nhu cầu

Sau khi phân tích dữ liệu xong, ta bắt đầu chọn và khớp một mô hình dự báo với chuỗi thời gian quá khứ Có rất nhiều mô hình đã được đề ra và áp dụng vào dự báo chuỗi thời gian Cả các kỹ thuật xác suất thống kê truyền thống, máy học và họcsâu đều đã được sử dụng Sau đây là một số mô hình phổ biến:

Hồi quy tuyến tính (linear regression): Ta có các loại mô hình hồi quy

tuyến tính và hồi quy phi tuyến trong xác suất thống kê truyền thống.

Trang 21

Trung bình trượt (moving average): Ta có các mô hình như Tự hồi quy

Kết hợp Trung bình trượt (Autoregresive Integrated Moving Average hay ARIMA) và biến thể hỗ trợ mùa vụ Tự hồi quy Kết hợp Trung bình trượt Mùa vụ (Seasonal ARIMA hay SARIMA).

Làm mịn lũy thừa (exponential smoothing): Ta có mô hình Holt-Winters

và các mô hình ETS.

Hồi quy động (dynamic regression): Là các mô hình kết hợp hồi quy tuyến

tính và trung bình trượt Chúng có thể tích hợp không chỉ các giá trị nhu cầu quá khứ mà còn các giá trị có ảnh hưởng khác như các chỉ số kinh tế, thời tiết, nhu cầu của các SKU khác,…

Học máy (machine learning): Gần đây, các mô hình học máy như cây

quyết định (decision tree), rừng ngẫu nhiên (random forest), máy vector hỗ trợ (support vector machine), gradient boosting,… ngày càng được dùng nhiều hơn Các mô hình này có thể nắm bắt các đặc điểm, hình dạng phức tạp và không hiển nhiên mà các mô hình truyền thống trên khó hoặc không làm được Để khai thác khối lượng dữ liệu ngày càng lớn, các mô hình học sâu như mạng nơ-ron hồi quy (Recurrent Neural Network hay RNN) và các biến thể của nó như bộ nhớ dài-ngắn hạn (Long Short-Term Memory hay LSTM) cũng đã được áp dụng vào dự báo chuỗi thời gian.

Mỗi mô hình có các đặc thù, ưu nhược điểm và tính chất dữ liệu cần thiết để hiệu quả khác nhau Mỗi mô hình cũng có các tham số mà ta cần chọn để khớp được dữ liệu quá khứ nhưng không quá khớp làm mất tính tổng quát Ta cần phân tích dữ liệu kĩ để chọn mô hình và tham số tốt nhất cho việc dự báo.

2.5Đánh giá mô hình dự báo nhu cầu

Sau khi đã chọn và xây dựng một mô hình dự báo, ta cần đánh giá hiệu suất/độ chính xác của nó khi đã có dữ liệu thật cho các thời điểm được dự báo Có rất nhiều độ đo khác nhau để đánh giá các mô hình Với p(t) = xdự báo(t) và a(t) = x(t)

Trang 22

thật, một số độ đo hay dùng là:

Hệ số biến thiên (Coefficient of Variation hay Cov):

Cov=σp (N)

Với σ là độ lệch chuẩn của các sai số e(t) = p(t) – a(t) tại các thời điểm t.

p(N ) là nhu cầu dự báo ở thời điểm gần đây nhất N.

Sai số tuyệt đối trung bình (Mean Absolute Error hay MAE):

|p (t )−a(t)|

Sai số toàn phương trung bình (Mean Squared Error hay MSE):

(log log( p (t )+1)−log log(a (t)+1))2

Dựa vào độ đo và đồ thị so sánh nhu cầu thật-dự báo, ta điều chỉnh các tham số của mô hình để cải thiện độ chính xác.

Ta có thể đánh giá mô hình một cách chính xác hơn dùng kỹ thuật kiểm chứng chéo (cross-validation) Phân chuỗi thời gian ra thành nhiều nhóm, mỗi nhómgồm một chuỗi thời gian để huấn luyện và một chuỗi thời gian nằm sau nó để đánh

Trang 23

giá Huấn luyện và đánh giá mô hình trên mỗi nhóm rồi tổng hợp kết quả lại Kỹ thuật này giúp tránh tình trạng quá khớp và đảm bảo mô hình có tính tổng quan khi ta thực hiện điều chỉnh tham số.

Hình 2.5 Minh họa việc tách chuỗi thời gian trong kiểm chứng chéo.

2.6Dự báo nhu cầu cho nhiều SKU

Để dự báo nhu cầu của nhiều SKU, có hai cách tiếp cận là từ trên xuống và từ dưới lên:

Từ dưới lên (bottom-up): Ta đơn giản là tiến hành dự báo chuỗi thời gian

nhu cầu của từng SKU theo các phương pháp đã trình bày ở mục 2.4.

Từ trên xuống (top-down): Cộng nhu cầu xi(t) của các SKU i trong một nhóm m SKU tại các thời điểm t lại để tạo một chuỗi thời gian tổng nhu cầu x(t):

x (t )=

i=1m

Trang 24

t =1N

x (t )

Sau đó, tính nhu cầu của SKU i từ tổng nhu cầu như sau:

xi( N +1)=pix (N +1)

2.7Dự báo tổng nhu cầu của các nhóm SKU

Ngoài dự báo nhu cầu cho từng SKU, ta còn có thể dự báo tổng nhu cầu của nhiều SKU trong một nhóm nào đó Để thực hiện, ta có thể dự báo nhu cầu của từngSKU trong một nhóm rồi cộng lại để có tổng nhu cầu tương lai (phương pháp từ dưới lên hay bottom-up) hoặc tính các tổng nhu cầu quá khứ và dự báo từ chúng (phương pháp từ trên xuống hay top-down) Ta hay tính tổng nhu cầu của các nhóm SKU sau:

Sản phẩm (product): Các SKU của cùng một sản phẩm.

Họ sản phẩm (product family): Các SKU của các sản phẩm liên quan với

nhau, được sản xuất bởi cùng một công ty dưới cùng một thương hiệu.

Dòng sản phẩm (product line): Các SKU của các sản phẩm có liên quan

chặt chẽ với nhau vì chúng hoạt động theo cách tương tự và được bán cho cùng mộtnhóm khách hàng.

Nhóm sản phẩm (product group): Các SKU của các sản phẩm cùng danh

Hỗn hợp sản phẩm (product mix): Các SKU của cùng một doanh nghiệp.Cửa hàng (store): Các SKU tại một cửa hàng.

Vùng địa lý (geographical region): Các SKU tại một vùng địa lý như thành

phố, tỉnh, bang, quốc gia, châu lục,…

Trang 25

2.8Dự báo nhu cầu trong lĩnh vực bán lẻ hàng điện tử

Khi dự báo nhu cầu cho các SKU trong lĩnh vực bán lẻ hàng điện tử, cần chúý đến những đặc thù của hàng điện tử Một số đặc thù của việc dự báo nhu cầu trongbán lẻ hàng điện tử là:

Ảnh hưởng của nhu cầu 1-3 tháng trước: Nhu cầu của một tới ba tháng

trước tháng đang xét có sự ảnh hưởng đáng kể đến nhu cầu của tháng đang xét.

Lịch sử nhu cầu thường ngắn: Vì các doanh nghiệp thường xuyên ra mắt

các sản phẩm điện tử mới, lịch sử nhu cầu của các mặt hàng này thường ngắn gây khó khăn trong dự báo Một số phương pháp để giải quyết vấn đề này là sử dụng lịch sử nhu cầu của các sản phẩm đời cũ tương tự, tích hợp các mô hình dự báo của nhiều nhóm sản phẩm ngắn hạn,

Ảnh hưởng của thông số, thương hiệu và ngày ra mắt: Như đã trình bày ở

mục 1.3, các yếu tố liên quan đến thông số, thương hiệu và ngày ra mắt có ảnh hưởng mạnh hơn đến nhu cầu của hàng điện tử so với các loại hàng khác Các thôngtin này sẽ có ích với các mô hình dự báo.

Chương 3: TỔNG QUAN VỀ MỘT SỐ MÔ HÌNH DỰ BÁOTRUYỀN THỐNG

3.1Hồi quy tuyến tính

Hồi quy tuyến tính là một phương pháp thống kê được sử dụng để dự đoán

Trang 26

một biến phụ thuộc liên tục (mục tiêu) dựa trên một hoặc nhiều biến độc lập (đặc trưng đầu vào) Kỹ thuật này giả định mối quan hệ tuyến tính giữa biến phụ thuộc và biến độc lập, tức là biến phụ thuộc thay đổi tỷ lệ thuận với sự thay đổi của biến độc lập Nói cách khác, hồi quy tuyến tính được sử dụng để xác định mức độ mà một hoặc nhiều biến có thể dự đoán giá trị của biến phụ thuộc.

Mô hình hồi quy tuyến tính là hàm số f có dạng:y = w0 + w1 x1 + w2 x2 + + wn xn

- Trong đó:

● 𝑦 là biến phụ thuộc (dependent variable)

● 𝑥1, 𝑥2, 𝑥𝑛 là các biến độc lập (independent variable) ● 𝑤1 ,𝑤2, ,𝑤n là những tham số mô hình.

Hình 3.1 Mô hình hồi quy tuyến tính

Phương trình hồi quy tuyến tính có rất nhiều ứng dụng trong thực tiễn và là một trong những lớp mô hình đặc biệt quan trọng trong machine learning Xét đến

Trang 27

một vài ví dụ tiêu biểu, chẳng hạn như về các dự báo trên truyền hình về chỉ số lạm phát, tốc độ tăng trưởng GDP của quốc gia hay dự báo về nhu cầu thị trường của một doanh nghiệp để chuẩn bị kế hoạch sản xuất kinh doanh Trong tài chính, chúngta có thể dự báo giá chứng khoán và các chỉ số tài chính dựa trên hồi qui tuyến tính.

Hồi quy tuyến tính là một công cụ tuyệt vời để phân tích mối quan hệ giữa các biến nhưng nó không được khuyến khích cho hầu hết các ứng dụng thực tế vì nóđơn giản hóa quá mức các vấn đề trong thế giới thực bằng cách giả định mối quan hệ tuyến tính giữa các biến.

3.2Tự hồi quy kết hợp trung bình trượt mùa vụ

hình dự báo chuỗi thời gian linh hoạt và được sử dụng rộng rãi Đây là phần mở rộng của mô hình ARIMA không theo mùa, được thiết kế để xử lý dữ liệu theo các mẫu theo mùa SARIMA nắm bắt cả sự phụ thuộc ngắn hạn và dài hạn trong dữ liệu, khiến nó trở thành một công cụ mạnh mẽ để dự báo Nó kết hợp các khái niệm về mô hình tự hồi quy (AR), mô hình tích hợp (I) và đường trung bình trượt (MA) với các thành phần theo mùa.

SARIMA hoạt động bằng cách mô hình hóa liên kết giữa các giá trị trong quá khứ và hiện tại của chuỗi thời gian và nhận dạng các mẫu trong dữ liệu

SARIMA sử dụng nhiều mô hình Tự hồi quy (AR) và trung bình trượt (MA), cũng như sự khác biệt, để nắm bắt xu hướng và tính thời vụ trong dữ liệu.

Trang 28

Hình 3.2 Mô hình SARIMA

Biểu diễn toán học của SARIMA như sau:

(1−ϕ1B)(1−ϕ1Bs)(1−B )(1−Bs)yt=(1+θ1B)(1+Θ1Bs)εt

Trong đó:

yt là chuỗi thời gian được quan sát tại thời gian t.

● B là toán tử dịch ngược, đại diện cho toán tử độ trễ.

ϕ1là hệ số tự hồi quy không theo mùa.● θ1 là hệ số trung bình trượt không theo mùa.● Θ1là hệ số trung bình trượt theo mùa.

● s là khoảng thời gian một mùa.

εt là sai số nhiễu trắng tại thời điểm t.

SARIMA được ứng dụng trong nhiều lĩnh vực khác nhau, chẳng hạn như: dự

Ngày đăng: 15/05/2024, 09:24

Tài liệu cùng người dùng

Tài liệu liên quan