1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn thạc sĩ Hệ thống thông tin quản lý: Dự báo nhu cầu sản xuất dựa vào dữ liệu quá khứ

77 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trang 1

ĈҤI HӐC QUӔC GIA TP HCM 75ѬӠ1*ĈҤI HӐC BÁCH KHOA

Trang 2

&Ð1*75Î1+ĈѬӦC HOÀN THÀNH TҤI 75ѬӠ1*ĈҤI HӐC BÁCH KHOA ±Ĉ+4*-HCM

Xác nhұn cӫa Chӫ tӏch Hӝi ÿӗng ÿiQh giá LV và 7Uѭӣng Khoa quҧn lý chuyên ngành sau khi luұn văn ÿã ÿѭӧc sӱa chӳa (nӃu có)

PGS.TS TRҪN MINH QUANG

Trang 3

,7Ç1Ĉӄ TÀI: Dӵ báo nhu cҫu sҧn xuҩt dӵa vào dӳ liӋu quá khӭ

II NHIӊM VӨ VÀ NӜI DUNG:

x 7uPKLӇXYӅGӵEiRFKXӛLWKӡLJLDQYjFiFSKѭѫQJSKiSP{KuQKGӵEiRGӳOLӋXFKXӛLWKӡLJLDQ

x ThXWKұSGӳOLӋXYjEiQKjQJFӫDF{QJW\GѭӧFSKҭPWӯÿӃQ

x ӬQJGөQJFiFP{KuQKGӵEiRÿmWuPKLӇXYj3\WKRQÿӇGӵEiRWUrQGӳOLӋXÿmWKXWKұSÿѭӧF

x ĈiQKJLiNӃWTXҧNLӃQQJKӏÿӅ[XҩWQӃXFy III NGÀY GIAO NHIӊM VӨ: 24/02/2020

IV NGÀY HOÀN THÀNH NHIӊM VӨ: 21/06/2020

Trang 4

LӠI CҦ0Ѫ1

LӡLÿҫu tiên tôi xin chân thành cҧPѫQWKҫy PGS TS Phҥm TrҫQ9NJÿmGjQKQKLӅu thӡi gian và tâm huyӃWKѭӟng dүQÿӏQKKѭӟng tôi trong thӡi gian thӵc hiӋn luұQYăQtӕt nghiӋp

Tôi xin gӱi lӡi cҧPѫQÿӃn quý thҫ\F{ÿmJLҧng dҥy và truyӅQÿҥt nhӳng kiӃn thӭc hӳu ích cho tôi trong suӕt thӡi gian tham gia hӑc tұp tҥLWUѭӡQJĈҥi hӑc Bách Khoa thành phӕ Hӗ Chí Minh

Tôi xin gӱi lӡi cҧPѫQÿӃn quý công ty Gѭӧc phҭm ÿmFKLDVӁ thông tin, nguӗn lӵc giúp tôi thӵc hiӋn luұQYăQQj\

CuӕLFQJW{L[LQFiPѫQÿӃQJLDÿuQKYjbҥQEqÿmÿӝQJYLrQJL~Sÿӥ tôi trong quá trình thӵc hiӋn luұQYăQQj\

Trang 5

TÓM TҲT LUҰ19Ă1

Ngày nay, dӵ báo nhu cҫu sҧn xuҩt rҩt hӳu ích cho nhà sҧn xuҩW[iFÿӏnh chính xác tӹ lӋ cung ӭng hàng hóa tӕLѭXQKҩt, tӯ ÿy[k\Gӵng kӃ hoҥch dӵ trӳ hàng tӗn kho và kӃ hoҥch mua vұt liӋXWѭѫQJӭQJÿӇ giӳ mӭc sҧn xuҩt ӣ mӭc vӯDÿӫ, cҳt giҧm chi phí MөF ÿtFK Fӫa luұQ YăQ WuP KLӇX SKѭѫQJ SKiS Gӵ EiR JL~S [iF ÿӏnh sӕ Oѭӧng sҧn phҭn cҫn sҧn xuҩWWURQJWѭѫQJODL

3KѭѫQJSKiSGӵ báo trong luұQYăQOjSKѭѫQJSKiSÿӏnh Oѭӧng

LuұQYăQQj\ WKӵc hiӋn nhҵm mөFÿtFKWuP UDP{KuQK Gӵ báo dӳ liӋu chuӛi thӡi gian tӕLѭXQKҩt cӫa mô hình SARIMA và mô hình LSTM

Trong luұQYăQQj\WiFJLҧ FNJQJWuPKLӇu và sӱ dөng ngôn ngӳ 3\WKRQÿӇ bên cҥnh viӋc nghiên cӭu các lý thuyӃWÿӇ tiӃn hành thӵc nghiӋp vào dӳ liӋu thu thұSÿѭӧc tҥi công ty sҧn xuҩWGѭӧc phҭm

ĈiQKJLiYjÿѭDUDNӃt luұn tӯ nghiên cӭu thӵc nghiӋm vӅ mô hình dӵ báo nào cho kӃt quҧ tӕLѭXQKҩt KӃt quҧ này sӁ OjWѭOLӋu tham khҧo hӳu hiӋXFKRFiFÿѫQYӏ sҧn xuҩWWURQJOƭQK vӵFGѭӧc phҭPFNJQJQKѭFyWKӇ mӣ rӝng cho viӋc phân tích và dӵ báo dӳ liӋu chuӛi thӡi gian bҩt kǤ

Trang 6

ABSTRACT

Nowadays, forecasting of production demand is very useful for manufacturers to accurately determine the ratio of the optimum supply of goods, thereby building inventory plans and purchasing materials of plans corresponding to keeping production at a sufficient level, to cut down the costs The purpose of the dissertation is to find out predictive methods to help the determination of the number of products to be produced in the future

The predictive method in the dissertation is the quantitative method

This dissertation aims to figure out the prediction model of the most optimal time series data of the SARIMA model and LSTM model

In this dissertation, the author also learns and uses the Python language, in addition to studying theories to conduct applying to on collected data at the pharmaceutical manufacturing company

Evaluate and make conclusions from experimental research on which predictive model gives the most optimal results This result will be a useful reference for manufacturers in the pharmaceutical sector and can be extended for the analysis and prediction of any time series data

Trang 7

LӠI CAM Ĉ2$1

7{L[LQFDPÿRDQUҵng toàn bӝ nӝi dung trong luұQYăQQj\GRW{LWӵ nghiên cӭu và thӵc hiӋn Sӕ liӋu tôi sӱ dөng trong luұQYăQQj\ÿѭӧc sӵ ÿӗng ý cӫa doanh nghiӋp sӣ hӳu nó và tôi có cam kӃt không tiӃt lӝ dӳ liӋu chi tiӃt và mã hóa thông tin nhҥy cҧPÿӇ không ҧQKKѭӣQJÿӃn kӃt quҧ kinh doanh cӫa doanh nghiӋp sӣ hӳu Ngoài

ra tôi ÿѭӧc phép công bӕ sӕ liӋu tәng hӧSÿmPmKyDYjNӃt quҧ tәng hӧp tӯ luұn

YăQQj\

NӃu có chӛ QjRNK{QJÿ~QJQKѭÿmQrQWUrQW{L[LQKRjQWRjQFKӏu trách nhiӋm 1JѭӡLFDPÿRDQ

Phan ThӃ Thành

Trang 8

4 Thu thұp, tìm hiӇXYjÿiQKJLiGӳ liӋu 4

5 Giӟi hҥn nghiên cӭu cӫDÿӅ tài 6

&+ѬѪ1* &Ѫ6Ӣ LÝ THUYӂT VÀ CÁC CÔNG TRÌNH CÓ LIÊN QUAN 7

&ѫVӣ lý thuyӃt 7

1.1 Dӵ báo nhu cҫu sҧn xuҩt 7

1.2 Chuӛi thӡi gian (time series) 7

1.3 Các mô hình dӵ báo chuӛi thӡi gian 8

1.3.1 Mô hình hӗi quy 8

1.3.2 Mô hình tӵ hӗi quy (AR) 9

0{KuQKWUXQJEuQKWUѭӧt (MA) 9

1.3.4 Mô hình ARIMA 10

1.3.5 Mô hình SARIMA 10

Trang 9

3KѭѫQJSKiSOXұn Box-Jenkins: 10

3KѭѫQJSKiSKӑc máy mҥQJQѫ-ron nhân tҥo 11

&iFF{QJWUuQKFyOLrQTXDQÿӃQÿӅ tài 13

2.1 Ӭng dөng mҥQJQѫ-ron dӵ báo chuӛi thӡi gian 13

2.2 Dӵ báo chuӛi thӡi gian mӡ dӵa trên ngӳ QJKƭD 13

2.3 Sӱ dөng mô hình máy hӑFÿӇ dӵ báo doanh sӕ bán hàng 14

2.4 Sӱ dөng máy hӑFÿӇ dӵ báo vӅ thӏ WUѭӡng chӭng khoán 14

2.5 Sӱ dөQJ690ÿӇ dӵ báo chuӛi thӡi gian tài chính 14

2.6 Ӭng dөng kӻ thuұt mҥQJQѫ-ron nhân tҥo ÿӇ dӵ báo 15

2.7 Tәng hӧp nhiӅXSKѭѫQJSKiSGӵ báo 15

3 KӃt luұn 15

&+ѬѪ1*  +,ӊN TRҤNG, YÊU CҪU, GIҦI PHÁP THӴC HIӊN Hӊ THӔNG 17

1 HiӋn trҥng hӋ thӕng thông tin tҥLF{QJW\Gѭӧc 17

2 Yêu cҫu cӫa hӋ thӕng 17

3 Giҧi pháp thӵc hiӋn dӵ báo 19

3.1 Trích xuҩt và phân tích dӳ liӋu 19

3.3 Xây dӵng mô hình dӵ báo SARIMA bҵng Python 23

3.3.1 Chuҭn bӏ dӳ liӋXÿҫu vào 23

;iFÿӏnh mô hình 24

3.3.3 Huҩn luyӋn (training) mô hình 25

3.3.4 Dӵ EiRYjÿiQKJLiVDLVӕ dӵ báo 25

Trang 10

3.4 Xây dӵng mô hình dӵ báo LSTM bҵng Python 25

3.4.1 Chuҭn bӏ dӳ liӋXÿҫu vào 25

3.4.2 Tҥo và luҩn luyӋn mô hình 27

3.4.3 Tҥo dӳ liӋu kiӇm tra 28

3.4.4 Dӵ EiRYjÿiQKJLiVDLsӕ 28

3.5 Phân tích và dӵ báo theo nhóm thuӕc 29

3.5.1 Trӵc quan hóa sӕ liӋu 29

3.5.2 Sӱ dөng mô hình SARIMA 32

a Tìm mô hình cho dӳ liӋu vӅ nhóm da liӉu 32

b KӃt quҧ dӵ báo nhóm da liӉu 33

a Tìm mô hình dӵ báo cho dӳ liӋu 1 sҧn phҭm thuӕc 42

b KӃt quҧ dӵ báo sҧn phҭm thuӕc 43

4 Hҥn chӃ YjKѭӟng nghiên cӭu tiӃp theo 50

TÀI LIӊU THAM KHҦO 52

PHӨ LӨC A: CODE PYTHON 55

A.1 Trӵc quan hóa dӳ liӋu nhóm 55

A.2 Trӵc quan hóa sӕ liӋu 1 sҧn phҭm thuӕc 57

A.3 Dӵ báo theo nhóm thuӕc ± mô hình SARIMA 58

Trang 11

A.4 Dӵ báo theo 1 sҧn phҭm thuӕc ± Mô hình SARIMA 59

A.5 Dӵ báo theo nhóm thuӕc ± Mô hình LSTM 60

A.6 Dӵ báo theo 1 sҧn phҭm thuӕc ± Mô hình LSTM 62

PHӨ LӨC B: CÁC THUӜC TÍNH CӪA LӞP SARIMAXRESULTS [25] 65

Trang 12

DANH MӨC HÌNH

Hình 3.6ѫÿӗ quan hӋ tәng quát hӋ thӕng thông tin tҥLF{QJW\Gѭӧc Hình 3.2 KiӃn trúc hӋ thӕng dӵ báo

Hình 3.3 Giao diӋn cӫa hӋ thӕng

Hình 3.4 Trӵc quan hóa dӳ liӋu bán hàng cӫa công ty Hình 3.5: BiӇXÿӗ sӕ Oѭӧng bán tҩt cҧ các mһt hàng Hình 3.6: BiӇXÿӗ sӕ Oѭӧng bán nhóm thuӕc vӅ Da liӉu Hình 3.7: BiӇXÿӗ sӕ Oѭӧng bán nhóm thuӕc vӅ Tiêu hóa Hình 3.8 KӃt quҧ tìm mô hình theo nhóm da liӉu

Hình 3.9 các thông sӕ kӃt quҧ dӵ báo theo nhóm da liӉu, mô hình 1 Hình 3.10 Ĉӗ thӏ kӃt quҧ dӵ báo nhóm da liӉu, mô hình 1

Hình 3.11 Các thông sӕ kӃt quҧ dӵ báo theo nhóm da liӉu, mô hình 2 Hình 3.12 Ĉӗ thӏ kӃt quҧ dӵ báo nhóm da liӉu, mô hình 2

Hình 3.13: Tóm tҳt (summary) mô hình hӑc máy LSTM

Hình 3.14: kӃt quҧ dӵ báo sҧn phҭm kháng sinh nhҽ theo mô hình LSTM Hình 3.15: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm ALPHA

Hình 3.16: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm B1-B6-B12 Hình 3.17: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm kháng sinh nhҽ

Hình 3.18: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm thuӕc giҧPÿDXKҥ sӕt Hình 3.19: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm CALCIUM

Hình 3.20: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm kháng sinh mҥnh Hình 3.21: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm viêm khӟp dҥng thҩp Hình 3.22 KӃt quҧ tìm mô hình theo sҧn phҭm kháng sinh nhҽ

Hình 3.23 Các thông sӕ kӃt quҧ dӵ báo theo sҧn phҭm kháng sinh nhҽ Hình 3.24 KӃt quҧ dӵ báo sҧn phҭm kháng sinh nhҽ theo mô hình SARIMA Hình 3.25: Tóm tҳt (summary) mô hình hӑc máy LSTM

Hình 3.26: KӃt quҧ dӵ báo sҧn phҭm kháng sinh nhҽ theo mô hình LSTM

Trang 13

DANH MӨC BҦNG SӔ LIӊU

Bҧng 3.1 Phân tích sӕ liӋu cӫa công ty

Bҧng 3.2 KӃt quҧ ÿiQKJLiVDLVӕ theo nhóm da liӉu Bҧng 3.3 KӃt quҧ ÿiQKJLiVDLVӕ theo sҧn phҭm Bҧng 4.1 Thӡi gian chҥy theo mô hình và loҥi dӳ liӋu

Trang 14

&+ѬѪ1* GIӞI THIӊ8Ĉӄ TÀI 1 Lý do chӑn ÿӅ tài

Trong phân hӋ hoҥFKÿӏnh nhu cҫu nguyên vұt liӋu (MPR) cӫa hӋ thӕng ERP thì dӵ báo nhu cҫu sҧn xuҩt là quan trӑng nhҩt và tӯ ÿyFyWKӇ dӵ toán sӕ Oѭӧng nguyên vұt liӋu sҧn xuҩt, và tӕL ѭX KyD Oѭӧng hàng tӗn kho mà vүn ÿiS ӭQJ ÿѭӧc nhu cҫu khách hàng

Trong sҧn xuҩt, rҩt nhiӅu hoҥW ÿӝQJ ÿѭӧc dӵa trên dӵ báo nhu cҫu sҧn xuҩt trong WѭѫQJODLQKѭNӃ hoҥch bán hàng, danh sӕ bán hàng, kӃ hoҥch thu mua nguyên vұt liӋu, tӗn kho, kӃ hoҥch tuyӇn dөng, huҩn luyӋQÿjRWҥo nhân sӵ mӟi

Dӵ EiRÿѭӧc dӵa trên dӳ liӋu quá khӭ, là mӝt trong nhӳQJSKѭѫQJSKiSGӵ báo phә biӃn nhҩt, lҩy dӳ liӋu quá khӭ ÿӇ ÿѭDUDGӵ EiRWѭѫQJODL7X\QKLrQSKѭѫQJSKiSnày lҥi bӓ qua các yӃu tӕ bên ngoài trong quá trình sҧn xuҩt dӵa trên sӕ Oѭӧng nhu cҫu trong nhӳng kǤ WUѭӟc

ĈӇ giӳ vӏ thӃ WUrQWKѭѫQJWUѭӡng, nhà sҧn xuҩt phҧi nhanh chóng thích ӭng vӟi thӏ WUѭӡng biӃQÿӝQJFNJQJQKѭOLrQWөFÿHPÿӃn nhӳng sҧn phҭm chҩWOѭӧng và dӏch vө tӕt nhҩWÿӃn khách hàng Vì vұy, hӑ cҫQÿӃn dӵ báo nhu cҫu sҧn xuҩWYjÿyFNJng là

lý do tôi chӑQÿӅ tài "Dӵ báo nhu cҫu sҧn xuҩt dӵa vào dӳ liӋu quá khӭ kӃt hӧp vӟi các yӃu tӕ bên ngoài có liên quan"

2 éQJKƭDNKRDKӑc và thӵc tiӉn

Dӵ báo nhu cҫu sҧn xuҩt giúp cho nhà sҧn xuҩW[iFÿӏnh chính xác tӹ lӋ cung ӭng hàng hóa tӕLѭXQKҩt là bao nhiêu, tӯ ÿy[k\Gӵng kӃ hoҥch dӵ trӳ hàng tӗn kho và kӃ hoҥch mua vұt liӋXWѭѫQJӭQJÿӇ giӳ mӭc sҧn xuҩt ӣ mӭc vӯDÿӫ, cҳt giҧm chi phí

+ѫQQӳa, dӵ báo nhu cҫXFNJQJJySSKҫQWăQJFѭӡng sӵ hӧp tác giӳa các bӝ phұn và trong suӕt quá trình sҧn xuҩt, chҷng hҥQQKѭEӝ phұn bán hàng và sҧn xuҩt

Nó cho phép nhà quҧn trӏ sҧn xuҩt kӃt hӧp các tình huӕng giҧ ÿӏnh trong kӃ hoҥch sҧn xuҩt cӫDPuQKYjÿѭDUDFiFKRҥWÿӝng thích hӧSÿӇ ÿҧm bҧo mөc tiêu sҧn xuҩt Các hoҥW ÿӝQJ ÿy ÿѭӧc bҳW ÿҫu tӯ sӕ liӋu dӵ toán, vì vұy dӵ ÿRiQ QKX Fҫu ҧnh Kѭӣng trӵc tiӃSÿӃn hiӋu suҩt cӫa công viӋc lұp kӃ hoҥch sҧn xuҩt và quҧn lý rҩt nhiӅu quy trình và hӋ thӕng trong doanh nghiӋSQKѭbán hàng, sҧn xuҩt, tài chính, cung ӭng và phân phӕi

Trang 15

3 MөFWLrXÿӕLWѭӧng và phҥm vi nghiên cӭu

Dӵ báo nhu cҫu sҧn xuҩt có doanh nghiӋp là bài toán khó hiӋQQD\FKѭDFySKѭѫQJpháp, mô hình tӕL ѭX ÿӇ giҧi quyӃt nó Ví dө ngày 13/07/2020 trang tin tӭc công nghӋ CNET.COM cӫD ÿѭD WLQ $SSOH ÿm Qӝp phҥt cho Samsung 950 triӋX ÿ{ YuNK{QJPXDÿӫ sӕ Oѭӧng tҩm nӅQ2/('QKѭFDPNӃWĈLӅu này xҧy ra là vì Apple dӵa trên báo nhu cҫu sҧn xuҩWYjÿһt mua sӕ Oѭӧng lӟn tҩm nӅn tӯ 6DPVXQJÿӇ ÿѭӧc Kѭӣng giá thҩp do mua sӕ Oѭӧng lӟQ7X\QKLrQWuQKKuQKEiQKjQJNK{QJQKѭNǤ vӑng GRÿҥi dӏch Corona nên $SSOHNK{QJPXDÿӫ sӕ Oѭӧng và phҧi chӏ phҥt

&iFWK{QJWLQÿһFWUѭQJWKѭӡQJGQJÿӇ dӵ báo nhu cҫu sҧn xuҩt:

x 'ӳOLӋXEiQKjQJWURQJTXiNKӭ

x TKD\ÿәLWKHRPa YөOѭӧQJKjQJEiQUDVӁQKLӅXKѫQKRһFtWKѫQYjRPӝWYjLWKӡLÿLӇPFөWKӇYjFyWtQKFKҩWOһSOҥLWKHRFKXNǤWKѭӡQJFKXNǤOjPӝWQăPQKѭQJFNJQJFyWKӇQJҳQKRһFGjLKѫQ

x 1ăQJOӵFFNJQJQKѭKҥQFKӃFӫDGRDQKQJKLӋSWURQJVҧQ[XҩWYtGөQKXFҫXVҧQ[XҩWEiQKWUXQJWKXWKiQJWӯJLӳDWKiQJÿӃQJLӳDWKiQJkPOӏFKOjKӝS7X\QKLrQQăQJOӵFVҧQ[XҩWWӕLÿDOjKӝSKҥQVӱGөQJOjWKiQJ 9u Yұ\ GRDQK QJKLӋS Fy WKӇ VҧQ [XҩW WUѭӟF YjL WKiQJ ÿӇ Gӵ SKzQJKjQJWӗQNKRÿӫEiQFKRPDWUXQJWKX

x 7uQKKuQKNLQKWӃYƭP{WӹJLiYjQJQJRҥLWӋ

x 7uQKKuQKWKLrQWDLGӏFKEӋQKKӓDKRҥQYtGө GӏFK&RURQDKҥQKiQӣPLӅQWUXQJ«

Tùy vào loҥi sҧn phҭm, nhu cҫu, [X Kѭӟng, mùa vө, ÿLӅu kiӋn kinh tӃ YL P{ Yƭmô« mà ta phҧi áp dөQJFiFSKѭѫQJSKiSP{KuQKGӵ báo phù hӧSÿӇ có sai sӕ dӵ báo nhӓ nhҩt

Tuy nhiên vì thӡi gian mà nguӗn lӵc hӳu hҥn, tôi chӍ giӟi hҥn phҥm vi nghiên cӭu cӫa luұQYăQOjdӳ liӋu bán hàng quá khӭ cӫa công ty sҧn xuҩWGѭӧc phҭm y tӃ và yӃu tӕ theo mùa vө

4 Thu thұp, tìm hiӇXYjÿiQKJLiGӳ liӋu

Trong quá trình thӵc hiӋn luұQ YăQ W{L ÿm ÿѭӧc phép sӱ dөng dӳ liӋu cӫa doanh nghiӋp vӅ sҧn xuҩWGѭӧc phҭm y tӃ trong thӡi gian tӯ QăPÿӃn nay Tuy nhiên tôi phҧi cam kӃt bҧo mұt dӳ liӋu chi tiӃW Yu ÿk\ Oj Gӳ liӋu bán hàng nӃu bӏ lӝ ra ngoài sӁ ҧQKKѭӣQJÿӃn kӃt quҧ kinh doanh cӫa công ty này

Trang 16

Dӳ liӋu thu thұS ÿѭӧc là dӳ liӋu bán hàng trong phân hӋ kӃ toán cӫa phҫn mӅm quҧn trӏ cӫa doanh nghiӋp Dӳ liӋu khoҧng 109 nghìn dòng MӛLQăPNKRҧQJÿӃn 22 nghìn dòng, mӛi dòng là chi tiӃt hàng hóa, sӕ Oѭӧng xuҩt, ngày xuҩt bán và các thông tin khác

7KHRÿӏQKQJKƭDGӳ liӋu time series, dӳ liӋu này là chuӛi sӵ kiӋQYjWKѭӟFÿRWKHRngày nên nó là dӳ liӋu time series

ĈӇ lӑc dӳ liӋu cho bài toán khai phá dӳ liӋu time series thì phҧLFyWѭѫQJÿӕLÿӫ ӣ FiFÿLӇm trong chuӛi thӭ tӵ thӡi gian

Công ty có trên 1100 hàng hóa chia thành 25 loҥi hàng hóa

Dӳ liӋu có rҩt nhiӅu hàng hóa chӍ kinh doanh thӡi gian nhҳn nên cҫn loҥi bӓ Tuy nhiên có 11 hàng hóa FyNLQKGRDQKWURQJÿӃn 12 tháng trong cҧ 7 QăPWURQJÿyQăPFKӍ WtQKWKiQJÿҫXQăP(toàn bӝ dӳ liӋXOjQăP 

Ngoài ra, khi xét theo loҥi hàng hóa thì FyQKyPFyÿӫ dӳ liӋXWURQJQăP Trӵc quan hóa dӳ liӋu bҵng power bi desktop

VӟLÿһt thù dӳ liӋu này, tôi quyӃWÿӏnh chӑQÿLӇm thӡi gian cho dӳ liӋu time series OjWKiQJQăPYjOӑc các hàng hóa ÿӫ 12 tháng ӣ tҩt cҧ FiFQăPWUӯ QăPFKӍ có 6 tháng

Trang 17

5 Giӟi hҥn nghiên cӭu cӫDÿӅ tài

Phҥm vi không gian: ÿӅ tài chӍ tìm hiӇu và dӵ báo vӅ các nhóm hàng và hàng hóa ÿѭӧc sҧn xuҩt tҥLF{QJW\Gѭӧc phҭm X (tác giҧ [LQÿѭӧc giҩXWrQÿӇ ÿҧm bҧo tính bҧo mұt) Ngoài ra vì thӡi gian có hҥn, tác giҧ mӟi chӍ tìm hiӇu và thӵc nghiӋm mô hình SARIMA và mô hình hӑc máy LSTM HiӋn nay còn có FiFP{KuQKQKѭmô hình véc-WѫWӵ hӗi quy (VAR), mô hình hiӋu chӍnh sai sӕ dҥng véc-Wѫ (Vector Error Correction Model - VECM) FNJQJFyWKӇ dӵ báo dӳ liӋu chuӛi thӡi gian tuy nhiên vì thӡi gian có hҥn, tác giҧ FKѭDWuPKLӇu kӏp Ngoài ra dӵ báo nhu cҫu sҧn xuҩt còn chӏu ҧQK Kѭӣng bӣi nhiӅu yӃu tӕ ngoҥi suy hay là các yӃu tӕ bên ngoài hӋ thӕng thông tin cӫDF{QJW\QKѭQJYuÿLӅu kiӋQFKѭDWKXWKұSÿӫ dӳ liӋu ngoҥLVX\QrQÿӅ WjLFKѭDÿѭDYjRP{KuQKGӵ báo

Phҥm vi thӡLJLDQÿӅ tài nghiên cӭu dӵa trên các dӳ liӋu dӳ liӋu lӏch sӱ bán hàng tӯ QăP ÿӃn nay

Trang 18

&+ѬѪ1* &Ѫ6Ӣ LÝ THUYӂT VÀ CÁC CÔNG TRÌNH CÓ LIÊN QUAN 1 &ѫVӣ lý thuyӃt

1.1 Dӵ báo nhu cҫu sҧn xuҩt

Dӵ báo doanh sӕ cho ta biӃt có bao nhiêu sҧn phҭm có khҧ QăQJ EiQ ÿѭӧc trong mӝt khoҧng thӡL JLDQ WѭѫQJ ODL 'ӵ báo doanh sӕ FKtQK [iF Oj ÿLӅu cҫn thiӃt cho mӝt doanh nghiӋp cho phép nó sҧn xuҩt sӕ Oѭӧng sҧn phҭm cҫn thiӃWYjRÿ~QJWKӡi ÿLӇPĈӕi vӟi bҩt kǤ doanh nghiӋp vӅ sҧn xuҩt nào, viӋFÿiQKJLiFiF[XKѭӟng thӏ WUѭӡng mӝWFiFKÿҫ\ÿӫ là rҩt cҫn thiӃt Mӝt cam kӃt vӅ phía bӝ phұn bán hàng và kӃ hoҥFKWѭѫQJODLFӫa toàn bӝ bӝ phұn sҧn xuҩt phө thuӝc vào dӵ báo này

1.2 Chuӛi thӡi gian (time series)

Theo Wikipedia (English): chuӛi thӡi gian là chuӛL FiF ÿLӇm dӳ liӋX ÿѭӧc lұp chӍ mөc theo thӭ tӵ thӡL JLDQ 7K{QJ WKѭӡng, mӝt chuӛi thӡi gian là mӝt chuӛL ÿѭӧc quan sát tҥLFiFÿLӇPFiFKÿӅu nhau theo thӡi gian, có thӇ là hàng ngày, hàng tháng, KjQJTXêKjQJQăP'RÿyQyOjPӝt chuӛi các dӳ liӋu thӡi gian rӡi rҥc

Ví dө vӅ chuӛi thӡi gian: sӕ liӋu chӭng khoán, sӕ liӋu tài chính kӃ toán, sӕ liӋu dӵ báo thӡi tiӃt, sӕ liӋu theo dõi sӕ QJѭӡi nhiӉm Covid-19

+uQKĈӗ thӏ minh hӑa mӝt chuӛi thӡi gian (Tәng sӕ ca nhiӉm Corona tҥi Mӻ) Chuӛi thӡi gian X vӟi các giá trӏ quan sát tҥi các thӡLÿLӇPÿѭӧc ký hiӋu là X1, X2, X«Xt«;n vӟi Xt là giá trӏ cӫa chuӛi X tҥi thӡLÿLӇm t

Trang 19

Các chuӛi thӡi gian vӃ kinh tӃ WKѭӡng có các tính chҩt: [2]

x 7tQK[XKѭӟQJGjLKҥQ

Tính chҩW Qj\ GQJ ÿӇ chӍ [X KѭӟQJ WăQJ KD\ JLҧm cӫD FiF ÿLӇm quan sát trong chuӛi thӡi gian Trӵc quan hóa dӳ liӋu chuӛi thӡi gian sӁ dӉ dàng thҩ\ [X Kѭӟng cӫa hình 1 là chuӛi thӡLJLDQFy[XKѭӟQJWăQJ9tGө dân sӕ ViӋW1DPFy[XKѭӟng WăQJ1KѭQJWӕFÿӝ WăQJGkQVӕ cӫa ViӋW1DPFy[XKѭӟng giҧm

x 7tQKPDYө

Tính chҩWQj\ÿӇ chӍ [XKѭӟQJWăQJKD\JLҧm cӫa chuӛi vào mӝt vài thӡLÿLӇm cө thӇ YjWKѭӡQJÿѭӧc lһp lҥi theo chu kǤ có thӇ OjKjQJWKiQJKjQJTXêKjQJQăP Ví dө: nhiӋW ÿӝ WăQJ YjR PD KqP JLҧP YjR PD ÿ{QJ Yj FKX NǤ lһp lҥi là hàng QăP

x 'ӵEiRFKXӛLWKӡLJLDQ

Dӵ báo chuӛi thӡi gian là quá trình dӵa trên dӳ liӋu quá khӭ kӃt hӧp mӝt sӕ mô hình, kӻ thuұWÿӇ ÿѭDUDNӃt quҧ dӵ ÿRiQWURQJWѭѫQJODL&iFP{KuQKGӵ báo chuӛi thӡLJLDQÿѭӧc xây dӵng dӵa trên nguyên lý quy luұt trong quá khӭ có thӇ lһp lҥi ӣ WURQJWѭѫQJODL

1.3 Các mô hình dӵ báo chuӛi thӡi gian

1.3.1 Mô hình hӗi quy

Mô hình hӗi quy (Regressive) là tìm quan hӋ phө thuӝc cӫa mӝt biӃQÿѭӧc gӑi là biӃn phө thuӝc vào mӝt hoһc nhiӅu biӃQNKiFÿѭӧc gӑi là biӃQÿӝc lұp nhҵm mөc ÿtFKѭӟFOѭӧng hoһFWLrQÿRiQJLiWUӏ kǤ vӑng cӫa biӃn phө thuӝc khi biӃWWUѭӟc giá trӏ cӫa biӃQÿӝc lұp [2]

Trang 20

Hàm hӗi quy tәng thӇ E(Y/X  ȕ1 ȕ2X

( <_; OjѭӟFOѭӧng cӫa Y theo X ȕYjȕFiFWKDPVӕ cӫa mô hình

X: biӃQÿӝc lұp, biӃn giҧi thích, biӃn tác nhân, biӃn ngoҥi sinh

Y: biӃn phө thuӝc, biӃQÿѭӧc giҧi thích, biӃQÿѭӧc dӵ báo, biӃQÿѭӧc hӗi quy, biӃn nӝi sinh

1.3.2 Mô hình tӵ hӗi quy (AR)

Mô hình tӵ hӗi quy (Auto Regressive ± tӵ hӗLTX\ êWѭӣng chính cӫa mô hình này là dӵa trên sӕ liӋu quá khӭ [1] [2]

Mô hình tӵ hӗi quy bұc 1 AR(1): Yt = a + bYt-1

Mô hình tӵ hӗi quy bұc p:

AR(p): Yt = a0 + σ௣௜ୀଵܽ௜ܻ௧ି௜ + ut

TURQJÿy

Yt: quan sát hiҵn tҢi Yt-i các quan sát quá khӈ

a0, ai các tham sҺ phân tích hһi quy

ut : sai sҺ dӌ báo ngҧu nhiên cӆDJLDLÿRҢn hiҵn tҢi

Yt là mҾt hàm tuyұn tính cӆa nhӋng quan sát quá khӈ Yt-1 Yt-2«1KѭYұy khi sӊ dӅng phân tích hһi quy Yt theo các giá trҷ chuҽi thӁi gian dӉQJFyÿҾ trҴ p

1.3.3 0{KuQKWUXQJEuQKWUѭӧt (MA)

0{KuQKWUXQJEuQKWUѭӧt bұc 1 MA(1): Yt = (Yt-1 + Yt-2)/2 Dҥng tәng quát

MA(q): ܻ௧ ൌ G െ  σ௤௜ୀଵT௜݁௧ି௤ ൅ ݁௧

Trang 21

1.3.4 Mô hình ARIMA

Mô hình ARIMA (Auto Regressive Integrated Moving Average) có thӇ dӏch là

WUXQJEuQKWUѭӧt kӃt hӧp tӵ hӗi quy

Dӵa trên giҧ thuyӃt chuӛi dӯQJYjSKѭѫQJVDLNK{QJÿәi Mô hình sӱ dөQJÿҫu vào là dӳ liӋu quá khӭ cӫa chuӛLÿѭӧc dӵ EiRÿӇ dӵ báo nó Các dӳ liӋu ÿyEDRJӗm: chuӛi tӵ hӗi quy AR (auto regression) và chuӛL WUXQJ EuQK WUѭӧt MA (moving average) ĈDVӕ các chuӛi thӡLJLDQFy[XKѭӟng biӃQÿәi WăQJKRһc giҧm theo thӡi JLDQ GR ÿy \Ӄu tӕ chuӛi dӯQJ WKѭӡQJ NK{QJ ÿҥW ÿѭӧc Vì vұy, chuӛi thӡi gian không dӯng sӁ cҫn biӃQÿәi sang chuӛi dӯng bҵng sai phân [2]

Các bұc sai phân

Sai phân bұc 0 là I(0): chính là dӳ liӋu gӕc Yt Sai phân bұc 1 là I(1): wt = Yt ± Yt-1

Sai phân bұc 2 là I(2): w2 t = wt ± wt-«

Sai phân bұc d ký hiӋu I(d) KӃt hӧp vӟi mô hình AR(p) và MA(q) áp dөng cho I(d) ÿѭӧc gӑi là mô hình ARIMA(p,d,q)

1.3.5 Mô hình SARIMA

Mô hình SARIMA thӯa kӃ lҥLP{KuQK$5,0$QKѭQJÿѭӧFÿLӅu chӍQKÿһc biӋWÿӇ áp dөng cho nhӳng chuӛi thӡi gian có yӃu tӕ mùa vө VӅ bҧn chҩt mô hình ARIMA chính là mô hình hӗi quy tuyӃQ WtQK QKѭQJ Pӕi quan hӋ tuyӃQ WtQK WKѭӡng không giҧi thích tӕt chuӛi thӡLJLDQWURQJWUѭӡng hӧp chuӛi thӡi gian có yӃu tӕ mùa vө Vì vұy, bҵng cách tìm ra chu kǤ cӫa quy luұt mùa vө và loҥi bӓ nó khӓi chuӛi thӡi gian thì sӁ ÿѭӧc mô hình hӗLTX\WKHRSKѭѫQJSKiS$5,0$ [2]

Trong mô hình ARIMA nӃu chúng ta tính toán sai phân bұc nhҩt vӟLÿӝ trӉ lӟQKѫQÿӇ khӱ tính mùa vө QKѭVDX

Trang 22

%ѭӟc 1: Xác lұp mô hình ARIMA(p, d, q)

'QJFiFÿӗ thӏ ÿӇ [iFÿӏnh bұc sai phân cҫn thiӃWÿӇ ÿӗ thӏ có tính dӯng Giҧ sӱ dӳ liӋu dùng ӣ , G 'QJÿӗ thӏ SAC và SPAC cӫD, G ÿӇ [iFÿӏnh p và q

TriӇn khai dҥng cӫa mô hình

%ѭӟc 2: Tính toán các tham sӕ cӫa mô hình

Trong mӝt sӕ dҥQJ $5,0$ ÿѫQ JLҧn chúng ta có thӇ GQJ SKѭѫQJ SKiS EuQKSKѭѫQJ Wӕi thiӇu Mӝt sӕ dҥng ARIMA phӭc tҥS ÿzL Kӓi phҧi sӱ dөQJ FiF ѭӟc Oѭӧng phi tuyӃn Quay lҥLEѭӟc 1 xây dӵng mô hình vӟi cһS ST NKiFGѭӡQJQKѭFNJQJSKKӧp Giҧ sӱ FK~QJWDѭӟFOѭӧQJÿѭӧc m mô hình ARIMA

%ѭӟc 3: KiӇm tra chҭQÿRiQ

6RViQKFiFP{KuQK$5,0$ÿmѭӟFOѭӧng vӟi các mô hình truyӅn hoһc giӳa các mô hình ARIMA vӟLQKDXÿӇ chӑn mô hình tӕt nhҩt

%ѭӟc 4: Dӵ báo

7URQJÿDVӕ WUѭӡng hӧp mô hình ARIMA cho kӃt quҧ dӵ báo ngҳn hҥQÿiQJWLQFұy nhҩWWURQJFiFSKѭѫQJSKiSGӵ báo Tuy nhiên giӟi hҥn cӫa ARIMA là: Sӕ quan sát cҫn cho dӵ báo phҧi lӟn ChӍ GQJ ÿӇ dӵ báo ngҳn hҥn không thӇ ÿѭD FiF \Ӄu tӕ WKD\ÿәi có ҧQKKѭӣQJÿӃn biӃn sӕ cҫn dӵ báo cӫa thӡi kǤ cҫn dӵ báo vào mô hình Xây dӵQJP{KuQK$5,0$WKHRSKѭѫQJSKiSOXұn Box HQNLQVFyOѭӧng tính toán khá lӟQQrQÿzLKӓi phҧi có phҫn mӅm kinh tӃ Oѭӧng chuyên dùng

1.3.7 3KѭѫQJSKiSKӑc máy mҥQJQѫ-ron nhân tҥo

Các mô hình mҥQJQѫ-ron truyӅn thӕng không thӇ OѭXFiFWK{QJWLQTXiNKӭ Vì vұy mҥQJQѫ-ron hӗi quy (Recurrent Neural Network - 511 VLQKUDÿӇ giҧi quyӃt vҩn ÿӅ ÿy 0ҥng này chӭa các vòng lһp bên trong cho phép thông tin có thӇ OѭX Oҥi ÿѭӧc Tuy nhiên vӟi khoҧng cách lӟn dҫn thì RNN không thӇ nhӟ và hӑFÿѭӧc nӳa

Trang 23

Hình 3 MҥQJQѫ-ron hӗi quy

Long Short-Term Memory Networks (LSTM) là dҥQJÿһc biӋt cӫa mҥQJQѫ-ron hӗi quy, nó có khҧ QăQJ Kӑc ÿѭӧc các phө thuӝF [D /670 ÿѭӧc giӟi thiӋu bӣi +RFKUHLWHU 6FKPLGKXEHU  YjVDXÿyÿmÿѭӧc cҧi tiӃn và phә biӃn bӣi rҩt nhiӅXQJѭӡi

/670ÿѭӧc thiӃt kӃ ÿӇ WUiQK ÿѭӧc vҩQÿӅ phө thuӝc xa (long-term dependency) Nên nó có thӇ nhӟ thông tin trong suӕt thӡi gian dài, chӭ ta không cҫn phҧi huҩn luyӋQQyÿӇ có thӇ nhӟ ÿѭӧc

Mӝt trong nhӳng ӭng dөng cӫD/670OjÿӇ dӵ báo chuӛi thӡi gian Hình 3.2 mҥQJQѫ-ron nhân tҥo

Trang 24

2.1 Ӭng dөng mҥQJQѫ-ron dӵ báo chuӛi thӡi gian

Nhóm tác giҧ TrҫQ Ĉӭc Minh, TrҫQ +X\ 'ѭѫQJ 9NJ Ĉӭc Thi nghiên cӭX ÿӅ tài ³Mӝt sӕ vҩQÿӅ vӅ dӵ báo dӳ liӋu chuӛi thӡi gian´ [3] Trong nghiên cӭu, các tác giҧ ÿmSKkQWtFKFiFFiFKWLӃp cұn lӵa chӑn mô hình và quy trình áp dөng dӵ báo dӳ liӋu chuӛi thӡi gian tұp trung vào ӭng dөng mҥng Qѫ-ron Các tác giҧ FNJQJ QKұn ÿӏnh, các bài toán dӵ báo chuӛi thӡLJLDQWKѭӡng khó vì chúng ta khó có thӇ nhұn biӃWFK~QJFyFiFÿһFÿLӇm quá trình là tuyӃn tính hay phi tuyӃQWtQKÿһc biӋWÿӕi vӟi các dӳ liӋu lӟn, phӭc tҥp

2.2 Dӵ báo chuӛi thӡi gian mӡ dӵa trên ngӳ QJKƭD

Nhóm tác giҧ NguyӉn Duy HiӃX9NJ1Kѭ/kQ1JX\Ӊn Cát Hӗ vӟLÿӅ WjL³Dӵ báo chuӛi thӡi gian mӡ dӵa trên ngӳ QJKƭD´ [4] 7URQJ ÿӅ tài, các tác giҧ giӟi thiӋu chuӛi thӡi gian mӡQJKƭDOj[HP[pWJLiWUӏ ÿӏQKOѭӧng cӫa các giá trӏ trong chuӛi thӡi gian tӯ JyFÿӝ ÿӏnh tính Tӯ ÿyFKX\Ӈn bài toán dӵ báo vӅ viӋc dӵ báo các giá trӏ ngôn ngӳ cӫa các biӃn ngôn ngӳ KL ÿy Fy WKӇ sӱ dөng các luұt mӡ, các suy luұn mӡ ÿӇ có thӇ ÿѭDUDNӃt quҧ dӵ báo Quan hӋ mӡ là nӃu quan sát Y(t) tҥi thӡi ÿLӇm t có thӇ suy ra tӯ giá trӏ TXDQViWWUѭӟFÿy< W-n) Y(t-2)Y(t-1)

Trang 25

ĈӅ tài này không ÿӅ cұSÿӃn viӋc áp dөng cho dӳ liӋu tài chính vӟi các tính chҩt QKѭtính mùa vө[XKѭӟng, chu kǤ

2.3 Sӱ dөng mô hình máy hӑFÿӇ dӵ báo doanh sӕ bán hàng

Tác giҧ %RKGDQ 0 3DYO\VKHQNR ÿm WKӵc hiӋn nghiên cӭu khoa hӑc vӟL ÿӅ tài ³0DFKLQH-Learning Models for Sales Time Series Forecasting´ [5] ÿѭӧc công bӕ trên MDPI ngày 18/01/2019 Tác giҧ ÿmQJKLrQFӭu viӋc sӱ dөng các mô hình máy hӑc ÿӇ phân tích và dӵ ÿRiQGRDQKVӕ bán hàng Mөc tiêu chính cӫa nghiên cӭu là xem xét các cách tiӃp cұn và vӅ viӋc sӱ dөng máy hӑF ÿӇ dӵ báo doanh sӕ bán hàng Theo kӃt quҧ nghiên cӭu thì có thӇ dӵ ÿRiQ GRDQK Vӕ bán hàng khi có mӝt Oѭӧng nhӓ dӳ liӋu lӏch sӱ cho chuӛi thӡLJLDQEiQKjQJWURQJWUѭӡng hӧp sҧn phҭm hoһc cӱa hàng mӟLÿѭӧFWXQJUD&NJQJWKHRQJKLrQFӭu, bҵng cách sӱ dөng kӻ thuұt xӃp chӗng (stacking techniques), tác giҧ cho rҵng có thӇ cҧi thiӋn hiӋu suҩt cӫa các mô hình dӵ ÿRiQÿӇ dӵ báo chuӛi thӡi gian bán hàng

Trong nghiên cӭu tác giҧ ÿѭD UD NӃt luұn viӋc sӱ dөng mô hình máy hӑc cө thӇ mҥQJ Qѫ-ron (neural network) có thӇ dӵ báo khi có chӍ Oѭӧng nhӓ dӳ liӋu lӏch sӱ cho chuӛi thӡLJLDQÿy7X\QKLrQWiFJLҧ FNJQJNKҷQJÿӏnh viӋc sӱ dөQJFiFSKѭѫQJpháp tiӃp cұn hӗLTX\ÿӇ dӵ EiREiQKjQJWKѭӡng có thӇ chúng ta kӃt quҧ tӕWKѫQ

2.4 Sӱ dөng máy hӑFÿӇ dӵ báo vӅ thӏ WUѭӡng chӭng khoán

Nhóm nghiên cӭu gӗm các tác giҧ Bjoern Krollner, Bruce Vanstone, Gavin Finnie nghiên cӭu khoa hӑc vӟL ÿӅ tài "Financial Time Series Forecasting with Machine Learning Techniques: A Survey" (2010) [6] Nghiên cӭXQj\ÿѭӧc trình bày tҥL³WKHEuropean symposium on artificial neural networks: Computational and machine OHDUQLQJ%UXJHV%HOJLXP´&iFWiFJLҧ ÿmQJKLrQFӭu khҧo sát các tài liӋXWUѭӟFÿyvӅ kӻ thuұt máy hӑc và trí tuӋ nhân tҥRÿѭӧc sӱ dөQJÿӇ dӵ báo vӅ thӏ WUѭӡng chӭng khoán Theo tác giҧ công nghӋ dӵa trên mҥQJQѫ-URQÿѭӧc chҩp nhұn và phù hӧp WURQJOƭQKYӵc dӵ báo chӍ sӕ chӭng khoán

2.5 Sӱ dөQJ690ÿӇ dӵ báo chuӛi thӡi gian tài chính

Tác giҧ Mahmoud K Okasha vӟL ÿӅ WjL ³Using Support Vector Machines in FinanciaO7LPH6HULHV)RUHFDVWLQJ´ [7] Tác giҧ ÿmÿӅ xuҩt sӱ dөng máy ver-WѫKӛ trӧ 690

Ngày đăng: 03/08/2024, 13:14

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN