ĈҤI HӐC QUӔC GIA TP HCM 75ѬӠ1*ĈҤI HӐC BÁCH KHOA
Trang 2&Ð1*75Î1+ĈѬӦC HOÀN THÀNH TҤI 75ѬӠ1*ĈҤI HӐC BÁCH KHOA ±Ĉ+4*-HCM
Xác nhұn cӫa Chӫ tӏch Hӝi ÿӗng ÿiQh giá LV và 7Uѭӣng Khoa quҧn lý chuyên ngành sau khi luұn văn ÿã ÿѭӧc sӱa chӳa (nӃu có)
PGS.TS TRҪN MINH QUANG
Trang 3,7Ç1Ĉӄ TÀI: Dӵ báo nhu cҫu sҧn xuҩt dӵa vào dӳ liӋu quá khӭ
II NHIӊM VӨ VÀ NӜI DUNG:
x 7uPKLӇXYӅGӵEiRFKXӛLWKӡLJLDQYjFiFSKѭѫQJSKiSP{KuQKGӵEiRGӳOLӋXFKXӛLWKӡLJLDQ
x ThXWKұSGӳOLӋXYjEiQKjQJFӫDF{QJW\GѭӧFSKҭPWӯÿӃQ
x ӬQJGөQJFiFP{KuQKGӵEiRÿmWuPKLӇXYj3\WKRQÿӇGӵEiRWUrQGӳOLӋXÿmWKXWKұSÿѭӧF
x ĈiQKJLiNӃWTXҧNLӃQQJKӏÿӅ[XҩWQӃXFy III NGÀY GIAO NHIӊM VӨ: 24/02/2020
IV NGÀY HOÀN THÀNH NHIӊM VӨ: 21/06/2020
Trang 4LӠI CҦ0Ѫ1
LӡLÿҫu tiên tôi xin chân thành cҧPѫQWKҫy PGS TS Phҥm TrҫQ9NJÿmGjQKQKLӅu thӡi gian và tâm huyӃWKѭӟng dүQÿӏQKKѭӟng tôi trong thӡi gian thӵc hiӋn luұQYăQtӕt nghiӋp
Tôi xin gӱi lӡi cҧPѫQÿӃn quý thҫ\F{ÿmJLҧng dҥy và truyӅQÿҥt nhӳng kiӃn thӭc hӳu ích cho tôi trong suӕt thӡi gian tham gia hӑc tұp tҥLWUѭӡQJĈҥi hӑc Bách Khoa thành phӕ Hӗ Chí Minh
Tôi xin gӱi lӡi cҧPѫQÿӃn quý công ty Gѭӧc phҭm ÿmFKLDVӁ thông tin, nguӗn lӵc giúp tôi thӵc hiӋn luұQYăQQj\
CuӕLFQJW{L[LQFiPѫQÿӃQJLDÿuQKYjbҥQEqÿmÿӝQJYLrQJL~Sÿӥ tôi trong quá trình thӵc hiӋn luұQYăQQj\
Trang 5TÓM TҲT LUҰ19Ă1
Ngày nay, dӵ báo nhu cҫu sҧn xuҩt rҩt hӳu ích cho nhà sҧn xuҩW[iFÿӏnh chính xác tӹ lӋ cung ӭng hàng hóa tӕLѭXQKҩt, tӯ ÿy[k\Gӵng kӃ hoҥch dӵ trӳ hàng tӗn kho và kӃ hoҥch mua vұt liӋXWѭѫQJӭQJÿӇ giӳ mӭc sҧn xuҩt ӣ mӭc vӯDÿӫ, cҳt giҧm chi phí MөF ÿtFK Fӫa luұQ YăQ WuP KLӇX SKѭѫQJ SKiS Gӵ EiR JL~S [iF ÿӏnh sӕ Oѭӧng sҧn phҭn cҫn sҧn xuҩWWURQJWѭѫQJODL
3KѭѫQJSKiSGӵ báo trong luұQYăQOjSKѭѫQJSKiSÿӏnh Oѭӧng
LuұQYăQQj\ WKӵc hiӋn nhҵm mөFÿtFKWuP UDP{KuQK Gӵ báo dӳ liӋu chuӛi thӡi gian tӕLѭXQKҩt cӫa mô hình SARIMA và mô hình LSTM
Trong luұQYăQQj\WiFJLҧ FNJQJWuPKLӇu và sӱ dөng ngôn ngӳ 3\WKRQÿӇ bên cҥnh viӋc nghiên cӭu các lý thuyӃWÿӇ tiӃn hành thӵc nghiӋp vào dӳ liӋu thu thұSÿѭӧc tҥi công ty sҧn xuҩWGѭӧc phҭm
ĈiQKJLiYjÿѭDUDNӃt luұn tӯ nghiên cӭu thӵc nghiӋm vӅ mô hình dӵ báo nào cho kӃt quҧ tӕLѭXQKҩt KӃt quҧ này sӁ OjWѭOLӋu tham khҧo hӳu hiӋXFKRFiFÿѫQYӏ sҧn xuҩWWURQJOƭQK vӵFGѭӧc phҭPFNJQJQKѭFyWKӇ mӣ rӝng cho viӋc phân tích và dӵ báo dӳ liӋu chuӛi thӡi gian bҩt kǤ
Trang 6ABSTRACT
Nowadays, forecasting of production demand is very useful for manufacturers to accurately determine the ratio of the optimum supply of goods, thereby building inventory plans and purchasing materials of plans corresponding to keeping production at a sufficient level, to cut down the costs The purpose of the dissertation is to find out predictive methods to help the determination of the number of products to be produced in the future
The predictive method in the dissertation is the quantitative method
This dissertation aims to figure out the prediction model of the most optimal time series data of the SARIMA model and LSTM model
In this dissertation, the author also learns and uses the Python language, in addition to studying theories to conduct applying to on collected data at the pharmaceutical manufacturing company
Evaluate and make conclusions from experimental research on which predictive model gives the most optimal results This result will be a useful reference for manufacturers in the pharmaceutical sector and can be extended for the analysis and prediction of any time series data
Trang 7LӠI CAM Ĉ2$1
7{L[LQFDPÿRDQUҵng toàn bӝ nӝi dung trong luұQYăQQj\GRW{LWӵ nghiên cӭu và thӵc hiӋn Sӕ liӋu tôi sӱ dөng trong luұQYăQQj\ÿѭӧc sӵ ÿӗng ý cӫa doanh nghiӋp sӣ hӳu nó và tôi có cam kӃt không tiӃt lӝ dӳ liӋu chi tiӃt và mã hóa thông tin nhҥy cҧPÿӇ không ҧQKKѭӣQJÿӃn kӃt quҧ kinh doanh cӫa doanh nghiӋp sӣ hӳu Ngoài
ra tôi ÿѭӧc phép công bӕ sӕ liӋu tәng hӧSÿmPmKyDYjNӃt quҧ tәng hӧp tӯ luұn
YăQQj\
NӃu có chӛ QjRNK{QJÿ~QJQKѭÿmQrQWUrQW{L[LQKRjQWRjQFKӏu trách nhiӋm 1JѭӡLFDPÿRDQ
Phan ThӃ Thành
Trang 84 Thu thұp, tìm hiӇXYjÿiQKJLiGӳ liӋu 4
5 Giӟi hҥn nghiên cӭu cӫDÿӅ tài 6
&+ѬѪ1* &Ѫ6Ӣ LÝ THUYӂT VÀ CÁC CÔNG TRÌNH CÓ LIÊN QUAN 7
&ѫVӣ lý thuyӃt 7
1.1 Dӵ báo nhu cҫu sҧn xuҩt 7
1.2 Chuӛi thӡi gian (time series) 7
1.3 Các mô hình dӵ báo chuӛi thӡi gian 8
1.3.1 Mô hình hӗi quy 8
1.3.2 Mô hình tӵ hӗi quy (AR) 9
0{KuQKWUXQJEuQKWUѭӧt (MA) 9
1.3.4 Mô hình ARIMA 10
1.3.5 Mô hình SARIMA 10
Trang 93KѭѫQJSKiSOXұn Box-Jenkins: 10
3KѭѫQJSKiSKӑc máy mҥQJQѫ-ron nhân tҥo 11
&iFF{QJWUuQKFyOLrQTXDQÿӃQÿӅ tài 13
2.1 Ӭng dөng mҥQJQѫ-ron dӵ báo chuӛi thӡi gian 13
2.2 Dӵ báo chuӛi thӡi gian mӡ dӵa trên ngӳ QJKƭD 13
2.3 Sӱ dөng mô hình máy hӑFÿӇ dӵ báo doanh sӕ bán hàng 14
2.4 Sӱ dөng máy hӑFÿӇ dӵ báo vӅ thӏ WUѭӡng chӭng khoán 14
2.5 Sӱ dөQJ690ÿӇ dӵ báo chuӛi thӡi gian tài chính 14
2.6 Ӭng dөng kӻ thuұt mҥQJQѫ-ron nhân tҥo ÿӇ dӵ báo 15
2.7 Tәng hӧp nhiӅXSKѭѫQJSKiSGӵ báo 15
3 KӃt luұn 15
&+ѬѪ1* +,ӊN TRҤNG, YÊU CҪU, GIҦI PHÁP THӴC HIӊN Hӊ THӔNG 17
1 HiӋn trҥng hӋ thӕng thông tin tҥLF{QJW\Gѭӧc 17
2 Yêu cҫu cӫa hӋ thӕng 17
3 Giҧi pháp thӵc hiӋn dӵ báo 19
3.1 Trích xuҩt và phân tích dӳ liӋu 19
3.3 Xây dӵng mô hình dӵ báo SARIMA bҵng Python 23
3.3.1 Chuҭn bӏ dӳ liӋXÿҫu vào 23
;iFÿӏnh mô hình 24
3.3.3 Huҩn luyӋn (training) mô hình 25
3.3.4 Dӵ EiRYjÿiQKJLiVDLVӕ dӵ báo 25
Trang 103.4 Xây dӵng mô hình dӵ báo LSTM bҵng Python 25
3.4.1 Chuҭn bӏ dӳ liӋXÿҫu vào 25
3.4.2 Tҥo và luҩn luyӋn mô hình 27
3.4.3 Tҥo dӳ liӋu kiӇm tra 28
3.4.4 Dӵ EiRYjÿiQKJLiVDLsӕ 28
3.5 Phân tích và dӵ báo theo nhóm thuӕc 29
3.5.1 Trӵc quan hóa sӕ liӋu 29
3.5.2 Sӱ dөng mô hình SARIMA 32
a Tìm mô hình cho dӳ liӋu vӅ nhóm da liӉu 32
b KӃt quҧ dӵ báo nhóm da liӉu 33
a Tìm mô hình dӵ báo cho dӳ liӋu 1 sҧn phҭm thuӕc 42
b KӃt quҧ dӵ báo sҧn phҭm thuӕc 43
4 Hҥn chӃ YjKѭӟng nghiên cӭu tiӃp theo 50
TÀI LIӊU THAM KHҦO 52
PHӨ LӨC A: CODE PYTHON 55
A.1 Trӵc quan hóa dӳ liӋu nhóm 55
A.2 Trӵc quan hóa sӕ liӋu 1 sҧn phҭm thuӕc 57
A.3 Dӵ báo theo nhóm thuӕc ± mô hình SARIMA 58
Trang 11A.4 Dӵ báo theo 1 sҧn phҭm thuӕc ± Mô hình SARIMA 59
A.5 Dӵ báo theo nhóm thuӕc ± Mô hình LSTM 60
A.6 Dӵ báo theo 1 sҧn phҭm thuӕc ± Mô hình LSTM 62
PHӨ LӨC B: CÁC THUӜC TÍNH CӪA LӞP SARIMAXRESULTS [25] 65
Trang 12DANH MӨC HÌNH
Hình 3.6ѫÿӗ quan hӋ tәng quát hӋ thӕng thông tin tҥLF{QJW\Gѭӧc Hình 3.2 KiӃn trúc hӋ thӕng dӵ báo
Hình 3.3 Giao diӋn cӫa hӋ thӕng
Hình 3.4 Trӵc quan hóa dӳ liӋu bán hàng cӫa công ty Hình 3.5: BiӇXÿӗ sӕ Oѭӧng bán tҩt cҧ các mһt hàng Hình 3.6: BiӇXÿӗ sӕ Oѭӧng bán nhóm thuӕc vӅ Da liӉu Hình 3.7: BiӇXÿӗ sӕ Oѭӧng bán nhóm thuӕc vӅ Tiêu hóa Hình 3.8 KӃt quҧ tìm mô hình theo nhóm da liӉu
Hình 3.9 các thông sӕ kӃt quҧ dӵ báo theo nhóm da liӉu, mô hình 1 Hình 3.10 Ĉӗ thӏ kӃt quҧ dӵ báo nhóm da liӉu, mô hình 1
Hình 3.11 Các thông sӕ kӃt quҧ dӵ báo theo nhóm da liӉu, mô hình 2 Hình 3.12 Ĉӗ thӏ kӃt quҧ dӵ báo nhóm da liӉu, mô hình 2
Hình 3.13: Tóm tҳt (summary) mô hình hӑc máy LSTM
Hình 3.14: kӃt quҧ dӵ báo sҧn phҭm kháng sinh nhҽ theo mô hình LSTM Hình 3.15: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm ALPHA
Hình 3.16: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm B1-B6-B12 Hình 3.17: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm kháng sinh nhҽ
Hình 3.18: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm thuӕc giҧPÿDXKҥ sӕt Hình 3.19: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm CALCIUM
Hình 3.20: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm kháng sinh mҥnh Hình 3.21: BiӇXÿӗ sӕ Oѭӧng bán sҧn phҭm viêm khӟp dҥng thҩp Hình 3.22 KӃt quҧ tìm mô hình theo sҧn phҭm kháng sinh nhҽ
Hình 3.23 Các thông sӕ kӃt quҧ dӵ báo theo sҧn phҭm kháng sinh nhҽ Hình 3.24 KӃt quҧ dӵ báo sҧn phҭm kháng sinh nhҽ theo mô hình SARIMA Hình 3.25: Tóm tҳt (summary) mô hình hӑc máy LSTM
Hình 3.26: KӃt quҧ dӵ báo sҧn phҭm kháng sinh nhҽ theo mô hình LSTM
Trang 13DANH MӨC BҦNG SӔ LIӊU
Bҧng 3.1 Phân tích sӕ liӋu cӫa công ty
Bҧng 3.2 KӃt quҧ ÿiQKJLiVDLVӕ theo nhóm da liӉu Bҧng 3.3 KӃt quҧ ÿiQKJLiVDLVӕ theo sҧn phҭm Bҧng 4.1 Thӡi gian chҥy theo mô hình và loҥi dӳ liӋu
Trang 14&+ѬѪ1* GIӞI THIӊ8Ĉӄ TÀI 1 Lý do chӑn ÿӅ tài
Trong phân hӋ hoҥFKÿӏnh nhu cҫu nguyên vұt liӋu (MPR) cӫa hӋ thӕng ERP thì dӵ báo nhu cҫu sҧn xuҩt là quan trӑng nhҩt và tӯ ÿyFyWKӇ dӵ toán sӕ Oѭӧng nguyên vұt liӋu sҧn xuҩt, và tӕL ѭX KyD Oѭӧng hàng tӗn kho mà vүn ÿiS ӭQJ ÿѭӧc nhu cҫu khách hàng
Trong sҧn xuҩt, rҩt nhiӅu hoҥW ÿӝQJ ÿѭӧc dӵa trên dӵ báo nhu cҫu sҧn xuҩt trong WѭѫQJODLQKѭNӃ hoҥch bán hàng, danh sӕ bán hàng, kӃ hoҥch thu mua nguyên vұt liӋu, tӗn kho, kӃ hoҥch tuyӇn dөng, huҩn luyӋQÿjRWҥo nhân sӵ mӟi
Dӵ EiRÿѭӧc dӵa trên dӳ liӋu quá khӭ, là mӝt trong nhӳQJSKѭѫQJSKiSGӵ báo phә biӃn nhҩt, lҩy dӳ liӋu quá khӭ ÿӇ ÿѭDUDGӵ EiRWѭѫQJODL7X\QKLrQSKѭѫQJSKiSnày lҥi bӓ qua các yӃu tӕ bên ngoài trong quá trình sҧn xuҩt dӵa trên sӕ Oѭӧng nhu cҫu trong nhӳng kǤ WUѭӟc
ĈӇ giӳ vӏ thӃ WUrQWKѭѫQJWUѭӡng, nhà sҧn xuҩt phҧi nhanh chóng thích ӭng vӟi thӏ WUѭӡng biӃQÿӝQJFNJQJQKѭOLrQWөFÿHPÿӃn nhӳng sҧn phҭm chҩWOѭӧng và dӏch vө tӕt nhҩWÿӃn khách hàng Vì vұy, hӑ cҫQÿӃn dӵ báo nhu cҫu sҧn xuҩWYjÿyFNJng là
lý do tôi chӑQÿӅ tài "Dӵ báo nhu cҫu sҧn xuҩt dӵa vào dӳ liӋu quá khӭ kӃt hӧp vӟi các yӃu tӕ bên ngoài có liên quan"
2 éQJKƭDNKRDKӑc và thӵc tiӉn
Dӵ báo nhu cҫu sҧn xuҩt giúp cho nhà sҧn xuҩW[iFÿӏnh chính xác tӹ lӋ cung ӭng hàng hóa tӕLѭXQKҩt là bao nhiêu, tӯ ÿy[k\Gӵng kӃ hoҥch dӵ trӳ hàng tӗn kho và kӃ hoҥch mua vұt liӋXWѭѫQJӭQJÿӇ giӳ mӭc sҧn xuҩt ӣ mӭc vӯDÿӫ, cҳt giҧm chi phí
+ѫQQӳa, dӵ báo nhu cҫXFNJQJJySSKҫQWăQJFѭӡng sӵ hӧp tác giӳa các bӝ phұn và trong suӕt quá trình sҧn xuҩt, chҷng hҥQQKѭEӝ phұn bán hàng và sҧn xuҩt
Nó cho phép nhà quҧn trӏ sҧn xuҩt kӃt hӧp các tình huӕng giҧ ÿӏnh trong kӃ hoҥch sҧn xuҩt cӫDPuQKYjÿѭDUDFiFKRҥWÿӝng thích hӧSÿӇ ÿҧm bҧo mөc tiêu sҧn xuҩt Các hoҥW ÿӝQJ ÿy ÿѭӧc bҳW ÿҫu tӯ sӕ liӋu dӵ toán, vì vұy dӵ ÿRiQ QKX Fҫu ҧnh Kѭӣng trӵc tiӃSÿӃn hiӋu suҩt cӫa công viӋc lұp kӃ hoҥch sҧn xuҩt và quҧn lý rҩt nhiӅu quy trình và hӋ thӕng trong doanh nghiӋSQKѭbán hàng, sҧn xuҩt, tài chính, cung ӭng và phân phӕi
Trang 153 MөFWLrXÿӕLWѭӧng và phҥm vi nghiên cӭu
Dӵ báo nhu cҫu sҧn xuҩt có doanh nghiӋp là bài toán khó hiӋQQD\FKѭDFySKѭѫQJpháp, mô hình tӕL ѭX ÿӇ giҧi quyӃt nó Ví dө ngày 13/07/2020 trang tin tӭc công nghӋ CNET.COM cӫD ÿѭD WLQ $SSOH ÿm Qӝp phҥt cho Samsung 950 triӋX ÿ{ YuNK{QJPXDÿӫ sӕ Oѭӧng tҩm nӅQ2/('QKѭFDPNӃWĈLӅu này xҧy ra là vì Apple dӵa trên báo nhu cҫu sҧn xuҩWYjÿһt mua sӕ Oѭӧng lӟn tҩm nӅn tӯ 6DPVXQJÿӇ ÿѭӧc Kѭӣng giá thҩp do mua sӕ Oѭӧng lӟQ7X\QKLrQWuQKKuQKEiQKjQJNK{QJQKѭNǤ vӑng GRÿҥi dӏch Corona nên $SSOHNK{QJPXDÿӫ sӕ Oѭӧng và phҧi chӏ phҥt
&iFWK{QJWLQÿһFWUѭQJWKѭӡQJGQJÿӇ dӵ báo nhu cҫu sҧn xuҩt:
x 'ӳOLӋXEiQKjQJWURQJTXiNKӭ
x TKD\ÿәLWKHRPa YөOѭӧQJKjQJEiQUDVӁQKLӅXKѫQKRһFtWKѫQYjRPӝWYjLWKӡLÿLӇPFөWKӇYjFyWtQKFKҩWOһSOҥLWKHRFKXNǤWKѭӡQJFKXNǤOjPӝWQăPQKѭQJFNJQJFyWKӇQJҳQKRһFGjLKѫQ
x 1ăQJOӵFFNJQJQKѭKҥQFKӃFӫDGRDQKQJKLӋSWURQJVҧQ[XҩWYtGөQKXFҫXVҧQ[XҩWEiQKWUXQJWKXWKiQJWӯJLӳDWKiQJÿӃQJLӳDWKiQJkPOӏFKOjKӝS7X\QKLrQQăQJOӵFVҧQ[XҩWWӕLÿDOjKӝSKҥQVӱGөQJOjWKiQJ 9u Yұ\ GRDQK QJKLӋS Fy WKӇ VҧQ [XҩW WUѭӟF YjL WKiQJ ÿӇ Gӵ SKzQJKjQJWӗQNKRÿӫEiQFKRPDWUXQJWKX
x 7uQKKuQKNLQKWӃYƭP{WӹJLiYjQJQJRҥLWӋ
x 7uQKKuQKWKLrQWDLGӏFKEӋQKKӓDKRҥQYtGө GӏFK&RURQDKҥQKiQӣPLӅQWUXQJ«
Tùy vào loҥi sҧn phҭm, nhu cҫu, [X Kѭӟng, mùa vө, ÿLӅu kiӋn kinh tӃ YL P{ Yƭmô« mà ta phҧi áp dөQJFiFSKѭѫQJSKiSP{KuQKGӵ báo phù hӧSÿӇ có sai sӕ dӵ báo nhӓ nhҩt
Tuy nhiên vì thӡi gian mà nguӗn lӵc hӳu hҥn, tôi chӍ giӟi hҥn phҥm vi nghiên cӭu cӫa luұQYăQOjdӳ liӋu bán hàng quá khӭ cӫa công ty sҧn xuҩWGѭӧc phҭm y tӃ và yӃu tӕ theo mùa vө
4 Thu thұp, tìm hiӇXYjÿiQKJLiGӳ liӋu
Trong quá trình thӵc hiӋn luұQ YăQ W{L ÿm ÿѭӧc phép sӱ dөng dӳ liӋu cӫa doanh nghiӋp vӅ sҧn xuҩWGѭӧc phҭm y tӃ trong thӡi gian tӯ QăPÿӃn nay Tuy nhiên tôi phҧi cam kӃt bҧo mұt dӳ liӋu chi tiӃW Yu ÿk\ Oj Gӳ liӋu bán hàng nӃu bӏ lӝ ra ngoài sӁ ҧQKKѭӣQJÿӃn kӃt quҧ kinh doanh cӫa công ty này
Trang 16Dӳ liӋu thu thұS ÿѭӧc là dӳ liӋu bán hàng trong phân hӋ kӃ toán cӫa phҫn mӅm quҧn trӏ cӫa doanh nghiӋp Dӳ liӋu khoҧng 109 nghìn dòng MӛLQăPNKRҧQJÿӃn 22 nghìn dòng, mӛi dòng là chi tiӃt hàng hóa, sӕ Oѭӧng xuҩt, ngày xuҩt bán và các thông tin khác
7KHRÿӏQKQJKƭDGӳ liӋu time series, dӳ liӋu này là chuӛi sӵ kiӋQYjWKѭӟFÿRWKHRngày nên nó là dӳ liӋu time series
ĈӇ lӑc dӳ liӋu cho bài toán khai phá dӳ liӋu time series thì phҧLFyWѭѫQJÿӕLÿӫ ӣ FiFÿLӇm trong chuӛi thӭ tӵ thӡi gian
Công ty có trên 1100 hàng hóa chia thành 25 loҥi hàng hóa
Dӳ liӋu có rҩt nhiӅu hàng hóa chӍ kinh doanh thӡi gian nhҳn nên cҫn loҥi bӓ Tuy nhiên có 11 hàng hóa FyNLQKGRDQKWURQJÿӃn 12 tháng trong cҧ 7 QăPWURQJÿyQăPFKӍ WtQKWKiQJÿҫXQăP(toàn bӝ dӳ liӋXOjQăP
Ngoài ra, khi xét theo loҥi hàng hóa thì FyQKyPFyÿӫ dӳ liӋXWURQJQăP Trӵc quan hóa dӳ liӋu bҵng power bi desktop
VӟLÿһt thù dӳ liӋu này, tôi quyӃWÿӏnh chӑQÿLӇm thӡi gian cho dӳ liӋu time series OjWKiQJQăPYjOӑc các hàng hóa ÿӫ 12 tháng ӣ tҩt cҧ FiFQăPWUӯ QăPFKӍ có 6 tháng
Trang 175 Giӟi hҥn nghiên cӭu cӫDÿӅ tài
Phҥm vi không gian: ÿӅ tài chӍ tìm hiӇu và dӵ báo vӅ các nhóm hàng và hàng hóa ÿѭӧc sҧn xuҩt tҥLF{QJW\Gѭӧc phҭm X (tác giҧ [LQÿѭӧc giҩXWrQÿӇ ÿҧm bҧo tính bҧo mұt) Ngoài ra vì thӡi gian có hҥn, tác giҧ mӟi chӍ tìm hiӇu và thӵc nghiӋm mô hình SARIMA và mô hình hӑc máy LSTM HiӋn nay còn có FiFP{KuQKQKѭmô hình véc-WѫWӵ hӗi quy (VAR), mô hình hiӋu chӍnh sai sӕ dҥng véc-Wѫ (Vector Error Correction Model - VECM) FNJQJFyWKӇ dӵ báo dӳ liӋu chuӛi thӡi gian tuy nhiên vì thӡi gian có hҥn, tác giҧ FKѭDWuPKLӇu kӏp Ngoài ra dӵ báo nhu cҫu sҧn xuҩt còn chӏu ҧQK Kѭӣng bӣi nhiӅu yӃu tӕ ngoҥi suy hay là các yӃu tӕ bên ngoài hӋ thӕng thông tin cӫDF{QJW\QKѭQJYuÿLӅu kiӋQFKѭDWKXWKұSÿӫ dӳ liӋu ngoҥLVX\QrQÿӅ WjLFKѭDÿѭDYjRP{KuQKGӵ báo
Phҥm vi thӡLJLDQÿӅ tài nghiên cӭu dӵa trên các dӳ liӋu dӳ liӋu lӏch sӱ bán hàng tӯ QăP ÿӃn nay
Trang 18&+ѬѪ1* &Ѫ6Ӣ LÝ THUYӂT VÀ CÁC CÔNG TRÌNH CÓ LIÊN QUAN 1 &ѫVӣ lý thuyӃt
1.1 Dӵ báo nhu cҫu sҧn xuҩt
Dӵ báo doanh sӕ cho ta biӃt có bao nhiêu sҧn phҭm có khҧ QăQJ EiQ ÿѭӧc trong mӝt khoҧng thӡL JLDQ WѭѫQJ ODL 'ӵ báo doanh sӕ FKtQK [iF Oj ÿLӅu cҫn thiӃt cho mӝt doanh nghiӋp cho phép nó sҧn xuҩt sӕ Oѭӧng sҧn phҭm cҫn thiӃWYjRÿ~QJWKӡi ÿLӇPĈӕi vӟi bҩt kǤ doanh nghiӋp vӅ sҧn xuҩt nào, viӋFÿiQKJLiFiF[XKѭӟng thӏ WUѭӡng mӝWFiFKÿҫ\ÿӫ là rҩt cҫn thiӃt Mӝt cam kӃt vӅ phía bӝ phұn bán hàng và kӃ hoҥFKWѭѫQJODLFӫa toàn bӝ bӝ phұn sҧn xuҩt phө thuӝc vào dӵ báo này
1.2 Chuӛi thӡi gian (time series)
Theo Wikipedia (English): chuӛi thӡi gian là chuӛL FiF ÿLӇm dӳ liӋX ÿѭӧc lұp chӍ mөc theo thӭ tӵ thӡL JLDQ 7K{QJ WKѭӡng, mӝt chuӛi thӡi gian là mӝt chuӛL ÿѭӧc quan sát tҥLFiFÿLӇPFiFKÿӅu nhau theo thӡi gian, có thӇ là hàng ngày, hàng tháng, KjQJTXêKjQJQăP'RÿyQyOjPӝt chuӛi các dӳ liӋu thӡi gian rӡi rҥc
Ví dө vӅ chuӛi thӡi gian: sӕ liӋu chӭng khoán, sӕ liӋu tài chính kӃ toán, sӕ liӋu dӵ báo thӡi tiӃt, sӕ liӋu theo dõi sӕ QJѭӡi nhiӉm Covid-19
+uQKĈӗ thӏ minh hӑa mӝt chuӛi thӡi gian (Tәng sӕ ca nhiӉm Corona tҥi Mӻ) Chuӛi thӡi gian X vӟi các giá trӏ quan sát tҥi các thӡLÿLӇPÿѭӧc ký hiӋu là X1, X2, X«Xt«;n vӟi Xt là giá trӏ cӫa chuӛi X tҥi thӡLÿLӇm t
Trang 19Các chuӛi thӡi gian vӃ kinh tӃ WKѭӡng có các tính chҩt: [2]
x 7tQK[XKѭӟQJGjLKҥQ
Tính chҩW Qj\ GQJ ÿӇ chӍ [X KѭӟQJ WăQJ KD\ JLҧm cӫD FiF ÿLӇm quan sát trong chuӛi thӡi gian Trӵc quan hóa dӳ liӋu chuӛi thӡi gian sӁ dӉ dàng thҩ\ [X Kѭӟng cӫa hình 1 là chuӛi thӡLJLDQFy[XKѭӟQJWăQJ9tGө dân sӕ ViӋW1DPFy[XKѭӟng WăQJ1KѭQJWӕFÿӝ WăQJGkQVӕ cӫa ViӋW1DPFy[XKѭӟng giҧm
x 7tQKPDYө
Tính chҩWQj\ÿӇ chӍ [XKѭӟQJWăQJKD\JLҧm cӫa chuӛi vào mӝt vài thӡLÿLӇm cө thӇ YjWKѭӡQJÿѭӧc lһp lҥi theo chu kǤ có thӇ OjKjQJWKiQJKjQJTXêKjQJQăP Ví dө: nhiӋW ÿӝ WăQJ YjR PD KqP JLҧP YjR PD ÿ{QJ Yj FKX NǤ lһp lҥi là hàng QăP
x 'ӵEiRFKXӛLWKӡLJLDQ
Dӵ báo chuӛi thӡi gian là quá trình dӵa trên dӳ liӋu quá khӭ kӃt hӧp mӝt sӕ mô hình, kӻ thuұWÿӇ ÿѭDUDNӃt quҧ dӵ ÿRiQWURQJWѭѫQJODL&iFP{KuQKGӵ báo chuӛi thӡLJLDQÿѭӧc xây dӵng dӵa trên nguyên lý quy luұt trong quá khӭ có thӇ lһp lҥi ӣ WURQJWѭѫQJODL
1.3 Các mô hình dӵ báo chuӛi thӡi gian
1.3.1 Mô hình hӗi quy
Mô hình hӗi quy (Regressive) là tìm quan hӋ phө thuӝc cӫa mӝt biӃQÿѭӧc gӑi là biӃn phө thuӝc vào mӝt hoһc nhiӅu biӃQNKiFÿѭӧc gӑi là biӃQÿӝc lұp nhҵm mөc ÿtFKѭӟFOѭӧng hoһFWLrQÿRiQJLiWUӏ kǤ vӑng cӫa biӃn phө thuӝc khi biӃWWUѭӟc giá trӏ cӫa biӃQÿӝc lұp [2]
Trang 20Hàm hӗi quy tәng thӇ E(Y/X ȕ1 ȕ2X
(<_; OjѭӟFOѭӧng cӫa Y theo X ȕYjȕFiFWKDPVӕ cӫa mô hình
X: biӃQÿӝc lұp, biӃn giҧi thích, biӃn tác nhân, biӃn ngoҥi sinh
Y: biӃn phө thuӝc, biӃQÿѭӧc giҧi thích, biӃQÿѭӧc dӵ báo, biӃQÿѭӧc hӗi quy, biӃn nӝi sinh
1.3.2 Mô hình tӵ hӗi quy (AR)
Mô hình tӵ hӗi quy (Auto Regressive ± tӵ hӗLTX\ êWѭӣng chính cӫa mô hình này là dӵa trên sӕ liӋu quá khӭ [1] [2]
Mô hình tӵ hӗi quy bұc 1 AR(1): Yt = a + bYt-1
Mô hình tӵ hӗi quy bұc p:
AR(p): Yt = a0 + σୀଵܻܽ௧ି + ut
TURQJÿy
Yt: quan sát hiҵn tҢi Yt-i các quan sát quá khӈ
a0, ai các tham sҺ phân tích hһi quy
ut : sai sҺ dӌ báo ngҧu nhiên cӆDJLDLÿRҢn hiҵn tҢi
Yt là mҾt hàm tuyұn tính cӆa nhӋng quan sát quá khӈ Yt-1 Yt-2«1KѭYұy khi sӊ dӅng phân tích hһi quy Yt theo các giá trҷ chuҽi thӁi gian dӉQJFyÿҾ trҴ p
1.3.3 0{KuQKWUXQJEuQKWUѭӧt (MA)
0{KuQKWUXQJEuQKWUѭӧt bұc 1 MA(1): Yt = (Yt-1 + Yt-2)/2 Dҥng tәng quát
MA(q): ܻ௧ ൌ G െ σୀଵT݁௧ି ݁௧
Trang 211.3.4 Mô hình ARIMA
Mô hình ARIMA (Auto Regressive Integrated Moving Average) có thӇ dӏch là
WUXQJEuQKWUѭӧt kӃt hӧp tӵ hӗi quy
Dӵa trên giҧ thuyӃt chuӛi dӯQJYjSKѭѫQJVDLNK{QJÿәi Mô hình sӱ dөQJÿҫu vào là dӳ liӋu quá khӭ cӫa chuӛLÿѭӧc dӵ EiRÿӇ dӵ báo nó Các dӳ liӋu ÿyEDRJӗm: chuӛi tӵ hӗi quy AR (auto regression) và chuӛL WUXQJ EuQK WUѭӧt MA (moving average) ĈDVӕ các chuӛi thӡLJLDQFy[XKѭӟng biӃQÿәi WăQJKRһc giҧm theo thӡi JLDQ GR ÿy \Ӄu tӕ chuӛi dӯQJ WKѭӡQJ NK{QJ ÿҥW ÿѭӧc Vì vұy, chuӛi thӡi gian không dӯng sӁ cҫn biӃQÿәi sang chuӛi dӯng bҵng sai phân [2]
Các bұc sai phân
Sai phân bұc 0 là I(0): chính là dӳ liӋu gӕc Yt Sai phân bұc 1 là I(1): wt = Yt ± Yt-1
Sai phân bұc 2 là I(2): w2 t = wt ± wt-«
Sai phân bұc d ký hiӋu I(d) KӃt hӧp vӟi mô hình AR(p) và MA(q) áp dөng cho I(d) ÿѭӧc gӑi là mô hình ARIMA(p,d,q)
1.3.5 Mô hình SARIMA
Mô hình SARIMA thӯa kӃ lҥLP{KuQK$5,0$QKѭQJÿѭӧFÿLӅu chӍQKÿһc biӋWÿӇ áp dөng cho nhӳng chuӛi thӡi gian có yӃu tӕ mùa vө VӅ bҧn chҩt mô hình ARIMA chính là mô hình hӗi quy tuyӃQ WtQK QKѭQJ Pӕi quan hӋ tuyӃQ WtQK WKѭӡng không giҧi thích tӕt chuӛi thӡLJLDQWURQJWUѭӡng hӧp chuӛi thӡi gian có yӃu tӕ mùa vө Vì vұy, bҵng cách tìm ra chu kǤ cӫa quy luұt mùa vө và loҥi bӓ nó khӓi chuӛi thӡi gian thì sӁ ÿѭӧc mô hình hӗLTX\WKHRSKѭѫQJSKiS$5,0$ [2]
Trong mô hình ARIMA nӃu chúng ta tính toán sai phân bұc nhҩt vӟLÿӝ trӉ lӟQKѫQÿӇ khӱ tính mùa vө QKѭVDX
Trang 22%ѭӟc 1: Xác lұp mô hình ARIMA(p, d, q)
'QJFiFÿӗ thӏ ÿӇ [iFÿӏnh bұc sai phân cҫn thiӃWÿӇ ÿӗ thӏ có tính dӯng Giҧ sӱ dӳ liӋu dùng ӣ ,G 'QJÿӗ thӏ SAC và SPAC cӫD,G ÿӇ [iFÿӏnh p và q
TriӇn khai dҥng cӫa mô hình
%ѭӟc 2: Tính toán các tham sӕ cӫa mô hình
Trong mӝt sӕ dҥQJ $5,0$ ÿѫQ JLҧn chúng ta có thӇ GQJ SKѭѫQJ SKiS EuQKSKѭѫQJ Wӕi thiӇu Mӝt sӕ dҥng ARIMA phӭc tҥS ÿzL Kӓi phҧi sӱ dөQJ FiF ѭӟc Oѭӧng phi tuyӃn Quay lҥLEѭӟc 1 xây dӵng mô hình vӟi cһSST NKiFGѭӡQJQKѭFNJQJSKKӧp Giҧ sӱ FK~QJWDѭӟFOѭӧQJÿѭӧc m mô hình ARIMA
%ѭӟc 3: KiӇm tra chҭQÿRiQ
6RViQKFiFP{KuQK$5,0$ÿmѭӟFOѭӧng vӟi các mô hình truyӅn hoһc giӳa các mô hình ARIMA vӟLQKDXÿӇ chӑn mô hình tӕt nhҩt
%ѭӟc 4: Dӵ báo
7URQJÿDVӕ WUѭӡng hӧp mô hình ARIMA cho kӃt quҧ dӵ báo ngҳn hҥQÿiQJWLQFұy nhҩWWURQJFiFSKѭѫQJSKiSGӵ báo Tuy nhiên giӟi hҥn cӫa ARIMA là: Sӕ quan sát cҫn cho dӵ báo phҧi lӟn ChӍ GQJ ÿӇ dӵ báo ngҳn hҥn không thӇ ÿѭD FiF \Ӄu tӕ WKD\ÿәi có ҧQKKѭӣQJÿӃn biӃn sӕ cҫn dӵ báo cӫa thӡi kǤ cҫn dӵ báo vào mô hình Xây dӵQJP{KuQK$5,0$WKHRSKѭѫQJSKiSOXұn Box HQNLQVFyOѭӧng tính toán khá lӟQQrQÿzLKӓi phҧi có phҫn mӅm kinh tӃ Oѭӧng chuyên dùng
1.3.7 3KѭѫQJSKiSKӑc máy mҥQJQѫ-ron nhân tҥo
Các mô hình mҥQJQѫ-ron truyӅn thӕng không thӇ OѭXFiFWK{QJWLQTXiNKӭ Vì vұy mҥQJQѫ-ron hӗi quy (Recurrent Neural Network - 511 VLQKUDÿӇ giҧi quyӃt vҩn ÿӅ ÿy 0ҥng này chӭa các vòng lһp bên trong cho phép thông tin có thӇ OѭX Oҥi ÿѭӧc Tuy nhiên vӟi khoҧng cách lӟn dҫn thì RNN không thӇ nhӟ và hӑFÿѭӧc nӳa
Trang 23Hình 3 MҥQJQѫ-ron hӗi quy
Long Short-Term Memory Networks (LSTM) là dҥQJÿһc biӋt cӫa mҥQJQѫ-ron hӗi quy, nó có khҧ QăQJ Kӑc ÿѭӧc các phө thuӝF [D /670 ÿѭӧc giӟi thiӋu bӣi +RFKUHLWHU 6FKPLGKXEHU YjVDXÿyÿmÿѭӧc cҧi tiӃn và phә biӃn bӣi rҩt nhiӅXQJѭӡi
/670ÿѭӧc thiӃt kӃ ÿӇ WUiQK ÿѭӧc vҩQÿӅ phө thuӝc xa (long-term dependency) Nên nó có thӇ nhӟ thông tin trong suӕt thӡi gian dài, chӭ ta không cҫn phҧi huҩn luyӋQQyÿӇ có thӇ nhӟ ÿѭӧc
Mӝt trong nhӳng ӭng dөng cӫD/670OjÿӇ dӵ báo chuӛi thӡi gian Hình 3.2 mҥQJQѫ-ron nhân tҥo
Trang 242.1 Ӭng dөng mҥQJQѫ-ron dӵ báo chuӛi thӡi gian
Nhóm tác giҧ TrҫQ Ĉӭc Minh, TrҫQ +X\ 'ѭѫQJ 9NJ Ĉӭc Thi nghiên cӭX ÿӅ tài ³Mӝt sӕ vҩQÿӅ vӅ dӵ báo dӳ liӋu chuӛi thӡi gian´ [3] Trong nghiên cӭu, các tác giҧ ÿmSKkQWtFKFiFFiFKWLӃp cұn lӵa chӑn mô hình và quy trình áp dөng dӵ báo dӳ liӋu chuӛi thӡi gian tұp trung vào ӭng dөng mҥng Qѫ-ron Các tác giҧ FNJQJ QKұn ÿӏnh, các bài toán dӵ báo chuӛi thӡLJLDQWKѭӡng khó vì chúng ta khó có thӇ nhұn biӃWFK~QJFyFiFÿһFÿLӇm quá trình là tuyӃn tính hay phi tuyӃQWtQKÿһc biӋWÿӕi vӟi các dӳ liӋu lӟn, phӭc tҥp
2.2 Dӵ báo chuӛi thӡi gian mӡ dӵa trên ngӳ QJKƭD
Nhóm tác giҧ NguyӉn Duy HiӃX9NJ1Kѭ/kQ1JX\Ӊn Cát Hӗ vӟLÿӅ WjL³Dӵ báo chuӛi thӡi gian mӡ dӵa trên ngӳ QJKƭD´ [4] 7URQJ ÿӅ tài, các tác giҧ giӟi thiӋu chuӛi thӡi gian mӡQJKƭDOj[HP[pWJLiWUӏ ÿӏQKOѭӧng cӫa các giá trӏ trong chuӛi thӡi gian tӯ JyFÿӝ ÿӏnh tính Tӯ ÿyFKX\Ӈn bài toán dӵ báo vӅ viӋc dӵ báo các giá trӏ ngôn ngӳ cӫa các biӃn ngôn ngӳ KL ÿy Fy WKӇ sӱ dөng các luұt mӡ, các suy luұn mӡ ÿӇ có thӇ ÿѭDUDNӃt quҧ dӵ báo Quan hӋ mӡ là nӃu quan sát Y(t) tҥi thӡi ÿLӇm t có thӇ suy ra tӯ giá trӏ TXDQViWWUѭӟFÿy<W-n) Y(t-2)Y(t-1)
Trang 25ĈӅ tài này không ÿӅ cұSÿӃn viӋc áp dөng cho dӳ liӋu tài chính vӟi các tính chҩt QKѭtính mùa vө[XKѭӟng, chu kǤ
2.3 Sӱ dөng mô hình máy hӑFÿӇ dӵ báo doanh sӕ bán hàng
Tác giҧ %RKGDQ 0 3DYO\VKHQNR ÿm WKӵc hiӋn nghiên cӭu khoa hӑc vӟL ÿӅ tài ³0DFKLQH-Learning Models for Sales Time Series Forecasting´ [5] ÿѭӧc công bӕ trên MDPI ngày 18/01/2019 Tác giҧ ÿmQJKLrQFӭu viӋc sӱ dөng các mô hình máy hӑc ÿӇ phân tích và dӵ ÿRiQGRDQKVӕ bán hàng Mөc tiêu chính cӫa nghiên cӭu là xem xét các cách tiӃp cұn và vӅ viӋc sӱ dөng máy hӑF ÿӇ dӵ báo doanh sӕ bán hàng Theo kӃt quҧ nghiên cӭu thì có thӇ dӵ ÿRiQ GRDQK Vӕ bán hàng khi có mӝt Oѭӧng nhӓ dӳ liӋu lӏch sӱ cho chuӛi thӡLJLDQEiQKjQJWURQJWUѭӡng hӧp sҧn phҭm hoһc cӱa hàng mӟLÿѭӧFWXQJUD&NJQJWKHRQJKLrQFӭu, bҵng cách sӱ dөng kӻ thuұt xӃp chӗng (stacking techniques), tác giҧ cho rҵng có thӇ cҧi thiӋn hiӋu suҩt cӫa các mô hình dӵ ÿRiQÿӇ dӵ báo chuӛi thӡi gian bán hàng
Trong nghiên cӭu tác giҧ ÿѭD UD NӃt luұn viӋc sӱ dөng mô hình máy hӑc cө thӇ mҥQJ Qѫ-ron (neural network) có thӇ dӵ báo khi có chӍ Oѭӧng nhӓ dӳ liӋu lӏch sӱ cho chuӛi thӡLJLDQÿy7X\QKLrQWiFJLҧ FNJQJNKҷQJÿӏnh viӋc sӱ dөQJFiFSKѭѫQJpháp tiӃp cұn hӗLTX\ÿӇ dӵ EiREiQKjQJWKѭӡng có thӇ chúng ta kӃt quҧ tӕWKѫQ
2.4 Sӱ dөng máy hӑFÿӇ dӵ báo vӅ thӏ WUѭӡng chӭng khoán
Nhóm nghiên cӭu gӗm các tác giҧ Bjoern Krollner, Bruce Vanstone, Gavin Finnie nghiên cӭu khoa hӑc vӟL ÿӅ tài "Financial Time Series Forecasting with Machine Learning Techniques: A Survey" (2010) [6] Nghiên cӭXQj\ÿѭӧc trình bày tҥL³WKHEuropean symposium on artificial neural networks: Computational and machine OHDUQLQJ%UXJHV%HOJLXP´&iFWiFJLҧ ÿmQJKLrQFӭu khҧo sát các tài liӋXWUѭӟFÿyvӅ kӻ thuұt máy hӑc và trí tuӋ nhân tҥRÿѭӧc sӱ dөQJÿӇ dӵ báo vӅ thӏ WUѭӡng chӭng khoán Theo tác giҧ công nghӋ dӵa trên mҥQJQѫ-URQÿѭӧc chҩp nhұn và phù hӧp WURQJOƭQKYӵc dӵ báo chӍ sӕ chӭng khoán
2.5 Sӱ dөQJ690ÿӇ dӵ báo chuӛi thӡi gian tài chính
Tác giҧ Mahmoud K Okasha vӟL ÿӅ WjL ³Using Support Vector Machines in FinanciaO7LPH6HULHV)RUHFDVWLQJ´ [7] Tác giҧ ÿmÿӅ xuҩt sӱ dөng máy ver-WѫKӛ trӧ 690