Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 76 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
76
Dung lượng
1,7 MB
Nội dung
I H C À N NG TR NG IH CS PH M - NGUY N T XÂY D NG NG THU TH Y NG D NG D BÁO CH S VÀ TÌNH HÌNH L M PHÁT KINH T VI T NAM N N M 2020 LU N V N TH C S H TH NG THÔNG TIN À N NG, N M 2019 CPI I H C À N NG TR NG IH CS PH M - NGUY N T XÂY D NG NG THU TH Y NG D NG D BÁO CH S CPI VÀ TÌNH HÌNH L M PHÁT KINH T VI T NAM N N M 2020 Chuyên ngành: Hệ thống thông tin Mã số: 848.04.01 LU N V N TH C S Ng ih ng d n khoa h c: PGS.TS NGUY N THANH BÌNH À N NG, N M 2019 ii M CL C L I CAM OAN i M C L C ii DANH M C CÁC CH VI T T T .v DANH M C CÁC B NG vi DANH M C CÁC HÌNH vii M U 1 Lý ch n tài M c tiêu nghiên c u .4 it Ph ng ph m vi nghiên c u ng pháp nghiên c u 5 B c c c a Lu n v n CH NG T NG QUAN V CH S GIÁ TIÊU DÙNG (CPI) VÀ L M PHÁT KINH T 1.1 CÁC KHÁI NI M C B N 1.1.1 Khái ni m v d báo[2] 1.1.2 Khái ni m v Ch s giá tiêu dùng(CPI) [8] .7 1.1.3 Vai trò c a ch s CPI [8] 1.1.4 M c ích c a ch s CPI [8] 1.1.5 Khái ni m v l m phát [8] 1.1.6 S khác gi a CPI l m phát 1.1.7 Cơng th c tính ch s CPI L m phát [8] 1.2 Ý NGH A, VAI TRỊ C A PHÂN TÍCH VÀ D RA QUY T BÁO TRONG QUÁ TRÌNH NH 10 1.2.1 Ý ngh a 10 1.2.2 Vai trò .11 1.3 CÁC NHÂN T CHÍNH TÁC NG N CH S CPI VÀ TÌNH HÌNH L M PHÁT KINH T 11 iii K t lu n ch CH ng .13 NG KHAI PHÁ D LI U VÀ CÁC K THU T PHÂN TÍCH D BÁO 14 2.1 KHAI PHÁ D LI U 14 2.1.1 Khái ni m KPDL 14 2.1.2 Các b c xây d ng m t gi i pháp v KPDL 15 2.2 M T S BÀI TOÁN C A KPDL 16 2.2.1 Bài toán phân lo i 16 2.2.2 Bài toán phân c m 16 2.2.3 Bài tốn phân tích lu t k t h p .16 2.2.4 Bài toán h i quy 17 2.2.5 Bài toán d oán .17 2.2.6 Bài toán phân tích chu i 17 2.2.7 Bài tốn phân tích l ch .17 2.3 NG D NG KPDL TRONG D 2.3.1 Cây quy t BÁO 18 nh 18 2.3.2 Phân l p Naïve Bayes 23 2.3.3 M ng n ron nhân t o 24 2.3.4 Lu t k t h p 27 2.3.5 Gi i thi u v công c weka 29 K t lu n ch CH ng .31 NG XÂY D NG H TH NG D TÌNH HÌNH L M PHÁT KINH T BÁO CH S CPI VÀ D BÁO N N M 2020 .32 3.1 PHÁT BI U BÀI TOÁN 32 3.2 GI I PHÁP D L M PHÁT KINH T BÁO CH S GIÁ TIÊU DÙNG (CPI) VÀ TÌNH HÌNH N N M 2020 33 3.2.1 Ti n x lý d li u 34 3.2.2 Quan sát t p d li u 34 3.2.3 Làm s ch d li u 36 iv 3.2.4 Chu n b phân chia t p d 41 3.2.5 Xây d ng mơ hình 41 3.3 ÁNH GIÁ, NH N XÉT K T QU MƠ HÌNH .48 3.4 XÂY D NG K t lu n ch NG D NG 51 ng 52 K T LU N CHUNG VÀ H TÀI LI U THAM KH O NG PHÁT TRI N TÀI 54 v DANH M C CÁC CH VI T T T TT Ký hi u Gi i thích 01 ARFF nh d ng t p tin thu c tính - quan h 02 CPI Ch s giá tiêu dùng 03 KPDL Khai phá d li u 04 TCTK T ng c c th ng kê 04 WEKA Công c h tr khai phá d li u vi DANH M C CÁC B NG S hi u b ng 3.1 Tên b ng C u trúc d li u d báo ch s giá tiêu dùng l m phát kinh t Vi t Nam Trang 34 3.2 B ng l a ch n thu c tính xây d ng mơ hình 38 3.3 B ng t ng h p k t qu phân tích mơ hình 50 50 Ch s cịn c g i nh y c a mơ hình xem xét có kh n ng t ng quát hóa nh th F1-score harmonic mean c a precision recall (gi s r ng hai l i ng khác không) F1-score = F1-score cao, b phân l p t t T ng h p k t qu t mơ hình nh sau: B ng 3.3 score có giá tr n m n a kho ng B ng t ng h p k t qu phân tích mơ hình Classifier MAE Test Train Precision Recall F1-score Test Train Test Train Test Train Test Error_rate Train Test 0.1148 0.1152 0.2381 0.2186 0.933 0.961 0.935 0.935 0.934 0.948 0.067 0.039 NaiveBayes 0.1285 0.1144 0.3069 0.2687 0.883 0.907 0.887 0.871 0.885 0.889 0.117 BayesNet 0.093 0.1235 0.1436 0.2698 0.2808 0.916 0.945 0.909 0.871 0.912 0.906 0.084 0.055 Tree J48 0.1028 0.0889 0.2267 0.1705 0.940 0.976 0.942 0.986 0.941 0.981 0.060 0.058 K=1 0.0551 0.061 0.1621 0.1534 0.963 0.969 0.961 0.968 0.962 0.968 0.037 0.031 K=2 0.1006 0.1131 0.2133 0.2058 0.929 0.969 0.922 0.968 0.925 0.968 0.071 0.078 K=3 0.116 0.1128 0.2375 0.2153 0.919 0.967 0.922 0.968 0.92 0.967 0.081 0.033 SMO 0.0909 0.129 0.3015 0.3529 0.920 0.945 0.909 0.871 0.914 0.906 0.080 0.055 0.0633 0.0678 0.1668 0.1529 0.961 0.976 0.961 0.968 0.961 0.972 0.039 0.033 Logistic Train RMSE kNN Multilayer Perceptron 51 Hình 3.19 Bi u so sánh k t qu d báo mơ hình D a vào b ng k t qu phân tích bi u k t lu n r ng i v i t p d li u so sánh có th ã có lu n v n mơ hình MultilayerPerceptron cho k t qu d báo xác cao nh t (> 96%), t l d báo l i th p nh t (< 4%) t p d li u hu n luy n cho k t qu d báo xác cao nh t (> 96.5%), t l d báo l i th p nh t (x p x 3.5%) ki m th t l F1-score t p d li u i v i t p d li u hu n luy n > 96%, t p ki m th > 97%, t l F1 cao cho th y b phân l p t t V y, ta có th u tiên l a ch n mơ hình Multilayer Perceptron cho tốn 3.4 XÂY D NG H th ng B c ch ng NG D NG c xây d ng b ng ngôn ng JAVA n n t ng JDK u, h th ng k t n i v i CSDL s d ng mơ hình ã xây d ng a d báo ch s giá tiêu dùng cpi tình hình l m phát kinh t Vi t Nam n n m 2020 Ng a k t qu d báo kèm theo i dùng có th l a ch n t xác c a d báo ng d ng bên d i 52 Hình 3.20 ng d ng d báo ch s giá tiêu dùng CPI tình hình l m phát kinh t n n m 2020 K t lu n ch Nh v y xây d ng hình l m phát kinh t Tr ng c ng d ng d báo ch sơ giá tiêu dùng tình n n m c n ph i th c hi n m t s công vi c sau: c tiên, t i file d li u Ch s giá tiêu dùng, ch s giá vàng ô la M tháng n m so v i tháng tr c t m c s li u th ng kê c a trang web T ng c c th ng kê Vi t Nam cung c p chuy n file d li u xml v d ng.csv ho c arff nh d ng file xml, ti p theo th c hi n c công c h tr Weka, ti p theo ti n x lý d li u t o thu c tính phân l p cho l p t ng ng v i d báo ch s cpi t ng, l p t ch s cpi gi m t ó a quy t ng ng v i d báo nh d báo l m phát tình hình kinh t r i phân chia t p d li u thành 80% làm t p d li u hu n luy n (training dataset) 20% làm t p d li u ki m th (test set/validation set) Sau ó s d ng t p d li u training xây d ng mơ hình phân l p (Logistic, Naive Bayes, Bayes Net, Tree J48, KNN, SMO, Multilayer Perceptron) so sánh, ánh 53 giá k t qu c a t ng mơ hình d a k t qu RMSE, Precision, Recall, Error_rate làm m c tiêu phân tích ánh giá MAE, có th xác nh mơ hình t t hay khơng t t Cu i ph i s d ng t p d li u test ki m ch ng l i xem k t qu ánh giá có th c s phù h p hi u qu v i b d li u train khơng, mơ hình cho k t qu t l d báo xác cao nh t t l l i th p nh t t c u tiên l a ch n D báo ch s giá tiêu dùng (CPI) ng lai lu n v n mà ã s d ng d li u th i gian t tháng 1/2002 n tháng 12/2017 c a T ng c c th ng kê Vi t Nam T k t qu nghiên c u k t có th k t lu n r ng u tiên l a ch n mơ hình MultilayerPerceptron d ốn ch s CPI n n m 2020 t k t qu d báo CPI d báo tình hình l m phát kinh t 54 K T LU N CHUNG VÀ H NG PHÁT TRI N TÀI K t lu n chung Qua trình nghiên c u tìm hi u v v n v t m quan tr ng c a vi c d báo ch s giá tiêu dùng (CPI) tình hình l m phát kinh t t i Vi t Nam m t s v n liên quan t i khai phá d li u xây d ng mơ hình d báo, lu n v n ã hoàn thành Lu n v n ã trình bày t c m t s k t qu nh sau: c vai trò t m quan tr ng c a vi c d báo ch s giá tiêu dùng (CPI) l m phát kinh t t i Vi t Nam Nghiên c u c s lý thuy t liên quan n k thu t xây d ng mơ hình d báo khai phá d li u xây d ng mơ hình b ng cơng c WEKA i v i toán d báo ch s giá tiêu dùng cpi tình hình l m phát kinh t Vi t Nam n n m 2020, lu n v n ã xây d ng mô hình d báo Logistic, Naive Bayes, Bayes Net, Tree J48, KNN, SMO, Multilayer Perceptron V i d li u t T ng c c th ng kê Vi t Nam, s li u thu th p 192 instance th i gian t 1/2002-12/2017 d li u thu th p c c có th i gian liên t c, khơng gián o n Qua nghiên c u phân tích, l a ch n ánh giá u tiên l a ch n mơ hình MultilayerPerceptron phù h p nh t v i t p d li u ã thu th p Trên c s tri th c phát hi n c t mơ hình d báo, lu n v n ti n hành xây d ng ng d ng d báo ch s giá tiêu dùng CPI tình hình l m phát kinh t Vi t Nam n n m 2020 V i vi c tri n khai th nghi m ng d ng d báo ch s giá tiêu dùng (CPI) tình hình l m phát kinh t Vi t Nam n n m 2020 th i a quy t ng d ng s góp ph n h tr cho nhà qu n lý k p nh úng n ho t ng kinh t , bình n giá tr ti n t , ki m ch l m phát Bên c nh nh ng k t qu d ng ph ng pháp phân tích t c, a mơ hình d báo vào vi c xây d báo, ki m ch ng th c t ánh giá k t 55 qu m t cách th ng xuyên B n thân nh n th y ây m t ng d ng có tính th c ti n cao, d báo ch s giá tiêu dùng t t s d n n ki m ch l m phát t t i u ó mang l i nhi u l i ích cho n n kinh t qu c gia c ng nh nhà u t doanh nghi p doanh ho ch H a quy t nh úng n kinh nh kinh t ng phát tri n Trong t ng lai, hy v ng nghiên c u i sâu h n b ng vi c th o lu n d báo ch s giá tiêu dùng l m phát th i gian b ng cách s d ng công ngh tiên ti n h n: bigdata, áp d ng môi tr ám mây, s d ng ph pháp m i ng i n toán ng pháp deeplearning tích h p nhi u ph ng cho m t ng d ng hoàn h o h n v i xác xu t d báo xác nh t Nghiên c u có th phát tri n t t h n b ng cách thêm bi n liên quan n tính ch t theo mùa, vùng th i gian d báo TÀI LI U THAM KH O Ti ng Vi t: [1] Nguy n Nh t Quang, Khai phá d li u.pdf [2] Nguy n V n Huân, Ph m Vi t Bình, Phân tích d báo kinh t , Nhà xu t b n khoa h c k thu t Hà N i 2012 Ti ng Anh: [3] Zhou, Shuigeng, Zhang, Songmao, Karypis, George (Eds.), Advanced Data Mining and Applications 8th International Conference, ADMA 2012, Nanjing, China, December 15-18, 2012, Proceedings pdf [4] Zhi-Hua Zhou, Data mining.pfd [5] Rance D Necaise, Data Structures and Algorithms Using Python.pdf Internet, c ng thông tin i n t [6] Thông t s 02/2012/TT-BKH T ngày tháng n m 2012 c a B K ho ch 1994 u t v Quy nh n m 2010 làm n m g c thay cho n m g c tính ch tiêu th ng kê theo giá so sánh [7] T p chí tài chính, http://tapchitaichinh.vn/kinh-te-vi-mo/ [8] T ng c c th ng kê, https://www.gso.gov.vn/default.aspx?tabid=628 [9] Ngân hàng nhà n c Vi t Nam, https://www.sbv.gov.vn/webcenter/portal/vi/menu/rm/cpi? [10] Trung tâm thông tin d báo xã h i qu c gia, http://ncif.gov.vn [11] T p chí kinh t d báo, http://kinhtevadubao.vn/danh-sach/214/tap-chikinh-te-va-du-bao.html [12] Data mining Concepts and Techniques, Second Edition, http://ccs1.hnue.edu.vn/hungtd/DM2012/DataMining_BOOK.pdf [13] Data Mining: Concepts and Techniques, 3rd Edition, http://myweb.sabanciuniv.edu/rdehkharghani/files/2016/02/The-MorganKaufmann-Series-in-Data-Management-Systems-Jiawei-Han-Micheline- Kamber-Jian-Pei-Data-Mining.-Concepts-and-Techniques-3rd-EditionMorgan-Kaufmann-2011.pdf [14] Introduction to Programming Using Java, http://math.hws.edu/eck/cs124/downloads/javanotes6-linked.pdf [15] Census Data Mining and Data Analysis using WEKA pdf https://arxiv.org/ftp/arxiv/papers/1310/1310.4647.pdf [16] Advanced java, http://enos.itcollege.ee/~jpoial/allalaadimised/reading/Advancedjava.pdf ... NG XÂY D NG H TH NG D TÌNH HÌNH L M PHÁT KINH T BÁO CH S CPI VÀ D BÁO N N M 2020 .32 3.1 PHÁT BI U BÀI TOÁN 32 3.2 GI I PHÁP D L M PHÁT KINH T BÁO CH S GIÁ TIÊU DÙNG (CPI) VÀ TÌNH... CPI tình hình l m phát kinh t v i nh ng lý nêu nên quy t nh ch n tài Xây d ng ng d ng d báo ch s CPI tình hình l m phát kinh t t i Vi t Nam n n m 2020 Trên c s nghiên c u lu n v n t p trung vào... giá tình hình CPI l m phát t i Vi t Nam d a vào ch s kinh t GDP, t ng tr vi c làm ng, l m phát, m t cân i v mô, i s ng, thu nh p, - D báo ch s giá tiêu dùng (CPI) tình hình l m phát nn m 2020