Như vậy, nếu lạm phát có thể dự đoán được thì sẽ không còn gây nên gánh nặng lớn đối với nền kinh tế bởi người ta có thể đưa ra các giải pháp phù hợp với nó, ngược lại nếu không thể dự b
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
Trang 2MỤC LỤC
MỤC LỤC 1
LỜI CAM ĐOAN 4
DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT 5
DANH MỤC HÌNH VẼ 6
DANH MỤC BẢNG BIỂU 8
PHẦN MỞ ĐẦU 9
CHƯƠNG 1: TỔNG QUAN VỀ DỰ BÁO 11
1.1 GIỚI THIỆU 11
1.1.1 Khái niệm về dự báo 11
1.1.2 Dự báo kinh tế 12
1.1.2.1 Phân loại dự báo kinh tế 13
1.1.2.2 Mơ hình bài tốn dự báo kinh tế 14
1.1.2.3 Một số mơ hình dự báo 16
1 2 CÁC PHƯƠNG PHÁP SỬ DỤNG TRONG DỰ BÁO KINH TẾ 18
1.2.1 Dự báo kinh tế sử dụng mơ hình kinh tế lượng 18
1.2.1.1 Mơ hình hồi quy 20
1.2.1.2 Mơ hình chuỗi thời gian 21
1.2.2 Dự báo kinh tế bằng cách tiếp cận mơ hình học máy 22
1.2.2.1 Khái niệm 22
1.2.2.2 Mơ hình dự báo dựa trên học máy 23
1.2.2.3 Mạng nơ ron 24
1.2.2.4 Nạve Bayes 25
Trang 31.2.2.5 K-láng giềng gần nhất (K-NN) 26
1.3 PHƯƠNG PHÁP ĐÁNH GIÁ DỰ BÁO 27
CHƯƠNG 2: ỨNG DỤNG MẠNG NƠ RON TRONG DỰ BÁO LẠM PHÁT KINH TẾ 29
2.1 MẠNG NƠ RON NHÂN TẠO 29
2.1.1 Định nghĩa mạng Nơron nhân tạo (Artificial Neural Network -ANN): 29
2.1.2 Các tính chất của mạng Nơron 29
2.1.3 Cấu trúc mạng nơ – ron 30
2.1.3.1 Đơn vị xử lý perceptron 30
2.1.3.2 Tiến trình học của mạng nơ ron 31
2.1.3.3 Mạng nơ ron nhiều lớp: 31
2.1.3.4 Phương pháp học trên mạng nơ ron 33
2.1.3.5 Học tham số: 33
2.1.3.6 Học giám sát với thuật toán lan truyền ngược 34
2.1.3.7 Thuật toán lan truyền ngược 37
2.2 LẠM PHÁT KINH TẾ 37
2.2.1 Khái niệm lạm phát 37
2.2.2 Phân loại lạm phát 39
2.2.3 Các phương pháp tính lạm phát 40
2.3 ỨNG DỤNG MẠNG NƠ RON TRONG DỰ BÁO LẠM PHÁT 41
Trang 4CHƯƠNG 3: PHÁT TRIỂN ỨNG DỤNG MẠNG NƠ RON TRONG DỰ
BÁO LẠM PHÁT KINH TẾ 45
3.1 PHÂN TÍCH KIẾN TRÚC TỔNG QUÁT CỦA HỆ THỐNG 45
3.1.1 Yêu cầu của hệ thống 45
3.1.2 Các chức năng cơ bản của hệ thống 45
3.2 GIẢI PHÁP CÔNG NGHỆ VÀ NGÔN NGỮ LẬP TRÌNH 46
3.2.1 Hệ quản trị CSDL Microsoft SQL Server 2012 46
3.2.2 Microsoft Net 47
3.2.2.1 Kiến trúc của Microsoft NET 47
3.2.2.2 Microsoft NET Framework 47
3.2.3 Ngôn ngữ lập trình C# 47
3.3 KẾT QUẢ THỬ NGHIỆM 48
3.3.1 Nguồn dữ liệu sử dụng 48
3.3.2 Dữ liệu dùng cho thử nghiệm: 50
3.3.3 Kết quả thử nghiệm 51
3.4 MỘT SỐ GIAO DIỆN CỦA HỆ THỐNG 53
3.5 KẾT LUẬN CHƯƠNG 3 56
KẾT LUẬN 57
TÀI LIỆU THAM KHẢO 58
Trang 5LỜI CAM ĐOAN
Trước hết, em gửi lời cảm ơn chân thành tới tập thể các thầy cô trong Viện Công nghệ Thông tin và Truyền thông, Trường Đại học Bách Khoa Hà Nội đã tạo môi trường tốt để em được học tập và nghiên cứu Em cũng xin cảm ơn các thầy cô trong Viện đào tạo sau đại học đã quan tâm đến khóa học này, tạo điều kiện cho các học viên có điều kiện thuận lợi để học tập và nghiên cứu Đặc biệt, em xin gửi lời cảm ơn sâu sắc đến TS Nguyễn Thị Thu Hà, Trường Đại học Điện lực Hà Nội đã tận tình chỉ bảo, hướng dẫn và sửa chữa chi tiết cho nội dung của luận văn này
Em cam đoan rằng nội dung của luận văn này là do em hoàn toàn tìm hiểu, nghiên cứu và viết ra, em đã thực hiện từng bước cẩn thận theo sự định hướng, hướng dẫn tận tình của giáo viên hướng dẫn Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng tên tác giả, tên công trình, thời gian, địa điểm công bố
Em xin chịu trách nhiệm với nội dung trong luận văn này
Người thực hiện đề tài
Trần Thị Hà
Trang 6DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT
CNTT Công nghệ Thông tin
MLR Multiple Linear Regression
HW Holt – Winters
ARIMA AutoRegressive Integrated Moving Average
ARMA Autoregressive Moving Average
MAPE Mean Absolute Percentage Error
K-NN K-láng giềng gần nhất
MAE Muan Absolute Error
RMSE Root Mean Squared Error
MAPE Mean Absolute Percentage
ANN Artificial Neural Network
MIMO Many Input Many Output
LMS Least Means Square
WPI Worcester Polytechnic Institute
CPI Consumer Price Index
PPI Producer Price Index
VAR Vector Autoregression
AR Univariate Autoregression
OECD Organization for Economic Co-Operation and Development
KRLS Kitchigami Regional Library System
GDP Gross Domestic Product
Trang 7DANH MỤC HÌNH VẼ
Hình 1.1: Mơ hình một bài tốn dự báo 15
Hình 1.2: Mơ hình dự báo cơ bản 16
Hình 1.3: Mơ hình dự báo nhân quả 17
Hình 1.4: Mơ hình dự báo theo xu hướng 18
Hình 1.5: Mơ hình lương và chi tiêu trong gia đình 18
Hình 1.6: Kết quả thử nghiệm với mơ hình HW 21
Hình 1.7: Kết quả thử nghiệm với mơ hình ARIMA 21
Hình 1.8: Dự báo dựa trên mơ hình học máy 24
Hình 1.9: Mơ hình dự báo năng lượng giĩ 25
Hình 1.10: Mơ hình dự báo giá bán lẻ dựa trên Nạve Bayes 26
Hình 2.1: Cấu trúc một perceptron 30
Hình 2.2: Mạng nơ ron nhiều lớp 32
Hình 2.3: Mạng nơ ron 3 lớp 35
Hình 2.4: Biểu đồ thể hiện lạm phát Việt Nam và trung bình thế giới 42
Hình 2.5: Kiến trúc mạng nơ ron dự báo sử dụng trong luận văn 44
Hình 3.1: Sơ đồ chức năng hệ thống dự báo 45
Hình 3.2: Biểu đồ Use case tổng quát 46
Hình 3.3: Các dịch vụ của SQL server 2012 47
Hình 3.4: Thành phần chính của Microsoft NET 47
Hình 3.5: Microsoft NET Framework 47
Hình 3.6: Ngân hàng dữ liệu thế giới 49
Hình 3.7: Tổng cục thống kê Việt Nam 50
Trang 8Hình 3.11: Giao diện tạo mới dữ liệu 55 Hình 3.12: Giao diện chỉnh sửa dữ liệu 55 Hình 3.13: Giao diện dự báo lạm phát 56
Trang 9DANH MỤC BẢNG BIỂU
Bảng 1.1: Tỉ lệ phần trăm thu nhập và tiêu dùng thời trang 19
Bảng 3.1: Mô tả dữ liệu thử nghiệm 50
Bảng 3.2: Bộ dữ liệu thử nghiệm 51
Bảng 3.3: Kết quả thử nghiệm 52
Trang 10PHẦN MỞ ĐẦU
Công nghệ Thông tin ngày càng phát triển và thành tựu của nó được ứng dụng trong hầu hết các ngành, lĩnh vực hoạt động của đời sống xã hội và mang lại nhiều hiệu quả to lớn, góp phần thúc đẩy sự phát triển chung của xã hội, đặc biệt nó còn góp phần duy trì, điều phối sự phát triển một cách ổn định của nền kinh tế
Tình hình biến động kinh tế của thế giới ngày càng diễn biến phức tạp Sự biến động của nền kinh tế vĩ mô sẽ tác động rất lớn đến sự ổn định và phát triển kinh tế của một quốc gia Lạm phát là một trong những nhân tố của nền kinh tế vĩ
mô, rất được quan tâm và cần thiết phải dự báo
Lạm phát là một hiện tượng kinh tế vĩ mô phổ biến, có ảnh hưởng sâu rộng đến mọi mặt của đời sống kinh tế - xã hội Lạm phát có tác động cả tích cực và tiêu cực, tuỳ thuộc vào khả năng thích ứng với sự thay đổi của lạm phát và mức độ tiên liệu về lạm phát Đối với nhà sản xuất, tỷ lệ lạm phát cao làm cho giá đầu vào và đầu ra biến động, gây ra sự mất ổn định trong quá trình sản xuất Đối với lĩnh vực lưu thông, lạm phát thúc đẩy quá trình đầu cơ tích trữ dẫn đến khan hiếm hàng hoá Đối với lĩnh vực tín dụng, lạm phát làm rối loạn hoạt động của hệ thống ngân hàng
Cụ thể là lượng tiền gửi vào ngân hàng sẽ giảm do sự điều chỉnh lãi suất tiền gửi không đủ làm an tâm những người đang có tiền nhàn rỗi, trong khi đó những người
đi vay lại được lợi lớn nhờ vào sự mất giá của đồng tiền Trong điều kiện các nhân
tố khác không đổi, lạm phát xảy ra sẽ làm tăng tỷ giá hối đoái, do đó tăng cường tính cạnh tranh của hàng xuất khẩu nhưng đồng thời cũng gây bất lợi cho hoạt động nhập khẩu Lạm phát còn gây thiệt hại cho Ngân hàng Nhà nước bằng việc bào mòn giá trị thực của những khoản công phí
Ngoài ra nếu để tình trạng lạm phát kéo dài và không đoán trước được sẽ làm cho nguồn thu Ngân sách Nhà nước giảm sút do sản xuất suy thoái Như vậy, nếu lạm phát có thể dự đoán được thì sẽ không còn gây nên gánh nặng lớn đối với nền kinh tế bởi người ta có thể đưa ra các giải pháp phù hợp với nó, ngược lại nếu không thể dự báo được thì sẽ dẫn đến những đầu tư sai lầm và phân phối thu nhập một cách ngẫu nhiên làm mất cân bằng của nền kinh tế Vì vậy việc dự báo lạm phát
Trang 11có ý nghĩa vô cùng quan trọng đối với các nhà hoạch định chính sách cũng như các nhà kinh doanh trong tiến trình quyết định
Đối với các nước đang phát triển, lạm phát mục tiêu (lạm phát tối ưu) là một công cụ hữu ích trong việc điều hành kinh tế vĩ mô Nếu lạm phát cao hơn lạm phát mục tiêu sẽ gây ra những tác động tiêu cực như: chi phí sản xuất của doanh nghiệp, chi phí sử dụng vốn phải tăng lên, sức mua của người tiêu dùng sẻ giảm Ngược lại nếu lạm phát thấp hay xảy ra giảm phát sẽ làm cho nền kinh tế trì trệ, không phát triển được
Vì vậy, Nhà nước cần có chính sách để kiểm soát lạm phát sát với lạm phát mục tiêu, nhằm giúp ổn định kinh tế vĩ mô và phát triển nền kinh tế Để kiểm soát lạm phát sát với lạm phát mục tiêu, các nhà làm chính sách cần phải biết được những yếu tố nào tác động đến lạm phát, dự báo được lạm phát trong tương lai, từ
đó có những điều chỉnh phù hợp nhằm đạt được mục tiêu đặt ra
Nhận thức được tầm quan trọng của công tác dự báo, đặc biệt là dự báo lạm phát Tác giả đã thực hiện đề tài “Nghiên cứu mạng nơ ron nhân tạo và ứng dụng vào dự báo lạm phát” cho luận văn tốt nghiệp của mình
Luận văn tốt nghiệp này có bố cục như sau:
Phần mở đầu
Chương 1: Tổng quan về dự báo
Chương 2: Ứng dụng mạng nơ ron trong dự báo lạm phát kinh tế
Chương 3: Xây dựng ứng dụng dự báo lạm phát sử dụng mô hình mạng nơ ron
Kết luận và hướng phát triển
Trang 12CHƯƠNG 1: TỔNG QUAN VỀ DỰ BÁO
Trong chương này trình bày các khái niệm cơ bản về dự báo, phân loại dự báo trong kỳ ngắn hạn, dài hạn và tầm quan trọng của dự báo trong phát triển kinh
tế của quốc gia Trong chương 1 này cũng giới thiệu một số các phương pháp sử dụng trong dự báo như mô hình kinh tế lượng, mô hình Time Series, các phương pháp đánh giá và thử nghiệm trong các bài toán dự báo
1.1 Giới thiệu
1.1.1 Khái niệm về dự báo
Dự báo đã hình thành từ đầu những năm 60 của thế kỉ 20 Khoa học dự báo với tư cách là một ngành khoa học độc lập có hệ thống lí luận, phương pháp luận và phương pháp hệ riêng nhằm nâng cao tính hiệu quả của dự báo
Dự báo là một khoa học và nghệ thuật tiên đoán những sự việc sẽ xảy ra trong tương lai, trên cơ sở phân tích khoa học về các dữ liệu đã thu thập được Khi tiến hành dự báo cần căn cứ vào việc thu thập, xử lý số liệu trong quá khứ và hiện tại để xác định xu hướng vận động của các hiện tượng trong tương lai nhờ vào một
số mô hình toán học (Định lượng) Tuy nhiên dự báo cũng có thể là một dự đoán chủ quan hoặc trực giác về tương lai (Định tính) và để dự báo định tính được chính xác hơn, người ta cố loại trừ những tính chủ quan của người dự báo[1]
Định nghĩa 1.1 [Dự báo]:
Dự báo là sự tiên đoán có căn cứ khoa học, mang tính chất xác suất về mức
độ, nội dung, các mối quan hệ, trạng thái, xu hướng phát triển của đối tượng nghiên cứu hoặc về cách thức và thời hạn đạt được các mục tiêu nhất định đã đề ra trong tương lai[7]
Tiên đoán được coi là một hình thức phản ánh vượt trước về thời gian hiện thực khách quan, đó là kết quả nhận thức chủ quan của con người dựa trên cơ sở nhận thức quy luật khách quan trong sự vận động và phát triển của sự vật và hiện tượng Tiên đoán gồm 03 loại khác nhau: tiên đoán có căn cứ khoa học, tiên đoán không khoa học và tiên đoán dựa trên kinh nghiệm
Trang 13Do nó chỉ là một tuyên bố về tương lai, bất cứ điều gì đều có thể dự báo ví
dụ tỷ lệ lạm phát giá tiêu dùng, thời tiết ngày mai hoặc của tháng tiếp theo, mức tăng trung bình của mực nước biển vào cuối thiên niên kỷ thứ ba, dân số của trái đất vào 10 năm tới hay giá trị của chỉ số Dow Jones tại bắt đầu năm 2010 Các kết quả
dự báo được coi là hữu ích trong việc xem xét để ra quyết định với sai số có thể chấp nhận được
1.1.2 Dự báo kinh tế
Tương lai của kinh tế, sẽ được quyết định bởi hành vi của con người trong tương lai Nó có thể đưa ra những gợi ý cho việc ra quyết định trong tương lai của các nhà kinh tế, các nhà đầu tư, hay Chính phủ của quốc gia Dự báo kinh tế ngày càng được Chính phủ các nước coi trọng và coi như là một lĩnh vực giúp cho sự phát triển của nền kinh tế đất nước Nhờ có dự báo, nhiều những hoạt động kinh tế tránh được rủi ro đánh kể Ví dụ, dự báo năm 1987 hoạt động kinh tế tại Hoa Kỳ khi các nhà phân tích tiên đoán chính xác rằng giá trị trao đổi của đồng USD sẽ giảm mạnh trong năm, chi tiêu tiêu dùng sẽ chậm lại, và rằng lãi suất sẽ tăng vừa phải Dựa vào những tiên đoán đó, mà Chính phủ có thể vận hành hoặc điều tiết nền kinh
tế theo một chiều hướng tốt hơn [9]
Định nghĩa 1.2 [Dự báo kinh tế]
Dự báo kinh tế là quá trình dự đoán trước về một sự kiện xảy ra đối với nền kinh tế có thể là toàn bộ hoặc một phần Dự báo kinh tế thường sử dụng dựa trên khoa học hoặc kinh nghiệm
Dự báo kinh tế có thể được thực hiện rất chi tiết hoặc có thể là rất chung chung Trong mọi trường hợp, dự báo giúp con người mô tả các hành vi tương lai
dự kiến của tất cả hoặc một phần của nền kinh tế và giúp hình thành cơ sở của quy
Trang 14Lúc này, mô hình phức tạp thường hơn dựa trên phân tích được dữ liệu từ quá khứ
và sử dụng chúng trong dự báo Vì thế, khi suy luận cần đòi hỏi kiến thức về lịch sử kinh tế và các nguyên tắc kinh tế, mặc dù, thậm chí sau đó, dự báo là do không có nghĩa là một con số chính xác, tuy nhiên, nó có thể là căn cứ đưa ra những quyết định lớn về kinh tế để giảm thiểu những thiệt hại xảy ra với toàn bộ hoặc một phần của nền kinh tế, thậm chí đối với các doanh nghiệp[9]
Nhiều nhà kinh tế cho rằng những thay đổi trong cung tiền xác định tỷ lệ tăng trưởng của hoạt động kinh doanh nói chung Những người khác đóng vai trò trung tâm để đầu tư vào cơ sở mới nhà ở, nhà máy công nghiệp, đường cao tốc, và
vv Tại Hoa Kỳ, nơi mà người tiêu dùng chiếm một phần lớn trong hoạt động kinh
tế, một số nhà kinh tế cho rằng quyết định của người tiêu dùng để đầu tư hoặc lưu cung cấp các manh mối chính cho các sự kiện tương lai của toàn bộ nền kinh tế
Đối với doanh nghiệp sản xuất kinh doanh, họ cần được biết hoặc tiên nghiệm được những sự kiện sắp xảy ra đối với nền kinh tế vĩ mô, từ đó họ có thể có những hoạt động phù hợp nhằm thúc đẩy hoặc phòng ngừa những rủi ro xảy ra Thiệt hại của doanh nghiệp cũng chính là thiệt hại của nền kinh tế, nó làm suy giảm GDP của một đất nước Bởi thế, những nhà đầu tư muốn có một công cụ, phương pháp đánh giá sự phát triển kinh tế của một quốc gia, một vùng hoặc một nhóm ngành có thể có những quyết định dựa trên những diễn biến kinh tế mới nhất [7],[10]
1.1.2.1 Phân loại dự báo kinh tế
Tùy theo mục đích, hình thức mà dự báo kinh tế được phân loại khác nhau [9], [10]
- Theo quy mô: dự báo kinh tế có thể phân loại thành dự báo vĩ mô và dự báo
vi mô
+ Dự báo vĩ mô được xem như dự báo có liên quan đối với toàn bộ nền kinh
tế Nó được đo bằng chỉ số của sản xuất công nghiệp, thu nhập quốc dân hoặc chi
Trang 15tiêu Ví dụ: dự báo lạm phát, dự báo xu hướng xuất nhập khẩu, dự báo GNI quốc gia,
+ Dự báo vi mô thường tập trung trong doanh nghiệp, ví dụ dự báo xu hướng của người tiêu dùng trong tháng tới để các doanh nghiệp có thể dễ dàng nắm bắt được nhu cầu và thị hướng của người tiêu dùng để cung cấp dịch vụ thích hợp
- Theo thời hạn: dự báo được phân loại thành dự báo ngắn hạn hoặc dự báo dài hạn
+ Dự báo ngắn hạn: trong một dự báo ngắn hạn, mô hình theo mùa được xem
là quan trọng nhất Nó có thể bao gồm một khoảng thời gian ba tháng, sáu tháng hoặc một năm Nó có chu kỳ theo mùa vụ
+ Dự báo dài hạn: hữu ích trong việc lập kế hoạch Nó cung cấp thông tin cho các quyết định chiến lược quan trọng Nó giúp tiết kiệm lãng phí về vật liệu, nhân lực, thời gian và năng lực
1.1.2.2 Mô hình bài toán dự báo kinh tế
Dự báo là một trong những yếu tố cần thiết để lập kế hoạch, cho dù dự báo vi
mô, hoặc vĩ mô Mô hình một bài toán dự báo được mô tả như hình dưới đây [9]
Trang 16Hình 1.1: Mô hình một bài toán dự báo
Mô hình dự báo trong hình trên bao gồm 2 pha:
- Xây dựng mô hình (model building):
+ Dữ liệu quá khứ: chi phí cho thu thập dữ liệu thường được coi là "đắt" Dữ liệu phải đảm bảo độ tin cậy mới có thể tạo ra một kết quả và chứng minh độ chính xác của mô hình đã xây dựng Mỗi một mô hình dự báo cần thiết có sự đánh giá của con người
+ Đặc tả mô hình: đây là quá trình xác định các biến sử dụng trong khi xây dựng mô hình
+ Ước lượng mô hình: ước lượng các hệ số của mô hình
+ Kiểm tra sự phù hợp của mô hình: kiểm tra sự phù hợp của mô hình và dữ liệu nhập vào
- Dự báo:
+ Dữ liệu kiểm tra: là dữ liệu cần quan sát kết quả
Trang 17+ Dự báo: sinh ra dự báo dựa trên mô hình đã xây dựng ở pha 1 và dữ liệu cần sinh ra dự báo
+ Tính ổn định: mô hình đưa ra kết quả có sai số nhiều so với chuyên gia dự báo hay không?
1.1.2.3 Một số mô hình dự báo
Có một số các mô hình dự báo như sau:
- Mô hình dự báo cơ bản:
Mô hình dự báo cơ bản bao gồm: một số yếu tố đầu vào (dữ liệu) và giả định
mô hình Một dự báo được tạo ra một số biến Trong ví dụ của dự báo bán hàng, đầu vào có thể là số lượng người bán hàng, các giả định có thể bao gồm năng suất
và số giờ làm việc, dự báo là kỳ vọng số doanh thu dự kiến cho các yếu tố đầu vào
và giả định Với mỗi dự báo, quan trọng là để quản lý quá trình thông qua sự so sánh của các biến liên quan để dự báo và sau đó làm việc trở lại thông qua các mô hình để giải thích lý do
Hình 1.2: Mô hình dự báo cơ bản
- Mô hình dự báo nhân quả:
Mô hình dự báo nhân quả sử dụng một số đầu vào cụ thể để dự báo một số đối tượng khác Ví dụ, có thể xây dựng một mô hình nhân quả để dự báo doanh thu (sản lượng) dựa trên số lượng người bán hàng (một đầu vào) Đây là loại mô hình được thể hiện trong sơ đồ trên
Trang 18Hình 1.3: Mô hình dự báo nhân quả
- Mô hình dự báo xu hướng:
Mô hình dự báo xu hướng hay mô hình suy luận tương lai là phương pháp bổ sung thêm trên biểu đồ xu hướng trong tương lai thông qua việc xem xét các chu kỳ trong quá khứ và mở rộng nó Phương pháp này được sử dụng theo mùa, chu kỳ
Mô hình này dự báo một cái gì đó bằng cách nhìn vào các giá trị trước của phần tử
đó Trong một mô hình dự báo xu hướng, dự báo doanh số bán hàng sẽ được dựa trên các giá trị trước của bán hàng, và xu hướng sử dụng, tính thời vụ, vv để phát triển một dự báo
Dữ liệu đầu vào Mô hình dự báo Kết quả dự báo
Giả thiết
Độ lệch
Giá trị thực tế
Phản hồi Quản lý lặp
Trang 19Hình 1.4 Mô hình dự báo theo xu hướng
1 2 Các phương pháp sử dụng trong dự báo kinh tế
1.2.1 Dự báo kinh tế sử dụng mô hình kinh tế lượng
Mô hình kinh tế lượng là một trong những công cụ kinh tế sử dụng để dự báo
sự phát triển tương lai của nền kinh tế Nói một cách đơn giản, kinh tế thông thường
đo lường mối quan hệ giữa các biến trong quá khứ như chi tiêu của người tiêu dùng, thu nhập hộ gia đình, mức thuế suất, lãi suất, việc làm, và sau đó dự báo những thay đổi trong một số biến sẽ ảnh hưởng đến tương lai
Ví dụ 1.1: Ảnh hưởng của lương đến chi tiêu trong gia đình
Dữ liệu đầu vào Mô hình dự báo Kết quả dự báo
Giả thiết
Độ lệch
Giá trị thực tế
Phản hồi Quản lý lặp
Dự báo xu hướng
Households
Cars, Clothing,
Business Films
(4) Households
Purchase
Payment forHousehold Purchases (USD)
Output
Output (3)
Trang 20Hình 1.5 trên mô tả các chi phí trong gia đình liên quan và ảnh hưởng tới thu nhập Ở bảng 1.1 dưới đây mô tả sự thay đổi giữa thu nhập và tiêu dùng trong gia đình về đồ dùng cá nhân như giày dép, quần áo
Bảng 1.1: Tỉ lệ phần trăm thu nhập và tiêu dùng thời trang
Từ mối quan hệ giữa những dữ liệu trên cho thấy, người Mỹ chi tiêu nhiều hơn vào quần áo và giày thu nhập hộ gia đình của họ cao hơn, nhưng họ dành ít nhất 100 tỷ $ mỗi năm Và dự báo khá chính xác khi tổng số đó sẽ được chi tiêu là:
100 $ tỷ cộng thêm 2,65 phần trăm thu nhập hộ gia đình Ở dạng phương trình, điều này được thể hiện bằng C = 100 + 0265W Sử dụng dữ liệu để xác định hoặc ước tính tất cả các giá trị tham số trong mô hình là bước quan trọng có thể biến các mô hình kinh tế toán học thành một mô hình kinh tế lượng
Kinh tế lượng là việc áp dụng các phương pháp thống kê số liệu kinh tế và được mô tả như những nhánh của kinh tế nhằm đưa ra nội dung thực nghiệm để quan hệ kinh tế Chính xác hơn, đó là "sự phân tích định lượng của các hiện tượng kinh tế thực tế dựa trên sự phát triển đồng thời của các lý thuyết và quan sát, liên quan bằng các phương pháp thích hợp của suy luận Kinh tế lượng ứng dụng sử dụng kinh tế lượng lý thuyết và số liệu thực tế để đánh giá các lý thuyết kinh tế, phát triển mô hình kinh tế, phân tích lịch sử kinh tế, và dự báo"
Dự báo từ một mô hình tuyến tính đơn giản có thể dễ dàng thu được bằng cách sử dụng phương trình
Trang 21Trong đó x là biến độc lập và y là biến phụ thuộc Hay nói các khác, x là các yếu tố liên quan tới dự báo, y là giá trị của dự báo tương ứng với các nhân tố x [9]
1.2.1.1 Mô hình hồi quy
Z Ismail và các cộng sự đã sử dụng mô hình hồi quy bội (multiple linear regression) để dự báo giá vàng tại Malaysia Trong nghiên cứu này, họ sử dụng các yếu tố kinh tế như lạm phát, biến động giá tiền tệ và những người khác Sau sự giảm giá của đồng đô la Mỹ, nhà đầu tư đổ tiền vào vàng bởi vì vàng đóng một vai trò quan trọng như một mục đầu tư ổn định Do sự gia tăng nhu cầu đối với vàng trong Malaysia và các quốc gia khác trên thế giới Họ cũng nhận thấy rằng có thể phát triển một mô hình phản ánh cấu trúc và của thị trường vàng và chuyển động dự báo giá vàng Các cách tiếp cận phù hợp nhất là mô hình hồi quy bội MLR để nghiên cứu về mối quan hệ giữa một biến duy nhất phụ thuộc và một hoặc nhiều hơn một các biến độc lập, như trường hợp này với giá vàng là biến phụ thuộc duy nhất Một mô hình đơn giản gọi là "dự báo-1" đã được coi là một mô hình chuẩn để đánh giá hiệu quả của mô hình [3], [5]
Tetyana Kuzhda đã đề xuất mô hình dự báo bán lẻ dựa trên mô hình hồi quy bội Họ cho rằng, môi trường bán lẻ gần đây có sự thay đổi, sự thay đổi này được gây ra bởi chi phí thu nhập và quảng cáo Mô hình của họ được xây dựng dựa trên các tác nhân ảnh hưởng (stage) bao gồm: ảnh hưởng kinh tế mức vĩ mô (lạm phát, cung cầu, tỉ giá hối đoái, chi tiêu Chính phủ, xuất nhập khẩu, ), yếu tố giải thích thay đổi trong kinh tế xã hội (doanh số bán lẻ, chi phí quảng cáo, ) Từ đó họ xây dựng mô hình bằng cách thu thập những dữ liệu của những tác nhân trên và xây dựng hàm toán học giải quyết vấn đề dự báo bán lẻ [12]
Vincenzo Bianco và các cộng sự dự báo về mức tiêu thụ điện tại Italy sử dụng mô hình hồi quy tuyến tính Họ cho rằng những ảnh hưởng các biến số kinh tế
Trang 22đầu người (GDP bình quân đầu người) và một phần dân số Trong phần thực nghiệm, họ có so sánh đánh giá với dự báo quốc gia dựa trên mô hình phức tạp hơn cho thấy tỉ lệ sai số là nhỏ với độ lệch chỉ +-1%
1.2.1.2 Mô hình chuỗi thời gian
Gurudeo Anand Tularam đã đề xuất phương pháp dự báo giá dầu dựa trên mô hình chuỗi thời gian, họ chứng minh rằng những dữ liệu về giá xăng dầu trong quá khứ ảnh hưởng tới giá dầu trong tương lai Trong bài báo của họ cũng thực hiện việc đánh giá độ chính xác của mô hình với giá dầu thực Ba loại mô hình đơn biến được sử dụng: làm min
số mũ (ES), Holt – Winters (HW), tự hồi quy trung bình trượt (ARIMA) Kết quả dự báo với độ chính xác 95% khi dự báo giá dầu thô West Texas Intermediate [5]
Hình 1.6: Kết quả thử nghiệm với mô hình HW
Hình 1.7: Kết quả thử nghiệm với mô hình ARIMA
Trang 23Wen-Hua Cui và các cộng sự trong năm 2014 đã thực hiện công việc dự báo
về dòng tiền trong ngân hàng nhằm mục đích tăng cường thông tin giữa dòng tiền kinh doanh và quỹ Đầu tiên họ dùng phương pháp trung bình trượt, tiếp theo làm mịn số mũ để dự đoán Hai phương pháp này đều kết hợp với chuỗi thời gian trong
dự báo dòng tiền Kết quả thực nghiệm được thực hiện với dòng tiền thực trong khoảng thời gian quý 1 năm 2011 và 2012 cho thấy rằng, phương pháp của họ đề xuất có độ chính xác khá cao [3]
1.2.2 Dự báo kinh tế bằng cách tiếp cận mô hình học máy
1.2.2.1 Khái niệm
Học máy (Machine Learning) là một ngành khoa học nghiên cứu các thuật toán cho phép máy tính có thể học được các khái niệm (concept)
Định nghĩa 1.3 [Máy học( Machine Learning )]: Máy học là một chương trình
máy tính có khả năng học hỏi kinh nghiệm đối với một tập dữ liệu trong quá khứ để thực hiện một số nhiệm vụ và cải thiện hiệu quả của nó tại một số nhiệm vụ này
Các ngành khoa học liên quan:
- Lý thuyết thống kê: các kết quả trong xác suất thống kê là tiền đề cho rất nhiều phương pháp học máy Đặc biệt, lý thuyết thống kê cho phép ước lượng sai số của các phương pháp học máy
- Các phương pháp tính: các thuật toán học máy thường sử dụng các tính toán số thực/số nguyên trên dữ liệu rất lớn Trong đó, các bài toán như: tối ưu có/không ràng buộc, giải phương trình tuyến tính v.v… được sử dụng rất phổ biến
- Khoa học máy tính: là cơ sở để thiết kế các thuật toán, đồng thời đánh giá thời gian chạy, bộ nhớ của các thuật toán học máy
- Các nhóm giải thuật học máy:
+ Học có giám sát: máy tính được xem một số mẫu gồm đầu vào (input) và
Trang 24với các quan sát Nó khác với học có giám sát là đầu ra tương ứng cho mỗi đầu vào
là không biết trước, xem các đối tượng đầu vào như một tập các biến ngẫu nhiên, sau đó nó phải tự tìm cách phân loại các mẫu này
+ Học nửa giám sát: một dạng lai giữa hai nhóm giải thuật trên
+ Học tăng cường: máy tính đưa ra quyết định hành động (action) và nhận kết quả phản hồi (response/reward) từ môi trường (environment) Sau đó máy tính tìm cách chỉnh sửa cách ra quyết định hành động của mình
- Ứng dụng của học máy: học máy có ứng dụng rộng khắp trong các ngành khoa học/sản xuất, đặc biệt những ngành cần phân tích khối lượng dữ liệu khổng lồ
+ Xử lý ngôn ngữ tự nhiên (Natural Language Processing): xử lý văn bản, giao tiếp người – máy, …
+ Nhận dạng (Pattern Recognition): nhận dạng tiếng nói, chữ viết tay, vân tay, thị giác máy (Computer Vision), …
+ Tìm kiếm (Search Engine)
+ Chẩn đoán trong y tế: phân tích ảnh X-quang, các hệ chuyên gia chẩn đoán
tự động
+ Tin sinh học: phân loại chuỗi gene, quá trình hình thành gene/protein + Vật lý: phân tích ảnh thiên văn, tác động giữa các hạt …
+ Phát hiện gian lận tài chính (financial fraud): gian lận thẻ tín dụng
+ Phân tích thị trường chứng khoán (stock market analysis)
1.2.2.2 Mô hình dự báo dựa trên học máy
Học máy sử dụng thuật toán học từ dữ liệu Các thuật toán có thể bao gồm các mạng nhân tạo nơ ron, học sâu, luật kết hợp, cây quyết định, học tăng cường và mạng Bayes Sự đa dạng của các thuật toán khác nhau cung cấp một loạt các lựa chọn cho việc giải quyết vấn đề, và mỗi thuật toán sẽ có những yêu cầu và cân bằng khác nhau về các yêu cầu đầu vào dữ liệu, tốc độ của hiệu suất và độ chính xác của kết quả Độ chính xác của các dự đoán cuối cùng sẽ được cân nhắc khi quyết định thuật toán sẽ làm việc phù hợp nhất
Học máy có thể thay thế được các kỹ thuật theo chuỗi thời gian Các mạng
Trang 25nơ ron là một trong những kỹ thuật đã được nghiên cứu khá rộng rãi, và thường được thể hiện tốt hơn các cách tiếp cận chuỗi thời gian Kỹ thuật máy học cũng xuất hiện trong cuộc thi về khai thác dữ liệu và dữ liệu chuỗi dựa trên thời gian Những phương pháp đã được chứng minh để thực hiện tốt hơn các phương pháp chuỗi thời gian
Hình 1.8: Dự báo dựa trên mô hình học máy
1.2.2.3 Mạng nơ ron
Lingling Li và các cộng sự năm 2009 đã đề xuất mô hình mạng nơ ron kết hợp với chuỗi thời gian để dự báo năng lượng gió tại các trang trại điện gió (win farm) Do đặc tính của gió là đặc tính ngẫu nhiên (random), động (dynamic) và dung lượng lớn, rất khó khăn khi kết hợp với hệ thống điện Bởi thế họ đã sử dụng
mô hình thời gian ARMA(p,q) dự báo tốc độ gió và áp suất khí quyển và kết hợp
Mô hình
Nhãn
Máy học Pha huấn luyện
Véc tơ đặc trưng
Huấn luyện
Pha dự báo
Véc tơ đặc trưng
Trang 26Hình 1.9: Mơ hình dự báo năng lượng giĩ Pituk Bunnoon sử dụng mơ hình mạng nơ ron trong dự báo phụ tải điện kỳ trung hạn (mid – term) cho 2 đến 3 năm tiếp theo Kết quả cho thấy mơ hình số 2 cĩ thể được giảm lỗi mà bình Lỗi Tỷ lệ tuyệt đối (MAPE) là 4,35% Mơ hình dự báo tải no.1 và số 2, MAPE gần như bằng nhau tương ứng là 4,65% và 4.70% [9]
1.2.2.4 Nạve Bayes
Naive Bayes là một phương pháp được sử dụng khá nhiều trong dự báo bởi tính đơn giản và độc lập của các biến Naive bayes sử dụng trong dự báo thời tiết,
dự báo giá vàng, giá dầu, xuất nhập khẩu, GDP, lạm phát,
Mehmet Yasin OZSAGLAM sử dụng mơ hình Nạve Bayes trong dự báo bán hàng Dữ liệu được chọn là dữ liệu của một thiết bị điện tử tiêu dùng Thổ Nhĩ
Kỳ trong hai năm, dữ liệu số tiền bán hàng của một thiết bị điện tử tiêu dùng đã được sử dụng và được nhĩm lại như bốn quý trong năm Trong năm tiếp theo, đầu tiên bán hàng quý được dự báo bằng cách sử dụng phương trình hồi quy và phương pháp Naive bayes và so sánh bởi doanh số bán thực lượng, dự báo bán hàng Kết quả là gần với số tiền thực tế và yếu tố mùa vụ là thực sự quan trọng đối với một số dịng sản phẩm [7]
Trang 27Hình 1.10: Mơ hình dự báo giá bán lẻ dựa trên Nạve Bayes
1.2.2.5 K-láng giềng gần nhất (K-NN)
K- láng giềng gần nhất được coi như là một phương pháp khá cổ điển và phổ biến khi sử dụng trong các bài tốn dự báo K - NN áp dụng nhiều trong các bài tốn cĩ độ liên quan tới mùa vụ như dự báo giá nơng sản, dự báo giá thị trường cổ phiếu, dự báo giá dầu,
Khalid Alkhatib và các cộng sự trong năm 2013 đã đề xuất một phương pháp
Nạve Bayes Classifier
Product Group 1
Product Group 2 Product Group 3
Regression Analysis
PRODUCTS VARIABLES Number of Sales Price Profit Seasonal Sales
FORECASTINGS
Trang 28và nguồn thông tin năng động được xem như là một môi trường thích hợp cho khai thác và kinh doanh dữ liệu nghiên cứu Họ áp dụng K-NN và phương pháp hồi quy phi tuyến tính để dự đoán giá cổ phiếu cho một mẫu sáu công ty lớn niêm yết trên thị trường chứng khoán Jordan để hỗ trợ các nhà đầu tư, quản lý, ra quyết định, và người sử dụng trong việc đưa ra chính xác và thông báo các khoản đầu tư quyết định Theo kết quả, các thuật toán K-NN là có tỷ lệ lỗi nhỏ; kết quả là hợp lý với độ chính xác khá cao Ngoài ra, tùy thuộc vào giá cổ phiếu dữ liệu thực tế; các kết quả
dự báo là gần gũi và gần như song song với giá cổ phiếu thực tế [2]
1.3 Phương pháp đánh giá dự báo
Đánh giá dự báo là đánh giá độ chính xác của dự báo Do đó, cần xác định được các lỗi khi so sánh giữa giá trị thực và kết quả cho ra bởi mô hình [9]
- Lỗi phụ thuộc độ đo (scale – dependent error)
Mean absolute error: MAE= mean(e i ) (1-3) Root mean squared error: RMSE = √ ) (1-4) Khi so sánh các phương pháp dự báo trên một tập dữ liệu duy nhất, MAE được dùng phổ biến vì dễ dàng trong tính toán
- Lỗi tỉ lệ (percentage error)
Các lỗi tỷ lệ được tính bởi: p i 100e i / y i (1-5)
Lỗi tỉ lệ thuận lợi hơn lỗi phụ thuộc độ đo Vì vậy thường được sử dụng để so sánh hiệu suất dự báo bộ dữ liệu khác nhau Các biện pháp thường được sử dụng nhất là: Mean absolute percentage error: MAPE= | |) (1-6)
- Lỗi độ đo:
Lỗi độ đo được đề xuất bởi Hyndman và Koehler (2006) như một sự thay thế cho việc sử dụng các lỗi tỷ lệ phần trăm khi so sánh chính xác dự báo trên loạt trên
Trang 29quy mô khác nhau Họ đề xuất nhân rộng các lỗi dựa trên đào tạo MAE từ một phương pháp dự báo đơn giản Đối với một chuỗi thời gian không theo mùa, một cách hữu ích để xác định một lỗi có quy mô sử dụng dự báo Naive:
j j
y y T
e q
2
11
1 (1-7)
Bởi vì tử số và mẫu số đều liên quan đến các giá trị trên độ đo của dữ liệu gốc, qj là độc lập với quy mô của dữ liệu Một lỗi có độ đo nhỏ hơn một nếu nó xuất phát từ một dự báo tốt hơn so với dự báo Naive trung bình tính trên dữ liệu huấn luyện Ngược lại, nó lớn hơn một nếu theo dự báo là kém hơn so với dự báo naive trung bình tính trên dữ liệu huấn luyện Đối với chuỗi thời gian theo mùa, một lỗi có thể được xác định bằng:
m t t
j j
y y m
T
e q
1
1 (1-8) Đối với dữ liệu chéo:
j j
y y N
e q
1
1 (1-9)
Trong trường hợp này, việc so sánh là với dự báo trung bình Các sai số trung bình
có quy mô tuyệt đối là:
MASE=mean( q j ) (1-10)
1.4 Kết luận chương 1
Trong chương này, luận văn đã trình bày tổng quan các khái niệm cơ bản liên quan tới dự báo, dự báo kinh tế Các phương pháp thường sử dụng trong dự báo kinh tế bao gồm các phương pháp liên quan tới kinh tế lượng và học máy Trong luận văn sử dụng các phương pháp định lượng để dự báo, do đó lý thuyết về phương
Trang 30Chương 2: ỨNG DỤNG MẠNG NƠ RON TRONG DỰ BÁO LẠM PHÁT
KINH TẾ
Trong chương này trình bày khái niệm và kiến trúc của mạng nơ ron nhân tạo, các phương pháp học trên mạng nơ ron nhân tạo và ứng dụng mạng nơ ron nhân tạo trong giải quyết bài toán dự báo lạm phát dựa trên một số các yếu tố tác động Phần thử nghiệm mô hình mạng nơ ron với dữ liệu được tải về từ Data world bank và Tổng cục thống kê Việt Nam cho kết quả chấp nhận được
2.1 Mạng nơ ron nhân tạo
Mạng nơron được giới thiệu đầu tiên năm 1943 bởi nhà thần kinh học Warren McCulloch và nhà logic học Walter Pits Dựa trên quan điểm cho rằng bộ não người là bộ điều khiển
Mỗi nơron sinh học có 4 thành phần cơ bản: Thân nơron (soma), Nhánh hình cây (dendrite), Sợi trục (axon), Khớp (synapse) [12]
2.1.1 Định nghĩa mạng Nơron nhân tạo (Artificial Neural Network -ANN):
Mạng nơ-ron nhân tạo gọi tắt là mạng nơ-ron là một mô hình xử lý thông tin phỏng theo cách thức xử lý thông tin của các hệ nơ-ron sinh học Nó được tạo lên từ một số lượng lớn các phần tử (gọi là các nơ-ron) kết nối với nhau thông qua các liên kết (gọi là trọng số liên kết) làm việc như một thể thống nhất để giải quyết bài toán
dự báo giá [12]
2.1.2 Các tính chất của mạng Nơron
Là hệ phi tuyến: mạng nơ-ron có khả năng to lớn trong lĩnh vực nhận dạng
và điều khiển các đối tượng phi tuyến
Là hệ xử lý song song: mạng nơ-ron có cấu trúc song song, do đó có tốc độ
tính toán rất cao giúp nâng cao hiệu quả tính toán
Là hệ học và thích nghi: mạng được luyện từ các số liệu quá khứ, có khả
năng tự chỉnh khi số liệu đầu vào bị mất, rất phù hợp với các hệ thống máy học