Dự báo kinh tế bằng cách tiếp cận mơ hình học máy

Một phần của tài liệu (LUẬN văn THẠC sĩ) NGHIÊN cứu MẠNG nơ RON NHÂN tạo và ỨNG DỤNG vào dự báo lạm PHÁT (Trang 26)

1.2.2.1 Khái niệm

Học máy (Machine Learning) là một ngành khoa học nghiên cứu các thuật tốn cho phép máy tính cĩ thể học đƣợc các khái niệm (concept).

Định nghĩa 1.3 [Máy học( Machine Learning )]: Máy học là một chương trình máy tính cĩ khả năng học hỏi kinh nghiệm đối với một tập dữ liệu trong quá khứ để thực hiện một số nhiệm vụ và cải thiện hiệu quả của nĩ tại một số nhiệm vụ này.

Các ngành khoa học liên quan:

- Lý thuyết thống kê: các kết quả trong xác suất thống kê là tiền đề cho rất nhiều phƣơng pháp học máy. Đặc biệt, lý thuyết thống kê cho phép ƣớc lƣợng sai số của các phƣơng pháp học máy.

- Các phƣơng pháp tính: các thuật tốn học máy thƣờng sử dụng các tính tốn số thực/số nguyên trên dữ liệu rất lớn. Trong đĩ, các bài tốn nhƣ: tối ƣu cĩ/khơng ràng buộc, giải phƣơng trình tuyến tính v.v… đƣợc sử dụng rất phổ biến. - Khoa học máy tính: là cơ sở để thiết kế các thuật tốn, đồng thời đánh giá thời gian chạy, bộ nhớ của các thuật tốn học máy.

- Các nhĩm giải thuật học máy:

+ Học cĩ giám sát: máy tính đƣợc xem một số mẫu gồm đầu vào (input) và đầu ra (output) tƣơng ứng trƣớc. Sau khi học xong các mẫu này, máy tính quan sát một đầu vào mới và cho ra kết quả.

+ Học khơng giám sát: là một phƣơng pháp học để tìm ra mơ hình phù hợp

với các quan sát. Nĩ khác với học cĩ giám sát là đầu ra tƣơng ứng cho mỗi đầu vào là khơng biết trƣớc, xem các đối tƣợng đầu vào nhƣ một tập các biến ngẫu nhiên, sau đĩ nĩ phải tự tìm cách phân loại các mẫu này.

+ Học nửa giám sát: một dạng lai giữa hai nhĩm giải thuật trên.

+ Học tăng cƣờng: máy tính đƣa ra quyết định hành động (action) và nhận kết quả phản hồi (response/reward) từ mơi trƣờng (environment). Sau đĩ máy tính tìm cách chỉnh sửa cách ra quyết định hành động của mình

- Ứng dụng của học máy: học máy cĩ ứng dụng rộng khắp trong các ngành khoa học/sản xuất, đặc biệt những ngành cần phân tích khối lƣợng dữ liệu khổng lồ. + Xử lý ngơn ngữ tự nhiên (Natural Language Processing): xử lý văn bản, giao tiếp ngƣời – máy, …

+ Nhận dạng (Pattern Recognition): nhận dạng tiếng nĩi, chữ viết tay, vân tay, thị giác máy (Computer Vision), …

+ Tìm kiếm (Search Engine)

+ Chẩn đốn trong y tế: phân tích ảnh X-quang, các hệ chuyên gia chẩn đốn

tự động.

+ Tin sinh học: phân loại chuỗi gene, quá trình hình thành

gene/protein

+ Vật lý: phân tích ảnh thiên văn, tác động giữa các hạt …

+ Phát hiện gian lận tài chính (financial fraud): gian lận thẻ tín dụng + Phân tích thị trƣờng chứng khốn (stock market analysis)

1.2.2.2 Mơ hình dự báo dựa trên học máy

Học máy sử dụng thuật tốn học từ dữ liệu. Các thuật tốn cĩ thể bao gồm các mạng nhân tạo nơ ron, học sâu, luật kết hợp, cây quyết định, học tăng cƣờng và mạng Bayes. Sự đa dạng của các thuật tốn khác nhau cung cấp một loạt các lựa chọn cho việc giải quyết vấn đề, và mỗi thuật tốn sẽ cĩ những yêu cầu và cân bằng khác nhau về các yêu cầu đầu vào dữ liệu, tốc độ của hiệu suất và độ chính xác của kết quả. Độ chính xác của các dự đốn cuối cùng sẽ đƣợc cân nhắc khi quyết định thuật tốn sẽ làm việc phù hợp nhất.

Học máy cĩ thể thay thế đƣợc các kỹ thuật theo chuỗi thời gian. Các mạng

nơ ron là một trong những kỹ thuật đã đƣợc nghiên cứu khá rộng rãi, và thƣờng đƣợc thể hiện tốt hơn các cách tiếp cận chuỗi thời gian. Kỹ thuật máy học cũng xuất hiện trong cuộc thi về khai thác dữ liệu và dữ liệu chuỗi dựa trên thời gian. Những phƣơng pháp đã đƣợc chứng minh để thực hiện tốt hơn các phƣơng pháp chuỗi thời

gian.

Pha huấn luyện

Pha dự báo

Mơ hình

dự báo Véc tơ đặc trƣng

Hình 1.8: Dự báo dựa trên mơ hình học máy

1.2.2.3 Mạng nơ ron

Lingling Li và các cộng sự năm 2009 đã đề xuất mơ hình mạng nơ ron kết hợp với chuỗi thời gian để dự báo năng lƣợng giĩ tại các trang trại điện giĩ (win farm). Do đặc tính của giĩ là đặc tính ngẫu nhiên (random), động (dynamic) và dung lƣợng lớn, rất khĩ khăn khi kết hợp với hệ thống điện. Bởi thế họ đã sử dụng mơ hình thời gian ARMA(p,q) dự báo tốc độ giĩ và áp suất khí quyển và kết hợp mơ hình mạng nơ ron RBF để dự báo năng lƣợng giĩ. Thực nghiệm họ sử dụng áp suất khí quyển và tốc độ giĩ là giá trị đầu vào cho kết quả dự báo đầu ra cĩ thể áp dụng đƣợc trong thực tế khi sai số dự báo là khá nhỏ [8].

24

Hình 1.9: Mơ hình dự báo năng lƣợng giĩ

Pituk Bunnoon sử dụng mơ hình mạng nơ ron trong dự báo phụ tải điện kỳ trung hạn (mid – term) cho 2 đến 3 năm tiếp theo. Kết quả cho thấy mơ hình số 2 cĩ thể đƣợc giảm lỗi mà bình Lỗi Tỷ lệ tuyệt đối (MAPE) là 4,35%. Mơ hình dự báo tải no.1 và số 2, MAPE gần nhƣ bằng nhau tƣơng ứng là 4,65% và 4.70% [9].

1.2.2.4 Nạve Bayes

Naive Bayes là một phƣơng pháp đƣợc sử dụng khá nhiều trong dự báo bởi tính đơn giản và độc lập của các biến. Naive bayes sử dụng trong dự báo thời tiết, dự báo giá vàng, giá dầu, xuất nhập khẩu, GDP, lạm phát,...

Mehmet Yasin OZSAGLAM sử dụng mơ hình Nạve Bayes trong dự báo bán hàng. Dữ liệu đƣợc chọn là dữ liệu của một thiết bị điện tử tiêu dùng Thổ Nhĩ Kỳ trong hai năm, dữ liệu số tiền bán hàng của một thiết bị điện tử tiêu dùng đã đƣợc sử dụng và đƣợc nhĩm lại nhƣ bốn quý trong năm. Trong năm tiếp theo, đầu tiên bán hàng quý đƣợc dự báo bằng cách sử dụng phƣơng trình hồi quy và phƣơng

pháp Naive bayes và so sánh bởi doanh số bán thực lƣợng, dự báo bán hàng. Kết quả là gần với số tiền thực tế và yếu tố mùa vụ là thực sự quan trọng đối với một số dịng sản phẩm [7].

25

PRODUCTS VARIABLES Number of Sales Price Proft Seasonal Sales Nạ ayes Classifer Product Group 1 Product Group 2 Product Group 3 Re ion Analysis FORECASTINGS

Hình 1.10: Mơ hình dự báo giá bán lẻ dựa trên Nạve Bayes

1.2.2.5 K-láng giềng gần nhất (K-NN)

K- láng giềng gần nhất đƣợc coi nhƣ là một phƣơng pháp khá cổ điển và phổ biến khi sử dụng trong các bài tốn dự báo. K - NN áp dụng nhiều trong các bài

tốn cĩ độ liên quan tới mùa vụ nhƣ dự báo giá nơng sản, dự báo giá thị trƣờng cổ phiếu, dự báo giá dầu, ...

Khalid Alkhatib và các cộng sự trong năm 2013 đã đề xuất một phƣơng pháp dự báo giá cổ phiếu dựa trên K-NN. Họ cho rằng, các đây là một chủ đề luơn luơn cần đƣợc nghiên cứu tại các nƣớc phát triển. Hiện nay, thị trƣờng chứng khốn đƣợc coi là một giao dịch nhiều lĩnh vực bởi trong nhiều trƣờng hợp nĩ mang lại lợi nhuận dễ dàng với tỷ lệ rủi ro thấp trở lại. Thị trƣờng chứng khốn với số khổng lồ

26

và nguồn thơng tin năng động đƣợc xem nhƣ là một mơi trƣờng thích hợp cho khai thác và kinh doanh dữ liệu nghiên cứu. Họ áp dụng K-NN và phƣơng pháp hồi quy phi tuyến tính để dự đốn giá cổ phiếu cho một mẫu sáu cơng ty lớn niêm yết trên thị trƣờng chứng khốn Jordan để hỗ trợ các nhà đầu tƣ, quản lý, ra quyết định, và ngƣời sử dụng trong việc đƣa ra chính xác và thơng báo các khoản đầu tƣ quyết định. Theo kết quả, các thuật tốn K-NN là cĩ tỷ lệ lỗi nhỏ; kết quả là hợp lý với độ

chính xác khá cao. Ngồi ra, tùy thuộc vào giá cổ phiếu dữ liệu thực tế; các kết quảdự báo là gần gũi và gần nhƣ song song với giá cổ phiếu thực tế [2].

1.3 Phƣơng pháp đánh giá dự báo

Đánh giá dự báo là đánh giá độ chính xác của dự báo. Do đĩ, cần xác định đƣợc các lỗi khi so sánh giữa giá trị thực và kết quả cho ra bởi mơ hình [9].

- Lỗi phụ thuộc độ đo (scale –

dependent error) Các lỗi dự báo đƣợc tính:

ei yi yi

Trong đĩ dựa trên cùng một độ đo, cùng một dữ liệu. Hai phƣơng pháp phụ thuộc và thơng dụng nhất đƣợc dựa trên các lỗi tuyệt đối hoặc lỗi bình phƣơng:

Mean absolute error: MAE= mean( ei ) Root mean squared error: RMSE =)

Khi so sánh các phƣơng pháp dự báo trên một tập dữ liệu duy nhất, MAE đƣợc dùng phổ biến vì dễ dàng trong tính tốn.

- Lỗi tỉ lệ (percentage error)

Các lỗi tỷ lệ đƣợc tính bởi: pi 100ei / yi (1-5) Lỗi tỉ lệ thuận lợi hơn lỗi phụ thuộc độ đo. Vì vậy thƣờng đƣợc sử dụng để so sánh hiệu suất dự báo bộ dữ liệu khác nhau. Các biện pháp thƣờng đƣợc sử dụng nhất là:

Mean absolute percentage error: MAPE=)

 

- Lỗi độ đo:

Lỗi độ đo đƣợc đề xuất bởi Hyndman và Koehler (2006) nhƣ một sự thay thế cho việc sử dụng các lỗi tỷ lệ phần trăm khi so sánh chính xác dự báo trên loạt trên

quy mơ khác nhau. Họ đề xuất nhân rộng các lỗi dựa trên đào tạo MAE từ một phƣơng pháp dự báo đơn giản. Đối với một chuỗi thời gian khơng theo mùa, một cách hữu ích để xác định một lỗi cĩ quy mơ sử dụng dự báo Naive:

qj

1 T

1 Bởi vì tử số và mẫu số đều liên quan đến các giá trị trên độ đo của dữ liệu

gốc, qj là độc lập với quy mơ của dữ liệu. Một lỗi cĩ độ đo nhỏ hơn một nếu nĩ xuất phát từ một dự báo tốt hơn so với dự báo Naive trung bình tính trên dữ liệu huấn luyện. Ngƣợc lại, nĩ lớn hơn một nếu theo dự báo là kém hơn so với dự báo naive trung bình tính trên dữ liệu huấn luyện. Đối với chuỗi thời gian theo mùa, một lỗi cĩ thể đƣợc xác định bằng:

qj T Đối với dữ liệu chéo:

qj

Trong trƣờng hợp này, việc so sánh là với dự báo trung bình. Các sai số trung bình cĩ quy mơ tuyệt đối là:

MASE=mean( qj )

1.4 Kết luận chƣơng 1

Trong chƣơng này, luận văn đã trình bày tổng quan các khái niệm cơ bản liên quan tới dự báo, dự báo kinh tế. Các phƣơng pháp thƣờng sử dụng trong dự báo kinh tế bao gồm các phƣơng pháp liên quan tới kinh tế lƣợng và học máy. Trong luận văn sử dụng các phƣơng pháp định lƣợng để dự báo, do đĩ lý thuyết về phƣơng pháp định lƣợng đƣợc trình bày nhiều hơn. Cuối chƣơng, luận văn cũng đƣa ra một số phƣơng pháp xác định lỗi dự báo nhằm mục đích đánh giá độ chính xác của các dự báo dựa trên sai lệch kết quả giữa mơ hình và giá trị thực tế của dự báo.

Chƣơng 2: ỨNG DỤNG MẠNG NƠ RON TRONG DỰ BÁO LẠM PHÁT KINH TẾ

Trong chƣơng này trình bày khái niệm và kiến trúc của mạng nơ ron nhân tạo, các phƣơng pháp học trên mạng nơ ron nhân tạo và ứng dụng mạng nơ ron nhân tạo trong giải quyết bài tốn dự báo lạm phát dựa trên một số các yếu tố tác động. Phần thử nghiệm mơ hình mạng nơ ron với dữ liệu đƣợc tải về từ Data world bank và Tổng cục thống kê Việt Nam cho kết quả chấp nhận đƣợc.

2.1 Mạng nơ ron nhân tạo

Mạng nơron đƣợc giới thiệu đầu tiên năm 1943 bởi nhà thần kinh học Warren McCulloch và nhà logic học Walter Pits. Dựa trên quan điểm cho rằng bộ não ngƣời là bộ điều khiển.

Mỗi nơron sinh học cĩ 4 thành phần cơ bản: Thân nơron (soma), Nhánh hình cây (dendrite), Sợi trục (axon), Khớp (synapse) [12].

2.1.1 Định nghĩa mạng Nơron nhân tạo (Artifcial Neural Network -ANN):

Mạng nơ-ron nhân tạo gọi tắt là mạng nơ-ron là một mơ hình xử lý thơng tin phỏng theo cách thức xử lý thơng tin của các hệ nơ-ron sinh học. Nĩ đƣợc tạo lên từ một số lƣợng lớn các phần tử (gọi là các nơ-ron) kết nối với nhau thơng qua các liên kết (gọi là trọng số liên kết) làm việc nhƣ một thể thống nhất để giải quyết bài tốn dự báo giá [12].

2.1.2 Các tính chất của mạng Nơron

Là hệ phi tuyến: mạng nơ-ron cĩ khả năng to lớn trong lĩnh vực nhận dạng và điều khiển các đối tƣợng phi tuyến.

Là hệ xử lý song song: mạng nơ-ron cĩ cấu trúc song song, do đĩ cĩ tốc độ tính tốn rất cao giúp nâng cao hiệu quả tính tốn.

Là hệ học và thích nghi: mạng đƣợc luyện từ các số liệu quá khứ, cĩ khả năng tự chỉnh khi số liệu đầu vào bị mất, rất phù hợp với các hệ thống máy học.

29

Là hệ nhiều biến, là hệ nhiều đầu vào, nhiều đầu ra (Many Input Many Output - MIMO), rất tiện dùng khi đối tƣợng cĩ nhiều biến.

2.1.3 Cấu trúc mạng nơ – ron 2.1.3.1 Đơn vị xử lý perceptron

Trên cơ sở mơ hình Nơron sinh vật tổng quát ngƣời ta đề xuất mơ hình nơ-ron nhân tạo (perceptron). Mơ hình nơ-ron nhân tạo đƣợc xây dựng từ ba thành phần chính: bộ tổng các liên kết đầu vào, động học tuyến tính và phi tuyến tính [12].

Hình 2.1: Cấu trúc một perceptron

Để mơ phỏng một nơ-ron ta coi nĩ nhƣ một hệ thống nhiều đầu vào và một

đầu ra.

- Bộ tổng liên kết: là bộ tổng hợp các liên kết đầu vào của một phần tử nơ-ron cĩ thể mơ tả nhƣ sau:

a n w x

j ji i

j 1

Trong đĩ:

a j: là tổng (Summing function) tất cả các đầu vào mơ tả tồn bộ thế năng tác động ở thân nơ-ron.

xi: là các đầu vào (input signals), i=1,2,...n là số lƣợng đầu vào mơ tả tín hiệu vào từ các đầu nhánh thần kinh hoặc từ các nơ-ron khác đƣa vào. Các tín hiệu này thƣờng đƣợc đƣa vào dƣới dạng một vector n chiều.

wji: là trọng số liên kết (Synaptic weight), là hệ số mơ tả mức độ liên kết giữa các đầu vào thứ i tới nơ-ron thứ j.

θj: là ngƣỡng (cịn gọi là một độ lệch - bias), đƣợc đƣa vào nhƣ một thành phần của hàm truyền xác định ngƣỡng kích thích hay ức chế.

Hàm truyền (Transfer function): dùng để giới hạn phạm vi đầu ra của mỗi nơron. Nĩ nhận đầu vào là kết quả của hàm tổng và ngƣỡng đã cho.Thơng thƣờng, phạm vi đầu ra của mỗi nơ-ron đƣợc giới hạn trong đoạn [0,1] hoặc [-1, 1]. Các hàm truyền rất đa dạng, cĩ thể là các hàm tuyến tính hoặc phi tuyến. Việc lựa chọn hàm truyền nào là tuỳ thuộc vào từng bài tốn và kinh nghiệm của ngƣời thiết kế mạng.

2.1.3.2 Tiến trình học của mạng nơ ron

Đối với con ngƣời, học là một quá trình rất quan trọng, nhờ học mà bộ não ngày càng tích luỹ những kinh nghiệm để thích nghi với mơi trƣờng và xử lý tình huống tốt hơn.

Mạng nơ ron cĩ khả năng học, nhớ lại và khái quát hĩa từ các dữ liệu đã học bằng cách gán và điều chỉnh các giá trị trọng số của các liên kết giữa các nơ ron.

Trong quá trình học, từ các giá trị đầu vào, qua quá trình xử lí để tìm đƣợc các giá trị đầu ra.

Sau đĩ là quá trình so sánh giá trị tạo ra bởi mạng nơ ron với giá trị đầu ra mong muốn. Nếu hai giá trị này giống nhau thì khơng thay đổi gì cả. Tuy nhiên, nếu cĩ một sai lệch giữa hai giá trị này vƣợt quá giá trị sai số mong muốn thì đi ngƣợc mạng từ đầu ra về đầu vào để thay đổi một số kết nối.

Đây là một quá trình lặp liên tục và cĩ thể khơng dừng khi khơng tìm các giá trị trọng số sao cho đầu ra tạo bởi mạng nơ ron bằng đúng đầu ra mong muốn. Do đĩ trong thực tế ngƣời ta phải thiết lập tiêu chuẩn dựa trên một giá trị sai số nào đĩ

của hai giá trị này, hay dựa trên một số lần lặp xác định.

2.1.3.3 Mạng nơ ron nhiều lớp:

Trong mạng nơ-ron truyền thẳng nhiều lớp, các liên kết đi theo một hƣớng

Một phần của tài liệu (LUẬN văn THẠC sĩ) NGHIÊN cứu MẠNG nơ RON NHÂN tạo và ỨNG DỤNG vào dự báo lạm PHÁT (Trang 26)

Tải bản đầy đủ (DOCX)

(71 trang)
w