K-láng giềng gần nhất (K NN)

Một phần của tài liệu (LUẬN văn THẠC sĩ) NGHIÊN cứu MẠNG nơ RON NHÂN tạo và ỨNG DỤNG vào dự báo lạm PHÁT (Trang 27)

L ỜI CAM ĐOAN

1.2.2.5K-láng giềng gần nhất (K NN)

K- láng giềng gần nhất đƣợc coi nhƣ là một phƣơng pháp khá cổ điển và phổ biến khi sử dụng trong các bài tốn dự báo. K NN áp dụng nhiều trong các bài - tốn cĩ độ liên quan tới mùa vụ nhƣ dự báo giá nơng sản, dự báo giá thị trƣờng cổ phiếu, dự báo giá dầu, ...

Khalid Alkhatib và các cộng sự trong năm 2013 đã đề xuất một phƣơng pháp dự báo giá cổ phiếu dựa trên K NN. Họ cho rằng, các đây là một chủ đề luơn luơn- cần đƣợc nghiên cứu tại các nƣớc phát triển. Hiện nay, thị trƣờng chứng khốn đƣợc coi là một giao dịch nhiều lĩnh vực bởi trong nhiều trƣờng hợp nĩ mang lại lợi nhuận dễ dàng với tỷ lệ rủi ro thấp trở lại. hị trƣờng chứng khốn với số khổng lồ T

Nạ ayes Classifier Product Group 1 Product Group 2 Product Group 3 Re ion Analysis PRODUCTS VARIABLES Number of Sales Price Profit Seasonal Sales FORECASTINGS

và nguồn thơng tin năng động đƣợc xem nhƣ là một mơi trƣờng thích hợp cho khai thác và kinh doanh dữ liệu nghiên cứu. Họ áp dụng K-NN và phƣơng pháp hồi quy phi tuyến tính để dự đốn giá cổ phiếu cho một mẫu sáu cơng ty lớn niêm yết trên thị trƣờng chứng khốn Jordan để hỗ trợ các nhà đầu tƣ, quản lý, ra quyết định, và ngƣời sử dụng trong việc đƣa ra chính xác và thơng báo các khoản đầu tƣ quyết định. Theo kết quả, các thuật tốn K-NN là cĩ tỷ lệ lỗi nhỏ; kết quả là hợp lý với độ chính xác khá cao. Ngồi ra, tùy thuộc vào giá cổ phiếu dữ liệu thực tế; các kết quả dự báo là gần gũi và gần nhƣ song song với giá cổ phiếu thực tế [2 ].

1.3 Phƣơng pháp đánh giá dự báo

Đánh giá dự báo là đánh giá độ chính xác của dự báo. Do đĩ, cần xác định đƣợc các lỗi khi so sánh giữa giá trị thực và kết quả cho ra bởi mơ hình ]. [9

- Lỗi phụ thuộc độ đo (scale – dependent error) Các lỗi dự báo đƣợc tính:

ei yi yi -2) (1 Trong đĩ dựa trên cùng một độ đo, cùng một dữ liệu. Hai phƣơng pháp phụ thuộc và thơng dụng nhất đƣợc dựa trên các lỗi tuyệt đối hoặc lỗi bình phƣơng:

Mean absolute error: MAE= mean(ei ) -3) (1 Root mean squared error: RMSE = ) (1- 4) Khi so sánh các phƣơng pháp dự báo trên một tập dữ liệu duy nhất, MAE đƣợc dùng phổ biến vì dễ dàng trong tính tốn.

- Lỗi tỉ lệ (percentage error)

Các lỗi tỷ lệ đƣợc tính bởi: pi 100ei / yi -5) (1 Lỗi tỉ lệ thuận lợi hơn lỗi phụ thuộc độ đo. Vì vậy thƣờng đƣợc sử dụng để so sánh hiệu suất dự báo bộ dữ liệu khác nhau.Các biện pháp thƣờng đƣợc sử dụng nhất là: Mean absolute percentage error: MAPE= ) -6) (1 - Lỗi độ đo:

Lỗi độ đo đƣợc đề xuất bởi Hyndman và Koehler (2006) nhƣ một sự thay thế cho việc sử dụng các lỗi tỷ lệ phần trăm khi so sánh chính xác dự báo trên loạt trên

quy mơ khác nhau. Họ đề xuất nhân rộng các lỗi dựa trên đào tạo MAE từ một phƣơng pháp dự báo đơn giản. Đối với một chuỗi thời gian khơng theo mùa, một cách hữu ích để xác định một lỗi cĩ quy mơ sử dụng dự báo Naive:

T t t t j j y y T e q 2 1 1 1 -7) (1

Bởi vì tử số và mẫu số đều liên quan đến các giá trị trên độ đo của dữ liệu gốc, qj là độc lập với quy mơ của dữ liệu. Một lỗi cĩ độ đo nhỏ hơn một nếu nĩ xuất phát từ một dự báo tốt hơn so với dự báo Naive trung bình tính trên dữ liệu huấn luyện. Ngƣợc lại, nĩ lớn hơn một nếu theo dự báo là kém hơn so với dự báo naive trung bình tính trên dữ liệu huấn luyện. Đối với chuỗi thời gian theo mùa, một lỗi cĩ thể đƣợc xác định bằng: T m t m t t j j y y m T e q 1 1 -8) (1

Đối với dữ liệu chéo:

N i i j j y y N e q 1 1 -9) (1 Trong trƣờng hợp này, việc so sánh là với dự báo trung bình. Các sai số trung bình cĩ quy mơ tuyệt đối là:

MASE=mean(qj ) -10) (1

1.4 Kết luận chƣơng 1

Trong chƣơng này, luận văn đã trình bày tổng quan các khái niệm cơ bản liên quan tới dự báo, dự báo kinh tế. Các phƣơng pháp thƣờng sử dụng trong dự báo kinh tế bao gồm các phƣơng pháp liên quan tới kinh tế lƣợng và học máy. Trong luận văn sử dụng các phƣơng pháp định lƣợng để dự báo, do đĩ lý thuyết về phƣơng pháp định lƣợng đƣợc trình bày nhiều hơn. Cuối chƣơng, luận văn cũng đƣa ra một số phƣơng pháp xác định lỗi dự báo nhằm mục đích đánh giá độ chính xác của các dự báo dựa trên sai lệch kết quả giữa mơ hình và giá trị thực tế của dự báo.

Chƣơng 2 Ứ: NG D NG MỤ ẠNG NƠ RON TRONG DỰ BÁO L M PHÁT Ạ KINH TẾ

Trong chƣơng này trình bày khái niệm và kiến trúc của mạng nơ ron nhân tạo, các phƣơng pháp học trên mạng nơ ron nhân tạo và ứng dụng mạng nơ ron nhân tạo trong giải quyết bài tốn dự báo lạm phát dựa trên một số các yếu tố tác động. Phần thử nghiệm mơ hình mạng nơ ron với dữ liệu đƣợc tải về từ Data world bank và Tổng cục thống kê Việt Nam cho kết quả chấp nhận đƣợc.

2.1 Mạng nơ ron nhân tạo

Mạng nơron đƣợc giới thiệu đầu tiên năm 1943 bởi nhà thần kinh học Warren McCulloch và nhà logic học Walter Pits. Dựa trên quan điểm cho rằng bộ não ngƣời là bộ điều khiển.

Mỗi nơron sinh học cĩ 4 thành phần cơ bản: Thân nơron (soma), Nhánh hình cây (dendrite), Sợi trục (axon), Khớp (synapse) [12].

2.1.1 Định nghĩa mạng Nơron nhân tạo (Artificial Neural Network -ANN):

Mạng nơ ron nhân tạo gọi tắt là mạng nơ ron là một mơ hình xử lý thơng tin - - phỏng theo cách thức xử lý thơng tin của các hệ nơ ron sinh học. Nĩ đƣợc tạo lên từ - một số lƣợng lớn các phần tử (gọi là các nơ ron) kết nối với nhau thơng qua các liên - kết (gọi là trọng số liên kết) làm việc nhƣ một thể thống nhất để giải quyết bài tốn dự báo giá 2]. [1

2.1.2 Các tính chất của mạng Nơron

Là hệ phi tuyến: mạng nơ ron cĩ khả năng to lớn trong lĩnh vực nhận dạng - và điều khiển các đối tƣợng phi tuyến.

Là hệ xử lý song song: mạng nơ ron cĩ cấu trúc song song, do đĩ cĩ tốc độ - tính tốn rất cao giúp nâng cao hiệu quả tính tốn.

Là hệ học và thích nghi: mạng đƣợc luyện từ các số liệu quá khứ, cĩ khả năng tự chỉnh khi số liệu đầu vào bị mất, rất phù hợp với các hệ thống máy học. (adsbygoogle = window.adsbygoogle || []).push({});

Là hệ nhiều biến, là hệ nhiều đầu vào, nhiều đầu ra (Many Input Many Output - MIMO), rất tiện dùng khi đối tƣợng cĩ nhiều biến.

2.1.3 C u trúc mấ ạng nơ –ron 2.1.3.1 Đơn vị ử x lý perceptron 2.1.3.1 Đơn vị ử x lý perceptron

Trên cơ sở mơ hình Nơron sinh vật tổng quát ngƣời ta đề xuất mơ hình nơ- ron nhân tạo perceptron). Mơ hình nơ ron nhân tạo đƣợc xây dựng từ ba thành ( - phần chính: bộ tổng các liên kết đầu vào, động học tuyến tính và phi tuyến tính 2 [1 ].

Hình 2.1: Cấu trúc một perceptron

Để mơ phỏng một nơ-ron ta coi nĩ nhƣ một hệ thống nhiều đầu vào và một đầu ra.

- B t ng liên k t: là b t ng h p các liên kộ ổ ế ộ ổ ợ ết đầu vào c a m t ph n t -ủ ộ ầ ử nơ ron cĩ thể mơ t ả nhƣ sau:

n j j i ji j w x a 1 -1) (2 Trong đĩ:

aj: là tổng (Summing function) tất cả các đầu vào mơ tả tồn bộ thế năng tác động ở thân nơ-ron.

xi: là các đầu vào (input signals), i=1,2,...n là số lƣợng đầu vào mơ tả tín hiệu vào từ các đầu nhánh thần kinh hoặc từ các nơ ron khác đƣa vào. Các tín hiệu này - thƣờng đƣợc đƣa vào dƣới dạng một vector n chiều.

wji: là trọng số liên kết (Synaptic weight), là hệ số mơ tả mức độ liên kết giữa các đầu vào thứ i tới nơ ron thứ j.-

θj: là ngƣỡng (cịn gọi là một độ lệch - bias), đƣợc đƣa vào nhƣ một thành phần của hàm truyền xác định ngƣỡng kích thích hay ức chế.

Hàm truyền (Transfer function): dùng để giới hạn phạm vi đầu ra của mỗi nơron. Nĩ nhận đầu vào là kết quả của hàm tổng và ngƣỡng đã cho.Thơng thƣờng, phạm vi đầu ra của mỗi nơ ron đƣợc giới hạn trong đoạn [0,1] hoặc [- -1, 1]. Các hàm truyền rất đa dạng, cĩ thể là các hàm tuyến tính hoặc phi tuyến. Việc lựa chọn hàm truyền nào là tuỳ thuộc vào từng bài tốn và kinh nghiệm của ngƣời thiết kế mạng.

2.1.3.2 n trình h c c a mTiế ạng nơ ron

Đối với con ngƣời, học là một quá trình rất quan trọng, nhờ học mà bộ não ngày càng tích luỹ những kinh nghiệm để thích nghi với mơi trƣờng và xử lý tình huống tốt hơn.

Mạng nơ ron cĩ khả năng học, nhớ lại và khái quát hĩa từ các dữ liệu đã học bằng cách gán và điều chỉnh các giá trị trọng số của các liên kết giữa các nơ ron.

Trong quá trình học, từ các giá trị đầu vào, qua quá trình xử lí để tìm đƣợc các giá trị đầu ra.

là quá trình so sán

Sau đĩ h giá trị tạo ra bởi mạng nơron với giá trị đầu ra

mong muốn. Nếu hai giá trị này giống nhau thì khơng thay đổi gì cả. Tuy nhiên, nếu cĩ một sai lệch giữa hai giá trị này vƣợt quá giá trị sai số mong muốn thì đi ngƣợc mạng từ đầu ra về đầu vào để thay đổi một số kết nối.

Đây là một quá trình lặp liên tục và cĩ thể khơng dừng khi khơng tìm các giá trị trọng số sao cho đầu ra tạo bởi mạng nơ ron bằng đúng đầu ra mong muốn. Do đĩ trong thực tế ngƣời ta phải thiết lập tiêu chuẩn dựa trên một giá trị sai số nào đĩ của hai giá trị này, hay dựa trên một số lần lặp xác định.

2.1.3.3 Mạng nơ ron nhiều lớp:

Trong mạng nơ ron truyền thẳng nhiều lớp, các liên kết đi theo một hƣớng - nhất định từ lớp vào tới lớp ra. Chúng khơng tạo thành đồ thị cĩ chu trình với các đỉnh là các nơ ron, các cung là các liên kết giữa chúng.-

Hình 2.2: Mạng nơ ron nhiều lớp

Một mạng truyền thẳng nhiều lớp bao gồm một lớp vào (Input layer), một lớp ra (Output layer) và một hoặc nhiều lớp ẩn (Hidden layer) nằm giữa lớp vào và lớp ra. Các nơ ron đầu vào thực chất khơng phải là các nơ ron theo đúng nghĩa - - bởi chúng chƣa thực hiện bất kỳ một tính tốn nào trên dữ liệu vào mà chỉ đơn giản là nhập dữ liệu từ bên ngồi đƣa vào và chuyển cho các lớp kế tiếp. Các nơ ron lớp - ẩn và lớp ra mới thực sự thực hiện tính tốn, kết quả đƣợc tính tốn thơng qua hàm chuyển. Cụm từ “truyền thẳng”( feed forword) (khơng phải là trái nghĩa với lan truyền ngƣợc) liên quan đến một thực tế là mỗi nơ ron của lớp này chỉ đƣợc kết nối - với các nơ ron ở lớp kế tiếp theo một hƣớng, khơng cho phép các liên kết giữa các - nơ ron cùng một lớp hoặc các liên kết ngƣợc giữa nơ ron lớp vào và lớp ra.- -

Luồng thơng tin trong mạng nơ ron đi từ trái qua phải, các giá trị đầu vào x - đƣợc truyền tới các nơ ron lớp ẩn thơng qua trọng số kết nối sau đĩ đƣa tới lớp ra. - Trọng số kết nối từ nơ-ron ẩn thứ j tới nơ-ron ra thứ k đƣợc kí hiệu là vjk.

Mỗi nơ ron tính tốn đầu ra của nĩ dựa trên mức độ kích thích nhận về từ - đầu vào. Cụ thể, đầu vào của nơ ron đƣợc tính bằng tổng các trọng số đầu vào của - nĩ, đầu ra của nơ ron đƣợc tính dựa trên hàm kích hoạt.-

Với lớp nơ ron ẩn thứ j:- n i ij i j i j j w x y f a a 1 , (2-2) Với nơ ron ra thứ k:-

k j k k k j kj j v y z f a a 1 , (2-3) Trong đĩ:

aj, ak: là tổng (Summing function) tất cả các đầu vào mơ tả tồn bộ thế năng tác động ở thân nơ ron thứ j thuộc lớp ẩn và nơ ron thứ k thuộc lớp ra.- -

xi, yj: là các đầu vào (input signals), i=1,2,...n là số lƣợng đầu vào của nơ ron thứ j trong lớp ẩn. Và j=1, 2, ...k là số lƣợng đầu vào của nơ-ron thứ k trong lớp ra. (adsbygoogle = window.adsbygoogle || []).push({});

wji, vkj: là trọng số liên kết (Synaptic weight) giữa các đầu vào của nơ ron thứ j - thuộc lớp ẩn và nơ-ron thứ k thuộc lớp ra.

θj, θk: là ngƣỡng (cịn gọi là một độ lệch - bias), đƣợc đƣa vào nhƣ một thành phần của hàm truyền xác định ngƣỡng kích thích hay ức chế.

2.1.3.4 Phƣơng pháp học trên mạng nơ ron

H c trong mọ ạng nơ ron đƣợ- c hi u theo hai m h c v c u trúc và h c v ể ặt: ọ ề ấ ọ ề tham s . H c c u trúc là lu t hố ọ ấ ậ ọc qua đĩ cĩ sự ến đổ ề ố ớ bi i v s l p trong mạng cũng nhƣ sự thay đổ ố nơi s -ron trong m i l p. H c tham s là lu t hỗ ớ ọ ố ậ ọc thay đổi, c p nh t ậ ậ các trọng s liên k t. ố ế

2.1.3.5 H c tham s : ọ

H c tham s phù h p v i tín hiọ ố ợ ớ ệu đầu vào cĩ nhi u ho c d ễ ặ ữ liệu đầu vào ph c t p. Quá trình h c trong m ng ANN th c ch t là m t quá trình hu n luyứ ạ ọ ạ ự ấ ộ ấ ện m ng sao cho t mạ ừ ột tập d liữ ệu đầu vào ta thu đƣợ ậc t p d liữ ệu đầu ra mong mu n. ố N u d ế ữ liệu ra vƣợt quá sai s cho phép thì m ng s t u ch nh (cĩ th ố ạ ẽ ự điề ỉ ể thay đổi trọng s liên k t gi a các thành ph n hoố ế ữ ầ ặc thay đổ ấi c u trúc mạng) để thu đƣợc tín hiệu đầu ra mong mu n. H c tham s là quá trình hu n luyố ọ ố ấ ện làm thay đổi các trọng s liên k t c a mố ế ủ ạng để đạt đƣợc k t qu yêu c u. Trong quá trình này, các tr ng s ế ả ầ ọ ố c a m ng s h i t d n t i các giá tr sao cho v i mủ ạ ẽ ộ ụ ầ ớ ị ớ ỗi vector đầu vào x t t p hu n ừ ậ ấ luy n, m ng s ệ ạ ẽcho ra vector đầu ra y nhƣ mong muốn.

2.1.3.6 H c giám sát vọ ới thuật tốn lan truyền ngƣợc

Thuật tốn tổng quát cho học cĩ giám sát trong các mạng nơ ron cĩ nhiều cài - đặt khác nhau, sự khác nhau chủ yếu là cách các trọng số liên kết đƣợc thay đổi trong suốt thời gian học. Trong đĩ tiêu biểu nhất là thuật tốn lan truyền ngƣợc.

V ề cơ bản, thuật tốn lan truyền ngƣợc là dạng tổng quát của thuật tốn trung bình bình phƣơng tối thiểu (Least Means Square-LMS). Thuật tốn này thuộc dạng thuật tốn xấp xỉ để tìm các điểm mà tại đĩ hiệu năng của mạng là tối ƣu. Chỉ số tối ƣu thƣờng đƣợc xác định bởi một hàm số của ma trận trọng số và các đầu vào nào đĩ mà trong quá trình tìm hiểu bài tốn đặt ra.

Giải thuật học lan truyền ngƣợc tìm kiếm một vectơ các trọng số (weight vector) giúp cực tiểu hĩa lỗi tổng thể của hệ thống đối với tập học.

Giải thuật lan truyền ngƣợc gồm hai giai đoạn:

+ Giai đoạn lan truyền tiến (Signal forword). Các tín hiệu đầu vào (vectơ các giá trị đầu vào) đƣợc lan truyền tiến từ tầng đầu vào đến tầng đầu ra (đi qua các tầng ẩn).

Truyền tuyến tính (tính output của các nơ ron): dữ liệu từ lớp đầu vào qua - lớp ẩn và đến lớp đầu ra để thay đổi giá trị của trọng số liên kết w của các nơ ron trong mạng biểu diễn dữ liệu học. Sự khác nhau giữa giá trị mong muốn và giá trị mà mạng tính đƣợc gọi là lỗi.

+ Giai đoạn lan truyền ngƣợc lỗi (Error backward):

Truyền ngƣợc (thay đổi trọng số của các cung, dùng thơng tin gradient của hàm lỗi): giá trị lỗi sẽ đƣợc truyền ngƣợc lại sao cho quá trình huấn luyện sẽ tìm ra trọng số để lỗi nhỏ nhất.

Căn cứ vào giá tr u ra mong mu n cị đầ ố ủa vectơ đầu vào, h th ng ệ ố

Một phần của tài liệu (LUẬN văn THẠC sĩ) NGHIÊN cứu MẠNG nơ RON NHÂN tạo và ỨNG DỤNG vào dự báo lạm PHÁT (Trang 27)