MẠNG NƠRON NHÂN TẠO

Một phần của tài liệu (LUẬN văn THẠC sĩ) NGHIÊN cứu MẠNG nơ RON NHÂN tạo và ỨNG DỤNG vào dự báo lạm PHÁT (Trang 37)

Mạng nơron đƣợc giới thiệu đầu tiên năm 1943 bởi nhà thần kinh học Warren McCulloch và nhà logic học Walter Pits. Dựa trên quan điểm cho rằng bộ não ngƣời là bộ điều khiển.

Mỗi nơron sinh học cĩ 4 thành phần cơ bản: Thân nơron (soma), Nhánh hình cây (dendrite), Sợi trục (axon), Khớp (synapse) [12].

2.1.1 Định nghĩa mạng Nơron nhân tạo (Artifcial Neural Network -ANN):

Mạng nơ-ron nhân tạo gọi tắt là mạng nơ-ron là một mơ hình xử lý thơng tin phỏng theo cách thức xử lý thơng tin của các hệ nơ-ron sinh học. Nĩ đƣợc tạo lên từ một số lƣợng lớn các phần tử (gọi là các nơ-ron) kết nối với nhau thơng qua các liên kết (gọi là trọng số liên kết) làm việc nhƣ một thể thống nhất để giải quyết bài tốn dự báo giá [12].

2.1.2 Các tính chất của mạng Nơron

Là hệ phi tuyến: mạng nơ-ron cĩ khả năng to lớn trong lĩnh vực nhận dạng và điều khiển các đối tƣợng phi tuyến.

Là hệ xử lý song song: mạng nơ-ron cĩ cấu trúc song song, do đĩ cĩ tốc độ tính tốn rất cao giúp nâng cao hiệu quả tính tốn.

Là hệ học và thích nghi: mạng đƣợc luyện từ các số liệu quá khứ, cĩ khả năng tự chỉnh khi số liệu đầu vào bị mất, rất phù hợp với các hệ thống máy học.

29

Là hệ nhiều biến, là hệ nhiều đầu vào, nhiều đầu ra (Many Input Many Output - MIMO), rất tiện dùng khi đối tƣợng cĩ nhiều biến.

2.1.3 Cấu trúc mạng nơ – ron 2.1.3.1 Đơn vị xử lý perceptron

Trên cơ sở mơ hình Nơron sinh vật tổng quát ngƣời ta đề xuất mơ hình nơ-ron nhân tạo (perceptron). Mơ hình nơ-ron nhân tạo đƣợc xây dựng từ ba thành phần chính: bộ tổng các liên kết đầu vào, động học tuyến tính và phi tuyến tính [12].

Hình 2.1: Cấu trúc một perceptron

Để mơ phỏng một nơ-ron ta coi nĩ nhƣ một hệ thống nhiều đầu vào và một

đầu ra.

- Bộ tổng liên kết: là bộ tổng hợp các liên kết đầu vào của một phần tử nơ-ron cĩ thể mơ tả nhƣ sau:

a n w x

j ji i

j 1

Trong đĩ:

a j: là tổng (Summing function) tất cả các đầu vào mơ tả tồn bộ thế năng tác động ở thân nơ-ron.

xi: là các đầu vào (input signals), i=1,2,...n là số lƣợng đầu vào mơ tả tín hiệu vào từ các đầu nhánh thần kinh hoặc từ các nơ-ron khác đƣa vào. Các tín hiệu này thƣờng đƣợc đƣa vào dƣới dạng một vector n chiều.

wji: là trọng số liên kết (Synaptic weight), là hệ số mơ tả mức độ liên kết giữa các đầu vào thứ i tới nơ-ron thứ j.

θj: là ngƣỡng (cịn gọi là một độ lệch - bias), đƣợc đƣa vào nhƣ một thành phần của hàm truyền xác định ngƣỡng kích thích hay ức chế.

Hàm truyền (Transfer function): dùng để giới hạn phạm vi đầu ra của mỗi nơron. Nĩ nhận đầu vào là kết quả của hàm tổng và ngƣỡng đã cho.Thơng thƣờng, phạm vi đầu ra của mỗi nơ-ron đƣợc giới hạn trong đoạn [0,1] hoặc [-1, 1]. Các hàm truyền rất đa dạng, cĩ thể là các hàm tuyến tính hoặc phi tuyến. Việc lựa chọn hàm truyền nào là tuỳ thuộc vào từng bài tốn và kinh nghiệm của ngƣời thiết kế mạng.

2.1.3.2 Tiến trình học của mạng nơ ron

Đối với con ngƣời, học là một quá trình rất quan trọng, nhờ học mà bộ não ngày càng tích luỹ những kinh nghiệm để thích nghi với mơi trƣờng và xử lý tình huống tốt hơn.

Mạng nơ ron cĩ khả năng học, nhớ lại và khái quát hĩa từ các dữ liệu đã học bằng cách gán và điều chỉnh các giá trị trọng số của các liên kết giữa các nơ ron.

Trong quá trình học, từ các giá trị đầu vào, qua quá trình xử lí để tìm đƣợc các giá trị đầu ra.

Sau đĩ là quá trình so sánh giá trị tạo ra bởi mạng nơ ron với giá trị đầu ra mong muốn. Nếu hai giá trị này giống nhau thì khơng thay đổi gì cả. Tuy nhiên, nếu cĩ một sai lệch giữa hai giá trị này vƣợt quá giá trị sai số mong muốn thì đi ngƣợc mạng từ đầu ra về đầu vào để thay đổi một số kết nối.

Đây là một quá trình lặp liên tục và cĩ thể khơng dừng khi khơng tìm các giá trị trọng số sao cho đầu ra tạo bởi mạng nơ ron bằng đúng đầu ra mong muốn. Do đĩ trong thực tế ngƣời ta phải thiết lập tiêu chuẩn dựa trên một giá trị sai số nào đĩ

của hai giá trị này, hay dựa trên một số lần lặp xác định.

2.1.3.3 Mạng nơ ron nhiều lớp:

Trong mạng nơ-ron truyền thẳng nhiều lớp, các liên kết đi theo một hƣớng nhất định từ lớp vào tới lớp ra. Chúng khơng tạo thành đồ thị cĩ chu trình với các đỉnh là các nơ-ron, các cung là các liên kết giữa chúng.

31

Hình 2.2: Mạng nơ ron nhiều lớp

Một mạng truyền thẳng nhiều lớp bao gồm một lớp vào (Input layer), một lớp ra (Output layer) và một hoặc nhiều lớp ẩn (Hidden layer) nằm giữa lớp vào và lớp ra. Các nơ-ron đầu vào thực chất khơng phải là các nơ-ron theo đúng nghĩa bởi chúng chƣa thực hiện bất kỳ một tính tốn nào trên dữ liệu vào mà chỉ đơn giản là nhập dữ liệu từ bên ngồi đƣa vào và chuyển cho các lớp kế tiếp. Các nơ-ron lớp ẩn và lớp ra mới thực sự thực hiện tính tốn, kết quả đƣợc tính tốn thơng qua hàm

chuyển. Cụm từ “truyền thẳng”( feed forword) (khơng phải là trái nghĩa với lan truyền ngƣợc) liên quan đến một thực tế là mỗi nơ-ron của lớp này chỉ đƣợc kết nối với các nơ-ron ở lớp kế tiếp theo một hƣớng, khơng cho phép các liên kết giữa các nơ-ron cùng một lớp hoặc các liên kết ngƣợc giữa nơ-ron lớp vào và lớp ra.

Luồng thơng tin trong mạng nơ-ron đi từ trái qua phải, các giá trị đầu vào x đƣợc truyền tới các nơ-ron lớp ẩn thơng qua trọng số kết nối sau đĩ đƣa tới lớp ra. Trọng số kết nối từ nơ-ron ẩn thứ j tới nơ-ron ra thứ k đƣợc kí hiệu là vjk .

Mỗi nơ-ron tính tốn đầu ra của nĩ dựa trên mức độ kích thích nhận về từ đầu vào. Cụ thể, đầu vào của nơ-ron đƣợc tính bằng tổng các trọng số đầu vào của nĩ, đầu ra của nơ-ron đƣợc tính dựa trên hàm kích hoạt.

Với lớp nơ-ron ẩn thứ j:

n

aj w xi j, yi f aj (2-2)

ij

i 1 Với nơ-ron ra thứ k:

32

a k

j kj

j 1 Trong đĩ:

aj, ak: là tổng (Summing function) tất cả các đầu vào mơ tả tồn bộ thế năng tác động ở thân nơ-ron thứ j thuộc lớp ẩn và nơ-ron thứ k thuộc lớp ra.

xi, yj: là các đầu vào (input signals), i=1,2,...n là số lƣợng đầu vào của nơ ron thứ j trong lớp ẩn. Và j=1, 2, ...k là số lƣợng đầu vào của nơ-ron thứ k trong lớp ra. wji, vkj: là trọng số liên kết (Synaptic weight) giữa các đầu vào của nơ-ron thứ j thuộc lớp ẩn và nơ-ron thứ k thuộc lớp ra.

θj, θk: là ngƣỡng (cịn gọi là một độ lệch - bias), đƣợc đƣa vào nhƣ một thành phần của hàm truyền xác định ngƣỡng kích thích hay ức chế.

2.1.3.4 Phƣơng pháp học trên mạng nơ ron

Học trong mạng nơ-ron đƣợc hiểu theo hai mặt: học về cấu trúc và học về tham số. Học cấu trúc là luật học qua đĩ cĩ sự biến đổi về số lớp trong mạng cũng nhƣ sự thay đổi số nơ-ron trong mỗi lớp. Học tham số là luật học thay đổi, cập nhậtcác trọng số liên kết.

2.1.3.5 Học tham số:

Học tham số phù hợp với tín hiệu đầu vào cĩ nhiễu hoặc dữ liệu đầu vào phức tạp. Quá trình học trong mạng ANN thực chất là một quá trình huấn luyện mạng sao cho từ một tập dữ liệu đầu vào ta thu đƣợc tập dữ liệu đầu ra mong muốn. Nếu dữ liệu ra vƣợt quá sai số cho phép thì mạng sẽ tự điều chỉnh (cĩ thể thay đổi trọng số liên kết giữa các thành phần hoặc thay đổi cấu trúc mạng) để thu đƣợc tín hiệu đầu ra mong muốn. Học tham số là quá trình huấn luyện làm thay đổi các trọng số liên kết của mạng để đạt đƣợc kết quả yêu cầu. Trong quá trình này, các trọng số của mạng sẽ hội tụ dần tới các giá trị sao cho với mỗi vector đầu vào x từ tập huấn luyện, mạng sẽ cho ra vector đầu ra y nhƣ mong muốn.

33

2.1.3.6 Học giám sát với thuật tốn lan truyền ngƣợc

Thuật tốn tổng quát cho học cĩ giám sát trong các mạng nơ-ron cĩ nhiều cài đặt khác nhau, sự khác nhau chủ yếu là cách các trọng số liên kết đƣợc thay đổi trong suốt thời gian học. Trong đĩ tiêu biểu nhất là thuật tốn lan truyền ngƣợc.

Về cơ bản, thuật tốn lan truyền ngƣợc là dạng tổng quát của thuật tốn trung bình bình phƣơng tối thiểu (Least Means Square-LMS). Thuật tốn này thuộc dạng thuật tốn xấp xỉ để tìm các điểm mà tại đĩ hiệu năng của mạng là tối ƣu. Chỉ số tối ƣu thƣờng đƣợc xác định bởi một hàm số của ma trận trọng số và các đầu vào nào đĩ mà trong quá trình tìm hiểu bài tốn đặt ra.

Giải thuật học lan truyền ngƣợc tìm kiếm một vectơ các trọng số (weight vector) giúp cực tiểu hĩa lỗi tổng thể của hệ thống đối với tập học.

Giải thuật lan truyền ngƣợc gồm hai giai đoạn:

+ Giai đoạn lan truyền tiến (Signal forword). Các tín hiệu đầu vào (vectơ các giá trị đầu vào) đƣợc lan truyền tiến từ tầng đầu vào đến tầng đầu ra (đi qua các tầng ẩn).

Truyền tuyến tính (tính output của các nơ-ron): dữ liệu từ lớp đầu vào qua lớp ẩn và đến lớp đầu ra để thay đổi giá trị của trọng số liên kết w của các nơ ron trong mạng biểu diễn dữ liệu học. Sự khác nhau giữa giá trị mong muốn và giá trị mà mạng tính đƣợc gọi là lỗi.

+ Giai đoạn lan truyền ngƣợc lỗi (Error backward):

Truyền ngƣợc (thay đổi trọng số của các cung, dùng thơng tin gradient của hàm lỗi): giá trị lỗi sẽ đƣợc truyền ngƣợc lại sao cho quá trình huấn luyện sẽ tìm ra trọng số để lỗi nhỏ nhất.

Căn cứ vào giá trị đầu ra mong muốn của vectơ đầu vào, hệ thống tính tốn giá trị lỗi.

Bắt đầu từ tầng đầu ra, giá trị lỗi đƣợc lan truyền ngƣợc qua mạng, từ tầng này qua tầng khác (phía trƣớc), cho đến tầng đầu vào.

Việc lan truyền ngƣợc lỗi (Error back-propagation) đƣợc thực hiện thơng qua việc tính tốn (một cách truy hồi) giá trị gradient cục bộ của mỗi nơ ron.

34

Xét một mạng nơ-rơn 3 lớp: lớp đầu vào (input), lớp ẩn (hidden), lớp đầu ra

(output).

Hàm kích hoạt của các nơ-ron: logistic sigmoid

Hàm lỗi :

Với t: đầu ra mong muốn z: đầu ra thực tế.

Hình 2.3: Mạng nơ ron 3 lớp

+ Đạo hàm riêng của hàm lỗi theo trọng số b:

E b

Ta cĩ :

download by : skknchat@gmail.com Đặt Khi đĩ ta đƣợc: Nơ ron tầng ẩn : y = g(u) d u a 0 xiai i 1

Đạo hàm riêng của hàm lỗi theo trọng số a:

E Ta cĩ : y E zi vi y y u u aj Đặt q E ypi bi y u Ta được : E q i 0 0 a qx i i i 36

(2-10) (2-11) (2-12) (2-13) (2-14) (2-15) (2-16) (2-17) (2-18) (2-19) (2-20) (2-21) (2-22) download by : skknchat@gmail.com

Sau khi tính đƣợc đạo hàm riêng của hàm lỗi theo từng trọng số.Trọng số sẽ đƣợc điều chỉnh bằng cách trừ bớt 1 lƣợng bằng tích của đạo hàm riêng và tốc độ học:

wi wi

2.1.3.7 Thuật tốn lan truyền ngƣợc

Để huấn luyện một mạng và xem xét nĩ thực hiện tốt đến đâu, ngƣời ta xây dựng hàm đánh giá để cung cấp cách thức đánh giá hệ thống một cách khơng nhập nhằng. Việc chọn hàm đánh giá là rất quan trọng bởi hàm đánh giá thể hiện mục tiêu thiết kế và thuật tốn huấn luyện nào cĩ thể áp dụng. Để phát triển một hàm mục tiêu đo chính xác cái chúng ta muốn khơng phải là việc dễ dàng. Hàm đƣợc sử dụng rộng rãi là hàm tổng bình phƣơng lỗi:

n

E 21 ( dk yk )2 k 1

Trong đĩ:

E: là sai số

dk: giá trị mong muốn tại đầu ra thứ k

yk: giá trị thực tế đầu ra thứ k

2.2 Lạm phát kinh tế2.2.1 Khái niệm lạm phát 2.2.1 Khái niệm lạm phát

Lạm phát đƣợc định nghĩa là sự gia tăng liên tục trong mức giá chung. Điều này khơng nhất thiết cĩ nghĩa giá cả của mọi hàng hĩa và dịch vụ đồng thời phải tăng lên theo cùng một tỷ lệ, mà chỉ cần mức giá trung bình tăng lên. Lạm phát vẫn cĩ thể xảy ra khi giá của một số hàng hĩa giảm, nhƣng giá cả của các hàng hĩa và dịch vụ khác tăng đủ mạnh. Lạm phát cũng cĩ thể đƣợc định nghĩa là sự suy giảm sức mua của đồng tiền. Trong bối cảnh lạm phát, một đơn vị tiền tệ mua đƣợc ngày càng ít đơn vị hàng hĩa và dịch vụ hơn. Hay nĩi một cách khác, trong bối cảnh lạm

37

phát, chúng ta sẽ phải chi ngày càng nhiều tiền hơn để mua một giỏ hàng hĩa và dịch vụ nhất định. Nếu thu nhập bằng tiền khơng tăng kịp tốc độ trƣợt giá, thì thu nhập thực tế, tức là sức mua của thu nhập bằng tiền sẽ giảm. Do vậy, thu nhập thực tế tăng lên hay giảm xuống trong thời kỳ lạm phát phụ thuộc vào điều gì xảy ra với thu nhập bằng tiền, tức là, phải chăng các cá nhân cĩ nhận thêm lƣợng tiền đã giảm giá trị đủ để bù đắp cho sự gia tăng của mức giá hay khơng. Ngƣời dân vẫn cĩ thể trở nên khá giá hơn khi thu nhập bằng tiền tăng nhanh hơn tốc độ tăng giá.

Lạm phát là tỷ lệ mà tại đĩ mức chung của giá cả hàng hĩa và dịch vụ đang tăng, và do đĩ, sức mua của tiền tệ đang giảm. Ngân hàng trung ƣơng cố gắng để hạn chế lạm phát, và tránh tình trạng giảm phát, để giữ cho nền kinh tế vận hành trơn tru.

Lạm phát là một phạm trù vốn cĩ của nền kinh tế thị trƣờng, nĩ xuất hiện khi các yêu cầu của các quy luật kinh tế hàng hố khơng đƣợc tơn trọng, nhất là quy luật lƣu thơng tiền tệ. Ở đâu cịn sản xuất hàng hố, cịn tồn tại những quan hệ hàng hố tiền tệ thì ở đĩ cịn ẩn náu khả năng lạm phát và lạm phát chỉ xuất hiện khi các quy luật của lƣu thơng tiền tệ bị vi phạm.

Định nghĩa 2.1 [Lạm phát]:

1. Lạm phát là phần trăm thay đổi trong giá trị của giá bán buơn Index (WPI) trên một năm so với năm cơ sở. Nĩ ảnh hưởng đến thay đổi của giá cả trong một giỏ hàng hĩa và dịch vụ trong một năm.

2. Lạm phát là sự tăng lên của mức giá trung bình theo thời gian.

Theo nhƣ định nghĩa lạm phát đĩ chính là sức mua của một đơn vị tiền tệ rớt xuống, cĩ nghĩa hàng hĩa tăng giá. Ví dụ, nếu tỷ lệ lạm phát là 2%, sau đĩ là một gĩi kẹo cao su mà chi phí $ 1 trong một năm sẽ cĩ giá 1,02 $ các năm tiếp theo. Khi hàng hĩa và dịch vụ địi hỏi nhiều tiền hơn để mua, giá trị của đồng tiền mất giá.

Lý thuyết kinh tế hiện đại mơ tả ba loại lạm phát:

+ Lạm phát chi phí đẩy là do tăng lƣơng gây ra các doanh nghiệp phải tăng giá để bù đắp chi phí lao động cao hơn, dẫn đến nhu cầu về tiền lƣơng vẫn cao (xoắn ốc giá tiền lƣơng).

38

+ Kết quả lạm phát cầu kéo từ nhu cầu tiêu dùng ngày càng tăng tài trợ bởi tính khả dụng dễ dàng hơn của tín dụng.

+ Lạm phát tiền tệ gây ra bởi việc mở rộng cung tiền (do in nhiều tiền hơn bằng một chính phủ để bù đắp thâm hụt ngân sách của nĩ).

2.2.2 Phân loại lạm phát

Lạm phát thƣờng đƣợc phân loại dựa trên tính chất hoặc theo mức độ của tỷ lệ lạm phát. Việc phân loại lạm phát theo tính chất sẽ chia thành 3 loại lạm phát: lạm phát vừa phải, lạm phát phi mã và siêu lạm phát.

Lạm phát vừa phải: lạm phát vừa phải đƣợc đặc trƣng bởi mức giá tăng chậm và nhìn chung cĩ thể dự đốn trƣớc đƣợc vì tƣơng đối ổn định. Đối với các

Một phần của tài liệu (LUẬN văn THẠC sĩ) NGHIÊN cứu MẠNG nơ RON NHÂN tạo và ỨNG DỤNG vào dự báo lạm PHÁT (Trang 37)

Tải bản đầy đủ (DOCX)

(71 trang)
w