Các tính chất của mạng nơron nhân tạo .... Chính kh ả năng này đã làm cho điều khiển nơron truyền th ng sao chẳ ụp đƣợc phƣơng thức x lý thông tin và ửđiều khi n c a con ngƣể ủ ời.. Tron
TỔ NG QUAN V M Ề ẠNG NƠRON NHÂN TẠ O
Các tính ch ất củ a m ạng nơron nhân tạ o
Là h phi tuyệ ến: Mạng nơron có khả năng to lớn trong lĩnh vực nh n d ng ậ ạ và điều khiển các đối tƣợng phi tuyến
Là h x lý song song:ệ ử Mạng nơron có cấu trúc song song, do đó có tốc độ tính toán r t cao, rấ ất phù h p vợ ới lĩnh vực nh n dậ ạng và điều khi n ể
Là h h c và thích nghi:ệ ọ Mạng đƣợc luy n t các s u quá kh , có kh ệ ừ ốliệ ứ ả năng tự ch nh khi s liỉ ố ệu đầu vào b m t, có th ị ấ ể điều khi n on-line ể
Là h ệ nhiều bi n, là h ế ệnhiề đầu u vào, nhiều đầu ra (Many Input Many Output - MIMO), rất tiện dụng khi điều khiển đối tƣợng có nhi u bi n s ề ế ố
C u trúc và mô hình m ấ ạng nơ - ron
Theo m c 7.1.1 Tr.208 tài li u tham kh o [1] ụ – ệ ả
Mạng nơron là s tái t o b ng k ự ạ ằ ỹthuật nh ng chữ ức năng của h ệ thần kinh con người Trong quá trình tái t o không ph i t t c các chạ ả ấ ả ức năng của b não con ộ người có đều được tái t o, mà ch có nh ng chạ ỉ ữ ức năng cần thi t Bên cế ạnh đó còn có nh ng chữ ức năng mới đƣợ ạc t o ra nh m gi i quy t mằ ả ế ột bài toán điều khiển đã định hướng trước
Mạng nơron bao g m vô s ồ ốcác nơron đƣợc liên k t truy n thông v i nhau ế ề ớ trong m ng Hình 1.1 là mạ ột phần c a mủ ạng nơron bao gồm hai nơron
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B
Hình 1 1 Một mạng nơ ron cơ bả- n g m hai thành ph n ồ ầ
Một nơ-ron chứa đựng các thành phần cơ bản:
-Thân nơ ron đƣợ- c gi i h n trong m t màng membran và trong cùng là nhân ớ ạ ộ
T ừ thân nơ-ron còn có rất nhiều đường r nhánh t m g i là r ẽ ạ ọ ễ
-“Bus” liên kết nơ-ron này với các nơ ron khác đƣợ- c g i là axon, trên axon ọ có các đường r ẽ nhánh Nơ-ron còn có th liên k t vể ế ới các nơ-ron khác qua các r ễ Chính vì cách liên kết đa dạng nhƣ vậy nên mạng nơ ron có độ- liên k t r t cao.ế ấ Các r cễ ủa nơ ron đƣợ- c chia thành hai lo i: lo i nh n thông tin t -ron ạ ạ ậ ừ nơ khác qua axon, mà ta s g i là r u vào và loẽ ọ ễ đầ ại đƣa thông tin qua axon tới các nơ- ron khác, g i là r u ra Mọ ễ đầ ột nơ-ron có th có nhi u r ể ề ễ đầu vào, nhƣng chỉ có một r u ra B i v y nễ đầ ở ậ ếu xem nơ ron nhƣ một khâu điề- u khi n thì nó chính là khâu có ể nhiều đầu vào, một đầu ra (khâu MISO)
Hình 1 2 Nơ-ron là khâu MISO
M t tính ch t rộ ấ ất cơ bản c a mủ ạng nơ-ron sinh học là các đáp ứng theo kích thích có kh ả năng thay đổi theo th i gian ờ Các đáp ứng có th ể tăng lên, giảm đi hoặc hoàn toàn bi n m t Qua các nhánh axon liên k t t ế ấ ế ế bào nơ-ron này với các nơ-ron khác, s ự thay đổi tr ng thái c a mạ ủ ột nơ ron cũng sẽ- kéo theo s ự thay đổi tr ng thái ạ c a nhủ ững nơ ron khác và do đó là sự thay đổ ủ- i c a toàn b mộ ạng nơ-ron Vi c thay ệ
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B đổi tr ng thái c a mạ ủ ạng nơ-ron có th th c hi n qua mể ự ệ ột quá trình “dạy” hoặc do kh ả năng “học” tự nhiên S thay th nh ng tính ch t này b ng m t mô hình toán ự ế ữ ấ ằ ộ học tương đương được g i là mọ ạng nơ-ron nhân t o Mạ ạng nơ-ron nhân t o có th ạ ể đƣợc ch t o b ng nhi u cách khác nhau vì v y trong th c t t n t i r t nhi u ki u ế ạ ằ ề ậ ự ế ồ ạ ấ ề ể mạng nơ-ron nhân t o ạ
Khâu c ng :ộ Σ Khâu c ng tín hi u vào có chộ ệ ức năng thực hiện phương trình sau:
tức là thực hiện phép nhân vô hướng hai vector w1 w w m
Khâu tiền đáp ứng c: Những kh ả năng hoạt động của nơ-ron hoàn toàn ph ụ thuộc vào khâu t o chạ ức năng đáp ứng c Th ế năng của m t màng membran càng ộ cao nếu nhƣ giá trị càng l n Khâu t o chớ ạ ức năng đáp ứng t o giá tr ạ ị đáp ứng tăng giảm ph thu c vào giátr u vào, mụ ộ ị đầ ột cách đơn giản nh t có th tấ ể ạo đáp ứng theo phương trình c (2.38)
Quan h gi a tín hiệ ữ ệu vào và ra được bi u diể ễn theo phương trình trên là một quan h ệ tĩnh và tuyến tính Đây cũng là cách thiế ế nơt k -ron nhân t o mạ ột cách đơn gi n nh ả ất.Để tăng độ chính xác người ta tìm cách xây dựng mô hình động cho nơ- ron Thự ế, khi có kích thích đầc t u vào, th ế năng của màng membran tăng dần lên cho dù ngay t i thạ ời điểm đƣợc kích thích vẫn chƣa có đáp ứng đầu ra Hoàn toàn tương tự, khi kích thích mất đi thì nơ ron cũng không thể ở ề- tr v ngay tr ng thái cân ạ bằng cũ mà sự v trở ềdiễn ra cũng dần dần nhƣ một quá trình liên t c theo th i gian ụ ờ Quá trình đó có thể mô t ả qua phương trình vi phân bậc nh t : ấ
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B trong đó c 0 là th ế năng của m ng membran ng thái không b ạ ở trạ ị kích thích Đó là phương trình động h c c a m t khâu quán tính b c nh t v i h ng s th i gian quán ọ ủ ộ ậ ấ ớ ằ ố ờ tính T Khâu t o chạ ức năng đá ứp ng ki u này còn có tên là BSB ể
Khâu đáp ứng : Giá tr ị ra yc a mủ ột nơ-ron bi u di n tr ng thái kích ể ễ ạ thích đến các nơ-ron ti p theo trong m ng Tín hi u raế ạ ệ yph ụ thuộc vào độ kích thích của nơ ron, thông thường đượ- c so sánh theo ki u cể ắt ngưỡng Quan h này ệ được mô t qua khâu tả ạo đáp ứng của mô hình nơ ron Thông thườ- ng giá tr ra ị y phải thay đổi liên t c theo s ụ ự thay đổ ủi c a ti n ề đáp ứng c hoặc không thay đổi n u ế c nh ỏ hơn giá trị ngƣỡng.
Nh ững mô hình nơ ron thườ - ng s d ng 12 ử ụ 1.5 C u t o mấ ạ ạng nơ -ron
Theo m c 7.1.2 Tr.214 tài li u tham kh o [1] : ụ – ệ ả
M i m t k t n i t vector tín hi u vào ỗ ộ ế ố ừ ệ x t i tín hi u ra ớ ệ y , qua đặc tính c a ủ khâu c ng v i hàm mô t (2.37), khâu tiộ Σ ớ ả ền đáp ứng c , và khâu tạo đáp ứ ng s ẽ cho ra một mô hình nơ ron Nhƣ vậ ổ- y t ng c ng s có t t c là ộ ẽ ấ ả 15 mô hình nơ-ron Giá trị đầ u ra ycủa nơ-ron là:
Tuy nhiên, ph bi n nhổ ế ất trong số 15 mô hình nơ-ron là sáu loại sau:
1.5 Cấu tạo mạng nơ-ron
Theo m c 7.1.3 Tr.208 tài li u tham kh o [1]: ụ – ệ ả
D a trên nhự ững phương pháp xây dựng nơ-ron ph n trên, ta có th ở ầ ể coi nơ- ron nhƣ mộ ệt h MISO truyền đạt và x lý tín hiử ệu Đặc tính truy n t cề đạ ủa nơ-ron
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B ph n lầ ớn là đặc tính truyền đạt tĩnh, chỉ khi ch n khâu chọ ức năng đáp ứng ki u BSB ể thì lúc đó nơ ron có đặc tính độ- ng Trong mọi trường hợp do đặc tính phi tuy n c a ế ủ khâu t o chạ ức năng ra kế ợt h p và/ho c vặ ới đặc tuy n phi tuy n c a khâu t o chế ế ủ ạ ức năng đáp ứng mà nơ-ron là m t h có tính phi tuy n m nh ộ ệ ế ạ
Liên kết các đầu vào và ra c a nhiủ ều nơ-ron với nhau ta đƣợc m t mộ ạng nơ- ron Vi c ghép nệ ối các nơ-ron trong m ng v i nhau có th theo mạ ớ ể ột nguyên t c bắ ất k ỳ nào đó, vì về nguyên t c mắ ột nơ-ron là m t h MISO T ộ ệ ừ đó có thể phân bi các ệt loại nơ ron khác nhau nhƣ các loại nơ ron mà các đầ- - u vào nh n thông tin t môi ậ ừ trường bên ngoài v i các loớ ại nơ ron mà các đầu vào đượ- c n i vố ới các nơ-ron khác trong mạng Các nơ ron mà đầ- u vào gi ữ chức năng nhận thông tin t ừ môi trường bên ngoài đóng ức năng “đầu vào” củch a mạng Cũng tương tự như vậy, một nơ-ron có một đầu ra, đầu ra của nơ-ron này có th ể là đầu vào c a nhiủ ều nơ-ron khác hoặc có th ể đưa ra môi môi trường bên ngoài Những nơ ron có đầu ra đưa tín hiệ- u vào môi trường bên ngoài được g i ọ là “đầu ra” của mạng Như vậy m t mộ ạng nơ-ron cũng có chức năng của m t h truyộ ệ ền đạt và x lý tín hi u t ử ệ ừ đầu vào đến đầu ra c a ủ mạng Các nơ-ron trong m t mộ ạng thường được ch n cùng m t loọ ộ ại, chúng được phân biệt với nhau qua vector hàm trọng lƣợng ở đầ u vào w
Hình 1 3 Mạng nơ-ron ba lớp
Nguyên lý c u t o c a m t mấ ạ ủ ộ ạng nơ-ron bao g m nhi u l p, m i l p bao ồ ề ớ ỗ ớ g m nhiồ ều nơ-ron có cùng m t chộ ức năng trong mạng Trong hình 2.2.3 là mô hình c a m t m nủ ộ ạ g nơ-ron ba l p vớ ới 9 nơ-ron Mạng có ba đầu vào x x x 1 , , 2 3 và hai đầu ra y y 1 , 2 Các tín hiệu đầu vào đƣợc đƣa đến ba nơ ron đầu vào, ba nơ- -ron này làm
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B thành lớp đầu vào c a mủ ạng (input layer) Các nơ-ron trong l p này ớ đƣợc gọi là nơ- ron đầu vào Đầu ra của các nơ ron này đƣợc đƣa đến đầ- u vào c a bủ ốn nơ-ron ti p ế theo, bốn nơ-ron này không tr c ti p ti p xúc vự ế ế ới môi trường xung quanh và làm thành l p trung gian trong mớ ạng (hidden layer) Các nơ-ron trong l p này có tên lớ à nơ-ron nội hay nơ-ron b ị che Đầu ra của các nơ ron này đƣợc đƣa đến hai nơ- -ron đưa tín hiệu ra môi trường bên ngoài Các nơ-ron trong lớp đầu ra này có tên là nơ- ron đầu ra (output layer)
Hình 1 5 C u trúc mấ ạng nơ-ron a) M ng truy n th ng m t l p ạ ề ẳ ộ ớ b) M ng h i ti p m t l p ạ ồ ế ộ ớ c) M ng MLP truy n thạ ề ẳng d) M ng MLP hạ ồi tiếp
Mạng nơ ron đƣợ- c xây dựng nhƣ trên là mạng g m ba l p m c n i ti p nhau ồ ớ ắ ố ế đi từ đầu vào đến đầu ra Trong m ng không t n t i b t k m t m ch h i ti p nào k ạ ồ ạ ấ ỳ ộ ạ ồ ế ể
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B c h i ti p n i l n h i ti p t u ra tr v u vào M t mả ồ ế ộ ẫ ồ ế ừ đầ ở ề đầ ộ ạng nơ-ron có c u t o ấ ạ nhƣ vậy đƣợc g i là m ng truyọ ạ ền th ng (feedforward network) M nẳ ạ g nơ-ron có đường ph n h i t u ra c a mả ồ ừ đầ ủ ột nơ-ron tới đầu vào của nơ-ron cùng l p ho c ớ ặ thuộ ớp phía trước l c có tên g i là m ng h i ti p (feedback network) Mọ ạ ồ ế ạng nơ-ron bao g m m t hay nhi u lồ ộ ề ớp trung gian đƣợc g i là m ng MLP (multilayer ọ ạ perceptrons Network) Còn m ng ch có m t l p, v a là l p vào v a là l p trung ạ ỉ ộ ớ ừ ớ ừ ớ gian và cũng là lớp ra thì mạng đó có tên là mộ ớt l p Mạng nơ-ron có c u trúc m ng ấ ạ ghép n i hoàn toàn, t c là b t c mố ứ ấ ứ ột nơ-ron nào trong mạng cũng đƣợc n i v i mố ớ ột hoặc vài nơ-ron khác Trong trường hợp các nơ-ron trong m ng có khâu t o chạ ạ ức năng đáp ứng là khâu tuy n tính, tính phi tuy n ch n m khâu t o chế ế ỉ ằ ở ạ ức năng ra thì vi c m c n i tiệ ắ ố ếp các nơ-ron trong mạng không còn ý nghĩa nữa và lúc đó ta hoàn toàn có thể thay th mế ạng nơ-ron nhi u l p thành mề ớ ạng nơ-ron một lớp.
Phương thức làm vi c c a m ệ ủ ạng nơ - ron
Theo m c 7.1.4 Tr.217 tài li u tham kh o [1]: ụ – ệ ả
Phương thức làm vi c c a m t mệ ủ ộ ạng nơ-ron nhân t o có th phân chia làm ạ ể hai giai đoạn:
-Và giai đoạn h c (learning phase) ọ m t m -ron có c u trúc b n v ng Ở ộ ạng nơ ấ ề ững có nghĩa là vector hàm trọng lƣợ đầu vào, khâu tạo đáp ứng và khâu t o tín hiạ ệu đầu ra đều c nh không b ố đị ị thay đổi v m t cề ặ ấu trúc cũng nhƣ tham số thì m ng có m t quá trình truyạ ộ ền đạt xác định ch chắc ắn, tĩnh hoặc động ph thu c vào c u t o cụ ộ ấ ạ ủa các nơ-ron trong m ng u ạ Ở đầ vào c a m ng xu t hi n thông tin thì tủ ạ ấ ệ ại đầu ra cũng xuất hi n mệ ột đáp ứng tương ứng Đố ới v i mạng nơ-ron có quá trình truyền đạt tĩnh, đáp ứng đầu ra xu t hi n ấ ệ ngay sau khi đầu vào nhận đƣợc thông tin, còn đối v i mớ ạng nơ-ron có quá trình truy n ề đạt động thì ph i sau m t thả ộ ời gian quá độ ở đầ u ra c a mủ ạng nơ-ron mới xu t hiấ ện đáp ứng Xu t phát t ấ ừ quan điểm mọi đáp ứng của nơ ron đề- u tiền định t ự nhiên, có nghĩa là khi xuất hi n các kích thích u vào c a m ng các thệ ở đầ ủ ạ ở ời điểm
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B khác nhau các giá tr ị như nhau thì đáp ứng u ra các thở đầ ở ời điểm tương ứng cũng hoàn toàn gi ng nhau Quá trình làm viố ệc nhƣ vậy c a m t mủ ộ ạng nơ ron đƣợ- c g i là ọ quá trình tái di n l i (reproduction phase) Khi có thông tin u vào mễ ạ ở đầ ạng lưu giữ thông tin đó và dựa trên các tri th c cứ ủa mình đƣa ra đáp ứng u ra phù h p v i ở đầ ợ ớ lƣợng thông tin thu đƣợ ừ đầc t u vào Mạng nơ-ron khi mới hình thành còn chƣa có tri th c, tri th c c a m ng hình thành d n sau m t quá trình h c Mứ ứ ủ ạ ầ ộ ọ ạng nơ ron đƣợ- c d y bạ ằng cách đƣa vào đầu vào nh ng kích thích và m ng hình thành nhữ ạ ững đáp ứng tương ứng, những đáp ứng phù h p v i t ng lo i kích thích s ợ ớ ừ ạ ẽ được lưu giữ, giai đoạn này đƣợc gọi là giai đoạn h c c a mọ ủ ạng Khi đã hình tri thức m ng có th ạ ể gi i quyả ết các vấn đề ụ c th mể ột cách đúng đắn Đó có thể là nh ng vữ ấn đề ứ ng d ng rụ ất khác nhau, đƣợc gi i quy t ch yả ế ủ ếu d a trên s t ch c h p nh t gi a các ự ự ổ ứ ợ ấ ữ thông tin đầu vào c a mủ ạng và các đáp ứng đầu ra:
1) Nhiệm v c a m t m ng liên k t là hoàn ch nh ho c hi u ch nh các ụ ủ ộ ạ ế ỉ ặ ệ ỉ thông tin thu thập đƣợc không đầy đủ ho c b ặ ị tác động c a nhi u Mủ ễ ạng nơ-ron ki u ể này đƣợ ức ng dụng trong lĩnh vực hoàn thi n m u, mà m t trong nhệ ẫ ộ ững lĩnh vực c ụ thể đó là nhận d ng ch vi ạ ữ ết.
2) Nhiệm v t ng quát c a m t mụ ổ ủ ộ ạng nơ ron là lưu giữ độ- ng các thông tin Dạng thông tin lưu giữ đó chính là quan hệ ữa các thông tin đầ gi u vào c a m ng ủ ạ và các đáp ứng đầu ra tương ứng, để khi có m t kích thích b t k ộ ấ ỳ tác động vào m ng, m ng có kh ạ ạ ả năng suy diễn và đƣa ra một đáp ứng phù hợp Đó chính là chức năng nhận d ng theo m u c a mạ ẫ ủ ạng nơ ron Để ự- th c hi n chệ ức năng này, mạng nơ- ron đóng vai trò như mộ ột b ph n t chậ ổ ức các nhóm thông tin đầu vào và tương ứng v i m i nhóm là mớ ỗ ột đáp ứng đầu ra phù hợp Nhƣ vậy m t nhóm bao g m m t loộ ồ ộ ại thông tin đầu vào và một đáp ứng ra Các nhóm có th ể đƣợc hình thành trong quá trình học và cũng có thể hình thành không trong quá trình h c ọ ng d ng, m -ron có kh u
Trong lĩnh vực ứ ụ ạng nơ ả năng tạo ra các đáp ứng đầ ra d a trên thông tin thu th p vào mự ậ ạng, điề đó có nghĩa là ứu ng v i m t thông tin ớ ộ xác định u vào m ng cung c p mở đầ ạ ấ ột đáp ứng tương ứng xác định u ra Nhìn ở đầ trên quan điểm lý thuy t h th ng, mạng nơ ron đƣợc coi nhƣ mộ ộ ấế ệ ố - t b x p x thông ỉ
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B tin, thi t b này có kh ế ị ả năng cung cấp m t quá trình x lý mong mu n m t cách ộ ử ố ộ chính xác Mục đích của quá trình h c là t o ra m t tri th c cho m ng thông qua rèn ọ ạ ộ ứ ạ luy n Nguyên t c hệ ắ ọc đƣợc th c hi n cho m t m ng mà c u trúc c a mự ệ ộ ạ ấ ủ ạng cũng nhƣ các phần t -ron c ử nơ ố định, chính là thay đổi giá tr c a các ph n t ị ủ ầ ử trong vector hàm trọng lƣợng, vector ghép n i gi a các ph n t -ron trong m ng Các ố ữ ầ ử nơ ạ ph n t ầ ử này đƣợc ch n sao cho quá trình truyọ ền đạt mong muốn đƣợc x p x mấ ỉ ột cách đủ chính xác như bài toán yêu cầu Để đạt được mục đích đó, người ta cho tác động vào đầu vào c a m ng hàng loủ ạ ạt các tác động x k ,k1,2 có kh ả năng lặp l i trong quá trình m ng làm vi c Nhạ ạ ệ ững tác động này đƣợc gọi là tác động m u ẫ Các đáp ứng y k của tác động mẫu được so sánh với đáp ứng m u ẫ y k chọn trước và các ph n t c a vector hàm trầ ử ủ ọng lƣợng w đƣợc hi u ch nh sao cho sai l ch so ệ ỉ ệ v i m u mong mu n là nh nh t Quá trình chớ ẫ ố ỏ ấ ỉnh định này s ẽ đƣợc th c hi n cho ự ệ đến khi đạt đƣợc sai s mong muố ốn nào đó Mạng lúc này đã có đƣợc một đáp ứng đầu ra hoàn toàn phù h p vợ ới tác động mẫu đầu vào và k t qu này s ế ả ẽ đƣợc c t gi ấ ữ
Các lu ật họ c
Nhƣ phần trên đã trình bày, học là vấn đề quan tr ng trong mọ ạng nơ-ron Có hai ki u h c: ể ọ
-H c thông s (Paramater Learning):ọ ố Tìm ra bi u th c c p nh t các thông s ể ứ ậ ậ ố v ng s c p nhềtrọ ố ậ ật kết nối giữa các nơron
-H c c u trúc (Structure Learning):ọ ấ Trọng tâm là s biự ến đổ ấi c u trúc của mạng nơ-ron gồm số lƣợng nút (node) và các m u liên kẫ ết
Có hai lo i hạ ọc: Thực hiện đồng th i và kờ hông đồng thời p trung vào ph n h c thông s
Giả ử s ma tr n tr ng s bao g m t t c các ph n t thích ng c a m ng ậ ọ ố ồ ấ ả ầ ử ứ ủ ạ nơron Nhiệm v c a vi c h c thông s là bụ ủ ệ ọ ố ằng cách nào đó, tìm đƣợc ma tr n chính ậ xác mong mu n t ma tr n gi thuyố ừ ậ ả ết ban đầu v i c u trúc c a mớ ấ ủ ạng nơron có sẵn Để làm đƣợc việc đó, mạng nơron sử ụ d ng các tr ng s ọ ố điều ch nh, v i nhi u ỉ ớ ề
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B phương pháp học khác nhau có th tính toán gể ần đúng ma trận W cần tìm đặc trưng cho mạng Có ba phương pháp học:
* H c có giám sát (Supervised Learning) ọ
Là quá trình h c có giám sát (Hình 1.6), m i thọ ở ỗ ời điểm th ứ i khi đƣa tín hi u vào xệ i mạng nơron, tương ứng s ẽ có các đáp ứng mong mu n dố i của đầu ra cho trướ ởc thời điểm đó Hay nói cách khác, trong quá trình học có giám sát, m ng ạ nơron đƣợc cung c p liên t c các c p s li u mong mu n vào - ra t ng thấ ụ ặ ố ệ ố ở ừ ời điểm (x 1 , d 1 ), (x 2 , d 2 ), …, (x k , d k ), … khi cho đầu vào th c c a m ng là xự ủ ạ k tương ứng s ẽ có tín hiệu đầu ra cũng đƣợ ặ ạc l p l i là d k giống nhƣ mong muốn K t qu c a quá ế ả ủ trình h c có giám sát là tọ ạo đƣợc m t hộ ộp đen có đầu vào là véc tơ tín hiệu vào x s ẽ đƣa ra đƣợc câu tr lả ời đúng d
Hình 1 6 Mô hình h c có giám ọ sát và học củng c ố
Hình 1 7 Mô hình h c ọ không có giám sát Để đạ đượ t c k t qu mong muế ả ốn trên, khi đưa vào tín hiệu x k , thông thường s có sai l ch eẽ ệ k gi a tín hiữ ệu đầu ra th c yự k và tín hiệu đầu ra mong mu n dố k Sai lệch đó sẽ đƣợc truyền ngƣợ ới đầu vào để điềc t u ch nh thông s mỉ ố ạng nơron là ma trận trọng sô W… Quá trình c ứthế ế ti p di n sao cho sai l ch gi a tín hi n ra mong ễ ệ ữ ệ muốn và tín hi u ra th c t trong ph m vi cho phép, k t qu ta nhệ ự ế ạ ế ả ận đƣợc ma tr n ậ trọng s W v i các ph n t wố ớ ầ ử ij đã đƣợc điều ch nh phù h p vỉ ợ ới đặc điểm của đối tƣợng hay hàm s mố ạng nơron cần h ọc.
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B
Tín hi u có th ệ ể được đưa tín hiệu d t ừ bên ngoài môi trường (Hình 1.6), nhƣng tín hiệu này có th ể không đƣợc đƣa đầy đủ, mà có th ểchỉ đƣa đại di n 1 bít ệ để có tính ch t kiấ ểm tra quá trình đúng hay sai Tín hiệu đó đươc gọi là tín hi u ệ c ng c ủ ố(Reinforcement Signal) Phương pháp học c ng c ủ ố chỉ là một trường hợp của phương pháp học có giám sát, bởi vì nó cũng có nhận tín hi u ch o (giáo ệ ỉ đạ viên) ph n h i t ả ồ ừ môi trường Ch khác là tín hi u c ng c ỉ ệ ủ ố chỉ có tính ướ ược l ng hơn là để ạy Có nghĩa là chỉ d có th nói là t t hay x u cho m t s tín hiể ố ấ ộ ố ệu đầu ra cá bi t Tín hiệ ệu giám sát bên ngoài d thường được ti n hành b i các tín hiế ở ệu ước lƣợng để ạ t o thông tin tín hiệu ƣớc lƣợng cho mạng nơron điều ch nh tr ng s v i ỉ ọ ố ớ hy v ng s ọ ự ƣớc lƣợng đó mạng l i s tạ ự ốt đẹp cho quá trình tính toán H c c ng c ọ ủ ố còn đƣợc gọi là h c vớ ự ƣớọ i s c lƣợng (Learning With a Critic)
* H c không có giám sát (Unsupervised Learning) ọ
Trong trường h p này, hoàn toàn không có tín hi u bên ngoài ợ ệ ở (Hình 1.7)
Giá tr mị ục tiêu điều khiển không được cung cấp và không được tăng cường M ng ạ ph i khám phá các mả ẫu, các nét đặc trưng, tính cân đối, tính tương quan … Trong , khi khám phá các đặc trương khác, mạng nơron đã trải qua vi c t ệ ự thay đổi thông s , v n ố ấ đề đó còn gọi là t t ự ổchức (Self Organizing)–
Hình 1.8 mô t c u trúc chung c a quá trình h c cả ấ ủ ọ ủa ba phương pháp học đã đƣợc nêu trên Trong đó tín hiệu vào xj, j = 1, 2, 3, …, m, có thể đƣợ ấ ừ đầc l y t u ra của các nơron khác hoặc có th ể đƣợ ấ ừc l y t bên ngoài Chú ý r ng thông s ằ ố ngƣỡng θ i có th ể đƣợc bao trong vi c hệ ọc nhƣ là một tr ng s ọ ốthứ m: w i,m c a tín hi u vào ủ ệ có giá trị xm -1 Tín hi u mong mu n d= ệ ố i có s n ch ẵ ỉ trong phương pháp học có giám sát ho c c ng c ặ ủ ố (với d i là tín hi u h c c ng c ) T ệ ọ ủ ố ừ hai phương pháp học trên Trọng s cố ủa nơron thứ i đƣợc thay đổi tùy theo tín hi u u vào mà nó thu nh n, ệ ở đầ ậ giá tr u ra cị đầ ủa nó Trong phương pháp học không giám sát s ự thay đổi tr ng s ọ ố chỉ ựa trên cơ sở d các giá tr ị đầu vào và đầu ra D ng t ng quát c a lu t h c tr ng ạ ổ ủ ậ ọ ọ s c a mố ủ ạng nơron cho biết là gia s cố ủa véc tơ w i là Δw i t l v i tín hi u h c r và ỷ ệ ớ ệ ọ tín hiệu đầu vào x(t):
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B Δw i (t) = η.r.x(t) (1.12)
Hình 1 8 Sơ đồ ấ c u trúc chung c a quá trình h c ủ ọ η là mộ ố dương còn gọt s i là h ng s hằ ố ọc, xác định tốc độ ọ h c r là tín hiệu h c: r = fọ r (w i , x, d i ) (1.13)
T (1.13) là bi u thừ ể ức chung để tính s gia c a tr ng s , ta thố ủ ọ ố ấy véc tơ trọng s ốw i = (w i1 , w i2 ,…, w im ) T có gia s v i tố ớ ỷ l c a tín hi u vào và tín hi u h c r T ệ ủ ệ x ệ ọ ừ các biểu thức trên ta có véc tơ trọng s thố ở ời điểm (t+1) đƣợc tính là: w i (t+1) = w i (t) + ηf r (w i (t), x(t), d i (t)x(t)) (1.14)
V i ch s trên là thớ ỉ ố ời điểm tính toán Phương trình liên quan đến s ự thay đổi trọng s trong mố ạng nơron rờ ại r c (Discrete - Time) và tương ứng v i s ớ ự thay đổi trọng s trong mố ạng nơron liên tục theo bi u th c: ể ứ
Vấn đề quan tr ng trong vi c phân biọ ệ ệt luật học cập nhật trọng s có giám sát ố hay không có giám sát là tín hi u hệ ọc r nhƣ thế nào để thay đổi ho c c p nh t tr ng ặ ậ ậ ọ s ốcó trong mạng nơron
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B
M ạng nơron truyề n th ng và m ẳ ạng nơron hồ i quy
1.8.1.1 M ạng nơron truyền th ng mẳ ột lớp
Hình 1 9 Mạng nơ-ron truy n th ng mề ẳ ột lớp
M t lộ ớp nơron là một nhóm các nơron mà chúng cùng nhận m t s tín hi u ộ ố ệ vào đồng th i (hình 1.9) ờ
Trong ma tr n tr ng s w, các dòng th hi n tr ng s c a mậ ọ ố ể ệ ọ ố ủ ỗi nơron, mỗi dòng th j có th ứ ể đặt nhãn nhƣ một véc tơ w j của nơron thứj gồm m tr ng s wọ ố ij wj = (wj1; wj2, …, w jm ) (1.16) Các tr ng s trong cùng m t c t th ọ ố ộ ộ ứ j (j = 1, 2, …, n) đồng th i nh n cùng ờ ậ một tín hiệu vào x j
T i cùng m t thạ ộ ời điểm, véc tơ đầu vào x = (x 1 , x2 xj…, x m ) có th là mể ột ngu n bên ngoài là c m bi n ho c thi t b ồ ả ế ặ ế ị đo lường đư ớa t i m ng T i khi toàn b ạ ớ ộ ma tr n tr ng s wậ ọ ố ji được xác định tương ứng với véc tơ đầu vào X thì các tích s ố wjixicũng đƣợc tính toán
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B
1.8.1.2 Mạng nơron truyền th ng nhiẳ ều lớp
Hình 1 10 Mạng nơ-ron truy n th ng nhi u l p ề ẳ ề ớ Trong mạng nơron truyền th ng nhi u lẳ ề ớp (Hình 1.10) trong đó các lớp đƣợc phân chia thành 3 loại sau đây:
-L p vào:ớ Là lớp nơron đầu tiên nh n các tín hi u vào xậ ệ i của véc tơ tín hiệu vào X M i tín hi u xỗ ệ i c a tín hi u vào s ủ ệ ẽ đƣợc đƣa đế ấ ả các nơron củn t t c a l p ớ nơron đầu tiên, chúng đƣợc phân ph i trên các tr ng s có s ố ọ ố ốlƣợng đúng bằng s ố nơron củ ớp này Thông thường, các nơron đầa l u vào không làm biến đổi các tín hi u vào xệ i , t c là chúng không có các tr ng s ho c không có các lo i hàm chuy n ứ ọ ố ặ ạ ể đổi nào, chúng ch ỉ đóng vai trò phân phối các tín hiệu và không đóng vai trò sửa đổi chúng
-L p ớ ẩn: Là lớp nơron dướ ới l p vào, chúng không tr c ti p liên h v i th ự ế ệ ớ ế giới bên ngoài nhƣ các lớp nơron vào và ra
-L p ra:ớ Là lớp nơron tạo các tín hi u ra cuệ ối cùng
Mạng nơron hồi quy (Recurrent Neural Networks) còn đƣợc g i là m ng ọ ạ ph n hả ồi (Feedback Networks) là lo i m ng t liên k t thành các vòng và liên kạ ạ ự ế ết h i quy giồ ữa các nơron Mạng nơron hồi quy có tr ng s liên kọ ố ết đối xứng nhƣ m ng ạ Hopfield luôn h i t v ng thái ộ ụ ề trạ ổn định (Hopfid, 1982) M ng liên k t 2 ạ ế chiều (Bidirectional Associative Memory BAM) – là mạng thu c nhóm mộ ạng nơron h i quy gồ ồm 2 lớp nơron liên kết tay đôi, trong đó đảm bảo nơron của cùng m t l p ộ ớ không liên k t v i nhau, cùng h i t v ng thái ế ớ ộ ụ ề trạ ổn định (Kosko, 1986) Nghiên c u mứ ạng nơron hồi quy có tr ng s liên kọ ố ết không đố ứi x ng s g p nhi u ph c tẽ ặ ề ứ ạp
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B hơn so với m ng truyạ ền th ng ẳ (Feedforward Networks) và mạng hồi quy đố ứi x ng
(Symmetrich Recurrent Neural Networks) Mạng nơron hồi quy có kh ả năng về nh n m u, nh n d ng các hàm phi tuy n, d ậ ẫ ậ ạ ế ự báo … Một ƣu điểm khác c a m ng ủ ạ nơron hồi quy là ch c n m ng nh ỉ ầ ạ ỏ hơn về ấu trúc cũng có khả năng nhƣ mạ c ng truy n th ng có c u trúc lề ẳ ấ ớn hơn Nó khắc phục đƣợc gi thuyả ết truyền th ng c a ố ủ mạng nơron là coi mạng có s ố nơron đủ ớ l n G m 2 lo i: ồ ạ
1.8.2.1 M ng h i quy không hoàn toàn (Partially Recurrent Networks) ạ ồ
Là mạng đó dựa trên cơ sở ạ m ng lan truyền ngƣợc (Back Propagation)– với c u trúc h i quy C u trúc c a m ng h i quy không hoàn toàn ph n l n là c u trúc ấ ồ ấ ủ ạ ồ ầ ớ ấ truy n thề ẳng nhƣ có cả ự s chọn l a cho m t b ph n có c u trúc h i quy Trong ự ộ ộ ậ ấ ồ nhiều trường h p, tr ng s c a c u trúc hợ ọ ố ủ ấ ồi quy được duy trì không đổi, như vậy luậ ọt h c lan truyền ngƣợc BP có th ể đƣợc d dàng s d ng Các mễ ử ụ ạng đó đƣợc gọi là m ng dãy ạ (Sequential Networks) và các nút nh n tín hi u hậ ệ ồi quy đƣợc g i là các ọ ph n t ầ ử Context (Context Units) Trong các m ng lo i này, s truy n thạ ạ ự ề ẳng đƣợc x y ra r t nhanh ho c không ph ả ấ ặ ụthuộc vào thời gian, trong khi đó tín hiệu h i quy ồ đƣợc th c hi n có tính th i gian T ự ệ ờ ừ đó, tại thời điểm t ph n t n m trong ph m vi ầ ử ằ ạ
Context Unitscó tín hi u vào t m t ph n m ng ệ ừ ộ ầ ạ ởthời điểm (t 1) Vì v y, b ph– ậ ộ ận n m trong ph m vi nh ằ ạ ớ đƣợc m t s d u c a quá kh t k t qu biộ ố ữliệ ủ ứ ừ ế ả ến đổi ởthời điểm t Do v y, tr ng thái c a m ng nguyên th y c a các m u ph ậ ạ ủ ạ ủ ủ ẫ ụthuộc vào các trạng thái đó cũng nhƣ dòng thồng tin đầu vào M ng có th nh n m u ạ ể ậ ẫ (Recognice) dãy d a vào tình tr ng cu i cùng c a dãy và có th d báo ti p theo cho tín hi u cự ạ ố ủ ể ự ế ệ ủa dãy theo th i gian T , m ng h i quy không hoàn toàn v ờ ừ đó ạ ồ ề cơ bản là m ng truyạ ền thẳng, liên k t h i quy có th ế ồ ể đi từ các nút các l p ra ho c l p ở ớ ặ ớ ẩn Sau đây là một vài d ng m ng h i quy không hoàn toàn (Hertzm, 1991) ạ ạ ồ
1.8.2.2 M ng các dãy c a Jordan (Jordan Sequential Netwoks) ạ ủ
Hình 1.11a là c u trúc chung c a m ng ấ ủ ạ Jordan, hình 1.11b là m t d ng cộ ạ ủa m ng ạ Jordan
Luận văn Thạc sĩ Chuyên ngành: Điều khi n & T ể ự Động Hóa
Ngô Ngọc Hoàng ĐK TĐH201- 5B
Hình 1 11 Sơ đồ ấ c u trúc c a m ng Jordan ủ ạ
Mạng đầu vào c a m ng g m tín hi u ph n hủ ạ ồ ệ ả ồi đầu ra vào l p Context kớ ết h p v i tín hi u vào ng thái ợ ớ ệ ở trạ sau đó Nói cách khác, lớp Context sao ch p tín ụ hi u ra c a thệ ủ ời điểm trước đó qua con đường ph n h i v i tr ng s ả ồ ớ ọ ố đơn vị M i t ỗ ự liên kết (Selt Connection)– trong l p ớ Context Ci hàm ho t hóa c a ph n t ạ ủ ầ ử thuộc l p ớ Contextcó dạng: ci(t) = -αc i (t) + yi(t) yi là tín hiệu ra; α là cường độ ủ c a m i t liên kố ự ết 0