b. Mô phỏng mạng nơron.
5.3.4 Kết quả mô phỏng
*Phân lớp trong không gian hai chiều
+ Mẫu bất kỳ
Mạng nơ ron Hình 5.9 học và phân lớp với giới hạn phi tuyến bất kỳ cho trên Hình 5.10a. Loại I có 31 điểm tiếp giáp với loại II với biên giới bất kỳ. Mạng đợc chọn với ngỡng và trọng ban đầu là ngẫu nhiên, sau 7.000 lần học kết quả phân loại nh Hình 5.10b, sau 14.000 lần học, thời gian học t =4.582s
, kết quả phân loại nh Hình 5.10c, sai số giảm cònE=3,0959e-011, loại I còn một điểm bị nhận dạng sai, vậy kết quả nhận dạng phân loại đạt chất lợng tốt.
Vẫn bộ mẫu nh trên nhng với đầu vào tuyến tính, sau 14.000 lần học, thời gian học t =4.200s, tuy thời gian học có giảm (358s) nhng kết quả nhận dạng phân loại còn sai rất nhiều nh Hình 5.10d, sai số đạt đợc E =0,0066 . Từ Hình 5.10d ta thấy đ- ờng phân cách các lớp nh là dạng của hai đờng thẳng tơng ứng với hai nơ ron của lớp một.
Vẫn bộ mẫu nh trên nhng cho mạng bậc ba học và nhận dạng chỉ cần 1000 lần học với thời gian học t=360s, mạng đã nhận dạng đợc nh Hình
5.01b, đạt sai số E =0,0029. Sau 10.000 lần học, thời gian học, t =3.600s, mạng nhận dạng đợc nh Hình 5.10c, đạt sai số E =3,8255e-004. Kết quả so sánh đợc thể hiện trên Bảng 5.1
Bảng 5.1
Lớp
vào Số lầnhọc gian họcThời (s)
Kết quả
Bậc 1 14.000 4.200 Nhận dạng sai nhiều, Hình 5.10d, E=0,0066
Hình 5.10: Học với 2 đầu vào, mẫu bất kỳ
b, b,
c, d,
Bậc 2 14.000 4.582 Nhận dạng gần hết, Hình 5.10c, 011 - 3,0959e = E Bậc 3 10.000 3.600 Nhận dạng gần hết, Hình 5.10c, 004 - 3,8255e = E
+ Bài toán XOR
Bài toán XOR là bài toán phân loại với các giá trị (0;1) và (1;0) thuộc loại I, giá trị (0;0) và (1;1) thuộc loại II. Đây không phải là bài toán tách tuyến tính. Vậy nếu sử dụng mạng chuẩn với đầu vào tuyến tính thì phải có lớp ẩn với nhiều nơ ron. Sở dĩ nh vậy vì đầu vào tuyến tính chỉ cho một siêu diện mà một siêu diện không thể phân lớp cho bài toán XOR đợc. Với đầu vào bậc hai thì mạng không cần lớp ẩn, số nơ ron cần ít hơn vì khi đầu vào bậc hai có thể đa ra ranh giới phân lớp là
các đờng cong dạng ê-líp, hyperbol, parabol... Với bài toán XOR ta có thể tiến hành tách lần lợt từng phần rời rạc của lớp, chẳng hạn trớc tiên ta tách phần lớp thuộc các giá trị (0;1) sau đó tách phần lớp thuộc giá trị (1;0). Hoặc cũng có thể tiến hành tách lớp đồng thời tất cả các phần của một lớp. Với mạng nơ ron có kết cấu nh trên Hình5.9 thực hiện phân loại cho bài toán XOR. Xét bài toán XOR với các lớp nh trên
Hình 5.13a, các điểm trong
phạm vi (0;1) và (1;0) thuộc lớp I, các điểm còn lại thuộc lớp II.
Lần thứ nhất, tách
phần lớp (0;1) Hình 5.11a, mạng học với 7.000 lần , đạt sai số 017
- 1,6087e =
E , kết quả
phân loại nh trên Hình
5.11b. Từ Hình 5.11 ta thấy
tất cả các điểm đợc chọn thuộc phân lớp này đều đợc nhận dạng đúng.
Lần thứ hai tách phân lớp (1;0) Hình 5.12a, mạng học với 7.000 lần , đạt sai
80
Hình 5.11: Bài toán XOR với phân lớp (0;1)
a, b,
Hình 5.12: Bài toán XOR với phân lớp (1;0)
a, b,
Hình 5.13: Bài toán XOR phân loại đồng thời
số E =7,3755e-005, kết quả phân loại nh trên Hình 5.12b. Từ Hình 5.12 ta thấy có 2 điểm của phân lớp I không đợc nhận dạng nhng dạng đờng bao kết quả vẫn đợc đảm bảo.
Vẫn bài toán XOR trên, sử dụng mạng với đầu vào bậc hai Hình 5.9 tiến hành cho mạng học sau đó tiến hành nhận dạng ta đợc kết quả nh sau:
Mạng học với 7.000 lần, thời gian học t =15.750s, với các trọng và ng- ỡng ban đầu chọn ngẫu nhiên thì đạt đợc sai số E=0,0050, kết quả nhận dạng nh trên Hình 5.13b.
Khi bài toán phân lớp XOR tiến hành học mẫu và nhận dạng đồng thời thực hiện bằng mạng nơ ron với đầu vào tuyến tính sau 7.000 lần học, thời gian học t =15.403s,thì kết quả không nhận dạng đợc điểm nào của loại I.
Với bài toán phân lớp XOR tiến hành học mẫu và nhận dạng đồng thời thực hiện bằng mạng nơ ron với đầu vào bậc ba chỉ sau 2.000 lần học, thời gian học t =5.678s, thì đã nhận dạng đợc hết các điểm của loại I, sai số đạt đợc E =3,9914e-006. Nh vậy mạng bậc ba có khả năng phân loại tốt.
Kết quả so sánh đợc thể hiện trên Bảng 5.2
Bảng 5.2 Lớp
vào Số lầnhọc Thời gianhọc (s) Kết quả
Bậc 1 7.000 15.403 Không nhận dạng đợc.
Bậc 2 7.000 15.750 Nhận dạng gần hết, Hình 3.14b, E =0,0050 Bậc 3 2.000 5.678 Nhận dạng hết, Hình 3.14a, E=3,9914e-006 * Phân lớp trong không gian ba chiều với giới hạn bất kỳ
Mạng với ba đầu vào bậc ba tiến hành học và phân lớp với giới hạn phi tuyến bất kỳ cho trên Hình 5.14a, loại I có 69 điểm tiếp giáp với loại II với biên giới bất kỳ. Mạng đợc chọn với ngỡng và trọng ban đầu là ngẫu nhiên, sau 7.000 lần học
a,
Hình 5.14: Học với 3 đầu vào bậc hai, bậc ba, mẫu bất kỳ b
kết quả phân loại nh Hình 5.14b, thời gian học của mạng t =3.500s, sai số đạt đợc là E=1,5949e-005. Từ Hình 5.14 ta nhận thấy tất cả các điểm đã đợc nhận dạng chính xác. Trong khi đó vẫn bộ mẫu trên với đầu vào tuyến tính, sau 7.000 lần học tuy thời gian học có giảm t =3.150s, sai số đạt đợc
0,0027 =
E nhng kết quả nhận dạng sai rất nhiều nh Hình 5.14c.
Vẫn mẫu học Hình 5.14a cho mạng bậc ba học thì chỉ cần 1.000 lần học kết quả phân loại đã đợc nh Hình 5.14b, thời gian học của mạng t =514s, sai số đạt đợc là E =4,6639e-006.
Kết quả so sánh đợc thể hiện trên Bảng 5.3
Bảng 5.3 Lớp
vào Số lầnhọc Thời gianhọc (s) Kết quả
Bậc 1 7.000 3.150 Sai nhiều, Hình 5.14c, E =0,0027
Bậc 2 7.000 3.500 Nhận dạng hết, Hình 5.14c, E=1,5949e-005
Bậc 3 1.000 514 Nhận dạng hết, Hình 5.14c, E =4,6639e-006
5.3.5 Kết luận
Mạng nơ ron nhân tạo có khả năng phân lớp rất tốt, nhng với đầu vào tuyến tính mạng chỉ thực hiện phân lớp đợc những vùng có ranh giới tuyến tính hoặc tuyến tính hoá từng đoạn. Mạng với đầu vào bậc hai khi chọn trọng và ngỡng phù hợp thì tạo đợc các đờng bao hình elíp, nh vậy có thể thực hiện phân loại đợc các vùng với ranh giới phi tuyến. Khi chuyển đổi từ đầu vào tuyến tính thành các đầu vào bậc hai và bậc ba cho mạng học và phân lớp thì có thể phân lớp đợc các lớp có ranh giới phi tuyến bất kỳ trong không gian, việc chọn trọng và ngỡng ban đầu là tuỳ ý không bị ràng buộc, tuy nhiên thời gian huấn luyện cho mạng với đầu vào bậc hai có dài hơn, còn với đầu vào bậc ba thời gian giảm. Từ phân tích với đầu vào bậc hai và bậc ba có thể mở rộng cho đầu vào cao hơn, nh vậy khả năng phân lớp của mạng nơ ron càng đợc mở rộng và đa dạng.