Do những hàm truyền như tansig, logsig… của mạng Neural chỉ hoạt động trong khoảng lân cận của 0 thường là [-1, 1], do đó để mạng hoạt động tốt và hội tụ nhanh thì dữ liệu vào thường phải được xử lý trước gọi là quá trình tiền xử lý dữ liệu. Một số phương pháp tiền xử lý thường được sử dụng là:
- Phương pháp biến đổi Min và Max (PreMinMax):
Trước khi được huấn luyện, dữ liệu đầu vào và đích thường được biến đổi thành các giá trị mới nằm trong khoảng [min, max] được xác định (thường là từ [-1,1]).
[Ipre, Imin, Imax, Tpre, Tmin, Tmax] = PreMinMax[I, T] (3 - 49) Trong đó:
Imin = Min {I} Imax = Max {I}
Ipre là vector đầu vào được xử lý, có thể được tính theo công thức:
Ipre = 2*(I-Imin)/(Imax - Imin) – 1 (3 - 50)
Trong đó: Tm in = Min {T} Tmax = Max {T}
Tpre là vector đầu vào được xử lý, có thể được tính theo công thức: Tpre = 2*(T - Tmin) / (Tmax - Tmin) – 1 (3 - 51)
Như vậy sau quá trình huấn luyện ta thu được giá trị đầu ra là Opre tương ứng với tập đầu vào Ipre dựa vào hai giá trị Tm in, Tmax ta có thể tính ra giá trị tập đầu ra thực tương ứng với tập vào I là:
53
O = 0,5(Opre + 1)*(Tmax - Tmin) + Tmin (3 - 52)
- Phương pháp tính trung bình và độ lệch chuẩn (PreMeanStandar).
Phương pháp này nhằm chuẩn hoá tập đầu vào (I) và đích (T) thành tập đầu vào (Ipre) và tập đích (Tpre) có trung bình bằng 0 và độ lệch chuẩn đơn vị.
[Ipre, Imean, Istđ, Tpre, Tmean, Tstd] = PreMeanStandar [I, T] (3 - 53) Trong đó:
Imean là giá trị trung bình của I Istd là độ lệch chuẩn của I
Khi đó tập vào Ipre được xử lý có công thức:
Ipre = (I - Imean) / Istd (3 - 54)
Trong đó:
Tmean là giá trị trung bình của T Tstd là độ lệch chuẩn của T
Khi đó tập vào Ipre được xử lý có công thức:
Tpre = (T - Tmean) / Tstd (3 - 55)
Như vậy sau quá trình huấn luyện ta thu được giá trị đầu ra là Opre tương ứng với tập đầu vào Ipre dựa vào hai giá trị Tmean, Tstd ta có thể tính ra giá trị tập đầu ra thực tương ứng với tập vào I là:
O = Tstd*Opre + Tmean (3 - 56)