Phương pháp đánh giá

Một phần của tài liệu Giải thuật di truyền cải tiến cho phân lớp (Trang 44 - 45)

 Các bước thực hiện quá trình đánh giá mô hình xây dựng:

- Bước 1: Bộ dữ liệu gốc (Stomach_Full.mat) được chia làm 2 phần: dữ liệu train chiếm 70% dữ liệu ban đầu và dữ liệu test chiếm 30% dữ liệu ban đầu. Thực hiện phân lớp bằng MPM trên bộ dữ liệu đã được chia như trên  kết quả phân lớp của MPM trên bộ dữ liệu gốc.

- Bước 2: Sử dụng bộ dữ liệu Train (Training_Validation.mat) chiếm 70% bộ dữ liệu gốc (trong đó dữ liệu Validation chiếm 30% dữ liệu Train) để thực hiện quá trình trích chọn thuộc tính bằng GA tool trong Matlab 7.0, với các tham số tùy chọn như sau:

 Fitness function: @fitness.

 Number of variables: 119.

 Population type: Bit string.

 Population size: 20.

 Selection function: Stochastic uniform.

 Crossover function: Scattered – khởi tạo ngẫu nhiên một vector nhị phân. Chọn các gen mà vector có giá trị là 1 từ cha thứ nhất và những gen mà vector có gí trị 0 từ cha thứ hai, rồi kết hợp các gen đó thành con.

Ví dụ:

cha1 = [a b b d e f g h] cha2 = [1 2 3 4 5 6 7 8]

vector lai ghép ngẫu nhiên = [1 1 0 0 1 0 0 0] con = [a b 3 4 e 6 7 8]

 Mutation function: Gaussian – thêm một số ngẫu nhiên vào mỗi vector đầu vào của một cá thể. Số ngẫu nhiên này được lấy từ phân bố Gauss.

44

- Bước 3: Chạy hàm DataSelection với đầu vào là chromosome tốt nhất vừa tìm được và bộ dữ liệu Test (TestSet.mat) chiếm 30% dữ liệu gốc để sinh ra tập dữ liệu mới (outData.mat) là bộ dữ liệu giảm chiều làm đầu vào cho bộ phân lớp MPM. - Bước 4: chạy bộ phân lớp MPM với tập dữ liệu là “outData”. Bộ dữ liệu giảm

chiều cũng được chia làm 2 phần với tỷ lệ như phân chia 70% là Training và 30% Test để thực hiện phân lớp  kết quả phân lớp của bộ dữ liệu giảm chiều.

Lặp lại bước 2 đến 4 nhiều lần với những điều kiện dừng ở bước 2 là “Generations” để thu được số liệu phục vụ cho quá trình phân tích.

- Bước 5: thống kê số liệu các lần thực hiện bước 2 đến 4 và so sánh kết quả thu được từ bước 1.

Một phần của tài liệu Giải thuật di truyền cải tiến cho phân lớp (Trang 44 - 45)