Hàm Sigmoid đơn cực

Một phần của tài liệu (LUẬN văn THẠC sĩ) áp dụng máy học để tìm ra các đặc trưng tối ưu trong các bài toán xử lý số liệu lớn luận văn ths công nghệ thông tin 60 48 05 (Trang 39 - 41)

Như vậy nơron đầu ra thực sự có giá trị trong khoảng [0, 1]. Khi huấn luyện, các đầu ra mong muốn cho nhận các giá trị là 0 và 1. Tùy từng vị trí phân lớp cụ thể, ở lớp ra nơron nào sẽ được nhận giá trị 0 và nơron nào sẽ được nhận giá trị 1. Để biết mẫu đầu vào thuộc lớp nào, lấy giá trị cao nhất của nơron lớp ra, tương ứng với giá trị được gán của nơron lớp ra mong muốn. Từ đó sẽ suy ra được bản ghi đầu vào thuộc phân lớp nàọ

Sau đó, GA lại tiếp tục sinh ra các tập con bộ thuộc tính khác, thông qua các phép toán: chọn lọc, lai ghép, đột biến (bước 2) đã được trình bày kỹ ở chương 3 của

luận văn. Có nghĩa là sau bước khởi tạo ban đầu, tính được độ phù hợp của mỗi bộ thuộc tính. Thực hiện phép toán chọn lọc theo kỹ thuật bánh xe quay trên các bộ thuộc tính này, khi đó các bộ thuộc tính có độ phù hợp cao thì khả năng được chọn càng caọ Lưu ý số cá thể trong mỗi quần thể hay cỡ quần thể ở đây ta cho cố định, không thay đổị Nghĩa là nếu cỡ quần thể là m thì thực hiện m lần chọn lọc. Kết thúc quá trình chọn lọc, lưu lại số lần được chọn của mỗi bộ thuộc tính vào trong bảng 4.1.

Tiếp theo các bộ thuộc tính được lai ghép với nhau thông qua xác suất lai ghép, Hoặc có thể thực hiện phép toán lai ghép dựa vào thông tin ở bảng 4.1. Thực hiện m/2 lần lai ghép. Mỗi lần lai ghép lấy ra 2 bộ thuộc tính để lai ghép, kết quả sinh ra 2 bộ thuộc tính mớị Bộ thuộc tính nào được lấy ra để lai ghép thì số lần chọn của nó ở bảng trên sẽ được trừ đi 1 để phục vụ cho lần lai ghép saụ Sau m/2 lần lai ghép thì cỡ quần thể sau khi lai ghép là m.

Bộ thuộc tính Số lần được chọn Bộ 1 x Bộ 2 y Bộ 3 t . . . . . . . . . . . . Bộ m z Bảng 4.1: Bảng kết quả sau quá trình chọn lọc

Qua phép đột biến mỗi vị trí trên bộ thuộc tính sẽ được đột biến thay đổi giá trị từ 0 sang 1 hoặc ngược lại, phụ thuộc vào xác suất đột biến của mỗi bộ thuộc tính và xác suất đột biến tại mỗi vị trí trên bộ thuộc tính đó. Như vậy, qua ba phép chọn lọc, đột biến và lai ghép các bộ thuộc tính mới được sinh rạ Để đánh giá độ phù hợp của mỗi bộ thuộc tính này, lại cho chúng qua mạng nơron nhân tạọ

Lặp lại các bước 1, bước 2 cho đến một số thế hệ đủ lớn nào đó hoặc độ thích nghi của cá thể tốt nhất trong các thế hệ kế tiếp nhau khác nhau không đáng kể. Kết thúc quá trình hoạt động ở Phần 1: thu được bộ thuộc tính có độ phù hợp cao nhất. Kết quả này được sử dụng để đưa vào Phần 2.

b. Hoạt động phần 2

Lấy tất cả bản ghi của bộ số liệu ban đầu nhưng chỉ với các thuộc tính vừa tìm được ở Phần 1, chia làm hai phần: huấn luyện và kiểm trạ Tập dữ liệu huấn luyện mới được sử dụng để huấn luyện cho mạng nơron.

Mạng nơron này là mới hoàn toàn, có cấu trúc và tham số tương tự như các mạng nơron ở phần trên, chỉ khác là số nơron đầu vào bằng số thuộc tính tối ưu vừa tìm được. Sau khi huấn luyện xong, cho tập dữ liệu kiểm tra vào mạng nơron này để đánh giá chất lượng hệ thống.

Để kiểm tra tính ổn định của hệ thống, tiến hành kiểm thử nhiều lần. Tức là mỗi lần kiểm thử là một lần chia bộ số liệu ngẫu nhiên thành tập huấn luyện và kiểm thử khác nhaụ

4.4 Sơ đồ khối phương pháp học máy

Say đây là sơ đồ khối mô tả phương pháp học máy đã trình bày ở phần trên.

Một phần của tài liệu (LUẬN văn THẠC sĩ) áp dụng máy học để tìm ra các đặc trưng tối ưu trong các bài toán xử lý số liệu lớn luận văn ths công nghệ thông tin 60 48 05 (Trang 39 - 41)

Tải bản đầy đủ (PDF)

(62 trang)