Trích xuất đặc trưng

Một phần của tài liệu báo cáo tìm hiểu mạng nơ tron ứng dụng trong nhận dạng chữ viết (Trang 33 - 35)

- Tách từ riêng biệt ra khỏi dòng ký tự.

c) Trích xuất đặc trưng

Trong mơ hình nhận dạng này, việc trích xuất bao gồm ba bước sau: đo đạc tọa độ cực, đưa ký tự vào lưới, và số hóa ký tự. Các ký tự viết tay được ghi chép lại các tọa độ cực từ trái / phải và trên / dưới và được chia thành một lưới hình chữ nhật hàng và cột cụ thể. Thuật tốn tự động điều chỉnh kích thước của lưới và các thành phần của nó theo kích thước của ký tự. Sau đó nó tìm kiếm sự hiện diện của pixel ký tự trong mỗi ô của lưới. Các ơ tìm thấy với các điểm ảnh ký tự được coi là "on" và phần còn lại được đánh dấu "off". Một chuỗi nhị phân của mỗi ký tự được hình thành từ việc định vị các "on" và "off" ô và làm đầu vào cho mạng. Tổng số ô lưới đại diện cho số lượng đầu vào nhị phân.

- Mạng nơ tron nhận dạng : dựa trên sự huấn luyện từ trước, mạng sẽ tính tốn và trả lời dữ liệu mẫu đầu vào là ký tự nào.

- Quá trình hậu xử lý: quá trình xử lý kết quả cho phù hợp với từng ứng dụng cụ thể.

5. Quá trình huấn luyện mạng

Mạng Kohonen được huấn luyện trong một chế độ khơng có giám sát. Tồn bộ quá trình huấn luyện cho một mạng nơ tron Kohonen cần phải lặp lại qua vài cơng đoạn. Nếu sai số đã tính tốn của mạng nơ tron Kohonen ở mức thấp hơn mức có thể chấp nhận được thì sẽ hồn tất q trình huấn luyện. Để tính tốn tỉ lệ sai số cho mạng nơ tron Kohonen, ta sẽ điều chỉnh các trọng số cho mỗi cơng đoạn.

Q trình huấn luyện cho mạng nơ tron Kohonen là huấn luyện cạnh tranh nên mỗi tập huấn luyện sẽ có một nơ tron thắng. Nơ tron thắng này sẽ có trọng số được điều chỉnh sao cho ngay lập tức nó sẽ tác động trở lại mạnh mẽ hơn trong dữ liệu đầu vào ở lần tiếp theo. Sự khác nhau giữa các nơ tron thắng sẽ dẫn tới sự khác nhau giữa các mẫu đầu vào tiếp theo.

34

Mạng nơ tron Kohonen được huấn luyện bởi các công đoạn tuần hoàn cho đến khi một trong hai vấn đề sau xảy ra :

- Nếu tính tốn các sai số ở mức thấp hơn mức có thể chấp nhận được thì nhiệm vụ của chu kỳ sẽ hồn thành q trình huấn luyện.

- Nếu tất cả các tỉ lệ sai số chỉ thay đổi bởi đa số cận biên, thì chu kỳ riêng lẻ này sẽ bị loại và các trọng số lại được khởi tạo lại với các giá trị ngẫu nhiên, đông thời một chu kỳ huấn luyện mới lại bắt đầu. Chu kỳ huấn luyện này sẽ tiếp tục chu kỳ huấn luyện trước và

Dừng

Bắt đầu

Khởi tạo ngẫu nhiên ma trận trọng số

Tính tốn sai số

Kiểm tra sai số xem có ở mức chấp nhận được

?

Thực hiện huấn luyện, điều chỉnh trọng số dựa vào

nơron thắng

Tính tốn lại tỉ lệ sai số, ghi lại những giá trị đã được cải

thiện Cải thiện tỉ lệ sai số là tầm thường? Ma trận trọng số này đã tốt nhất chưa? Nếu có ma trận trọng số tốt hơn của ma trận trọng số tốt nhất? Gán ma trận trọng số này thành ma trận trọng số tốt nhất Đã quá số chu kỳ xác định? Yes No Yes Yes No No No No Yes Yes

35

nó sẽ phân tích các cơng đoạn để đưa ra kết quả; hoặc là chu kỳ bị loại bỏ hoặc tạo ra một tập các trọng số đó mà có mức sai số có thể chấp nhận được.

-

Một phần của tài liệu báo cáo tìm hiểu mạng nơ tron ứng dụng trong nhận dạng chữ viết (Trang 33 - 35)