3. Đối tượng và phạm vi nghiên cứu
3.3. Trích chọn đặc trưng của chữ số viết tay
Trích chọn đặc trưng nhằm trích rút những đặc trưng cơ bản của chữ số để phân biệt được các chữ số khác nhau. Chúng tôi thử nghiệm với 3 tập đặc trưng như sau:
3.1.1 Trích chọn đặc trưng bằng phương pháp chia ô theo cạnh
Với mỗi ảnh kích thước 28x28, chúng tôi chia ảnh thành các ô: - Dùng phép chia 14x14 ô, ta được 4 ô tương ứng với 4 đặc trưng. - Dùng phép chia 7x7 ô, ta được 16 ô tương ứng với 16 đặc trưng. - Dùng phép chia 4x4 ô, ta được 49 ô tương ứng với 49 đặc trưng.
Sau đó ghép tất cả các đặc trưng trên thành 1 vector đặc trưng cho ảnh, ta có được 1 vector có độ dài 69 đặc trưng.
3.2.2. Trích chọn đặc trưng bằng phương pháp chia ô từ góc
Chúng tôi sử dụng phương pháp này đã được đề xuất ở [14] bằng cách thực hiện chia ô từ 4 góc của ảnh. Với mỗi góc, chúng tôi sẽ tạo các hình chữ nhật với kích thước 4, 8, 12, 16, 20, 24 và 28 mà một đỉnh của hình chữ nhật được neo ở góc. Ví dụ với góc trên bên trái, các hình chữ nhật mô tả như hình 4.3, tức là ô 2 chứa ô 1, ô 3 chứa ô 1 và ô 2, ô 4 chứa ô 1, 2 và 3...Với cách này chúng ta có 1 vector có chiều dài 4x7 = 28 đặc trưng. Tuy nhiên vì hình vuông ngoài cùng sẽ được lặp lại 4 lần do đó chỉ lấy 1 lần, và vector đặc trưng sẽ còn 25 đặc trưng.
Hình 3.3. Phương pháp chia ô từgóc
3.2.3. Trích chọn đặc trưng bằng phương pháp phân tích thành phần chính
Phương pháp phân tích thành phần chính đã được đề xuất trong các ứng dụng nhận dạng ảnh mặt người [11]. Ý tưởng chính của phương pháp là trích chọn các đặc trưng của ảnh dựa trên các vector riêng của tập dữ liệu huấn luyện. Quá trình nhận dạng được thực hiện bằng cách so sánh khoảng cách giữa vector riêng của ảnh nhận dạng với các vector riêng của tập dữ liệu huấn luyện và chọn ra vector gần nhất.
Trong thử nghiệm này, chúng tôi sẽ sử dụng các vector riêng của tập dữ liệu huấn luyện như làm đầu vào của mạng nơ-ron để huấn luyện và sử dụng vector riêng của ảnh nhận dạng để nhận dạng ảnh thông qua mạng nơ-ron đã được huấn luyện.