Huấn luyện mô hình và kết quả thực nghiệm với mô hình thống kê học sâu

Một phần của tài liệu Nghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chế (Trang 52 - 57)

Chương 3: KẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ

3.4. Huấn luyện mô hình và kết quả thực nghiệm với mô hình thống kê học sâu

3.4.1. Huấn luyện mô hình 3.4.1.1. Cấu trúc mô hình

Hình 3-1: Mô hình huấn luyện mạng

Trong mô hình huấn luyện học viên sử dụng ba lớp RBM để huấn luyện, với các lớp có các thông số như sau:

 Lớp đầu vào (Visible Units): Với 784 nút đầu vào, mỗi một nút đầu vào đại diện cho một điểm ảnh, với giá trị là mức xám của điểm ảnh đó (0  255).

 Các lớp ẩn (Hidden Units): Tại các lớp này học viên sử dụng 3 lớp ẩn với các lớp tương ứng với 500, 500, 2000 nút.

 Lớp đầu ra (Visible Units): Sau khi quá trình huấn luyện và chỉnh sửa trọng số thì lớp đầu ra là 10 nút, mỗi nút tương ứng với giá trị của các số tương ứng từ 0 đến 9.

3.4.1.2. Phương pháp huấn luyện và quy trình nhận dạng

Về bản chất, nhiệm vụ của mô hình này chính là nhiệm vụ phân loại, với đầu vào là ảnh của một ký tự bất kỳ (được đưa vào dưới dạng ma trận, cụ thể ảnh đầu vào ở đây có dạng 28 x 28 pixel), mạng cần tính toán để xếp ảnh này vào một nhóm ký tự nào đó.

Những lưu ý khi huấn mạng là:

 Để tráng hiện tượng overfiting (hiện tượng mà khả năng học của mạng rất tốt nhưng khả năng tổng quát hóa của mạng lại kém, tức là mạng nhận dạng tốt những mẫu đã được huấn luyện nhưng lại tỏ ra kém hiệu quả với những mẫu chưa được huấn luyện). Việc chọn tập mẫu huấn luyện và tập mẫu thử phải đảm bảo: (1) chúng có đầy đủ mẫu của tất cả các kí tự với số lượng không chênh lệch nhau nhiều, (2) tập mẫu huấn luyện và tập mẫu thử nghiệm không được trùng nhau, chỉ nên giao nhau một phần và số mẫu trong tập thử nghiệm nên bằng khoảng 2/3 số mẫu trong tập huấn luyện. Cách chọn mẫu học và thử nghiệm này được gọi là Cross- Validation.

 Số lần huấn luyện mạng cũng cần được chú ý: nếu số lần huấn luyện mạng quá lớn thì mạng sẽ rất “thuộc bài” tức là khả năng học của nó rất cao tuy niên nó lại nhớ một cách quá “máy móc” dẫn đến khả năng “nhạy bén” để tổng quát hóa nhằm phân loại những mẫu chưa được học lại kém hiệu quả.

Quá trình nhận dạng được thực hiện qua các bước như sau:

 Ảnh của kí tự (đầu vào) được đưa qua mạng ở lớp mạng đầu tiên. Mạng này sẽ thực hiện việc phân loại (lan truyền xuôi tín hiệu đầu vào lần lượt qua các lớp mạng) để xác định xem đầu vào thuộc nhóm kí tự nào.

 Nếu nhóm này chỉ gồm một kí tự thì kết thúc việc nhận dạng và đưa kết quả ra đầu ra.

 Tương tự, nếu nhận dạng với nhiều ảnh, các ảnh đầu vào sẽ được đưa vào theo dạng ma trận các điểm ảnh, việc phân loại ảnh là việc tính toán ma trận trên các lớp mạng, sau đó đưa ra kết quả với các lớp tương ứng.

3.4.2. Giao diện chính của chương trình

Chương trình được xây dựng với mục đích nhận dạng ký tự viết tay hạn chế.

Bao gồm 2 chức năng chính:

- Nhận dạng từng ký tự đơn lẻ nhằm đánh giá tính chính xác của mô hình nhận dạng - Nhận dạng toàn bộ các ảnh trong một thư mục, nhằm đánh giá kết quả của mô

hình nhận dạng.

Hình 3-1: Giao diện chính của chương trình nhận dạng chữ viết tay hạn chế

Hình 3-2: Chương trình khi nhận dạng 1 ảnh bất kỳ

Hình 3-3: Nhận dạng và thống kê nhiều ảnh

3.4.3. Kết quả thực nghiệm

Với việc sử dụng môi trường thực nghiệm và bộ dữ liệu thực nghiệm học viên rút ra được một số kết luận như sau:

Bảng 3-4: Kết quả thực nghiệm trên 2 tập dữ liệu MNIST và Tuyển Sinh Các thông số Bộ dữ liệu MNIST Bộ dữ liệu Tuyển Sinh

Số mẫu học 60.000 60.000

Số mẫu nhận dạng Chưa xác định 5433

Thời gian học < 24 giờ < 24 giờ

Thời gian nhận dạng Chưa xác định < 5 phút

Tỉ lệ nhận dạng đúng Chưa xác định 99.48 %

Bảng 3-5: Kết quả thực nghiệm trên tập dữ liệu Tuyển sinh

Chữ số Số mẫu Số mẫu nhận dạng đúng Độ chính xác (%)

0 1281 1279 99,8439

1 861 854 99,1870

2 338 335 99,1124

3 747 735 98,3936

4 337 337 100

5 287 286 99,6516

6 438 435 99,3135

7 661 661 100

8 238 238 100

9 295 295 100

Một phần của tài liệu Nghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chế (Trang 52 - 57)

Tải bản đầy đủ (PDF)

(70 trang)