Một vài nhận xét rút ra từ các thí nghiệm

Một phần của tài liệu Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng (Trang 115 - 117)

Từ việc xem xét, phân tích và đánh giá kết quả của các thí nghiệm, có thể nhận ra rằng mỗi một kỹ thuật rút trích đặc trưng đều có những ưu điểm và nhược điểm riêng. Những ưu nhược điểm này có thể được bộc lộ trên mọi bộ dữ liệu hoặc chỉ bộc lộ ở bộ dữ liệu này mà không có ở bộ dữ liệu khác. Tính đến thời điểm hiện tại, trong khuôn khổ các thí nghiệm của đồ án này, nếu chỉ xét kỹ thuật riêng lẻ không có sự kết hợp thì hai kỹ thuật Diagonal based và Dense Distribution, hai kỹ thuật có hướng tiếp cận thống kê lượng điểm ảnh màu đen trong từng vùng cụ thể, cho hiệu quả cao nhất cả trên MyCharacter và MNIST. Bảng thống kê 4.1 cho thấy ưu nhược điểm của một vài kỹ thuật rút trích đặc trưng (chỉ xét những kỹ thuật được thí nghiệm), trong điều kiện thí nghiệm của đồ án:

Bảng 4.1. So sánh ưu nhược điểm của một số kỹ thuật rút trích đặc trưng Kỹ thuật lấy đặc trưng Ưu điểm Nhược điểm 1. Diagonal based

[18]

Mang lại độ chính xác cao do tiếp cận hướng thông kê điểm ảnh, tận dụng sự phân bố trung bình điểm ảnh trên các đường chéo của vùng.

Do tiếp cận hướng thống kê do đó đòi hỏi lượng mẫu huấn luyện phải tương đối lớn khi số lớp cần phân nhiều, từ đó có thể gây tốn thời gian huấn luyện và tài nguyên hệ thống.

2. Twelve Direction [14], [17]

Thể hiện được đặc trưng về chất của từng điểm ảnh thông qua ma trận gradient.

Số lượng chiều vector đặc trưng lớn, từ đó khiến cho thời gian huấn luyện trở nên khá lâu mà độ chính xác nhiều khi không như mong muốn.

3. Hotspot [23] Cách thức tiếp cận khá giản đơn

Độ chính xác có thể bị giảm trong trường hợp không tìm xương ảnh. Ngoài ra việc xác định số lượng hotspot và số hướng cụ thể như thế nào cho từng bài toán cũng là không dễ.

4. 40-Point [11] Số lượng chiều của vector đặc trưng rất thấp, thấp hơn hẳn nhiều kỹ thuật khác, là lợi thế để tiết kiệm tài nguyên hệ thống.

Mức độ đặc trưng cho ký tự của kỹ thuật không được cao, dẫn đến hiệu quả nhận dạng thấp.

5. Shadow [6] Hướng tiếp cận khá đơn giản, số chiều vector đặc trưng ít giúp tiết kiệm tài nguyên hệ thống.

Khả năng đặc trưng khi lấy độc lập là thấp nên cần phải kết hợp với kỹ thuật khác.

6. Intersection [6] Cách thức tiếp cận cũng khá đơn giản, số chiều vector đặc trưng ít góp phần tiết kiệm tài nguyên hệ thống.

Việc đếm số điểm tận cùng và giao điểm là không đủ để đặc trưng cho ký tự, vì vậy cần phải kết hợp với kỹ thuật khác.

7. Straight line fitting [6]

Phép tính thực hiện khá đơn giản, số chiều vector đặc trưng ít cũng giúp giảm gánh nặng về tài nguyên hệ thống. Việc tìm ra đường thẳng xấp xỉ cho một tập hợp điểm có độ bất định vị trí lớn là khá khó khăn, ngoài ra khả năng đặc trưng khi lấy độc lập là thấp nên cần phải kết hợp với kỹ thuật khác.

8. Background Directional Distribution [12]

Số chiều vector đặc trưng ở mức trung bình, có thể chấp nhận được.

Hướng tiếp cận có thể không dễ hiểu, hiệu quả khi sử dụng độc lập không cao do đó cần kết hợp kỹ thuật khác.

9. Dense Distribution Số chiều vector đặc trưng thấp, thời gian huấn luyện và kiểm tra là thấp so với trung bình của các kỹ thuật khác.

Vì tiếp cận hướng thống kê nên nhược điểm lớn nhất chính là độ chính xác phụ thuộc vào tương quan giữa số lượng mẫu huấn luyện với số lượng lớp cần phân.

CHƯƠNG 5

CÀI ĐẶT ỨNG DỤNG ĐỌC BẢNG ĐIỂM SINH VIÊN

Tính đến nay, trường Đại học Nha Trang đã và đang được xem là một trong những trường đại học trọng điểm của vùng cũng như là trường dẫn đầu về công tác đào tạo khối ngành thủy sản. Đặc biệt trong những năm gần đây, lượng học sinh phổ thông đăng ký vào học tập ở trường tăng mạnh, từ đó dẫn đến khối lượng thao tác và xử lý dữ liệu liên quan đến sinh viên ngày càng nhiều hơn. Trong đó, một trong những công tác đặc biệt quan trọng trong quá trình đào tạo của nhà trường đối với sinh viên là việc nhập bảng điểm học tập. Hiện nay, công việc nhập bảng điểm vẫn được thực hiện dưới dạng thủ công, tức là chuyên viên phòng Đào tạo phải lần lượt nhập điểm kiểm tra và điểm thi của sinh viên từ bàn phím máy tính. Đây là một công việc đòi hỏi nhiều thời gian và công sức trong khi số lượng chuyên viên phòng đào tạo là có hạn.

Trong hoàn cảnh đó, em chọn cài đặt ứng dụng đọc bảng điểm sinh viên, áp dụng bài toán nhận dạng chữ viết tay rời rạc. Ứng dụng này được phát triển hầu phần nào giảm đi chi phí về thời gian và nhân lực cho các chuyên viên, để giúp nâng cao hơn nữa chất lượng cho công tác quản lý điểm nói riêng và quản lý công tác đào tạo nói chung của phòng Đào tạo, trường Đại học Nha Trang.

Một phần của tài liệu Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng (Trang 115 - 117)