Nhƣ chúng tôi đã trình bày ở phần 2.3, việc lựa chọn hàm nhân và tham số của nó ảnh hƣởng rất lớn đến sự chính xác của thuật toán và thời gian xử lý của nó. Để chọn đƣợc hàm nhân và tham số tốt nhất (trong một khoảng giá trị xác định trƣớc) cho bài toán nhận dạng chữ số viết tay, ta cần phải thực hiện tìm kiếm dạng lƣới và thẩm định chéo lần lƣợt với từng hàm nhân, từng tham số để có thể lựa chọn đƣợc mô hình tốt nhất (lựa chọn đƣợc hàm nhân và tham số tốt nhất trong một khoảng giá trị xác định trƣớc).
Thuật toán tìm kiếm dạng lƣới với một tham số của hàm nhân đƣợc cài đặt nhƣ sơ đồ dƣới đây:
Hình 3.5: Sơ đồ thuật toán tìm kiếm dạng lưới với một giá trị tham số của hàm nhân. i++ i < Max Thẩm định chéo Tỷ lệ tốt nhất < Tỷ lệ đúng thẩm định chéo Chọn giá trị i Cập nhật tỷ lệ đúng tốt nhất Kết luận giá trị i và tỷ lệ đúng tốt nhất i = 0 Tỷ lệ đúng tốt nhất = 0 Đ Đ S S
Thuật toán thẩm định chéo đƣợc cài đặt nhƣ sơ đồ dƣới đây:
Hình 3.6: Sơ đồ thuật toán thẩm định chéo.
Kết chƣơng
Chƣơng này đã giới thiệu các bƣớc cơ bản của một hệ thống nhận dạng chữ viết tay, từ xử lý đầu vào cho đến hậu xử lý. Trong đó, bƣớc huấn luyện và nhận dạng là quan trọng nhất và quyết định độ chính xác của hệ thống. Có rất nhiều phƣơng pháp huấn luyện và nhận dạng khác nhau, nhƣng phƣơng pháp máy vector hỗ trợ đang là phƣơng pháp tiên tiến và đƣợc áp dụng khá hiệu quả trong số các thuật toán học máy. Bằng việc nhị phân hóa ảnh bằng ma trận 32x32 để rút ra đặc trƣng và áp dụng thuật toán tối ƣu tối tiểu tuần tự, ta có thể áp dụng đƣợc thuật toán máy vector hỗ trợ trong bài toán nhận dạng chữ số viết tay.
i++
i < n
Huấn luyện phần 1,2,...i-1,i+1...n Test phần i Kết luận tỷ lệ đúng trung bình fold = n i = 0 Tỷ lệ đúng trung bình = 0 Đ S Cập nhật tỷ lệ đúng trung bình
Chƣơng 4: CÀI ĐẶT VÀ THỬ NGHIỆM CHƢƠNG TRÌNH
Thuật toán Máy vector hỗ trợ đã đƣợc nghiên cứu và cài đặt thành công trên rất nhiều nền tảng ngôn ngữ khác nhau nhƣ: C, C++, Java, C#... Trong đó bộ công cụ Accord.NET1 đƣợc xây dựng trên nền tảng C# khá thành công, hỗ trợ các tính toán trong lĩnh vực học máy trong đó có máy vector hỗ trợ. Do vậy, chúng tôi đã sử dụng bộ công cụ này để cài đặt thuật toán tìm kiếm dạng lƣới và thẩm định chéo, thử các hàm nhân khác nhau với tham số khác nhau để đƣa ra kết quả thử nghiệm, đánh giá và so sánh các kết quả đạt đƣợc.