Nhận dạng ký tự.

7. Thuật toỏn phõn cụm dữ liệu dựa trờn mẫu 1 Thuật toỏn EM

2.2 Nhận dạng ký tự.

Kỹ thuật nhận dạng ký dựa vào phõn cụm dữ liệu được phỏt triển bởi Connell và Jain [1998] để nhận biết lexemes trong văn bản viết tay cho cỏc mục đớch của nhà văn viết tay cụng nhận độc lập. Sự thành cụng của một hệ thống nhận dạng chữ viết là cực kỳ phụ thuộc vào chấp nhận bởi người sử dụng tiềm năng. Nhà văn phụ thuộc hệ thống cung cấp một mức độ cao hơn sự cụng nhận chớnh xỏc hơn so với cỏc hệ thống nhà văn độc lập, nhưng đũi hỏi một lượng lớn dữ liệu đào tạo. Một nhà văn độc lập hệ thống, mặt khỏc, phải cú khả năng nhận ra nhiều phong cỏch văn bản nhằm đỏp ứng một người dựng cỏ nhõn. Khi cỏc biến thiờn của phong cỏch văn bản phải được bắt giữ bởi một hệ thống tăng, nú càng trở nờn khú khăn để phõn biệt đối xử giữa cỏc lớp khỏc nhau do số lượng chồng chộo nhau trong khụng gian tớnh năng này. Một trong những giải phỏp cho vấn đề này là để tỏch cỏc dữ liệu từ những

phong cỏch viết khỏc nhau cho mỗi lớp học vào lớp con khỏc nhau, được gọi là lexemes. Những lexemes đại diện cho cỏc phần của dữ liệu được dễ dàng hơn tỏch ra từ cỏc dữ liệu của cỏc tầng lớp khỏc hơn mà lexeme thuộc.

Trong hệ thống này, chữ viết là bị bắt bởi số hoỏ cỏc tọa độ (x, y) và vị trớ của cỏc cõy bỳt và vị trị đặt điểm bỳt (lờn hoặc xuống) với tỷ lệ lấy mẫu khụng đổi. Sau một số lấy lại mẫu, bỡnh thường hoỏ, và làm mịn, mỗi nột bỳt là đại diện như là một chuỗi dài biến-điểm. Một số liệu dựa trờn đàn hồi mẫu lập trỡnh phự hợp và năng động, được xỏc định để cho phộp khoảng cỏch giữa hai nột để được tớnh toỏn.

Sử dụng cỏc khoảng cỏch tớnh bằng cỏch này, một ma trận gần nhau được xõy dựng của từng loại chữ số (tức là, 0 thụng qua 9). Mỗi biện phỏp ma trận khoảng cỏch lớp trong cho một lớp chữ số cụ thể. Chữ số trong một lớp đặc biệt là nhúm trong một thực nghiệm để tỡm một số lượng nhỏ cỏc nguyờn mẫu. Phõn cụm được thực hiện bằng cỏch sử dụng chương trỡnh CLUSTER mụ tả ở trờn [Jain và Dubes 1988], trong đú vộc tơ tớnh năng cho một chữ số của nú là N lõn cận đến con số của cựng một lớp. CLUSTER phõn nhúm tốt nhất cho mỗi giỏ trị của K trờn một số phạm vi, trong đú K là số cụm vào đú dữ liệu này là để được phõn vựng. Theo dự đoỏn, cú nghĩa là lỗi bỡnh phương (MSE) giảm đơn điệu như là một chức năng của K. Cỏc "tối ưu" giỏ trị của K được chọn bằng cỏch xỏc định một “đầu gối” trong biểu đồ của MSE vs K. Khi đại diện cho một cụm chữ số của một mẫu thử nghiệm duy nhất, tốt nhất nhận diện on-line kết quả được cụng nhận đó thu được bằng cỏch sử dụng cỏc chữ số đú là gần nhất để tới trung tõm cụm's. Sử dụng sơ đồ này, một tỷ lệ nhận diện chớnh xỏc là 99,33%.

Định nghĩa Phõn đoạn ảnh