Bài báo này đề xuất một mô hình giải quyết riêng cho bài toán nhận dạng ký tự trên container, bao gồm các bước chính là phân tách các ký tự trên container, rút trích đặc trưng [r]
(1)MỘT MƠ HÌNH ĐỀ XUẤT CHO BÀI TOÁN NHẬN DẠNG KÝ TỰ TRÊN CONTAINER VẬN TẢI ĐƯỜNG THỦY
Lê Hồng Thanha*
aKhoa Cơng nghệ Thơng tin, Trường Đại học Nha Trang, Khánh Hồ, Việt Nam
Lịch sử báo
Nhận ngày 08 tháng 01 năm 2017 | Chỉnh sửa ngày 11 tháng 04 năm 2017 Chấp nhận đăng ngày 11 tháng 05 năm 2017
Tóm tắt
Nhận dạng ký tự lĩnh vực quan tâm nhằm xây dựng chương trình có khả chuyển hình ảnh thành văn tài liệu Kỹ thuật này ứng dụng công tác quét lưu trữ, đẩy nhanh việc nhập liệu vào máy với ít lỗi Hiện lĩnh vực vận tải, công việc ghi nhận mã số container thực hiện chủ yếu tay, cần thiết phải có giải pháp để nhận dạng tự động để tiết kiệm thời gian công sức Bài báo bước đầu đề xuất mơ hình giải tốn nhận dạng ký tự container dựa việc phân tách ký tự rút trích đặc trưng HOG Kết quả bước đầu từ thực nghiệm chứng minh mơ hình đề xuất cho kết tương đối khả quan
Từ khóa:HOG; Nhận dạng ký tự; Số container; SVM
1 GIỚI THIỆU
Nhận dạng ký tự cần thiết ứng dụng rộng rãi nhiều lĩnh vực nhận dạng chữ số chi phiếu ngân hàng, mã số bì thư dịch vụ bưu chính, hay chữ số biểu mẫu nói chung Vấn đề nhận dạng ký tự nói chung thách thức lớn nhà nghiên cứu (Trần, 2013) Bài tốn lớn ln đặt phía trước phức tạp việc nhận dạng ký tự phụ thuộc nhiều vào yếu tố khác đặc thù ứng dụng, chất lượng ảnh đầu vào Có thể hình dung vấn đề từ ứng dụng nhận dạng chữ viết tay so với nhận dạng bảng số xe, toán nhận dạng ký tự cách tiếp cận giải pháp hoàn toàn khác biệt Hệ thống nhận dạng thường bao gồm hai bước: (1) Rút trích đặc trưng từ ảnh; (2) Học tự động từ đặc trưng để nhận dạng ký tự Hiệu hệ thống nhận dạng phụ thuộc vào
(2)phương pháp sử dụng hai giai đoạn Hầu hết hệ thống sử dụng đặc trưng từ ảnh ký tự đường biên, cạnh, độ dày, giá trị mức xám (Trần, 2013), Haar-like (Said, Tan, & Baker, 2000), với xử lý đặc thù lấy mẫu, dao động điểm ảnh, biến đổi ảnh, thêm liệu ảo (Freund & Schapire, 1996) Sau hệ thống
nhận dạng huấn luyện mơ hình học tự động k-NN, mạng neural, SVM, boosting
(Du & Swamy, 2006) Các kỹ thuật áp dụng phụ thuộc nhiều vào toán cụ thể Bài báo đề xuất mơ hình giải riêng cho tốn nhận dạng ký tự container, bao gồm bước phân tách ký tự container, rút trích đặc trưng ảnh nhận dạng dựa máy phân lớp SVM
2 QUY ƯỚC SỐ HIỆU CONTAINER 2.1 Hệ thống nhận biết
Hệ thống nhận biết container bao gồm thành phần sau: Mã chủ sở hữu (owner code), ký hiệu loại thiết bị (product group code), số serial (serial number) chữ
số kiểm tra (check digit), mô tả Hình
Hình Một ví dụ vềmã quy ước nhận biết container 2.1.1 Mã chủ sở hữu
Mã chủ sở hữu bao gồm chữ viết hoa thống đăng ký với quan đăng kiểm quốc tế thông qua quan đăng kiểm quốc gia đăng kí trực tiếp với Cục container Quốc tế (BIC) Sau đăng ký, việc sở hữu mã thức cơng nhận toàn giới
(3)Bảng Mã chủ sở hữu công ty Việt Nam
Mã BIC Tên công ty
GMD Gemadept
GMT Gematrans
NSH Nam Trieu shipping
VCL Vinashin-TGC
VNL Vinalines container
VNT Vinashin-TGC
2.1.2 Ký hiệu loại thiết bị
Là ba chữ viết hoa, tương ứng với loại thiết bị:
• U: Container chở hàng (freight container);
• J: Thiết bị tháo rời container chở hàng (detachable);
• Z: Đầu kéo (trailer) moóc (chassis)
Việc sử dụng chữ không thuộc ba chữ (U, J, Z) làm ký hiệu loại thiết bị coi không tuân theo tiêu chuẩn ISO 6346 (ISO, 1995)
2.1.3 Serial number
Đây số hiệu container, gồm chữ số Nếu số serial khơng đủ chữ số, chữ số thêm vào phía trước để thành đủ chữ số Chẳng hạn, số serial “1234”, số serial đầy đủ “001234” Số serial chủ sở hữu container đặt ra, đảm bảo nguyên tắc số sử dụng cho container
2.1.4 Chữ số kiểm tra (Check digit)
(4)tuyệt đối, sai ký tự trở lên số kiểm tra đúng, sai sót không bị phát (ISO, 1995)
2.2 Mã kích thước mã kiểu
Mã kích thước bao gồm ký tự, chữ chữ số Ký tự thứ biểu thị chiều dài container, chữ số ví dụ Hình thể chiều dài container 40 feet (~12.192m) Ký tự thứ hai biểu thị chiều rộng chiều cao container, ví dụ chiều cao feet inches (~2.591m) Mã kiểu gồm ký tự, ký tự thứ cho biết kiểu container, ký tự “G” thể container hàng bách hóa Ký tự thứ hai biểu thị đặc tính liên quan đến container, ký tự “1” nghĩa container có cửa thơng gió phía Tóm lại, “42G1” Hình thể container bách hóa dài 40 feet, cao feet inches, thơng gió phía Tiêu chuẩn ISO 6346 quy định chi tiết ý nghĩa mã kích thước mã kiểu
Hình Ví dụ vềmã quy ước kích thước kiểu container 2.3 Các dấu hiệu khai thác
(5)Hình Ví dụ vềmã quy ước tải trọng mã quốc gia container 3 MƠ HÌNH ĐỀ XUẤT
Tìm biên ảnh: Một biên hình ảnh nói chung định nghĩa đường bao ảnh đường viền ngăn cách khu vực ảnh liền kề có đặc điểm tương đối khác biệt theo số tính quan tâm, số độ đo thay đổi đột ngột cấp xám Biên có thơng tin quan trọng góp phần hướng tới phân tích giải thích thơng tin hình ảnh nhận dạng (Lương, 2003) Kết thực nghiệm bước đầu cho thấy thuật tốn tìm biên Canny tương đối thích hợp việc phân tách ký tự trường hợp toán cụ thể
Hình Các bước mơ hình đề xuất
Giãn ảnh nhị phân: Tập hợp B thường coi phần tử cấu trúc giãn nhị phân, phép tốn hình thái khác, tập hợp A tập hợp
các phần tử hình ảnh gốc (Lương, 2003) Với A B tập hợp
Z ,
phép giãn nhị phân A theo B (AB) định nghĩa qua công thức (1) (Lương,
2003)
{z | (B)z A }
A B (1)
(6)Định vị đối tượng: Để khoanh vùng đối tượng có khả ký tự, báo sử dụng thuật toán định vị dựa láng giềng Mỗi đối tượng ứng viên ảnh
được khoanh vùng hình chữ nhật có kích thước n×m
Rút gọn tập ứng viên: Sau bước định vị đối tượng ảnh ta tập ký tự ứng viên để tiến hành nhận dạng Tuy nhiên để rút ngắn thời gian thực cho bước phân loại tiếp theo, báo đề xuất việc sơ loại đối tượng dựa tỷ lệ kích thước chúng Từ thực nghiệm cho thấy đối tượng ký tự container thỏa mãn điều kiện công thức (2)
0.486 0.486
1.083 1.083
m n
40px n m 200px (2)
Hình Ví dụ tập ký tựứng viên khoanh vùng
Rút trích đặc trưng: Hiện có nhiều phương pháp để rút trích đặc trưng ảnh Trong tốn nhận ký tự quang học nói chung, phương pháp chia lưới ký tự sử dụng phổ biến Tuy nhiên, báo đề xuất sử dụng phương pháp rút trích đặc trưng dựa gradient ảnh HOG (Histogram of Oriented Gradients) mơ tả Hình Các kỹ thuật chứng minh tính hiệu việc rút trích đặc trưng phục vụ đầu vào cho toán nhận dạng (Dalal & Triggs, 2005)
(7)Kỹ thuật HOG sử dụng cửa sổ trượt để rút trích đặc trưng ảnh đầu vào Ảnh chia thành có kích thước 8×8 pixel, 2×2 tạo thành block Gradient vector tính pixel, có 64 gradient vector cell Các gradient vector
này đặt vào histogram gồm n bin Giả sử n chọn dãy bin
histogram nằm khoảng từ - 1800, bin ứng với phạm vi 200 (Dalal & Triggs,
2005) Giá trị bố trí vào bin histogram tỉ trọng độ lớn gradient vector
gần với bin Hay nói cách khác, ta chia tỷ trọng độ lớn gradient vector vào
bin gần
Như nói trên, giá trị bin histogram tích lũy độ lớn
64 gradient vector cell (8×8 pixel) Giả sử mức xám pixel cell nhân 1.5 lần (tăng độ tương phản) độ lớn gradient vector nhân lên 1.5 lần Như giá trị bin histogram nhân 1.5 lần Do đó, để bất biến với thay đổi độ sáng ảnh ta cần phải chuẩn hóa histogram Tuy nhiên thực tế khơng cần phải chuẩn hóa histogram, thay vào thực việc chuẩn hóa theo block (Dalal & Triggs, 2005) Trong đó, block biểu diễn cách ghép histogram ô thành vector gồm 36 thành phần (4 histogram × bin/histogram) Trong tốn dị ký tự container, cửa sổ trượt thiết lập có kích thước 64×128 pixel chia thành 105 block (7 block ngang × 15 block dọc) Mỗi block biểu diễn 36 giá trị, tổng cộng có 3780 giá trị cho cửa sổ dị tìm Hay nói cách khác cửa sổ biểu diễn vector đặc trưng bao gồm 3780 chiều
Nhận dạng ký tự: Để thực việc phân lớp ký tự, báo sử dụng phân lớp SVM với chiến lược “one-vesus-all” (Alpaydin, 2014) Như với tổng cộng 36 ký tự tương ứng với việc xây dựng 36 phân lớp SVM nhị phân
4 KẾT QUẢ THỰC NGHIỆM
Để huấn luyện mô hình, báo sử dụng tập liệu chuẩn Chars74K xây
dựng từ ảnh chụp Google Street View (De Campos, Babu, &Varma, 2009) Các