Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 36 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
36
Dung lượng
838,27 KB
Nội dung
LOGO NHẬN DẠNG CHỮ VIẾT TAY MÔ HÌNH MARKOV ẨN Học viên : NGUYỄN MINH TRIẾT Giáo viên hướng dẫn : TS VŨ ĐỨC LUNG www.themegallery.com NỘI DUNG GiỚI THIỆU ĐỀ TÀI TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƢNG MÔ HÌNH MARKOV ẨN ỨNG DỤNG MÔ HÌNH MARKOV ẨN NHẬN DẠNG CHỮ VIẾT TAY CHƢƠNG TRÌNH DEMO COMPANY LOGO www.themegallery.com GiỚI THIỆU ĐỀ TÀI - Các toán nhận dạng ứng dụng thực tế, tập trung vào nhận dạng mẫu, nhận dạng tiếng nói nhận dạng chữ… -Nhận dạng chữ viết tay toán quan tâm nhiều nhận dạng ký tự không dấu đạt nhiều thành công lớn -Nhận dạng chữ viết tay tiếng Việt vấn đề thách thức lớn nhà nghiên cứu - Bài toàn chưa thể giải trọn vẹn hoàn toàn phụ thuộc vào người viết biến đổi đa dạng cách viết trạng thái sức khỏe, tinh thần người viết COMPANY LOGO www.themegallery.com GiỚI THIỆU ĐỀ TÀI - Hiện có số đề tài nghiên cứu nhận dạng chữ viết tay tiếng Việt mạng Nơron, máy Vector hổ trợ…., nhiên kết nhận dạng lại không cao Đó lý em chọn đề tài với mong muốn nâng cao kết nhận dạng đặc biệt tiếng Việt Trong đề tài tập trung vào nghiên cứu nhận dạng ký tự viết tay tiếng Việt đơn lẽ mô hình Markov ẩn COMPANY LOGO www.themegallery.com QUI TRÌNH THỰC HIỆN Qui trình nhận dạng chữ viết tay đƣợc thực qua bƣớc nhƣ sau : COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG Chuyển xám - Mục đích : Chuyển ảnh màu ảnh đa cấp xám Ví dụ : Chuyển xám Trước chuyển xám Sau chuyển xám COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG -Thuật toán trung bình cộng : Ý tưởng thuật toán sau: Tính trung bình cộng giá trị 1pixel, sau gán lại giá trị trung bình cộng cho RGB Ví dụ:Quá trình chuyển xám sau : TBC=(145+254+43)/3 = 147 Sau gán lại giá trị 147 cho R,G,B Pixel mô tả sau Như ảnh chuyển ảnh đa cấp xám COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG Phân ngƣỡng - Mục đích: Chuyển ảnh đầu vào thành ảnh đen trắng (là ảnh có pixel mang giá trị 255) - Thuật toán trung bình cộng: Sau tính giá trị TBC phần ta đem so sánh với ngưỡng COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG Ngưỡng số nằm khoảng từ 0255 Trong đặt ngưỡng 128 Thuật toán cụ thể sau: Nếu TBC < 0: Gán giá trị R,G,B = Nếu TBC > 255: Gán giá trị R,G,B = 255 Nếu TBC < Ngưỡng: Gán giá trị RGB = Nếu TBC >= Ngưỡng: Gán giá trị RGB=255 COMPANY LOGO www.themegallery.com TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG Lọc nhiễu Áp dụng lọc Median - Mục đích: Lọc nhiễu đốm, nhiễu muối tiêu sau phân ngưỡng ảnh -Với ảnh đầu vào ảnh scan ảnh chụp từ điện thoại máy ảnh, sau phân ngưỡng hay có điểm đen lốm đốm nằm rải rác toàn vùng ảnh - Các điểm gọi nhiễu, mục đích lọc median loại bỏ điểm nhiễu COMPANY LOGO •Ví dụ kết ảnh sau lượng tử www.themegallery.com MÔ HÌNH MARKOV Ẩn Ứng dụng mô hình Markov ẩn : Nhận dạng tiếng nói Nhận dạng chữ viết tay Xử lý ngôn ngữ thống kê Dịch máy Tin sinh học COMPANY LOGO www.themegallery.com MÔ HÌNH MARKOV ẨN 2.Chuổi (Xích )Markov Về chất, mô hình Markov phương pháp mô hình tín hiệu chuỗi kết xuất quan sát, sinh số tiến trình gọi nguồn (source) Ví dụ : Mô hình Markov trạng thái COMPANY LOGO www.themegallery.com MÔ HÌNH MARKOV ẨN - qt trạng thái đặt đến thời điểm t - aij xác suất chuyển từ trạng thái Si sang trạng thái Sj : Aij = P[qt+1 = j|qt = i], a ij 1 - S trạng thái hệ thống thời điểm t COMPANY LOGO www.themegallery.com MÔ HÌNH MARKOV ẨN Ví dụ : Mô hình biểu diễn thời tiết -Mưa : Trạng thái 0.2 -Mây : Trạng thái -Nắng : Trạng thái 0.1 0.2 -Ma trận xác suất -Chuyển trạng thái: 04 0.3 0.3 A 0.2 06 0.2 0.1 0.1 0.8 Hỏi : Xắc suất để thời tiết ngày liên tiếp : Nắng, mưa, mây, nắng ? Trả lời : Dãy quan sát o (nắng , mưa, mây , nắng) P(O) = P[3,1,2,3] = P[3]*P[1,3]*P[2,1]*P[3,2]= *a31 *a12 *a23 COMPANY LOGO www.themegallery.com MÔ HÌNH MARKOV ẨN 3.Mô hình Markov ẩn Trong mô hình Markov ẩn, kiện quan sát nằm trạng thái phụ thuộc vào hàm mật độ xác suất trạng thái Ví dụ : {A, B, } qt = Trạng thái thời điểm t S={1,2,…,N} – Tập tất trạng thái ẩn Ot = (ký hiệu) quan sát thời điểm t V = {1,2…,M}tập tất ký hiệu quan sát aij= P(qt+1 =j|qt =i),aij 0, i,j N B=[bij] xác suất nhả ký hiệu b = P(o =k|q=i),b 0, i N&1 k M [ i ]xác suất khởi trạng i P(q1 i) A=[aij] xác suất chuyển trạng thái COMPANY LOGO www.themegallery.com MÔ HÌNH MARKOV ẨN Ví dụ : Mô hình Markov ẩn Hệ thống bình cầu bao gồm : -N trạng thái, M tín hiệu quan sát -Khả chọn bình xác suất chuyển trạng thái - Khả chọn cầu xác suất tín hiệu quan sát COMPANY LOGO www.themegallery.com MÔ HÌNH MARKOV ẨN Ba toán mô hình Markov ẩn Bài toán 1: cho trước chuỗi tín hiệu quan sát O = O1 O2 … OT mô hình HMM đại diện tham số λ = (A, B, π) Làm để tính toán cách hiệu p(O|λ) – xác suất phát sinh O từ mô hình λ? Bài toán 2: cho trước chuỗi tín hiệu quan sát O = O1 O2 … OT mô hình HMM đại diện tham số λ = (A, B, π) Cần tìm chuỗi trạng thái tối ưu Q = q1 q2 … qT phát sinh O? COMPANY LOGO www.themegallery.com MÔ HÌNH MARKOV ẨN Bài toán 3: cho trước chuỗi tín hiệu quan sát O = O1, O2 … OT Làm để xác định tham số mô hình λ = (A, B, π) cho cực đại hóa xác suất p(O|λ)? Bộ tham số λ chọn cho xác suất p(O|λ) đạt cực đại cục thuật toán Baum-Welch: - Trước tiên, ta định nghĩa ξt(i,j) xác suất trạng thái Si thời điểm t rơi vào trạng thái Sj thời điểm t+1 cho trước mô hình λ chuỗi tín hiệu quan sát O: ξt (i, j) =p(qt= Si , qt +1 = S j | O, λ) COMPANY LOGO www.themegallery.com MÔ HÌNH MARKOV ẨN Theo định nghĩa này, ξt(i,j) tính thông qua biến forward α t(i) backward βt(i) sau: Mặc khác, ta có γt(i) xác suất trạng thái Si vào thời điểm t cho trước chuỗi tín hiệu quan sát O mô hình λ Lấy tổng ξt(i,j) j, ta tương quan γt(i) ξt(i,j) sau: COMPANY LOGO www.themegallery.com MÔ HÌNH MARKOV ẨN Nếu ta lấy tổng γt(i) theo t ∈ [1, T-1], kết nhận số lần kỳ vọng chuyển trạng thái từ Si Tương tự, lấy tổng ξt(i,j) theo t ∈ [1, T-1], ta có số lần kỳ vọng chuyển từ trạng thái Si sang Sj: Với đại lượng này, ta có biểu thức cập nhật tham số HMM sau: COMPANY LOGO www.themegallery.com MÔ HÌNH MARKOV ẨN ( , A, B ) COMPANY LOGO www.themegallery.com ỨNG DỤNG MÔ HÌNH MARKOV ẨN NHẬN DẠNG CHỮ VIẾT TAY Huấn lyện : ‒ Ảnh ký tự scan, chụp đưa vào hệ thống ‒ Tiền xử lý trích chọn đặc trưng ‒ Các vector đặc trưng đưa vào mô hình cần huấn luyện tương ứng với ký tự đưa vào Các vector đặc trưng dãy quan sát đầu vào mô hình Markov ẩn Nhận dạng: Cũng tương tự phần huấn luyện Ảnh scan lấy đặc trưng Dãy vector đặc trưng đưa vào mô hình Markov ẩn huấn luyện Mô hình gần với mô hình huấn luyện chọn COMPANY LOGO www.themegallery.com CHƯƠNG TRÌNH DEMO - Cấu hình cài đặt : CPU pentium4, RAM 2G - Ngôn ngữ lập trình : Ngôn ngữ C# , mã nguồn mở - Giao diện chƣơng trình : COMPANY LOGO www.themegallery.com KẾT LUẬN Đề tài ứng dụng mô hình Markov ẩn vào nhận dạng chữ viết tay cho thấy kết nhận dạng tương đối tốt Hướng phát triển - Nhận dạng đoạn văn viết tay… - Phát triển để chương trình tích hợp với trương trình quản lý sinh viên, học sinh Phát triển thêm mặt liệu để trương trình hoạt động tốt với liệu chương trình quản lý - Cải tiến số thuật toán tiền xử lý để chương trình có tốc độ tốt - Phát triển giao diện thân thiện với người sử dụng COMPANY LOGO LOGO EM XIN CẢM ƠN THẦY CÔ VÀ CÁC BẠN ĐÃ LẮNG NGHE !