1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu ứng dụng phương pháp nhận dạng cấu trúc văn phạm trong nhận dạng (nhận dạng chữ,…) và so sánh chất lượng và hiệu năng với phương pháp khác để nhận dạng chữ

27 492 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 27
Dung lượng 1,57 MB

Nội dung

BỘ GIÁO DỤC & ĐÀO TẠO ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN ĐÀO TẠO SAU ĐẠI HỌC  - TIỂU LUẬN MƠN HỌC Đề 13: Tìm hiểu ứng dụng phương pháp nhận dạng cấu trúc văn phạm nhận dạng (nhận dạng chữ,…) so sánh chất lượng hiệu với phương pháp khác để nhận dạng chữ GVHD: PGS.TS Nguyễn Thị Hoàng Lan Học viên: Hồng Văn Hải Nguyễn Văn Dũng Trần Đình Phương Lớp: CH-12BMTT Hà nội, 12/2012 Tiểu luận môn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hoàng Lan MỞ ĐẦU Được phân cơng ban cán lớp, nhóm thực đề tài: Tìm hiểu ứng dụng phương pháp nhận dạng cấu trúc văn phạm nhận dạng (nhận dạng chữ,…) so sánh chất lượng hiệu với phương pháp khác để nhận dạng chữ (Đề 13) Trong phạm vi tiểu luận này, với kiến thức học tự nghiên cứu thêm tài liệu từ giáo trình, giảng mạng Internet, chúng tơi xin trình bày nội dung sau: Phần 1: Sơ lược nhận dạng Phần 2: Tìm hiểu ứng dụng phương pháp nhận dạng cấu trúc văn phạm nhận dạng (nhận dạng chữ, hình học, ảnh nhị phân,…) Phần 3: So sánh chất lượng hiệu với phương pháp khác để nhận dạng chữ (phương thức đồ thị, chuỗi) Cho dù cố gắng, điều kiện thời gian khả nhiều hạn chế, nội dung tiểu luận môn học lĩnh vực tri thức rộng lớn nghiên cứu, đa dạng phức tạp nên chắn không tránh khỏi sai sót khiếm khuyết Rất mong nhận góp ý, phê bình, đánh giá PGS.TS bạn lớp để nhóm chúng tơi rút kinh nghiệm hoàn thiện tốt thời gian tới Chúng xin gửi lời cảm ơn chân thành đến PGS.TS Nguyễn Thị Hoàng Lan giảng dạy kiến thức, cung cấp tài liệu, định hướng hướng dẫn chúng tơi suốt thời gian qua để nhóm chúng tơi hồn thành tiểu luận Phân cơng cơng việc: Phần 1: Hoàng Văn Hải Phần 2: Hoàng Văn Hải Phần 3: Nguyễn Văn Dũng (Phương thức đồ thị) Phần 3: Trần Đình Phương (Phương thức xâu chuỗi) Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang Tiểu luận môn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hoàng Lan PHẦN SƠ LƯỢC VỀ NHẬN DẠNG 1.1 Không gian biểu diễn đối tượng, không gian diễn dịch a) Không gian biểu diễn đối tượng Các đối tượng quan sát hay thu thập được, thường biểu diễn tập đặc trưng hay đặc tính Như trường hợp xử lý ảnh, ảnh sau tăng cường để nâng cao chất lượng, phân vùng trích chọn đặc tính biểu diễn đặc trưng biên, miền đồng nhất, Người ta thường phân đặc trưng theo loại như: đặc trưng tơ pơ, đặc trưng hình học đặc trưng chức Việc biểu diễn ảnh theo đặc trưng phụ thuộc vào ứng dụng Ở ta đưa cách hình thức việc biểu diễn đối tượng Giả sử đối tượng X (ảnh, chữ viết, dấu vân tay, …) biểu diễn n thành phần (n đặc trưng): X = {x1, x2, , xn}; xi biểu diễn đặc tính Khơng gian biểu diễn đối tượng thường gọi tắt không gian đối tượng X định nghĩa: X = {X1, X2, , Xm} Xi biểu diễn đối tượng Khơng gian vô hạn Để tiện xem xét xét tập X hữu hạn b) Không gian diễn dịch Không gian diễn dịch tập tên gọi đối tượng Kết thúc trình nhận dạng ta xác định tên gọi cho đối tượng tập khơng gian đối tượng hay nói nhận dạng đối tượng Một cách hình thức gọi Ω tập tên đối tượng: Ω = {w1, w2, ,wk} với wi, i = 1, 2, , k tên đối tượng Quá trình nhận dạng đối tượng f ánh xạ f: X > Ω với f tập quy luật để định phần tử X ứng với phần tử Ω Nếu tập quy luật tập tên đối tượng biết trước nhận dạng chữ viết (có 26 lớp từ A đến Z), người ta gọi nhận dạng có giám sát Trường hợp thứ hai nhận dạng khơng có giám sát Đương nhiên trường hợp việc nhận dạng có khó khăn Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang Tiểu ḷn mơn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hoàng Lan 1.2 Nhận dạng mẫu thống kê nhận dạng cấu trúc a) Nhận dạng mẫu thống kê Nhận dạng mẫu thống kê phân loại mơ hình dựa tập hợp tính trích xuất mơ hình thống kê Lý tưởng nhất, thực với thủ tục đơn giản: - Xác định vector tính năng, - Huấn luyện hệ thống, - Phân lớp Cũng có nhiều mơ hình chứa thơng tin cấu trúc quan hệ khiến cho khó khơng xác định dạng vector tính b) Nhận dạng cấu trúc văn phạm Cách tiếp cận mơ hình dựa vào việc mô tả đối tượng cách biểu thị giả định đối tượng sở để đánh giá ngôn ngữ tự nhiên Phương pháp xây dựng mơ tả thứ bậc mơ hình phức tạp từ yếu tố nguyên thủy đơn giản Để mô tả đối tượng, người ta dùng số dạng nguyên thuỷ đoạn thẳng, cung,… Chẳng hạn hình chữ nhật định nghĩa gồm đoạn thẳng vuông góc với đơi Trong mơ hình người ta sử dụng kí hiệu kết thúc Vt, kí hiệu khơng kết thúc gọi V n Ngồi có dùng tập luật sản xuất để mô tả cách xây dựng đối tượng phù hợp dựa đối tượng đơn giản đối tượng nguyên thuỷ (tập V t) Trong cách tiếp cận này, ta chấp nhận khẳng đinh là: cấu trúc dạng kết việc áp dụng luật sản xuất theo theo nguyên tắc xác định dạng gốc bắt đầu Một cách hình thức, ta coi mơ hình tương đương văn phạm G = (V t, Vn, P, S) với: - Vt ký hiệu kết thúc, - Vn ký hiệu không kết thúc, - P luật sản xuất, Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang Tiểu luận môn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hoàng Lan - S ký hiệu, biểu tượng kết thúc Ví dụ, đối tượng nhà gồm mái tường, mái tam giác gồm cạnh đoạn thẳng, tường hình chữ nhật gồm cạnh vng góc với đơi mô tả thông qua cấu trúc mô tả dựa vào văn phạm sinh hình Hình Mơ hình cấu trúc đối tượng nhà Việc xác định số lượng mô tả cấu trúc thực chủ yếu cách sử dụng: - Ngơn ngữ hình thức - Mô tả quan hệ (chủ yếu đồ thị) Bước tiếp theo, nhận dạng phân loại thực cách sử dụng: - Phân tích cú pháp (đối với ngơn ngữ hình thức), - Kết hợp đồ thị quan hệ (đối với mô tả quan hệ) Trong tiểu luận nghiên cứu phương pháp tiếp cận nhận dạng cấu trúc văn phạm So sánh với phương pháp nhận dạng chuỗi đồ thị Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang Tiểu ḷn mơn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hồng Lan PHẦN 2: TÌM HIỂU ỨNG DỤNG PHƯƠNG PHÁP NHẬN DẠNG CẤU TRÚC VĂN PHẠM TRONG NHẬN DẠNG 2.1 Phương thức cấu trúc văn phạm Ngữ pháp cung cấp mơ hình chi tiết hóa làm tảng cho việc tạo ký tự chuỗi Ví dụ, chuỗi số điện thoại có cấu trúc chặt chẽ Tương tự vậy, hệ thống nhận dạng ký tự quang nhận dạng biên dịch phương trình tốn học có sử dụng quy tắc để xếp biểu tượng toán học Bài tốn nhận dạng, chúng tơi đưa câu (một chuỗi có quy tắc) ngữ pháp (các quy tắc), xác định xem câu có tạo văn phạm không Một ngữ pháp bao gồm bốn thành phần: - Các ký tự: Mỗi câu bao gồm chuỗi ký tự (hay biểu tượng nguyên thủy, biểu tượng kết thúc) từ bảng chữ - Các biến: Là (ký hiệu) biểu tượng không kết thúc (hoặc biểu tượng trung gian, biểu tượng nội bộ) - Biểu tượng gốc: Là biến đặc biệt, gốc cho tất chuỗi - Luật sinh: quy tắc sinh (hoặc viết lại quy tắc) để xác định chuyển đổi tập hợp biến biểu tượng vào biến biểu tượng khác Ví dụ, A biến c ký hiệu kết thúc, quy tắc cA -> cc nghĩa thời điểm phân khúc cA xuất chuỗi thay cc Ngơn ngữ L(G) tạo văn phạm G tập hợp tất chuỗi (có thể số vơ hạn) tạo G Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang Tiểu luận môn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hồng Lan Hình 2: Cây minh họa câu tiếng Anh tạo văn phạm Một vài đặc điểm phương thức nhận dạng theo cú pháp cấu trúc sau: + Các mẫu phân tách thành mẫu nhỏ dựa mối quan hệ + Các mẫu hình thành mẫu nhỏ phân cấp + Các lớp khác có mẫu nhỏ khác nhau, quy luật mẫu nhỏ khác khác với lớp khác Ví dụ cho mẫu nhận dạng: Hình – Phân tích nhận dạng cú pháp khng nhạc Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang Tiểu luận môn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hoàng Lan Như vậy, đối tượng cần nhận dạng X miêu tả xâu chuỗi, đồ thị văn phạm Ta có cấu trúc văn phạm G dựa tứ G = (VN, VT, P, S), VN VT (VN ∩ VT = ∅) - VN: tập từ vựng - VT: tập từ vựng coi biến - P tập quy tắc sinh câu Ví dụ: α → β, α β tập V α ∩ VN = ∅ - S ∈ VN biểu tượng, dấu hiệu thư mục gốc (hoặc bắt đầu) Một số ký hiệu: • Σ * tập hợp tất câu có chiều dài hữu hạn hình thành từ biểu tượng Σ Chuỗi rỗng ký hiệu λ; Σ + = Σ * - {λ} • xn biểu thị lặp lại câu x n lần • | x | độ dài câu x • nghĩa η trực tiếp tạo câu γ, nghĩa η = ω1 α ω2, γ = ω1 β ω2, có tồn quy tắc sinh α → β • có nghĩa η gián tiếp tạo câu γ, tức là, có tồn chuỗi câu ς1 , ςn để η = ς1, γ = ςn, ςi ⇒ ςi +1, i = 1, , n - Các câu ς1, , ςn gọi nguồn gốc γ từ η Nếu G cấu trúc văn phạm, cụm từ có cấu trúc tạo văn phạm Một ngôn ngữ có nhiều cách đặc tả, có nhiều văn phạm khác sinh ngôn ngữ Hai văn phạm sinh ngơn ngữ gọi tương đương G1 tương đương G2 L(G1) = L(G2) Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang Tiểu luận môn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hoàng Lan Nếu chuỗi x ∈ L(G) sinh nhiều cách, văn phạm G không rõ ràng Trong ứng dụng nhận dạng, văn phạm rõ ràng điều mong muốn, phân tích cú pháp Hình – Minh họa hệ thống nhận dạng theo cấu trúc văn phạm 2.2 Ngơn ngữ hình thức Bằng cách áp đặt số quy tắc hạn chế luật sinh, Noam Chomsky đề nghị hệ thống phân loại văn phạm dựa vào tính chất luật sinh Hệ thống cho phép xây dựng nhận dạng hiệu tương thích với loại văn phạm Ta có loại văn phạm sau: Loại 0: (Văn phạm phi ngữ cảnh hay không hạn chế): Văn phạm không cần thỏa mãn ràng buộc luật sinh hay quy tắc Loại 1:(văn phạm cảm ngữ cảnh CSG): Nếu văn phạm G có luật sinh dạng αIβ → αxβ Trong α,β chuỗi chứa biến trung gian biểu tượng kết thúc, I biến trung gian, x biến trung gian biểu tượng kết thúc Loại 2: (văn phạm phi ngữ cảnh CFG): Nếu văn phạm G có luật sinh dạng A → α với A biến trung gian α chuỗi ký hiệu kết thúc biến trung gian ∈ VT Loại 3: (văn phạm quy RG): Nếu văn phạm G có luật sinh dạng tuyến tính: α → zβ α → βz α → z với α,β biến trung gian z chuỗi ký hiệu kết thúc (có thể rỗng) Lớp văn phạm kiểu i bao gồm tất văn phạm kiểu i + Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang Tiểu ḷn mơn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hoàng Lan 2.3 Nhận dạng sử dụng cấu trúc văn phạm Giả sử có câu x tạo ngơn ngữ c có mẫu lớp khác Câu x phân loại theo ngữ pháp sinh nó, x thành viên ngơn ngữ L(Gi) Phân tích cú pháp trinh xử lý ngược, cho x cụ thể, tìm dẫn xuất G, dẫn đến x Phân tích cú pháp từ lên bắt đầu với câu x, tìm cách đơn giản nó, coi biểu tượng gốc Phương pháp tiếp cận sử dụng luật sinh trở trước, tức tìm viết lại quy tắc bên phải chuỗi tại, thay với phân khúc Phân tích cú pháp từ xuống bắt đầu với nút gốc liên tục áp dụng luật sinh để tìm gốc câu x Từ xác định quy tắc sinh 2.4 Ngơn ngữ mơ tả hình ảnh sử dụng nhận dạng cấu trúc văn phạm Hình 5: Sử dụng ngơn ngữ mơ tả hình ảnh (PDL) để nhận dạng cấu trúc văn phạm Ngôn ngữ mô tả hình ảnh (PDL) cách thức để mơ tả mẫu hình ảnh sử dụng ngơn ngữ hình thức Trong hình trên: Các ký hiệu (biểu tượng) kết thúc: {t, b, u, o, s, *, - , +}; + đại diện cho vector nối đuôi nhau, * đại diện cho vector điểm bắt đầu, - đại diện đảo ngược vector H đại diện cho cuối vector T đại diện cho đầu vector Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 10 Tiểu ḷn mơn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hồng Lan Hình 10: Ví dụ cú pháp biểu diễn ảnh nhị phân Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 13 Tiểu ḷn mơn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hoàng Lan PHẦN 3: SO SÁNH CHẤT LƯỢNG VÀ HIỆU NĂNG NHẬN DẠNG VỚI PHƯƠNG PHÁP KHÁC ĐỂ NHẬN DẠNG CHỮ 3.1 Phương pháp suy luận Trong nhiều ứng dụng, ngữ pháp thiết kế tay Một phương pháp khác học ngữ pháp từ mẫu có sẵn Việc học gọi phương pháp suy luận Dữ liệu huấn luyện thiết lập H bao gồm mẫu tích cực S+ mẫu tiêu cực S-, có nghĩa là, H = {S+, S-} Mục đích để học ngũ pháp Glearn ngữ pháp để mẫu S+ thuộc ngôn ngữ xác định ngữ pháp, mẫu S- khơng Ngồi ra, mẫu huấn luyện "ngoại suy" Nếu: S+={ab, aabb, aaabbb, aaaabbbb} Có thể phát biểu rằng: L(Glearn) ={anbn|n≥1} P={S→ab, S→aSb} Một văn phạm quy hình thành cách sử dụng liệu huấn luyện theo cách sau • S + S- cho có sẵn • Khởi tạo ngữ pháp Glearn(0) = {VN(0), VT(0), P(0), S(0)} xây dựng chỉnh sửa quy tắc tạo thành viên P, VN, VT giả thiết biết • Mục đích để xác định G learn để S+ chuỗi thuộc ngôn ngữ L(G learn) S-khơng Tổng quan thủ tục học tập: • Đặt i = • Xem tập huấn luyện x(i) ∈ S+ Nếu có phân tích chỉnh sửa Glearn để phân tích khơng có x ∈ S- phân tích • Nếu i < |S+|, đặt i = i + quay lại bước trước đó, khơng Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 14 Tiểu luận mơn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hồng Lan Một điểm yếu rõ ràng thủ tục đặc điểm kỹ thuật quy tắc chỉnh sửa thích hợp cho P, VN, VT khó khăn.Hơn nữa, quy định không nhất, số lượng Glearn ngữ pháp phát triển nhanh chóng 3.2 Nhận dạng dựa vào đồ thị Một đồ thị có hướng sử dụng để đại diện cho phụ thuộc phức tạp nguyên thủy (biểu tượng) cách sử dụng chuỗi biểu tượng chiều Như vậy, so sánh mẫu đại diện sử dụng đồ thị nhìn thấy cảm giác tổng quát so sánh chuỗi biểu tượng Xem đỉnh N đồ thị G = {N, R} (khác nhau) biểu tượng R cạnh chúng phản ánh (khác nhau) quan hệ chúng (được gọi thuộc tính đồ thị) Hình 11: Một ví dụ mẫu biểu diễn đồ thị: Nhận dạng dựa so sánh đồ thị biểu đồ nguyên mẫu lớp khác cách sử dụng thuật toán K-láng giềng gần Đồ thị đại diện mơ hình quan sát khơng thiết phải hồn tồn phù hợp với đồ thị nguyên mẫu Nó đồ thị số đồ thị nguyên mẫu việc so sánh giống đồ thị dựa tương đồng hai đỉnh cạnh đồ thị so sánh Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 15 Tiểu luận môn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hồng Lan Đồ thị biểu diễn cách sử dụng ma trận kề M có kích thước p × p, p số đỉnh: M (i, j) != có đỉnh i j, khơng M (i, j) =0 Phép đồng cấu đẳng cấu đồ thị: Đồ thị G1={N1, R1} G2={N2, R2} gọi đồng cấu tồn ánh xạ f : N1  N2 để có cạnh đỉnh v1, w1 ∈ N2 Sao cho (v1, w1)∈R1⇒(f(v1), f(w1))∈R2 Đồ thị gọi đẳng cấu đồng cấu có ánh xạ f – cho đỉnh N2 tồn xác đỉnh tương ứng N1 (song ánh), cho (v1, w1)∈R1⇔(f(v1), f(w1))∈R2 Nói cách khác, G2 thu từ G1 cách đánh lại số đỉnh Ví dụ đồ thị đẳng cấu: Hình 12: Một ví dụ đẳng cấu hai đồ thị vơ hướng với p = Trong thực tế đẳng cấu đồ thị biện pháp tốt tương tự việc phân loại, khơng cho phép khác biệt đồ thị.Vì thế, nhạy cảm với sai sót giai đoạn khai thác tính Ngồi ra, phát phép đẳng cấu đồ thị tính tốn địi hỏi: • Xem xét so sánh đồ thị G1 G2 biểu diễn cách sử dụng ma trận kề M1 M2 • Nếu M1 = M2 đồ thị đẳng cấu Sự so sánh cần thực cho tất yếu tố ma trận p × p (O (| N1 | 2)) • Nếu M1 != M2, tất cách khác để đánh số đỉnh M1 phải cố gắng thực Thông thường, kiểm tra thất bại đồ thị khơng đẳng cấu sử dụng.Các tính chất đồ thị bất biến để đẳng cấu: Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 16 Tiểu ḷn mơn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hồng Lan • Số đỉnh (loại định) • Số cạnh (loại định) • Số cạnh (loại định) kết nối với đỉnh (của số loại) Có tồn nhiều thuật toán phép so sánh khác biệt đồ thị Hai cách tiếp cận điển hình là: • Vectơ tính xây dựng cho biểu đồ vectơ so sánh • Số lượng phép toán tối thiểu cần thiết để sửa đổi đồ thị khác sử dụng biện pháp thay o Chèn loại bỏ đỉnh o Kết hợp chia tách đỉnh o Thay đổi loại đỉnh o Chèn loại bỏ cạnh o Thay đổi loại cạnh 3.3 Nhận dạng dựa đối sánh cấu trúc xâu chuỗi Phân tích cấu trúc chuỗi kí tự có nghĩa kiểm tra cấu trúc có chấp nhận hay khơng, là, tạo cách sử dụng quy tắc ngữ pháp Cách xây dựng: Hi Hình 13: Bộ nhận dạng Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 17 Tiểu ḷn mơn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hoàng Lan Ở x chuỗi kí hiệu Gi văn phạm tương tương ứng với lớp ωi Giả sử G văn phạm ngữ cảnh x chuỗi kí tự Trong việc xây dựng, cơng nhận phân tích cú pháp tương ứng với x sử dụng G cố gắng Nếu xây dựng => x thuộc ngôn ngữ L (G), xây dựng, x không thuộc ngơn ngữ L(G) Ví dụ Xem xét văn phạm G = (VN, VT, P, S), VN = {S, T}, VT = {I, +, *}, I ∈ {a, b, c}, P={S→T, T→T∗I, S→S+T, T→I} Một chuỗi biểu tượng x = a * b + c * a + b thuộc ngơn ngữ L (G) Vì phân tích cú pháp theo cách sau Hình 14: Cây cú pháp cho x Việc xây dựng khơng quan trọng Tuy nhiên, thường kí hiệu đưa từ trái sang phải thuật toán phân tích Trong q trình phân tích cú pháp, quy tắc lựa chọn nút con.Tuy nhiên, lựa chọn số quy tắc dẫn đến phân tích cú pháp khơng thành cơng chuỗi thuộc vào ngôn ngữ Trong trường hợp đó, người ta phải trở điểm bị sai chọn quy tắc khác Điều gọi quay lại Phân tích cú pháp dung phương pháp top-down bottom-up Phân tích kiểu top-down (từ xuống) • Phân tích cú pháp kí tự gốc Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 18 Tiểu ḷn mơn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hoàng Lan • S phân rã thành phần (subgoals): S → X1X2 Xn • Nếu X1 kí tự phân rã, có phải kí tự chuỗi x phân tích • Nếu X1 biểu tượng phân rã, cần đưa vào phần x tương ứng với • Nếu X1 phân tích thành cơng đến X2 tiếp tục • Nếu số Xi khơng thể phân tích cú pháp, phân tách ban đầu → X1’X2’ Xn’ thử • Các subgoals tiếp tục phân hủy thành subgoals • Nếu số subgoals khơng thể đạt được, phân tích cú pháp trả với mức độ cao phân rã thực • Căn từ trái sang phải với trình đệ quy Một form → Aα sinh vịng lặp vơ hạn phân tích cú pháp Cần phải tránh điều • Một cách kiểm tra hiệu lựa chọn subgoals: chắn chưa xử lý, kí tự tận bên trái khơng thể phân rã thành subgoals Hình 15: Ví dụ phân tích kiểu top-down Phân tích kiểu bottom – up Phân tích cú pháp tồn cấu trúc x • Các quy tắc tính áp dụng "ngược" • Khơng có subgoals: có kết phân tích • phân tích cú pháp từ lên hiệu quả, số lượng lựa chọn sai lớn • Cách thử nghiệm hiệu để lựa chọn quy tắc: phân tích biểu tượng khơng thể phân rã bắt đầu với số biểu tượng phân rã khác Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 19 Tiểu luận môn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hồng Lan • quy tắc sản xuất hình thức A → Aα khơng phải vấn đề • Nếu phân tích cú pháp kết thúc kết thúc chết, phân tích trả cấp độ thấp quy tắc sản xuất thay lựa chọn Hình 16: Ví dụ bottom-up So sánh phương pháp tiếp cận từ lên từ xuống khó khăn Đối với số trường hợp phương pháp từ lên hiệu So sánh chuỗi kí tự Cách đơn giản để nhận chuỗi biểu tượng xây dựng từ điển, bao gồm chuỗi biểu tượng (tất cả) ngôn ngữ Nhận dạng dựa so sánh chuỗi biểu tượng định với chuỗi từ điển Một vấn đề phương pháp thường | L (G) | = ∞ Lựa chọn biện pháp tự nhiên phụ thuộc vào đại diện mơ hình (biểu tượng) tính chất đặc trưng ứng dụng (ý nghĩa cấu nội bộ) Ví dụ.Ký tự viết tay thể chuỗi biểu tượng biểu tượng khác tương ứng với đoạn đường thẳng dài góc độ khác (được gọi chuỗi mã hóa) Nếu biểu tượng chuỗi khác từ biểu tượng tương ứng chuỗi, số phần nhân vật viết góc độ khác nhau; tích biểu tượng thêm cho thấy số phần nhân vật viết lớn nhỏ Hãy xem xét so sánh chuỗi thời gian, mà vấn đề thường phải đối mặt Nếu có biện pháp tương tự (chi phí) điểm hai chuỗi thời gian (ví dụ, khoảng cách Euclide), Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 20 Tiểu luận môn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hồng Lan Dynamic Time Warping thuật tốn (DTW) sử dụng DTW thuật tốn kết nối điểm hai chuỗi thời gian tổng hợp chi phí tất cặp điểm nhỏ tốt • Hãy xét r(i), i = 1, , I, t(j), j = 1, , J thành hai chuỗi thời gian Thường I = J • Xác định điểm lưới hai chiều (i, j) tương ứng để kết nối điểm r (i) t (j) chuỗi thời gian • Kết nối điểm hai chuỗi thời gian biểu cách sử dụng đường dẫn sau đây: (i0, j0), (i1, j1) , (if, jf) Đối với đường, có tồn tổng chi phí K số lượng kết nối (chiều dài đường), d (ik, jk) (d (ik, jk | ik-1, jk-1)) chi phí kết nối điểm r (ik) t (jk) chi phí kết nối trước thực Thuật toán DTW dựa nguyên tắc tối ưu Bellman Ký hiệu đường tối ưu cách • Đi qua đường tối ưu thông qua điểm (i, j) ký hiệu • Theo nguyên tắc tối ưu Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 21 Tiểu luận mơn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hồng Lan Với ⊕ biểu thị nối đường dẫn • Như vậy, đường tối ưu tính đệ quy: (Nếu tổng chi phí sản phẩm chi phí, thay tổng hợp theo sản phẩm.) Thuật tốn DTW sử dụng rộng rãi cơng nhận phát biểu viết tay ký tự Hình 17: ví dụ việc tìm kiếm đệ quy cho đường tối ưu Một biện pháp sử dụng rộng rãi việc so sánh trình tự biểu tượng chỉnh sửa khoảng cách mà dựa thuật tốn DTW • Giả sử mơ hình bao gồm chuỗi biểu tượng • Đo lường giống hai chuỗi biểu tượng A (i), i = 1, , I, B (j), j = 1, , sử dụng số lượng tối thiểu chỉnh sửa operations (thay đổi biểu tượng C, thêm vào tôi, gỡ bỏ R) yêu cầu để làm cho chuỗi nhau: Mô tả j tất hoạt động yêu cầu phải A từ B • Xác định hai chiều lưới điện thời điểm (i, j) tương ứng với biểu tượng A (i) B (j) Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 22 Tiểu luận môn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hồng Lan • Mục tiêu để tìm đường tối ưu từ điểm (0,0) (I, J) • Các chi phí điểm (0,0) D (0,0) = • Các điểm (i, j) đường truy cập từ điểm (i-1, j), (i-1, j-1), (i, j-1) • Các chi phí sau có liên quan với hoạt động sửa: • Bây đường tối ưu đệ quy giải cách sử dụng DTW Một số ví dụ việc sử dụng khoảng cách chỉnh sửa Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 23 Tiểu ḷn mơn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hoàng Lan KẾT LUẬN Qua tiểu luận, nhóm chúng tơi hiểu nhận dạng gì, khái niệm, vấn đề nhận dạng, ngơn ngữ hình thức, cấu trúc văn phạm, phương pháp nhận dạng cấu trúc nhận dạng Trên sở tham khảo giáo trình, hiểu nắm vấn đề nhận dạng cấu trúc văn phạm, chúng tơi có so sánh phương pháp nhận dạng chữ khác phương pháp suy luận, đồ thị, chuỗi ký tự với phương pháp nhận dạng chữ dựa vào cấu trúc Mặc dù cố gắng, điều kiện thời gian khả kiến thức nhiều hạn chế nên chắn không tránh khỏi sai sót khiếm khuyết, tiểu luận mang tính chất mở rộng kiến thức nhận dạng cấu trúc văn phạm chưa mang tính chất chuyên sâu Rất mong nhận góp ý, phê bình, đánh giá PGS.TS bạn lớp để nhóm chúng tơi rút kinh nghiệm hồn thiện tốt hơn, nghiên cứu chuyên sâu thời gian tới Chúng xin gửi lời cảm ơn chân thành đến PGS.TS Nguyễn Thị Hoàng Lan giảng dạy kiến thức, cung cấp tài liệu, định hướng hướng dẫn chúng tơi suốt thời gian qua để nhóm chúng tơi hồn thành tiểu luận Mọi đóng góp phê bình xin gửi về: Hồng Văn Hải, Tổng cục An ninh I – Bộ Công an Địa chỉ: 44 Yết Kiêu, P.Trần Hưng Đạo, Q.Hoàn Kiếm, TP.Hà Nội Điện thoại: 0916.286.256 Email:ithoanghai@gmail.com Nguyễn Văn Dũng Địa chỉ: Điện thoại: 0948.128.086 Email:bk03k50@gmail.com Trần Đình Phương Địa chỉ: Điện thoại: 0166.657.9501 Email:phuongtd1905@gmail.com Hà Nội, ngày 20 tháng 12 năm 2012 Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 24 Tiểu ḷn mơn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hoàng Lan Thay mặt nhóm Hồng Văn Hải TÀI LIỆU THAM KHẢO [1] Slide giáo trình giảng dạy mơn Nhận dạng, PGS-TS Nguyễn Thị Hoàng Lan, ĐHBKHN [2] Pattern recognition: Esa Alhoniemi, Spring 2003 [3] Richard O Duda, Peter E Hart, David G Stork (2001) Pattern classification (2nd edition), Wiley [4] Structural and Syntactic Pattern Recognition Selim Aksoy, Department of Computer Engineering Bilkent University, 2008 Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 25 Tiểu luận mơn học: Nhận dạng GVHD: PGS TS Nguyễn Thị Hồng Lan MỤC LỤC MỞ ĐẦU PHẦN SƠ LƯỢC VỀ NHẬN DẠNG 1.1 Không gian biểu diễn đối tượng, không gian diễn dịch 1.2 Nhận dạng mẫu thống kê nhận dạng cấu trúc .4 PHẦN 2: TÌM HIỂU ỨNG DỤNG PHƯƠNG PHÁP NHẬN DẠNG CẤU TRÚC VĂN PHẠM TRONG NHẬN DẠNG 2.1 Phương thức cấu trúc văn phạm 2.2 Ngơn ngữ hình thức 2.3 Nhận dạng sử dụng cấu trúc văn phạm 10 2.4 Ngơn ngữ mơ tả hình ảnh sử dụng nhận dạng cấu trúc văn phạm 10 10 PHẦN 3: SO SÁNH CHẤT LƯỢNG VÀ HIỆU NĂNG NHẬN DẠNG VỚI PHƯƠNG PHÁP KHÁC ĐỂ NHẬN DẠNG CHỮ 14 3.1 PHƯƠNG PHÁP SUY LUẬN 14 3.2 NHẬN DẠNG DỰA VÀO ĐỒ THỊ 15 3.3 NHẬN DẠNG DỰA TRÊN ĐỐI SÁNH CẤU TRÚC XÂU CHUỖI 17 KẾT LUẬN 24 TÀI LIỆU THAM KHẢO 25 MỤC LỤC 26 Nhóm 13: Hồng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 26 ... lược nhận dạng Phần 2: Tìm hiểu ứng dụng phương pháp nhận dạng cấu trúc văn phạm nhận dạng (nhận dạng chữ, hình học, ảnh nhị phân,…) Phần 3: So sánh chất lượng hiệu với phương pháp khác để nhận dạng. .. PHẦN 3: SO SÁNH CHẤT LƯỢNG VÀ HIỆU NĂNG NHẬN DẠNG VỚI PHƯƠNG PHÁP KHÁC ĐỂ NHẬN DẠNG CHỮ 3.1 Phương pháp suy luận Trong nhiều ứng dụng, ngữ pháp thiết kế tay Một phương pháp khác học ngữ pháp từ... ảnh sử dụng nhận dạng cấu trúc văn phạm 10 10 PHẦN 3: SO SÁNH CHẤT LƯỢNG VÀ HIỆU NĂNG NHẬN DẠNG VỚI PHƯƠNG PHÁP KHÁC ĐỂ NHẬN DẠNG CHỮ 14 3.1 PHƯƠNG PHÁP

Ngày đăng: 07/11/2014, 14:13

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w