Luận văn tốt nghiệp Khoa học máy tính: Tìm hiểu mạng Neural Hamming và ứng dụng trong bài toán nhận dạng các chữ cái Tiếng Việt

20 953 0
  • Loading ...
    Loading ...
    Loading ...

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Tài liệu liên quan

Thông tin tài liệu

Ngày đăng: 11/10/2014, 16:05

Luận văn tốt nghiệp Khoa học máy tính: Tìm hiểu mạng Neural Hamming và ứng dụng trong bài toán nhận dạng các chữ cái Tiếng Việt được chia làm 3 chương chính. Chương 1: Tổng quan về hiện trạng các bài toán nhận dạng và thiết lập bài toán nghiên cứu; Chương 2: Tìm hiểu về mạng Neural và khoảng cách Hamming; Chương 3: Ứng dụng mạng neural Hamming trong bài toán nhận dạng các chữ cái Tiếng Việt. LU N VĂN T T NGHI P CHUYÊN NGÀNH Ậ Ố Ệ KHOA H C MÁY TÍNH Ọ Đ tài: “Tìm hi u ề ể m ng Neural Hamming và ng d ng trong bài toánạ ứ ụ nh n d ng các ch cái Ti ng Vi t”ậ ạ ữ ế ệ Sinh viên: Phùng Văn Ki mệ L p ớ : Cao h c k10bọ Giáo viên h ng d nướ ẫ : TS. Lê Quang Minh PH N M Đ UẦ Ở Ầ T lâu các nhà khoa h c đã nh n th y nh ng u đi m c a b ócừ ọ ậ ấ ữ ư ể ủ ộ con ng i và tìm cách b t ch c đ th c hi n trên nh ng máy tính, t oườ ắ ướ ể ự ệ ữ ạ cho nó có kh năng h c t p, nh n d ng và phân lo i. Vì v y các nhà khoaả ọ ậ ậ ạ ạ ậ h c đã nghiên c u và sáng t o ra m ng Neural nhân t o. Nó th c s đ cọ ứ ạ ạ ạ ự ự ượ chú ý và nhanh chóng tr thành m t h ng nghiên c u đ y tri n v ng đ cở ộ ướ ứ ầ ể ọ ặ bi t là lĩnh v c nh n d ng. Và bài toán nh n d ng ký t là m t bài toánệ ự ậ ạ ậ ạ ự ộ con trong l p các bài toán nh n d ng, x lý nh.ớ ậ ạ ử ả Hi n nay trên th gi i, các s n ph m nh n d ng ký t đã đ cệ ế ớ ả ẩ ậ ạ ự ượ tri n khai t ng đ i r ng rãi. Tuy nhiên đây là các s n ph m nh n d ngể ươ ố ộ ả ẩ ậ ạ ký t ti ng Anh, do đó đ i v i nh n d ng ký t ti ng Vi t thì ch cóự ế ố ớ ậ ạ ự ế ệ ỉ ng i Vi t Nam m i có th phát tri n đ c. n c ta trong m t vài nămườ ệ ớ ể ể ượ Ở ướ ộ g n đây cũng đã có m t s s n ph m nh n d ng ti ng vi t đ c tri nầ ộ ố ả ẩ ậ ạ ế ệ ượ ể khai trên th tr ng. Nh ng các s n ph m này đ c bán trên th tr ngị ườ ư ả ẩ ượ ị ườ d i d ng đóng kín nên vi c đ phát tri n thành ph n m m t đ ng c pướ ạ ệ ể ể ầ ề ự ộ ậ nh t nh là đi u không th . Vì v y nên tôi đã ch n đ tài ậ ả ề ể ậ ọ ề “Tìm hi uể m ng Neural Hamming và ng d ng trong bài toán nh n d ng các chạ ứ ụ ậ ạ ữ cái Ti ng Vi t”ế ệ . H th ng ch cái Ti ng Vi t là đ c xây d ng d a trên ch cáiệ ố ữ ế ệ ượ ự ự ữ Latinh có thêm ch ghép và d u ph . Do đó vi c nh n d ng s g p khóữ ấ ụ ệ ậ ạ ẽ ặ khăn h n so v i ch cái Latinh thông th ng và c n ph i có thu t toán xơ ớ ữ ườ ầ ả ậ ử lý đem l i đ chính xác cao. ạ ộ Trong khuôn kh , th i l ng c a lu n văn, tôi đ a ra m t ch ngổ ờ ượ ủ ậ ư ộ ươ trình mô ph ng m ng Neural nh n d ng 29 ch cái Ti ng Vi t t A đ nỏ ạ ậ ạ ữ ế ệ ừ ế Y và 10 ch s t 0 đ n 9.ữ ố ừ ế Lu n văn đ c s p x p và chia thành 3 ch ng chính:ậ ượ ắ ế ươ . - Ch ng 1: T ng quan v hi n tr ng các bài toán nh n d ng và thi tươ ổ ề ệ ạ ậ ạ ế l p bài toán nghiên c u;ậ ứ - Ch ng 2: Tìm hi u v m ng Neural và kho ng cách Hamming;ươ ể ề ạ ả - Ch ng 3: ng d ng m ng neural Hamming trong bài toán nh n d ngươ Ứ ụ ạ ậ ạ các ch cái Ti ng Vi t.ữ ế ệ Nhân đây, tôi xin chân thành c m n TS. Lê Quang Minh ng i tr c ti pả ơ ườ ự ế h ng d n, ch b o nhi t tình cho tôi hoàn thành lu n văn này. Tôi xinướ ẫ ỉ ả ệ ậ chân thành cám n các th y cô trong Tr ng Đ i h c CNTT & TT Đ iơ ầ ườ ạ ọ ạ h c Thái Nguyên và toàn th các b n đã giúp đ tôi hoàn thành cu n lu nọ ể ạ ỡ ố ậ văn này. CH NG I: T NG QUAN V HI N TR NG CÁC BÀI TOÁNƯƠ Ổ Ề Ệ Ạ NH N D NG VÀ THI T L P BÀI TOÁN NGHIÊN C UẬ Ạ Ế Ậ Ứ 1.1 T ng quan v bài toán nh n d ng.ổ ề ậ ạ Nh n d ng ch là m t lĩnh v c đã đ c quan tâm nghiên c u vàậ ạ ữ ộ ự ượ ứ ng d ng t nhi u năm nay theo hai h ng chính:ứ ụ ừ ề ướ • Nh n d ng ch in: ph c v cho công vi c t đ ng hóa đ c tài li u,ậ ạ ữ ụ ụ ệ ự ộ ọ ệ tăng t c đ và hi u qu nh p thông tin vào máy tính tr c ti p t cácố ộ ệ ả ậ ự ế ừ ngu n tài li u.ồ ệ • Nh n d ng ch vi t tay: v i nh ng m c đ ràng bu c khác nhau vậ ạ ữ ế ớ ữ ứ ộ ộ ề cách vi t ,ki u ch ph c v cho các ng d ng đ c và x lý ch ng t ,ế ể ữ ụ ụ ứ ụ ọ ử ứ ừ hóa đ n, phi u ghi, b n th o vi t tay Nh n d ng ch vi t tay đ c táchơ ế ả ả ế ậ ạ ữ ế ượ thành hai h ng phát tri n: nh n d ng ch vi t tay tr c tuy n (on-line)ướ ể ậ ạ ữ ế ự ế và nh n d ng ch vi t tay ngo i tuy n (off-line).ậ ạ ữ ế ạ ế Đ n th i đi m này, bài toán nh n d ng ch in đã đ c gi i quy tế ờ ể ậ ạ ữ ượ ả ế g n nh tr n v n (s n ph m FineReader 11 c a hãng ABBYY có thầ ư ọ ẹ ả ẩ ủ ể nh n d ng ch in theo 20 ngôn ng khác nhau trong đó có c Vi t Nam,ậ ạ ữ ữ ả ệ ph n m m nh n d ng ch Vi t in VnDOCR 4.0 c a Vi n Công nghầ ề ậ ạ ữ ệ ủ ệ ệ Thông tin Hà N i có th nh n d ng đ c các tài li u ch a hình nh, b ngộ ể ậ ạ ượ ệ ứ ả ả và văn b n ti ng Vi t v i đ chính xác trên 99%, ). Tuy nhiên trên thả ế ệ ớ ộ ế gi i cũng ớ như Vi t Nam, bài toán nh n d ng ch vi t tay v n còn làở ệ ậ ạ ữ ế ẫ v n đ thách th c l n đ i v i các nhà nghiên c u. Bài toàn này ch a thấ ề ứ ớ ố ớ ứ ư ể gi i quy t tr n v n vì nó ph thu c quá nhi u vào ng i vi t và s bi nả ế ọ ẹ ụ ộ ề ườ ế ự ế đ i quá đa d ng trong cách vi t và tr ng thái tinh th n c a t ng ng iổ ạ ế ạ ầ ủ ừ ườ vi t. Đ c bi t đ i v i vi c nghiên c u nh n d ng ch vi t tay ti ng Vi tế ặ ệ ố ớ ệ ứ ậ ạ ữ ế ế ệ l i càng g p nhi u ạ ặ ề khó khăn h n do b ký t ti ng Vi t có thêm ph nơ ộ ự ế ệ ầ d u, r t d nh m l n v i các nhi u.ấ ấ ễ ầ ẫ ớ ễ 1.2. C th v bài toán nh n d ng ch cái Ti ng Vi t.ụ ể ề ậ ạ ữ ế ệ Hi n nay cũng có r t nhi u bài báo đ c p đ n bài toán nh n d ngệ ấ ề ề ậ ế ậ ạ kí t quang h c, nh m c i ti n các ph ng pháp phân đo n nh, nh nự ọ ằ ả ế ươ ạ ả ậ d ng. Song v n ch a gi i quy t m t cách tri t đ nh ng v n đ khó khănạ ẫ ư ả ế ộ ệ ể ữ ấ ề c a bài toán th ng g p ph i. Đ c bi t là đ i v i vi c nh n d ng các kíủ ườ ặ ả ặ ệ ố ớ ệ ậ ạ t ti ng Vi t, g p r t nhi u khó khăn, do tính riêng bi t c a ti ng Vi t:ự ế ệ ặ ấ ề ệ ủ ế ệ S kí t nhi u, các kí t l i có d u…Nên bài toán v n còn thu hút đ cố ự ề ự ạ ấ ẫ ượ s quan tâm, nghiên c u nh m gi i quy t nh ng v n đ khó khăn c a bàiự ứ ằ ả ế ữ ấ ề ủ toán m t cách tri t đ . M t s h nh n nh n d ng văn b n đã và đangộ ệ ể ộ ố ệ ậ ậ ạ ả đ c áp d ng r t nhi u vào ng d ng nh FineReader c a hãngượ ụ ấ ề ứ ụ ư ủ AABBYY, OmmiPage c a hãng Scansoft đ c dùng đ nh n d ng cácủ ượ ể ậ ạ văn b n ti ng Anh,… VNDOCR c a Vi n công ngh thông tin cho cácả ế ủ ệ ệ văn b n ti ng Vi tả ế ệ Nhìn chung, các s n ph m ph n m m nh n d ng văn b n Ti ngả ẩ ầ ề ậ ạ ả ế Vi t ch in c a n c ta đã thu đ c k t qu kh quan, đ c bi t ph nệ ữ ủ ướ ượ ế ả ả ặ ệ ầ m m VNDOCR đã đ c s d ng r ng rãi trong các c quan nhà n c.ề ượ ử ụ ộ ơ ướ Riêng ph n nh n d ng kí t vi t tay v n đang đ c nghiên c u và phátầ ậ ạ ự ế ẫ ượ ứ tri n nh m ph c v cho các yêu c u khác nhau nh đ c và x lý các bi uể ằ ụ ụ ầ ư ọ ử ể m u: hóa đ n, phi u đi u tra ẫ ơ ế ề Khó khăn l n nh t khi nghiên c u bài toán nh n d ng ch cáiớ ấ ứ ậ ạ ữ ti ng Vi t là s bi n thiên quá đa d ng trong cách vi t c a t ngế ệ ự ế ạ ế ủ ừ ng i. Cùng m t ng i vi t nh ng đôi khi cũng có nhi u s khácườ ộ ườ ế ư ề ự bi t trong cách vi t tuỳ thu c vào t ng ng c nh, ki u vi t c a m tệ ế ộ ừ ữ ả ể ế ủ ộ ng i cũng có th thay đ i theo th i gian ho c theo thói quen Đi uườ ể ổ ờ ặ ề này gây ra nhi u tr ng i trong vi c nh n d ng cũng nh l a ch nề ở ạ ệ ậ ạ ư ự ọ mô hình nh n d ng.ậ ạ 1.3. Thi t l p bài toán.ế ậ Đ tài mà tôi th c hi n là: “ ng d ng m ng Neural Hamming trong bàiề ự ệ Ứ ụ ạ toán nh n d ng các ch cái Ti ng Vi t”, công vi c chính là “Xây d ngậ ạ ữ ế ệ ệ ự ch ng trình nh n d ng các ch cái Ti ng Vi t” ý t ng bài toán nhươ ậ ạ ữ ế ệ ưở ư sau:  Phân tích nh cho ký t : Chia nh và tách ký t theo t ng vùng gi iả ự ả ự ừ ớ h n;ạ  Chuy n đ i kí t sang ma tr n đi m nh;ể ổ ự ậ ể ả  Chuy n thành ma tr n tuy n tính và đ a vào m ng neural;ể ậ ế ư ạ  Đ a vào m ng neural tính giá tr đ u ra.ư ạ ị ầ Các b c gi i quy t bài toán s d ng m ng neural Hamming nh nướ ả ế ử ụ ạ ậ d ng ch cái Ti ng Vi t mô t theo ti n trình chung nh sau:ạ ữ ế ệ ả ế ư nh đ u vàoẢ ầ Ti n x lýề ử Quá trình bi n đ i nhế ổ ả Nh n d ngậ ạ K t quế ả Hình 1. S đ h th ng nh n d ngơ ồ ệ ố ậ ạ 1.3.1. nh đ u vàoẢ ầ V i đ u vào là các file nh *ớ ầ ả .bmp có kích c nh là 150 x 150. Sauỡ ả khi đã n p m u c n nh n d ng ta ti n nh các thao tác x lý nh đ táchạ ẫ ầ ậ ạ ế ả ử ả ể ra ký t . Ta có th xác đ nh đ c ký t d a vào đ ng biên c a ký t .ự ể ị ượ ự ự ườ ủ ự Tr i qua các b c ti n x lý nh: l c m n nh, nh phân, ch nh nghiêng,ả ươ ề ử ả ọ ị ả ị ỉ chu n kích th c, l p kho ng tr ng, l y biên, ta thu đ c nh ký t v iẩ ướ ấ ả ố ấ ượ ả ự ớ biên c a nó.ủ 1.3.2. Ti n s lýề ử Giai đo n này góp ph n làm tăng đ chính xác phân l p c a hạ ầ ộ ớ ủ ệ th ng nh n d ng, tuy nhiên nó cũng làm cho t c đ nh n d ng c a hố ậ ạ ố ộ ậ ạ ủ ệ th ng ch m l i. Vì v y, tùy thu c vào ch t l ng nh quét vào c a t ngố ậ ạ ậ ộ ấ ượ ả ủ ừ văn b n c th đ ch n m t ho c m t vài ch c năng trong kh i này. N uả ụ ể ể ọ ộ ặ ộ ứ ố ế c n u tiên t c đ x lý và ch t l ng c a máy quét t t thì có th b quaầ ư ố ộ ử ấ ượ ủ ố ể ỏ giai đo n này. Kh i ti n x lý bao g m m t s ch c năng:ạ ố ề ử ồ ộ ố ứ Nh phân hóa nh, l c nhi u, chu n hóa kích th c nh, làm tr nị ả ọ ễ ẩ ướ ả ơ biên ch , làm đ y ch , làm m nh ch và xoay văn b n.ữ ầ ữ ả ữ ả 1.3.2.1. Nh phân hóa nhị ả Nh phân hóa nh là m t k thu t chuy n nh đa c p xámị ả ộ ỹ ậ ể ả ấ sang nh nh phân. Trong b t kỳ bài toán phân tích ho c nâng caoả ị ấ ặ ch t l ng nh nào, nó cũng c n thi t đ xác đ nh các đ i t ngấ ượ ả ầ ế ể ị ố ượ quan tr ng. Nh phân hóa nh phân chia nh thành 2 ph n: ph nọ ị ả ả ầ ầ n n và ph n ch . H u h t các ph ng pháp nh phân hóa nhề ầ ữ ầ ế ươ ị ả hi n nay đ u l a ch n m t ng ng thích h p theo c ng đ sángệ ề ự ọ ộ ưỡ ợ ườ ộ c a nh và sau đó chuy n t t c các giá tr đ sáng l n h nủ ả ể ấ ả ị ộ ớ ơ ng ng đó thành m t giá tr đ sáng (ví d “tr ng”) và t t c cácưỡ ộ ị ộ ụ ắ ấ ả giá tr bé h n ng ng thành m t giá tr đ sáng khác (“đen”).ị ơ ưỡ ộ ị ộ Hình 1.2. Nh phân hóa nh.ị ả 1.3.2.2. L c nhi uọ ễ Nhi u là m t t p các đi m sáng th a trên nh. Kh nhi u là m tễ ộ ậ ể ừ ả ử ễ ộ v n đ th ng g p trong nh n d ng, nhi u có nhi u lo i (nhi u đ m,ấ ề ườ ặ ậ ạ ễ ề ạ ễ ố nhi u v t, nhi u đ t nét ). Đ kh các nhi u đ m (các nhi u v i kíchễ ệ ễ ứ ể ử ễ ố ễ ớ th c nh ), có th s d ng các ph ng pháp l c (l c trung bình, l c trungướ ỏ ể ử ụ ươ ọ ọ ọ v )- Tuy nhiên, v i các nhi u v t (ho c các nhi u có kích th c l n) thìị ớ ễ ệ ặ ễ ướ ớ các ph ng pháp l c t ra kém hi u qu , trong tr ng h p này s d ngươ ọ ỏ ệ ả ườ ọ ử ự ph ng pháp ươ kh các vùng liên thông nh t ra có hi u qu h n.ử ỏ ỏ ệ ả ơ Hình 1.3. Nhi u đ m và nhi u v t.ễ ố ễ ệ 1.3.2.3. Chu n hóa kích th c nhẩ ướ ả Hình 1.4.Chu n hóa kích th c nh các ký t “A” và “P”.ẩ ướ ả ự Vi c chu n hóa kích th c nh d a trên vi c xác đ nh tr ng tâmệ ẩ ướ ả ự ệ ị ọ nh, sau đó xác đ nh kho ng cách l n nh t t tâm nh đ n các c nhả ị ả ớ ấ ừ ả ế ạ trên, d i, trái, ph i c a hình ch nh t bao quanh nh. Thông quaướ ả ủ ữ ậ ả kho ng cách l n nh t đó, có th xác đ nh đ c m t t l co, giãn c aả ớ ấ ể ị ượ ộ ỷ ệ ủ nh g c so v i kích th c đã xác đ nh, t đó hi u ch nh kích th c nhả ố ớ ướ ị ừ ệ ỉ ướ ả theo t l co, giãn này. Nh v y, thu t toán chu n hóa kích th c nhỷ ệ ư ậ ậ ẩ ướ ả luôn luôn đ m b o đ c tính cân b ng khi co giãn nh, nh s không bả ả ượ ằ ả ả ẽ ị bi n d ng ho c b l ch.ế ạ ặ ị ệ 1.3.2.4 Làm tr n biên chơ ữ Đôi khi do ch t l ng quét nh quá x u, các đ ng biên c a chấ ượ ả ấ ườ ủ ữ không còn gi đ c dáng đi u tr n tru ban đ u mà hình thành cácữ ượ ệ ơ ầ đ ng răng c a gi t o. Trong các tr ng h p này, ph i dùng các thu tườ ư ả ạ ườ ọ ả ậ toán làm tr n biên đ kh c ph c [28].ơ ể ắ ụ (a) (b) Hình 1.5.(a) nh g c, (b) nh sau khi đ c làm tr n biên.Ả ố Ả ượ ơ 1.3.2.5. Làm đ y chầ ữ Ch c năng này đ c áp d ng v i các ký t b đ t nét m t cáchứ ượ ụ ớ ự ị ứ ộ ng u nhiên. nh đ t nét gây khó khăn cho vi c tách ch , d b nh m haiẫ Ả ứ ệ ữ ễ ị ầ ph n liên thông c a ký t thành hai ký t riêng bi t, t o nên sai l mầ ủ ự ự ệ ạ ầ trong quá trình nh n d ng.ậ ạ 1.3.2.6. Làm m nh chả ữ Đây là m t b c quan tr ng nh m phát hi n khung x ng c a kýộ ướ ọ ằ ệ ươ ủ t b ng cách lo i b d n các đi m biên ngoài c a các nét. Tuy nhiên,ự ằ ạ ỏ ầ ể ủ quá trình làm m nh ch r t nh y c m v i vi c ả ữ ấ ạ ả ớ ệ kh nhi u. Hi n nay cóử ễ ệ nhi u ph ng pháp làm m nh ch , các thu t toán tìm x ng có thề ươ ả ữ ậ ươ ể tham kh o [28].ả ở Hình 1.4 . Làm m nh chả ữ 1.3.2.7. Đi u ch nh đ nghiêng c a văn b nề ỉ ộ ủ ả Do trang tài li u quét vào không c n th n ho c do s c in n, cácệ ẩ ậ ặ ự ố ấ hàng ch b l ch so v i l chu n m t góc α, đi u này gây khó khăn choữ ị ệ ớ ề ẩ ộ ề công đo n tách ch , đôi khi không th tách đ c. Trong nh ng tr ngạ ữ ể ượ ữ ườ h p nh v y, ph i tính l i t a đ đi m nh c a các ch b sai l ch. Cóợ ư ậ ả ạ ọ ộ ể ả ủ ữ ị ệ nhi u k thu t đ đi u ch nh đ nghiêng, k thu t ph bi n nh t d aề ỹ ậ ể ề ỉ ộ ỹ ậ ổ ế ấ ự trên c s bi u đ chi u (projection profile) c a nh tài li u; m t s kơ ở ể ồ ế ủ ả ệ ộ ố ỹ thu t d a trên c s các phép bi n đ i Hough và Fourier, m t s kậ ự ơ ở ế ổ ộ ố ỹ thu t hi u ch nh đ nghiêng khác có th tìm th y trong [28].ậ ệ ỉ ộ ể ấ [...]... của bài toán được xây dựng trong luận văn Từ những thiết lập bài toán ở trên để giải quyết bài toán nhận dạng chữ với những ưu điểm đơn giản về thuật toán nhưng rất hiệu qủa, cùng với những thành công trong các ứng dụng thực tiễn Tôi chọn phương pháp nhận dạng chữ sử dụng mạng nơ ron nhân tạo làm định hướng tập trung nghiên cứu của luận án CHƯƠNG II: TÌM HIỂU MẠNG NEURAL VÀ MẠNG HAMMING 2.1 Mạng neural. .. tính toán rất lớn nên việc sử dựng các đặc trưng Karhunent-Loeve trong các bài toán nhận dạng chữ không được phổ biến rộng rãi Tuy nhiên, để tăng tốc độ tính toán cho các máy phân lớp, các đặc trưng này trở nên thiết thực hơn cho các hệ nhận dạng chữ trong những năm gần đây 1.3.4 Nhận dạng Có nhiều phương pháp nhận dạng mẫu khác nhau được áp dụng rộng rãi trong các hệ thống nhận dạng chữ viết tay Các. .. truyền ngược Trong các hệ thống nhận dạng chữ, các mạng nơ ron sử dụng phổ biến nhất là mạng perceptron đa lớp thuộc nhóm mạng truyền thẳng và mạng SOM (Self Origanizing Map) của Kohonen thuộc nhóm mạng lan truyền ngược Mạng perceptron đa lớp được đề xuất bởi Rosenblatt [64] được nhiều tác giả sử dụng trong các hệ nhận dạng chữ viết tay [65,66] Hầu hết các nghiên cứu phát triển nhận dạng chữ viết tay... ảnh cần nhận dạng được thu gọn với kích cỡ là 60x30 và đến quá trình ánh xạ giá tr ị pixel ảnh vào Bước quan trọng cuối cùng đó là nhận dạng và cho ra kết quả 1.4 Kết luận Nội dung của chương 1 là trình bày về các bài toán nhận dạng nói chung và nhận dạng chữ nói riêng trên thế giới cũng như ở Vi ệt Nam: Những ứng dụng đã được áp dụng trong thực tế; một số kết quả được coi là thành công nhất Và thiết... trung vào mạng SOM [67] SOM kết hợp trích ch ọn đặc trưng và nhận dạng trên một tập lớn các ký tự huấn luy ện Mạng này ch ứng t ỏ rằng nó tương đương với thuật toán phân cụm k-means Với thuật toán đơn giản nhưng rất hiệu quả, cùng với thành công của mô hình này trong các ứng dụng thực tiễn, mạng nơ ron hi ện đang là một trong các hướng nghiên cứu của lĩnh vực học máy Mạng nơ ron tỏ ra phù hợp với các bài. .. điểm chạc cuối Cuối cùng là xây dựng cây tìm kiếm, dựa vào đặc trưng về cấu trúc xương và cấu trúc biên để phân tập mẫu học thành các lớp Quá trình tìm kiếm để phân lớp được tiến hành qua hai bước: Xác định lớp tương ứng với mẫu vào và tìm kiếm trong lớp đó mẫu nào gần giống với mẫu vào nhất [62,63] Các phương pháp cấu trúc áp dụng cho các bài toán nhận dạng chữ được phát triển theo hai hướng sau: 1.3.4.2.1... 1960, các nhà nghiên cứu bắt đầu xét các luật của ngôn ngữ học để phân tích tiếng nói và chữ viết Sau đó, các luật đa dạng của chính tả, từ vựng và ngôn ngữ học đã được áp dụng cho các chiến lược nhận dạng Các phương pháp ngữ pháp khởi tạo một số luật sinh để hình thành các ký tự từ một tập các công th ức ng ữ pháp nguyên thủy Các luật sinh này có thể kết nối bất kỳ ki ểu đặc tr ưng thống kê và đặc... được thành lập trong giai đoạn huấn luyện để mô tả các nét, các ký tự hoặc các t ừ Giai đoạn nhận dạng gán một đồ thị chưa biết vào một trong các lớp bằng cách sử dụng một độ đo để so sánh các đặc điểm giống nhau giữa các đồ thị Có rất nhiều hướng tiếp cận khác nhau sử dụng phương pháp đồ thị, tiêu biểu là hướng tiếp cận đồ thị phân cấp được dùng trong việc nhận dạng chữ viết tay Trung Quốc và Hàn Quốc... trên các hệ chữ cái tiếng La tinh, Hy Lạp, Trung Quốc, Việt Nam tuy nhiên các k ết qu ả đ ạt đ ược cũng còn nhiều hạn chế [88,89,5.2,5.4] SVM được áp dụng rộng rãi trong các lĩnh khai phá dữ liệu và thị giác máy tính SVM gốc được thiết kế để giải bài toán phân lớp nh ị phân, ý tưởng chính của phương pháp này là tìm một siêu phẳng phân cách sao cho khoảng cách lề giữa hai lớp đạt cực đại Kho ảng cách... khác M ột mạng nơ ron chứa nhiều nút, đầu ra của một nút được s ử dụng cho một nút khác ở trong mạng và hàm quyết định cuối cùng phụ thuộc vào sự tương tác phức tạp giữa các nút Mặc dù nguyên lý khác nhau, nhưng hầu hết các kiến trúc mạng nơ ron đều tương đương với các phương pháp nhận dạng mẫu thống kê [26,27] Các kiến trúc mạng nơ ron có thể được phân thành hai nhóm chính: mạng truyền thẳng và mạng lan . Hy L p, Trung Qu c, Vi t Nam tuy nhiên các k t qu đ t đ cạ ố ệ ế ả ạ ượ cũng còn nhi u h n ch [88 ,89 ,5.2,5.4].ề ạ ế SVM đ c áp d ng r ng rãi trong các lĩnh khai phá d li u và thượ ụ ộ ữ ệ ị giác. cóử ễ ệ nhi u ph ng pháp làm m nh ch , các thu t toán tìm x ng có thề ươ ả ữ ậ ươ ể tham kh o [ 28] .ả ở Hình 1.4 . Làm m nh chả ữ 1.3.2.7. Đi u ch nh đ nghiêng c a văn b nề ỉ ộ ủ ả Do trang tài. Hough và Fourier, m t s kậ ự ơ ở ế ổ ộ ố ỹ thu t hi u ch nh đ nghiêng khác có th tìm th y trong [ 28] .ậ ệ ỉ ộ ể ấ Hình 1.7.Hi u ch nh đ nghiêng c a văn b n.ệ ỉ ộ ủ ả Quá
- Xem thêm -

Xem thêm: Luận văn tốt nghiệp Khoa học máy tính: Tìm hiểu mạng Neural Hamming và ứng dụng trong bài toán nhận dạng các chữ cái Tiếng Việt, Luận văn tốt nghiệp Khoa học máy tính: Tìm hiểu mạng Neural Hamming và ứng dụng trong bài toán nhận dạng các chữ cái Tiếng Việt, Luận văn tốt nghiệp Khoa học máy tính: Tìm hiểu mạng Neural Hamming và ứng dụng trong bài toán nhận dạng các chữ cái Tiếng Việt

Từ khóa liên quan