1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu phương pháp nhận dạng chữ quang học và ứng dụng nhận dạng thẻ bảo hiểm y tế

86 17 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 86
Dung lượng 6,58 MB

Nội dung

ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC SƢ PHẠM NGÔ TẤN LÂM NGHIÊN CỨU PHƢƠNG PHÁP NHẬN DẠNG CHỮ QUANG HỌC VÀ ỨNG DỤNG NHẬN DẠNG THẺ BẢO HIỂM Y TẾ LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Đà Nẵng, Năm 2017 ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC SƢ PHẠM NGÔ TẤN LÂM NGHIÊN CỨU PHƢƠNG PHÁP NHẬN DẠNG CHỮ QUANG HỌC VÀ ỨNG DỤNG NHẬN DẠNG THẺ BẢO HIỂM Y TẾ Chuyên ngành: Hệ thống thông tin Mã số: 61.49.01.04 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Ngƣời hƣớng dẫn khoa học: TS PHẠM ANH PHƢƠNG Đà Nẵng, Năm 2017 ii MỤC LỤC DANH MỤC CÁC TỪ VIẾT TẮT v DANH MỤC HÌNH VẼ vi MỞ ĐẦU 1 TÍNH CẤP THIẾT CỦA ĐỀ TÀI MỤC TIÊU ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU PHƢƠNG PHÁP NGHIÊN CỨU KẾT QUẢ DỰ KIẾN BỐ CỤC LUẬN VĂN CHƢƠNG TỔNG QUAN VỀ NHẬN DẠNG CHỮ QUANG HỌC 1.1 GIỚI THIỆU CHUNG 1.2 MƠ HÌNH NHẬN DẠNG CHỮ TỔNG QUÁT 1.2.1 Tiền xử lý 1.2.2 Khối tách chữ 1.2.3 Trích chọn đặc trƣng 1.2.4 Huấn luyện nhận dạng 10 1.2.5 Hậu xử lý 10 1.3 CÁC KHÁI NIỆM CƠ BẢN VÀ MỘT SỐ KỸ THUẬT XỬ LÝ ẢNH TRONG NHẬN DẠNG 11 1.3.1 Các khái niệm 11 1.3.2 Một số kỹ thuật xử lý ảnh 13 1.3.3 Một số kỹ thuật cải thiện ảnh nhị phân 20 1.3.4 Phép biến đổi Hough 22 1.4 CÁC PHƢƠNG PHÁP NHẬN DẠNG 26 1.4.1 Đối sánh mẫu 26 1.4.2 Phƣơng pháp tiếp cận cấu trúc 27 1.4.3 Các phƣơng pháp thống kê 29 1.4.4 Máy véc tơ hỗ trợ (SVM) 29 iii 1.4.5 Mạng nơ-ron nhân tạo (ANN) 30 1.5 KẾT CHƯƠNG 31 CHƯƠNG MẠNG NƠ-RON NHÂN TẠO 32 2.1 GIỚI THIỆU MẠNG NƠ-RON 32 2.1.1 Khái niệm 32 2.1.2 Mơ hình mạng nơ-ron nhân tạo 35 2.1.3 Khả ứng dụng mạng nơ-ron nhân tạo 38 2.2 MẠNG TRUYỀN THẲNG MỘT LỚP 40 2.2.1 Mạng perceptron lớp 40 2.2.2 Quá trình học mạng truyền thẳng lớp 41 2.3 MẠNG TRUYỀN THẲNG NHIỀU LỚP 42 2.3.1 Mạng perceptron nhiều lớp 42 2.3.2 Thuật toán học theo phương pháp lan truyền ngược sai số 42 2.3.3 Huấn luyện mạng theo thuật toán lan truyền ngược 43 2.3.4 Một số vấn đề sử dụng mạng MLP 45 2.4 KẾT CHƯƠNG 47 CHƯƠNG ỨNG DỤNG NHẬN DẠNG THẺ BHYT 48 3.1 BÀI TOÁN NHẬN DẠNG THẺ BẢO HIỂM Y TẾ 48 3.2 CƠ SỞ DỮ LIỆU THỰC NGHIỆM 49 3.3 MƠ HÌNH NHẬN DẠNG THẺ BHYT 50 3.3.1 Thẻ BHYT 50 3.3.2 Tiền xử lý 55 3.3.4 Tách ký tự ảnh mã thẻ 58 3.3.5 Huấn luyện nhận dạng ký tự 59 3.3.6 Hậu xử lý 61 3.4 MÔI TRƯỜNG CÀI ĐẶT 61 3.5 GIAO DIỆN CHƯƠNG TRÌNH 61 3.5.1 Giao diện chương trình 61 3.5.2 Các chức chương trình 62 iv 3.6 KẾT CHƢƠNG 65 KẾT LUẬN 66 TÀI LIỆU THAM KHẢO 68 QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN (Bản sao) v DANH MỤC CÁC TỪ VIẾT TẮT Từ viết tắt Thuật ngữ ANN Artificial Neural Network BHYT Bảo hiểm y tế CGA Color Graphic Adaptor k-NN k-láng giềng gần HMM Hidden Markov Model – mơ hình Markov ẩn MLP Multilayer Perceptron OCR Optical Character Recognition SVM Support Vector Machine VGA Video Graphic Array vi DANH MỤC HÌNH VẼ Số hiệu Tên hình hình Trang 1.1 Sơ đồ tổng quát hệ thống nhận dạng chữ 1.2 Nhị phân hóa ảnh 1.3 Nhiễu đốm nhiễu vệt 1.4 Chuẩn hóa kích thƣớc ảnh 1.5 Hiệu chỉnh độ nghiêng ảnh văn 1.6 Lƣợc đồ xám ảnh 14 1.7 Giãn độ tƣơng phản 15 1.8 Tách nhiễu phân ngƣỡng 16 1.9 Lọc trung bình ảnh nhị phân 18 1.10 Ảnh sau áp dụng lần lƣợt hai kỹ thuật “Giãn” “Co” 21 2.1 Cấu tạo tế bào nơ-ron sinh học 33 2.2 Mơ hình nơ-ron nhân tạo 34 2.3 Mạng nơ-ron nhân tạo có nút có phản hồi 36 2.4 Mạng nơ-ron truyền thẳng lớp 37 2.5 Mạng nơ-ron truyền thẳng nhiều lớp 37 2.6 Lan truyền tín hiệu theo phƣơng pháp lan truyền ngƣợc 43 2.7 Hàm sigmoid g ( x)  1/ (1  e x ) 45 3.1 Một số mẫu ký tự 49 3.2 Mẫu thẻ BHYT dùng để kiểm thử 49 3.3 Mơ hình nhận dạng thẻ BHYT 50 3.4 Thẻ bảo hiểm y tế 50 3.5 Ảnh trƣớc quay 56 3.6 Ảnh sau quay 56 vii Số hiệu Tên hình hình Trang 3.7 Ảnh trƣớc phân ngƣỡng 58 3.8 Ảnh sau phân ngƣỡng 58 3.9 Tách ký tự ảnh mã thẻ 59 3.10 Giao diện chƣơng trình 62 3.11 Chọn ảnh thẻ BHYT 62 3.12 Cắt mã thẻ BHYT 63 3.13 Kết cắt mã thẻ BHYT 63 3.14 Huấn luyện dựa mạng nơ-ron lớp perceptron 64 3.15 Kết nhận dạng thẻ BHYT 65 MỞ ĐẦU TÍNH CẤP THIẾT CỦA ĐỀ TÀI Trong thời đại nay, với phát triển mạnh mẽ công nghệ thông tin, toán nhận dạng lĩnh vực đƣợc quan tâm phát triển Bài tốn nhận dạng đóng vai trò quan trọng nhiều ứng dụng thực tế nhƣ: giám sát an ninh, giao thông, nhận dạng y học, nhận dạng đối tƣợng, nhận dạng khuôn mặt, nhận dạng chữ, nhận dạng tiếng nói, phát chuyển động, theo dõi chuyển động,… Cùng với thúc đẩy q trình tin học hóa lĩnh vực y tế, đầu tháng năm 2016, Bảo hiểm xã hội Việt Nam triển khai việc cấp phát thẻ BHYT theo cấu trúc mã thẻ có mã vạch chiều cho tất đối tƣợng tham gia BHYT dựa quy định Quyết định số 1351/QĐ-BHXH ngày 16 tháng 11 năm 2015 Bảo hiểm xã hội Việt Nam việc ban hành mã số ghi thẻ bảo hiểm y tế; việc sử dụng thẻ BHYT mã vạch chiều mang lại nhiều tiện ích cho sở khám chữa bệnh ngƣời dân tham gia BHYT khám chữa bệnh, đảm bảo xác thơng tin việc cấp phát thẻ BHYT cho bệnh nhân Tuy nhiên trình triển khai cịn gặp nhiều khó khăn nhƣ: việc đầu tƣ sở vật chất chƣa đồng bộ, cần có lộ trình kinh phí, trình độ tin học, công nghệ thông tin nhân viên sở khám chữa bệnh chƣa theo kịp đà phát triển cơng nghệ…, vấn đề khó khăn số thẻ phát hành bị mờ, mực in bị bong tróc, khơng rõ thơng tin, máy khơng đọc đƣợc mã vạch…gây khó khăn cho ngƣời dân lẫn sở khám chữa bệnh, nhiều ngƣời xa đến, không khám bảo hiểm đƣợc phải tự chi trả phải quay xin cấp lại thẻ, thời gian, khó khăn tốn cho ngƣời bệnh Xuất phát từ thực tiễn trên, Tôi ứng dụng sức mạnh công nghệ thông tin lĩnh vực máy học để thực đề tài “Nghiên cứu phƣơng pháp nhận dạng chữ quang học Ứng dụng nhận dạng thẻ bảo hiểm y tế” Nhận dạng thẻ BHYT chƣơng trình hỗ trợ việc quản lý BHYT, từ kết nhận dạng mã số thẻ BHYT giúp ngƣời quản lý tìm kiếm, trích xuất đƣợc thông tin 63 3.5.2.2 Cắt mã thẻ Khi ảnh đƣợc xử lý chức “Chọn ảnh thẻ” ta tiến hành cắt mã thẻ nhƣ hình 3.12 Hình 3.12 Cắt mã thẻ BHYT Việc cắt mã thẻ dựa phép chiếu trục Ox, Oy, ta nhận đƣợc khung hình chữ nhật chứa ký tự mã thẻ Tiếp tục loại bỏ phần cạnh hình chữ nhật bao quanh mã thẻ sau ta tiến hành tách ký tự dựa mật độ phân bổ điểm đen ảnh kết nhƣ hình 3.13 Hình 3.13 Kết cắt mã thẻ BHYT 64 3.5.2.3 Huấn luyện Áp dụng mơ hình mạng nơ-ron lớp perceptron để thực việc huấn luyện (hình 3.14) dựa tập sở liệu thực nghiệm gồm 28 ký tự có 18 ký tự chữ từ A đến Y 10 chữ số từ đến Sau huấn luyện tạo ma trận trọng số Wij để phục vụ cho phần nhận dạng Hình 3.14 Huấn luyện dựa mạng nơ-ron lớp perceptron 3.5.2.4 Nhận dạng ký tự tách Sau trình huấn luyện kết thúc, ta tiến hành nhận dạng ký tự tách đƣợc dựa ma trận trọng số Wij liên kết, kết hợp với đặc trƣng ảnh đầu vào ngƣỡng θ Kết nhận dạng đƣợc hiển thị textbox “Mã thẻ BHYT nhận dạng đƣợc” nhƣ hình 3.15 65 Hình 3.15.Kết nhận dạng thẻ BHYT 3.6 KẾT CHƢƠNG Với thuật toán đơn giản nhƣng hiệu quả, mạng nơ-ron perceptron lớp truyền thẳng giải đƣợc toán nhận dạng thẻ BHYT thông qua việc huấn luyện kiểm thử tập liệu gồm 28 ký tự ảnh 200 ảnh thẻ BHYT đạt đƣợc với tỷ lệ xác cao (176/200, tỷ lệ 88%) Mạng nơ-ron tỏ phù hợp với toán phân lớp, phân loại mẫu, dự báo, điều khiển tối ƣu hố,…trong phƣơng pháp truyền thống khơng đủ khả giải vấn đề nêu cách hiệu Đặc biệt hệ thống nhận dạng sử dụng mạng nơ-ron nhân tạo đạt đƣợc tỉ lệ nhận dạng xác, so sánh với phƣơng pháp nhận dạng cấu trúc, thống kê, phƣơng pháp k-NN, 66 KẾT LUẬN Các kết luận văn Luận văn nghiên cứu tổng quan hệ thống nhận dạng chữ quang học, bao gồm bƣớc quan trọng nhƣ: tiền xử lý, tách chữ, huấn luyện nhận dạng, hậu xử lý Bên cạnh đó, luận văn giới thiệu tổng quan số phƣơng pháp nhận dạng thƣờng dùng hệ thống nhận dạng chữ quang học đƣợc nhà nghiên cứu quan tâm nhƣ: mơ hình nhận dạng theo cấu trúc, nhận dạng dựa vào đối sánh mẫu, mạng nơ-ron nhân tạo, phƣơng pháp máy vec-tơ hỗ trợ (SVM), … Trong phƣơng pháp nhận dạng mạng nơ-ron nhân tạo đƣợc đánh giá phƣơng pháp có độ xác cao, với thuật toán xử lý hiệu lĩnh vực nhận dạng Tuy nhiên, hạn chế mặt thời gian nên luận văn nghiên cứu thuật toán xử lý ảnh áp dụng việc nhận dạng ký tự nhƣ: khử nhiễu, phép quay ảnh, phân ngƣỡng,…và sử dụng mạng Perceptron lớp truyền thẳng giải toán Luận văn đạt đƣợc số kết sau: - Mạng Perceptron lớp truyền thẳng giải đƣợc toán nhận dạng thẻ BHYT thơng qua q trình kiểm thử tập liệu gồm 200 ảnh thẻ BHYT với nhiều góc nghiêng ngẫu nhiên, với tỷ lệ nhận dạng đúng: 176/200 đạt tỷ lệ 88% - Hiểu nắm bắt đƣợc quy trình hệ thống nhận dạng - Nghiên cứu số phƣơng pháp nhận dạng áp dụng việc nhận dạng thẻ BHYT - Tìm hiểu cài đặt thuật tốn xử lý ảnh, sở giải đƣợc vấn đề nâng cao chất lƣợng ảnh - Triển khai xây dựng, cài đặt đƣợc ứng dụng nhận dạng thẻ BHYT Hạn chế luận văn Với kết đạt đƣợc, luận văn gặp phải số hạn chế chƣa giải đƣợc, cụ thể nhƣ sau: 67 - Cơ sở liệu mẫu hạn chế nên chƣa xem xét hết trƣờng hợp ký tự cần nhận dạng, gặp nhiều hạn chế việc kiểm nghiệm hiệu phƣơng pháp nhận dạng - Chƣa đề xuất phƣơng pháp trích chọn đặc trƣng hiệu cho toán nhận dạng - Ảnh liệu đầu vào cịn giới hạn góc nghiêng ảnh thẻ BHYT Ảnh mẫu dùng để kiểm tra phải có độ phân giải tốt Hƣớng phát triển Từ kết đạt đƣợc vấn đề tồn tại, Tôi xin đề xuất số hƣớng phát triển tƣơng lai: - Mở rộng sở liệu ảnh hệ thống để có đánh giá xác kết thực nghiệm tƣơng lai - Nâng cao hiệu hệ thống để xử lý tốt với trƣờng hợp góc nghiêng quét thẻ BHYT Nhận dạng tốt với trƣờng hợp ảnh có độ phân giải thấp, ảnh cũ, ảnh bị mờ, … - Tiếp tục tìm hiểu tiếp cận phƣơng pháp áp dụng việc nhận dạng nhƣ nhận dạng mơ hình Markov ẩn, phƣơng pháp máy véc tơ hỗ trợ (SVM), mạng Nơ-ron cải tiến, tiến hành thử nghiệm hệ thống cho kết tốt nhất, thực xây dựng ứng dụng nhận dạng văn bằng, chứng Sở Giáo dục Đào tạo Đà Nẵng 68 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Quang Hoan (2006), Giáo trình Xử lý ảnh, Học viện Cơng nghệ Bƣu Viễn thơng, Hà Nội [2] Khoa Cơng nghệ thơng tin, Đại học Hàng Hải Việt Nam (2011), Giáo trình Xử lý ảnh, Hải Phòng [3] Lƣơng Bá Mạnh, Nguyễn Thanh Thủy (2002), Nhập môn xử lý ảnh số, Nhà xuất Khoa học Kỹ thuật, Hà Nội [4] Phạm Thị Hoàng Nhung (2007), Nghiên cứu ứng dụng phương pháp máy học tiên tiến công tác dự báo vận hành hồ Hịa Bình, Luận văn Thạc sĩ , Trƣờng Đại học Công nghệ, Đại học Quốc gia Hà Nội [5] Phạm Anh Phƣơng (2010), Nghiên cứu ứng dụng phương pháp máy véc tơ tựa nhận dạng chữ Việt viết tay rời rạc, Luận án Tiến sĩ, Viện Công nghệ thông tin, Viện Khoa học Công nghệ Việt Nam [6] Nguyễn Kim Quốc (2015), Nghiên cứu cải tiến chế điều khiển nút mạng, Luận án Tiến sĩ máy tính, Trƣờng Đại học Khoa học, Đại học Huế [7] Đỗ Năng Toàn, Phạm Việt Bình (2007), Giáo trình mơn học Xử lý ảnh, Khoa Công nghệ thông tin, Đại học Thái Nguyên [8] Lê Minh Trung (2005), Giáo trình mạng Nơron nhân tạo, Nhà xuất Thống kê, Hà Nội Tiếng nƣớc [9] A K Jain, D Zongker (1997), Representation and Recognition of Handwritten Digits Using Deformable Templates, IEEE Trans Pattern Analysis and Machine Intelligence, Vol.19, no.12, [10] Chin-Teng Lin, C.S George Lee (1996), Neural fuzzy systems: a neurofuzzy synergism to intelligent systems, Prentice-Hall Inc [11] Dah-Ming Chiu and Raij JAIN (1989), Analysis of the Increase and Decrease Algorithms for Congestion Avoidance in Computer Networks 69 [12] Mohamed Cheriet, Nawwaf Kharma, Cheng-Lin Liu And Ching Y Suen (2007), Character Recognition Systems:A Guide for Students and Practioners, N Y.: John Wiley & Sons [13] Ismail Kilinş, Kerem Ciğizouğlu (2005), Reservoir Management Using Artificial Neural Networks, 14th Reg Directorate of DSI (State Hydraulic Works), Istanbul, Turkey [14] Jyh Shing Roger Jang, Chuen Tsai Sun, Eiji Mizutani (2002), Neuro fuzzy and Soft Computing, Prientice Hall International, Inc [15] Lekkas D.F., Onof C (2005), Improved flow forecasting using artificial neural networks, 9th International Conference on Environmental and Technology, Rhodes Island, Greece, 1-3 September 2005 [16] L F C Pessoa, P Maragos (2000), Neural Networks with Hybrid Morphological/Rank/Linear Nodes: A Unifying Framework with Applications to Handwritten Character Recognition, Pattern Recognition, Vol.33 [17] Lotfi A Zadeh (1994), Fuzzy logic, neural networks and soft computing, Communications of the ACM, Vol 37, No [18] V N Vapnik (1998), Statistical Learning Theory, N Y.: John Wiley & Sons DAI HOC DA NANG CONG HoA xA HOI CHU NGIDA VIET NAM DQc I,p - T\I' - H~nh phuc TRUONG DAI HOC SU PHAM HOP BIEN BAN HOI nONG CHAM LuAN VAN THAC si Ten dS tai: Nghien cuu phuong phap nhdn dang chi} quang h9C nhdn dang the baa hiim y ti va ung dung Chuyen nganh: H~ thong thong tin Theo Quyet dinh l~p H9i d6ng cham luan van thac sf s6 718 IQU-UHSP 07/7/2017 Ngay h9P H9i dong: 30 thang ndm 2017 Danh sach cac vien H9i d6ng: STT HQvATEN CUONG VJ TRONG HOI DONG PGS.TSKH Trfrn QU6c ChiSn Chu tich H9i d6ng TS Hoang Tht Thanh Ha TIm ky H9i d6ng PGS.TS GS.TS Nguyen Thanh Thuy TS Trfrn Thien Thimh ve Trung Hung a Thanh vien co mat: _ ._.a5:'-'L_ Uy vien Phan bien Uy vien Phan bien Uy vien _ b Thanh vien v~g mat: +&;;,.0/"' Thir kY H9i d6ng bao cao qua trinh h9C t~p, nghien ciru cua h9C vien cab h9C va d9C ly lich khoa h9C (co van ban kern theo) H9C vien cao h9C trinh bay luan van Cac phan bien d9C nhan xet va neu cau hoi (co van ban kern thea) H9C vien cao h9C tra Uri cac can hoi cua vien H9i d6ng 10 H9i d6ng h9P rieng dS danh gia 11 Truong ban ki8m phieu cong b6 kSt qua 12 KSt lu~n cua H9i d6ng a) KSt luan chung: {}, - ~ \~ :bl,jJ)~ b) Yeu d.u chinh, cBH u7 pbq vY) sua v6 nQidung: \\ c) Cac y kiSn khac: d) Diem danh gia: BAng s6: S' B~ng chfr: ,-I t O,t

Ngày đăng: 14/05/2021, 15:16

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w