1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu phương pháp nhận dạng chữ quang học và ứng dụng nhận dạng thẻ bảo hiểm y tế

26 226 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 26
Dung lượng 1,06 MB

Nội dung

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM ` NGÔ TẤN LÂM NGHIÊN CỨU PHƯƠNG PHÁP NHẬN DẠNG CHỮ QUANG HỌC VÀ ỨNG DỤNG NHẬN DẠNG THẺ BẢO HIỂM Y TẾ Chuyên ngành: Hệ thống thông tin Mã số: 61.49.01.04 TĨM TẮT LUẬN VĂN THẠC SĨ HỆ THỐNG THƠNG TIN ĐÀ NẴNG - NĂM 2017 Cơng trình hồn thành ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM Người hướng dẫn khoa học: TS PHẠM ANH PHƯƠNG Phản biện 1: PGS.TS Võ Trung Hùng Phản biện 2: GS.TS Nguyễn Thanh Thủy Luận văn bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Hệ thống thông tin, họp Đại học Đà Nẵng vào ngày 30 tháng năm 2017 Có thể tìm hiểu luận văn tại: - Thư viện Trường Đại học Sư phạm, Đại học Đà Nẵng MỞ ĐẤU TÍNH CẤP THIẾT CỦA ĐỀ TÀI Trong thời đại nay, với phát triển mạnh mẽ công nghệ thông tin, toán nhận dạng lĩnh vực quan tâm phát triển Bài toán nhận dạng đóng vai trị quan trọng nhiều ứng dụng thực tế như: giám sát an ninh, giao thông, nhận dạng y học, nhận dạng đối tượng, nhận dạng khuôn mặt, nhận dạng chữ, nhận dạng tiếng nói, phát chuyển động, theo dõi chuyển động,… Cùng với thúc đẩy q trình tin học hóa lĩnh vực y tế, đầu tháng năm 2016, Bảo hiểm xã hội Việt Nam triển khai việc cấp phát thẻ bảo hiểm y tế (BHYT) theo cấu trúc mã thẻ có mã vạch chiều cho tất đối tượng tham gia BHYT, việc sử dụng thẻ BHYT mã vạch chiều mang lại nhiều tiện ích cho sở khám chữa bệnh người dân tham gia BHYT khám chữa bệnh, đảm bảo xác thơng tin việc cấp phát thẻ BHYT cho bệnh nhân Tuy nhiên trình triển khai cịn gặp nhiều khó khăn như: việc đầu tư sở vật chất chưa đồng bộ, cần có lộ trình kinh phí, trình độ tin học, cơng nghệ thông tin nhân viên sở khám chữa bệnh chưa theo kịp đà phát triển cơng nghệ…, vấn đề khó khăn số thẻ phát hành bị mờ, mực in bị bong tróc, khơng rõ thơng tin, máy khơng đọc mã vạch…gây khó khăn cho người dân lẫn sở khám chữa bệnh, nhiều người xa đến, không khám bảo hiểm phải tự chi trả phải quay xin cấp lại thẻ, thời gian, khó khăn tốn cho người bệnh Xuất phát từ thực tiễn trên, Tôi ứng dụng sức mạnh công nghệ thông tin lĩnh vực máy học để thực đề tài “Nghiên cứu phƣơng pháp nhận dạng chữ quang học ứng dụng nhận dạng thẻ bảo hiểm y tế” Nhận dạng thẻ BHYT chương trình hỗ trợ việc quản lý BHYT, từ kết nhận dạng mã số thẻ BHYT giúp người quản lý tìm kiếm, trích xuất thông tin bệnh nhân dựa thẻ BHYT cách nhanh chóng, xác, hạn chế tình trạng trùng thẻ BHYT, đảm bảo cho việc tốn BHYT xác đạt hiệu cao, hạn chế tiêu cực, đồng thời theo dõi xuyên suốt trình điều trị bệnh bệnh nhân Trong đề tài này, Tôi nghiên cứu số phương pháp nhận dạng lĩnh vực nhận dạng chữ quang học Từ đó, có cách nhìn rõ nét lĩnh vực máy học, hiểu tầm quan trọng tính thực tiễn sống người MỤC TIÊU - Nghiên cứu phương pháp nhận dạng ảnh, nhận dạng ký tự quang học số phương pháp trích chọn đặc trưng ảnh - Xây dựng, cài đặt thuật toán nhận dạng để giải toán nhận dạng thẻ BHYT dựa việc thu thập số liệu, xây dựng sở tri thức ứng dụng việc nhận dạng thẻ BHYT ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU 3.1 Đối tƣợng nghiên cứu Các phương pháp nhận dạng ảnh, nhận dạng ký tự quang học 3.2 Phạm vi nghiên cứu - Ảnh thẻ BHYT - Ảnh chụp điều kiện ánh sáng bình thường (không chụp ngược ánh sáng, chụp máy kỹ thuật số máy scan) - Các ký tự rời rạc, khơng bị dính PHƢƠNG PHÁP NGHIÊN CỨU Để hồn thành mục tiêu đề ra, tơi chọn phương pháp nghiên cứu lý thuyết tiến hành ứng dụng thực nghiệm Cụ thể sau: - Về lý thuyết: Tham khảo tài liệu lý thuyết liên quan - Về thực nghiệm: + Thu thập liệu ảnh thẻ BHYT để xây dựng sở tri thức + Ứng dụng nhận dạng thẻ BHYT liệu ảnh thu thập KẾT QUẢ DỰ KIẾN 5.1 Lý thuyết - Nghiên cứu tổng quan nhận dạng ảnh, nhận dạng ký tự quang học - Nghiên cứu lĩnh vực máy học, phương pháp nhận dạng: Phương phương pháp Máy vector hỗ trợ (Support Vector Machine); Mạng nơ-ron nhân tạo (Artificial Neural Network),…để làm sở cho việc phân tích liệu - Tìm hiểu lập trình với OpenCV, Matlab 5.2 Thực tiễn Từ kết nhận dạng mã thẻ BHYT, dùng để hỗ trợ cho việc quản lý thẻ BHYT khám chữa bệnh sở y tế BỐ CỤC LUẬN VĂN Luận văn dự kiến tổ chức thành chương sau: Chƣơng 1: TỔNG QUAN VỀ NHẬN DẠNG CHỮ QUANG HỌC Chƣơng 2: MẠNG NƠ-RON NHÂN TẠO Chƣơng 3: ỨNG DỤNG NHẬN DẠNG THẺ BHYT Cuối phần kết luận hướng nghiên cứu phát triển luận văn CHƢƠNG TỔNG QUAN VỀ NHẬN DẠNG CHỮ QUANG HỌC Chương giới thiệu khái quát nhận dạng chữ quang học, mơ hình nhận dạng ký tự tổng quát, khái niệm xử lý ảnh số kỹ thuật, phương pháp nhận dạng chữ áp dụng lĩnh vực nhận dạng Cho đến kết nghiên cứu nhận dạng lĩnh vực hạn chế, ứng dụng chủ yếu tập trung số lĩnh vực hẹp Có nhiều mơ hình, kỹ thuật tiên tiến lĩnh vực máy học áp dụng cho toán nhận dạng chữ như: mạng nơ-ron nhân tạo, mơ hình Markov ẩn, máy véc tơ hỗ trợ (SVM), CHƢƠNG MẠNG NƠ-RON NHÂN TẠO Chương giới thiệu mạng nơ-ron nhân tạo Từ đặc trưng, tính mạng nơ-ron nhân tạo mạng có khả học hệ thống gồm nhiều phần tử xử lý đơn giản hoạt động xử lý song song, cho phép áp dụng để giải toán từ đơn giản đến phức tạp Đặc biệt toán phân lớp, loại tốn địi hỏi giải vấn đề phân loại đối tượng quan sát thành nhóm dựa đặc điểm nhóm đối tượng Đồng thời dạng tốn sở nhiều toán thực tế như: nhận dạng chữ, tiếng nói, phân loại gen, phân loại chất lượng sản phẩm,…Do đó, mạng nơ-ron perceptron lớp thuật toán lựa chọn để cài đặt ứng dụng việc nhận dạng thẻ CHƢƠNG ỨNG DỤNG NHẬN DẠNG THẺ BHYT Trong chương này, Tôi đưa chương trình mơ xây dựng cài đặt dựa thuật toán mạng nơ-ron perceptron lớp truyền thẳng để huấn luyện, nhận dạng 18 chữ từ A đến Y 10 chữ số từ đến liệu mẫu gồm 200 file ảnh dùng để kiểm thử hận dạng Đây ký tự thường dùng việc cấp phát mã số thẻ BHYT dùng việc khám chữa bệnh sở y tế Dựa kết nhận dạng từ chương trình, người ta dùng truy xuất liệu quản lý thẻ BHYT đạt hiệu qua nâng cao hiệu suất quản lý đồng thời theo dõi xuyên suốt trình khám chữa bệnh cho bệnh nhân 3.1 BÀI TOÁN NHẬN DẠNG THẺ BẢO HIỂM Y TẾ Nhận dạng thẻ BHYT chương trình hỗ trợ hệ thống quản lý BHYT, mơ tả tốn sau: - Đầu vào: Dữ liệu file ảnh dạng văn có định dạng *.JPG trải qua giai đoạn tiền xử lý: xử lý ảnh nhiễu, phân ngưỡng, lọc ảnh , phân tích ảnh tách ký tự theo vùng sau huấn huyện dựa mạng nơ-ron nhân tạo nhận dạng đưa kết - Đầu ra: file text chứa ký tự tương ứng với mã thẻ BHYT mà chương trình mong muốn Số ký tự đầu mong muốn phải tương ứng với số ký tự ảnh đầu vào cần huấn luyện Dựa kết mã thẻ BHYT nhận dạng, giúp người quản lý dùng để tìm kiếm, trích xuất thơng tin bệnh nhân cách nhanh chóng, xác, hạn chế tình trạng trùng thẻ BHYT, đảm bảo cho việc toán BHYT xác đạt hiệu cao, đồng thời theo dõi xuyên suốt trình điều trị bệnh bệnh nhân 3.2 CƠ SỞ DỮ LIỆU THỰC NGHIỆM Tập liệu mẫu dùng để huấn luyện chứa 28 file ảnh, với kích thước 16×20, định dạng *.JPG, tương ứng với ký tự: gồm ký tự số từ đến ký tự chữ gồm A, B, C, D, E, G, H, K, L, M, N, O, Q, S, T, V, X, Y ABCDXY 0123589 Hình 3.1 Một số mẫu ký tự Tập liệu dùng để kiểm thử chứa: file ảnh thẻ BHYT, định dạng *.JPG Mỗi file ảnh lưu với tên theo định dạng: .JPG Ví dụ: CH4480405300003.JPG Hình 3.2 Mẫu thẻ BHYT dùng để kiểm thử 3.3 MƠ HÌNH NHẬN DẠNG THẺ BHYT Hình 3.3 Mơ hình nhận dạng thẻ BHYT 3.3.1 Thẻ BHYT Hình 3.4 Thẻ bảo hiểm y tế - Ơ thứ 02 ký tự: Gồm chữ mã đối tượng tham gia BHYT gồm 34 loại đối tượng, có ký hiệu : DN, HX, CH, NN, TK, HC, XK, CA, HT, TB, MS, XB, XN, TN, CC, CK, CB, KC, HD, BT, HN, TC, TQ, TA, TY, TE, HG, LS, CN, HS, GD, TL, XV, NO - Ô thứ hai 01 ký tự: Được ký hiệu số (theo thứ tự từ đến 5), quy định mức hưởng BHYT - Ô thứ ba 02 ký tự: Được ký hiệu số từ 01 đến 99 mã tỉnh, thành phố trực thuộc trung ương, nơi phát hành thẻ BHYT - Ô thứ tư 02 ký tự: Được ký hiệu số từ 01 đến 99 mã quận, huyện, thị xã, thành phố trực thuộc tỉnh nơi quản lý đầu mối người tham gia BHYT - Ô thứ năm 03 ký tự: Được ký hiệu số từ 001 đến 999 mã đơn vị quản lý, theo địa giới hành theo loại đối tượng 10 Hình 3.5 Ảnh trước quay Hình 3.6 Ảnh sau quay 3.3.2.2 Khử nhiễu Như trình bày chương 1, lọc trung vị kỹ thuật lọc phi tuyến, dùng để làm trơn ảnh khử nhiễu, có lợi cho việc 11 loại bỏ điểm ảnh hay hàng mà bảo tồn độ phân giải Ý tưởng thuật tốn lọc trung vị sau: ta sử dụng cửa sổ lọc (ma trận 3x3) quét qua điểm ảnh ảnh đầu vào (input) Tại vị trí điểm ảnh lấy giá trị điểm ảnh tương ứng vùng 3x3 ảnh gốc "lấp" vào ma trận lọc Sau xếp điểm ảnh cửa sổ theo thứ tự (tăng dần giảm dần tùy ý) Cuối cùng, gán điểm ảnh nằm (trung vị) dãy giá trị điểm ảnh xếp cho giá trị điểm ảnh xét ảnh đầu (output) Kích thước cửa sổ lọc thường chọn cho số điểm ảnh cửa sổ lẻ, thường là: 3x3, 5x5, 7x7 Các bước kỹ thuật lọc trung vị: - Quét cửa sổ lọc lên thành phần ảnh gốc; điền giá trị quét vào cửa sổ lọc - Lấy thành phần cửa sổ lọc để xử lý - Sắp xếp theo thứ tự thành phần cửa sổ lọc - Lưu lại thành phần trung vị, gán cho ảnh đầu (output) 3.3.2.3 Phân ngưỡng Khi xử lý ảnh trực tiếp ảnh từ không gian ảnh màu (RGB,…) ảnh xám ta phải tiếp nhận số lượng lớn thơng tin từ ảnh Điều gây khó khăn cho việc xây dựng thuật tốn làm giảm tốc độ xử lý Vì việc phân ngưỡng ảnh - trường hợp đặc biệt khử nhiễu, để chuyển ảnh đầu vào không gian ảnh nhị phân (vì có hai mức) trình bày chương nhằm để đơn giản hóa q trình xử lý Phân ngưỡng kỹ thuật đặt ngưỡng để 12 hiển thị tông màu liên tục, điểm ảnh so sánh với ngưỡng định trước Giá trị ngưỡng định điểm có hiển thị hay khơng Hình 3.7 Ảnh trước phân ngưỡng Hình 3.8 Ảnh sau phân ngưỡng 13 3.3.4 Tách ký tự ảnh mã thẻ Vì ảnh thẻ BHYT có kích thước cố định, trước tiến hành việc tách ký tự ảnh thẻ, ta hiệu chỉnh lại kích thước ảnh thẻ, sau ta cắt mã thẻ dựa tọa độ điểm đầu (góc bên trái) điểm cuối (góc bên phải) khung hình chữ nhật chứa mã thẻ, tiếp tục thực việc loại bỏ phần cạnh hình chữ nhật bao quanh mã thẻ tiến hành tách ký tự mã thẻ để phục vụ cho việc nhận dạng dựa vào mật độ phân bố điểm đen ảnh chiếu lên trục Ox Oy, ta kết hình 3.9 Hình 3.9.Tách ký tự ảnh mã thẻ 3.3.5 Huấn luyện nhận dạng ký tự Áp dụng mơ hình mạng nơ-ron lớp perceptron trình bày chương 2, với lớp đầu vào gồm 320 nơ-ron tương ứng với 320 điểm ảnh (ma trận pixel ảnh đưa vào 1620) lớp đầu tương đương với 28 nơ-ron dãy ký tự quy định thông tin đầu 14 3.3.5.1 Pha huấn luyện - Dữ liệu đầu vào (input): Việc huấn luyện mạng dựa phương pháp học có giám sát với tập mẫu học {(x(k), t(k))}, đó:  x(k) = [x1(k), x2(k), …, xm(k)] ảnh đầu vào  t(k) = [t1(k), t2(k), …, tn(k)] nhãn (label) quan sát đầu mong muốn - Dữ liệu đầu (output): trọng số wij (trọng số liên kết từ nơron j tới nơ-ron i) - Phương thức (method) Quá trình học mạng truyền thẳng lớp Với mẫu học {(x(k), t(k))}, k= 1,2, …, p bước thực hiện: Bƣớc 1: Tính giá trị y(k) theo cơng thức (3.1) m yi (k )  g (w Ti x(k ))  g ( w ij x j (k)) với i=1,2,…,n; j 1 k=1,2,…,p (3.1) Bƣớc 2: Xác định sai số ei nơ-ron i: ei = ti – yi , ti giá trị đầu mong muốn yi giá trị đầu tính tốn nơ-ron thứ i Bƣớc 3: Tính ∆wij số gia trọng số wij (trọng số liên kết đầu vào j tới nơ-ron i) theo công thức 3.2 15 ∆wij =η ei xj η tốc độ học (0

Ngày đăng: 25/05/2019, 13:57

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w