Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 23 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
23
Dung lượng
530,81 KB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN NGUYỄN VŨ QUANG GÁN NHÃN ĐỐI TƯỢNG DỰA VÀO KỸ THUẬT NHẬN DẠNG Ngành: Công nghệ thông tin Chuyên ngành: Quản lý Hệ thống thông tin Mã số: Chuyên ngành đào tạo thí điểm TĨM TẮT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS Đỗ Năng Toàn Hà Nội - 2015 PHẦN MỞ ĐẦU Cùng với phát triển ngày mạnh mẽ khoa học kĩ thuật vài thập kỷ gần đây, xử lý ảnh ngành khoa học tương đối mẻ so với nhiều ngành khoa học khác lĩnh vực phát triển nhanh thu hút quan tâm đặc biệt từ nhà khoa học, thúc đẩy trung tâm nghiên cứu, ứng dụng lĩnh vực hấp dẫn Nhận dạng gán nhãn cho hình ảnh đóng vai trị quan trọng nhiều ứng dụng thực tế khoa học kĩ thuật sống thường ngày như: sản xuất kiểm tra chất lượng, di chuyển Robot, phương tiện lại tự trị, công cụ hướng dẫn cho người mù, an ninh giám sát, nhận dạng đối tượng, nhận dạng mặt, ứng dụng y học, sản xuất, hiệu chỉnh video,… Một ứng dụng quan trọng, việc nhận dạng gán nhãn cho loại hình ảnh … Tự động nhận dạng ảnh đặt vị trí nhãn lĩnh vực trực quan hóa thơng tin Nhãn đoạn văn nhằm truyền đạt thông tin, làm rõ ý nghĩa cấu trúc phức tạp biểu diễn dạng đồ họa Bài toán nhận dạng gán nhãn đề cập, nghiên cứu nhiều giới Tại Việt Nam toán trọng ứng dụng nhiều lĩnh vực Vì vậy, đề tài xây dựng với mục đích: Tìm hiểu tốn nhận dạng hình ảnh gán nhãn, ứng dụng lĩnh vực; Tìm hiểu số vấn đề, thuật toán liên quan; Đặt tảng cho cá nhân nghiên cứu, tìm hiểu sâu vấn đề Từ thiết kế chương trình thử nghiệm nhận dạng gán nhãn cho ảnh cụ thể Luận văn gồm phần mở đầu, phần kết luận chương, nội dung chương sau: Chương 1: Khái quát gán nhãn toán nhận dạng đối tượng Chương khái quát lại kiến thức toán gán nhãn gồm xử lý ảnh gán nhãn xử lý ảnh Đồng thời nói tốn nhận dạng đối tượng, vai trị tầm quan trọng tốn nhận dạng đối tượng, phương pháp nhận dạng đối tượng số hệ thống nhận dạng đối tượng tiếng giới Chương 2: Một số vấn đề nhận dạng đối tượng sử dụng mạng nơron Chương đề cập đến số vấn đề nhận dạng đối tượng sử dụng mạng nơron Mô tả kiến trúc hệ thống nhận dạng đối tượng sử dụng mạng nơron nhân tạo cách thiết kế, huấn luyện mạng nơron nhân tạo cho việc nhận dạng Chương 3: Chương trình thử nghiệm Chương áp dụng kiến thức nghiên cứu chương chương 2, sử dụng mạng nơron nhiều lớp lan truyền ngược kỹ thuật gán nhãn để xây dựng chương trình nhận dạng ký tự CHƯƠNG 1: KHÁI QUÁT VỀ GÁN NHÃN VÀ BÀI TOÁN NHẬN DẠNG ĐỐI TƯỢNG Chương khái quát lại kiến thức toán gán nhãn gồm xử lý ảnh gán nhãn xử lý ảnh Đồng thời nói tốn nhận dạng đối tượng, vai trị tầm quan trọng toán nhận dạng đối tượng, phương pháp nhận dạng đối tượng số hệ thống nhận dạng đối tượng tiếng giới 1.1 Khái quát gán nhãn 1.1.1 Xử lý ảnh Xử lý ảnh phần lĩnh vực xử lý tín hiệu số Tăng cường chất lượng thơng tin hình ảnh q trình tri giác người biễu diễn máy tính Xử lý ảnh số bao gồm phương pháp kỹ thuật để biến đổi, để truyền tải mã hóa ảnh tự nhiên Xử lý ảnh liên quan đến việc thay đổi hình ảnh để đạt hai mục đích: - Thứ nhất: biến đổi ảnh làm đẹp ảnh - Thứ hai: tự động phân tích nhận dạng ảnh hay đoán nhận ảnh đánh giá nội dung ảnh Lý phải xử lý ảnh: - Ảnh bị lỗi q trình thu ảnh, truyền dẫn hiển thị (hồi phục, nâng cao chất lượng ảnh, nội suy) - Ảnh mang nội dung nhạy cảm (vd, chống lại copy không hợp pháp, giả mạo lừa đảo) - Tạo ảnh có hiệu ứng nghệ thuật Có thể tạm phân biệt hệ thống xử lý ảnh theo mức độ phức tạp thuật toán xử lý sau: - Xử lý ảnh mức thấp: trình biến đổi đơn giản thực lọc nhằm khử nhiễu ảnh, tăng cường độ tương phản hay độ nét ảnh Trong trường hợp này, tín hiệu đưa vào hệ thống xử lý tín hiệu đầu ảnh quang học - Xử lý ảnh mức trung: trình xử lý phức tạp hơn, thường sử dụng để phân lớp, phân đọan ảnh, xác định dự đóan biên ảnh, nén anh để lưu trữ truyền phát Đặc điểm hệ thống xử lý ảnh mức trung tín hiệu đầu vào hình ảnh, cịn tín hiệu đầu thành phần tách từ hình ảnh gốc, luồng liệu nhận sau nén ảnh - Xử lý ảnh mức cao: q trình phân tích nhận dạng hình ảnh Đây trình xử lý thực hệ thống giác người Chúng ta thấy rằng, ứng dụng xử lý ảnh bắt buộc phải tuân theo bước xử lý nêu trên, ví dụ ứng dụng chỉnh sửa ảnh nghệ thuật dừng lại bước tiền xử lý Một cách tổng quát chức xử lý bao gồm nhận dạng giải thích thường có mặt hệ thống phân tích ảnh tự động bán tự động, dùng để rút trích thơng tin quan trọng từ ảnh, ví dụ ứng dụng nhận dạng kí tự quang học, nhận dạng chữ viết tay vv… 1.1.2 Gán nhãn xử lý ảnh Nhãn đoạn văn nhằm truyền đạt thông tin, làm rõ ý nghĩa cấu trúc phức tạp biểu diễn dạng đồ họa Bài toán tự động gán nhãn xác định lĩnh vực nghiên cứu quan trọng ACM Computational Geometry Task Force (Đội tính tốn hình học ACM) Gán nhãn nguồn nhiều tốn tối ưu hóa hình học Ngay nhãn đặt vào vị trí cố định tương ứng với điểm, toán NP-hard Các đồ cần gán nhãn, cần có giải thuật hiệu quả, giải thuật heuristics để xác định ràng buộc, vị trí Gán nhãn cho đối tượng xác định nhãn phân loại cho thành phần đối tượng quan sát Gán nhãn cho đối tượng sử dụng nhiều toán gán nhãn từ loại, nhận dạng hình ảnh, âm hay tốn dự đốn gen Đây tốn có ứng dụng nhiều lĩnh vực bao gồm vẽ đồ, hệ thống thông tin địa lý vẽ đồ thị Hiện giới có nhiều cơng trình nghiên cứu toán gán nhãn tự động Tuy nhiên Việt Nam, tốn cịn đề cập đến cách hạn chế Trong toán gán nhãn cho đối tượng thành công, nhãn phải đặt cho người xem dễ đọc theo tiêu chuẩn chất lượng thẩm mỹ Nhãn phải đặt vị trí tốt có sẵn theo số quy tắc bản: Nhãn phải dễ dàng đọc, nhanh chóng xác định vị trí nhãn đối tượng mà thuộc nên dễ dàng thừa nhận, nhãn phải đặt gần với đối tượng chúng, nhãn không che khuất nhãn khác đối tượng khác, nhãn phải đặt vị trí thích hợp số tất vị trí dễ đọc Tóm tắt đánh giá chất lượng gán nhãn ba quy tắc sau đây: - Khơng có chồng chéo nhãn với nhãn khác, đối tượng đồ họa khác vẽ - Mỗi nhãn dễ dàng xác định đối tượng hình vẽ - Mỗi nhãn phải đặt vị trí tốt (trong số tất nhãn có vị trí chấp nhận được) Thứ tự hiển thị ưu tiên vị trí nhãn thay đổi tùy theo ứng dụng cụ thể 1.2 Bài toán nhận dạng đối tượng 1.2.1 Giới thiệu Như biết, xuất hình ảnh bề mặt phụ thuộc vào nhiều yếu tố: Ánh sáng, thông số máy ảnh định vị máy ảnh Trong nhiều lĩnh vực điều khiển, tự động hóa, cơng nghệ thông tin…, nhận dạng đối tượng vấn đề mấu chốt định thành công toán Nhận dạng bước quan trọng nhiều lĩnh vực khoa học, đặc biệt lĩnh vực điều khiển tự động hóa khơng nhận dạng xác đối tượng điều khiển khơng có giải pháp tối ưu để điều khiển chúng Từ việc đối tượng phải nhận dạng từ xuất nhiều vật thể, phức tạp nhận dạng đối tượng phụ thuộc vào nhiều yếu tố Nhận dạng trình phân loại đối tượng biểu diễn theo mơ hình gán chúng tên (gán cho đối tượng tên gọi, tức dạng) dựa theo quy luật mẫu chuẩn 1.2.2 Các cách tiếp cận 1.2.2.1 Nhận dạng đối tượng dùng thống kê Khái niệm: Nhận dạng đối tượng dùng thống kê phương pháp nhận dạng đối tượng dựa vào đặc tính thống kê đối tượng Nhận dạng đối tượng dùng thống kê sử dụng phương pháp máy học dựa thống kê để học rút đối tượng tham khảo từ lượng liệu lớn 1.2.2.2 Nhận dạng dựa theo cấu trúc Biểu diễn định tính Trong cách biểu diễn này, người ta quan tâm đến dạng mối quan hệ chúng Giả thiết rằng, đối tượng biểu diễn dãy ký tự, đặc tính biểu diễn số ký tự Phương pháp nhận dạng nhận dạng logic, dựa vào hàm phân biệt hàm Bool Cách nhận dạng nhận dạng từ có độ dài 1.2.2.3 Nhận dạng dựa mạng nơron Giới thiệu Xét trường hợp đối tượng phi tuyến có độ phức tạp cao, sử dụng phương pháp giải tích thơng thường để nhận dạng khó khăn, chí khơng thực hiểu biết nghèo nàn đối tượng Vì nhà khoa học đưa ý tưởng sử dụng cơng cụ tính tốn mềm hệ mờ, mạng nơron, đại số gia tử để xấp xỉ -chính nhận dạng đối tượng Mạng nơron cơng cụ hữu hiệu để nhận dạng mơ hình đối tượng, phương pháp ta mô hình tốn thực đối tượng hồn tồn sử dụng kết xấp xỉ để thay đối tượng Cấu trúc neural nhân tạo Mơ hình nơron nhân tạo gồm phần chính: Bộ tổng liên kết đầu vào, động học tuyến tính phi tuyến 1.2.3 Một số hệ thống nhận dạng đối tượng 1.2.4 Quy trình hoạt động hệ thống nhận dạng đối tượng CHƯƠNG 2: NHẬN DẠNG ĐỐI TƯỢNG SỬ DỤNG MẠNG NƠRON Chương đề cập đến số vấn đề nhận dạng đối tượng sử dụng mạng Nơron Mô tả kiến trúc hệ thống nhận dạng đối tượng sử dụng mạng nơron nhân tạo cách thiết kế, huấn luyện mạng nơron nhân tạo cho việc nhận dạng 2.1 Kiến trúc hệ thống nhận dạng đối tượng sử dụng mạng nơron nhân tạo 2.1.1 Khái niệm mạng nơron nhân tạo Mạng nơron nhân tạo hay thường gọi ngắn gọn mạng nơron, tiếng anh Artificial Neural Network Nó gồm có nhóm nơron nhân tạo nối với nhau, xử lý thông tin cách truyền theo kết nối tính giá trị nút Trong nhiều trường hợp, mạng nơron nhân tạo hệ thống thích ứng, tự thay đổi cấu trúc dựa thơng tin bên ngồi hay bên chảy qua mạng trình học 2.1.2 Lịch sử phát triển mạng nơron 2.1.3 Mơ hình nơron 2.1.3.1 Nơron nhân tạo đơn giản Một nơron nhân tạo đơn giản thiết bị với nhiều đầu vào có đầu Nơron có hai chế độ hoạt động: chế độ huấn luyện chế độ sử dụng Trong chế độ huấn luyện, nơron huấn luyện với số đối tượng đầu vào tới không sử dụng Trong chế độ sử dụng phát đối tượng học đầu vào, đầu trở thành đầu Nếu đối tượng đầu vào không thuộc vào danh sách đối tượng học luật loại bỏ sử dụng để tiếp tục dùng hay loại bỏ nơron 2.1.3.2 Nơron phức tạp (Mơ hình McCulloch Pitts: MCP) Sự khác biệt với mơ hình đơn giản đầu vào mơ hình có trọng số, hiệu đầu vào có đưa định phụ thuộc vào trọng số đầu vào Trọng số đầu vào số mà nhân với đầu vào ta có trọng số đầu vào Những đầu vào trọng số nhóm lại với chúng vượt giá trị ngưỡng nơron bị loại bỏ Với trường hợp khác nơron khơng bị loại bỏ 2.1.4 So sánh mạng nơron với máy tính truyền thống 2.1.5 Một số kiến trúc mạng nơron dùng nhận dạng đối tượng 2.1.5.1 Mạng truyền thẳng Mạng truyền thẳng cho phép tín hiệu truyền theo đường từ đầu vào tới đầu ra, khơng có phản hồi hay lặp lại Mạng có xu hướng truyền thẳng đầu vào với đầu Chúng dùng rộng rãi nhận dạng đối tượng Cách tổ chức mạng truyền thẳng tham chiếu tới phương pháp từ lên từ xuống 2.1.5.2 Mạng hồi quy Mạng hồi quy có kiến trúc tương tự mạng truyền thẳng (hình 2.3) có điểm khác cho phép tín hiệu truyền theo hai hướng Mạng hồi quy truyền tín hiệu tốt trở lên phức tạp Nó có tính động; trạng thái thay đổi liên tục tới đạt tới điểm trạng thái cân Chúng trì điểm cân tới đầu vào thay đổi cần tìm một trạng thái cân Kiến trúc hồi quy tham chiếu tới việc tương tác 2.1.5.3 Các lớp mạng Các loại phổ biến mạng nơron nhân tạo bao gồm ba nhóm lớp đơn vị: lớp đơn vị "đầu vào" kết nối với lớp đơn vị "ẩn", lớp đơn vị “ẩn” kết nối với lớp đơn vị "đầu ra" 2.1.5.4 Perceptrons Nghiên cứu có ảnh hưởng mạng nơron năm 60 tiến hành tiêu đề “perceptron” thuật ngữ 10 đặt Frank Rosenblatt Perceptron (hình 2.5) trở thành mơ hình MCP (nơron với đầu vào trọng số) với số bổ sung, sửa chữa, tiền xử lý Các đơn vị có nhãn A1, A2, Aj, Ap gọi đơn vị kết nối nhiệm vụ chúng trích xuất đặc điểm riêng biệt từ hình ảnh đầu vào 2.1.6 Ứng dụng mạng nơron nhân tạo 2.2 Thiết kế mạng nơron nhân tạo 2.2.1 Các bước thiết kế Các bước thiết kế mơ hình mạng nơron nhân tạo, gồm bước: Bước 1: Lựa chọn biến Bước 2: Thu thập liệu Bước 3: Tiền xử lý liệu Bước 4: Các tập liệu huấn luyện, kiểm thử, chứng thực Bước 5: Sơ đồ mạng nơron: Số lượng lớp ẩn, Số lượng nơron ẩn, Số lượng nơron đầu ra, Hàm chuyển đổi Bước 6: Huấn luyện mạng nơron: Số lần lặp lại huấn luyện Bước 7: Triển khai 2.2.2 Chi tiết bước thiết kế mạng nơron 2.2.2.1 Lựa chọn biến 2.2.2.2 Thu thập liệu 2.2.2.3 Tiền xử lý liệu 2.2.2.4 Các tập liệu huấn luyện, kiểm thử, chứng thực 2.2.2.5 Sơ đồ mạng nơron 2.2.2.6 Quá trình huấn luyện mạng nơron 2.2.2.7 Triển khai 11 2.3 Huấn luyện mạng 2.3.1 Các phương pháp học Hình trạng mạng trọng số liên kết bên mạng định chức mạng nơron Hình trạng mạng bao gồm số lớp, số đơn vị tầng, cách mà lớp liên kết với mạng thường cố định Một thuật toán huấn luyện lưa chọn định trọng số Tiến trình điều chỉnh trọng số để mạng “nhận biết” quan hệ đầu vào đích mong muốn gọi học hay huấn luyện 2.3.2 Học có giám sát mạng nơron Học có giám sát xem việc xấp xỉ ánh xạ: X→ Y, X tập vấn đề Y tập lời giải tương ứng cho vấn đề Các đối tượng (x, y) với x = (x1, x2, , xn) ∈ X, y = (yl, y2,…,ym) ∈ Y cho trước 2.3.3 Thuật toán lan truyền ngược Back-Propagation Thuật toán lan truyền ngược dạng tổng qt thuật tốn trung bình bình phương tối thiểu Thuật toán thuộc dạng thuật toán xấp xỉ để tìm điểm mà hiệu mạng tối ưu Chỉ số tối ưu thường xác định hàm số ma trận trọng số đầu vào mà q trình tìm hiểu tốn đặt 2.3.3.1 Mơ tả thuật toán Mạng lan truyền ngược hàm phi tuyến xấp xỉ gần hàm đích cho qua số đối tượng tập đối tượng Một mạng lan truyền tổng quát mạng có n (n>2) lớp: lớp thứ gọi lớp nhập, lớp thứ n lớp xuất n-2 lớp ẩn Phần lớn mạng có biến phụ thuộc với mơ hình tả mạng nơron cho phép số nút lớp nhập, lớp xuất, lớp ẩn 12 tùy ý Số nút lớp nhập lớp xuất phụ thuộc vào yêu cầu toán, số nút ẩn người xây dựng mơ hình định 2.3.3.2 Sử dụng thuật toán Back – Propagation 2.3.3.3 Đánh giá thuật toán Ưu điểm thuật toán: - Dễ dàng triển khai - Phương pháp chuẩn hoạt động tốt - Thời gian tính tốn giảm trọng số chọn ban đầu nhỏ - Không yêu cầu đặc tính đặc biệt hàm học Nhược điểm thuật tốn: - Có thể bị vướng vào tối thiểu địa phương nghiệm tối ưu - Số lượng lớn đầu vào/đầu không chắn liên hệ chúng với đầu - Nghiệm phương trình thay đổi theo thời gian - Đầu mờ khơng phải số 2.4 Nhận dạng sử dụng mạng nơron 2.4.1 Khả sử dụng mạng nơron nhận dạng Xét trường hợp đối tượng phi tuyến tính có độ phức tạp cao, sử dụng phương pháp giải tích thơng thường để nhận dạng khó khăn, chí không thực hiểu biết nghèo nàn đối tượng Vì nhà khoa học đưa ý tưởng sử dụng cơng cụ tính toán mềm hệ mờ, mạng nơron, đại số gia tử để xấp xỉ Mạng nơron cơng cụ hữu hiệu để nhận dạng mơ hình đối tượng Bằng phương pháp ta mô 13 hình tốn thực đối tượng hồn tồn dùng kết xấp xỉ để thay đối tượng Vì tính phi tuyến mạng nơron (hàm kích hoạt phi tuyến), chúng dùng để mô tả hệ thống phi tuyến phức tạp Mạng nơron công cụ nhận dạng tốt đặc trưng sau: khả học từ kinh nghiệm hay huấn luyện, khả khái quát hố cho đầu vào khơng huấn luyện Mạng nơron có khả xấp xỉ hàm phi tuyến cách đầy đủ xác, sử dụng tốt cho mơ hình động học phi tuyến Điều quan trọng sử dụng thuật truyền ngược tĩnh động mạng nơron, sử dụng để hiệu chỉnh tham số trình nhận dạng 2.4.2 Mơ hình nhận dạng hệ thống sử dụng mạng nơron Việc nhận dạng việc quan trọng Khi thông số đối tượng cần thiết để việc điều khiển đạt chất lượng mong muốn Khi thông số đối tượng tự thay đổi tiến trình làm việc (đối tượng phi tuyến) có tính động học việc nhận dạng theo chúng phức tạp nhiều so với đối tượng có thơng số bất biến Nhận dạng thường chia làm: nhận dạng mơ hình nhận dạng tham số Nhận dạng mơ hình q trình xác định mơ hình đối tượng thông số sở đầu vào đầu đối tượng Mơ hình thu sau nhận dạng gọi tốt thể đối tượng 14 Nhận dạng tham số huấn luyện mạng Mơ hình mạng nơron luyện để mô hành vi đối tượng giống mơ hình truyền thống biểu diễn hình : 2.4.3 Nhận dạng hệ thống sử dụng mạng nơron Như hai giai đoạn cần cho nhận dạng lựa chọn mơ hình tối ưu tham số Đối với mạng nơron dựa vào nhận dạng lựa chọn số nút ẩn, số lớp ẩn (cấu trúc mạng) tương đương với mơ hình lựa chọn Mạng huấn luyện theo kiểu giám sát với kỹ thuật lan truyền ngược, dựa vào luật học sai số hiệu chỉnh Tín hiệu sai số lan truyền ngược qua mạng Kỹ thuật lan truyền ngược sử dụng phương pháp giảm gradient để xác định trọng mạng tương đương với tối ưu tham số Mạng nơron huấn luyện để xấp xỉ mối quan hệ biến.Mạng nơron huấn luyện để tối thiểu hàm sai số Mạng huấn luyện để tối thiểu sai số bình phương đầu mạng đầu vào hệ thống, xác định hàm truyền ngược Trong kiểu nhận dạng đầu mạng hội tụ đầu vào hệ sau huấn luyện, mạng đặc trưng cho hàm truyền ngược hệ Phương pháp nhận dạng khác cần phải hướng đầu hệ thống tới đầu mạng Trong kiểu mạng đặc 15 trưng cho hàm truyền thẳng hệ thống Giả sử hàm phi tuyến để mô tả hệ thuộc lớp hàm biết phạm vi quan tâm cấu trúc mơ hình nhận dạng phải phù hợp với hệ thống Với giả thiết ma trận trọng mạng nơron mơ hình nhận dạng tồn tại, điều kiện ban đầu hệ thống mơ hình có lượng với lượng vào xác định Do trình nhận dạng thực chất điều chỉnh tham số mạng nơron dựa vào sai lệch giá trị đầu hệ thống mô hình 16 CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM Chương áp dụng kiến thức nghiên cứu chương chương 2, sử dụng mạng nơron nhiều lớp lan truyền ngược để xây dựng chương trình nhận dạng ký tự Đồng thời, đánh giá kết đạt định hướng phát triển tương lai 3.1 Giới thiệu Nhận dạng ký tự ứng dụng nhiều quan tâm đầy khó khăn thử thách Điều khó khả nhận dạng phù hợp kí tự kiểu ngơn ngữ phức tạp không theo quy luật biến đổi font, kiểu kích cỡ Với số phương thức lập trình truyền thống ánh xạ ảnh kí tự vào ma trận, phân tích ảnh vector liệu, kiểm tra đưa định phù hợp kết Việc thực thi lập trình truyền thống cần viết mã nguồn vô tận cho kiểu không quán hay lệch với giá trị đầu khác Lý thuyết không thực Sử dụng mạng neural nhân tạo với mạng làm việc quy tắc từ việc cập nhật lại trọng số liên kết nút mạng Với ưu điểm mạng nhận liệu từ phân tích sinh động ảnh đầu vào việc huấn luyện cho ký tự đầu cho mẫu nói cách khác khả thích nghi với mơi trường liệu đầu vào sinh động 3.2 Các bước giải toán 3.2.1 Xây dựng mạng nơron 3.2.2 Xử lý liệu 3.2.3 Huấn luyện mạng 3.2.4 Nhận dạng ảnh Quá trình nhận dạng mạng neural đơn giản dễ hiểu Khi chương trình chạy gọi modun: phân tích ảnh, vector hóa 17 q trình huấn luyện sử dụng lại trình nhận dạng 3.2.5 Lựa chọn công cụ Tôi lựa chọn ngôn ngữ C# sử dụng nguồn opensource Neural Network Ocr được cấp phép theo giấy phép GNU General Public (GPLv3), người phát triển đưa ví dụ là Andrew Kirillov, lập trình viên IBM 3.3 Một số kết thử nghiệm đánh giá hệ thống nhận dạng ký tự 3.5.1 Thử nghiệm hệ thống nhận dạng ký tự 3.5.2 Ưu điểm hạn chế Ưu điểm: Hệ thống nhận dạng tốt với đối tượng ký tự chuẩn tốc độ nhanh với lỗi thấp, ký tự vẽ tay paint kết nhận dạng xác đầu vào vẽ ký tự chuẩn không xiên xẹo hệ thống cần thời gian huấn luyện lâu Nhược điểm: Hệ thống phụ thuộc nhiều đầu vào ảnh Đối với số ký tự vẽ đứt nét ,độ lệch so với ký tự chuẩn nhiều cho kết không tốt phần nhận dạng ảnh Hệ thống triển khai môi trường desktop nên chưa thật tiện lợi cho người sử dụng 3.5.3 Hướng phát triển tương lai Hệ thống nhận dạng ký tự, tương lai em hi vọng phát triển hệ thống nhận dạng nhiều ký tự lúc, nhiều hàng, nhiều dịng Ngồi ra, hướng phát triển lâu dài mang tính tương lai nhận dạng chữ viết tay tiếng việt trả kết giọng nói, từ làm thành phần mềm hỗ trợ nghe đọc cho người mù 18 PHẦN KẾT LUẬN Nhận dạng gán nhãn cho đối tượng sống thường ngày đóng vai trò quan trọng áp dựng nhiều thực tế như: sản xuất kiểm tra chất lượng, di chuyển Robot, phương tiện lại tự trị, công cụ hướng dẫn cho người mù, an ninh giám sát, nhận dạng đối tượng, nhận dạng mặt, ứng dụng y học, sản xuất, hiệu chỉnh video,… Luận văn tập trung vào nghiên cứu số kỹ thuật gán nhãn đối tượng dựa vào kỹ thuật nhận dạng đạt kết sau : Trình bày khái quát kỹ thuật gán nhãn đối tượng dựa vào nhận dạng Hệ thống hóa lại kiến thức: số kỹ thuật gán nhãn, mạng neural nhân tạo, toán nhận dạng đối tượng cách sử dụng mạng neural vào phân tích bái tốn cụ thể Cài đặt chương trình thử nghiệm hệ thống nhận dạng ký tự Hướng phát triển tiếp : Do có hạn chế định mặt thời gian kiến thức thân, luận văn dừng lại mức thử nghiệm hệ thống ảnh với số lượng ảnh thông tin ảnh khiêm tốn cho việc xác nhận ký tự Trong thời gian tới, em tiến hành thử nghiệm hệ thống với tập liệu chữ viết tay đầy đủ Đồng thời, tăng số lượng 19 ảnh chi tiết ảnh nhiều lên cần nhận dạng để xây dựng mơt hệ thống hồn chỉnh Nhận dạng ảnh gán nhãn phần quan trọng lĩnh vực nhận dạng nói riêng xử lý ảnh nói chung Cùng với việc sử dụng công cụ mạng neural lĩnh vực sử dụng nhiều cần phát triển 20 DANH MỤC TÀI LIỆU THAM KH O Tiếng việt [1] Đỗ Năng Tồn (2010), Giáo trình xử lý ảnh, Học viện Cơng nghệ Bưu Viễn thơng Tiếng Anh [2] D Heckenberg, B C Lovell (2000), “A Gesture Driven Computer Interface”, Proceeding of Visual Communications and Image Processing, SPIE, 4067, 261-268 [3] Journal on Graphics (2006),Vision and Image Processing, [4] J Mathews (2002), “An Introduction to Edge Detection: The Sobel Edge Detector” [5] Peter l Rockett (2005), “An Improved Rotation-Invarient Thinning Algorithm”, IEEE transaction on Pattern, Analysis and Machine Intelligence, 27, 10 [6] Te-Hsiu Sun, Fang-Chih Tien (2008), Using Backpropagation Neural Network for Face Recognition with 2D+ 3D Hybrid Information, Elsevier: Expert System with Applications, 35,361-372 [7] N Sakai, S Yonekawa and A Matsuzaki, Two-dimensional image analysis of the shape of rice and its applications to separating varieties”, Journal of Food Engineering, vol 27, 1996, pp 397-407 [8] A J M Timmermans, and A A Hulzebosch, Computer vison system for on-line sorting of pot plants using an artificial neural network classifier, Computers and Electronics in Agriculture, vol 15, 1996, pp 41-55 21 [9] S Abbasi, F Mokhtarian, and J Kittler, Reliable classification of chrysanthemum leaves through curvature scale space, Lecture Notes in Computer Science, vol 1252, 1997, pp 284295 [10] J Camarero, S Siso, and E.G-Pelegrin, Fractal dimension does not adequately describe the complexity of leaf margin in seedlings of Quercus species, Anales del Jardín Botánico de Madrid, vol 60, no 1, 2003, pp 63-71 [11] C-L Lee, and S-Y Chen, Classification of leaf images, 16th IPPR Conference on Computer Vision, Graphics and Image Processing (CVGIP), 2003, pp 355-362 [12] S G Wu, F S Bao, E Y Xu, Y-X Wang, Y-F Chang, and Q-L Xiang, A leaf recognition algorithm for plant classification using probabilistic neural network, The Computing Research Repository (CoRR), vol.1, 2007, pp 11-16 [13] J Pan and Y He, Recognition of plants by leaves digital image and neural network, International Conference on Computer Science and Software Engineering, vol 4, 2008, pp 906 – 910 22 23 ... ninh giám sát, nhận dạng đối tượng, nhận dạng mặt, ứng dụng y học, sản xuất, hiệu chỉnh video,… Luận văn tập trung vào nghiên cứu số kỹ thuật gán nhãn đối tượng dựa vào kỹ thuật nhận dạng đạt kết... khái quát kỹ thuật gán nhãn đối tượng dựa vào nhận dạng Hệ thống hóa lại kiến thức: số kỹ thuật gán nhãn, mạng neural nhân tạo, toán nhận dạng đối tượng cách sử dụng mạng neural vào phân tích... gồm xử lý ảnh gán nhãn xử lý ảnh Đồng thời nói tốn nhận dạng đối tượng, vai trò tầm quan trọng toán nhận dạng đối tượng, phương pháp nhận dạng đối tượng số hệ thống nhận dạng đối tượng tiếng giới