TÌM HIỂU cơ bản về NHẬN DẠNG ẢNH số .............................................. TÌM HIỂU cơ bản về NHẬN DẠNG ẢNH số .............................................. TÌM HIỂU cơ bản về NHẬN DẠNG ẢNH số .............................................. TÌM HIỂU cơ bản về NHẬN DẠNG ẢNH số ..............................................
TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ MỤC LỤC DANH MỤC HÌNH VẼ……………………………………………………………ii DANH MUC CÁC TỪ VIẾT TẮT iii CHƯƠNG GIỚI THIỆU CHUNG 1.1 GIỚI THIỆU ĐỀ TÀI 1.2 MỤC TIÊU CỦA ĐỀ TÀI CHƯƠNG TÌM HIỂU VỀ XỬ LÝ ẢNH .2 2.1 GIỚI THIỆU VỀ XỬ LÝ ẢNH .2 2.2 CÁC BƯỚC CƠ BẢN TRONG XỬ LÝ ẢNH 2.3 NHỮNG VẤN ĐỀ CƠN BẢN TRONG XỬ LÝ ẢNH 2.3.1 Điểm ảnh 2.3.2 Độ phân giải ảnh 2.3.3 Mức xám ảnh CHƯƠNG TÁCH BIÊN ẢNH .8 3.1 CƠ SỞ LÝ THUYẾT TÁCH BIÊN ẢNH 3.2 TÁCH BIÊN ẢNH TRONG MATLAB .9 3.2.1 Bộ tách biên Sobel 3.2.2 Bộ tách biên Prewitt 10 3.2.3 Bộ tách biên Robert 11 3.2.4 Bộ tách biên Canny 11 CHƯƠNG GIỚI THIỆU VỀ MATLAB 13 4.1 GIỚI THIỆU VỀ MATLAB .13 4.2 DỮ LIỆU 14 4.3 HỆ THỐNG MATLAB .14 4.4 MỘT SỐ LỆNH CƠ BẢN TRONG XỬ LÝ ẢNH .15 CHƯƠNG KẾT LUẬN 18 5.1 ƯU ĐIỂM VÀ KHUYẾT ĐIỂM CỦA ĐỀ TÀI .18 5.2 KHẢ NĂNG ỨNG DỤNG VÀ PHÁT TRIỂN ĐỀ TÀI 18 TÀI LIỆU THAM KHẢO 18 PHỤ LỤC 18 \ DANH MỤC HÌNH VẼ Hình 2- Ma trận ảnh số ……… ………………………….4 Hình 2-2 Ảnh màu…………… …………………………….3 Hình 2-3 Ảnh xám ………………………………………… Hình 2-4 Ảnh nhị phân………………………………….….5 Hình 3-1 Bộ tách biên Sobel………………………… …….6 Hình 3-2 Bộ tách biên Prewitt …………………………….8 Hình 3-3 Bộ tách biên Robert …………………………….11 Hình 4.1 Giao diện MATLAB……………………………….13 Hình 5.1 Giao diện ………………………………………… 16 Hình 5.2 Giao diện mô phỏng……………………………….17 DANH MỤC CÁC TỪ VIẾT TẮT MATLAB : RGB : Matrix Laboratory Red Green Blue Trang 1/18 CHƯƠNG GIỚI THIỆU CHUNG 1.1Giới thiệu đề tài Ngày nay, phát triển mạnh mẽ khoa học công nghệ, sống người có thay đổi ngày tốt hơn, mang lại tiện lợi tối ưu với trang thiết bị đại phục vụ cơng cơng nghiệp hố, đại hố đất nước Góp phần vào phát triển ngành kĩ thuật điện tử góp phần khơng nhỏ nghiệp xây dựng phát triển đất nước Ngày phần lớn thiết bị điện tử dần phát triển theo xu hướng tự động hóa, thơng minh, hiểu ý người, chúng giao tiếp với người mà không cần thông qua thiết bị trung gian cả, để làm điều thiết bị cảm biến, thuật toán đời ngày đại , xác bảo mật, chúng nhận biết hoạt động người , hình dáng người hoạt động theo ý muốn người Xứ lý ảnh lĩnh vực mang tính khoa học cơng nghệ Nó ngành khoa học mẻ so với nhiều ngành khoa học khác tốc độ phát triển nhanh, kích thước trung tâm nghiên cứu , ứng dụng , đặc biệt máy tính chun dụng riêng cho 1.2Mục tiêu đề tài -Thực đề tài nhằm: Tìm hiểu thuật toán nhận dạng ảnh xử lý ảnh màu, ảnh nhị phân Nâng cao kỹ thiết kế lập trình ngơn ngữ Matlab Rèn luyện kỹ nghiên cứu tìm hiểu tài liệu CHƯƠNG TÌM HIỂU VỀ XỬ LÝ ẢNH 1.3Giới thiệu xử lý ảnh Xử lý ảnh đưa vào giảng dạy bậc đại học khoảng mười năm Nó mơn học liên quan đến nhiều lĩnh vực cần nhiều kiến thức sở khác Đầu tiên phải kể đến xử lý tín hiệu số môn học cho xử lý tín hệu TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 2/18 chung , khái niệm tích chập , biết đổi Fourier, biến đổi Laplace, cá lọc hữu hạn… Để dễ tưởng tượng , xét bước cần thiết xử lý ảnh Đầu tiên , ảnh tự nhiên từ giới thu nhận qua thiết bị thu ( Camera , máy chụp hình) Gần , với phát triển công nghệ , ảnh màu ảnh đen trắng lấy từ camera, sau chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý 1.4Các bước xử lý ảnh Thu nhận ảnh Tiền xử lý ảnh Phân đoạn ảnh Biểu diễn mô Nhận dạng tả nội suy Cơ sở tri thức Thu nhận ảnh : Ảnh thu từ nhiều nguồn khác : Máy tính , máy quay , ảnh vệ tinh Mục đích :biến đổi thơng tin hình ảnh cấu trúc lưu trữ máy tính hiển thị thiết bị ngoại vi máy in , hình,… Tiền xử lý : Là trình sử dụng kỹ thuật xử lý ảnh để làm ảnh tốt lên theo mục đích sử dụng Mục đích : Điề chỉnh độ chiếu sáng để khắc phục độ chiếu sáng không Giảm nhỏ thành phẩn nhiễu ảnh tức đối tượng ý muốn Hiệu chỉnh giá trị cường độ sáng đối tượng Chuẩn hóa màu , độ lớn , dạng ảnh Phân đoạn : TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 3/18 Là trình phân chia nội dung cá đối tượng cần khảo sát khỏi ảnh Phân chia đối tượng tiếp giáp Phân tách cá đối tượng riêng biệt thành đối tượng Biểu diễn ảnh Đầu ảnh sau phân doạn chứa điểm ảnh 1.5Những vấn đề xử lý ảnh 1.1.1 Điểm ảnh Là điểm vật lý hình ảnh raster, khối màu nhỏ đơn vị để tạo nên ảnh kỹ thuật số., điểm ảnh CRT tương ứng với chế thời gian chúng tỷ lệ quét pixel khơng có kích thước cố định Mỗi điểm ảnh mẫu hình ảnh ban đầu, nhiều điểm ảnh thường cung cấp đại diện xác gốc Cường độ điểm ảnh thay đổi Hầu hết chương trình ứng dụng đồ họa diễn tả độ phân giải hình ảnh pixel dimensions - kích thước pixel, với số đo chiều ngang trước Trong số pixel có nhiều thông tin lưu trữ khác 1.1.2 Độ phân giải ảnh Khái niệm “resolution” - “độ phân giải” lượng thông tin chứa đựng tập tin ảnh kỹ thuật số hiển thị thiết bị in ra, thông thường đo pixel Nói cách tổng quát, độ phân giải ảnh cao, việc hiển thị website trang in chi tiết mượt mà - vài ảnh có độ phân giải cao chứa nhiều pixels mức mà mà mắt người nhìn thấy 1.1.3 Mức xám ảnh a) Ảnh số điểm ảnh Ảnh số (Digital image): đối tượng mà máy tính xử lý Ảnh số ma trận chiều, việc xử lý chúng thao tác ma trận cho kết hợp lý TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 4/18 Ví dụ ảnh số có độ phân giải 640x480 nghĩa chiều ngang có 640 điểm ảnh (pixel), chiều dọc có 480 điểm ảnh, điểm ảnh biểu diễn số Hình 2-1 Ma trận ảnh số b) Ảnh màu (RGB – Red Green Blue) Các điểm ảnh tạo thành từ tổ hợp màu R (red), G (green), B (blue) Cùng giá trị hiển thị khác thiết bị khác Màu 16 bit: màu mã hóa 5bit ( kiểu 555) hay thêm bit lại cho mau xanh (kiểu 565) Màu 24 bit: kênh màu mã hóa byte (8 bit) có giá trị nằm đoạn [0-255] mã hóa 255 * 255 * 255 = 16,581,375 màu hay gọi 16 triệu màu Màu 32 bit: tương tự màu 24 bit, có bit dư không sử dụng ( ngoại trừ khả sử dụng kênh alpha) Màu 48 bit: tương tự màu 16 bit thành phần mã hóa 16 bit màu, điều làm cho màu có khả biểu thị 65.535 sắc thái thay có 255 \Màu RGBA: với việc xuất nhu cầu ghép ảnh, việc thêm vào bit dư cho độ suốt tạo thành màu 32 bit với kênh Alpha, biểu diễn độ suốt điểm ảnh TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 5/18 Hình 2-2 Ảnh màu c) Ảnh xám (gray image) Ảnh xám hay gọi ảnh đơn sắc Ảnh mức xám điểm ảnh có giá trị nằm đoạn [0-7], ảnh 256 mức xám điểm ảnh có giá trị nằm đoạn [0-255] Giá trị điểm ảnh đại diện cho điểm ảnh tối (đen), giá trị điểm ảnh lơn đại diện cho điểm ảnh sáng (trắng) Ví dụ biểu diễn ảnh xám 154 255 200 136 198 236 16 154 234 98 TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 6/18 d) Ngưỡng xám (threshold) Cách phổ biến để tạo ảnh nhị phân từ ảnh xám chọn ngưỡng cho tất điểm ảnh quan tâm có giá trị thấp ngưỡng có màu trắng cá điểm ảnh quan tâm có giá trị cao ngưỡng có màu đen ngược lại e) Ảnh nhị phân (binary image) Ảnh nhị phân ảnh số, điểm ảnh biểu diễn giá trị (trắng) (đen) Ảnh nhị phân tạo cách biến đổi ảnh xám dựa vào ngưỡng xác định Với ngưỡng xám Ví dụ biểu diễn ảnh nhị phân: 1 0 1 0 1 Hình 2-4 Ảnh nhị phân TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 7/18 CHƯƠNG TÁCH BIÊN ẢNH 1.6Cơ sở lý thuyết tách biên ảnh Tách biên phương pháp thông dụng để tách theo nghĩa gián đoạn giá trị cường độ Sử gián đoạn tách sử dụng đạo hàm bậc bậc hai Đạo hàm bậc lựa chọn xử lý ảnh grandient (độ dốc) Grandient hàm 2-D f(x,y) định nghĩa dạng vecter: �� f � � � Gx � �� �f � � � x � f � Gy � �� � � y� �� � Biên độ vectơ này: -1 -0 -2 -1 1/2 2 � � f � �� f �� � �f mag (�f ) � G G � � � � �� � � � x � �� y �� �� � � � x 1/2 y Đạo hàm bậc hai xử lý ảnh tính sử dụng Laplace : �2 f ( x, y ) �2 f ( x, y ) �2 f ( x, y ) � x � y Tốn tử Laplace sử dụng tách biên vi phân bậc dễ bị ảnh hưởng nhiễu, biên độ sinh biến kép khơng thể tách hướng biên TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 8/18 Ý tưởng đằng sau tách biên tìm nơi ảnh có cường độ thay đổi nhanh , sử dụng hai tiêu chuẩn sau : Tìm nơi đạo hàm bậc cường độ sang có biên độ ngưỡng Tìm nơi đạo hàm bậc hai cường độ thay đổi qua mức 1.7Tách biên ảnh Matlab Cấu trúc tổng quát hàm này: [g,t]= edge(f, ‘method’, parameter) Trong ‘method’ gồm : Sobel, Prewitt , Robert, LoG , Zero Crossing, Canny 1.1.4 Bộ tách biên Sobel Bộ tách biên Sobel sử dụng mặt nạ hình để xấp xỉ đạo hàm bậc Gxvà Gy Nói cách khác grandient điểm tâm lân cận tính theo tách Sobel Mặt nạ lọc Sobel: -1 -2 -1 0 Hinh 3-1 Bộ tách biên Sobel Gx=(Z7 + 2Z8 + Z9) – (Z1 + 2Z2 + Z3) Z7) Cú pháp gọi tách biên tổng quát [g ,t]= edge(f, ’sobel ’,T,dir ) g= edge (f), [g,t] = edge (f) TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Gx=(Z3 + 2Z6 + Z9) – (Z1 + 2Z2 + Trang 9/18 1.1.5 Bộ tách biên Prewitt -1 Bộ tách biên Prewitt sử dụng mặt nạ : -1 -1 -1 0 1 -1 -1 1 Hình 3-2 Bộ tách biên Prewitt Gy=(Z3 + Z6 + Z9) – (Z1 + Z4 + Z7) G x=(Z7 + Z8 + Z9) – (Z1 + Z2 + Z3) Để xấp xỉ theo phương pháp số đạo hàm bậc Gx Gy Cú pháp tổng quát : [g ,t]= edge(f, ’prewitt ’,T,dir ) Bộ tách biên prewitt đơn giản dễ thực máy tính so với Sobel, có thẻ sinh chút nhiễu 1.1.6 Bộ tách biên Robert Bộ tách biên sử dụng mặt nạ: -1 0 -1 0 Hình 3-3 Bộ tách biên Robert Gx= Z9 – Z5 Gx= Z8 – Z6 Để xấp xỉ theo phương pháp số đạo hàm bậc Gx Gy TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 10/18 Cú pháp tổng quát : [g ,t]= edge(f, ’prewitt ’,T,dir ) Bộ tách biên Robert tách biên xưa xử lý ảnh số đơn giản Tuy nhiên , đuọc dùng thường xuyên thực phần cứngkhi tính đơn giản tốc độ yếu tố chi phối 1.1.7 Bộ tách biên Canny Là tách biên mạnh cunbg cấp hàm edge Có thể tóm tắt phương pháp sau: Ảnh làm trơn sử dụng lộc Gauss với độ lệch chuẩn để giảm nhiễu 1/2 Grandient cục , � G Gy2 � � g(x,y)= � x hướng biên y� �� ( x, y) tan 1 � � x � Được tính tốn điểm Một điểm biên �� định nghĩa điểm ó độ dài cực đại theo hướng Grandient Điểm biên xác định tang lên đến đỉnh Grandient biên đọ ảnh Cuối , thuật toán thực biên kết nối kết hợp pixel yếu mà có dạng kết nối -8 với pixel mạnh Cú pháp tổng quát : [g ,t]= edge(f, ’canny ’,T, sigma ) Trong T vectơ , T=[T1,T2] ngưỡng , sigma độ lệch chuẩn lọc làm trơn Giá tri mặc định sigma TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 11/18 CHƯƠNG GIỚI THIỆU VỀ MATLAB 1.8Giới thiệu MATLAB MATLAB viết tắt Matrix Laboratory , phần mềm toán học hãng Mathworks để lập trình , tính tốn số có tính trực quan cao MATLAB làm việc chủ yếu với ma trận Ma trận cỡ mxn bảng chữ nhật gồm mxn số xếp thành m hàng n cột TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 12/18 MATLAB làm việc với nhiều kiểu liệu khác Với chuỗi kí tự MATLAB xem dãy kí tự dãy mã số ký tự MATLAB dùng để giải tốn giải tích số, xử lý tín hiệu số, xử lý đồ họa, … mà khơng phải lập trình cổ điển Hiện nay, MATLAB có đến hàng ngàn lệnh hàm tiện ích Ngồi hàm cài sẵn ngơn ngữ, MATLAB có lệnh hàm ứng dụng chuyên biệt Toolbox, đểmở rộng môi trường MATLAB nhằm giải toán thuộc phạm trù riêng Các Toolbox quan trọng tiện ích cho người dùng tốn sơ cấp, xử lý tín hiệu số, xử lý ảnh, xử lý âm thanh, ma trận thưa, logic mờ,… Giao diện phần mềm MATLAB bắt đầu chạy ứng dụng : Hình 4-1 Giao diện Matlab 1.9Dữ liệu Dữ liệu Matlab thể dạng ma trận (hoặc mảng - tổng quát), có kiểu liệu liệt kê sau đây: TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 13/18 Kiểu đơn single, kiểu có lợi nhớ liệu đòi hỏi byte nhớ hơn, kiểu liệu khơng sử dụng phép tính tốn học, độ xác Kiểu double kiểu kiểu thông dụng biến Matlab Kiểu Sparse Kiểu uint8, uint8, uint16, uint64 Kiểu char ví dụ “Hello” Kiểu cell Kiểu Structure Trong Matlab kiểu liệu double kiểu mặc định sử dụng phép tính số học 1.10 Hệ thống MATLAB Hệ thống giao diện Matlab chia thành phần: Môi trường phát triển Đây nơi đặt công cụ, phương tiện giúp sử dụng lệnh file, ta liệt kê số sau Desktop Command Window Command History Browsers for viewinghelp Thư viện, hàm toán học bao gồm cấu trúc tính tổng, sin cosin atan, atan2 etc , phép tính đơn giản đến phép tính phức tạp tính ma trận nghich đảo, trị riêng, chuyển đổi fourier, laplace, symbolic library Ngơn ngữ Matlab Đó ngơn ngữ cao ma trận mảng, với dòng lệnh, hàm, cấu trúc liệu vào, lập trình hướng đối tượng Đồ hoạ Matlab Bao gồm câu lệnh thể đồ họa môi trường 2D 3D, tạo hình ảnh chuyển động, cung cấp giao diện tương tác người sử dụng máy tính Giao tiếp với ngơn ngữ khác Matlab cho phép tương tác với ngôn ngữ khác C, Fortran … 1.11 Một số lệnh xử lý ảnh TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 14/18 + dither : Tạo ảnh nhị phân từ ảnh cường độ đen trắng cách trộn , tạo ảnh số từ ảnh RGB cách trộng (dither ) + gray2id : Tạo ảnh số từ ảnh cường độ đen trắng + grayslice : Tạo ảnh số từ ảnh cường độ đen trắng cách đặt ngưỡng + im2bw : Tạo ảnh nhị phân từ ảnh cường độ , ảnh số hay ảnh RGB sở ngưỡng ánh sáng + ind2gray : Tạo ảnh cường độ đen trắng từ ảnh số + ind2rgb : Tạo ảnh RGB từ ảnh số + mat2gray : Tạo ảnh cường độ đen trắng từ liệu ma trận cách lấy tỉ lệ giữ liệu + rgb2gray : Tạo ảnh cường độ đen trắng từ ảnh RGB + rgb2ind : Tạo ảnh số từ ảnh RGB CHƯƠNG KẾT QUẢ MƠ PHỎNG 1.12 Giao diện chương trình TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 15/18 Hình5-1 Giao diện chương trình 1.13 Kết mơ TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 16/18 Hình 5-2 Kêt mơ CHƯƠNG KẾT LUẬN 5.1 Ưu điểm khuyết điểm đề tài - Ưu điểm: Nhận biết nhanh vật thể giảm chi phí lao cơng Nhặn biết nhiều vật thể Tiết kiệm chi phí lắp đặt -Nhược điểm: tính ổn định chưa cao , dễ bị nhiễu Dễ bị ảnh hưởng nhiều vật cản khác TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 17/18 5.2 Khả ứng dụng phát triển đề tài - Ứng dụng : dùng cho cơng ty hay xí nghiệp để kiểm sốt hàng hóa -Phát triển : nhận dạng khn mặt , nhận dạng vân tay, kiểm soát người vào TÀI LIỆU THAM KHẢO Tiếng Anh: [1] Digital Image Processing Using Matlab – Gonzales [2] Digital Image Processing – Gonzzales [3] Digital Image Processing Using Matlab V4 – Ingle and Proakis Tiếng Việt: [4] Phạm Hồng Liên , ‘MATLAB VÀ ỨNG DỤNG TRONG VIỄN THÔNG’, NXB Đại học quốc gia TP.HCM PHỤ LỤC A TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ ... PHỎNG 1.12 Giao diện chương trình TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 15/18 Hình5-1 Giao diện chương trình 1.13 Kết mơ TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 16/18 Hình 5-2 Kêt mơ CHƯƠNG... TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 14/18 + dither : Tạo ảnh nhị phân từ ảnh cường độ đen trắng cách trộn , tạo ảnh số từ ảnh RGB cách trộng (dither ) + gray2id : Tạo ảnh số từ ảnh cường... lý Ảnh số ma trận chiều, việc xử lý chúng thao tác ma trận cho kết hợp lý TÌM HIỂU CƠ BẢN VỀ NHẬN DẠNG ẢNH SỐ Trang 4/18 Ví dụ ảnh số có độ phân giải 640x480 nghĩa chiều ngang có 640 điểm ảnh