1. Trang chủ
  2. » Luận Văn - Báo Cáo

kl le minh hai 810026d

92 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • TRANG BÌA

  • LỜI CẢM ƠN

  • MỤC LỤC

  • DANH MỤC HÌNH

  • LỜI MỞ ĐẦU

  • CHƯƠNG 1: LÝ THUYẾT XỬ LÝ ẢNH

    • 1.1. Tổng quan về một hệ thống xử lý ảnh:

    • 1.2. Các vấn đề cơ bản trong xử lý ảnh:

    • 1.3. Các kỹ thuật phân đoạn ảnh:

  • CHƯƠNG 2: TỔNG QUAN VỀ NHẬN DẠNG

    • 2.1. Không gian biểu diễn đối tượng, không gian diễn dịch:

    • 2.2. Mô hình và bản chất của quá trình nhận dạng:

    • 2.3. Nhận dạng dựa trên phân hoạch không gian:

    • 2.4. Nhận dạng theo cấu trúc:

    • 2.5. Tổng quan về mạng neural networks:

  • CHƯƠNG 3: GIỚI THIỆU CHƯƠNG TRÌNH VÀ MÔ PHỎNG

    • 3.1. Giới thiệu chương trình sử dụng:

    • 3.2. MÔ PHỎNG:

  • TÀI LIỆU THAM KHẢO

Nội dung

TỔNG LIÊN ĐỒN LAO ĐỘN G TRƯỜNG ĐẠI HỌC TƠN ĐỨC THẮNG - LUẬN VĂN TỐT NGHIỆP ĐỀ TÀI: NHẬN DẠNG CỬ ĐỘNG BÀN TAY SVTH : LÊ MINH HẢI MSSV : 810026D GVHD : Ths HỒNG MẠNH HÀ TP.HỒ CHÍ MINH, THÁNG NĂM 2009 Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà LỜI CẢM ƠN Lời em gửi lời cảm ơn chân thành đến thầy Ths.Hoàng Mạnh Hà tận tình hướng dẫn gợi ý bổ xung kiến thức động viên, bỏ nhiều thời gian để hướng dẫn tụi em trình nghiên cứu đề tài Em cám ơn trường tạo điều kiện tình thần vật chất cho em học tập nghiên cứu đề tài thời gian qua Trong thực đề tài, em cố gắng tổng hợp kiến thức mà học tham khảo tài liều nhằm đạt kết tốt.Tuy nhiên kiến thức trình độ cịn có nhiều hạn chế nên kết làm khơng mong muốn cịn nhiều thiếu sót Trang Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN TPHCM, Tháng năm 2009 Giáo viên hướng dẫn Trang Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN TPHCM, Tháng năm 2009 Giáo viên phản biện Trang Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà MỤC LỤC LỜI CẢM ƠN MỤC LỤC DANH MỤC HÌNH LỜI MỞ ĐẦU 10 CHƯƠNG 1: LÝ THUYẾT XỬ LÝ ẢNH 11 1.1.Tổng quan hệ thống xử lý ảnh: 11 1.2.Các vấn đề xử lý ảnh: 13 1.2.1.Pixel (picture element – phần tử ảnh): 13 1.2.2.Gray level (mức xám): 14 1.2.3.Tín hiệu số biểu diễn ảnh số: 14 1.2.4.Khái quát hệ thống xử lý tín hiệu số: 15 1.2.5.Các tốn tử khơng gian (spatial operators): 16 1.2.5.1.Toán tử tuyến tính: 16 1.2.5.2.Tích chập: 16 1.2.6.Các phương pháp xử lý hình học: 20 1.2.6.1.Các định nghĩa sở : 20 1.2.6.2.Các phép biến đổi không gian: 21 1.2.6.3.Lược đồ mức xám: 22 1.2.6.4.Một số kỹ thuật cải thiện ảnh nhị phân: 23 1.3.Các kỹ thuật phân đoạn ảnh: 24 1.3.1.Phân đoạn dựa đường biên : 25 1.3.2.Phân đoạn dựa miền : 27 1.3.3.Phân đoạn dựa ngưỡng : 29 1.3.4.Phân đoạn dựa vào chuyển động: 31 CHƯƠNG 2: TỔNG QUAN VỀ NHẬN DẠNG 33 2.1.Không gian biểu diễn đối tượng, không gian diễn dịch: 33 2.1.1.Không gian biểu diễn đối tượng : 33 2.1.2.Không gian diễn dịch: 33 2.2.Mơ hình chất q trình nhận dạng: 34 2.2.1.Mơ hình: 34 Trang Nhận Dạng Cử Động Bàn Tay ThS Hồng Mạnh Hà 2.2.2.Bản chất q trình nhận dạng: 36 2.3.Nhận dạng dựa phân hoạch không gian: 37 2.3.1.Phân hoạch không gian: 37 2.3.2.Hàm phân lớp hay hàm định 37 2.3.3.Nhận dạng thống kê: 38 2.3.4.Một số thuật toán nhận dạng tiêu biểu tự học 40 2.3.4.1.Thuật toán dựa vào khoảng cách lớn nhất: 40 2.3.4.2.Thuật tốn k trung bình (giả sử có k lớp g): 41 2.3.4.3.Thuật toán isodata: 41 2.4.Nhận dạng theo cấu trúc: 42 2.4.1.Biểu diễn định tính: 42 2.4.2.Phương pháp định dựa vào cấu trúc: 42 2.4.2.1.Một số khái niệm: 42 2.4.2.2.Phương pháp nhận dạng: 43 2.5.Tổng quan mạng neural networks: 43 2.5.1.Bộ não nơ ron sinh học: 43 2.5.2.Mơ hình mạng nơ ron nhân tạo: 46 2.5.2.1.Mơ hình nơ ron nhân tạo: 46 2.5.2.2.Mạng nơron: 49 2.5.2.2.1.Phân loại mạng nơron: 49 2.5.2.2.2.Hai cách nhìn mạng nơron: 50 2.5.2.2.3.Khả tính tốn biểu diễn phụ thuộc liệu mạng nơ ron: 52 2.5.2.2.4.Xác định cấu trúc mạng tối ưu: 52 2.5.3.Các mạng nơron lớp: 53 2.5.3.1.Mạng hopfield: 53 2.5.3.2.Mạng kiểu nhớ chiều kết hợp thích nghi (adaptive idirectional associative memory neural network): 55 2.5.3.3.Mạng perceptron: 57 2.5.4.Các mạng nơ ron nhiều lớp (multi-layer neural network): 59 2.5.4.1.Mạng nơ ron nhiều lớp lan truyền ngược sai số (back-propagation neural network): 59 Trang Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà 2.5.4.2.Mạng nơ ron nhiều lớp ngược hướng (counter-propagation neural network): 64 2.5.5.Ứng dụng mạng nơ ron lan truyền ngược hướng cho nhận dạng ký tự: 65 2.5.5.1.Mở đầu: 65 2.5.5.2.Nhận dạng mạng noron lan truyền ngược hướng: 65 CHƯƠNG 3: GIỚI THIỆU CHƯƠNG TRÌNH VÀ MƠ PHỎNG 68 3.1.Giới thiệu chương trình sử dụng: 68 3.1.1.Các kiểu ảnh matlab: 69 3.1.1.1.Ảnh số: 69 3.1.1.2.Ảnh biểu diễn theo độ sáng: 69 3.1.1.3.Ảnh nhị phân: 70 3.1.1.4.Ảnh rgb: 70 3.1.2.Hệ thống tọa độ : 71 3.1.2.1.Tọa độ pixel: 71 3.1.2.2.Tọa độ không gian: 71 3.1.3.Hiển thị ảnh : 72 3.1.4.Thay đổi kích thước ảnh: 73 3.1.5.Chuyển đổi kiểu ảnh: 74 3.1.6.Các phép toán số học liệu ảnh: 75 3.1.7.Các kiểu liệu ảnh: 76 3.1.8.Hàm imtransform: 76 3.2.Mô phỏng: 79 3.2.1.Thực thu nhận ảnh từ webcam: 79 3.2.2.Chuẩn hoa webcam : 79 3.2.3.Lấy ảnh biến đổi xám nền: 81 3.2.4.Lấy ảnh đối tượng biến đổi mức xám 82 3.2.5.Lấy hình dạng bàn tay loại bỏ đồng thời lấy nhị phân ảnh: 83 3.2.6.Loại bỏ điện tích ko cần thiết: 85 3.2.7.Tìm điểm cao vào trọng tâm: 86 3.2.8.Chuẩn hóa điểm cao 87 3.2.9.Kết nhận được: 88 Trang Nhận Dạng Cử Động Bàn Tay ThS Hồng Mạnh Hà 3.2.10.Kết khơng mong muốn: 88 3.2.11.Nhận dạng : 88 3.2.12.Giao diện thể hiện: 90 TÀI LIỆU THAM KHẢO 91 Trang Nhận Dạng Cử Động Bàn Tay ThS Hồng Mạnh Hà DANH MỤC HÌNH Hình 1.1: Các giai đoạn xử lý ảnh 111 Hình1.2: Các thành phần hệ thống xử lý ảnh 122 Hình 1.3: Tín hiệu rời rạc 144 Hình 1.4: Một biểu diễn tốn tử chập 177 Hình 1.5: Ví dụ tốn tử chập cuộn 188 Hình 1.6: Cải thiện ảnh nhị phân 233 Hình 1.7: Minh họa việc phân đoạn dựa biên 266 Hình 1.8: Minh họa phương pháp phân đoạn watershed 277 Hình 1.9: Minh họa việc phân tích quadtree 288 Hình 1.10: Minh họa phương pháp phân đoạn dựa ngưỡng 29 Hình 1.11: Minh họa việc phân đoạn với nhiều mức ngưỡng 300 Hình 1.12: Minh họa việc phát chuyển động 322 Hình 2.1: Mơ hình cấu trúc đối tượng nhà 355 Hình 2.2: Sơ đồ tổng quát hệ nhận dạng 377 Hình 2.3: Cấu tạo nơ ron sinh học 466 Hình 2.4: Mơ hình nơ ron nhân tạo 466 Hình 2.5: Minh họa neuron với ngõ vào 477 Hình 2.6: Khả biểu diễn nơron 49 Hình 2.7: Mạng nơron truyền thẳng nhiều lớp 500 Hình 2.8: Mạng nơron hồi qui 500 Hình 2.9: Học tham số có giám sát 511 Hình 2.10: Mạng hopfield 533 Hình 2.11: Mạng abam 566 Hình 2.12: Mạng perceptron 588 Hình 2.13: Mạng nơron lớp 60 Hình 3.1: Ảnh số 69 Hình 3.2: Ảnh biểu diễn theo dộ sáng 700 Hình 3.3: Ảnh nhị phân 700 Hình 3.4: Ảnh rgb 700 Trang Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà Hình 3.5: Tọa độ pixel 711 Hình 3.6: Ảnh kết nối webcam chương trinh matlab 79 Hình 3.7: diểm tối 800 Hình 3.8: diểm sang bốn góc 800 Hình 3.9: Tọa dộ điểm quy đổi webcam 811 Hình 3.10: điểm biến đổi 81 Hình 3.11: Ảnh chưa lấy xám 822 Hình 3.12: Ảnh lấy xám 822 Hình 3.13: Ảnh đối tượng 833 Hình 3.14: Ảnh biến đổi xám đối tượng 833 Hình 3.15: Ảnh lấy hình dạng bàn tay loại bỏ 844 Hình 3.16: Ảnh nhị phân hình dạng bàn tay 844 Hình 3.17: Ảnh sau loại bỏ diện thích nhỏ khơng cần thiết 866 Hình 3.18: Ảnh xác định trọng tâm điểm cao 877 Hình 3.19: Ảnh thể hiên điểm cao chuẩn hóa bị mờ 877 Hình 3.20: Ảnh điểm chuẩn hóa làm rõ 888 Hình 3.21: Việc trượt cửa sổ tìm đối tượng lên ảnh 89 Hình 3.22: Kết nhận dạng ảnh tĩnh 89 Hình 3.23: Chương trình mơ tương tác 90 Trang Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà + B=imtransform (A,TFORM , INTERP) : dạng phép nội suy sử dụng INTERP giá trị ‘nearest’, ‘bicubic’ ‘bilinear’ Tương tự , INTERP cấu trúc trả từ hàm makeresampler Tuỳ chọn cho phép điều khiển nhiều lên việc lấy mẫu lại ( resampling ) +[B,XDATA,YDATA]= imtransform(…) : trả vị trí ảnh B không gian X-Y XDATA YDATA véctơ hai thành phần Những thành phần XDATA toạ độ x cột đầu cuối B Những thành phần YDATA toạ độ y cột đầu cuối B Bình thường , hàm imtransform tính tốn XDATA YDATA tự động B chứa tồn ảnh biến đổi A Tuy nhiên , ta đè chồng tính tốn tự động xem : [B,XDATA,YDATA] = imtransform( ,param1,val1,param2,val2, ) : Chỉ tham số điều khiển nhiều khía cạnh khác biến đổi không gian Bảng sau liệt kê tham số mà ta ham số Diễn giải Cả hai tham số véctơ hai phần tử thực ‘Udata’ ‘Vdata’ vị trí khơng gian ảnh A không gian vào chiều U-V Hai phần tử ‘UData’ ‘Udata’ cho toạ độ u (hoành độ ) cột cuối A Hai phần ‘VData’ tử ‘Vdata’ cho toạ độ v ( tung độ ) hàng cuối A Giá trị mặc định cho ‘Udata’ ‘Vdata’ tương ứng [1 size(A,2) ] [1 size(A,1) ] Cả hai tham số véctơ hai phần tử thực vị trí khơng gian ảnh B không gian chiều X-Y Hai phần tử ‘Xdata’ hoành độ ‘Xdata’ x cột cuối B Hai phần tử ‘Ydata’ tung độ ‘Ydata’ hàng cuối B Nếu ‘Xdata’ ‘Ydata’ không , hàm imtransform ước lượng giá trị cho chúng để chứa tồn ảnh bị biến đổi Là véctơ với hai phần tử thực Phần tử ‘XYScale’ chiều rộng pixel vào không gian X-Y Phần tử thứ hai ( tồn ‘XYSca ) chiều cao pixel Nếu ‘XYScale’ có phần tử , giá le’ trị dùng cho chiều rộng chiều cao Nếu ‘XYScale’ không định Size ‘XYScale’ tính tốn từ ‘Size’ ,’Xdata’ ‘Ydata’ Trang 77 Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà ‘Size’ Một véctơ hai phần tử nguyên không âm ‘Size’ số hàng cột ảnh B Với chiều cao , kích cỡ B lấy trực tiếp từ A Nói cách khác , size(B,k) tương đương với size(A,k) với k>2 Nếu ‘Size’ không định , tính từ ‘Xdata’ ,’Ydata’ ‘XYScale’ ‘FillVal ues’ Một mảng chứa nhiều giá trị tô ( fill values ) Fill values sử dụng cho pixel ảnh vị trí biến đổi tương ứng ảnh vào hoàn toàn viền ảnh A chiều , ‘Fillvalues’ phải vô hướng Tuy nhiên , chiều A lớn , ‘FillValues’ mảng mà kích thước thoả mãn ràng buộc sau : size(fill_values,k) phải size(A,k+2) Chẳng hạn , A ảnh RGB unit8 có kích thước 200x200x3 khả ‘FillValues’ bao gồm : + : Tô với màu đen +[0;0;0] : Tô với màu đen +255 : Tô với màu trắng + [255;255;255] : Tô với màu trắng +[0;0;255] : Tô với màu xanh +[255;255;0] : Tô với màu vàng Nếu A chiều 200x200x3x10 ‘FillValues’ vơ hướng 1x10,3x1,3x10 Trang 78 Nhận Dạng Cử Động Bàn Tay ThS Hồng Mạnh Hà 3.2 MƠ PHỎNG: 3.2.1 Thực thu nhận ảnh từ webcam: Trước hết để thực chương trình ta phải kết nối webcam với chương trình MATAB Để thực điều ta sử dung lệnh: vid = videoinput('winvideo', 1, 'RGB24_160x120'); Giải thích lệnh: Videoinput: truy cập thiết bị thu nhận hình ảnh với 160 x 120 kích thước Hình ảnh webcam thu nhận(do điều chỉnh phụ thuộc vào webcam) Preview: sử dụng cửa sổ để xem vị trí xác webcam Hình 3.6: ảnh kết nối webcam chương trinh MATLAB -dựa vào lệnh (hình ảnh minh họa) ta thu thập liệu hình ảnh để xử lý 3.2.2 Chuẩn hóa webcam : - Do trình thực xử lý ảnh phụ thuộc nhiều vào vị trí, độ tương phản hình, ánh sáng để chọn vị trí tốt chuyển động khơng mong muốn q trình thực tương tác webcam hình máy tính nên q trình chuẩn hóa webcam khơng thể thiếu q trình xử lý ảnh  Thực điểm sáng tối hình máy tính bốn góc : - Dựa vào tọa độ axes ta thực điểm tối bốn góc hình Ví dụ điểm thứ góc bên trái có tọa độ (1,1) điểm thứ tư Trang 79 Nhận Dạng Cử Động Bàn Tay ThS Hồng Mạnh Hà góc hình (30,40) Để thực điều trước tiên ta chỉnh tọa độ màu tọa độ(1,1) trùng với khung nền, sau để thực điểm sáng tọa độ điểm ta cho tọa độ màu điểm(1,1) khác so với màu khung axes Nhưng tốt ta nên chọn màu cho có tương phản lẫn webcam nhận biết rõ điều Giữa lần thay đổi màu ta để thời gian để thay đổi(giống bóng đèn chớp tắt) Hình 3.7: điểm tối Hình 3.8: điểm sáng bốn góc  Biến đổi điểm bốn góc(điểm sáng) thành tọa độ webcam - Vì vị trí webcam lệch so với hình tương tác nên điểm sáng có tọa độ khác so với tọa độ hình tưởng tác.chính điều làm cho tọa độ khung hình khác tọa độ so với webcam.Ví dụ ví trí điểm sáng theo khung axes là(1, 1), hiên thi webcam tọa độ ko (1,1) Chính điều làm cho việc xử lý bạn gặp khó khăn chạy ko xác Trang 80 Nhận Dạng Cử Động Bàn Tay ThS Hồng Mạnh Hà Hình 3.9: Tọa độ điểm quy đổi webcam  Chuẩn hóa điểm : - Do biết điểm axes thu nhận từ webcam có tọa độ khác nên việc chuẩn hóa điểm vị trí ban đầu khơng thể tránh khỏi Và dựa vào lệnh MATLAB ta thực điều đó, lại xảy khuyết điểm diểm bị nhịe dẫn đến việc xử lý không ta mong muốn Và điều khắc phục( để cập bên dưới) Hình 3.10: điểm biến đổi - Sau ta thực bốn điểm chuẩn hóa Tại vị trị xuất thơng số quan trọng nhất, ma trận chuẩn hóa số chuẩn hóa Và dựa vào ma trận chuẩn hóa số chuẩn hóa ta biển đổi điểm tọa độ webcam thu nhận thành tọa độ axes(khung hình) lúc điểm webcam thu nhận chuẩn hóa vị trí 3.2.3 Lấy ảnh biến đổi xám nền: - Sau chuẩn hóa điểm Ta tiến hành xử lý, việc ta phải chọn ảnh nền.Ở điểm ta phải chọn ảnh có màu tương phản với ánh sáng để tránh phản xạ lại ánh sáng, điều dẫn tới việc trích đặc trưng Trang 81 Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà vật thể khơng cịn xác Và để tiến hành lấy đặc trưng vật thể ta phải biến đổi ảnh thành ảnh mức xám để thể rõ ảnh Và ảnh phải đơn giản tốt, có nhiều vật thể vật phản xạ lượng ánh sáng khác Điều ảnh hưởng đến việc xử lý ảnh sau - Giải thích lênh: Getsnapshot: chụp hình ảnh mà đặc tính khơng chuyển động Hình 3.11: Ảnh chưa lấy xám Hình 3.12: Ảnh lấy xám 3.2.4 Lấy ảnh đối tượng biến đổi mức xám : - Sau lấy ảnh nền, ta tiến hành đưa bàn tay vào ảnh nền, điều quan trọng ảnh có bàn tay ảnh khơng có bàn tay phải hồn tồn giống vật thể, cường độ sáng….Để thực phép trừ điều quan trọng làm cho độ sáng ảnh khơng có bàn tay ảnh có bàn tay có cường độ sáng Ta làm điều cách biến đổi xám ảnh có bàn tay Trang 82 Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà Hình 3.13: Ảnh đối tượng Hình 3.14: Ảnh biến đổi xám đối tượng 3.2.5 Lấy hình dạng bàn tay loại bỏ đồng thời lấy nhị phân ảnh: - Sau ta biến đổi xám bàn tay, cường độ sáng khu vực bàn tay khác với cường độ sáng ảnh có bàn tay khác Dựa vào điều ta trích đặc trưng bàn tay cách thực phép trừ ảnh(vì MATLAB hình ảnh thể ma trận, điều quan trọng đầy ảnh ảnh có bàn tay phải kích thước với tức ma trận có kích thước giống nhau).Và để tránh trường hợp xảy số âm ta nên đưa trị tuyết đối vào phép trừ, để thuận lợi cho việc xử lý Để đơn giản hóa việc xử lý để thuận lời cho việc kiểm soát pixel ảnh ta phải biến đổi ảnh dạng nhị phân truanh= imabsdiff (anh11,anh22); anhnhiphan=im2bw(truanh,value); Trang 83 Nhận Dạng Cử Động Bàn Tay ThS Hồng Mạnh Hà Ví dụ : X = uint8([ 255 10 75; 44 225 100]); Y = uint8([ 50 50 50; 50 50 50 ]); Z = imabsdiff(X,Y) Z= 205 40 25 175 50 Hình 3.15: Ảnh lấy hình dạng bàn tay loại bỏ - Trong trình thực phép trừ ảnh, để đo độ sáng Khơng thể giống hồn toàn nên thực hiên phép trừ biến đổi nhị phân, xuất số điểm sáng không mong muốn điều khiến cho việc trích đặc trưng vật thể gặp nhiều khó khăn Và việc kiểm sốt pixel ảnh khơng mong muốn.Vì thể ta phải loại bỏ số điện tích khơng mong muốn Hình 3.16: Ảnh nhị phân hình dạng bàn tay Trang 84 Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà 3.2.6 Loại bỏ điện tích ko cần thiết: - Loại bỏ diện tích không mong muốn điều cần phải làm Điều thuận lợi ảnh nhị phận ảnh RGB ảnh nhị phận có số điều ta gắn mác cho khu vực mà ta cần xử lý Đồng thời ta đếm diện tích khu vực đó, dựa vào yếu tố ta loại bỏ diện tích khơng cần thiết Sau lệnh thực điều [anhnhiphan2,num] = bwlabel(anhnhiphan,4); - Giải thích Bwlabel: gán nhãn chỗ thành phần ảnh nhị phân L = bwlabel(BW,n): trả ma trận L vó kích thước tương ứng với BW, n giá trị [L,num] = bwlabel(BW,n): num số vật thể gán mác BW Ví dụ BW = [1 1 0 0 1 1 0 1 1 0 1 0 1 1 0 1 1 0 1 1 0 1 1 0 0 0]; L = bwlabel(BW,4) L= [1 1 0 0 1 2 0 1 2 0 1 0 1 0 1 0 1 0 3 1 0 0 0] Sau gán mác loại bỏ diện tích khơng mong muốn ta hình ảnh thể bên dưới: Trang 85 Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà Hình 3.17: Ảnh sau loại bỏ diện thích nhỏ khơng cần thiết 3.2.7 Tìm điểm cao vào trọng tâm: - Đây điều quan chương trình xử lý Đó việc tìm trọng tâm điểm cao bàn tay Thuật tốn tìm trọng tâm thực tổng moment theo chiều x y (công thức thể hiên biện dưới) Tìm điểm thuật tốn quan trọng Để làm rõ điểm chuẩn hóa ta dựa vào thuật tốn - Thuật tốn tìm trọng tâm: ( , ) = = ∗ ( , ) = ∗ ( , ) = = Với (Xo, Yo) tọa độ trọng tâm Trang 86 Nhận Dạng Cử Động Bàn Tay ThS Hồng Mạnh Hà Hình 3.18: Ảnh xác định trọng tâm điểm cao 3.2.8 Chuẩn hóa điểm cao - Sau ta có điểm đầu tiên, độ lệch webcam khiến cho điểm di chuyển sai vị trí ta mong muốn Ví ta phải chuẩn hóa điểm cho với vị trí khung axes Để thực điều ta sử dụng ma trận chuẩn hóa thơng số chuẩn hóa để chuyển đổi tọa độ điểm cao tọa độ khung axes Nhưng điểm mờ điều khơng trách khỏi Và ta phải làm sáng điểm Hình 3.19: Ảnh thể hiên điểm cao chuẩn hóa bị mờ - Dựa vào thuật tốn tím điểm ta làm sáng điểm cao nhất, minh họa điểm bên dưới: Trang 87 Nhận Dạng Cử Động Bàn Tay ThS Hồng Mạnh Hà Hình 3.20: Ảnh điểm chuẩn hóa làm rõ 3.2.9 Kết nhận được: - Trích đặc trưng bàn tay ta muốn, đồng thời loại bỏ số diện tích ta khơng mong muốn - Dù webcam có đặt vị trí điểm di chuyển theo ngon tay di chuyển theo bàn tay - Tao tương tác webcam hình máy tính 3.2.10 Kết khơng mong muốn: - Dù việc chuẩn hóa có tốt sai số phép tính phép làm tròn nên điểm cao lệch đôi chút so với di chuyển bàn tay - Do ta thực biên đổi nhiều lần nên xác điểm cao bàn tay khơng xác mong muốn - Do phụ thuộc nhiều vào ánh sáng nên nhiễu điều tránh khỏi - Do ta thực biến đổi ảnh nên kích thước ảnh thay đổi Nhưng chuẩn hóa nên điểm cao chạy theo bàn tay có sai sót đơi chút 3.2.11 Nhận dạng : Ta thực việc nhận dạng đối tượng theo phương pháp tương quan tín hiệu, cách đối sánh mẫu với đối tượng cần nhận dạng Việc thực cách thiết lập hàm tương quan ảnh mẫu w(x,y) ảnh xét f(x,y) c(s,t) = ∑ ∑ f(x, y)w(x − s, y − t) Hoặc thiết lập hệ số tương quan: Trang 88 Nhận Dạng Cử Động Bàn Tay γ(s,t)= {∑ ∑ ThS Hoàng Mạnh Hà ∑ ∑ ( , ) ( , ) ̅( , ) ̅( , ) [ ( ∑ ∑ [ ( ) , , ] ) ] } / Với trung bình w(x,y) f(̅ x, y) trị trung bình f(x,y) Việc hình dung việc chập cửa sổ trượt w(x,y) chứa ảnh mẫu lên ảnh f(x,y) để tìm đối tượng ảnh: Hình 3.21: Việc trượt cửa sổ tìm đối tượng lên ảnh Ta khảo sát với thực tế điều kiện ảnh tĩnh kích thước ảnh chưa giảm xuống: Hình 3.22: Kết nhận dạng ảnh tĩnh Trang 89 Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà Kết có ta có điểm đạt cực tương quan nhất, vị trí giống mẫu Chương trình xử lý lâu, ta phải giảm kích thước ảnh xuống mức tối thiểu để thực nhận dạng ảnh động nhanh Khuyết điểm lớn phương pháp đối tượng ta thay đổi kích thước, xoay, đổi chiều lớn so với mẫu việc nhận dạng sai 3.2.12 Giao diện thể hiện: Hình 3.23: Chương trình mơ tương tác Trang 90 Nhận Dạng Cử Động Bàn Tay ThS Hoàng Mạnh Hà TÀI LIỆU THAM KHẢO Tiếng Việt: [1] Lương Mạnh Bá, Nguyễn Thanh Thủy “Nhập môn xử lý ảnh số” nhà xuất khoa học kỹ thuật [2] Phạm Hồng Liên, Đặng Ngọc Khoa, Trần Thanh Phương “Matlab ứng dụng viễn thông” nhà xuất đại học quốc gia TPHCM Tiếng Anh: [3] Prentice Hall - Digital Image Processing By Gonzalez 2nd Edition 2002 [4] The Mathworks, “Image Processing Toolbox for use with MATLAB”, Version 7, 2005 [5] The Mathworks, “Image Acquisition Toolbox for use with MATLAB”, Version 7, 2005 Trang 91 ... trên, công thức (1.9) viết lại cách tường minh sau: Y(m,n)=H00Xm,n+H01Xm,n-1+H02Xm,n-2+H10Xm-1,n+H11Xm-1,n-1+H12Xm-1,n-2+H20Xm2,n+H21Xm-2,n-1+H22Xm-2,n-2 Với m Є [1,M] n Є [1,N] Các số viết theo... pixel lưu trữ 1, 4, hay 24 bit Sau pixel pixel lân cận nó: P1(x-1,y-1) P2(x-1,y) P3(x-1,y+1) P4(x,y-1) P(x,y) P5(x,y+1) P6(x+1,y-1) P7(x+1,y) P8(x+1,y+1) Một pixel p tọa độ (x,y) có pixel lân... H Và công thức (1.10) viết lại cách tường minh sau: Y(m,n)=H11Xm+1,n+1+H12Xm+1,n+H13Xm+1,n-1+H21Xm,n+1+H22Xm,n+H23Xm,n-1+H31Xm1,n+1+H32Xm-1,n+H33Xm-1,n-1 Với m Є [1,M] n Є [1,N] Các số viết theo

Ngày đăng: 30/10/2022, 07:19

w