Luận văn thạc sĩ điểm bất động và ứng dụng trong nhận dạng đối tượng

68 4 0
Luận văn thạc sĩ điểm bất động và ứng dụng trong nhận dạng đối tượng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

z CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT Auto-correlation matrix Co-variance matrix CSDL Differentiation Scale DoG Integration Scale LoG Scale Second moment matrix SIFT Ma trận tương quan tự động Ma trận đồng biến Cơ sở liệu Tỷ lệ vi phân Difference-of-Gaussian Tỷ lệ tích phân Laplacian-of-Gaussian Tỷ lệ Ma trận moment cấp hai Scale Invariant Feature Transform z DANH MỤC CÁC HÌNH VẼ Hình 1.1 Sơ đồ tổng quát hệ nhận dạng Hình 1.2 Hai đối tượng mặt phẳng Hình 1.3 Các tứ giác hình trịn mặt phẳng hai chiều Hình 1.4 Ví dụ bất biến hình học đối phép quay tịnh tiến 13 Hình 2.1 Một thể đa tỷ lệ tín hiệu 25 Hình 2.2 Các mức khác thể không gian tỷ lệ 26 Hình 2.3 Ví dụ tỷ lệ đặc trưng 29 Hình 2.4 Phát điểm quan tâm bất biến tỷ lệ 32 Hình 2.5 Điểm quan tâm bất biến tỷ lệ ảnh bị biến đổi affine 33 Hình 2.6 Biểu đồ giải thích phép chuẩn hóa affine 36 Hình 2.7 Phát lặp lại điểm quan tâm bất biến affine 42 Hình 2.8 Phát điểm quan tâm bất biến affine 43 Hình 2.9 Xây dựng thể khơng gian tỷ lệ 45 Hình 2.10 Các giá trị cực đại cực tiểu ảnh DoG 45 Hình 2.11 Các giai đoạn lựa chọn điểm khóa 48 Hình 2.12 Bộ mơ tả điểm khóa 51 Hình 3.1 Ví dụ tốn nhận dạng đối tượng: xác định xem đối tượng 54 ảnh (b) có ảnh (a) khơng? 54 Hình 3.2 Sơ đồ chức nhận dạng đối tượng 55 Hình 3.3 Giao diện chương trình 58 Hình 3.4 (a) Ảnh truy vấn chứa nhiều đối tượng; (b) Ảnh huấn luyện; 59 (c) Kết nhận dạng 59 Hình 3.5 (a) Ảnh truy vấn chứa nhiều đối tượng; 60 (b) Ảnh chứa đối tượng cần nhận dạng; (c) Kết nhận dạng 60 Hình 3.6 Khơng nhận dạng đối tượng 61 z MỞ ĐẦU Trong sống ngày, thường xuyên cần phải nhận dạng phân biệt vô số đối tượng kể đối tượng quen thuộc đối tượng lạ Các đối tượng biến đổi đơi chút hình thức, màu sắc, kết cấu, v.v… Các đối tượng nhận dạng từ nhiều tư khác (từ phía trước, bên cạnh phía sau), nhiều nơi nhiều kích thước khác Các đối tượng chí nhận dạng chúng bị che khuất phần đối tượng khác Vì vậy, việc nhận dạng đối tượng cách tự động vấn đề thiết thực xã hội đại Ngày nay, với phát triển mạnh mẽ ngành Khoa học máy tính bùng nổ lĩnh vực Cơng nghệ thông tin đẩy nhanh phát triển nhiều lĩnh vực xã hội quân sự, y học, giáo dục, kinh tế, giải trí v.v… Sự phát triển phần cứng phương diện thu nhận, hiển thị, với tốc độ xử lý mở nhiều hướng cho phát triển phần mềm, đặc biệt Công nghệ xử lý ảnh phát triển nhanh Nó giải tốn phát hiện, nhận dạng tự động loại đối tượng thực tế, chẳng hạn tạo hệ thống phát kẻ gian đột nhập vào quan cần giám sát sau hành Kho bạc, Ngân hàng v.v thay cần phải có đội bảo vệ canh gác cẩn thận Nhận dạng mặt người ảnh có nhiều ý nghĩa quân sự, an ninh v.v Rõ ràng toán phát đối tượng nhận dạng đối tượng ngày quan trọng phát triển xã hội, đặc biệt quan trọng cho xã hội Việt Nam Bài toán nhận dạng đối tượng toán cốt yếu lĩnh vực nhận dạng hay thị giác máy, sở cho nhiều ứng dụng quan trọng Nhận dạng đối tượng có nhiều cách tiếp cận để giải quyết, loại đối tượng có kỹ thuật cụ thể, song chúng có sở chung Một nguyên nhân định cho chất lượng nhận dạng đối tượng ảnh việc trích chọn đặc trưng Các đặc trưng trích chọn thường dựa vào đặc trưng bất biến Lý thuyết điểm bất động nghiên cứu nhiều toán học vật lý Việc nghiên cứu áp dụng lý thuyết để trích chọn đặc điểm phục vụ cho z nhận dạng xử lý ảnh hướng tiếp cận có nhiều hứa hẹn đối tượng có biến đổi kích thước, hình dạng, đối tượng bị che khuất số phận đối tượng chuyển động v.v Như toán nhận dạng đối tượng dựa vào đặc trưng bất biến mà tảng dựa vào điểm bất động cách tiếp cận khoa học nhận dạng, sở để xây dựng nhiều ứng dụng quan trọng cần thiết Trên điểm qua tầm quan trọng toán nhận dạng đối tượng, đặc biệt đối tượng bị biến đổi cho ta thấy rõ tính cần thiết tính thời đồng thời ý nghĩa khoa học thực tiễn vấn đề Nhận thức điều này, chọn đề tài luận văn: “Điểm bất động ứng dụng nhận dạng đối tượng” Bố cục luận văn bao gồm phần mở đầu, phần kết luận ba chương nội dung tổ chức sau: Chương 1: Tổng quan bất biến nhận dạng đối tượng Chương trình bày định nghĩa loại bất biến, lý thuyết điểm bất động, toán nhận dạng đối tượng cách giải Chương 2: Các phương pháp xác định điểm bất động ảnh Chương trình bày kỹ thuật xác định điểm bất động ảnh để xây dựng đặc trưng bất biến đối tượng sử dụng đặc trưng cho việc so khớp nhận dạng đối tượng Chương 3: Ứng dụng điểm bất động nhận dạng đối tượng Trong phần luận văn trình bày ứng dụng nhận dạng đối tượng dựa vào đặc trưng bất biến xây dựng từ điểm bất động, cài đặt thử nghiệm phương pháp trình bày chương z Chƣơng – TỔNG QUAN VỀ BẤT BIẾN VÀ NHẬN DẠNG ĐỐI TƢỢNG Chương trình bày tổng quan toán nhận dạng đối tượng ảnh, đề cập đến hai vần đề dạng bất biến ảnh lý thuyết điểm bất động 1.1 Tổng quan nhận dạng Trong lý thuyết nhận dạng nói chung nhận dạng ảnh nói riêng có cách tiếp cận khác nhau: - Nhận dạng dựa vào phân hoạch không gian - Nhận dạng cấu trúc - Nhận dạng dựa vào kỹ thuật mạng nơron Hai cách tiếp cận đầu kỹ thuật kinh điển Các đối tượng ảnh quan sát thu nhận phải trải qua giai đoạn tiền xử lý nhằm tăng cường chất lượng, làm chi tiết, trích chọn biểu diễn đặc trưng cuối qua giai đoạn nhận dạng Cách tiếp cận thứ ba hồn tồn khác Nó dựa vào chế đốn nhận, lưu trữ phân biệt đối tượng mô theo hoạt động hệ thần kinh người Do chế đặc biệt, đối tượng thu nhận thị giác người không cần qua giai đoạn cải tiến mà chuyển sang giai đoạn tổng hợp, đối sánh mẫu lưu trữ để nhận dạng Nhận dạng trình phân loại đối tượng biểu diễn theo mơ hình gán cho chúng lớp (gán cho đối tượng tên gọi) dựa theo quy luật mẫu chuẩn Quá trình nhận dạng dựa vào mẫu học biết trước gọi nhận dạng có thầy hay học có thầy; trường hợp ngược lại gọi học khơng có thầy z 1.1.1 Không gian biểu diễn đối tƣợng, không gian diễn dịch 1.1.1.1 Không gian biểu diễn đối tƣợng Các đối tượng quan sát hay thu nhận được, thường biểu diễn tập đặc trưng hay đặc tính Như trường hợp xử lý ảnh, ảnh sau tăng cường để nâng cao chất lượng, phân vùng trích chọn đặc tính biểu diễn đặc trưng biên, miền đồng nhất, v.v Người ta thường phân đặc trưng theo loại như: đặc trưng tơpơ, đặc trưng hình học đặc trưng chức Việc biểu diễn ảnh theo đặc trưng tùy thuộc vào ứng dụng Ở ta đưa cách hình thức cho việc biểu diễn đối tượng Giả sử đối tượng X biểu diễn n thành phần (n đặc trưng): X={x1, x2,…,xn}; xi biểu diễn đặc trưng Không gian biểu diễn đối tượng thường gọi tắt không gian đối tượng X định nghĩa: X = { X1, X2,…, Xm} Xi biểu diễn đối tượng Khơng gian vơ hạn Để xem xét xét tập X hữu hạn 1.1.1.2 Không gian diễn dịch Không gian diễn dịch tập tên gọi đối tượng Kết thúc trình nhận dạng ta xác định tên gọi cho đối tượng tập không gian đối tượng hay nói cách khác nhận dạng đối tượng Một cách hình thức gọi  tập tên đối tượng:  = {w1, w2, …, wk} với wi, i = 1, 2,…, k tên đối tượng Quá trình nhận dạng đối tượng f ánh xạ f: X   với f tập quy luật để định phần tử X ứng với phần tử  1.1.2 Mô hình chất trình nhận dạng 1.1.2.1 Mơ hình Việc lựa chọn q trình nhận dạng có liên quan mật thiết đến kiểu mơ tả mà người ta sử dụng để đặc tả đối tượng Trong nhận dạng, người ta phân chia làm hai họ lớn: z - Họ mô tả theo tham số - Họ mô tả theo cấu trúc Cách mô tả lựa chọn xác định mơ hình đối tượng Như vậy, có hai loại mơ hình: mơ hình theo tham số mơ hình theo cấu trúc * Mơ hình tham số: sử dụng vectơ để đặc tả đối tượng Mỗi phần tử vectơ mơ tả đặc tính đối tượng Ví dụ đặc trưng chức năng, người ta sử dụng sở trực giao để biểu diễn Và vậy, ảnh biểu diễn chuỗi hàm trực giao Giả sử C đường bao ảnh C(i,j) điểm thứ i đường bao, i = 1, 2,…, N (đường bao gồm N điểm) Giả sử tiếp: x0  N  xi N i1 N y   yi N i1 tọa độ tâm điểm Như vậy, moment trung tâm bậc p, q đường bao là: μ pq  N (x i -x )p (yi -y0 )q  N i1 Vectơ tham số trường hợp moment ij với i = 1, 2,…, p j = 1, 2,…, q Còn số đặc trưng hình học, người ta sử dụng chu tuyến, đường bao, diện tích tỷ lệ T = 4S/p2, với S diện tích, p chu tuyến Việc lựa chọn phương pháp biểu diễn làm đơn giản cách xây dựng Tuy nhiên, việc lựa chọn đặc trưng hoàn toàn phụ thuộc vào ứng dụng * Mơ hình cấu trúc: cách tiếp cận mơ hình dựa vào việc mơ tả đối tượng nhờ số khái niệm biểu thị đối tượng sở ngôn ngữ tự nhiên Để mô tả đối tượng, người ta dùng số dạng nguyên thủy đoạn thẳng, cung, v.v… Trong mơ hình này, người ta sử dụng ký hiệu kết thúc Vt, ký hiệu khơng kết thúc gọi Vn Ngồi có dùng tập luật sản xuất để mô tả cách xây dựng đối tượng phù hợp dựa đối tượng đơn giản đối tượng nguyên thủy (tập Vt) Trong cách tiếp cận này, ta chấp nhận khẳng định là: cấu trúc dạng kết việc áp dụng luật sản xuất theo nguyên tắc xác định dạng gốc bắt đầu Một z cách hình thức, ta coi mơ hình tương đương văn phạm G = (V t, Vn, P, S) với: - Vt ký hiệu kết thúc, - Vn ký hiệu không kết thúc, - P luật sản xuất, - S dạng (ký hiệu bắt đầu) 1.1.2.2 Bản chất trình nhận dạng Q trình nhận dạng gồm giai đoạn chính: - Lựa chọn mơ hình biểu diễn đối tượng - Lựa chọn luật định (phương pháp nhận dạng) suy diễn trình học - Học nhận dạng Khi mơ hình biểu diễn đối tượng xác định, định lượng (mơ hình tham số) hay định tính (mơ hình cấu trúc), q trình nhận dạng chuyển sang giai đoạn học Học giai đoạn quan trọng Thao tác học nhằm cải thiện, điều chỉnh việc phân hoạch tập đối tượng thành lớp Việc nhận dạng tìm quy luật thuật tốn để gán đối tượng vào lớp hay nói cách khác gán cho đối tượng tên Nhìn chung, dù mơ hình kỹ thuật nhận dạng sao, hệ thống nhận dạng tóm tắt theo sơ đồ sau: Trích chọn đặc trƣng biểu diễn đối tƣợng Phân lớp định Quá trình tiền xử lý trả lời Đánh giá Khối nhận dạng Hình 1.1 Sơ đồ tổng quát hệ nhận dạng 1.1.3 Bài toán nhận dạng đối tƣợng ảnh Cho trước đối tượng hai chiều Tồn nhiều toán nhận dạng khác đối tượng ảnh hai chiều z Bài toán 1: Cho hai đối tượng ảnh hai chiều Hình 1.2 Hãy so sánh xem chúng có giống hay khơng? Hình 1.2 Hai đối tƣợng mặt phẳng Bài tốn người giải cách nhanh chóng (Hai đối tượng có diện tích giống khác lỗ hổng) Nhưng máy việc giải tốn khơng dễ dàng Bài tốn 2: Cho hai đối tượng ảnh có kích thước khác đặt tùy ý mặt phẳng Hãy so sánh xem chúng có “giống nhau” hay khơng? Để giải tốn người đặt chúng lại theo vị trí thích hợp cho hướng nằm chúng giống Sau dùng độ đo khác để so sánh hai đối tượng Chẳng hạn, đặt đối tượng theo vị trí cần sử dụng phép biến đổi quay, tịnh tiến Trong hoàn cảnh khác người ta xem hai đối tượng đồng dạng giống Do đó, q trình giải tốn người tự mã hóa thơng số đối tượng ảnh bất biến theo vị trí, hướng tỷ lệ Đây việc khó khăn Bài tốn 3: Cho đối tượng Hình 1.3 Hãy phân loại chúng thành hai lớp Để giải tốn người phân chia đối tượng thành hai lớp tứ giác {b,c,e} hình trịn {a,d} Người ta chia thành hai lớp đối tượng có diện tích {a,b,c} {d,e} b a d c e Hình 1.3 Các tứ giác hình trịn mặt phẳng hai chiều z 53 vectơ xóa bỏ thay đổi độ tương phản Thay đổi độ sáng tức số cộng vào điểm ảnh, điều không ảnh hưởng đến giá trị gradient, giá trị gradient tính từ độ chênh lệch điểm ảnh Bởi vậy, mô tả bất biến thay đổi affine độ sáng Tuy nhiên, thay đổi độ sáng phi tuyến tính xảy bão hòa camera thay đổi chiếu sáng mà chúng ảnh hưởng đến bề mặt 3D với hướng khác lượng khác Các ảnh hưởng gây nên thay đổi lớn cường độ liên quan số gradient, có khả ảnh hưởng đến hướng gradient Vì vậy, giảm tác động cường độ gradient lớn việc lấy ngưỡng giá trị vectơ đơn vị đặc trưng cho cường độ không vượt 0.2, sau chuẩn hóa lại chiều dài đơn vị Điều có nghĩa việc so khớp cường độ gradient lớn khơng cịn quan trọng nữa, phân bố hướng điều quan trọng Giá trị 0.2 xác định thực nghiệm sử dụng ảnh có độ chiếu sáng khác cho đối tượng 3D 2.5 Kết luận Trên trình bày phương pháp phát điểm quan tâm bất biến tỷ lệ bất biến affine ảnh Thuật toán phát điểm bất biến affine làm thích nghi đồng thời vị trí, tỷ lệ hình dạng vùng lân cận điểm để thu điểm bất biến affine Khơng có phương pháp phương pháp trước giải đồng thời cho tất tham số thuật tốn trích chọn đặc trưng Các phương pháp bất biến tỷ lệ xử lý tốt cho thay đổi tỷ lệ lớn phương pháp bất biến affine lại thất bại ảnh có phép biến đổi affine lớn Các điểm bất biến affine mang lại so khớp tin cậy cho ảnh có biến dạng hình phối cảnh đáng kể Tuy nhiên, tính ổn định độ hội tụ vùng affine chủ đề hướng nghiên cứu tương lai tính bền vững chúng đường biên cụt (occlusions) z 54 Chƣơng – ỨNG DỤNG ĐIỂM BẤT ĐỘNG TRONG NHẬN DẠNG ĐỐI TƢỢNG Phần trình bày ứng dụng phương pháp xác định điểm bất động việc trích chọn đặc trưng để giải tốn nhận dạng đối tượng ảnh Cài đặt thử nghiệm phương pháp trình bày chương 3.1 Bài toán nhận dạng đối tƣợng Phát biểu toán Cho trước hai ảnh, ảnh thứ chứa nhiều đối tượng, ảnh thứ hai chứa đối tượng nhất, yêu cầu xác định xem ảnh thứ có đối tượng ảnh thứ hai khơng, chí đối tượng nằm tọa độ ảnh thứ (a) (b) Hình 3.1 Ví dụ tốn nhận dạng đối tƣợng: xác định xem đối tƣợng ảnh (b) có ảnh (a) khơng? Cách giải tốn Tư tưởng: Cho trước ảnh huấn luyện đối tượng cần nhận dạng, ta tìm ảnh cần xét (ảnh truy vấn) có đối tượng hay khơng Bằng cách đánh giá mức độ giống đối tượng ảnh cho trước với đối tượng ảnh z 55 truy vấn Do cần phải giải toán theo cách đối sánh đặc trưng ảnh cho trước với đặc trưng ảnh truy vấn Một cách nơm na trường hợp đặc biệt toán tra cứu ảnh dựa đặc trưng đặc biệt Và lưu ý yếu tố thời gian thực ln quan tâm cho tốn, mức độ cần thiết tùy thuộc vào tốn mà ta giải quyết, yếu tố định thành cơng hay thất bại nhiều tốn Như vậy, toán nhận dạng đối tượng kỹ thuật Xử lý ảnh gồm ba pha chính: - Xác định trích chọn đặc trưng hai ảnh cách độc lập - Đánh giá độ tương tự (độ giống nhau) đối tượng hai ảnh dựa vào việc so khớp đặc trưng trích chọn - Phân tích xác suất để thực xác minh cuối Đây tốn lớn lĩnh vực nhận dạng thị giác máy 3.1.1 Mơ hình toán nhận dạng đối tƣợng Ảnh đầu vào Ảnh huấn luyện Trích chọn đặc trƣng: Bất biến Trích chọn đặc trƣng: Bất biến So sánh độ tƣơng tự Ảnh kết (ảnh có khoanh vùng đối tƣợng nhận dạng đƣợc) Hình 3.2 Sơ đồ chức nhận dạng đối tƣợng z 56 3.1.2 Thuật toán Để giải toán ta sử thuật toán “Phép biến đổi đặc trưng bất biến tỷ lệ” (Scale Invariant Feature Transform – SIFT) mô tả chi tiết chương Đây phương pháp hiệu để trích chọn điểm bất biến xây dựng nên đặc trưng có tính phân biệt cao từ ảnh dùng để thực so khớp tin cậy tầm nhìn khác đối tượng Phương pháp gồm giai đoạn chính: phát cực trị không gian tỷ lệ, định vị xác điểm khóa, gán hướng cho điểm khóa xây dựng đặc trưng Được trình bày vắn tắt lại sau: * Phát cực trị không gian tỷ lệ Giai đoạn trình trích chọn điểm bất động tìm kiếm tất tỷ lệ vị trí ảnh để xác định điểm quan tâm tiềm tàng mà chúng bất biến có thay đổi tỷ lệ phép quay Xây dựng thể không gian tỷ lệ cho ảnh sử dụng hàm L(x,y,) tạo phép cuộn ảnh đầu vào I(x,y) với hàm Gaussian biến thiên tỷ lệ G(x,y,): L( x, y, )  G( x, y, )  I ( x, y) Chúng ta xét điểm đặc trưng mà hàm D(x,y,) đạt cực trị địa phương, hàm tạo dựa vào chênh lệch hai mức tỷ lệ lân cận phân biệt thừa số k: D( x, y, )  L( x, y, k )  L( x, y, ) * Định vị điểm khóa Một cực trị địa phương hàm D(x,y,) tìm thấy, việc định vị xác điểm khóa, có nhiều cực trị phát có lượng định điểm khóa ổn định đặc trưng Để định vị xác điểm khóa ta thực chỉnh chi tiết vị trí điểm khóa ứng cử cho phù hợp với liệu lân cần vị trí, tỷ lệ, tỷ lệ độ cong chủ yếu Thông tin cho phép loại bỏ điểm có độ tương phản thấp điểm định vị dọc theo biên z 57 Hướng tiếp cận sử dụng phép khai triển Taylor hàm không gian tỷ lệ D(x,y,): D(x)  D  DT 2 D x  xT x x x Vị trí cực trị cho cơng thức sau:  D 1 D  x x x  Nếu |D( x )| thấp ngưỡng vị trí ứng cử bị loại bỏ Trong chương trình ta sử dụng ngưỡng 0.03 để loại bỏ cực trị không ổn định Khi giá trị riêng ma trận Hessian H:  Dxx Dxy   D D yy    xy H tính, vị trí ứng cử bị loại bỏ giá trị riêng nhỏ thấp ngưỡng * Gán hƣớng Một nhiều hướng gán cho vị trí điểm khóa dựa vào hướng gradient ảnh cục Tất thao tác sau thực liệu ảnh bị biến đổi có liên quan đến hướng gán, tỷ lệ, vị trí điểm khóa, cung cấp bất biến phép biến đổi Để tính tốn hướng cho điểm khóa (xk,yk,k) ta sử dụng gradient ảnh L(xk,yk,k) chọn tỷ lệ thích hợp Chúng ta tính tốn biểu đồ hướng gradient L vùng ảnh đặt vị trí (xk,yk) Mỗi mẫu biểu đồ hướng gán trọng số cường độ gradient Hướng điểm khóa gán cho đỉnh biểu đồ hướng * Xây dựng đặc trƣng Đặc trưng xây dựng cách tạo mơ tả cho điểm khóa Một mơ tả hình thành việc lấy mẫu cường độ hướng gradient vùng ảnh xung quanh vị trí điểm khóa, hướng biểu diễn có liên quan đến hướng điểm khóa Các biểu đồ hướng tính 4x4 vùng mẫu Mỗi biểu đồ có bin hướng, mơ tả có tổng cộng 128 phần tử z 58 * So khớp đặc trƣng Sau trích chọn đặc trưng từ ảnh huấn luyện ảnh truy vấn, bước tiến hành nhận dạng đối tượng Nhận dạng đối tượng thực cách so khớp đặc trưng cách độc lập tới sở liệu (CSDL) đặc trưng trích chọn từ ảnh huấn luyện Một so khớp ứng cử tốt cho đặc trưng tìm thấy việc xác định láng giềng gần CSDL đặc trưng Láng giềng gần xác định đặc trưng có khoảng cách Euclide ngắn 3.2 Cài đặt thử nghiệm 3.2.1 Cài đặt chƣơng trình Các tính chính: Chương trình viết ngơn ngữ Visual C++ 6.0, chạy hệ điều hành Window XP, máy tính tốc độ 1,5GHz, nhớ 512MB RAM Chương trình có chức sau: - Cho phép người sử dụng lựa chọn ảnh truy vấn ảnh chứa đối tượng cần nhận dạng, lựa chọn thuộc tính tìm kiếm - Hiển thị kết nhận dạng Giao diện chương trình: Hình 3.3 Giao diện chƣơng trình z 59 3.2.2 Một số kết thực nghiệm Thực cài đặt thử nghiệm phương pháp “Phép biến đổi đặc trưng bất biến tỷ lệ” để trích chọn đặc trưng bất biến, sau sử dụng thuật tốn láng giềng gần để so khớp nhận dạng Bước đầu với số kết sau: (a) (b) (c) Hình 3.4 (a) Ảnh truy vấn chứa nhiều đối tƣợng; (b) Ảnh huấn luyện; (c) Kết nhận dạng Hình 3.4 thể kết nhận dạng đối tượng, ảnh (a) đối tượng thu nhận tương đối rõ ràng nên việc trích chọn so khớp đặc trưng tiến hành khơng khó khăn độ xác tương đối cao, góc nhìn đối tượng cần nhận dạng hai giống khác tỷ lệ không đáng kể z 60 (a) (b) (c) Hình 3.5 (a) Ảnh truy vấn chứa nhiều đối tƣợng; (b) Ảnh chứa đối tƣợng cần nhận dạng; (c) Kết nhận dạng Hình 3.5 thể kết thực nghiệm khác nhận dạng đối tượng, đối tượng cần nhận dạng hai ảnh có khác đơi chút góc nhìn, ảnh truy vấn lại chứa q nhiều đối tượng, thu nhận không rõ ràng có nhiều đặc trưng tìm thấy ảnh (a) việc so khớp đặc trưng nhiều thời gian số lượng so khớp khơng xác tăng lên Tuy nhiên nhận dạng đối tượng z 61 Hình 3.6 Khơng nhận dạng đƣợc đối tƣợng Hình 3.6 thể ví dụ khơng nhận dạng đối tượng cần nhận dạng bị che khuất nhiều nên điểm khóa trích chọn từ vị trí có đối tượng khơng tương ứng với đặc trưng ảnh thứ hai nên việc so khớp không thành cơng * Nhận xét: Thuật tốn đánh giá hiệu qủa việc trích chọn đặc trưng phục vụ cho việc nhận dạng đối tượng, đặc biệt ảnh thu nhận có tỷ lệ khác đối tượng ảnh đặt góc nhìn khác Tuy nhiên q trình cài đặt thuật tốn chưa xử lý trường hợp đối tượng cần nhận dạng bị che khuất số phận bị thay đổi góc nhìn, tỷ lệ lớn z 62 KẾT LUẬN Một vấn đề kinh điển thị giác máy xử lý ảnh xác định xem liệu có hay khơng liệu ảnh chứa đối tượng, đặc trưng hay hoạt động Thơng thường cơng việc giải người cách đơn giản không cần phải nỗ lực nhiều, khơng giải cách hài lịng thị giác máy trường hợp tổng quát: đối tượng tùy ý hoàn cảnh khác Các phương pháp thời cho việc giải vấn đề giải tốt cho đối tượng đặc biệt đối tượng hình học đơn giản, mặt người, ký tự viết tay hay ký tự in, loại xe v.v… hồn cảnh đặc biệt, mơ tả cách điển hình chiếu sáng, rõ ràng Một hướng tiếp cận để nhận dạng đối tượng hiệu nhiều nhóm nghiên cứu ý gần dựa vào đặc trưng bất biến đối tượng Làm nhận dạng xác đối tượng ảnh cho dù đối tượng có biến đổi đơi chút hình thức, thay đổi tỷ lệ thu nhận ảnh, đối tượng cần nhận dạng bị che khuất phần đối tượng khác hay biến đổi khác vấn đề có ý nghĩa Xuất phát từ thực tế luận văn nhằm tìm hiểu tổng quan nhận dạng đối tượng, phương pháp phát đặc trưng bất biến mà tảng dựa vào điểm bất động ứng dụng chúng nhận dạng Cụ thể luận văn đạt kết sau:  Trình bày tổng quan trình tốn nhận dạng đối tượng ảnh, đề cập đến hai vấn đề dạng bất biến ảnh lý thuyết điểm bất động  Hệ thống hóa số phương pháp phát điểm bất động ảnh như: Phương pháp Harris, phương pháp Harris-Laplace, phương pháp Harris-Affine phương pháp “Phép biển đổi đặc trưng bất biến tỷ lệ”  Cài đặt thử nghiệm kỹ thuật trình bày chương 2: cài đặt phương pháp “Phép biến đổi đặc trưng bất biến tỷ lệ” trường z 63 hợp ảnh có khác tỷ lệ, góc nhìn đối tượng ảnh khơng bị che khuất số phận không đáng kể Các vấn đề nghiên cứu tiếp tục:  Các ảnh thu nhận có khác đáng kể tỷ lệ, đối tượng cần nhận dạng bị che khuất nhiều phần  Ảnh chứa đối tượng cần nhận dạng chịu phép biến đổi affine, thay đổi độ sáng, độ tương phản z 64 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Thanh Thủy, 2002, “Nhập môn xử lý ảnh số”, Trường Đại học Bách khoa Hà Nội Tiếng Anh [2] Basri, R., and Jacobs, D.W 1997 Recognition using region correspondences International Journal of Computer Vision, 25(2):145- 166 [3] Baumberg, A 2000 Reliable feature matching across widely separated views In Conference on Computer Vision and Pattern Recognition, Hilton Head, South Carolina, pp 774-781 [4] Brown, M and Lowe, D.G 2002 Invariant features from interest point groups In The 13th British Machine Vision Conference, Cardiff University, UK, pp 253–262 [5] Harris, C and Stephens, M.J 1988 A combined corner and edge detector In Alvey Vision Conference, pages 147–152 [6] Lindeberg, T 1994 Scale-space theory: A basic tool for analysing structures at different scales Journal of Applied Statistics, 21(2):224-270 [7] Lowe, D.G 1999 Object recognition from local scale-invariant features In International Conference on Computer Vision, Corfu, Greece, pp 1150-1157 [8] Lowe, D.G 2004 Distinctive image features from Scale-Invariant keypoints International Journal of Computer Vision [9] Mikolajczyk, K 2002 Detection of local features invariant to affine transformations, Ph.D thesis, Institut National Polytechnique de Grenoble, France [10] Mikolajczyk, K., and Schmid, C 2004 Scale & affine invariant interest point detectors International Journal of Computer Vision 60(1), 63-86 z 65 [11] Mikolajczyk, K and Schmid, C 2005 A performance evaluation of local descriptors In IEEE Transactions on Pattern Analysis and Machine Intelligence [12] Rothganger, F., Lazebnik, S., Schmid, C and Ponce J 2005 Object modeling and recognition using local affine-invariant image descriptors and multi-view spatial consraints In International Journal of Computer Vision [13] http://en.wikipedia.org/wiki/Fixed-point_theorem [14] http://signal.ece.utexas.edu/seminars/dsp_seminars/02spring/danilo.html [15] http://www.hindawi.com/journals/fpta/guidelines.html [16] http://www.icassp2003.com/archives/5 z 66 MỤC LỤC CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT DANH MỤC CÁC HÌNH VẼ .2 MỞ ĐẦU Chƣơng  TỔNG QUAN VỀ BẤT BIẾN VÀ NHẬN DẠNG .5 ĐỐI TƢỢNG 1.1 Tổng quan nhận dạng 1.1.1 Không gian biểu diễn đối tượng, không gian diễn dịch .6 1.1.1.1 Không gian biểu diễn đối tượng 1.1.1.2 Không gian diễn dịch 1.1.2 Mơ hình chất trình nhận dạng 1.1.2.1 Mơ hình 1.1.2.2 Bản chất trình nhận dạng 1.1.3 Bài toán nhận dạng đối tượng ảnh 1.2 Tổng quan bất biến vai trò bất biến nhận dạng 10 1.2.1 Bất biến moment thống kê 10 1.2.2 Bất biến hình học 13 1.2.3 Bất biến đại số 15 1.2.4 Vai trò bất biến nhận dạng 16 1.3 Điểm bất động vai trò điểm bất động nhận dạng 17 1.3.1 Lý thuyết điểm bất động 17 1.3.2 Vai trò điểm bất động nhận dạng đối tượng 19 1.3.2.1 Trích chọn đặc trưng bất biến từ điểm bất động 19 1.3.2.2 So khớp đặc trưng 20 Chƣơng  CÁC PHƢƠNG PHÁP XÁC ĐỊNH ĐIỂM BẤT ĐỘNG 22 TRONG ẢNH 22 2.1 Phương pháp Harris 22 2.2 Phương pháp Harris-Laplace 24 2.2.1 Sự thể không gian tỷ lệ 24 2.2.2 Hàm Harris thích nghi tỷ lệ 27 2.2.3 Sự lựa chọn tỷ lệ tự động 28 z 67 2.2.3 Thuật toán phát điểm bất biến Harris-Laplace 29 2.2.3.1 Thuật toán Harris-Laplace 30 2.2.3.2 Thuật toán Harris-Laplace đơn giản 31 2.2.3.3 Ví dụ điểm bất biến 31 2.3 Phương pháp xác định điểm bất biến Harris-Affine 32 2.3.1 Động thúc đẩy 32 2.3.2 Ma trận moment cấp hai affine 33 2.3.2.1 Phép biến đổi affine ma trận moment cấp hai 34 2.3.2.2 Phép đo tính đẳng hướng 36 2.3.3 Phương pháp phát điểm bất biến Harris-Affine 37 2.4 Phương pháp “Phép biến đổi đặc trưng bất biến tỷ lệ” 44 2.4.1 Phát cực trị không gian tỷ lệ 44 2.4.1.1 Tần số lấy mẫu theo tỷ lệ 46 2.4.1.2 Tần số lấy mẫu vùng không gian 47 2.4.2 Định vị xác điểm khóa 47 2.4.3 Gán hướng cho điểm khóa 50 2.4.4 Bộ mô tả ảnh cục 51 2.5 Kết luận 53 Chƣơng  ỨNG DỤNG ĐIỂM BẤT ĐỘNG TRONG 54 NHẬN DẠNG ĐỐI TƢỢNG 54 3.1 Bài toán nhận dạng đối tượng 54 3.1.1 Mô hình tốn nhận dạng đối tượng 55 3.1.2 Thuật toán 56 3.2 Cài đặt thử nghiệm 58 3.2.1 Cài đặt chương trình 58 3.2.2 Một số kết thực nghiệm 59 KẾT LUẬN 62 TÀI LIỆU THAM KHẢO 64 z ... định điểm bất động ảnh để xây dựng đặc trưng bất biến đối tượng sử dụng đặc trưng cho việc so khớp nhận dạng đối tượng Chương 3: Ứng dụng điểm bất động nhận dạng đối tượng Trong phần luận văn. .. hình dạng chúng giữ lại số điểm định không thay đổi, dựa vào điểm bất biến đối tượng ta nhận dạng đối tượng 1.3.2.1 Trích chọn đặc trƣng bất biến từ điểm bất động Một ứng dụng quan trọng điểm bất. .. hẹn đối tượng có biến đổi kích thước, hình dạng, đối tượng bị che khuất số phận đối tượng chuyển động v.v Như toán nhận dạng đối tượng dựa vào đặc trưng bất biến mà tảng dựa vào điểm bất động

Ngày đăng: 06/03/2023, 15:41

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan