(LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

68 2 0
(LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TIEU LUAN MOI download : skknchat@gmail.com CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT Auto-correlation matrix Co-variance matrix CSDL Differentiation Scale DoG Integration Scale LoG Scale Second moment matrix SIFT Ma trận tương quan tự động Ma trận đồng biến Cơ sở liệu Tỷ lệ vi phân Difference-of-Gaussian Tỷ lệ tích phân Laplacian-of-Gaussian Tỷ lệ Ma trận moment cấp hai Scale Invariant Feature Transform TIEU LUAN MOI download : skknchat@gmail.com DANH MỤC CÁC HÌNH VẼ Hình 1.1 Sơ đồ tổng quát hệ nhận dạng Hình 1.2 Hai đối tượng mặt phẳng Hình 1.3 Các tứ giác hình trịn mặt phẳng hai chiều Hình 1.4 Ví dụ bất biến hình học đối phép quay tịnh tiến 13 Hình 2.1 Một thể đa tỷ lệ tín hiệu 25 Hình 2.2 Các mức khác thể không gian tỷ lệ 26 Hình 2.3 Ví dụ tỷ lệ đặc trưng 29 Hình 2.4 Phát điểm quan tâm bất biến tỷ lệ 32 Hình 2.5 Điểm quan tâm bất biến tỷ lệ ảnh bị biến đổi affine 33 Hình 2.6 Biểu đồ giải thích phép chuẩn hóa affine 36 Hình 2.7 Phát lặp lại điểm quan tâm bất biến affine 42 Hình 2.8 Phát điểm quan tâm bất biến affine 43 Hình 2.9 Xây dựng thể khơng gian tỷ lệ 45 Hình 2.10 Các giá trị cực đại cực tiểu ảnh DoG 45 Hình 2.11 Các giai đoạn lựa chọn điểm khóa 48 Hình 2.12 Bộ mơ tả điểm khóa 51 Hình 3.1 Ví dụ tốn nhận dạng đối tượng: xác định xem đối tượng 54 ảnh (b) có ảnh (a) khơng? 54 Hình 3.2 Sơ đồ chức nhận dạng đối tượng 55 Hình 3.3 Giao diện chương trình 58 Hình 3.4 (a) Ảnh truy vấn chứa nhiều đối tượng; (b) Ảnh huấn luyện; 59 (c) Kết nhận dạng 59 Hình 3.5 (a) Ảnh truy vấn chứa nhiều đối tượng; 60 (b) Ảnh chứa đối tượng cần nhận dạng; (c) Kết nhận dạng 60 Hình 3.6 Khơng nhận dạng đối tượng 61 TIEU LUAN MOI download : skknchat@gmail.com MỞ ĐẦU Trong sống ngày, thường xuyên cần phải nhận dạng phân biệt vô số đối tượng kể đối tượng quen thuộc đối tượng lạ Các đối tượng biến đổi đơi chút hình thức, màu sắc, kết cấu, v.v… Các đối tượng nhận dạng từ nhiều tư khác (từ phía trước, bên cạnh phía sau), nhiều nơi nhiều kích thước khác Các đối tượng chí nhận dạng chúng bị che khuất phần đối tượng khác Vì vậy, việc nhận dạng đối tượng cách tự động vấn đề thiết thực xã hội đại Ngày nay, với phát triển mạnh mẽ ngành Khoa học máy tính bùng nổ lĩnh vực Công nghệ thông tin đẩy nhanh phát triển nhiều lĩnh vực xã hội quân sự, y học, giáo dục, kinh tế, giải trí v.v… Sự phát triển phần cứng phương diện thu nhận, hiển thị, với tốc độ xử lý mở nhiều hướng cho phát triển phần mềm, đặc biệt Công nghệ xử lý ảnh phát triển nhanh Nó giải toán phát hiện, nhận dạng tự động loại đối tượng thực tế, chẳng hạn tạo hệ thống phát kẻ gian đột nhập vào quan cần giám sát sau hành Kho bạc, Ngân hàng v.v thay cần phải có đội bảo vệ canh gác cẩn thận Nhận dạng mặt người ảnh có nhiều ý nghĩa quân sự, an ninh v.v Rõ ràng toán phát đối tượng nhận dạng đối tượng ngày quan trọng phát triển xã hội, đặc biệt quan trọng cho xã hội Việt Nam Bài toán nhận dạng đối tượng toán cốt yếu lĩnh vực nhận dạng hay thị giác máy, sở cho nhiều ứng dụng quan trọng Nhận dạng đối tượng có nhiều cách tiếp cận để giải quyết, loại đối tượng có kỹ thuật cụ thể, song chúng có sở chung Một nguyên nhân định cho chất lượng nhận dạng đối tượng ảnh việc trích chọn đặc trưng Các đặc trưng trích chọn thường dựa vào đặc trưng bất biến Lý thuyết điểm bất động nghiên cứu nhiều toán học vật lý Việc nghiên cứu áp dụng lý thuyết để trích chọn đặc điểm phục vụ cho TIEU LUAN MOI download : skknchat@gmail.com nhận dạng xử lý ảnh hướng tiếp cận có nhiều hứa hẹn đối tượng có biến đổi kích thước, hình dạng, đối tượng bị che khuất số phận đối tượng chuyển động v.v Như toán nhận dạng đối tượng dựa vào đặc trưng bất biến mà tảng dựa vào điểm bất động cách tiếp cận khoa học nhận dạng, sở để xây dựng nhiều ứng dụng quan trọng cần thiết Trên điểm qua tầm quan trọng toán nhận dạng đối tượng, đặc biệt đối tượng bị biến đổi cho ta thấy rõ tính cần thiết tính thời đồng thời ý nghĩa khoa học thực tiễn vấn đề Nhận thức điều này, chọn đề tài luận văn: “Điểm bất động ứng dụng nhận dạng đối tượng” Bố cục luận văn bao gồm phần mở đầu, phần kết luận ba chương nội dung tổ chức sau: Chương 1: Tổng quan bất biến nhận dạng đối tượng Chương trình bày định nghĩa loại bất biến, lý thuyết điểm bất động, toán nhận dạng đối tượng cách giải Chương 2: Các phương pháp xác định điểm bất động ảnh Chương trình bày kỹ thuật xác định điểm bất động ảnh để xây dựng đặc trưng bất biến đối tượng sử dụng đặc trưng cho việc so khớp nhận dạng đối tượng Chương 3: Ứng dụng điểm bất động nhận dạng đối tượng Trong phần luận văn trình bày ứng dụng nhận dạng đối tượng dựa vào đặc trưng bất biến xây dựng từ điểm bất động, cài đặt thử nghiệm phương pháp trình bày chương TIEU LUAN MOI download : skknchat@gmail.com Chƣơng – TỔNG QUAN VỀ BẤT BIẾN VÀ NHẬN DẠNG ĐỐI TƢỢNG Chương trình bày tổng quan toán nhận dạng đối tượng ảnh, đề cập đến hai vần đề dạng bất biến ảnh lý thuyết điểm bất động 1.1 Tổng quan nhận dạng Trong lý thuyết nhận dạng nói chung nhận dạng ảnh nói riêng có cách tiếp cận khác nhau: - Nhận dạng dựa vào phân hoạch không gian - Nhận dạng cấu trúc - Nhận dạng dựa vào kỹ thuật mạng nơron Hai cách tiếp cận đầu kỹ thuật kinh điển Các đối tượng ảnh quan sát thu nhận phải trải qua giai đoạn tiền xử lý nhằm tăng cường chất lượng, làm chi tiết, trích chọn biểu diễn đặc trưng cuối qua giai đoạn nhận dạng Cách tiếp cận thứ ba hồn tồn khác Nó dựa vào chế đoán nhận, lưu trữ phân biệt đối tượng mô theo hoạt động hệ thần kinh người Do chế đặc biệt, đối tượng thu nhận thị giác người không cần qua giai đoạn cải tiến mà chuyển sang giai đoạn tổng hợp, đối sánh mẫu lưu trữ để nhận dạng Nhận dạng trình phân loại đối tượng biểu diễn theo mơ hình gán cho chúng lớp (gán cho đối tượng tên gọi) dựa theo quy luật mẫu chuẩn Quá trình nhận dạng dựa vào mẫu học biết trước gọi nhận dạng có thầy hay học có thầy; trường hợp ngược lại gọi học khơng có thầy TIEU LUAN MOI download : skknchat@gmail.com 1.1.1 Không gian biểu diễn đối tƣợng, không gian diễn dịch 1.1.1.1 Không gian biểu diễn đối tƣợng Các đối tượng quan sát hay thu nhận được, thường biểu diễn tập đặc trưng hay đặc tính Như trường hợp xử lý ảnh, ảnh sau tăng cường để nâng cao chất lượng, phân vùng trích chọn đặc tính biểu diễn đặc trưng biên, miền đồng nhất, v.v Người ta thường phân đặc trưng theo loại như: đặc trưng tơpơ, đặc trưng hình học đặc trưng chức Việc biểu diễn ảnh theo đặc trưng tùy thuộc vào ứng dụng Ở ta đưa cách hình thức cho việc biểu diễn đối tượng Giả sử đối tượng X biểu diễn n thành phần (n đặc trưng): X={x1, x2,…,xn}; xi biểu diễn đặc trưng Không gian biểu diễn đối tượng thường gọi tắt không gian đối tượng X định nghĩa: X = { X1, X2,…, Xm} Xi biểu diễn đối tượng Khơng gian vơ hạn Để xem xét xét tập X hữu hạn 1.1.1.2 Không gian diễn dịch Không gian diễn dịch tập tên gọi đối tượng Kết thúc trình nhận dạng ta xác định tên gọi cho đối tượng tập không gian đối tượng hay nói cách khác nhận dạng đối tượng Một cách hình thức gọi  tập tên đối tượng:  = {w1, w2, …, wk} với wi, i = 1, 2,…, k tên đối tượng Quá trình nhận dạng đối tượng f ánh xạ f: X   với f tập quy luật để định phần tử X ứng với phần tử  1.1.2 Mô hình chất trình nhận dạng 1.1.2.1 Mơ hình Việc lựa chọn q trình nhận dạng có liên quan mật thiết đến kiểu mơ tả mà người ta sử dụng để đặc tả đối tượng Trong nhận dạng, người ta phân chia làm hai họ lớn: TIEU LUAN MOI download : skknchat@gmail.com - Họ mô tả theo tham số - Họ mô tả theo cấu trúc Cách mô tả lựa chọn xác định mơ hình đối tượng Như vậy, có hai loại mơ hình: mơ hình theo tham số mơ hình theo cấu trúc * Mơ hình tham số: sử dụng vectơ để đặc tả đối tượng Mỗi phần tử vectơ mơ tả đặc tính đối tượng Ví dụ đặc trưng chức năng, người ta sử dụng sở trực giao để biểu diễn Và vậy, ảnh biểu diễn chuỗi hàm trực giao Giả sử C đường bao ảnh C(i,j) điểm thứ i đường bao, i = 1, 2,…, N (đường bao gồm N điểm) Giả sử tiếp: x0  N  xi N i1 N y   yi N i1 tọa độ tâm điểm Như vậy, moment trung tâm bậc p, q đường bao là: μ pq  N (x i -x )p (yi -y0 )q  N i1 Vectơ tham số trường hợp moment ij với i = 1, 2,…, p j = 1, 2,…, q Cịn số đặc trưng hình học, người ta sử dụng chu tuyến, đường bao, diện tích tỷ lệ T = 4S/p2, với S diện tích, p chu tuyến Việc lựa chọn phương pháp biểu diễn làm đơn giản cách xây dựng Tuy nhiên, việc lựa chọn đặc trưng hoàn toàn phụ thuộc vào ứng dụng * Mơ hình cấu trúc: cách tiếp cận mơ hình dựa vào việc mô tả đối tượng nhờ số khái niệm biểu thị đối tượng sở ngôn ngữ tự nhiên Để mô tả đối tượng, người ta dùng số dạng nguyên thủy đoạn thẳng, cung, v.v… Trong mơ hình này, người ta sử dụng ký hiệu kết thúc Vt, ký hiệu không kết thúc gọi Vn Ngồi có dùng tập luật sản xuất để mô tả cách xây dựng đối tượng phù hợp dựa đối tượng đơn giản đối tượng nguyên thủy (tập Vt) Trong cách tiếp cận này, ta chấp nhận khẳng định là: cấu trúc dạng kết việc áp dụng luật sản xuất theo nguyên tắc xác định dạng gốc bắt đầu Một TIEU LUAN MOI download : skknchat@gmail.com cách hình thức, ta coi mơ hình tương đương văn phạm G = (V t, Vn, P, S) với: - Vt ký hiệu kết thúc, - Vn ký hiệu không kết thúc, - P luật sản xuất, - S dạng (ký hiệu bắt đầu) 1.1.2.2 Bản chất trình nhận dạng Q trình nhận dạng gồm giai đoạn chính: - Lựa chọn mơ hình biểu diễn đối tượng - Lựa chọn luật định (phương pháp nhận dạng) suy diễn trình học - Học nhận dạng Khi mơ hình biểu diễn đối tượng xác định, định lượng (mơ hình tham số) hay định tính (mơ hình cấu trúc), q trình nhận dạng chuyển sang giai đoạn học Học giai đoạn quan trọng Thao tác học nhằm cải thiện, điều chỉnh việc phân hoạch tập đối tượng thành lớp Việc nhận dạng tìm quy luật thuật tốn để gán đối tượng vào lớp hay nói cách khác gán cho đối tượng tên Nhìn chung, dù mơ hình kỹ thuật nhận dạng sao, hệ thống nhận dạng tóm tắt theo sơ đồ sau: Trích chọn đặc trƣng biểu diễn đối tƣợng Phân lớp định Quá trình tiền xử lý trả lời Đánh giá Khối nhận dạng Hình 1.1 Sơ đồ tổng quát hệ nhận dạng 1.1.3 Bài toán nhận dạng đối tƣợng ảnh Cho trước đối tượng hai chiều Tồn nhiều toán nhận dạng khác đối tượng ảnh hai chiều TIEU LUAN MOI download : skknchat@gmail.com Bài toán 1: Cho hai đối tượng ảnh hai chiều Hình 1.2 Hãy so sánh xem chúng có giống hay khơng? Hình 1.2 Hai đối tƣợng mặt phẳng Bài tốn người giải cách nhanh chóng (Hai đối tượng có diện tích giống khác lỗ hổng) Nhưng máy việc giải tốn khơng dễ dàng Bài tốn 2: Cho hai đối tượng ảnh có kích thước khác đặt tùy ý mặt phẳng Hãy so sánh xem chúng có “giống nhau” hay khơng? Để giải tốn người đặt chúng lại theo vị trí thích hợp cho hướng nằm chúng giống Sau dùng độ đo khác để so sánh hai đối tượng Chẳng hạn, đặt đối tượng theo vị trí cần sử dụng phép biến đổi quay, tịnh tiến Trong hoàn cảnh khác người ta xem hai đối tượng đồng dạng giống Do đó, q trình giải tốn người tự mã hóa thơng số đối tượng ảnh bất biến theo vị trí, hướng tỷ lệ Đây việc khó khăn Bài tốn 3: Cho đối tượng Hình 1.3 Hãy phân loại chúng thành hai lớp Để giải toán người phân chia đối tượng thành hai lớp tứ giác {b,c,e} hình trịn {a,d} Người ta chia thành hai lớp đối tượng có diện tích {a,b,c} {d,e} b a d c e Hình 1.3 Các tứ giác hình trịn mặt phẳng hai chiều TIEU LUAN MOI download : skknchat@gmail.com 53 vectơ xóa bỏ thay đổi độ tương phản Thay đổi độ sáng tức số cộng vào điểm ảnh, điều không ảnh hưởng đến giá trị gradient, giá trị gradient tính từ độ chênh lệch điểm ảnh Bởi vậy, mô tả bất biến thay đổi affine độ sáng Tuy nhiên, thay đổi độ sáng phi tuyến tính xảy bão hòa camera thay đổi chiếu sáng mà chúng ảnh hưởng đến bề mặt 3D với hướng khác lượng khác Các ảnh hưởng gây nên thay đổi lớn cường độ liên quan số gradient, có khả ảnh hưởng đến hướng gradient Vì vậy, giảm tác động cường độ gradient lớn việc lấy ngưỡng giá trị vectơ đơn vị đặc trưng cho cường độ không vượt 0.2, sau chuẩn hóa lại chiều dài đơn vị Điều có nghĩa việc so khớp cường độ gradient lớn khơng cịn quan trọng nữa, phân bố hướng điều quan trọng Giá trị 0.2 xác định thực nghiệm sử dụng ảnh có độ chiếu sáng khác cho đối tượng 3D 2.5 Kết luận Trên trình bày phương pháp phát điểm quan tâm bất biến tỷ lệ bất biến affine ảnh Thuật toán phát điểm bất biến affine làm thích nghi đồng thời vị trí, tỷ lệ hình dạng vùng lân cận điểm để thu điểm bất biến affine Khơng có phương pháp phương pháp trước giải đồng thời cho tất tham số thuật tốn trích chọn đặc trưng Các phương pháp bất biến tỷ lệ xử lý tốt cho thay đổi tỷ lệ lớn phương pháp bất biến affine lại thất bại ảnh có phép biến đổi affine lớn Các điểm bất biến affine mang lại so khớp tin cậy cho ảnh có biến dạng hình phối cảnh đáng kể Tuy nhiên, tính ổn định độ hội tụ vùng affine chủ đề hướng nghiên cứu tương lai tính bền vững chúng đường biên cụt (occlusions) TIEU LUAN MOI download : skknchat@gmail.com 54 Chƣơng – ỨNG DỤNG ĐIỂM BẤT ĐỘNG TRONG NHẬN DẠNG ĐỐI TƢỢNG Phần trình bày ứng dụng phương pháp xác định điểm bất động việc trích chọn đặc trưng để giải toán nhận dạng đối tượng ảnh Cài đặt thử nghiệm phương pháp trình bày chương 3.1 Bài toán nhận dạng đối tƣợng Phát biểu toán Cho trước hai ảnh, ảnh thứ chứa nhiều đối tượng, ảnh thứ hai chứa đối tượng nhất, yêu cầu xác định xem ảnh thứ có đối tượng ảnh thứ hai khơng, chí đối tượng nằm tọa độ ảnh thứ (a) (b) Hình 3.1 Ví dụ toán nhận dạng đối tƣợng: xác định xem đối tƣợng ảnh (b) có ảnh (a) khơng? Cách giải toán Tư tưởng: Cho trước ảnh huấn luyện đối tượng cần nhận dạng, ta tìm ảnh cần xét (ảnh truy vấn) có đối tượng hay khơng Bằng cách đánh giá mức độ giống đối tượng ảnh cho trước với đối tượng ảnh TIEU LUAN MOI download : skknchat@gmail.com 55 truy vấn Do cần phải giải toán theo cách đối sánh đặc trưng ảnh cho trước với đặc trưng ảnh truy vấn Một cách nơm na trường hợp đặc biệt toán tra cứu ảnh dựa đặc trưng đặc biệt Và lưu ý yếu tố thời gian thực ln quan tâm cho tốn, mức độ cần thiết tùy thuộc vào tốn mà ta giải quyết, yếu tố định thành cơng hay thất bại nhiều tốn Như vậy, toán nhận dạng đối tượng kỹ thuật Xử lý ảnh gồm ba pha chính: - Xác định trích chọn đặc trưng hai ảnh cách độc lập - Đánh giá độ tương tự (độ giống nhau) đối tượng hai ảnh dựa vào việc so khớp đặc trưng trích chọn - Phân tích xác suất để thực xác minh cuối Đây tốn lớn lĩnh vực nhận dạng thị giác máy 3.1.1 Mơ hình toán nhận dạng đối tƣợng Ảnh đầu vào Ảnh huấn luyện Trích chọn đặc trƣng: Bất biến Trích chọn đặc trƣng: Bất biến So sánh độ tƣơng tự Ảnh kết (ảnh có khoanh vùng đối tƣợng nhận dạng đƣợc) Hình 3.2 Sơ đồ chức nhận dạng đối tƣợng TIEU LUAN MOI download : skknchat@gmail.com 56 3.1.2 Thuật toán Để giải toán ta sử thuật toán “Phép biến đổi đặc trưng bất biến tỷ lệ” (Scale Invariant Feature Transform – SIFT) mô tả chi tiết chương Đây phương pháp hiệu để trích chọn điểm bất biến xây dựng nên đặc trưng có tính phân biệt cao từ ảnh dùng để thực so khớp tin cậy tầm nhìn khác đối tượng Phương pháp gồm giai đoạn chính: phát cực trị khơng gian tỷ lệ, định vị xác điểm khóa, gán hướng cho điểm khóa xây dựng đặc trưng Được trình bày vắn tắt lại sau: * Phát cực trị không gian tỷ lệ Giai đoạn q trình trích chọn điểm bất động tìm kiếm tất tỷ lệ vị trí ảnh để xác định điểm quan tâm tiềm tàng mà chúng bất biến có thay đổi tỷ lệ phép quay Xây dựng thể không gian tỷ lệ cho ảnh sử dụng hàm L(x,y,) tạo phép cuộn ảnh đầu vào I(x,y) với hàm Gaussian biến thiên tỷ lệ G(x,y,): L( x, y, )  G( x, y, )  I ( x, y) Chúng ta xét điểm đặc trưng mà hàm D(x,y,) đạt cực trị địa phương, hàm tạo dựa vào chênh lệch hai mức tỷ lệ lân cận phân biệt thừa số k: D( x, y, )  L( x, y, k )  L( x, y, ) * Định vị điểm khóa Một cực trị địa phương hàm D(x,y,) tìm thấy, việc định vị xác điểm khóa, có nhiều cực trị phát có lượng định điểm khóa ổn định đặc trưng Để định vị xác điểm khóa ta thực chỉnh chi tiết vị trí điểm khóa ứng cử cho phù hợp với liệu lân cần vị trí, tỷ lệ, tỷ lệ độ cong chủ yếu Thông tin cho phép loại bỏ điểm có độ tương phản thấp điểm định vị dọc theo biên TIEU LUAN MOI download : skknchat@gmail.com 57 Hướng tiếp cận sử dụng phép khai triển Taylor hàm không gian tỷ lệ D(x,y,): D(x)  D  DT 2 D x  xT x x x Vị trí cực trị cho cơng thức sau:  D 1 D  x x x  Nếu |D( x )| thấp ngưỡng vị trí ứng cử bị loại bỏ Trong chương trình ta sử dụng ngưỡng 0.03 để loại bỏ cực trị không ổn định Khi giá trị riêng ma trận Hessian H:  Dxx Dxy   D D yy    xy H tính, vị trí ứng cử bị loại bỏ giá trị riêng nhỏ thấp ngưỡng * Gán hƣớng Một nhiều hướng gán cho vị trí điểm khóa dựa vào hướng gradient ảnh cục Tất thao tác sau thực liệu ảnh bị biến đổi có liên quan đến hướng gán, tỷ lệ, vị trí điểm khóa, cung cấp bất biến phép biến đổi Để tính tốn hướng cho điểm khóa (xk,yk,k) ta sử dụng gradient ảnh L(xk,yk,k) chọn tỷ lệ thích hợp Chúng ta tính tốn biểu đồ hướng gradient L vùng ảnh đặt vị trí (xk,yk) Mỗi mẫu biểu đồ hướng gán trọng số cường độ gradient Hướng điểm khóa gán cho đỉnh biểu đồ hướng * Xây dựng đặc trƣng Đặc trưng xây dựng cách tạo mơ tả cho điểm khóa Một mơ tả hình thành việc lấy mẫu cường độ hướng gradient vùng ảnh xung quanh vị trí điểm khóa, hướng biểu diễn có liên quan đến hướng điểm khóa Các biểu đồ hướng tính 4x4 vùng mẫu Mỗi biểu đồ có bin hướng, mơ tả có tổng cộng 128 phần tử TIEU LUAN MOI download : skknchat@gmail.com 58 * So khớp đặc trƣng Sau trích chọn đặc trưng từ ảnh huấn luyện ảnh truy vấn, bước tiến hành nhận dạng đối tượng Nhận dạng đối tượng thực cách so khớp đặc trưng cách độc lập tới sở liệu (CSDL) đặc trưng trích chọn từ ảnh huấn luyện Một so khớp ứng cử tốt cho đặc trưng tìm thấy việc xác định láng giềng gần CSDL đặc trưng Láng giềng gần xác định đặc trưng có khoảng cách Euclide ngắn 3.2 Cài đặt thử nghiệm 3.2.1 Cài đặt chƣơng trình Các tính chính: Chương trình viết ngơn ngữ Visual C++ 6.0, chạy hệ điều hành Window XP, máy tính tốc độ 1,5GHz, nhớ 512MB RAM Chương trình có chức sau: - Cho phép người sử dụng lựa chọn ảnh truy vấn ảnh chứa đối tượng cần nhận dạng, lựa chọn thuộc tính tìm kiếm - Hiển thị kết nhận dạng Giao diện chương trình: Hình 3.3 Giao diện chƣơng trình TIEU LUAN MOI download : skknchat@gmail.com 59 3.2.2 Một số kết thực nghiệm Thực cài đặt thử nghiệm phương pháp “Phép biến đổi đặc trưng bất biến tỷ lệ” để trích chọn đặc trưng bất biến, sau sử dụng thuật tốn láng giềng gần để so khớp nhận dạng Bước đầu với số kết sau: (a) (b) (c) Hình 3.4 (a) Ảnh truy vấn chứa nhiều đối tƣợng; (b) Ảnh huấn luyện; (c) Kết nhận dạng Hình 3.4 thể kết nhận dạng đối tượng, ảnh (a) đối tượng thu nhận tương đối rõ ràng nên việc trích chọn so khớp đặc trưng tiến hành khơng khó khăn độ xác tương đối cao, góc nhìn đối tượng cần nhận dạng hai giống khác tỷ lệ không đáng kể TIEU LUAN MOI download : skknchat@gmail.com 60 (a) (b) (c) Hình 3.5 (a) Ảnh truy vấn chứa nhiều đối tƣợng; (b) Ảnh chứa đối tƣợng cần nhận dạng; (c) Kết nhận dạng Hình 3.5 thể kết thực nghiệm khác nhận dạng đối tượng, đối tượng cần nhận dạng hai ảnh có khác đơi chút góc nhìn, ảnh truy vấn lại chứa nhiều đối tượng, thu nhận khơng rõ ràng có nhiều đặc trưng tìm thấy ảnh (a) việc so khớp đặc trưng nhiều thời gian số lượng so khớp không xác tăng lên Tuy nhiên nhận dạng đối tượng TIEU LUAN MOI download : skknchat@gmail.com 61 Hình 3.6 Khơng nhận dạng đƣợc đối tƣợng Hình 3.6 thể ví dụ khơng nhận dạng đối tượng cần nhận dạng bị che khuất nhiều nên điểm khóa trích chọn từ vị trí có đối tượng khơng tương ứng với đặc trưng ảnh thứ hai nên việc so khớp không thành cơng * Nhận xét: Thuật tốn đánh giá hiệu qủa việc trích chọn đặc trưng phục vụ cho việc nhận dạng đối tượng, đặc biệt ảnh thu nhận có tỷ lệ khác đối tượng ảnh đặt góc nhìn khác Tuy nhiên q trình cài đặt thuật tốn chưa xử lý trường hợp đối tượng cần nhận dạng bị che khuất số phận bị thay đổi góc nhìn, tỷ lệ lớn TIEU LUAN MOI download : skknchat@gmail.com 62 KẾT LUẬN Một vấn đề kinh điển thị giác máy xử lý ảnh xác định xem liệu có hay khơng liệu ảnh chứa đối tượng, đặc trưng hay hoạt động Thơng thường cơng việc giải người cách đơn giản không cần phải nỗ lực nhiều, không giải cách hài lòng thị giác máy trường hợp tổng quát: đối tượng tùy ý hoàn cảnh khác Các phương pháp thời cho việc giải vấn đề giải tốt cho đối tượng đặc biệt đối tượng hình học đơn giản, mặt người, ký tự viết tay hay ký tự in, loại xe v.v… hoàn cảnh đặc biệt, mơ tả cách điển hình chiếu sáng, rõ ràng Một hướng tiếp cận để nhận dạng đối tượng hiệu nhiều nhóm nghiên cứu ý gần dựa vào đặc trưng bất biến đối tượng Làm nhận dạng xác đối tượng ảnh cho dù đối tượng có biến đổi đơi chút hình thức, thay đổi tỷ lệ thu nhận ảnh, đối tượng cần nhận dạng bị che khuất phần đối tượng khác hay biến đổi khác vấn đề có ý nghĩa Xuất phát từ thực tế luận văn nhằm tìm hiểu tổng quan nhận dạng đối tượng, phương pháp phát đặc trưng bất biến mà tảng dựa vào điểm bất động ứng dụng chúng nhận dạng Cụ thể luận văn đạt kết sau:  Trình bày tổng quan trình toán nhận dạng đối tượng ảnh, đề cập đến hai vấn đề dạng bất biến ảnh lý thuyết điểm bất động  Hệ thống hóa số phương pháp phát điểm bất động ảnh như: Phương pháp Harris, phương pháp Harris-Laplace, phương pháp Harris-Affine phương pháp “Phép biển đổi đặc trưng bất biến tỷ lệ”  Cài đặt thử nghiệm kỹ thuật trình bày chương 2: cài đặt phương pháp “Phép biến đổi đặc trưng bất biến tỷ lệ” trường TIEU LUAN MOI download : skknchat@gmail.com 63 hợp ảnh có khác tỷ lệ, góc nhìn đối tượng ảnh khơng bị che khuất số phận không đáng kể Các vấn đề nghiên cứu tiếp tục:  Các ảnh thu nhận có khác đáng kể tỷ lệ, đối tượng cần nhận dạng bị che khuất nhiều phần  Ảnh chứa đối tượng cần nhận dạng chịu phép biến đổi affine, thay đổi độ sáng, độ tương phản TIEU LUAN MOI download : skknchat@gmail.com 64 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Thanh Thủy, 2002, “Nhập môn xử lý ảnh số”, Trường Đại học Bách khoa Hà Nội Tiếng Anh [2] Basri, R., and Jacobs, D.W 1997 Recognition using region correspondences International Journal of Computer Vision, 25(2):145- 166 [3] Baumberg, A 2000 Reliable feature matching across widely separated views In Conference on Computer Vision and Pattern Recognition, Hilton Head, South Carolina, pp 774-781 [4] Brown, M and Lowe, D.G 2002 Invariant features from interest point groups In The 13th British Machine Vision Conference, Cardiff University, UK, pp 253–262 [5] Harris, C and Stephens, M.J 1988 A combined corner and edge detector In Alvey Vision Conference, pages 147–152 [6] Lindeberg, T 1994 Scale-space theory: A basic tool for analysing structures at different scales Journal of Applied Statistics, 21(2):224-270 [7] Lowe, D.G 1999 Object recognition from local scale-invariant features In International Conference on Computer Vision, Corfu, Greece, pp 1150-1157 [8] Lowe, D.G 2004 Distinctive image features from Scale-Invariant keypoints International Journal of Computer Vision [9] Mikolajczyk, K 2002 Detection of local features invariant to affine transformations, Ph.D thesis, Institut National Polytechnique de Grenoble, France [10] Mikolajczyk, K., and Schmid, C 2004 Scale & affine invariant interest point detectors International Journal of Computer Vision 60(1), 63-86 TIEU LUAN MOI download : skknchat@gmail.com 65 [11] Mikolajczyk, K and Schmid, C 2005 A performance evaluation of local descriptors In IEEE Transactions on Pattern Analysis and Machine Intelligence [12] Rothganger, F., Lazebnik, S., Schmid, C and Ponce J 2005 Object modeling and recognition using local affine-invariant image descriptors and multi-view spatial consraints In International Journal of Computer Vision [13] http://en.wikipedia.org/wiki/Fixed-point_theorem [14] http://signal.ece.utexas.edu/seminars/dsp_seminars/02spring/danilo.html [15] http://www.hindawi.com/journals/fpta/guidelines.html [16] http://www.icassp2003.com/archives/5 TIEU LUAN MOI download : skknchat@gmail.com 66 MỤC LỤC CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT DANH MỤC CÁC HÌNH VẼ .2 MỞ ĐẦU Chƣơng  TỔNG QUAN VỀ BẤT BIẾN VÀ NHẬN DẠNG .5 ĐỐI TƢỢNG 1.1 Tổng quan nhận dạng 1.1.1 Không gian biểu diễn đối tượng, không gian diễn dịch .6 1.1.1.1 Không gian biểu diễn đối tượng 1.1.1.2 Không gian diễn dịch 1.1.2 Mơ hình chất q trình nhận dạng 1.1.2.1 Mô hình 1.1.2.2 Bản chất trình nhận dạng 1.1.3 Bài toán nhận dạng đối tượng ảnh 1.2 Tổng quan bất biến vai trò bất biến nhận dạng 10 1.2.1 Bất biến moment thống kê 10 1.2.2 Bất biến hình học 13 1.2.3 Bất biến đại số 15 1.2.4 Vai trò bất biến nhận dạng 16 1.3 Điểm bất động vai trò điểm bất động nhận dạng 17 1.3.1 Lý thuyết điểm bất động 17 1.3.2 Vai trò điểm bất động nhận dạng đối tượng 19 1.3.2.1 Trích chọn đặc trưng bất biến từ điểm bất động 19 1.3.2.2 So khớp đặc trưng 20 Chƣơng  CÁC PHƢƠNG PHÁP XÁC ĐỊNH ĐIỂM BẤT ĐỘNG 22 TRONG ẢNH 22 2.1 Phương pháp Harris 22 2.2 Phương pháp Harris-Laplace 24 2.2.1 Sự thể không gian tỷ lệ 24 2.2.2 Hàm Harris thích nghi tỷ lệ 27 2.2.3 Sự lựa chọn tỷ lệ tự động 28 TIEU LUAN MOI download : skknchat@gmail.com 67 2.2.3 Thuật toán phát điểm bất biến Harris-Laplace 29 2.2.3.1 Thuật toán Harris-Laplace 30 2.2.3.2 Thuật toán Harris-Laplace đơn giản 31 2.2.3.3 Ví dụ điểm bất biến 31 2.3 Phương pháp xác định điểm bất biến Harris-Affine 32 2.3.1 Động thúc đẩy 32 2.3.2 Ma trận moment cấp hai affine 33 2.3.2.1 Phép biến đổi affine ma trận moment cấp hai 34 2.3.2.2 Phép đo tính đẳng hướng 36 2.3.3 Phương pháp phát điểm bất biến Harris-Affine 37 2.4 Phương pháp “Phép biến đổi đặc trưng bất biến tỷ lệ” 44 2.4.1 Phát cực trị không gian tỷ lệ 44 2.4.1.1 Tần số lấy mẫu theo tỷ lệ 46 2.4.1.2 Tần số lấy mẫu vùng không gian 47 2.4.2 Định vị xác điểm khóa 47 2.4.3 Gán hướng cho điểm khóa 50 2.4.4 Bộ mô tả ảnh cục 51 2.5 Kết luận 53 Chƣơng  ỨNG DỤNG ĐIỂM BẤT ĐỘNG TRONG 54 NHẬN DẠNG ĐỐI TƢỢNG 54 3.1 Bài toán nhận dạng đối tượng 54 3.1.1 Mô hình tốn nhận dạng đối tượng 55 3.1.2 Thuật toán 56 3.2 Cài đặt thử nghiệm 58 3.2.1 Cài đặt chương trình 58 3.2.2 Một số kết thực nghiệm 59 KẾT LUẬN 62 TÀI LIỆU THAM KHẢO 64 TIEU LUAN MOI download : skknchat@gmail.com ... khớp nhận dạng đối tượng Chương 3: Ứng dụng điểm bất động nhận dạng đối tượng Trong phần luận văn trình bày ứng dụng nhận dạng đối tượng dựa vào đặc trưng bất biến xây dựng từ điểm bất động, ... hình dạng chúng giữ lại số điểm định không thay đổi, dựa vào điểm bất biến đối tượng ta nhận dạng đối tượng 1.3.2.1 Trích chọn đặc trƣng bất biến từ điểm bất động Một ứng dụng quan trọng điểm bất. .. QUAN VỀ BẤT BIẾN VÀ NHẬN DẠNG ĐỐI TƢỢNG Chương trình bày tổng quan tốn nhận dạng đối tượng ảnh, đề cập đến hai vần đề dạng bất biến ảnh lý thuyết điểm bất động 1.1 Tổng quan nhận dạng Trong lý

Ngày đăng: 27/06/2022, 15:37

Hình ảnh liên quan

cách hình thức, ta có thể coi mô hình này tương đương một văn phạm G= (V t, V n, P, S) với:  - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

c.

ách hình thức, ta có thể coi mô hình này tương đương một văn phạm G= (V t, V n, P, S) với: Xem tại trang 9 của tài liệu.
Bài toán 1: Cho hai đối tượng ảnh hai chiều trong Hình 1.2. Hãy so sánh xem chúng có giống nhau hay không?  - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

i.

toán 1: Cho hai đối tượng ảnh hai chiều trong Hình 1.2. Hãy so sánh xem chúng có giống nhau hay không? Xem tại trang 10 của tài liệu.
1.2.2 Bất biến hình học - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

1.2.2.

Bất biến hình học Xem tại trang 14 của tài liệu.
7) Kích thước của hình chữ nhật nhỏ nhất bao quanh ảnh có các cạnh song song với các trục quán tính cực đại và cực tiểu l 1 và l2 - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

7.

Kích thước của hình chữ nhật nhỏ nhất bao quanh ảnh có các cạnh song song với các trục quán tính cực đại và cực tiểu l 1 và l2 Xem tại trang 15 của tài liệu.
Hình 2.1. Một thể hiện đa tỷ lệ của một tín hiệu là một tập có thứ tự của các tín hiệu thu nhận đƣợc dự định để thể hiện tín hiệu gốc ở các mức tỷ lệ khác nhau - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

Hình 2.1..

Một thể hiện đa tỷ lệ của một tín hiệu là một tập có thứ tự của các tín hiệu thu nhận đƣợc dự định để thể hiện tín hiệu gốc ở các mức tỷ lệ khác nhau Xem tại trang 26 của tài liệu.
hiệu thu nhận, ở đó các cấu trúc có tỷ lệ nhỏ được nén liên tiếp (Hình 2.1). Một ý tưởng như vậy nên được thực hiện như thế nào trong thực tế? Một yêu cầu cốt  yếu là các cấu trúc ở các tỷ lệ thô trong  một thể hiện đa tỷ lệ sẽ là các sự đơn  giản hóa của - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

hi.

ệu thu nhận, ở đó các cấu trúc có tỷ lệ nhỏ được nén liên tiếp (Hình 2.1). Một ý tưởng như vậy nên được thực hiện như thế nào trong thực tế? Một yêu cầu cốt yếu là các cấu trúc ở các tỷ lệ thô trong một thể hiện đa tỷ lệ sẽ là các sự đơn giản hóa của Xem tại trang 27 của tài liệu.
Hình 2.3. Ví dụ về các tỷ lệ đặc trƣng. - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

Hình 2.3..

Ví dụ về các tỷ lệ đặc trƣng Xem tại trang 30 của tài liệu.
ta phải giữ lại tất cả các điểm đã chọn. Như vậy, nhìn vào hình chúng ta có thể thấy vị trí và tỷ lệ của các điểm đúng với sự biến đổi giữa các ảnh - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

ta.

phải giữ lại tất cả các điểm đã chọn. Như vậy, nhìn vào hình chúng ta có thể thấy vị trí và tỷ lệ của các điểm đúng với sự biến đổi giữa các ảnh Xem tại trang 33 của tài liệu.
thể hiện bằng màu đen và các hình elip màu trắng là các vùng tương ứng được chiếu từ ảnh khác với phép biến đổi affine - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

th.

ể hiện bằng màu đen và các hình elip màu trắng là các vùng tương ứng được chiếu từ ảnh khác với phép biến đổi affine Xem tại trang 34 của tài liệu.
Hình 2.6. Biểu đồ giải thích phép chuẩn hóa affine dựa trên các ma trận moment cấp hai - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

Hình 2.6..

Biểu đồ giải thích phép chuẩn hóa affine dựa trên các ma trận moment cấp hai Xem tại trang 37 của tài liệu.
Hình 2.7. Phát hiện lặp lại của một điểm quan tâm bất biến affine khi có sự hiện diện của phép biến đổi affine (dòng ở trên và dƣới). - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

Hình 2.7..

Phát hiện lặp lại của một điểm quan tâm bất biến affine khi có sự hiện diện của phép biến đổi affine (dòng ở trên và dƣới) Xem tại trang 43 của tài liệu.
Nhìn chung để đạt đến sự hội tụ chỉ cần ít hơn 10 lần lặp. Điển hình, khoảng 40% các điểm ban đầu không hội tụ do không có các tỷ lệ đặc trưng hoặc do sự  chênh lệch lớn giữa các giá trị riêng của ma trận  U (λ max(U)/λmin(U) >  6) - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

h.

ìn chung để đạt đến sự hội tụ chỉ cần ít hơn 10 lần lặp. Điển hình, khoảng 40% các điểm ban đầu không hội tụ do không có các tỷ lệ đặc trưng hoặc do sự chênh lệch lớn giữa các giá trị riêng của ma trận U (λ max(U)/λmin(U) > 6) Xem tại trang 44 của tài liệu.
Hình 2.9 thể hiện một phương pháp hiệu quả cho việc xây dựng hàm - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

Hình 2.9.

thể hiện một phương pháp hiệu quả cho việc xây dựng hàm Xem tại trang 46 của tài liệu.
Hình 2.9. Xây dựng một thể hiện không gian tỷ lệ - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

Hình 2.9..

Xây dựng một thể hiện không gian tỷ lệ Xem tại trang 46 của tài liệu.
Hình 2.11. Các giai đoạn lựa chọn các điểm khóa. (a) Ảnh gốc với 233189 điểm ảnh. (b) 832  vị  trí  điểm  khóa  ban  đầu  ở  các  điểm  cực  đại  và  cực  tiểu  của  hàm  - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

Hình 2.11..

Các giai đoạn lựa chọn các điểm khóa. (a) Ảnh gốc với 233189 điểm ảnh. (b) 832 vị trí điểm khóa ban đầu ở các điểm cực đại và cực tiểu của hàm Xem tại trang 49 của tài liệu.
Hình 2.12. Bộ mô tả điểm khóa - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

Hình 2.12..

Bộ mô tả điểm khóa Xem tại trang 52 của tài liệu.
Hình 3.1. Ví dụ về bài toán nhận dạng đối tƣợng: xác định xem đối tƣợng trong ảnh (b) có trong ảnh (a) không?  - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

Hình 3.1..

Ví dụ về bài toán nhận dạng đối tƣợng: xác định xem đối tƣợng trong ảnh (b) có trong ảnh (a) không? Xem tại trang 55 của tài liệu.
3.1.1 Mô hình bài toán nhận dạng đối tƣợng - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

3.1.1.

Mô hình bài toán nhận dạng đối tƣợng Xem tại trang 56 của tài liệu.
Hình 3.4. (a) Ảnh truy vấn chứa nhiều đối tƣợng; (b) Ảnh huấn luyện; (c) Kết quả nhận dạng  - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

Hình 3.4..

(a) Ảnh truy vấn chứa nhiều đối tƣợng; (b) Ảnh huấn luyện; (c) Kết quả nhận dạng Xem tại trang 60 của tài liệu.
Hình 3.5. (a) Ảnh truy vấn chứa nhiều đối tƣợng; (b) Ảnh chứa đối tƣợng cần nhận dạng; (c) Kết quả nhận dạng  - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

Hình 3.5..

(a) Ảnh truy vấn chứa nhiều đối tƣợng; (b) Ảnh chứa đối tƣợng cần nhận dạng; (c) Kết quả nhận dạng Xem tại trang 61 của tài liệu.
Hình 3.6. Không nhận dạng đƣợc đối tƣợng - (LUẬN VĂN THẠC SĨ) Điểm bất động và ứng dụng trong nhận dạng đối tượng

Hình 3.6..

Không nhận dạng đƣợc đối tƣợng Xem tại trang 62 của tài liệu.