Biến đổi Fourier nhanh

Một phần của tài liệu Nghiên cứu phương pháp trích chọn đặc trưng ảnh dựa trên đối sánh hình dạng và ứng dụng (Trang 55 - 74)

Đầu vào là một ma trận số phức 2 chiều được sinh ra từ ma trận điểm ảnh đã đọc bằng cách gán phần ảo của tất cả các số phức bằng 0, phần thực được gán bằng giá trị của điểm ảnh.

Đầu ra là ma trận số phức hai chiều biểu diễn khai triển Fourier của ma trận đầu vào.

Trong hàm FFT 2 chiều (hàm twoD_FFT() ), từng hàng của ma trận đầu vào được biến đổi Fourier bằng hàm biến đổi 1chiều (hàm oneD_FFT() ), sau đó mới tính FFT 1 chiều cho các cột.

Hai hàm cơ sở để xây dựng oneD_FFT là Scramble() và Butterflies(). Trong đó Scramble() sử dụng để sắp xếp lại dãy đầu vào theo thứ tự đảo bit, còn hàm

Butterflies() là thuật toán cơ sở, được gọi đệ qui để tính FFT.

3.3.6. Tạo véc tơ đặc trƣng hình dạng cho ảnh

Véc tơ đặc trưng của ảnh là một vector 256 chiều, chứa 256 giá trị số double.

double* m_Signature;

m_Signature = new double[256]; Hàm sinh chữ ký GenerateSignature():

Đầu vào: Ma trận vuông kích thước 256x256 các số phức (sinh ra do hàm biến đổi FFT 2 chiều twoD_FFT()) biểu diễn ảnh trong miền tần số.

Đầu ra: vector chữ ký 256 chiều hay là một mảng 256 số double là signature của ảnh.

Thuật toán:

Tính modul (magnitude) của từng phần tử trong mảng hai chiều 256x256 phần tử theo công thức:

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

Trong đó: Magnitude(i,j) là modul của số phức tại vị trí hàng i, cột j của ma trận, Re(i,j) là phần thực của số phức tại vị trí hàng i và cột j, Im(i,j) là phần áo của số phức tại vị trí hàng i, cột j.

Chia ảnh đầu vào thành những khối kích thước 16x16. Khởi tạo mảng image_Signature[] gồm 256 phần tử Tính signature cho từng khối theo công thức:

15 0 15 0 ) ( ), ( _ i j j iBlockCol i iBlockRow Mag Signature block

Trong đó: block_Signature là giá trị signature của khối, iBlockRow (0 - 255) là chỉ số hàng của phần tử đầu tiên trong khối, iBlockCol (0 - 255) là chỉ số cột của phần tử đầu tiên của khối, i là chỉ hàng của phần tử trong khối (i = 0,...,15), j là chỉ số cột của phần tử trong khối (j = 0,...,15). Mag[i,j] là modul của số phức tại vị trí hàng i, cột j của ma trận đầu vào.

Lưu chữ ký block_Signature được lưu vào mảng image_Signature[]; Sau khi tính xong signature cho cả 256 khối, tiến hành chuẩn hóa mảng image_Signature[].

3.3.7. So sánh ảnh bằng cách tính khoảng cách Euclide

Khoảng cách giữa ảnh Query_Image và ảnh Found_Image được định nghĩa là khoảng cách Euclide giữa hai chữ ký query_Signature[] và found_Signature[] theo công thức:

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

3.4.Sử dụng chƣơng trình

Khởi động chương trình, chọn tệp ảnh mẫu bằng cách bấm vào nút

Chương trình sẽ tìm ra một ảnh có khoảng cách Euclide so với ảnh truy vấn nhỏ nhất và hiển thị.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

3.5.Đánh giá chƣơng trình

3.5.1. Kết quả đạt đƣợc

Chương trình đã đạt được một số kết quả nhất định sau:

Chương trình đã trích xuất các đặc điểm là hình dạng của ảnh.

Chương trình đã nhận dạng được một số các biển báo giao thông.

3.5.2. Hạn chế

Chương trình được giới thiệu mới chỉ đưa ra một thuật toán khá đơn giản để trích chọn đặc điểm (sinh véc tơ đặc trưng) nên chắc chắn sẽ không thể cho kết quả so sánh tốt.

Các ảnh ban đầu phải được tiền xử lý như lọc nhiễu và yêu cầu ở một định dạng đơn giản nên phạm vi so sánh bị hạn chế.

Chương trình thiết lập kích thước cố định cho ảnh trước khi xử lý là 256×256, kích thước các khối là 16×16, số chiều của vector đặc trưng là 256 làm hạn chế tính mềm dẻo của chương trình.

3.5.3. Khả năng mở rộng

Các kỹ thuật tra cứu ảnh có rất nhiều hướng nghiên cứu phát triển tạo ra những thuật toán rất hiệu quả làm cho máy tính “hiểu” được nội dung của ảnh. Hoàn toàn có thể xây dựng một thuật toán tốt hơn để trích chọn được những đặc điểm đặc trưng khác như màu sắc, kết cấu, hình dạng của đối tượng ảnh để phát triển cho bài toán nhận dạng vật thể.

Sử dụng các phương pháp làm giảm số chiều của véc tơ đặc trưng sẽ làm tăng đáng kể tốc độ tra cứu. Đối với các hệ thống máy tính có trang bị nhiều bộ vi xử lý hoặc có bộ xủ lý lõi kép thì có thể xây dựng các thuật toán cho phép phân phối các tác vụ cho nhiều vi xử lý đồng thời cũng là một giải pháp tốt để tăng tốc độ tra cứu.

Sử dụng các phương pháp tính toán độ tương tự phù hợp hơn cho từng loại đặc điểm để có được những kết quả so sánh gần với trực giác hơn.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

KẾT LUẬN

Luận văn đã trình bày một vài kỹ thuật trích chọn đặc trưng của ảnh dựa trên đối sánh hình dạng. Hình dạng có thể biểu diễn thống qua các bất biến moment, các hàm xoay, mô tả Fourier, độ tròn, độ lệch tâm, hướng trục chính và cả biến đổi radon.

Ngoài ra các đặc điểm trực quan của mỗi điểm ảnh lại có thể được sử dụng để phân tách mỗi ảnh thành các vùng đồng nhất hoặc các đối tượng ảnh. Các đặc điểm cục bộ của các vùng ảnh hoặc các đối tượng ảnh có thể dùng trong các hệ thống tra cứu ảnh theo vùng.

Có nhiều cách để đánh giá khoảng cách giữa các đặc điểm trực quan, một số cách được sử dụng phổ biến như khoảng cách Minkowski, khoảng cách toàn phương, khoảng cách Mahalanobis, độ phân kỳ Kullback-Leibler và độ phân kỳ Jeffrey. Đến thời điểm này thì phương pháp tính khoảng cách Minkowski và khoảng cách toàn phương được sử dụng rộng rãi nhất.

Mặc dù kỹ thuật tra cứu ảnh theo nội dung đưa ra được một giải pháp thông minh và tự động để tìm kiếm ảnh một cách hiệu quả thì vấn đề chính của kỹ thuật này vẫn chỉ dựa trên những đặc điểm ở mức thấp nên nó chỉ có thể phản ánh đựơc một khía cạnh nào đó của ảnh.

Ngoài ra sự đánh giá độ tương tự giữa các đặc điểm trực quan lại chưa liên quan đến đặc điểm tâm lý học thị giác của con người. Người sử dụng thường quan tâm đến sự giống nhau về ngữ nghĩa nên kết quả truy vấn dựa trên các đặc điểm mức thấp thường không thoả mãn được yêu cầu và nói chung là khó đoán trước.

Phần cuối của luận văn đã đưa ra một áp dụng cụ thể cho phương pháp đối sánh ảnh theo hình dạng.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

Những vấn đề đã đƣợc giải quyết trong luận văn:

o Giới thiệu các kỹ thuật trích chọn đặc trưng hình ảnh theo hình dạng.

o Sơ lược về cách đánh giá hiệu năng của một hệ thống tra cứu ảnh.

o Trình bày kỹ thuật tra cứu ảnh dựa trên đặc trưng hình dạng.

o Áp dụng phương pháp tra cứu ảnh theo nội dung vào bài toán tìm kiếm biển báo giao thông theo đặc điểm hình dạng.

Những vấn đề còn tồn tại:

Do thời gian tìm hiểu về đề tài chưa được nhiều và những hạn chế về khả năng lập trình đồ hoạ nên một số mục tiêu đặt ra từ khi nghiên cứu chưa thực hiện được trong chương trình chạy thử này bao gồm:

o Chưa có chức năng tra cứu ảnh bằng cách kết hợp nhiều đặc điểm.

o Chưa cài đặt các kỹ thuật đánh chỉ số hiệu quả, tin cậy của chương trình.

o Chưa cài đặt các kỹ thuật tăng hiệu năng của hệ thống bằng cách giảm số chiều các véc tơ đặc trưng.

Trong thời gian tới, tôi hy vọng sẽ có thể giải quyết được những vấn đề còn tồn tại trên để có thể xây dựng được một chương trình thực sự hữu ích, đáp ứng được những yêu cầu của bài toán.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

TÀI LIỆU THAM KHẢO

Tiếng Việt

[1]Đỗ Năng Toàn, Phạm Việt Bình, Giáo trình môn học Xử lý ảnh, Khoa CNTT - Đại học Thái Nguyên, 2007.

[2]Nguyễn Thanh Thủy, Lương Mạnh Bá, Nhập môn xử lý ảnh số, NXB Khoa học và Kỹ thuật, 2003.

[3] Nguyễn Quang Hoan, Xử lý ảnh, Học Viện Công nghệ Bưu chính Viễn thông Hà Nội, 2006.

[4]Lê Thị Tâm, Nghiên cứu một số kỹ thuật tra cứu biển báo giao thông, Luận văn thạc sĩ khoa học máy tính, Trường Đại học Sư phạm Hà Nội 2, Hà Nội, 2013.

Tiếng Anh

[5]Mark S. Nixon, Alberto S. Aguado, Feature Extraction and Image Processing, Newnes, 2002.

[6]Tam Le, Son Tran, Seichii Mita, Thuc Nguyen, “Realtime Traffic Sign Detection Using Color and Shape-Based Features”, The 2nd Asian Conference on Intelligent Information and Database Systems (ACIIDS), LNAI5991, Vietnam, 2010

[7]Fleyeh, H., "Road and Traffic Sign Color Detection and Segmentation - A Fuzzy Approach" Machine Vision Applications (MVA2005), Tsukuba Science City, Japan, 16-18 May, 2005.

[8]Low, A Introductory Computer Vision and Image Processing, McGraw-hill, 1991. [9]Gonzalez & RichardE Woods, Digital Image Processing, Rafael C. Addison-

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

PHỤ LỤC

Một số loại biển báo giao thông đƣờng bộ tại Việt Nam. Biển báo cấm:

STT Ảnh Số biển Tên biển Chi tiết

1 101 Đường cấm

Đường cấm tất cả các loại phương tiện (cơ giới và thô sơ) đi lại cả hai hướng, trừ các xe được ưu tiên theo luật lệ nhà nước quy định.

2 102 Cấm đi ngược chiều

Đường cấm tất cả các loại xe (cơ giới và thô sơ) đi vào theo chiều đặt biển, trừ các xe được ưu tiên theo luật lệ nhà nước quy định.

3 103a Cấm ôtô Đường cấm tất cả các loại xe cơ giới kể cả môtô 3 bánh có thùng đi qua, trừ môtô hai bánh, xe gắn máy và các xe được ưu tiên theo luật lệ nhà nước quy định.

4 103b Cấm ôtô rẽ phải

Đường cấm tất cả các loại xe cơ giới kể cả môtô 3 bánh có thùng xe rẽ phải, trừ môtô hai bánh, xe gắn máy và các xe được ưu tiên theo luật lệ nhà nước.

5 103c Cấm ôtô

rẽ Đường cấm tất cả các loại xe cơ giới kể cả môtô 3 bánh có thùng xe rẽ , trừ môtô hai bánh, xe gắn máy và các xe được ưu tiên theo luật lệ nhà nước.

6 104 Cấm môtô

Đường cấm tất cả các loại môtô đi qua, trừ các xe môtô được ưu tiên theo luật lệ nhà nước quy định.

7 105 Cấm ôtô và môtô

Đường cấm tất cả các loại xe cơ giới và môtô đi qua trừ xe gắn máy và các xe ưu tiên theo luật lệ nhà nước quy định.

8 106 Cấm ôtô

tải Để báo đường cấm tất cả các loại ôtô tải có trọng lượng lớn nhất cho phép (bao gồm trọng lượng xe và hàng) trên 3,5Tấn đi qua trừ các xe được ưu tiên theo luật lệ nhà nước quy định. 9 107 Cấm ôtô

khách và ôtô tải

Để báo đường cấm ôtô chở hành khách và các loại ôtô tải có trọng lượng lớn nhất cho phép trên 3,5Tấn kể cả các loại máy kéo và xe máy thi công chuyên dùng đi qua trừ các xe được ưu tiên theo luật lệ nhà nước quy định. 10 108 Cấm ôtô

kéo moóc

Đường cấm tất cả các loại xe cơ giới kéo theo rơ-moóc kể cả môtô, máy kéo, ôtô khách kéo theo rơ-moóc đi qua, trừ loại ôtô sơ-mi rơ- moóc và các loại xe được ưu tiên (có kéo theo rơ-moóc) theo luật lệ nhà nước quy định.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

11 109 Cấm máy kéo

Để báo đường cấm tất cả các loại máy kéo, kể cả máy kéo bánh hơi và bánh xích đi qua.

12 110a Cấm đi

xe đạp Để báo đường cấm xe đạp đi qua.

13 110b Cấm xe đạp

Để báo đường cấm xe đạp thồ đi qua. Biển này không cấm người dắt loại xe này.

14 111a Cấm xe gắn máy

Để báo đường cấm xe gắn máy đi qua. Biển không có giá trị đối với xe đạp.

15 111b Cấm xe ba bánh loại có động cơ (xem lam)

Để báo đường cấm xe ba bánh loại có động cơ như xe lam, xích lô máy, xe lôi máy v.v...

16 111c Cấm xe ba bánh loại có động cơ (xe lôi máy)

Để báo đường cấm xe ba bánh loại có động cơ như xe lam, xích lô máy, xe lôi máy v.v...

17 111d Cấm xe ba bánh loại không có động cơ

Để báo đường cấm xe ba bánh loại không có động cơ như xích lô, xe lôi, xe đạp v.v...

18 112 Cấm người đi bộ

Để báo đường cấm đi bộ qua lại.

19 113 Cấm xe người kéo, đẩy

Để báo đường cấm xe người kéo, đẩy đi qua. Biển không có giá trị cấm những xe nôi của trẻ em và phương tiện chuyên dùng để đi lại của người tàn tật.

20 114 Cấm xe xúc vật kéo

Để báo đường cấm súc vật vận tải hàng hóa hoặc hành khách dù kéo xe hay chở trên lưng đi qua.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

21 115 Hạn chế trọng lượng xe

Để báo đường cấm các loại xe (cơ giới và thô sơ) kể cả các xe được ưu tiên theo luật lệ của nhà nước quy định, có trọng lượng toàn bộ (cả xe và hàng) vượt quá trị số ghi trên biển đi qua. 22 116 Hạn chế

trọng lượng trên trục xe

Để báo đường cấm các loại xe (cơ giới và thô sơ) kể cả các xe được ưu tiên theo luật lệ của nhà nước quy định, có trọng lượng toàn bộ (cả xe và hàng) phân bổ trên một trục bất kỳ của xe vượt quá trị số ghi trên biển đi qua.

33 117 Hạn chế chiều cao

Cấm các xe (cơ giới và thô sơ) kể cả các xe được ưu tiên theo luật lệ nhà nước quy định có chiều cao (tính đến điểm cao nhất kể cả xe và hàng hóa) vượt quá trị số ghi trên biển không được đi qua.

34 118 Hạn chế chiều ngang

Cấm các xe (cơ giới và thô sơ) kể cả các xe được ưu tiên theo luật lệ nhà nước quy định có chiều ngang (kể cả xe và hàng hóa) vượt quá trị số ghi trên biển không được đi qua. 35 119 Hạn chế

chiều dài ôtô kéo moóc

Đường cấm các loại xe (cơ giới và thô sơ) kéo theo moóc kể cả ôtô sơ-mi rơ-moóc và các loại xe được ưu tiên kéo moóc theo luật lệ nhà nước quy định, có độ dài toàn bộ kể cả xe, moóc và

hàng lớn hơn trị số ghi trên biển đi qua. 36 120 Hạn chế

chiều dài ôtô kéo moóc

Đường cấm các loại xe (cơ giới và thô sơ) kéo theo moóc kể cả ôtô sơ-mi rơ-moóc và các loại xe được ưu tiên kéo moóc theo luật lệ nhà nước quy định, có độ dài toàn bộ kể cả xe, moóc và

hàng lớn hơn trị số ghi trên biển đi qua. 37 121 Cự ly tối

thiểu giữa hai xe

Để báo xe ôtô phải đi cách nhau một khoảng tối thiểu. Số ghi trên biển cho biết khoảng cách tối thiểu tính bằng mét. Biển có hiệu lực cấm các xe ôtô không được đi cách nhau kể cả các xe được ưu tiên theo luật lệ nhà nước quy định một cự ly nhỏ hơn trị số ghi trên biển báo. 38 122 Dừng lại Biển có hiệu lực buộc các xe cơ giới và thô sơ

kể cả các xe được ưu tiên theo luật lệ Nhà nước quy định dừng lại trước biển hoặc trước vạch ngang đường và chỉ được phép đi khi thấy các tín hiệu (do người điều khiển giao thông hoặc đèn, cờ) cho phép đi.

39 123a Cấm rẽ trái

Cấm rẽ trái (theo hướng mũi tên chỉ) ở những chỗ đường giao nhau. Biển có hiệu lực cấm các loại xe (cơ giới và thô sơ) trừ các xe được ưu tiên theo luật lệ Nhà nước quy định được rẽ trái

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn/

40 123b Cấm rẽ

phải Để báo cấm rẽ phải (theo hướng mũi tên chỉ) ở những chỗ đường giao nhau. Biển có hiệu lực cấm các loại xe (cơ giới và thô sơ) trừ các xe

Một phần của tài liệu Nghiên cứu phương pháp trích chọn đặc trưng ảnh dựa trên đối sánh hình dạng và ứng dụng (Trang 55 - 74)

Tải bản đầy đủ (PDF)

(74 trang)