Biến đổi Fourier là mấu chốt trong xử lý ảnh nó đƣợc ứng dụng rộng rãi trong lý thuyết cũng nhƣ trong thực tế. Nguyên tắc cơ bản của biến đổi Fourier đó là một đối tƣợng đƣợc coi nhƣ một tín hiệu và nhƣ vậy có thể biểu diễn đối tƣợng thành các thành phần cơ bản của tín hiệu. Biến đổi Fourier rất hữu ích cho phân tích các đối tƣợng khác nhau: có thể đối tƣợng bị làm nhiễu bởi biến đổi phổ (Hình 2.1), trong khi các đối tƣợng tƣơng đƣơng khác sẽ có biến đổi phổ tƣơng tự thậm chí cả khi chúng bị ảnh hƣởng bởi nhiễu và các biến đổi khác ( Hình 2.2)
Hình 2.1: Đối tƣợng bị làm nhiễu bởi biến đổi phổ.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
2.1.1.1Chuỗi Fourier
Đặt f(x) là hàm tuần hoàn chu kỳ 2đ và nguyên trong một chu kỳ, theo lý thuyết Fourier f(x) có thể khai triển thành chuỗi Fourier nhƣ sau:
(2.1) (2.2) (2.3) ( 2.4) (2.5) ( 2.6) Với chu kỳ T :
2.1.1.2. Sự hội tụ của chuỗi Fourier
Nếu một hàm f(x) là tuần hoàn và nguyên trong chu kỳ của nó thì sẽ tồn tại chuỗi Fourier nhƣng không đảm bảo chắc chắn rằng chuỗi Fourier sẽ hội tụ tới f(x). Tuy nhiên theo điều kiện Fourier Dirichcle phần lớn hoặc các lớp chung
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
của hàm có thể biểu diễn bằng chuỗi Fourier. Điều kiện chuỗi Fourier Dicrichcle nếu là một đoạn hàm f(x) liên tục :
1. Giới hạn số các điểm không liên tục 2. Giới hạn các điểm cực trị.
Hàm này có thể mở rộng thành chuỗi Fourier hội tụ tại các điểm liên tục và ý nghĩa của điểm giới hạn thực và giới hạn ảo của hàm tại điểm giới hạn:
Đối với tín hiệu số hoặc đối tƣợng số điều kiện Dirichcle đƣợc chứng minh vì vậy nó có thể đƣợc biểu diễn bởi chuỗi Fourier:
2.1.1.3. Biến đổi Fourier
Nếu hàm f(x) có thể biểu diễn bằng chuỗi Fourier của nó. Sau đó f(x) đƣợc xác định duy nhất bởi hệ số Cn. Ngƣợc lại nếu hệ số Cn của chuỗi Fourier của hàm đã biết trƣớc thì f(x) có thể đƣợc xây dựng lại từ tập Cn. Chuỗi Fourier thiết lập mối quan hệ duy nhất giữa f(x) và hệ số Cn. Biểu diễn theo công thức :
( 2.7 ) Tƣơng ứng công thức :
( 2.8 )
2.1.1.4. Biến đổi Fourier rời rạc
Biến đổi Fourier đặc biệt hữu ích đối với phân tích đối tƣợng số vì đối tƣợng số tồn tại ở dạng rời rạc. Để biến đổi công thức 2.7 và 2.8 thành dạng rời rạc, f(x) đƣợc lấy N mẫu trong chu kỳ [0, T]
f(x0); f(x0+∆x); f(x0+2∆x);… f(x0+(N-1)∆x)
∆x gọi là bƣớc lấy mẫu trong phạm vi không gian xem xét f(x) biểu diễn thành:
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
( 2.9 )
( 2.10 ) Bƣớc lấy mẫu ∆u trong miền tần số và bƣớc lấy mẫu ∆x trong miền không gian có quan hệ theo biểu thức :
Mối quan hệ này dễ thay đổi chỉ rõ sự chính xác của biểu diễn đối tƣợng trong miền không gian và trong miền tần số là ngƣợc với nhau. Chú ý, khi bố trí một tập dữ liệu khác thì chúng không thể biến đổi độc lập với nhau. Điều này cần lƣu ý khi trích chọn đặc trƣng trong miền không gian lấy mẫu đối tƣợng.
2.1.1.5. Biến đổi Fourier hai chiều
Đối với hàm hai biến f(x,y) xác định 0 ≤ x, y ≤ N. Cặp biến đổi Fourier là:
( 2.11 )
( 2.12 )
Mặc dù, số lƣợng F(u,v) từ biến đổi Fourier của biểu thức là rất lớn nhƣng số lƣợng F(u,v) có ích là rất bé. Đây là lý do biểu diễn đối tƣợng trong miền tần số tốt hơn (Hệ số có nghĩa ít). Điều này thực sự hữu ích trong nhiều ứng dụng đặc biệt trong việc phân tích hình dạng vì nó có thể xấp xỉ ý nghĩa của đối tƣợng gốc f(x,y) hoặc f(x) có thể xây dung từ F(u,v) nhỏ. Đây là vấn đề cơ bản của xử lý tín hiệu Fourier và phân tích đối tƣợng Fourier.
2.1.1.6. Phạm vi của biến đổi Fourier
Biến đổi Fourier tuân theo phạm vi hữu ích của việc phân tích đối tƣợng Sự riêng rẽ: Biến đổi Fourier rời rạc (1.11) có thể mô tả riêng rẽ nhƣ sau:
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
(2.13) Lợi ích của việc riêng rẽ này đó là F(u,v) có thể thu đƣợc trong 2 bƣớc bằng cách sử dụng liên tiếp biến đổi Fourier 1 chiều. FT 1 chiều có thể đƣợc tính toán sử dụng biến đổi Fourier nhanh FFT.
Biến đổi: Biến đổi phạm vi của FT
( 2.14 ) Điều này chỉ ra: 1 sự thay đổi trong miền không gian sẽ dẫn đến sự thay đổi trong miền tần số.
Phép quay: Nếu gắn vào hệ toạ độ cực
Sau đó thay thế vào biểu thức có :
( 2.15 )
Điều này có nghĩa việc quay f(x,y) trong miền không gian góc θ0 cũng tƣơng ứng việc quay F(u,v) một góc tƣơng tự trong miền tần số.
Độ chia: đối với hai hệ số a, b, phạm vi độ chia của FT đƣợc viết nhƣ sau:
(1.16)
Điều này chỉ ra rằng: độ chia của f(x,y) với a và b theo x,y trong miền không gian tỷ lệ nghịch với biên độ F(U,V) trong miền tần số. Điều này cũng giảm bớt hệ số F(u,v) bởi 1/a và 1/b theo u, v trong miền tần số. Tổng quát, phóng to một đối tƣợng ảnh trong miền tần số sẽ làm nổi mức tần số thấp trong miền không gian trong khi việc thu nhỏ đối tƣợng trong ảnh sẽ làm tăng vùng tần số cao trong miền không gian.
2.1.2. Không gian độ chia
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
tƣợng. Nó đã đƣợc phát triển trong các hệ thống tính toán. Phần này sẽ giới thiệu không gian độ chia tuyến tính và phạm vi quan trọng của nó.
2.1.2.1. Cơ sở
Lý thuyết không gian độ chia giúp ta quan sát các đối tƣợng trong các độ chia khác nhau và các đối tƣợng chỉ có ý nghĩa duy nhất theo độ chia chính. Một ví dụ đơn giản nếu là ảnh một sự vật thì dù có là độ chia 1m hay 1cm thì ý nghĩa của sự vật không thay đổi. Trong vật lý các đối tƣợng tồn tại trong sự sắp xếp độ chia. Các dụng cụ quan sát nhƣ camera các dụng cụ này có thể quan sát cũng là một sự sắp xếp độ chia. Để mở rộng các độ chia tƣơng ứng với sự phóng to hay thu nhỏ nhờ các dụng cụ quan sát. Độ chia của một dụng cụ luôn có hai giới hạn: độ chia giúp phân biệt chi tiết ảnh tốt nhất và kém nhất và khi quan sát sự vật thì độ chia nằm trong khoảng giới hạn hai phía này.
Để tính toán bất kỳ dạng biểu diễn nào từ dữ liệu ảnh, thông tin cần đƣợc trích chọn bằng cách sử dụng toán tử nào đó với dữ liệu. Các toán tử tƣơng tự nhƣ ống kính máy quay sử dụng để mô tả thế giới thực. Một vài vấn đề đặt ra khi đề cập tới các toán tử đó đƣợc sử dụng nhƣ thế nào, thực hiện ở đâu và thực hiện công việc ra sao, độ lớn nhƣ thế nào. Nhƣ vậy thông tin thu đƣợc xác định rất phong phú thông qua mối quan hệ của các cấu trúc thực tế trong dữ liệu và kích cỡ của toán tử. Độ chia gần đúng khi phân tích đối tƣợng có thể biết trƣớc. Tuy nhiên trong phần lớn các vấn đề thì điều này không quan trọng. Lý do chính để xây dựng không gian độ chia đó là nếu có kiến thức biết trƣớc về không gian độ chia thích hợp lấy từ tập CSDL có nhiều độ chia thì không gian độ chia sẽ đƣợc áp dụng để thu gọn công thức tính toán thích hợp.
Việc sử dụng các hàm làm trơn nhiễu Gauss tại các độ chia khác nhau đã đƣợc áp dụng trong phân tích ảnh cho thấy mối liên hệ giữa các độ chia khác nhau với cấu trúc ảnh và không gian độ chia là có giới hạn. Tuy nhiên độ chia kích thƣớc hoàn toàn có thể thêm vào trong không gian miêu tả đối tƣợng vì các cấu trúc có thể đƣợc nghiên cứu thông qua độ chia. Đặc biệt khi gắn vào tín
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
hiệu f(x): R N → R và 1 tập liên tục {L(x,t)>0} làm mịn dần dần (có nghĩa là việc nhân chập tín hiệu f(x) với một hàm liên tục g(x,t))
L(x,t) = g (x,t)*f (x) ( 2.17)
ở đây g(x,t) là hàm làm mịn hoặc hàm mặt nạ, l(x,t) là tín hiệu đƣợc làm mịn, * là phép nhân chập. Với tín hiệu liên tục thì f(x)đƣợc khai triển nhƣ sau:
(2.18)
2.1.2.2. Không gian độ chia Gaussian
Hàm Gausss là hàm mặt nạ hữu ích nhất cho không gian độ chia tổng quát nhất. Mang tới một tín biệu f(x): R N → R là mô tả độ chia L: R N x R → Rt đuợc
định nghĩa nhƣ một mô tả tại độ chia 0 đối với tín hiệu gốc L(x,0) = f (x) (2.19)
( 2.20)
Và sự miêu tả độ chia kém hơn mang lại bằng phép nhân chập với mặt nạ Gauss khi đó kích thƣớc ảnh tăng lên:
( 2.22)
2.1.2.3. Phạm vi của sự không tạo các đặc trƣng mới
Phạm vi quan trọng nhất trong không gian độ chia đó là sự không tạo các đặc trƣng mới. Có nghĩa là sự biến đổi từ một độ chia tốt sang một độ chia xấu hơn sẽ thiết lập một tín hiệu đơn giản hơn, vì thế đặc trƣng trong không gian độ chia mất tính đơn điệu khi độ chia gia tăng. Nó là nguyên nhân làm ảnh hƣởng tới tín hiệu và làm mờ ảnh hƣởng đối với tín hiệu hai chiều.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Hình 2.3: Điểm qua 0 tại vị trí x và độ chia t của tín hiệu
Các đặc trƣng hữu ích đặc biệt tại điểm qua 0 của đạo hàm bậc thứ n. Thực tế đạo hàm bậc hai của tín hiệu đƣợc sử dụng trong phân tích đối tƣợng, bởi đạo hàm bậc hai phản ánh điểm uốn cong của tín hiệu. Điểm cong (một đặc trƣng hữu ích đối với phân tích đối tƣợng). Điểm qua 0 của đạo hàm bậc hai là điểm uốn cong đó là đặc trƣng cho góc lồi ra của đối tƣợng. Với tín hiệu một chiều,điều đó đƣợc áp dụng với không gian độ chia Gauss. Điểm qua 0 của tín hiệu tại tất cả các độ chia gọi là lấy dấu hoặc cây khoảng cách. (hình 2.3 b). Bởi phạm vi không sáng tạo của đặc trƣng mới, việc làm mịn cuối cùng của tín hiệu đƣợc bảo đảm. Vì vậy chiều cao của cây khoảng cách là có giới hạn. Witkin (Wit 83) giải thích cây khoảng cách này với kinh nghiệm quan sát, cành cây trong cây khoảng cách tƣơng ứng với vị trí lồi ra của đối tƣợng. ASA 84: đầu tiên trích chọn đỉnh từ cây khoảng cách thu đƣợc và giải thích chúng nhƣ các đặc trƣng vật lý( nhƣ góc, điểm nối, điểm kết thúc, điểm đặc biệt…) Mok96 cũng trích chọn đỉnh từ cây khoảng cách thu đƣợc và đề nghị việc sử dụng các đặc trƣng đỉnh thông thƣờng cho tìm kiếm hình dạng. Hoàn toàn có thể áp dụng không gian độ chia để biểu diễn hình dạng.
2.1.2.4. Không gian độ chia mâu thuẫn với việc đa quyết định
Trong phân tích đối tƣợng hai phƣơng pháp phân tích có thứ bậc thƣờng đƣợc sử dụng: một là phƣơng pháp không gian độ chia, phƣơng pháp khác cây quyết định, ví dụ nhƣ phƣơng pháp hình chóp và phƣơng pháp sóng. Hai phƣơng pháp này khác nhau: điểm khác biệt chính của hai công cụ thể hiện ở
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
3 khía cạnh:
+ Lấy mẫu không nhất quán, chống lại việc lấy mẫu các không gian khác. Biểu diễn không gian độ chia đƣợc định nghĩa bằng việc làm mịn và lƣu giữ các mẫu không gian giống nhau tại tất cả các độ chia. Trong khi lấy mẫu không gian đa quyết định tại các độ chia khác nhau là khác nhau. Đối tƣợng chính của đa quyết định là giảm bớt lấy mẫu từ một độ chia tới các độ chia cao hơn, vì thế quá trình xử lý tín hiệu có thể hiệu quả hơn.
Tƣơng quan độ chia đối nghịch với sự phân ly độ chia, phƣơng pháp đa quyết định không khai thác điểm khác biệt của cấu trúc thông qua độ chia. Các kết quả tính toán tại mỗi một độ chia đƣợc sử dụng duy nhất để hƣớng dẫn tính toán tại độ chia tiếp theo nhỏ hơn và đƣợc loại bỏ một khi điều này đƣợc hoàn thành. Chỉ thực hiện thuật toán tại một độ chia và tại một thời điểm. Phƣơng pháp không gian độ chia chính là việc phân tích độ chia nhƣ một phần cần thiết của quá trình phân tích sự quan sát và nhận dạng. Phạm vi các phép đo tại các độ chia khác nhau có thể có cơ sở vững chắc phụ thuộc nhiệm vụ chứa trong nó. Bằng định nghĩa, giới thiệu không gian độ chia mang đến một giải pháp cho việc phổ biến lƣợng bù sai, điều đó có nghĩa các đặc trƣng ở các độ chia khác nhau có thể liên quan tới những đặc trƣng khác một cách rõ ràng.
Lấy mẫu độ chia liên tục chống lại việc lấy mẫu độ chia cố định. Giữa các phƣơng pháp không gian độ chia và phƣơng pháp đa quyết định đó là sự miêu tả đa quyết định chấp nhận một bƣớc lấy mẫu cố định trong độ chia hoặc quyết định đó không bị suy giảm, trong khi phƣơng pháp độ chia phân tích tín hiệu tại độ chia liên tục. Vì vậy nhiệm vụ của việc tìm đặc trƣng qua độ chia dễ dàng hơn trong không gian độ chia so với việc miêu tả đa quyết định. Sự tinh xảo của lấy mẫu độ chia có thể thực hiện khi có yêu cầu.
Sự khác biệt các đặc trƣng của hai loại phƣơng pháp xác định ở cách ứng dụng của chúng. Phƣơng pháp không gian độ chia thƣờng đƣợc sử dụng cho phân tích và tìm hiểu tín hiệu, trong khi phƣơng pháp đa quyết định thƣờng
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
đƣợc sử dụng cho mã hoá. Nó cũng cần thiết để kết hợp phƣơng pháp không gian độ chia với phƣơng pháp đa độ chia. Phƣơng pháp đa độ chia đƣợc chú ý hơn đa quyết định trong điều kiện phân tích hoặc miêu tả tín hiệu tại một độ chia tại một thời điểm. Nó không khai thác khái niệm phân tích, miêu tả tín hiệu ở độ chia liên tục. Mối tƣơng quan tác động cấu trúc tín hiệu thông qua độ chia làm mất ý nghĩa của phƣơng pháp đa độ chia.
2.2. Đánh giá độ tƣơng tự
Đối với việc tìm kiếm ảnh dựa trên hình dạng và các đặc trƣng ảnh đƣợc trích chọn thƣờng là vector đặc trƣng N chiều, nó có thể đƣợc đề cập tới nhƣ một điểm trong không gian N chiều. Một bức ảnh đƣợc đánh chỉ mục trong cơ sở dữ liệu sử dụng các vector đặc trƣng đƣợc trích chọn. Việc tìm kiếm ảnh thực chất là việc xác định sự giống nhau giữa ảnh truy vấn và các ảnh mục tiêu trong cơ sở dữ liệu mà thực chất là sự xác định khoảng cách giữa các vector đặc trƣng miêu tả hình ảnh. Sự đo đạc khoảng cách mong muốn cần phải tham chiếu với nhận thức của ngƣời. Vì vậy, đối với một đặc trƣng hình dạng dẫn tới sự chính xác của việc tìm kiếm ảnh cao hơn, phép đo khoảng cách tốt hơn. Đối với việc tìm kiếm ảnh trực tuyến thì hiệu quả cần phải đƣợc xem xét khi lựa chọn một phép đo khoảng cách. Nhiều phép đo khoảng cách khác đã đƣợc khai thác trong việc tìm kiếm ảnh, chúng bao gồm khoảng cách các khối trung tâm ; khoảng cách Ơcơlit ; khoảng cách Cosin, khoảng cách giao nhau của biểu đồ histoogram, hai khoảng cách thống kê, khoảng cách bậc hai và khoảng cách Mahalanobis. Trong mục này, một vài phép đo khoảng cách sẽ đƣợc mô tả và ƣớc lƣợng. Mục đích của việc ƣớc lƣợng này để tìm ra một phép đo tƣơng đồng sự mong đợi cho các bộ mô tả ƣớc lƣợng hình dạng khác nhau. Để biết tìm kiếm ảnh tốt nhƣ thế nào, cần phải có một phép đo khả thi. Nói chung, thực hiện các phép đo đo đƣợc sự chính xác của việc tìm kiếm ảnh. Tuy nhiên, phụ thuộc vào sự xác định độ chính xác khác nhau, có các phép đo sự thực hiện khác nhau.
Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
2.2.1. Phép đo sự giống nhau
Một phép đo tƣơng đồng thƣờng đƣợc định nghĩa nhƣ một phép đo khoảng cách. Trong phần này mô tả chi tiết các phép đo sự giống nhau, khác nhau. [2]