Hãy sử dụng ngôn ngữ lập trình CC++ để thực hiện các việc sau. 1. Tìm hiểu và nắm vững phương pháp chuyển đổi Fourier rời rạc. Hãy trình bày các kỹ thuật nhận dạng mặt người sử dụng chuyển đổi Fourier rời rạc. 2. Hãy sưu tầm 40 bức ảnh chân dung người từ internet, các bức ảnh đều có cùng kích thước. Những bức ảnh này gồm đủ mặt đàn ông, đàn bà. 3. Viết một hàm có tên “dft_face” để chuyển đổi một bức ảnh sang miền tần số bằng phương pháp chuyển đổi Fourier rời rạc (DFT). 4. Thực hiện chuyển đổi DFT cho toàn bộ các bức ảnh nói trên. Xây dựng một vector gồm ít nhất 4 thuộc tính của mỗi bức ảnh từ tín hiệu đã chuyển đổi DFT. 5. Chọn một bức ảnh mới về mặt trẻ em, thực hiện việc tìm kiếm xem trong số 40 bức ảnh đã lưu có bức ảnh nào giống nhất với bức ảnh mới đưa vào dựa trên các thuộc tính đã chọn ở bước 4.
Trang 1Mục Lục
A TÌM HIỂU VỀ MỘT SỐ KĨ THUẬT XỬ LÝ ẢNH 2
I MỘT SỐ THUẬT TOÁN TÌM NGƯỠNG 3
1 Thuật toán tìm ngưỡng 3
2 Thuật toán đối xứng nền 3
II MỘT SỖ BỘ LỌC 5
1 Lọc trung vị 5
2 Lọc trung bình 7
3 Trung bình k láng giềng gần nhất 8
B TÌM HIỂU VỀ BIẾN ĐỔI FOURIER 9
I BIẾN ĐỔI FOURIER LÀ GÌ? 9
II CƠ SỞ BIẾN ĐỔI FOURIER CHO TÍN HIỆU VÀ HỆ THỐNG RỜI RẠC TRONG MIỀN TẦN SỐ LIÊN TỤC 9
1 Biến đổi FOURIER thuận 9
2 Biến đổi FOURIER ngược 14
3 Các tính chất của FOURIER 16
4 FOURIER 2 Chiều 19
III Trích rút đặc trưng trong miền tần số 22
IV Demo………
……… 24
Trang 2Yêu cầu bài toán:
Hãy sử dụng ngôn ngữ lập trình C/C++ để thực hiện các việc sau
1 Tìm hiểu và nắm vững phương pháp chuyển đổi Fourier rời rạc Hãy trình bày các kỹ thuật nhận dạng mặt người sử dụng chuyển đổi Fourier rời rạc
2 Hãy sưu tầm 40 bức ảnh chân dung người từ internet, các bức ảnh đều có cùng kích thước Những bức ảnh này gồm đủ mặt đàn ông, đàn bà
3 Viết một hàm có tên “dft_face” để chuyển đổi một bức ảnh sang miền tần số bằng phương pháp chuyển đổi Fourier rời rạc (DFT)
4 Thực hiện chuyển đổi DFT cho toàn bộ các bức ảnh nói trên Xây dựng một vector gồm ít nhất 4 thuộc tính của mỗi bức ảnh từ tín hiệu đã chuyển đổi DFT
5 Chọn một bức ảnh mới về mặt trẻ em, thực hiện việc tìm kiếm xem trong số 40 bức ảnh đã lưu có bức ảnh nào giống nhất với bức ảnh mới đưa vào dựa trên các thuộc tính đãchọn ở bước 4
A TÌM HIỂU VỀ MỘT SỐ KĨ THUẬT XỬ LÝ ẢNH
Kỹ thuật xử lý ảnh: là quá trình biến đổi một hình ảnh thành một hình ảnh khácbằng máy tính điện tử một cách tự động phụ thuộc vào mục đích của người sử dụng
1 Thuật toán tìm ngưỡng
Đây là kỹ thuật chọn ngưỡng theo kiểu lặp do Ridler và Calvard đưa ra
Trước hết, lược đồ sẽ được phân đoạn thành hai phần bằng một giá trịngưỡng khởi động với tức là bằng phân nửa thang độ xám động của ảnh
Sau đó, các trung bình mẫu (mf,0) của những điểm ảnh thuộc đối tượng và(mb,0) của những điểm ảnh nền sẽ được tính toán
Một giá trị ngưỡng mới q1 sẽ được tính kế đó bằng cách lấy giá trị trungbình của hai trung bình mẫu nói trên
Quá trình này cứ thế sẽ được tiếp tục với ngưỡng mới cho đến khi nào giátrị ngưỡng không thay đổi nữa thì dừng lại
Nếu biểu diễn dưới dạng công thức toán học, chúng ta có :
Trang 32 Thuật toán đối xứng nền
Kỹ thuật này dựa trên sự giả định là tồn tại hai đỉnh phân biệt trong lược
đồ nằm đối xứng nhau qua đỉnh có giá trị lớn nhất trong phần lược đồthuộc về các điểm ảnh nền Kỹ thuật này có thể tận dụng ưu điểm củaviệc làm trơn.Đỉnh cực đại maxp tìm được nhờ tiến hành tìm giá trị cựcđại trong lược đồ Sau đó thuật toán sẽ được áp dụng ở phía không phải
là điểm ảnh thuộc đối tượng ứng với giá trị cực đại đó nhằm tìm ra giátrị độ sáng a ứng với giá trị phần trăm p% mà: P(a) = p%, trong đó P(a)
là hàm phân phối xác suất về độ sáng
Định nghĩa: [Hàm phân phối xác suất về độ sáng] Hàm phân phối xác
suất P(a) thể hiện xác suất chọn được một giá trị độ sáng từ một vùngảnh cho trước, sao cho giá trị này không vượt quá một giá trị sáng chotrước a Khi a biến thiên từ âm vô cùng đến dương vô cùng, P(a) sẽnhận các giá trị từ 0 đến 1 P(a) là hàm đơn điệu không giảm theo a, dovậy
Trang 4 Ở đây ta đang giả thiết là ảnh có các đối tượng tối trên nền sáng Giả sử
độ chắc chắn là 95%, thì có nghĩa là ta phải ở bên phải đỉnh maxp mộtgiá trị a sao cho P(a)=95% Do tính đối xứng đã giả định ở trên, chúng
ta lấy đối xứng qua maxp để có được ngưỡng T: T = maxp – (a – maxp)(5.11) Kỹ thuật này thực hiện ngược lại với tình huống ảnh có các đốitượng sáng trên một nền tối
1 Lọc trung vị
Bộ lọc trung vị là bộ lọc làm mượt phi tuyến trong miền không gian
Bộ lọc trung vị là một trong những bộ lọc theo thống kê thứ tự
Nó thay thế giá trị của điểm ảnh bằng trung vị của các mức xám củacácđiểm lân cận
Bộ lọc trung vị được dùng phổ biến, bởi vì một số loại nhiễu nhất định,
nó có thể lọc nhiễu rất tốt với độ mờ thấp so với bộ lọc tuyến tính cùngkích thước
Trung vị E của một tập hợp là giá trị mà một nữa các giá trị trong tậphợpnhỏ hơn hoặc bằng E, một nữa các giá trị trong tập hợp lớn hơn hoặcbằng E
Áp dụng bộ lọc trung vị lên điểm đang xét, ta sắp xếp các điểm ảnh vàlân cận của nó theo thứ tự giá trị tăng dần và tìm giá trị trung vị, gán giátrị này cho giá trị của điểm anh đang xét
Trang 5 Chức năng cơ bản của bộ lọc trung vị là thiết lập giá trị của các điểmvới các mức xám khác nhau thành giá trị có vẻ như gần giống với giá trịcủa điểm lân cận.
Thuật toán lọc Trung vị gồm các bước:
– Sử dụng một cửa sổ lọc (ma trận 3x3) quét qua lần lượt từng điểm ảnhcủa ảnh đầu vào input
– Tại vị trí mỗi điểm ảnh lấy giá trị của các điểm ảnh tương ứng trong vùng3x3 của ảnh gốc "lấp" vào ma trận lọc
– Sau đó sắp xếp các điểm ảnh trong cửa sổ này theo thứ tự (tăng dần hoặcgiảm dần tùy ý)
– Cuối cùng, gán điểm ảnh nằm chính giữa (Trung vị) của dãy giá trị điểmảnh đã được sắp xếp ở trên cho giá trị điểm ảnh đang xét của ảnh đầu raoutput
Cho dãy x1; x2 ; xn đơn điệu tăng (giảm) Khi đó trung vị của dãy kýhiệu là Med({xn}), được định nghĩa:
Giả sử ta có ảnh I ngưỡng θ cửa sổ W(P) và điểm ảnh P
Khi đó kỹ thuật lọc trung vị phụ thuộc không gian bao gồm các bước cơ bản sau:
• Bước 1: Tìm trung vị trong phần ảnh đang xét (cửa sổ quét qua)
• Bước 2: Gán giá trị cho pixel “tâm”
Trang 6Ví dụ: Giả sử cho cửa sổ W = (3x3); giá trị ngưỡng θ =2
Giá trị 16, sau phép lọc có giá trị 2, các giá trị còn lại không thay đổi
- Khử nhiễu
- Bộ lọc làm trơn đơn giản nhất là bộ lọc trung bình (average filtering)
Ý tưởng bộ lọc trung bình: thay thế giá trị tại mỗi pixel bằng trung bìnhcác giá trị pixel trong mặt nạ lân cận nhằm
- Loại bỏ những pixel biến đổi lớn so với lân cận (nhiễu)
- Những pixel nằm trên biên cũng có sự biến đổi lớn so với lân cận ->làm mờ
Cho dãy x1, x2…, xn khi đó trung bình của dãy ký hiệu AV({xn}) đượcđịnh nghĩa:
Trang 8B1: tìm k giá trị gần nhất {I(q)| q ∈W(P)}→{k giá trị gần I(p) nhất}
B2: tính trung bình {k giá trị gần I(P) nhất}→ TBk(P)
B3:
Nhận xét:
Nếu k> kích thước cửa sổ W thì kỹ thuật này trở thành lọc trung bình
Nếu k=1 thì kết quả là chính nó
B TÌM HIỂU VỀ BIẾN ĐỔI FOURIER.
I BIẾN ĐỔI FOURIER LÀ GÌ?
Biến đổi Fourier hay chuyển hóa Fourier, được đặt tên theo nhà toán học người Pháp
Trang 9cơ sở, có nghĩa là dưới dạng tổng hay một tích phân của các hàm số sin được nhân với cáchằng số khác nhau (hay còn gọi là biên độ) Biến đổi Fourier có rất nhiều dạng khác nhau,chúng phụ thuộc vào dạng của hàm được khai triển.
Biến đổi Fourier có rất nhiều ứng dụng khoa học, ví dụ như trong vật lý, số học, xử lý tínhiệu, xác suất, thống kê, mật mã, âm học, hải dương học, quang học, hình học và rất nhiềulĩnh vực khác Trong xử lý tín hiệu và các ngành liên quan, biến đổi Fourier thường đượcnghĩ đến như sự chuyển đổi tín hiệu thành các thành phần biên độ và tần số
Ở đây chúng ta đang tìm hiểu về biến đổi Fourier cho tín hiệu và hệ thống rời rạc trong miềntần số liên tục
II CƠ SỞ BIẾN ĐỔI FOURIER CHO TÍN HIỆU VÀ HỆ THỐNG RỜI RẠC
TRONG MIỀN TẦN SỐ LIÊN TỤC
Tổng quan biến đổi Foiurier chúng ta đang nghiên cứu là để chuyển biểu diễn tínhiệu và hệ thống rời rạc từ miền biến số độc lập n sang miền tần số liên tục ω
1 Biến đổi FOURIER thuận
1.1 Định nghĩa
Nếu dãy x(n) thoả mãn điều kiện
(n)
nx
Biến đổi Fourier đã chuyển dãy số x(n) thành hàm phức X(e j ), [2] là biểu thức biến
đổi Fourier thuận và được ký hiệu như sau :
Trang 101.2 Sự tồn tại của biến đổi FOURIER
Theo định nghĩa, biến đổi Fourier thuận [2] chỉ tồn tại nếu dãy x(n) thoả mãn điều kiện khả tổng tuyệt đối [1] Điều đó có nghĩa là, nếu dãy x(n) thoả mãn điều kiện [1] thì chuỗi [2] sẽ hội tụ về hàm X(e j ), nên x(n) tồn tại biến đổi Fourier Ngược lại,
nếu dãy x(n) không thoả mãn điều kiện [1] thì chuỗi [2] sẽ phân kỳ, vì thế hàm X(e j )
không tồn tại và x(n) không có biến đổi Fourier.
Các tín hiệu số x(n) có năng lượng hữu hạn :
2
( )
x n
�
� �
[5]
luôn thỏa mãn điều kiện [1] , do đó luôn tồn tại biến đổi Fourier.
Ví dụ 1 : Hãy xét sự tồn tại và tìm biến đổi Fourier của các dãy sau:
Trang 12- X(e j ) được gọi là hàm biên độ tần số, nó là hàm chẵn và đối xứng qua trụctung : X(ej ) =X(e - j )
- () được gọi là hàm pha tần số, nó là hàm lẻ và phản đối xứng qua gốc toạ
Hàm pha : ( ) ( ) Arg [A( ej)] [19]
Với Arg [A( ej)]phụ thuộc vào dấu của hàm A( ej)như sau
0 0
[A( )]
( )
j j
1 2
j e
Trang 13Ví dụ 2 : Hãy xác định các hàm phần thực và phần ảo, mô đun và argumen, độ lớn và
pha của hàm tần số X( ej) cos(2 ) ej
2 Biến đổi FOURIER ngược
Biến đổi Fourier ngược cho phép tìm dãy x(n) từ hàm ảnh X(e j ) Để tìm biểu
thức của phép biến đổi Fourier ngược, xuất phát từ biểu thức Fourier thuận [2] :
Trang 14(IFT là chữ viết tắt của thuật ngữ tiếng Anh Inverse Fourier Transform).
Biểu thức biến đổi Fourier thuận [20] và biểu thức biến đổi Fourier ngược [21] hợp
thành cặp biến đổi Fourier của dãy số x(n).
Trang 15( 1) ( 1) ( 3) ( 3)
1 ( )
, nên để lập bảng biến đổi Fourier chỉ cần sử dụng
bảng biến đổi z khi thay z = e j , và để tìm biến đổi Fourier ngược, ngoài cách tính
trực tiếp tích phân [21], cũng có thể sử dụng các phương pháp giống như tìm biến đổi
Z ngược.
3 Các tính chất của FOURIER
Do biến đổi Fourier là một trường hợp riêng của biến đổi Z nên, biến đổi Fourier
cũng có các tính chất giống như biến đổi Z Dưới đây trình bầy các tính chấtthường được sử dụng khi phân tích phổ tín hiệu số và đặc tính tần số của hệ xử lýsố
Trang 16Chứng minh: Theo biểu thức biến đổi Fourier thuận [2] có
Khi dịch trễ dãy x(n) đi k mẫu thì hàm biên độ tần sốX(e j ) không thay đổi, chỉ
có hàm pha tần số () bị dịch đi lượng k.
Nếu k > 0 là x(n) bị giữ trễ k mẫu, nếu k < 0 là x(n) được đẩy sớm k mẫu.
Chứng minh: Theo biểu thức biến đổi Fourier thuận [2] có :
Trang 17Theo biểu thức [6] và tính chất dịch của biến đổi Fourier nhận được :
Khi nhân dãy x(n) với , trong đó 0 là hằng số, thì hàm tần số X(e j ) không bị biến
dạng mà chỉ tịnh tiến trên trục tần số một khoảng bằng 0 , theo chiều ngược với dấu
Trang 18Như vậy, các dãy thực nhân quả và phản nhân quả tương ứng có hàm biên độ tần
số giống nhau, còn hàm pha tần số ngược dấu
Ta sẽ xét sự biến đổi giá trị điểm ảnh theo 2 chiều tọa độ Ox và Oy, tương ứng có 2
chiều trong miền tần số, đặt là u và v
Hình trên minh họa biến đổi DFT 2 chiều Ảnh gốc chỉ có sự biến đổi giá trị theo
chiều Ox nên tương ứng trong miền tần số chỉ có sự thay đổi giá trị theo u
Biến đổi DFT cho ảnh kích thước N × N tính theo công thức sau:
Trang 19Một đặc tính quan trọng của biến đổi DFT là tính lặp lại, hay chu kỳ Ta sẽ chứng minh DFT
2 chiều có đặc tính này Với biến đổi DFT của ảnh kích thước N × N , với m và n là các sốnguyên, ta tính:
Do m, n nguyên nên nguyên Áp dụng được:
Kết quả cho thấy tuần hoàn với chu kỳ N, với N × N là kích thước của ảnh đầu vào.Như vậy, mặc dù các biến u và v không bị chặn (từ -∞ đến ∞ ), nhưng do tính chất tuần hoànnên kết quả của biến đổi DFT 2 chiều của ảnh N × N chỉ cần biểu diễn dưới dạng ma trận N
× N
Giá trị còn gọi là hệ số DC (Direct Current) Thay u = v = 0 vào phương trình
ta được:
Hay là tổng giá trị tất cả các điểm ảnh chia cho
Hình dưới bên trái biểu diễn kết quả biến đổi DFT dưới dạng ma trận Ta sử dụng phép dịch
để được kết quả như hình bên phải, điểm tần số 0 (hệ số DC) nằm ở giữa ma trận, các điểmbiểu diễn tần số tăng dần theo chiều tiến ra biên
Trang 20Dịch hệ số DC vào giữa ma trận kết quả
Phương trình trên cho thấy khi nhân mỗi điểm ảnh với , điểm biểu diễn DFT bị dịch
đi một đoạn theo cả 2 trục Tức là điểm tần số 0 sẽ nằm chính giữa ma trận kết quả biểudiễn miền tần số
III Trích rút đặc trưng của ảnh từ miền tần số
Nhóm em sử dung các đặc trưng để trích đo sự tương đồng tìm ảnh như sau:
Trang 212 Tần suất xuất hiện các giá trị của điểm ảnh (tong từ 0 đến giá trị max)
3 Entropy của ảnh (năng lượng: ảnh mang thông tin)
4 Giá trị trung bình của biên độ ảnh trong miền tần số
CODE
1 Các cấu trúc sử dụng :
Freq: chứa giá trị x và tần suất xuất hiện fre của x.
Destance: chứa tên ảnh x và khoảng cách L1-norm của ảnh mới và x.
Pix: chứa các giá trị màu của điểm ảnh.
Trang 22 BitMap: chứa các thông tin về ảnh.
- Các hàm được sử dụng:
Trang 23 readBMP: dùng để đọc file ảnh định dạng BMP
Trang 24 Dft_face: hàm chuyển đổi DFT đầu vào là mảng các điểm ảnh, kích thước và đầu ra là mảng.
writeData: hàm ghi dữ liệu đầu ra của hàm d_f_t vào file định dạng txt.
Trang 25 converDataToPixelArray: hàm chuyển đổi dữ liệu ảnh sang mảng các điểm ảnh.
Trang 26 fr: hàm tính tần suất xuất hiện, đầu và là đầu ra của hàm d_f_t đầu ra
là mảng struct kiểu Freq.
Trang 27 L1N: hàm tính khoảng cách L1-norm đầu vào là 2 vector đặc trung của 2 ảnh, đầu ra là khoảng cách.
writeVect: hàm ghi vector thuôc tính vào file định dạng txt.
Trang 28 writeDes: hàm ghi khoảng cách của ảnh mới với các ảnh trong tập ảnh, và khoảng cách min vào file định dạng txt.
Trang 29 grayscale: chuyển từ mảng pix RGB sang 1 màu
Hàm main:
Trang 33Trích rút đặc trưng:
Trang 35Kết quả: ảnh 1.bmp
DFT cho ảnh 1.bmp
Trang 36Vector đặc trưng:
Tìm kiếm ảnh:
Cho đầu vào là ảnh be.bmp
Khoảng cách distance với 40 bức ảnh còn lại được trích ra: