1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài tập lớn hệ cơ sở dữ liệu đa phương tiện

38 442 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 38
Dung lượng 1,4 MB

Nội dung

Hãy sử dụng ngôn ngữ lập trình CC++ để thực hiện các việc sau. 1. Tìm hiểu và nắm vững phương pháp chuyển đổi Fourier rời rạc. Hãy trình bày các kỹ thuật nhận dạng mặt người sử dụng chuyển đổi Fourier rời rạc. 2. Hãy sưu tầm 40 bức ảnh chân dung người từ internet, các bức ảnh đều có cùng kích thước. Những bức ảnh này gồm đủ mặt đàn ông, đàn bà. 3. Viết một hàm có tên “dft_face” để chuyển đổi một bức ảnh sang miền tần số bằng phương pháp chuyển đổi Fourier rời rạc (DFT). 4. Thực hiện chuyển đổi DFT cho toàn bộ các bức ảnh nói trên. Xây dựng một vector gồm ít nhất 4 thuộc tính của mỗi bức ảnh từ tín hiệu đã chuyển đổi DFT. 5. Chọn một bức ảnh mới về mặt trẻ em, thực hiện việc tìm kiếm xem trong số 40 bức ảnh đã lưu có bức ảnh nào giống nhất với bức ảnh mới đưa vào dựa trên các thuộc tính đã chọn ở bước 4.

Trang 1

Mục Lục

A TÌM HIỂU VỀ MỘT SỐ KĨ THUẬT XỬ LÝ ẢNH 2

I MỘT SỐ THUẬT TOÁN TÌM NGƯỠNG 3

1 Thuật toán tìm ngưỡng 3

2 Thuật toán đối xứng nền 3

II MỘT SỖ BỘ LỌC 5

1 Lọc trung vị 5

2 Lọc trung bình 7

3 Trung bình k láng giềng gần nhất 8

B TÌM HIỂU VỀ BIẾN ĐỔI FOURIER 9

I BIẾN ĐỔI FOURIER LÀ GÌ? 9

II CƠ SỞ BIẾN ĐỔI FOURIER CHO TÍN HIỆU VÀ HỆ THỐNG RỜI RẠC TRONG MIỀN TẦN SỐ LIÊN TỤC 9

1 Biến đổi FOURIER thuận 9

2 Biến đổi FOURIER ngược 14

3 Các tính chất của FOURIER 16

4 FOURIER 2 Chiều 19

III Trích rút đặc trưng trong miền tần số 22

IV Demo………

……… 24

Trang 2

Yêu cầu bài toán:

Hãy sử dụng ngôn ngữ lập trình C/C++ để thực hiện các việc sau

1 Tìm hiểu và nắm vững phương pháp chuyển đổi Fourier rời rạc Hãy trình bày các kỹ thuật nhận dạng mặt người sử dụng chuyển đổi Fourier rời rạc

2 Hãy sưu tầm 40 bức ảnh chân dung người từ internet, các bức ảnh đều có cùng kích thước Những bức ảnh này gồm đủ mặt đàn ông, đàn bà

3 Viết một hàm có tên “dft_face” để chuyển đổi một bức ảnh sang miền tần số bằng phương pháp chuyển đổi Fourier rời rạc (DFT)

4 Thực hiện chuyển đổi DFT cho toàn bộ các bức ảnh nói trên Xây dựng một vector gồm ít nhất 4 thuộc tính của mỗi bức ảnh từ tín hiệu đã chuyển đổi DFT

5 Chọn một bức ảnh mới về mặt trẻ em, thực hiện việc tìm kiếm xem trong số 40 bức ảnh đã lưu có bức ảnh nào giống nhất với bức ảnh mới đưa vào dựa trên các thuộc tính đãchọn ở bước 4

A TÌM HIỂU VỀ MỘT SỐ KĨ THUẬT XỬ LÝ ẢNH

Kỹ thuật xử lý ảnh: là quá trình biến đổi một hình ảnh thành một hình ảnh khácbằng máy tính điện tử một cách tự động phụ thuộc vào mục đích của người sử dụng

1 Thuật toán tìm ngưỡng

 Đây là kỹ thuật chọn ngưỡng theo kiểu lặp do Ridler và Calvard đưa ra

 Trước hết, lược đồ sẽ được phân đoạn thành hai phần bằng một giá trịngưỡng khởi động với tức là bằng phân nửa thang độ xám động của ảnh

 Sau đó, các trung bình mẫu (mf,0) của những điểm ảnh thuộc đối tượng và(mb,0) của những điểm ảnh nền sẽ được tính toán

 Một giá trị ngưỡng mới q1 sẽ được tính kế đó bằng cách lấy giá trị trungbình của hai trung bình mẫu nói trên

 Quá trình này cứ thế sẽ được tiếp tục với ngưỡng mới cho đến khi nào giátrị ngưỡng không thay đổi nữa thì dừng lại

 Nếu biểu diễn dưới dạng công thức toán học, chúng ta có :

Trang 3

2 Thuật toán đối xứng nền

 Kỹ thuật này dựa trên sự giả định là tồn tại hai đỉnh phân biệt trong lược

đồ nằm đối xứng nhau qua đỉnh có giá trị lớn nhất trong phần lược đồthuộc về các điểm ảnh nền Kỹ thuật này có thể tận dụng ưu điểm củaviệc làm trơn.Đỉnh cực đại maxp tìm được nhờ tiến hành tìm giá trị cựcđại trong lược đồ Sau đó thuật toán sẽ được áp dụng ở phía không phải

là điểm ảnh thuộc đối tượng ứng với giá trị cực đại đó nhằm tìm ra giátrị độ sáng a ứng với giá trị phần trăm p% mà: P(a) = p%, trong đó P(a)

là hàm phân phối xác suất về độ sáng

Định nghĩa: [Hàm phân phối xác suất về độ sáng] Hàm phân phối xác

suất P(a) thể hiện xác suất chọn được một giá trị độ sáng từ một vùngảnh cho trước, sao cho giá trị này không vượt quá một giá trị sáng chotrước a Khi a biến thiên từ âm vô cùng đến dương vô cùng, P(a) sẽnhận các giá trị từ 0 đến 1 P(a) là hàm đơn điệu không giảm theo a, dovậy

Trang 4

 Ở đây ta đang giả thiết là ảnh có các đối tượng tối trên nền sáng Giả sử

độ chắc chắn là 95%, thì có nghĩa là ta phải ở bên phải đỉnh maxp mộtgiá trị a sao cho P(a)=95% Do tính đối xứng đã giả định ở trên, chúng

ta lấy đối xứng qua maxp để có được ngưỡng T: T = maxp – (a – maxp)(5.11) Kỹ thuật này thực hiện ngược lại với tình huống ảnh có các đốitượng sáng trên một nền tối

1 Lọc trung vị

 Bộ lọc trung vị là bộ lọc làm mượt phi tuyến trong miền không gian

 Bộ lọc trung vị là một trong những bộ lọc theo thống kê thứ tự

 Nó thay thế giá trị của điểm ảnh bằng trung vị của các mức xám củacácđiểm lân cận

 Bộ lọc trung vị được dùng phổ biến, bởi vì một số loại nhiễu nhất định,

nó có thể lọc nhiễu rất tốt với độ mờ thấp so với bộ lọc tuyến tính cùngkích thước

 Trung vị E của một tập hợp là giá trị mà một nữa các giá trị trong tậphợpnhỏ hơn hoặc bằng E, một nữa các giá trị trong tập hợp lớn hơn hoặcbằng E

 Áp dụng bộ lọc trung vị lên điểm đang xét, ta sắp xếp các điểm ảnh vàlân cận của nó theo thứ tự giá trị tăng dần và tìm giá trị trung vị, gán giátrị này cho giá trị của điểm anh đang xét

Trang 5

 Chức năng cơ bản của bộ lọc trung vị là thiết lập giá trị của các điểmvới các mức xám khác nhau thành giá trị có vẻ như gần giống với giá trịcủa điểm lân cận.

 Thuật toán lọc Trung vị gồm các bước:

– Sử dụng một cửa sổ lọc (ma trận 3x3) quét qua lần lượt từng điểm ảnhcủa ảnh đầu vào input

– Tại vị trí mỗi điểm ảnh lấy giá trị của các điểm ảnh tương ứng trong vùng3x3 của ảnh gốc "lấp" vào ma trận lọc

– Sau đó sắp xếp các điểm ảnh trong cửa sổ này theo thứ tự (tăng dần hoặcgiảm dần tùy ý)

– Cuối cùng, gán điểm ảnh nằm chính giữa (Trung vị) của dãy giá trị điểmảnh đã được sắp xếp ở trên cho giá trị điểm ảnh đang xét của ảnh đầu raoutput

 Cho dãy x1; x2 ; xn đơn điệu tăng (giảm) Khi đó trung vị của dãy kýhiệu là Med({xn}), được định nghĩa:

Giả sử ta có ảnh I ngưỡng θ cửa sổ W(P) và điểm ảnh P

Khi đó kỹ thuật lọc trung vị phụ thuộc không gian bao gồm các bước cơ bản sau:

• Bước 1: Tìm trung vị trong phần ảnh đang xét (cửa sổ quét qua)

• Bước 2: Gán giá trị cho pixel “tâm”

Trang 6

Ví dụ: Giả sử cho cửa sổ W = (3x3); giá trị ngưỡng θ =2

Giá trị 16, sau phép lọc có giá trị 2, các giá trị còn lại không thay đổi

- Khử nhiễu

- Bộ lọc làm trơn đơn giản nhất là bộ lọc trung bình (average filtering)

 Ý tưởng bộ lọc trung bình: thay thế giá trị tại mỗi pixel bằng trung bìnhcác giá trị pixel trong mặt nạ lân cận nhằm

- Loại bỏ những pixel biến đổi lớn so với lân cận (nhiễu)

- Những pixel nằm trên biên cũng có sự biến đổi lớn so với lân cận ->làm mờ

 Cho dãy x1, x2…, xn khi đó trung bình của dãy ký hiệu AV({xn}) đượcđịnh nghĩa:

Trang 8

B1: tìm k giá trị gần nhất {I(q)| q ∈W(P)}→{k giá trị gần I(p) nhất}

B2: tính trung bình {k giá trị gần I(P) nhất}→ TBk(P)

B3:

Nhận xét:

Nếu k> kích thước cửa sổ W thì kỹ thuật này trở thành lọc trung bình

Nếu k=1 thì kết quả là chính nó

B TÌM HIỂU VỀ BIẾN ĐỔI FOURIER.

I BIẾN ĐỔI FOURIER LÀ GÌ?

Biến đổi Fourier hay chuyển hóa Fourier, được đặt tên theo nhà toán học người Pháp

Trang 9

cơ sở, có nghĩa là dưới dạng tổng hay một tích phân của các hàm số sin được nhân với cáchằng số khác nhau (hay còn gọi là biên độ) Biến đổi Fourier có rất nhiều dạng khác nhau,chúng phụ thuộc vào dạng của hàm được khai triển.

Biến đổi Fourier có rất nhiều ứng dụng khoa học, ví dụ như trong vật lý, số học, xử lý tínhiệu, xác suất, thống kê, mật mã, âm học, hải dương học, quang học, hình học và rất nhiềulĩnh vực khác Trong xử lý tín hiệu và các ngành liên quan, biến đổi Fourier thường đượcnghĩ đến như sự chuyển đổi tín hiệu thành các thành phần biên độ và tần số

Ở đây chúng ta đang tìm hiểu về biến đổi Fourier cho tín hiệu và hệ thống rời rạc trong miềntần số liên tục

II CƠ SỞ BIẾN ĐỔI FOURIER CHO TÍN HIỆU VÀ HỆ THỐNG RỜI RẠC

TRONG MIỀN TẦN SỐ LIÊN TỤC

Tổng quan biến đổi Foiurier chúng ta đang nghiên cứu là để chuyển biểu diễn tínhiệu và hệ thống rời rạc từ miền biến số độc lập n sang miền tần số liên tục ω

1 Biến đổi FOURIER thuận

1.1 Định nghĩa

Nếu dãy x(n) thoả mãn điều kiện

(n)

nx

Biến đổi Fourier đã chuyển dãy số x(n) thành hàm phức X(e j ), [2] là biểu thức biến

đổi Fourier thuận và được ký hiệu như sau :

Trang 10

1.2 Sự tồn tại của biến đổi FOURIER

Theo định nghĩa, biến đổi Fourier thuận [2] chỉ tồn tại nếu dãy x(n) thoả mãn điều kiện khả tổng tuyệt đối [1] Điều đó có nghĩa là, nếu dãy x(n) thoả mãn điều kiện [1] thì chuỗi [2] sẽ hội tụ về hàm X(e j ), nên x(n) tồn tại biến đổi Fourier Ngược lại,

nếu dãy x(n) không thoả mãn điều kiện [1] thì chuỗi [2] sẽ phân kỳ, vì thế hàm X(e j )

không tồn tại và x(n) không có biến đổi Fourier.

Các tín hiệu số x(n) có năng lượng hữu hạn :

2

( )

x n

�

�  �

[5]

luôn thỏa mãn điều kiện [1] , do đó luôn tồn tại biến đổi Fourier.

Ví dụ 1 : Hãy xét sự tồn tại và tìm biến đổi Fourier của các dãy sau:

Trang 12

- X(e j ) được gọi là hàm biên độ tần số, nó là hàm chẵn và đối xứng qua trụctung : X(ej ) =X(e - j )

-() được gọi là hàm pha tần số, nó là hàm lẻ và phản đối xứng qua gốc toạ

Hàm pha :   ( )    ( )  Arg [A( ej)] [19]

Với Arg [A( ej)]phụ thuộc vào dấu của hàm A( ej)như sau

0 0

[A( )]

( )

j j

1 2

j e

Trang 13

Ví dụ 2 : Hãy xác định các hàm phần thực và phần ảo, mô đun và argumen, độ lớn và

pha của hàm tần số X( ej) cos(2 )   ej

2 Biến đổi FOURIER ngược

Biến đổi Fourier ngược cho phép tìm dãy x(n) từ hàm ảnh X(e j ) Để tìm biểu

thức của phép biến đổi Fourier ngược, xuất phát từ biểu thức Fourier thuận [2] :

Trang 14

(IFT là chữ viết tắt của thuật ngữ tiếng Anh Inverse Fourier Transform).

Biểu thức biến đổi Fourier thuận [20] và biểu thức biến đổi Fourier ngược [21] hợp

thành cặp biến đổi Fourier của dãy số x(n).

Trang 15

( 1) ( 1) ( 3) ( 3)

1 ( )

, nên để lập bảng biến đổi Fourier chỉ cần sử dụng

bảng biến đổi z khi thay z = e j , và để tìm biến đổi Fourier ngược, ngoài cách tính

trực tiếp tích phân [21], cũng có thể sử dụng các phương pháp giống như tìm biến đổi

Z ngược.

3 Các tính chất của FOURIER

Do biến đổi Fourier là một trường hợp riêng của biến đổi Z nên, biến đổi Fourier

cũng có các tính chất giống như biến đổi Z Dưới đây trình bầy các tính chấtthường được sử dụng khi phân tích phổ tín hiệu số và đặc tính tần số của hệ xử lýsố

Trang 16

Chứng minh: Theo biểu thức biến đổi Fourier thuận [2] có

Khi dịch trễ dãy x(n) đi k mẫu thì hàm biên độ tần sốX(e j )  không thay đổi, chỉ

có hàm pha tần số () bị dịch đi lượng k.

Nếu k > 0 là x(n) bị giữ trễ k mẫu, nếu k < 0 là x(n) được đẩy sớm k mẫu.

Chứng minh: Theo biểu thức biến đổi Fourier thuận [2] có :

Trang 17

Theo biểu thức [6] và tính chất dịch của biến đổi Fourier nhận được :

Khi nhân dãy x(n) với , trong đó 0 là hằng số, thì hàm tần số X(e j ) không bị biến

dạng mà chỉ tịnh tiến trên trục tần số một khoảng bằng 0 , theo chiều ngược với dấu

Trang 18

Như vậy, các dãy thực nhân quả và phản nhân quả tương ứng có hàm biên độ tần

số giống nhau, còn hàm pha tần số ngược dấu

Ta sẽ xét sự biến đổi giá trị điểm ảnh theo 2 chiều tọa độ Ox và Oy, tương ứng có 2

chiều trong miền tần số, đặt là u và v

Hình trên minh họa biến đổi DFT 2 chiều Ảnh gốc chỉ có sự biến đổi giá trị theo

chiều Ox nên tương ứng trong miền tần số chỉ có sự thay đổi giá trị theo u

Biến đổi DFT cho ảnh kích thước N × N tính theo công thức sau:

Trang 19

Một đặc tính quan trọng của biến đổi DFT là tính lặp lại, hay chu kỳ Ta sẽ chứng minh DFT

2 chiều có đặc tính này Với biến đổi DFT của ảnh kích thước N × N , với m và n là các sốnguyên, ta tính:

Do m, n nguyên nên nguyên Áp dụng được:

Kết quả cho thấy tuần hoàn với chu kỳ N, với N × N là kích thước của ảnh đầu vào.Như vậy, mặc dù các biến u và v không bị chặn (từ -∞ đến ∞ ), nhưng do tính chất tuần hoànnên kết quả của biến đổi DFT 2 chiều của ảnh N × N chỉ cần biểu diễn dưới dạng ma trận N

× N

Giá trị còn gọi là hệ số DC (Direct Current) Thay u = v = 0 vào phương trình

ta được:

Hay là tổng giá trị tất cả các điểm ảnh chia cho

Hình dưới bên trái biểu diễn kết quả biến đổi DFT dưới dạng ma trận Ta sử dụng phép dịch

để được kết quả như hình bên phải, điểm tần số 0 (hệ số DC) nằm ở giữa ma trận, các điểmbiểu diễn tần số tăng dần theo chiều tiến ra biên

Trang 20

Dịch hệ số DC vào giữa ma trận kết quả

Phương trình trên cho thấy khi nhân mỗi điểm ảnh với , điểm biểu diễn DFT bị dịch

đi một đoạn theo cả 2 trục Tức là điểm tần số 0 sẽ nằm chính giữa ma trận kết quả biểudiễn miền tần số

III Trích rút đặc trưng của ảnh từ miền tần số

Nhóm em sử dung các đặc trưng để trích đo sự tương đồng tìm ảnh như sau:

Trang 21

2 Tần suất xuất hiện các giá trị của điểm ảnh (tong từ 0 đến giá trị max)

3 Entropy của ảnh (năng lượng: ảnh mang thông tin)

4 Giá trị trung bình của biên độ ảnh trong miền tần số

CODE

1 Các cấu trúc sử dụng :

 Freq: chứa giá trị x và tần suất xuất hiện fre của x.

 Destance: chứa tên ảnh x và khoảng cách L1-norm của ảnh mới và x.

 Pix: chứa các giá trị màu của điểm ảnh.

Trang 22

 BitMap: chứa các thông tin về ảnh.

- Các hàm được sử dụng:

Trang 23

 readBMP: dùng để đọc file ảnh định dạng BMP

Trang 24

 Dft_face: hàm chuyển đổi DFT đầu vào là mảng các điểm ảnh, kích thước và đầu ra là mảng.

 writeData: hàm ghi dữ liệu đầu ra của hàm d_f_t vào file định dạng txt.

Trang 25

 converDataToPixelArray: hàm chuyển đổi dữ liệu ảnh sang mảng các điểm ảnh.

Trang 26

 fr: hàm tính tần suất xuất hiện, đầu và là đầu ra của hàm d_f_t đầu ra

là mảng struct kiểu Freq.

Trang 27

 L1N: hàm tính khoảng cách L1-norm đầu vào là 2 vector đặc trung của 2 ảnh, đầu ra là khoảng cách.

 writeVect: hàm ghi vector thuôc tính vào file định dạng txt.

Trang 28

 writeDes: hàm ghi khoảng cách của ảnh mới với các ảnh trong tập ảnh, và khoảng cách min vào file định dạng txt.

Trang 29

 grayscale: chuyển từ mảng pix RGB sang 1 màu

Hàm main:

Trang 33

Trích rút đặc trưng:

Trang 35

Kết quả: ảnh 1.bmp

DFT cho ảnh 1.bmp

Trang 36

Vector đặc trưng:

Tìm kiếm ảnh:

Cho đầu vào là ảnh be.bmp

Khoảng cách distance với 40 bức ảnh còn lại được trích ra:

Ngày đăng: 24/05/2018, 00:01

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w