Phép biến đổi đơn vị, phép biến đổi KL PCA Nguyên nhân: DCT là một tiêu chuẩn quốc tế cho các hệ thống mã chuyểnvị bởi nó có đặc tính gói năng lượng tốt (gói năng lượng của ảnh con vàomột phần nhỏ các hệ số hàm truyền), cho kết quả là số thực và có thuật toán nhanh để thực hiện chúng. DCT mang lại một tỉ lệ nén hiệu quả và chấtlượng ảnh suy giảm là có thể chấp nhận được. Chính vì thế với JPEG làmột định dạng ảnh phổ biến nhất hiện nay, việc sử dụng DCT giúp giảm được rất nhiều chi phí và tài nguyên lưu trữ truyền tải.
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
Viện Công nghệ Thông tin và Truyền thông
Báo cáo
Xử lý dữ liệu đa phương tiện Nhóm 5: Tìm hiểu các phép biến đổi trong xử lý dữ liệu
đa phương tiện và ứng dụng
Giáo viên hướng dẫn: PGS.Nguyễn Thị Hoàng Lan Sinh viên thực hiện: Hoàng Đình Hiệp 20111584
Hoàng Anh Chiến 20111247 Nguyễn Văn Hiệp 20111590
Trang 2Mục lục
Lời nói đầu
Xử lý dữ liệu đa phương tiện cung cấp các kiến thức lý thuyết và cá kỹ thuật xử lý dữ liệu đa phương tiện cần thiết trong các ứng dụng truyền thông đa phương tiện trên mạng máy tính Cũng như khái quát về các lại dữ liệu đa
phương tiện và xử lý dữ liệu trong truyền thông đa phương tiện; tín hiệu video,
số hoá video và nén; mã hoá dự đoán DPCM; lượng tử hoá vector; phương pháp
mã hoá các dải tần; nén ảnh dựa trên các phép biến đổi; các phương pháp nén video; các phương pháp mã hoá audio; đồng bộ audio-video
Để hiểu thêm lý thuyết, các kỹ thuật trong xử lý nén ảnh nhóm đã chọn
Đề tài 5: Tìm hiểu các phép biến đổi trong xử lý dữ liệu đa phương tiện và ứng dụng Trong đề tài này, nhóm đã tập trung vào các phép biến đổi là: KL,
PCA Và ứng dụng của PCA trong trích chọn đặc trưng khuôn mặt
Do hạn chế về thời gian, cũng như kiến thức và kinh nghiệm bài báo cáo không tránh khỏi những thiếu sót Rất mong được sự góp ý của cô và các bạn.
Nhóm xin chân thành cảm ơn!
Trang 3Phân công công việc
- Nguyễn Văn Hiệp:
Tìm hiểu chung các phép biến đổi đơn vị, các tính chất chung
- Hoàng Đình Hiệp:
Tìm hiểu các phép biến đổi KL, PCA (Principle Component Analysis)
Tìm hiểu về phương pháp trích chọn đặc trưng dựa trên các phép biến đổi KL-PCA
- Hoàng Anh Chiến:
Khảo sát các ứng dụng của phép biến đổi PCA trong trích chọn đặc trưng khuôn mặt
Trang 41 Phép biến đổi đơn vị (Unitary Transform)
Định nghĩa phép biến đổi đơn vị trong không gian vector dữ liệu:
x T
y = A.
với điều kiện
I T
TA. A*T =
Trong đó:
: Ma trận dữ liệu đầu vào có dạng [1*n]={ n
x x
x
x1, 2, 3, ,
}
: Ma trận hệ số biến đổi
T
: Ma trận của phép biến đổi
•
T A
T *
: Ma trận chuyển vị của ma trận phức liên hợp của ma trận T A
: Ma trận đơn vị Xét điều kiện trên ta thấy:
I T
TA−1. A =
nếu A
T
là trực giao thì TA−1 = TA
I T
T T A
Mặt khác: Nếu A
T
là ma trận thực thì
T A
T A A
T * = ⇒ = *
Do đó: nếu ma trận A
T
vừa thực vừa trực giao thì
I T
T T A
A * =
(điều kiện được thỏa mãn)
Tồn tại một phép biến đổi ngược:
Trang 5T
x ˆ = ˆ = ∑
trong đó
•
I T T T
T T
T
A A
S = −1 = * ⇒ = =
•
) , , ,
( i,1 i,2 i,n
T
i =
chính là hàng thứ i của
ma trận
*
A
T
và cũng là cột thứ i của ma trận
T A
T *
• s i
T
được gọi là vector cơ sở của phép biến đổi Phép biến đổi đơn vị phân tích vector x thành tổ hợp tuyến tính của các vector cơ sở với hệ số phân tích là y
Kì vọng:
[ i j ]
E Φi, Φ ˆ j = δ −
Trong không gian trực chuẩn, A
T
là ma trận trực giao do đó ta có:
T A A
T = − 1 =
⇒ TA TA T = TA T TA = I
[ i j ]
E Φi, Φ j = δ −
- Bảo toàn năng lượng: ||x||2=||y||2 (đẳng thức Parseval), không gây sai số giữa 2 miền không gian
Trang 6- Năng lượng tập trung: Đối với ảnh thông thường, năng lượng phân bố
không đều; các thành phần biến thiên nhanh chiếm năng lượng nhỏ trong tín hiệu; nhiều phép biến đổi đơn vị tập trung năng lượng ảnh vào một vài thành phần hệ số biến đổi
- Giải tương quan: Đầu vào là vector có thành phần tương quan mạnh, qua
phép biến đổi sẽ nhận được các thành phần tương quan yếu
Đánh giá: Trong các phép biến đổi đơn vị, phương pháp biến đổi KL là tốt nhất về lí thuyết cho nén dữ liệu
Nguyên nhân:
o Phép biến đổi KL đạt được sự giải tương quan tốt nhất nên về mặt
lí thuyết thì đó là phương pháp nén dữ liệu tốt nhất
Phương pháp biến đổi cosin rời rạc được dùng theo chuẩn JPEG
Nguyên nhân: DCT là một tiêu chuẩn quốc tế cho các hệ thống mã chuyển
vị bởi nó có đặc tính gói năng lượng tốt (gói năng lượng của ảnh con vào một phần nhỏ các hệ số hàm truyền), cho kết quả là số thực và có thuật toán nhanh để thực hiện chúng DCT mang lại một tỉ lệ nén hiệu quả và chất lượng ảnh suy giảm là có thể chấp nhận được Chính vì thế với JPEG là một định dạng ảnh phổ biến nhất hiện nay, việc sử dụng DCT giúp giảm được rất nhiều chi phí và tài nguyên lưu trữ truyền tải
Trang 72 Phép biến đổi KL, PCA
Phép biến đổi KL có nguồn gốc từ khai triển chuỗi của các quá trình ngẫu nhiên liên tục Biến đổi KL cũng còn gọi là biến đổi Hoteling hay phương pháp thành phần chính
Phép biến đổi KL là phép biến đổi tuyến tính đơn vị dựa trên các vecto riêng và các giá trị riêng của ma trận tương quan để cho phép giảm thứ nguyên không gian với sai số nhỏ nhất
Đây là phép biến đổi không gian chiều thành không gian chiều, với Mỗi thành phần của vectơ miêu tả một đặc tính của đối tượng Nếu ta biến đổi được từ không gian n chiều về không gian m chiều, như vậy ta sẽ làm giảm được thông tin dư thừa (giảm thứ nguyên)
Mục đích của biến đổi KL là chuyển từ không gian n chiều sang không gian trực giao m chiều sao cho sai số bình phương là nhỏ nhất Gọi là tập các vector cơ sở trong không gian trực giao
Với với và
Mọi vector y trong không gian trực giao có thể viết:
với
Gọi là kết quả thu được trong không gian m chiều và
Sai số trong phép biến đổi
Sai số trung bình bình phương:
Trang 8Mà , do đó
Theo định nghĩa của R, phương trình trở thành:
đạt min khi ( đạt min
Đặt (5)
Như vậy đạt min khi (5) min Để tìm min của 5 ta dùng phương pháp đạo hàm và dẫn đến việc giải phương trình:
Phương trình 6 gọi là phương trình đặc trưng của R với là các trị riêng và
là các véctơ riêng tương ứng Đây chính là cơ sở lý thuyết của biến đổi KL
Không gian quan sát
Phép biến đổi KL: sao cho sai số trung bình bình phương nhỏ nhất
là ma trận của phép biến đổi
Các bước thực hiện:
Tính ma trận tương quan R của X:
R có giá trị riêng tương ứng với
vecto riêng (trực giao đôi một)
Có phương trình đặc trưng của R:
⇔
⇒ các giá trị riêng
Trang 9⇒ các vecto riêng Chọn M giá trị lớn nhất trong N giá trị tìm được, ta có M vecto tương ứng
Ma trận biến đổi với
Mục tiêu của PCA là tìm một không gian mới với số chiều nhỏ hơn không gian cũ
Các trục toạ độ trong không gian mới được xây dựng sao cho trên mỗi trục,
độ biến thiên của dữ liệu trên đó là lớn nhất có thể
Cho ma trận
Tiền xử lý
hoặc
Với là độ lệch chuẩn của cột j trong X
Xây dựng không gian mới.
Tìm các giá trị riêng và vecto riêng của ma trận hiệp phương sai của
R có N giá trị riêng �, ta sắp xếp theo thứ tự giảm dần, tương ứng được N vecto riêng u
Chuyển dữ liệu từ không gian ban đầu vào không gian mới.
Chọn ra k vecto riêng đầu tiên:
Trang 10Toạ độ các điểm trong không gian mới là:
Các bước thực hiện:
Gọi M là số mẫu đầu vào, mỗi mẫu được chuyển thành vector N chiều Ta
có tập hợp đầu vào
Trung bình của các vector đầu vào:
Sai lệch so với tâm:
Gọi ta có ma trận tương quan của A là:
C có giá trị riêng tương ứng với
vecto riêng (trực giao đôi một)
Ta được:
Sắp xếp các giá trị riêng theo thứ tự giảm dần, tương ứng được các vecto riêng
Chọn ra k vector riêng u đầu tiên tương ứng với k giá trị riêng � lớn nhất
Phép biến đổi tuyến tính là:
Trang 123 Khảo sát các ứng dụng của phép biến đổi PCA trong trích chọn đặc trưng khuôn mặt
Trong thực tế có vô vàn các ứng dụng đã được thiết kế phục vụ cho các mục đích nhận dạng, nhận diện khuôn mặt người
Ví dụ :
- ứng dụng mở khóa laptop hay mở khóa điện thoại bằng cách nhận diện khuôn mặt
- Ứng dụng xác định vị trí những khuôn mặt người trong một bức ảnh
- Hệ thống tra cứu tội phạm: Nó giúp cơ quan an ninh có thể kiểm tra một người A có phải là tội phạm đang bị truy nã hay không
- Hệ thống tương tác giữa người và máy
- Các hệ thống camera,
- v.v
Ở đây, để khảo sát ứng dụng của phép biến đổi PCA trong trích chọn đặc trưng khuôn mặt em sẽ vận dụng vào một bài toán nhỏ :
Em có một bức ảnh trong đó có thể có ảnh khuôn mặt của một người hoặc
là không phải Và em sẽ phải kiểm tra xem bức ảnh đó có phải là mặt người hay không Bài toán này là một phần nhỏ trong bài toán xác định vị trí mặt người trong một bức ảnh lớn
Ứng dụng dựa trên phương pháp thiết lập các khuôn mặt riêng – eigenface
từ các trị riêng, vectơ riêng của một tập cơ sở dữ liệu các ảnh khuôn mặt đã
có Ý tưởng của phương pháp là phân tích các thành phần chủ yếu tạo nên khuôn mặt, hoặc những vectơ riêng của ma trận hiệp phương sai của tập ảnh các khuôn mặt Mỗi vectơ chưa một số lượng các đặc tính riêng biệt của khuôn mặt từ đó tạo ra sự khác nhau giữa các khuôn mặt Các vectơ này còn được gọi là các khuôn mặt riêng – eigenfaces
Trang 133.2.3. Sơ đồ thực hiện:
Đầu vào: Đầu vào là tập dữ liệu ảnh có kích thước giống nhau, mỗi ảnh là một khuôn mặt (Tập dữ liệu huấn luyện :trainingset)
Qua quá trình vận dụng PCA để biến đổi ta có được đầu ra là các khuôn mặt riêng (eigenfaces)
Tập các ảnh mặt người
Sử dụng phép biến đổi
PCA Kết quả
Tạo ra khuôn mặt trung bình và các khuôn mặt
riêng
Đưa ảnh cần kiểm tra
có phải khuôn mặt hay
không
Tính khoảng cách Euclide
Gần không gian mặt người ???
Sai Đúng
Là ảnh mặt người Không là ảnh mặt
người
Trang 14Sau quá trình tính toán ta đưa ảnh cần xác định có phải là mặt người hay không vào để kiểm tra
Giả sử ta có tập huấn luyện gồm M bức ảnh khuôn mặt ,, , Chúng ta biểu diễn mỗi bức ảnh kích thức NxN bằng một vector Γ có kích thước x1:
Các ảnh trong tập huấn luyện lần lượt là Γ1, Γ2, Γ3,…, ΓM Khuôn mặt trung bình của tập được ký hiệu:
Để có được các chi tiết cần thiết, ảnh khuôn mặt cần được biểu diễn trong một không gian nhỏ hơn Tương đương với việc ta cần tính các vector riêng của ma trận hiệp phương sai (các khuôn mặt riêng)
Mỗi khuôn mặt chênh lệch với khuôn mặt trung bình một đại lượng là vector :
Ta có ma trận hiệp phương sai:
Trang 15Như vậy, ma trận C có kích thước N2x N2 , việc xác định N2 vector riêng và giá trị riêng là khó thực hiện Ta cần một phương pháp dễ dàng hơn để tìm các vector riêng này Ta chỉ giữ lại những vectơ riêng tương ứng với những trị riêng lớn nhất bởi những vectơ riêng này chứa nhiều đặc trưng nhất, còn các vectơ ứng với các trị riêng nhỏ chỉ chứa một số ít các đặc trưng
Thay vì việc tính các vector riêng của ma trận C, ta đi tính các vector riêng của ma trận MxM Xét các vector riêng vi của ATA :
ATAvi = μi vi
Nhân 2 vế của phương trình trên với A , ta có:
AAT Avi = μi Avi
Từ đó ta thấy = Avi là vector riêng của C = AAT
Như vậy AAT và ATA có cùng các trị riêng và vector riêng của chúng quan
hệ với nhau theo = Avi
Chú ý: ATA có thể có M trị riêng và vector riêng
AAT có thể có N2 trị riêng và vector riêng
M trị riêng của ATA cùng với các vector riêng tương ứng với M trị riêng lớn nhất của AAT
người hay không
Do các khuôn mặt riêng tương ứng với các trị riêng lớn nhất được chọn là khá đầy đủ để mô tả ảnh các khuôn mặt, nên ta có thể sử dụng chúng để xác
Trang 16định khuôn mặt có phải là mặt người hay không Các khuôn mặt riêng tạo
ra một không gian chiều con M từ không gian ảnh N2 ban đầu
Một ảnh cần kiểm tra (Γ) được biến đổi thành các thành phần khuôn mặt riêng (chiếu vào không gian ảnh mặt) bằng một biến đổi đơn giản
Với k = 1,…, M’ uT
k là các vectơ riêng ta đã tính ở trên
Các trọng số của một vector ΩT = [ω1, ω2, …, ωM’ ] mô tả các phần liên quan của mỗi khuôn mặt riêng trong biểu diễn ảnh khuôn mặt nhập vào
Để xác định ảnh kiểm tra có phải là khuôn mặt người hay không thì ta có thể xác định bằng cách tính toán khoảng cách Euclide:
Từ đây, ta có 2 khả năng:
(1) : nếu ảnh kiểm tra gần không gian mặt thì đó là ảnh mặt người
(2) : nếu ảnh kiểm tra không gần không gian mặt thì đó không phải là ảnh mặt người
Ví dụ:
Trang 17Ở ví dụ trên ta thấy nếu một ảnh mặt người sau khi chiếu lên không gian mặt thì được kết quả gần giống ban đầu, còn ảnh không phải mặt người thì sau khi chiếu được kết quả rất khác biệt so với ảnh ban đầu Từ cách đó ta
có thể phân biệt được ảnh đưa vào là ảnh mặt người hay không
- 30 bức ảnh thể hiện các trạng thái biểu cảm khác nhau của 3 người
- Mỗi bức ảnh có kích cỡ là: 112x92 px
Trang 183.4.2. khuôn mặt trung bình:
Trang 193.4.3. Các khuôn mặt riêng được tổng hợp
4 Tài liệu tham khảo:
http://luanvan.co/luan-van/do-an-xu-ly-anh-nhan-dang-mat-nguoi-tren-matlab-31017/
http://doc.edu.vn/tai-lieu/do-an-do-tim-va-cat-anh-mat-nguoi-dung-pca-s4339/
- http://phvu.net/2011/10/05/pca-principal-component-analysis/