Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 28 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
28
Dung lượng
504,67 KB
Nội dung
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG Trần Mạnh Tuấn NÉN ẢNH TRONG THÔNG TIN SỐ THẾ HỆ SAU Chun ngành: Kỹ thuật Viễn thơng Mã số: 62.52.02.08 TĨM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT HÀ NỘI – 2013 Cơng trình hồn thành tại: HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG Người hướng dẫn khoa học: 1- TS Phùng Kim Anh 2- TS Nguyễn Hữu Hậu Phản biện 1: PGS TS Đào Thanh Tĩnh Phản biện 2: PGS TS Nguyễn Văn Khang Phản biện 3: PGS TS Nguyễn Thế Hiếu Luận án bảo vệ trước Hội đồng đánh giá luận án tiến sĩ cấp Học viện họp Học viện Cơng nghệ Bưu Viễn thông vào hồi 14 00, ngày 10 tháng 12 năm 2013 Có thể tìm hiểu luận án tại: - Thư viện Quốc gia - Thư viện Học viện Công nghệ Bưu Viễn thơng MỞ ĐẦU Tính cấp thiết đề tài Hiện nay, với việc triển khai mạng thông tin hệ sau, nhiều ứng dụng đời truyền tín hiệu video phương tiện thông tin di động, đa môi trường Nâng cao hiệu sử dụng tài nguyên băng tần phương tiện tốn phải nén tín hiệu video hiệu Vì vậy, đề tài chủ đề cấp thiết cho việc ứng dụng truyền video mạng viễn thông đa môi trường hệ Mục tiêu nghiên cứu Tìm thuật tốn hợp lý để ước lượng chuyển động ảnh video cho dễ tính tốn, đảm bảo độ bám chuyển động ảnh cách tốt - Nghiên cứu đề xuất ứng dụng thuật toán ước lượng chuyển động không gian nhiều chiều với nghiệm ước lượng chuyển động tối ưu, độ bám tốt - Tăng hiệu sử dụng băng tần truyền dẫn thuật tốn khơng cần sử dụng tín hiệu đào tạo - Thuật toán ước lượng làm việc ổn định điều kiện kênh có nhiễu Đối tượng, phạm vi phương pháp nghiên cứu Luận án nghiên cứu phương pháp nén video số, ứng dụng truyền video mạng thông tin di động hệ Đây phạm vi rộng, bao gồm: lượng tử hóa, ước lượng chuyển động ảnh, mã hóa - giải mã Luận án tập trung vào việc nghiên cứu thuật toán ước lượng chuyển động ảnh, phân tích kết nghiên cứu chuyển động ảnh có trước đây; nghiên cứu thuật toán ước lượng mặt toán học từ tìm thuật tốn ước lượng hợp lý để đạt mục tiêu đề Từ phân tích tốn học, luận án dùng công cụ mô để kiểm chứng Ý nghĩa khoa học thực tiễn đề tài Ý nghĩa khoa học: Làm phong phú lý luận ước lượng chuyển động ảnh thuật tốn lặp, là: - Dùng thuật tốn Kalman: Đây phương pháp lặp, sử dụng không gian nhiều chiều nghiệm tối ưu ước lượng chuyển động - Dùng thuật toán mù: Đây phương pháp lặp, không cần sử dụng tham chiếu trước mà cần mối tương quan hai khung ảnh ước lượng chuyển động ảnh Ý nghĩa thực tiễn: Mở khả tính tốn để ước lượng ảnh nhanh hơn, có độ bám chuyển động tốt hơn, tránh thông tin dư thừa độ bám chuyển động không tốt gây Nội dung luận án Mở đầu: Giới thiệu toán phương pháp nghiên cứu Chương - Tổng quan nén video: Giới thiệu vai trị, vị trí, u cầu, mơ hình hệ thống số kỹ thuật nén video Chương - Tổng quan ước lượng chuyển động ảnh: Đây chương đưa kiến thức ước lượng chuyển động ảnh, thuật tốn có, đánh giá ưu điểm nhược điểm thuật tốn có Chương - Ước lượng chuyển động giải pháp mới: Đề xuất áp dụng thuật toán cho việc ước lượng chuyển động ảnh, thuật toán Kalman thuật toán mù Chương - Một số kết tính tốn số: Trình bày số kết mơ từ đưa nhận xét, so sánh hiệu phương pháp Bayes phương pháp Kalman Kết luận kiến nghị: Nêu lên kết đạt luận án hướng nghiên cứu CHƯƠNG TỔNG QUAN VỀ NÉN VIDEO 1.1 Giới thiệu Để truyền chương trình video hệ thống thơng tin di động, tốn đặt phải nén hình ảnh để tiết kiệm băng tần truyền dẫn mà đảm bảo chất lượng hình ảnh Trong hoàn cảnh mạng NGN di động hệ sau tiếp tục địi hỏi phải hồn thiện thuật tốn nén - giải nén tín hiệu video với mục đích làm cho chất lượng hình ảnh tốt hơn, sử dụng băng tần truyền dẫn hiệu 1.2 Độ dư tín hiệu video, nhu cầu cần thiết nén video 1.2.1 Độ dư tín hiệu video Mục trình bày độ dư tín hiệu video, gồm: Độ dư thống kê ảnh (độ dư không gian, độ dư thời gian, độ dư mã) độ dư khả nhìn thấy Việc nhận biết độ dư tín hiệu video tìm kiếm giải pháp để loại bỏ độ dư nén liệu 1.2.2 Nhu cầu cần thiết nén video Những thành tựu đạt công nghệ điện tử - viễn thông tin học tạo điều kiện phát triển kỹ thuật truyền video đáp ứng nhu cầu ngày tăng ứng dụng sống hàng ngày điện thoại video, hội nghị video, truyền hình độ phân giải cao… Để làm điều đó, cần thiết phải nén video 1.3 Khái niệm nén video Mục trình bày khái qt về: Khái niệm nén video, mơ hình, chức bản, đặc điểm phần tử hệ thống nén video Hình 1.5 mơ hình nén video tổng quát 1.4 Yêu cầu ứng dụng nén video, số kỹ thuật nén video 1.4.1 Yêu cầu ứng dụng nén video Mục trình bày số yêu cầu ứng dụng nén video, gồm: Các đặc tính video, yêu cầu truyền dẫn, đặc tính hiệu hệ thống nén, yêu cầu tỷ lệ méo yêu cầu tiêu chuẩn Hình 1.5 Hệ thống nén video tổng quát 1.4.2 Một số kỹ thuật nén video Mục trình bày số kỹ thuật nén video bản, bao gồm: - Mã entropy mã dự đoán: Là mã tiếp cận entropy nguồn; DPCM sử dụng mô hình nguồn Markov dùng chuẩn MPEG-1 H.261 Tuy nhiên, mã hoá tương đối phức tạp; VLC dùng kết hợp với DPCM để giảm tốc độ bit - Mã chuyển đổi khối biến đổi DCT: Gói hầu hết lượng tín hiệu gốc vào số hệ số biến đổi, bỏ qua hệ số chứa khơng chứa lượng Có ưu điểm IDCT khơng tạo gián đoạn rõ nét rìa khối; biến đổi rời rạc tạo nên tín hiệu tái cấu trúc có chu kỳ; nhược điểm tính tốn chủ yếu giải tích cổ điển, phức tạp - Bù ước lượng chuyển động: Dựa vào tĩnh chuyển động ảnh gần Nếu khơng thay đổi hai khung hiệu chúng hai khung mã hố thành Các vật thể chuyển động phát cách phối hợp vật thể cận cảnh hai khung CHƯƠNG TỔNG QUAN VỀ ƯỚC LƯỢNG CHUYỂN ĐỘNG CỦA ẢNH 2.1 Giới thiệu Ước lượng chuyển động trình quan trọng việc mơ tả, phân tích dãy ảnh, bám mục tiêu mã hóa video Việc mơ tả ứng dụng có yêu cầu khác nhau, phải sử dụng phương pháp ước lượng chuyển động khác Chương luận án tập trung vào việc nghiên cứu phương pháp ước lượng chuyển động video so sánh phương pháp đó, từ định hướng cho giải pháp đề xuất chương luận án 2.2 Ước lượng chuyển động phương pháp ước lượng chuyển động 2.2.1 Ước lượng chuyển động Ước lượng chuyển động phận cấu thành toán mã hoá nén video Trong ước lượng chuyển động, điểm s=[h, v]T khung thời điểm t liên quan đến điểm khung tham chiếu trước thời điểm t-∆t: f t (s) = ft −∆t (s − x(s)) (2.1) Mục đích ước lượng chuyển động tìm véctơ chuyển động x(s)=[xh(s), xv(s)]T Chú ý x(s) khơng thiết phải véctơ chuyển động tồn điểm Như vậy, phương pháp ước lượng chuyển động cần phải truy cập giá trị cường độ vị trí khơng lấy mẫu khung tham chiếu Phương pháp nội suy song tuyến tính thường sử dụng dung hịa tốt chất lượng nội suy độ phức tạp tính tốn Nó định nghĩa sau: f (h, v) = (1 − h f )(1 − v f ) f (hi , vi ) + h f (1 − v f ) f (hi + 1, vi ) (2.3) + (1 − h f )v f f ( hi , vi + 1) + h f v f f (hi + 1, vi + 1) (hi,vi) (hf,vf) tương ứng phần nguyên phần phân tọa độ điểm (h,v) Các mơ hình tất định xác suất Trong mơ hình tất định, chuyển động xem đại lượng tất định chưa biết Bằng cách cực đại xác suất dãy video quan sát theo chuyển động chưa biết ước lượng đại lượng tất định Công thức ước lượng tương ứng thường xem toán ML Trong mơ hình xác suất, chuyển động xem biến ngẫu nhiên Tập véctơ chuyển động tạo thành trường ngẫu nhiên Trường thường mơ hình hoá trường ngẫu nhiên Markov (MRF) Việc ước lượng chuyển động cơng thức hố tốn MAP Các mơ hình tham số phi tham số Trong mơ hình tham số, chuyển động biểu thị tập tham số chuyển động Như vậy, toán ước lượng chuyển động trở thành tốn ước lượng tham số chuyển động Với mơ hình tham số, ràng buộc để làm theo quy tắc toán ước lượng chuyển động giả định sai đưa vào mơ hình chuyển động cách đầy đủ Trong mơ hình phi tham số, ràng buộc rõ ràng (ví dụ: tính trơn tru trường chuyển động) đưa vào để làm theo quy tắc toán giả định sai ước lượng chuyển động Vùng hỗ trợ Vùng hỗ trợ tập điểm mà mơ hình chuyển động áp dụng Vùng hỗ trợ lớn khung nhỏ điểm, có kích thước cố định thay đổi có hình dạng cân đối hình dạng tùy ý 2.2.2 Các phương pháp ước lượng chuyển động Mục giới thiệu số phương pháp ước lượng chuyển động thường sử dụng, đưa nhận xét ưu điểm nhược điểm phương pháp, bao gồm: - Các phương pháp vi phân: Dựa vào mối quan hệ biến đổi không gian thời gian cường độ Các phương pháp chấp nhận số giả thiết hạn chế véctơ chuyển động x phải nhỏ, trái lại nghiệm tốn xác nhạy cảm nhiễu - Các phương pháp hồi quy điểm: Dựa vào tối thiểu theo gradient lặp lặp lại lỗi dự đoán Ước lượng phụ thuộc nhiều vào gradient không gian Các phương pháp phải chọn cỡ bước điều khiển phù hợp để dung hoà tốc độ hội tụ độ xác ước lượng Có thể dễ hội tụ đến điểm tối ưu cục bề mặt lỗi Vùng có cường độ thay đổi, gián đoạn trường chuyển động dịch chuyển lớn xử lý hiệu - Các phương pháp miền tần số: Dựa thuộc tính khai triển Fourier, dịch chuyển tịnh tiến miền không gian tương ứng với dịch pha tuyến tính miền tần số Phương pháp tương quan pha có số tính chất đặc biệt: Độ phức tạp tính tốn nhỏ, đặc biệt sử dụng FFT; không nhạy cảm với thay đổi độ sáng - Các phương pháp phối hợp khối: Dựa vào việc chia khung ảnh thành khối ước lượng chuyển động cho khối Tuỳ vào việc lựa chọn hàm phối hợp (như NCCF, SSD, SAD) mà có hiệu khác So sánh chất lượng dự đốn thì: SSD > SAD > NCCF So sánh độ phức tạp tính tốn SAD có độ phức tạp tính tốn thấp khơng địi hỏi có phép nhân - Các phương pháp lặp truyền thống: Đều thuộc họ thuật toán độ dốc, dựa tốn tử gradient cịn hạn chế tốc độ hội tụ chậm, độ bám thay đổi hình ảnh khơng cao; độ ổn định khơng cao cần có giá trị tham chiếu để so sánh CHƯƠNG ƯỚC LƯỢNG CHUYỂN ĐỘNG BẰNG CÁC GIẢI PHÁP MỚI 3.1 Giới thiệu Trong chương 3, luận án đề xuất giải pháp ước lượng phân thành hai loại là: - Ước lượng chuyển động ảnh thuật toán Kalman: Mục tiêu đạt sử dụng ưu thuật tốn Kalman lặp có độ bám chuyển động tốt so với phương pháp gradient đồng thời phát huy ưu thuật toán Bayes xét đặc điểm tự nhiên dãy ảnh - Ước lượng chuyển động ảnh thuật toán mù: Mục tiêu đạt giải tốn khơng cần thơng tin huấn luyện thuật tốn đòi hỏi phương pháp gradient nhằm nâng cao độ sử dụng băng tần truyền dẫn mở rộng cho trường hợp nhiễu loạn 3.2 Ước lượng chuyển động Kalman 3.2.1 Đặt toán Giả thiết: z biểu diễn khung dãy ảnh thời điểm t Trường chuyển động x1 biểu thị độ lệch z1 z2 cho pixel thời điểm t1, t2 tương ứng Trường phân vùng z bao gồm số nhãn pixel, nhãn biểu thị mục tiêu chuyển động: xn = n (n = 1, 2, , N ) cho vị trí pixel lưới Λ; N tổng số mục tiêu chuyển động Mục tiêu toán ước lượng chuyển động x với giá trị z cho Trong nghiên cứu này, luận án giả thiết: a) Tập giá trị đo z1 , z2 , , zk ký hiệu véctơ z giá trị biết trước b) Mối quan hệ vật lý trạng thái tự nhiên ước lượng giá trị đo biểu thị quan hệ: z = g ( x, v ) (3.1) Thực tế mối quan hệ z độ dịch chuyển x tuyến tính: 12 tốn Kalman vừa giảm độ phức tạp tính tốn, vừa tăng tốc độ tính tốn độ bám quĩ đạo chuyển động ảnh theo ưu điểm thuật toán Kalman 3.3 Ước lượng chuyển động tối ưu ảnh video 3.3.1 Đặt toán Trong mục 3.2, từ ước lượng chuyển động ảnh Bayes, luận án đưa giải pháp dùng thuật toán lặp Kalman để ước lượng chuyển động ảnh video nhằm hạn chế nhược điểm phương pháp Bayes giữ chất nội dung chuyển động ảnh Từ xuất toán tìm ước lượng tốt chuyển động xˆ k thời điểm tk Ở luận án sử dụng thuật toán Kalman để ước lượng chuyển động tối ưu dãy ảnh cho sai số trung bình bình phương ước lượng chuyển động dãy ảnh bé 3.3.2 Ước lượng chuyển động tối ưu ảnh video Luận án ứng dụng thuật toán nêu mục 3.2 vào trường hợp chuyển động ảnh đặc trưng phương trình sai phân tuyến tính đồng nhất: x k = Φ k , k −1x k −1 (3.32) Khi có ước lượng xˆ k −1 thời điểm tk −1 , dự đoán ước lượng chuyển động ảnh thời điểm tk xˆ ′k = Φ k , k −1xˆ k −1 Giá trị đo z k thời điểm tk sử dụng để cải tiến ước lượng Trên sở xˆ ′k giá trị đo z k : z k = H k xk + v k (3.33) Khi E[ v k ] = giá trị đo trung bình thời điểm tk H k xˆ ′k Sai số ước lượng phản ảnh sai số theo giá trị đo kỳ vọng ek = z k − H k Φ k ,k −1xˆ k −1 Ước lượng hàm tuyến tính giá trị đo Ở ta phải xác định ma trận chưa biết K k cho ước lượng xˆ k cho bởi: xˆ k = Φ k ,k −1xˆ k −1 + K k [z k − H k Φ k ,k −1xˆ k −1 ] (3.34) Bài toán đặt phải xác định ma trận K k cho: 13 E[(xˆ k − x k )T (xˆ k − x k )] (3.35) bé giá trị xˆ k gọi tốt theo nghĩa sai số trung bình bình phương bé Ma trận K k gọi ma trận trọng số ma trận độ lợi Với số giả thiết, sử dụng phép biến đổi tốn học ta có: (3.37) Pk′ ≜ Φ k ,k −1Pk −1ΦTk , k −1 T T −1 ′ ′ (3.42) K k = Pk H k [H k Pk H k + R k ] Pk = Pk′ − K k H k Pk′ (3.43) Các phương trình (3.34), (3.37), (3.42) (3.43) giá trị ước lượng chuyển động ảnh tối ưu theo giải pháp lọc Kalman Nhận xét: Với việc sử dụng lọc Kalman để ước lượng chuyển động ảnh, đưa việc giải tốn xác suất theo luật Bayes khó khăn việc giải phương pháp lặp Ở nghiệm để đảm bảo sai số trung bình bình phương bé Đồng thời luận án việc chọn độ lợi K k tối ưu thuật toán Kalman để ước lượng chuyển động ảnh nhằm đảm bảo nghiệm tốt 3.4 Ước lượng chuyển động ảnh phương pháp mù 3.4.1 Đặt toán Tuy phương pháp Kalman đem lại hiệu tốt ước lượng chuyển động ảnh độ bám tốt có điều kiện ràng buộc mà nội thân thuật tốn Kalman địi hỏi hàm mật độ xác suất h, v, d Gauss Trong thực tế, điều kiện ràng buộc chặt Ngoài ra, biết thuật tốn mù có số đặc điểm: - Khi kênh có can nhiễu đủ mạnh tham số kênh biến đổi nhanh, lúc dùng dãy đào tạo từ bên phát truyền đến bên thu bị sai lệch làm cho trình đào tạo khơng cịn xác hiệu - Nếu phải dùng thuật tốn có đào tạo chiếm dụng phần kênh truyền dẫn, làm giảm hiệu suất sử dụng kênh 14 - Trong hệ thống đa truy nhập, di động, trình đào tạo cần đồng cần gửi tập đào tạo theo thời điểm kết nối phải cài đặt lại đồng Đây điều khó thực Để khắc phục hạn chế khơng cần mẫu đào tạo tính tốn thuật tốn, luận án đưa giải pháp mù 3.4.2 Ước lượng chuyển động ảnh phương pháp mù 1- Ước lượng chuyển động ảnh thuật toán kỳ vọng hợp lý max.max Trong toán ước lượng chuyển động trước điều kiện ràng buộc ma trận H H (x * ) > Đây điều kiện ràng buộc chặt mà hệ thống thực Trong thực tế, với tốn ước lượng, viết hệ thống phương trình tuyến tính dạng tổng quát sau: Hx + v = z hoaëc Hx = z − v (3.44) m×n m H=[hij]∈IR mơ hình ma trận, z∈IR véctơ đo chuyển động ảnh, v∈IRm véctơ sai số đo, x∈IRn véctơ chuyển động ảnh cần ước lượng Ở mục này, lựa chọn nghiên cứu sinh tìm véctơ x cho tối thiểu hàm mục tiêu: J p (x) = z - Hx p = v( x) p , p ≥1 (3.45) véctơ sai số đo v có dạng: T v (x) = [ v1 (x), v2 (x), , vm (x)] (3.46) với thành phần v biểu thị: n vi (x) = zi − hTi x = zi − ∑ hij x j , (i = 1,2, , m) (3.47) j =1 Với vài giả thiết, sử dụng phép biến đổi toán học, thuật toán kỳ vọng hợp lý max.max có dạng: x j (k ) m z x j (k + 1) = m ∑ hij T i , ( j = 1, 2, , n) (3.57) i = h h x ∑ i ij i (k ) Nhận xét: Với toán ước lượng chuyển động ảnh thuật toán kỳ vọng hợp lý max.max giúp vượt qua 15 khó khăn phần tử ma trận H không thiết phải dương khơng cần tính giá trị đào tạo thuật toán lặp 2- Ước lượng chuyển động ảnh thuật toán kỳ dị Tikhonov Đặt tốn phải ước lượng chuyển động x có nhiễu tác động vào véctơ kết đo chuyển động z thành phần ma trận H Trong hồn cảnh này, nghiệm tốn giải phần mục 3.4.2 bị sai lệch nhiều thường khơng có giá trị Để làm giảm bớt ảnh hưởng đó, phần luận án sử dụng giải pháp ước lượng mù Tikhonov Theo lý thuyết kỳ dị hàm lượng kỳ dị (hàm cực tiểu) tổng trọng số hai thành phần: J ( x, α ) = J d ( x ) + α J x ( x ) (3.58) Jd lượng số liệu Jx ràng buộc làm trơn (còn gọi lượng ổn định) Khi (3.58) có dạng biểu diễn thống kê Bayes ω (x) = exp {−α J x (x)} phân bố có điều kiện x z viết dạng: p(z , x) = c exp {− J d (x) − α J x (x)} (3.60) Do đó, tiêu chí cực đại phân bố tiên nghiệm p(x z ) x tương đương với cực tiểu hàm mục tiêu J(x,α) Từ hàm mục tiêu trên, để giải toán suy biến, chọn p = (3.45), ta có: 1 T J (x) = z − Hx = ( z − Hx ) ( z − Hx ) 2 (3.61) T 1m = v v = ∑ vi 2 i =1 n vi (x) = zi − hTi x = zi − ∑ hij x j j =1 (3.62) Hàm mục tiêu đạt cực tiểu tồn gradient 0: ∇J ( x) = H T ( z − Hx ) = (3.63) T −1 T Do x* = (H H) H z Từ (3.61), nghiệm kỳ dị xác định đơn giản nghiệm toán sau: 16 x(α ) = arg minn J (x,α ) ( x∈IR (3.64) ) 2 z − Hx + α x , α > (3.65) Ở tham số suy biến α điều khiển làm trơn nghiệm kỳ dị Sử dụng phương pháp gradient dốc ta thu hệ thống phương trình vi phân: dx = µ HT ( z − Hx ) − α x (3.66) dt Chú ý việc cực tiểu hàm lượng J(x,α) (3.65) theo x tương đương với việc giải phương trình: ( HT H + α I ) x = HT z (3.67) Có thể sử dụng lý thuyết khai triển kỳ dị (SVD) để giải phương trình (3.67) Giả thiết ma trận H , cấp m × n có hạng n (m ≥ n) , có khai triển kỳ dị sau: n H = U ∑ VT = ∑ σ i u i vTi (3.69) i =1 U = [u1 , u , , u m ] ∈ IR m×m V = [ v1 , v , , v n ] ∈ IR n×n ma trận trực giao Σ ma trận giả đường chéo m × n với n hàng chứa đường chéo diag{σ ,σ , , σ n } với σ ≥ σ ≥ ≥ σ n (m − n) hàng phía Có thể {ui } {v i } tương ứng cột U V, nghiệm suy biến Tikhonov cực tiểu tiêu chuẩn bình phương bé phương trình (3.67) xấp xỉ bằng: n n σ uT z βi x* (α ) = ∑ i ⋅ i ⋅ v i = ∑ ⋅ vi (3.70) i =1 σ + α i =1 σ + α σ σ i i i i J ( x, α ) = β i = uTi z α > tham số kỳ dị Một phương pháp khác để giải toán kỳ dị (3.61) gọi phương pháp khai triển kỳ dị cắt cụt, người ta bỏ qua giá trị suy biến nhỏ cách cắt bỏ thành phần tổng (3.70) ứng với r < n Nhận xét: Phương pháp kỳ dị Tikhonov liên quan chặt chẽ với ước lượng Bayes Trong phương pháp này, thống kê bậc hai tập 17 quan sát sử dụng để tạo nên mơ hình thơng tin tiên nghiệm cho giải pháp kỳ dị Phương pháp giải khó khăn nói ước lượng Bayes 3- Ước lượng chuyển động ảnh thuật toán Kaczmarz thuật toán Kaczmarz mở rộng Bài toán đặt véctơ kết đo chuyển động z thành phần ma trận H bị ảnh hưởng nhiễu giải Phần luận án trả lời câu hỏi Giả thiết q trình ước lượng chuyển động ảnh, nhiễu N tác động vào thành phần ma trận số liệu đặc trưng ma trận H véctơ kết đo chuyển động z có sai số n Khi đó, phương trình hệ thống có dạng: (3.82) ( H ®óng + N ) x ≈ z ®óng + n = z Hđúng ma trận số liệu khơng có nhiễu zđúng véctơ kết đo chuyển động ảnh khơng có sai số Hãy xác định nghiệm x mơ hình (3.82) trường hợp: - Nhiễu Gauss có trung bình - Nhiễu Để giải toán này, luận án chọn giải pháp tìm x cho cực tiểu đại lượng: γ ∆H 1− γ γ =β = F + (1 − γ ) ∆z F (3.83) σ , ∆H ∆z tương ứng nhiễu loạn ma σ n N trận H véctơ z Khảo sát hàm mục tiêu sai số trung bình bình phương chuẩn: Jɶ (x) = E{eT (k )e(k )} (3.84) véctơ sai số e xác định theo công thức sau: e(k ) = z − Hx(k ) = (z ®óng + n) − (H ®óng + N)x( k ) (3.85) với Hđúng zđúng tham số chưa biết Việc cực tiểu hàm mục tiêu Jɶ (x) theo x cho ta nghiệm chệch thành phần 18 nhiễu hàm x Để tránh vấn đề này, luận án sử dụng hàm mục tiêu sai số trung bình bình phương cải tiến để tạo nên ước lượng không chệch sở tốn tổng bình phương bé (TLS) Để đưa thuật tốn thích nghi lặp, luận án biểu diễn hàm mục tiêu sau: m J ( x) = ∑ J i ( x) i =1 J i (x) = E{ε (k )} = (3.88) E{ei2 (k )} ei = zi − hTi x ( hTi hàng β + xT x thứ i H) Do đó, thuật tốn lặp thời gian rời rạc lợi dụng phương pháp gradient dốc viết dạng: x(k + 1) = x(k ) + η (k )eɶi (k )[h i +eɶi (k ) x(k )] i = k modulo (m + 1) eɶi (k ) = zi − hTi x ( k ) ei (k ) = β + xT ( k ) x ( k ) β + xT ( k ) x ( k ) (3.90) (3.91) Vì thành phần ( β + xT (k )x(k )) −1 ln dương, đưa (3.90) dạng đơn giản hơn: x(k + 1) = x(k ) + η (k )ei (k )[h i +eɶi (k ) x(k )] (3.92) i = k modulo (m + 1) Kaczmarz sử dụng khái niệm trung bình khối tất số i chu trình lặp để đưa thuật toán lặp luận án sử dụng để ước lượng chuyển động ảnh: zi − hTi x(k ) zi − hTi x(k ) h + x(k ) (3.93) i T n i =1 ∑ j =1 r h β + x ( k ) x( k ) j ij m x(k + 1) = x(k ) + η (k ) ∑ < η (k ) < tốc độ học chuẩn hóa rj số phần tử hij khác không cột j Nhận xét: Trong trường hợp có nhiễu tác động vào thành phần ma trận H véctơ kết đo chuyển động z có sai số, cách sử dụng hàm mục tiêu (3.88) luận án sử dụng thuật toán 19 lặp mù đơn giản để ước lượng chuyển động ảnh mà phương pháp Bayes phương pháp lặp trước chưa tính đến 4- Ước lượng chuyển động ảnh thuật tốn tổng bình phương thích nghi mở rộng Bài toán đặt thành phần nhiễu có tương quan tương hỗ giải Để giải tốn đó, nghiên cứu sinh sử dụng thuật tốn bình phương thích nghi mở rộng với giả thiết: - Các thành phần nhiễu có tương quan tương hỗ - Ma trận phương sai nhiễu biết trước ước lượng - Nhiễu véctơ x(k) độc lập thống kê Trong hoàn cảnh tổng quát này, sử dụng hàm mục tiêu có dạng sau: −1 T −1 x H H x J ( x) = T −1 −1 x R NN x T (3.94) Tiếp cực tiểu hàm mục tiêu (3.94) Để đơn giản tăng tốc độ tính tốn, việc chọn hệ số phụ thuộc vào bước lặp cho làm giảm hàm mục tiêu tức thời: T −1 zi T −1 x(k ) h zi h i x(k ) i J (x(k )) = (3.95) T −1 −1 x(k ) R NN (k ) x(k ) theo bước lặp cách dịch hệ số dọc theo hướng ngược với hướng gradient J(x(k)) giá trị hệ số Chúng ta sử dụng số thời gian rời rạc k cho ma trận tương quan nhiễu để thống kê nhiễu thay đổi theo 20 thời gian Chúng ta giả thiết khai triển ma trận tương quan nhiễu R NN (k ) sau: r (k ) (rnN (k ))T R NN (k ) = nn (3.96) rnN (k ) R NN (k ) rnn(k) đại lượng tương ứng với tự tương quan nhiễu z, rnN(k) véctơ chứa thành phần tương quan chéo thành phần nhiễu zi hi, RNN(k) ma trận tự tương quan thành phần nhiễu véctơ hồi quy hi Việc tính toán gradient J(x(k)) theo véctơ hệ số cho bởi: ∂J (x(k )) = −2(ei (k )hi + ei (k )(−rnN ( k ) + R NN (k )x( k ))) (3.97) ∂ (x( k )) ei (k ) chuẩn hóa lỗi ước lượng xác định sau: ei (k ) ei (k ) = (3.98) T −1 −1 x( k ) R NN (k ) x(k ) Luận án sử dụng thuật tốn tổng bình phương mở rộng: x(k + 1) = x(k ) + η ei (k )(h i +ei (k )(−rnN (k ) + R NN (k )x(k ))) (3.99) Nhận xét: Những cơng trình ước lượng chuyển động ảnh trước người ta dừng lại giả thiết nhiễu sai số đo chuyển động ảnh có phân bố Gauss, trung bình Ở mục luận án mở rộng: - Không có nhiễu tác động vào giá trị đo chuyển động ảnh mà cịn có nhiễu tác động vào phần tử ma trận H - Không dừng lại giả thiết nhiễu Gauss mà nhiễu 21 CHƯƠNG MỘT SỐ KẾT QUẢ TÍNH TỐN SỐ Để đánh giá kiểm chứng phương pháp ước lượng chuyển động đề xuất chương 3, luận án thực mô thuật toán ước lượng chuyển động ảnh video phương pháp Bayes phương pháp Kalman Trên sở kết mô phỏng, luận án đưa nhận xét, so sánh hiệu giải pháp ước lượng chuyển động ảnh theo tiêu chí về: tốc độ tính tốn, độ bám chuyển động ảnh, độ xác ước lượng chuyển động ảnh a b Hình 4.1 a) Khung 1512 b) Khung 1513 videoclip-1 a b Hình 4.2 a) Khung 434 b) Khung 435 videoclip-2 22 Hình 4.3 Trường chuyển động videoclip-1, phương pháp Bayes (λ=100) Hình 4.5 Trường chuyển động videoclip-1, phương pháp Kalman (L=10) Hình 4.7 Trường chuyển động videoclip-2, phương pháp Bayes (λ=100) Hình 4.8 Trường chuyển động videoclip-2, phương pháp Kalman (L=100) Hình 4.9 Đồ thị biểu diễn thời gian tính tốn theo phương pháp Bayes Hình 4.10 Đồ thị biểu diễn thời gian tính tốn theo phương pháp Kalman 23 Kết mô minh chứng phương pháp lặp Kalman có ưu điểm hẳn so với phương pháp Bayes, là: - Về tốc độ tính tốn: Phương pháp Kalman có độ phức tạp thấp phương pháp Bayes thời gian tính tốn thực tế phương pháp Kalman nhỏ nhiều so với phương pháp Bayes - Về độ bám chuyển động ảnh: Thực nghiệm minh chứng phương pháp Kalman có độ bám chuyển động ảnh tốt phương pháp Bayes Trong phương pháp Kalman, kết mô hình 4.5 hình 4.8 cho thấy véctơ dịch chuyển tập trung chi tiết chuyển động đối tượng chuyển động Trong đó, với phương pháp Bayes, kết mơ hình 4.3 hình 4.7 cho thấy số lượng véctơ nhiều trải rộng toàn ảnh - Về độ xác ước lượng chuyển động ảnh: Do mức độ dịch chuyển tính tốn theo phương pháp Kalman đạt đến phần thập phân điểm ảnh nên kết thực nghiệm minh chứng trường chuyển động thu từ phương pháp Kalman mịn so với phương pháp Bayes số lượng véctơ trường chuyển động phương pháp Kalman so với phương pháp Bayes KẾT LUẬN Trong khuôn khổ luận án, nghiên cứu sinh nghiên cứu phương pháp ước lượng chuyển động ảnh video, kế thừa lý luận bản, điểm mạnh đồng nghiệp trước bổ sung làm phong phú thêm lý luận ước lượng chuyển động ảnh Đó là: 1- Ước lượng chuyển động ảnh phương pháp Kalman: Chuyển ước lượng chuyển động ảnh từ phương pháp Bayes sang ước lượng chuyển động ảnh phương pháp Kalman Thực chất kế thừa điểm mạnh ước lượng chuyển động phương pháp Bayes, chuyển sang phương pháp ước lượng chuyển 24 động Kalman để sử dụng phương pháp lặp tính tốn - có tốc độ tính tốn nhanh hơn, độ bám chuyển động tốt hơn, ước lượng chuyển động ảnh xác 2- Ước lượng chuyển động tối ưu ảnh video: Bản chất ước lượng chuyển động ảnh thuật toán Kalman giá trị ma trận độ lợi Kk để nghiệm ước lượng chuyển động đạt tối ưu, đảm bảo điều kiện sai số trung bình bình phương bé 3- Ước lượng chuyển động ảnh thuật toán mù: Kết hợp tư tưởng ước lượng phương pháp lặp ước lượng mối tương quan chuyển động phối hợp khối Từ làm đơn giản tính tốn cơng cụ máy tính phương pháp lặp, khơng cần sử dụng dãy đào tạo làm tăng độ xác ước lượng kênh có nhiễu lớn fading; đồng thời sử dụng hợp lý cho hệ thống đa truy nhập di động 4- Ước lượng chuyển động thuật toán kỳ dị Tikhonov: Với chất phương pháp mù mở rộng cho trường hợp có nhiễu tác động vào kết đo z thành phần ma trận H Điều làm cho toán trở nên tổng quát hợp lý với điều kiện thực tế hệ thống động ln có nhiễu tác động Với kết này, luận án góp phần làm phong phú thêm lý luận ước lượng chuyển động ảnh Thuật toán ước lượng đơn giản, hợp lý sử dụng chương trình tính tốn máy tính KIẾN NGHỊ VỀ NHỮNG NGHIÊN CỨU TIẾP THEO Từ kết nghiên cứu mà luận án đạt được, đề xuất hướng nghiên cứu triển khai tiếp theo: - Tiếp tục nghiên cứu ước lượng chuyển động mà thích nghi với thuật tốn có độ phức tạp thấp - Nghiên cứu đánh giá hiệu ước lượng chuyển động mà thích nghi với phương pháp khác DANH MỤC CƠNG TRÌNH CƠNG BỐ CỦA TÁC GIẢ Trần Mạnh Tuấn, Dư Đình Viên (8/2009), “Phân tích chuyển động ảnh thuật tốn Kalman”, Tạp chí nghiên cứu khoa học công nghệ quân sự, tr 40-45 Trần Mạnh Tuấn (02/2010), “Xác định độ lợi thuật toán ước lượng chuyển động ảnh video”, Tạp chí nghiên cứu khoa học công nghệ quân sự, tr 50-53 Trần Mạnh Tuấn, Phùng Kim Anh (04/2010), “Ước lượng chuyển động ảnh lọc Kalman mở rộng”, Tạp chí nghiên cứu khoa học công nghệ quân sự, tr 39-41 ... QUAN VỀ NÉN VIDEO 1.1 Giới thiệu Để truyền chương trình video hệ thống thơng tin di động, tốn đặt phải nén hình ảnh để tiết kiệm băng tần truyền dẫn mà đảm bảo chất lượng hình ảnh Trong hồn cảnh... ứng dụng nén video, số kỹ thuật nén video 1.4.1 Yêu cầu ứng dụng nén video Mục trình bày số yêu cầu ứng dụng nén video, gồm: Các đặc tính video, yêu cầu truyền dẫn, đặc tính hiệu hệ thống nén, yêu... triển khai mạng thông tin hệ sau, nhiều ứng dụng đời truyền tín hiệu video phương tiện thông tin di động, đa môi trường Nâng cao hiệu sử dụng tài nguyên băng tần phương tiện tốn phải nén tín hiệu