PHƯƠNG PHÁP XÁC ĐỊNH CHUYỂN ĐỘNG DỰA TRÊN ĐẶC TÍNH CỦA MẮT NGƯỜI ĐỐI VỚI THÀNH PHẦN XÁM TRONG VIỆC LOẠI BỎ DƯ THỪA VỀ MẶT THỜI GIAN CỦA MÃ HÓA VIDEO MJPEG
Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 51 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
51
Dung lượng
1,79 MB
Nội dung
Header Page of 113 ĐẠI HỌC QUỐC GIA HÀ NỘI ĐẠI HỌC CÔNG NGHỆ NGUYỄN NGỌC SINH PHƯƠNG PHÁP XÁC ĐỊNH CHUYỂN ĐỘNG DỰA TRÊN ĐẶC TÍNH CỦA MẮT NGƯỜI ĐỐI VỚI THÀNH PHẦN XÁM TRONG VIỆC LOẠI BỎ DƯ THỪA VỀ MẶT THỜI GIAN CỦA MÃ HÓA VIDEO MJPEG LUẬN VĂN THẠC SỸ Công nghệ Kỹ thuật Điện tử Truyền thông Hà Nội - 2016 Footer Page of 113 Header Page of 113 ĐẠI HỌC QUỐC GIA HÀ NỘI ĐẠI HỌC CÔNG NGHỆ NGUYỄN NGỌC SINH PHƯƠNG PHÁP XÁC ĐỊNH CHUYỂN ĐỘNG DỰA TRÊN ĐẶC TÍNH CỦA MẮT NGƯỜI ĐỐI VỚI THÀNH PHẦN XÁM TRONG VIỆC LOẠI BỎ DƯ THỪA VỀ MẶT THỜI GIAN CỦA MÃ HÓA VIDEO MJPEG Ngành: Công nghệ Kỹ thuật Điện tử Truyền thông Chuyên ngành: Kỹ thuật Điện tử Mã số: 60520203 LUẬN VĂN THẠC SỸ Công nghệ Kỹ thuật Điện tử Truyền thông NGƯỜI HƯỚNG DẪN KHOA HỌC : PGS.TS Trần Xuân Tú Hà Nội - 2016 Footer Page of 113 Header Page of 113 i LỜI CAM ĐOAN Tôi xin cam đoan luận văn tốt nghiệp: “Phương pháp xác định chuyển động dựa đặc tính mắt người thành phần xám việc loại bỏ dư thừa mặt thời gian mã hóa video MJPEG ” công trình nghiên cứu riêng tác giả Các số liệu, kết trình bày luận văn hoàn toàn trung thực, chưa công bố công trình khác Trong luận văn có dùng số tài liệu tham khảo nêu phần tài liệu tham khảo Tác giả luận văn Nguyễn Ngọc Sinh Footer Page of 113 Header Page of 113 ii LỜI CẢM ƠN Để hoàn thành luận văn tốt nghiệp này, trước tiên, xin gửi lời cảm ơn chân thành sâu sắc tới người Thầy PGS.TS Trần Xuân Tú Thầy người theo sát tôi, tận tình bảo, góp ý hướng dẫn, định hướng cho suốt trình làm luận văn PTN Trọng điểm Hệ thống Tích hợp Thông minh, Đại học Công nghệ Tôi không học Thầy phương pháp luận nghiên cứu khoa học, tích lũy nhiều học quý báu cách làm việc chuyên nghiệp, lối tư đánh giá việc, kinh nghiệm làm việc quan trọng cho công việc sau Em cảm ơn Thầy nhiều! Tiếp theo, xin gửi lời cảm ơn sâu sắc tới Thầy, Cô anh chị em khoa Điện tử - Viễn thông PTN Trọng điểm Hệ thống Tích hợp Thông minh sẵn sàng giúp đỡ tạo điều kiện tốt cho trình làm luận văn Cuối cùng, xin gửi lời cảm ơn chân thành tới gia đình tôi, người luôn ủng hộ, động viên vật chất lẫn tinh thần để hoàn thành luận văn tốt Mặc dù có nhiều cố gắng, song luận văn hạn chế định Tôi mong nhận góp ý, bảo thầy, cô để hoàn thiện luận văn Tôi xin chân thành cảm ơn Hà Nội, Ngày 28 tháng 12 năm 2016 Học viên Nguyễn Ngọc Sinh Footer Page of 113 Header Page of 113 MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN II MỤC LỤC DANH MỤC VIẾT TẮT DANH SÁCH HÌNH VẼ DANH SÁCH BẢNG MỞ ĐẦU TÓM TẮT 8 CHƯƠNG MÃ HÓA VIDEO TRONG XU THẾ IOT VÀ CƠ HỘI CHO MÃ HÓA MJPEG 1.1 Tổng quan mã hóa video 1.2 Mã hóa video xu IoT 1.3 Mã hóa video MJPEG 1.3.1 Mã hóa ảnh JPEG 1.3.2 MJPEG mạng cảm biến không dây 1.4 Kết luận chương 10 10 13 14 14 17 18 CHƯƠNG PHƯƠNG I PHÁP XÁC ĐỊNH CHUYỂN ĐỘNG DỰA TRÊN ĐẶC TÍNH CỦA MẮT NGƯỜI ĐỐI VỚI THÀNH PHẦN XÁM TRONG VIỆC LOẠI BỎ 2.1 Dư thừa mặt thời gian 2.2 Các kỹ thuật loại bỏ dư thừa mặt thời gian 2.2.1 Dự đoán khung hình liền kề trước 2.2.2 Dự đoán mô hình ước lượng chuyển động khối 2.2.3 Đồng khung tham chiếu mã hóa giải mã 2.3 Kỹ thuật loại bỏ dư thừa thời gian đề xuất dựa phân tách chuyển động 2.3.1 Thuật toán xác định chuyển động 2.3.2 Đặc tính mắt người thành phần xám khả áp dụng cho phân tách chuyển động 2.4 Phương pháp xác định chuyển động dựa đặc tính mắt người thành phần xám việc loại bỏ dư thưa mặt thời gian mã hóa MJPEG 2.4.1 Nguyên lý hoạt động 2.4.2 Sơ đồ mã hóa chi tiết 2.5 Kết luận chương DƯ THƯA VỀ MẶT THỜI GIAN CỦA MÃ HÓA MJPEG Footer Page of 113 19 19 19 20 21 21 23 24 24 27 28 29 32 Header Page of 113 CHƯƠNG MÔ PHỎNG VÀ ĐÁNH GIÁ PHƯƠNG ÁN ĐỀ XUẤT 3.1 Thông số đánh giá 3.1.1 Tỷ lệ nén 3.1.2 Chất lượng hình ảnh giải mã PSNR 3.1.3 Độ phức tạp 3.2 Mô đánh giá kết 3.2.1 Kịch mô 3.2.2 Kết mô KẾT LUẬN 33 33 33 33 34 34 35 36 44 DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN VĂN TÀI LIỆU THAM KHẢO Footer Page of 113 45 46 Header Page of 113 DANH MỤC VIẾT TẮT 4:2:0 4:2:2 4:4:4 Phương pháp lấy mẫu theo tỷ lệ 4:2:0; thành phần màu chiều ngang chiều dọc lấy mẫu 1/2 thành phần xám Phương pháp lấy mẫu mà thành phần màu chiều dọc lấy mẫu 1/2 thành phần xám Phương pháp lấy mẫu mà thành phần màu lấy mẫu với số mẫu thành phần xám DCT Discrete Cosine Transform GOP Group of Picture, nhóm khung hình mã hóa H.261 Chuẩn mã hóa video H.261 H.264/AVC H.264 Advance Video Codec HEVC High Efficient Video Codec IOT ISO ITU Internet of Thing International Standards Organization Một liên đoàn toàn giới quan tiêu chuẩn từ khoảng 140 quốc gia Homepage at: http://www.iso.ch International Telecommunications Union Tổ chức quốc tế thuộc hệ thống Liên Hợp Quốc, nơi phủ khu vực tư nhân phối hợp mạng dịch vụ viễn thông toàn cầu Homepage at: http://www.itu.int JPEG Joint Photographic Experts Group Cộng đồng phát triển chuẩn nén ảnh JPEG JPEG2000 Homepage at: http://www.jpeg.org MJPEG Motion Joint Photographic Experts Group Footer Page of 113 Header Page of 113 MPEG Motion Picture Experts Group Cộng đồng phát triển MPEG Homepage at: http://www.chiariglione.org/mpeg PNG PSNR Portable Network Graphics Peak Signal to Noise Ratio UBICOMP Ubiquitous computing Footer Page of 113 Header Page of 113 DANH SÁCH HÌNH VẼ Hình 1.1 Hình 1.2 Hình 1.3 Hình 1.4 Hình 1.5 Tỷ lệ nén số chuẩn mã hóa video thông dụng Sơ đồ lịch sử phát triển nén video từ 1990 [1] Giải pháp tiền xử lý cho camera mạng cảm biến không dây Mã hóa JPEG Phân bố lượng ma trận 8x8 sau DCT [2] 11 12 13 14 16 Hình 2.1 Hình 2.2 Hình 2.3 Hình 2.4 Hình 2.5 Hình 2.6 Hình 2.7 Hình 2.8 Hình 2.9 Hình 2.10 Hình 2.11 Ba khung hình liên tiếp video Khung hình 1(trái), 2(phải) Khung hình sai khác Sơ đồ đồng khung tham chiếu mã hóa giải mã Nguyên lý đề xuất Cấu trúc mắt người (Encyclopedia Britannica, 1994) Toàn sắc thái xám ảnh bit bit Kết sử dụng đặc tính mắt người Nguyên lý mã hóa Nguyên lý giải mã Sơ đồ mã hoá chi tiết 19 20 20 22 24 25 26 27 28 28 29 Hình 3.1 Hình 3.2 Hình 3.3 Hình 3.4 Hình 3.5 Hình 3.6 Hình 3.7 Hình 3.8 Hình 3.9 Hình 3.10 Sơ đồ cho kịch đánh giá Khung hình mã hóa - giải mã video akiyo Khung hình mã hóa - giải mã video container Khung hình mã hóa - giải mã video foreman Khung hình mã hóa -giải mã video hall Khung hình mã hóa -giải mã video news Khung hình mã hóa -giải mã video soccer Kết nén video mẫu QP[5-95] Tỷ lệ nén inter-intra video mẫu Kết PSNR tỷ lệ nén video mẫu 35 36 37 37 38 38 39 40 41 42 Footer Page of 113 Header Page 10 of 113 DANH SÁCH BẢNG Bảng 3.1 Môi trường mô Bảng 3.2 Video tham gia mô Bảng 3.3 Các ký hiệu sử dụng chung phần mô Bảng 3.4 Số phép tính thuật toán Zipfian, biến đổi DCT thuận, Lượng tử phương pháp đề xuất khối 8x8 [3] Footer Page 10 of 113 34 34 36 43 33 Header Page 37 of 113 Chương MÔ PHỎNG VÀ ĐÁNH GIÁ PHƯƠNG ÁN ĐỀ XUẤT 3.1 Thông số đánh giá 3.1.1 Tỷ lệ nén Khả nén liệu thông số quan trọng việc đánh giá hiệu thuật toán/ phương pháp mã hóa video Phương pháp mã hóa video hiệu cho tỷ lệ nén cao Đối với số chuẩn mã hóa tiên tiến tỷ lệ nén so với file video gốc lên đến 100 H.264/AVC hay 200 HEVC Công thức tính tỷ lệ nén thuật toán trình bày sau: Tỷ lệ nén = 3.1.2 Kích thước file gốc Kích thước file sau mã hóa (3.1) Chất lượng hình ảnh giải mã PSNR Để so sánh hiệu phương pháp mã hóa video phải đánh giá tỷ lệ nén phương pháp chất lượng ảnh/video sau giải mã Đánh giá chất lượng hình ảnh thông số thông dụng PSNR (Peak Signal to Noise Ratio - Tỷ số tín hiệu cực đại nhiễu) PSNR [15] hay gọi tỷ số tín hiệu cực đại nhiễu Thông số đại diện cho tỷ lệ giá trị lượng tối đa tín hiệu lượng nhiễu ảnh hưởng đến độ xác thông tin Do đó, PSNR dùng để đo chất lượng tín hiệu khôi phục sau trình nén có mát Tỷ số PSNR cao tương ứng với sai khác ảnh gốc ảnh khôi phục nhỏ Công thức 3.2 trình bày cách tính thông số PSNR m−1 n−1 MSE = ∑ ∑ I(i, j) − D(i, j) m × n i=1 j=1 PSNR = 10 × log10 MAXI2 MSE Trong đó, m × n kích thước ảnh I D khung ảnh gốc khung ảnh giải mã Footer Page 37 of 113 (3.2) (3.3) 34 Header Page 38 of 113 MSE mean squared signal, MAXI giá trị tối đa điểm ảnh, ảnh 8-bit 255 3.1.3 Độ phức tạp Độ phức tạp thuật toán mã hóa video thông số quan trọng sử dụng cho hệ thống bị giới hạn lực tính toán Số lượng phép tính tốc độ mã hóa thuật toán thông số đại diện cho khả thực thi độ phức tạp mã hóa 3.2 Mô đánh giá kết Bảng 3.1: Môi trường mô Thông số Ghi Thư viện JPEG libjpeg-6b [16] Hệ điều hành Centos 6.5 x32 GNU version g++/gcc 4.4.7 Matlab 7.9.0.529 CPU Intel(R) Core(TM)2 Duo CPU E4400 @ 2.00GHz Bảng 3.2: Video tham gia mô Video Kích thước Akiyo CIF Container CIF Foreman CIF Hall CIF News CIF Soccer CIF FPS 30 30 30 30 30 30 Nhóm A A B A B C Ghi Chương trình thời Video bến cảng Người nói trước máy quay Camera giám sát hành lang Chương trình thời với nhiều chuyển động Trận đấu bóng Nhóm A có độ chi tiết thấp số lượng chuyển động nhỏ Nhóm B có số lượng chuyển động mức trung bình Nhóm C có số lượng chuyển động mức cao liên tục Bảng 3.1 - 3.2 trình bày điều kiện môi trường mô đặc điểm video tham gia mô Footer Page 38 of 113 35 Header Page 39 of 113 3.2.1 Kịch mô Như trình bày phần 3.1 có ba thông số để đánh giá khả phương pháp mã hóa video: PSNR, tỷ lệ nén, tốc độ mã hóa Mô hình đánh giá kết thuật toán hình bày Hình 3.1 Trong phần đánh giá PSNR sử dụng phần mềm thứ 3, xây dựng hàm có sẵn Matlab Phần đánh giá tốc độ mã hóa thực hàm đếm thời gian hệ điều hành Các phương pháp tham gia mã hóa bao gồm: MJPEG, nén sai khác MJPEG, MJPEG kết hợp với thuật toán xác định chuyển động phương pháp đề xuất PSNR Khung hình gốc Video Khung hình gốc Mã hóa Giải mã Time Counter Hình 3.1: Sơ đồ cho kịch đánh giá Footer Page 39 of 113 Khung hình sau giải mã Header Page 40 of 113 3.2.2 36 Kết mô Ký hiệu conv diff modi Ý nghĩa Phương pháp nén MJPEG truyền thống Phương pháp nén sai khác MJPEG Phương pháp nén sử dụng MJPEG kết hợp thuật toán xác định chuyển động zipfian xbit Phương pháp nén đề xuất sử dụng const = nth-frame Thứ tự khung hình video, QP Giá trị tính ma trận lượng tử mã hóa JPEG Videos Akiyo, container, foreman, hall, news, soccer [17] Bảng 3.3: Các ký hiệu sử dụng chung phần mô Khung hình mã hóa - giải mã Hình 3.2: Khung hình mã hóa - giải mã video akiyo Footer Page 40 of 113 Header Page 41 of 113 37 Hình 3.3: Khung hình mã hóa - giải mã video container Hình 3.4: Khung hình mã hóa - giải mã video foreman Footer Page 41 of 113 Header Page 42 of 113 38 Hình 3.5: Khung hình mã hóa -giải mã video hall Hình 3.6: Khung hình mã hóa -giải mã video news Footer Page 42 of 113 Header Page 43 of 113 39 Hình 3.7: Khung hình mã hóa -giải mã video soccer Hình 3.2 - Hình 3.7 trình bày khung hình mã hóa phương pháp đề xuất hàng Hàng thứ khung hình giải mã, sử dụng chung giải mã với phương pháp nén sai khác MJPEG MJPEG kết hợp với thuật toán xác định chuyển động Các khung hình sử dụng nằm vị trí thứ 2, 10 chuỗi mã hóa 10 khung hình Tại khu vực nền, mã hóa đề xuất cho hình ảnh mịn hoàn toàn sai số lượng tử Tuy nhiên, giống phương pháp dựa khung hình liền kề phía trước, phương pháp đề xuất khả loại bỏ dư thừa vật thể chuyển động Năng lượng dư thừa thấy rõ video loại B Foreman loại C Soccer Tỷ lệ nén Hình 3.8 trình bày tỷ lệ nén trung bình 10 khung hình video mẫu với phương pháp mã hóa khác QP [5-90] Trong 10 khung hình, khung hình nén theo phương pháp intra, khung hình lại nén theo phương pháp inter sử dụng kỹ thuật loại bỏ dư thừa thời gian khác Trong phương án đề cập, MJPEG cho kết tỷ lệ nén thấp hẳn so với phương pháp khác Cùng với số QP phương pháp sử dụng kỹ thuật loại bỏ dư thừa mặt thời gian cho hiệu nén tăng gấp đôi Nguyên nhân xuất phát từ thực tế mã hóa MJPEG không sử dụng kỹ thuật loại bỏ dư thừa mặt thời gian Trong phương án có loại bỏ dư thừa mặt thời gian, tỷ lệ nén tăng dần theo thứ tự: nén sai khác MJPEG, MJPEG thuật toán Zipfian, MJPEG đặc tính mắt người Sự chênh lệch tỷ lệ nén tăng dần theo số QP phụ thuộc vào tỷ lệ thành phần tĩnh video Tại số QP thấp, hệ số lượng tử ma trận lượng Footer Page 43 of 113 40 Header Page 44 of 113 140 140 diff modi xbit conv 120 120 100 Compression ratio 100 Compression ratio diff modi xbit conv 80 (c) snn 60 80 (c) snn 60 40 40 20 20 0 10 20 30 40 50 60 70 80 90 100 10 20 30 40 QP (a) Akiyo video 70 140 diff modi xbit conv 120 80 90 100 90 100 90 100 diff modi xbit conv 120 100 Compression ratio 100 Compression ratio 60 (b) Container video 140 80 (c) snn 60 80 (c) snn 60 40 40 20 20 0 10 20 30 40 50 QP 60 70 80 90 100 10 (c) Foreman video 20 30 40 50 QP 60 70 80 (d) Hall monitor video 140 140 diff modi xbit conv 120 diff modi xbit conv 120 100 Compression ratio 100 Compression ratio 50 QP 80 (c) snn 60 80 (c) snn 60 40 40 20 20 0 10 20 30 40 50 QP 60 (e) News video 70 80 90 100 10 20 30 40 50 QP 60 70 80 (f) Soccer video Hình 3.8: Kết nén video mẫu QP[5-95] tử có giá trị cao thành phần AC sau lượng tử tiến gần giá trị Trong ba mã hóa kể trên, nén sai khác MJPEG có tỷ lệ nén xuất phát từ sai số lượng tử hóa Mã hóa MJPEG với Zipfian có tỷ lệ nén MJPEG với đặc tính mắt nguời bắt nguồn từ việc thuật toán xác định chuyển động cố gắng bao trùm toàn vật thể nội không chuyển động Tỷ lệ thành phần tĩnh tác động không nhỏ đến chênh lệch, với video có số lượng chuyển động lớn nhanh sai khác mã hóa MJPEG có loại bỏ sai khác nhỏ Footer Page 44 of 113 41 Header Page 45 of 113 Tỷ lệ nén khung hình intra, inter 140 110 100 90 80 100 80 Compression ratio Compression ratio 120 (c) snn 60 70 60 (c) snn 50 40 30 40 xbit-60 xbit-75 xbit-90 20 xbit-60 xbit-75 xbit-90 20 10 nth-frame 9 nth-frame (a) Akiyo video (b) Container video 80 110 100 70 90 80 Compression ratio Compression ratio 60 50 (c) snn 40 70 60 (c) snn 50 40 30 30 20 xbit-60 xbit-75 xbit-90 10 nth-frame xbit-60 xbit-75 xbit-90 20 10 (c) Foreman video nth-frame (d) Hall monitor video 140 55 50 120 45 Compression ratio Compression ratio 100 80 (c) snn 60 40 35 (c) snn 30 25 40 20 20 xbit-60 xbit-75 xbit-90 0 nth-frame (e) News video xbit-60 xbit-75 xbit-90 15 10 nth-frame (f) Soccer video Hình 3.9: Tỷ lệ nén inter-intra video mẫu Hình 3.9 trình bày tỷ lệ nén khung hình 10 khung hình sử dụng phương pháp đề xuất giá trị QP phổ biến: 60-75-90 Riêng khung hình khung hình intra, khung hình khung hình inter Trong hình vẽ, khung hình inter có tỷ lệ nén biến động lớn Sự biến động xuất phát từ việc tỷ lệ nén khung hình inter phụ thuộc nhiều vào tỷ lệ chuyển động số lượng chuyển động khung hình ngẫu nhiên Tuy nhiên, tỷ lệ nén khung Footer Page 45 of 113 42 Header Page 46 of 113 hình inter luôn cao so với khung hình intra Đối với video tồn nhiều chuyển động Soccer, khung hình inter đạt tỷ lệ nén gấp 1.5 lần so với khung hình intra Tuy nhiên, tỷ lệ đạt vài chục lần đến trăm lần có video tồn chuyển động Akiyo Chỉ số PSNR tỷ lệ nén tương ứng phương pháp mã hóa MJPEG 50 50 diff modi xbit conv 45 45 40 35 PSNR 40 PSNR diff modi xbit conv (c) snn 35 30 30 25 25 20 (c) snn 20 20 40 60 80 Compression Ratio 100 120 140 20 (a) Akiyo video 40 60 80 Compression Ratio 100 120 140 (b) Container video 45 50 diff modi xbit conv 40 diff modi xbit conv 45 40 PSNR PSNR 35 (c) snn 35 (c) snn 30 30 25 25 20 20 20 40 60 80 Compression Ratio 100 120 140 (c) Foreman video 20 40 60 80 Compression Ratio 100 120 140 (d) Hall monitor video 50 45 diff modi xbit conv 45 diff modi xbit conv 40 40 PSNR PSNR 35 35 (c) snn (c) snn 30 30 25 25 20 20 20 40 60 80 Compression Ratio (e) News video 100 120 140 20 40 60 80 Compression Ratio 100 120 140 (f) Soccer video Hình 3.10: Kết PSNR tỷ lệ nén video mẫu Hình 3.10 trình bày PSNR tỷ lệ nén tương ứng 10 khung hình đầu với Footer Page 46 of 113 Header Page 47 of 113 43 thuật toán nén video khác Bên cạnh việc so sánh tỷ lệ nén phương pháp mã hóa dựa MJPEG điểm QP giống việc so sánh tỷ lệ nén chất lượng ảnh (ví dụ PSNR) quan trọng Bởi mã hóa sử dụng kỹ thuật khác để đạt tỷ lệ nén mong muốn nên dư thừa loại bỏ khác Hơn nữa, mục tiêu cuối mã hóa đạt tỷ lệ nén cao mà đảm bảo tính đắn video sau giải mã Theo Hình 3.10, MJPEG có khả đạt PSNR cao Tất điều xuất phát từ thực tế MJPEG không loại bỏ dư thừa mặt thời gian nên kết video sau giải mã chịu ảnh hưởng lượng tử hóa Tuy nhiên, so sánh số PSNR, MJPEG có tỷ lệ nén thấp Các mã hóa có kỹ thuật loại bỏ dư thừa thời gian có tỷ lệ nén cao PSNR có nhiều dư thừa loại bỏ có khả khôi phục tốt hơn(dư thừa mặt thời gian) Những kỹ thuật loại bỏ nhiều dư thừa có tỷ lệ nén cao PSNR Độ phức tạp Bảng 3.4: Số phép tính thuật toán Zipfian, biến đổi DCT thuận, Lượng tử phương pháp đề xuất khối 8x8 [3] Phép tính Zipfian FDCT Lượng tử hóa Đề xuất Cộng/Trừ 200 928 64 ≤ 64 Nhân 192 64 Dịch 20 128 0 Bảng 3.4 trình bày số lượng phép tính sử dụng cho khối 8x8 Trong đó, Zipfian số lượng phép tính DCT, lượng tử trích xuất từ báo [3] Giá trị số lượng phép tính cộng/trừ phương án để xuất nhỏ 64 phép tính xuất phát từ công thức 2.9 - 2.10 số lượng điểm ảnh khối 64 Theo công thức 2.9, điểm ảnh tiêu tốn phép trừ để tính sai khác Công thức 2.10 trạng thái khối xác định mà không cần đến việc tính sai khác cho toàn điểm ảnh Như trình bày Bảng 3.4, số lượng phép tính cho khối thuật toán Zipfian hẳn so với biến đổi DCT thuận lượng tử Trong báo cáo [3], video có số lượng khối tĩnh nhiều 60%, MJPEG Zipfian có số lượng phép tính toán nhỏ so với MJPEG truyền thống Mặc dù vậy, Zipfian yêu cầu số lượng phép tính nhiều hẳn phương án để xuất, số khoảng lần Footer Page 47 of 113 Header Page 48 of 113 44 KẾT LUẬN Trong suốt thời gian nghiên cứu thực luận văn, với hướng dẫn tận tình PGS.TS Trần Xuân Tú, với cố gắng nỗ lực thân, toàn nội dung luận văn hoàn thiện đáp ứng yêu cầu đặt Luận văn đề xuất, thiết kế "Phương pháp xác định chuyển động dựa đặc tính mắt người thành phần xám việc loại bỏ dư thừa mặt thời gian mã hóa video MJPEG" phù hợp với camera mạng cảm biến không dây Kiến trúc đề xuất xuất phát từ thực tế đặc tính giới hạn mắt người thành phần xám Trong kiến trúc mã hóa đề xuất, để mã hóa khung hình, mã hóa chia làm ba giai đoạn: phân tách chuyển động dựa đặc tính mắt người, mã hóa khối tĩnh-động giải mã Giai đoạn phân tách chuyển động có vai trò phân chia thành phần tĩnh động khung hình Phân tách hỗ trợ thực giai đoạn mã hóa tĩnh - động Trong đó, mã hóa khối tĩnh lược giản bớt trình không cần thiết: biến đổi DCT lượng tử hóa Giai đoạn cuối đảm bảo đồng khung tham chiếu giải mã mã hóa Dựa vào đặc tính khối tĩnh mà toàn phần giải mã khối tĩnh lược giản Kết mô đánh giá mã hóa đề xuất đảm bảo tính đơn giản hiệu việc tăng tỷ lệ nén mã hóa MJPEG Với chất lượng video sau mã hóa tương đương, phương pháp đề xuất đạt tỷ lệ nén gấp đôi so với MJPEG truyền thống cao so với phương pháp loại bỏ dư thừa thời gian nêu luận văn: nén sai khác MJPEG, MJPEG với thuật toán xác định chuyển động Zipfian So sánh độ phức tạp, phương án đề xuất sử dụng lượng phép tính gấp lần so với phương án áp dụng MJPEG với thuật toán xác định chuyển động Zipfian Điều đảm bảo phương án đề xuất đạt tốc độ mã hóa cao so với phương án mã hóa xây dựng từ MJPEG đề cập cho video tồn chuyển động Về mặt khả ứng dụng, mã hóa đề xuất hoàn toàn phù hợp cho camera mạng cảm biến không dây mã hóa đề xuất có độ phức tạp thấp cho phép linh động GOP Trong tương lai học viên mong muốn áp dụng kỹ thuật loại bỏ dư thừa mặt thời gian đề xuất cho chuẩn mã hóa tiên tiến HEVC Footer Page 48 of 113 Header Page 49 of 113 45 DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN VĂN Ngoc-Sinh Nguyen, Duy-Hieu Bui, and Xuan-Tu Tran Reducing temporal redundancy in mjpeg using zipfian estimation techniques In 2014: the 12th of the biennial IEEE Asia Pacific Conference on Circuits and Systems (IEEE APCCAS 2014), pages 65–68, November 2014 Outstanding Student Paper Award & Travel Support Grant Award Ngoc-Sinh Nguyen, Duy-Hieu Bui, and Xuan-Tu Tran.An Efficient Video Coding Algorithm Targeting Low Bitrate Stationary ộtCameras In 2013 IEICE International Conference on Integrated Circuits, Devices, and Verification (ICDV 2013), pages 127–132, November 2014 Footer Page 49 of 113 Header Page 50 of 113 46 TÀI LIỆU THAM KHẢO [1] “Brief history of video codecs.” https://www.linkedin.com/pulse/ brief-history-video-codecs-yoav-nativ [2] I E Richardson, The H.264 Advanced Video Coding Standard second ed [3] N.-S Nguyen, D.-H Bui, and X.-T Tran, “Reducing temporal redundancy in mjpeg using zipfian estimation techniques,” in 2014: the 12th of the biennial IEEE Asia Pacific Conference on Circuits and Systems (IEEE APCCAS 2014), pp 65–68, November 2014 Outstanding Student Paper Award & Travel Support Grant Award [4] ITU-T, “Video codec for audiovisual services at p x 64 kbit/s,” tech rep., International Telecommunication Union, March 1993 [5] ITU-T, “H.264/AVC,” recommendation, International Telecommunication Union, 2003 [6] Thomas Wiegand, Gary J Sullivan, Gisle Bjøntegaard and Ajay Luthra, “Overview of the H.264/AVC Video Coding Standard,” IEEE Transactions on Circuits and Systems for Video Technology, vol 13, July 2003 [7] ITU-T, “H.265/HEVC,” recommendation, International Telecommunication Union, April 2013 [8] TGary J Sullivan, Jens-Rainer Ohm, Woo-Jin Han and Thomas Wiegand, “Overview of the High Efficiency Video Coding (HEVC) Standard,” IEEE Transactions on Circuits and Systems for Video Technology, vol 22, December 2012 [9] S Ponlatha and R S Sabeenian, “Comparison of video compression standards,” in December 2013 International Journal of Computer and Electrical Engineering, December 2013 [10] ITU-T, “Recommendation T.81,” recommendation, The International Telegraph and Telephone Consultative Commitee, September 1992 [11] “Runlength.” https://en.wikipedia.org/wiki/Run-length_encoding [12] “Huffman coding.” https://en.wikipedia.org/wiki/Huffman_coding Footer Page 50 of 113 Header Page 51 of 113 47 [13] N.-S Nguyen, D.-H Bui, and X.-T Tran, “An efficient video coding algorithm targeting low bitrate stationary cameras,” in 2013 IEICE International Conference on Integrated Circuits, Devices, and Verification (ICDV 2013), pp 127–132, November 2014 [14] Eric Kreit, Lydia M M¨athger, Roger T Hanlon, Patrick B Dennis, Rajesh R Naik, Eric Forsythe, Jason Heikenfeld, “Biological versus electronic adaptive coloration: how can one inform the other?,” Journal of The Royal Society Interface 10(78), September 2012 [15] “Peak Signal to Noise Ratio.” https://en.wikipedia.org/wiki/Peak_ signal-to-noise_ratio [16] “JPEG library libjpeg.” http://www.ijg.org/ [17] “Video samples.” http://media.xiph.org/video/derf/ Footer Page 51 of 113 ... NGHỆ NGUYỄN NGỌC SINH PHƯƠNG PHÁP XÁC ĐỊNH CHUYỂN ĐỘNG DỰA TRÊN ĐẶC TÍNH CỦA MẮT NGƯỜI ĐỐI VỚI THÀNH PHẦN XÁM TRONG VIỆC LOẠI BỎ DƯ THỪA VỀ MẶT THỜI GIAN CỦA MÃ HÓA VIDEO MJPEG Ngành: Công nghệ... cho phân tách chuyển động 2.4 Phương pháp xác định chuyển động dựa đặc tính mắt người thành phần xám việc loại bỏ dư thưa mặt thời gian mã hóa MJPEG 2.4.1 Nguyên lý hoạt động ... mạng cảm biến không dây: Phương pháp xác định chuyển động dựa đặc tính mắt người thành phần xám việc loại bỏ dư thừa mặt thời gian mã hóa video MJPEG ” Mô hình nén video đề xuất luận văn bao