1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nghiên cứu hiệu năng mạng LORAWAN trong internet vạn vật TT

22 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - NGUYỄN QUANG HUY NGHIÊN CỨU VÀ ĐÁNH GIÁ MỘT SỐ THUẬT TOÁN ƯỚC LƯỢNG CHUYỂN ĐỘNG TRONG MÃ HÓA VIDEO CHUYÊN NGÀNH : KỸ THUẬT VIỄN THƠNG MÃ SỐ: 8.52.02.08 TĨM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI - 2021 Luận văn hồn thành tại: HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học: TS Vũ Hữu Tiến Phản biện 1: …………………….…………………………………………… Phản biện 2: …………………………….…………………………………… Luận văn bảo vệ trước hội đồng chấm luận văn thạc sĩ Học viện Cơng nghệ Bưu Viễn thông Vào lúc: …… …… ngày …… Tháng …… Năm …… Có thể tìm hiểu luận văn tại: - thư viện Học viện Cơng nghệ Bưu Viễn thơng I MỞ ĐẦU 1.Tính cấp thiết đề tài: Trong video, dư thừa liệu nằm mối tương quan không gian, thời gian thống kê khung hình Các mối tương quan xử lý tách biệt khác đặc điểm chúng Các chuẩn nén video thường gồm phần để giảm ba loại dư thừa liệu Ước lượng bù chuyển động sử dụng để giảm dư thừa thời gian khung hình liên tiếp miền thời gian Ước lượng chuyển động nhằm xem xét chuyển động đối tượng chuỗi ảnh để tìm vector biểu diễn cho chuyển động Ước lượng chuyển động sử dụng hiểu biết chuyển động đối tượng giảm dư thừa thời gian Vì việc nghiên cứu xây dựng thuật toán ước lượng chuyển động cần thiết việc cải thiện chất lượng thời gian xử lý chuẩn nén video Do vậy, chọn đề tài “Nghiên cứu đánh giá số thuật toán ước lượng chuyển động mã hóa video” làm nội dung nghiên cứu cho luận văn Đây chủ đề cấp thiết cho việc ứng dụng truyền video mạng viễn thông đa môi trường hệ Tổng quan vấn đề nghiên cứu: Trên thực tế, có nhiều nghiên cứu thuật tốn tìm kiếm khác sử dụng để dự đoán chuyển động khung hình Có hai cách tiếp cận ước lượng chuyển động: - Ước lượng chuyển động dựa pixel - Ước lượng chuyển động dựa khối Cách tiếp cận ước lượng chuyển động dựa pixel tìm xác định vector chuyển động cho pixel ảnh Phương pháp gọi “phương pháp dòng quang” Phương pháp làm việc dựa giả định không thay đổi độ sáng nghĩa cường độ pixel khơng đổi dịch chuyển Tuy nhiên số lượng vector biểu diễn chuyển động lớn pixel cần vector tương ứng Một cách tiếp cận thực tế nhanh ước lượng chuyển động dựa khối BMME (Block Matching Motion Estimation) Trong phương pháp này, frame chia thành khối khơng chồng lấn (có kích thước 16 x 16, x 8, chí x pixel tiêu chuẩn gần đây) với block xác định vector chuyển động frame tham chiếu Chỉ cần tính vector chuyển động cho tồn khối, ta giả định toàn block chuyển động tịnh tiến Điều giả định hợp lý ngoại trừ biên đối tượng Cho đến ước lượng chuyển động dựa khối chấp nhận tất chuẩn mã hóa video Nó dễ thực phần cứng, ước lượng dự đốn chuyển động thời gian thực Các thuật toán gồm: thuật tốn tìm kiếm đầy đủ FSA (Full Search Algorithm), Thuật tốn tìm kiếm logarithm hai chiều TDL (Two - dimentional logarithmnic search), Thuật tốn tìm kiếm ba bước TSS (Three - step search algorithm), Thuật tốn tìm kiếm chéo CSA (Cross Search Algorithm), Thuật toán OTA (One-at-a-time Search Algorithm), Thuật toán OTA cải tiến gọi NOTA (New One at a Time Algorithm), Thuật tốn tìm kiếm ba bước cải tiến MTSS (Modified Three-Step Search Algorithm), thuật toán cải tiến khác Mục đích nghiên cứu: - Nghiên cứu số chuẩn nén video ứng dụng rộng rãi bao gồm MPEG H.26x - Nghiên cứu số thuật toán ước lượng chuyển động áp dụng chuẩn nén - Mô đánh giá thuật tốn dựa tiêu chí chất lượng hình ảnh tỷ lệ nén Đối tượng phạm vi nghiên cứu: 4.1 Đối tượng nghiên cứu: - Đối tượng nghiên cứu đề tài thuật toán ước lượng chuyển động video 4.2 Phạm vi nghiên cứu: - Nghiên cứu đánh giá hiệu số thuật toán ước lượng Vector chuyển động - Tiêu chí đánh giá thuật tốn bao gồm : • Tỷ lệ nén video (được đánh giá qua bitrate) • Chất lượng hình ảnh sau bù chuyển động (được đánh giá thông qua tham số PSNR) Phương pháp nghiên cứu: 5.1 Phương pháp nghiên cứu tài liệu: Nghiên cứu, khảo sát đánh giá thuật toán áp dụng - chuẩn nén video dựa tiêu chí bitrate chất lượng hình ảnh 5.2 Phương pháp mô Đánh giá so sánh thuật tốn dựa cơng cụ mơ mã hóa tín hiệu video - JM Đây cơng cụ phần mềm xây dựng theo chuẩn mã hóa tín hiệu Video ISO/IEC 14496-10 AVC Luận văn cấu trúc với chương sau: Chương 1: Tổng quan mã hóa Video Chương 2: Nghiên cứu thuật tốn ước lượng chuyển động mã hóa Video Chương 3: Mơ đánh giá thuật toán ước lượng chuyển động mã hóa Video CHƯƠNG I: TỔNG QUAN VỀ MÃ HÓA VIDEO 1.1 Tổng quan Về kỹ thuật mã hóa video làm giảm bớt thông tin không cần thiết video mà không làm ảnh hưởng đến chất lượng trải nghiệm người xem Lượng thông tin dư thừa video gồm hai loại dư thừa thông tin miền không gian (trong khung hình) dư thừa thơng tin miền thời gian (trong khung hình liên tiếp) Mã hóa video làm giảm số bit lưu trữ truyền Các kỹ thuật mã hóa entropy sử dụng để làm giảm lượng thông tin dư thừa giữ lại tin quan trọng 1.2 Nguyên tắc mã hóa video - Các nghiên cứu trước frame chuỗi video pixel frame có mối tương quan định Dựa vào mối tương quan thực việc nén tín hiệu video mà không làm ảnh hưởng tới độ phân giải ảnh - Dư thừa thông tin miền không gian (Spatial redundancy): Dư thừa thông tin miền không gian xuất pixel khung hình (ví dụ tương đồng pixel) Thơng tin dư thừa loại bỏ kỹ thuật mã hóa biến đổi (transform coding) - Dư thừa thông tin miền thời gian (Temporal redundancy): Loại thông tin dư thừa xuất khung ảnh liên tiếp có thơng tin tương đồng Để giảm dư thừa người ta dùng kỹ thuật mã hóa khác biệt frame 1.2.1 Kỹ thuật giảm dư thừa thơng tin miền khơng gian a Mã hóa phương pháp dự đốn - Phương pháp giảm dư thơng không gian đưa dựa việc dự báo giá trị pixel dựa vào giá trị pixel mã hóa trước - Phương pháp gọi “Điều chế xung mã sai phân” (Differential Pulse Code Modulation – DPCM) - Bộ dự đốn cho kết tốt q trình dự báo dựa giá trị pixel liền kề mã hóa trước 5 b Mã hóa phương pháp biến đổi Người ta chia lượng tử làm hai loại: lượng tử đồng (Uniform quantiser – UTQ) lượng tử đồng có dead zone (UTQ-DZ) Các hệ số DC chế độ nén nội ảnh lượng tử UTQ hệ số AC hệ số DC chế độ nén liên ảnh lượng tử UTQ-DZ Lý UTQ-DZ làm cho nhiều hệ số AC trở thành giá trị nên hệ số nén cao 1.2.2 Kỹ thuật giảm dư thừa thông tin miền thời gian - Kỹ thuật giảm dư thừa thông tin miền thời gian thực dựa việc tìm khác khung hình liên tiếp - Để làm giảm lượng thông tin này, người ta tiến hành thêm bước trung gian gọi ước lượng chuyển động (motion estimation) cho đối tượng hình dựa cách so sánh khung hình khung hình trước - Q trình ước lượng chuyển động cho kết vector chuyển động Dựa vào vector khung hình trước đó, khung hình dự đốn Q trình gọi “bù chuyển động” (motion compensated) Như vậy, khác biệt khung hình khung hình dự đoán giảm so với khác biệt khung hình thời khung khung hình trước a Ước lượng chuyển động Mục đích q trình ước lượng chuyển động để tìm vector chuyển động Trong tiêu chuẩn mã hóa video, thuật toán BMA (Block Matching Algorith) thường sử dụng để ước lượng chuyển động Để tìm đánh giá mức độ giống hai khối hình đích khối hình tham chiếu, sử dụng số phương pháp sử dụng hàm tương quan chéo (Crosscorrelation function - CCF), hàm trung bình bình phương lỗi (Mean Square Error – MSE) hàm trung bình tuyệt đối lỗi (Mean absolute error – MAE) b Bù chuyển động Sau q trình ước lượng chuyển động ta có vector chuyển động đối tượng khối pixel N x N khung hình đích Dựa vào vector chuyển động, khối pixel N x N khung hình tham chiếu dịch chuyển theo hướng độ lớn vector chuyển động Quá trình gọi bù chuyển động Kết trình khung hình cho giống với khung hình thời Tuy nhiên, q trình dự đốn nên khung hình dự đốn khơng thể giống hồn tồn với khung hình thời 1.2.3 Sơ đồ tổng quát mã hóa video Về mã hóa video MPEG, H261, H264… có nguyên lý hoạt động tổng quát hình Hình 1.1: Sơ đồ nguyên lý tổng quát mã hóa video a) Intraframe/Interframe loop Trong chế độ mã hóa liên ảnh, giá trị khác biệt pixel khung hình khung hình dự đốn dựa vào khung hình trước mã hóa truyền Tại phía thu, sau giải mã, giá trị khác biệt cộng với khung hình dự đốn bên thu đưa để xây dựng lên khung hình b) Ước lượng chuyển động Lượng liệu truyền lớn với pixel có vector chuyển động Thay vào đó, người ta gán cho nhóm pixel (block) vector chuyển động Trong chuẩn mã hóa, nhóm pixel hình vng có kích thước 16x16 (được gọi Macroblock - MB) ước lượng chuyển động bù chuyển động Thông thường, việc ước lượng chuyển động thực kênh chói (kênh Y) khung hình c) Inter/Intra swich Inter/Intra switch có tác dụng chuyển đổi hai chế độ liên ảnh nội ảnh Trong chuẩn mã hóa ảnh JPEG, tất MB ảnh mã hóa chế độ nội ảnh Với chuẩn mã hóa video H.26x MPEG, số loại frame mã hóa chế độ nội ảnh, số loại frame mã hóa chế độ liên ảnh Ngồi ra, frame liên ảnh, số MB mã hóa chế độ nội ảnh để tối ưu hóa tỷ lệ mã hóa 7 d) DCT Trên kênh Y hai kênh màu U, V, MB chia thành khối nhỏ có kích thước 8x8 Như vậy, có khối 8x8 thuộc kênh Y số khối thuộc kênh màu tùy theo độ phân giải ảnh Mỗi khối 8x8 biến đổi DCT để có ma trận 8x8 hệ số biến đổi DCT d) Lượng tử hóa Có hai loại lượng tử hóa Một loại có dead zone sử dụng cho hệ số AC hệ số DC MB mã hóa liên ảnh Loại cịn lại khơng có dead zone sử dụng cho hệ số DC MB nội ảnh Khoảng giá trị hệ số lượng tử từ -2047 đến +2047 Với lượng tử có dead zone, trị tuyệt đối hệ số nhỏ bước lượng tử q gán Ngược lại, giá trị hệ số sau lượng tử khoảng từ đến 31 e) Variable Length Coding Các hệ số sau lượng tử mã hóa mã có độ dài thay đổi Ngoài ra, giá trị vector chuyển động mã hóa mã với hệ số lượng tử f) Giải lượng tử biến đổi DCT ngược Để tái tạo khung hình thời, hệ số DCT sau lượng tử giải lượng tử biến đổi DCT ngược Sau đó, giá trị cộng với khung hình trước mã hóa lưu giữ để tái tạo lại khung hình thời Khung hình thời lại lưu giữ để dùng cho trình dự đốn khung hình g) Bộ đệm Tốc độ bit tạo mã hóa liên tục thay đổi tốc độ bit phụ thuộc vào mức độ chuyển động đối tượng video Vì vậy, trước truyền tín hiệu video kênh truyền có băng thơng cố định bit lưu đệm để điều tiết việc truyền Bộ đệm trường hợp nhớ có hai cổng ghi đọc 1.3 Giải mã hóa video Q trình giải mã hóa video giống bước mã hóa video ngược lại Ban đầu liệu nhận tín hiệu mã hóa tách thành hai phần: liệu mã hóa giá trị khác biệt liệu mã hóa giá trị vector chuyển động Vector chuyển động đưa vào dự đốn để dự đốn khung hình Dữ liệu mã hóa giá trị khác biệt khung hình khung hình trước giải mã entropy, giải luợng tử, biến đổi DCT ngược Sau biến đổi DCT ngược ta khung hình hiệu số khung hình khung hình dự đốn Sau cộng với khung hình dự đốn, ta thu khung hình tái tạo khung hình 8 1.4 Các tiêu chuẩn cho mã hóa tín hiệu video Trên giới có hai tổ chức đưa tiêu chuẩn cho mã hóa video Tổ chức Viễn thông quốc tế (International Standards Organisation – ISO) Hiệp hội Viễn thông quốc tế (International Telecommunications Union – ITU) Tiêu chuẩn ITU đưa tập trung vào ứng dụng video thời gian thực, ứng dụng thoại video Nhóm đưa tiêu chuẩn ITU có tên VCEG (Video Coding Experts Group) 1.5 Kết luận chương Kết thúc chương I hiểu kiến thức tổng quát mã hóa video, nguyên lý hoạt mã hóa dựa nguyên tắc loại bỏ dư thừa video bước thực chi tiết Để phát triển mã hóa video khơng đòi hỏi mạnh phần cứng phần mềm, thuật toán áp dụng cách hiệu Mã hóa video chuỗi bước thực ước lượng chuyển động hoạt động quan trọng có sử dụng thuật tốn ước lượng chuyển động phân tích chi tiết chương 9 CHƯƠNG II: NGHIÊN CỨU CÁC THUẬT TOÁN ƯỚC LƯỢNG CHUYỂN ĐỘNG TRONG MÃ HÓA VIDEO Hiện có hai cách tiếp cận ước lượng chuyển động: - Ước lượng chuyển động dựa pixel - Ước lượng chuyển động dựa khối Cách tiếp cận ước lượng chuyển động dựa pixel tìm xác định vector chuyển động cho pixel ảnh Phương pháp gọi “phương pháp dòng quang” Một cách tiếp cận thực tế nhanh ước lượng chuyển động dựa khối Trong phương pháp này, frame chia thành khối không chồng lấn với block xác định vector chuyển động frame tham chiếu Chỉ cần tính vector chuyển động cho toàn khối Tính hiệu kỹ thuật nén sử dụng bù chuyển động dựa khối phụ thuộc vào mức độ giả định sau: - Độ chói đồng quỹ đạo chuyển động - Bỏ qua vấn đề vùng không xét đến 2.1 Thuật tốn tìm kiếm theo khối BMA (Block Matching Algorithm) BMA giả sử tất pixel khối có hoạt động chuyển động Trong BMA, chuyển động ước tính sở khối hình chữ nhật Vectơ chuyển động (MV) tạo cho khối Do phạm vi tìm kiếm định, cửa sổ nhưcấu trúc hình thành hệ quy chiếu, gọi Cửa sổ Tìm kiếm (SW) Đối với phạm vi tìm kiếm [−p , + p] MB có kích thước N × N, quan hệ không gian-mối quan hệ MB SW thể Hình 2.1 Quá trình đối sánh block thời với block ứng cử viên quy điểm tìm kiếm cửa sổ tìm kiếm Nếu tìm tất điểm cửa sổ tìm kiếm đảm bảo tìm điểm có độ méo nhỏ 10 Hình 2.1: Ước lượng chuyển động theo khối Sự kết hợp tiêu chí BMA có tác động trực tiếp đến hiệu mã hóa tính tốn phức tạp Nhiều tiêu chí phù hợp đề xuất tài liệu, ví dụ: sai số bình phương, Tổng số chênh lệch tuyệt đối (SAD), phân loại chênh lệch pel, v.v Trong số tiêu chí đối sánh đề xuất khác nhau, tính tốn SAD u cầumột vài bước tính tốn đơn giản • Sai số bình phương trung bình MSE MSE block gồm pixel tính với độ dịch chuyển (𝑤𝑥 , 𝑤𝑦 ) frame tham chiếu có cơng thức sau: 𝑁 𝑁 𝑀𝑆𝐸 (𝑚, 𝑛) = ∑ ∑(𝑓(𝑚, 𝑛) − 𝑔(𝑚 + 𝑖, 𝑛 + 𝑗))2 , −𝑤 ≤ 𝑚, 𝑛 ≤ 𝑤 𝑁 (2.1) 𝑚=1 𝑛=1 • Tổng trị tuyệt đối sai khác SAD Giống tiêu chuẩn MSE, SAD coi giá trị sai khác dương, thay lấy tổng bình phương Đánh giá SAD cho vị trí định (m, n) SW thực như: 𝑁−1 𝑁−1 𝑆𝐴𝐷 (𝑚, 𝑛) = ∑ ∑ |𝑐𝑢𝑟(𝑖, 𝑗) − 𝑟𝑒𝑓(𝑖 + 𝑚, 𝑗 + 𝑛)| (2.2) 𝑖=0 𝑗=0 • Kích thước block Một tham số quan trọng khác BMA kích thước block Nếu kích thước block nhỏ, cho chất lượng dự đốn tốt Đó số lý sau Kích thước block nhỏ 11 làm tăng độ xác hay nói cách khác, với kích thước nhỏ có khả block chứa đối tượng khác dịch chuyển theo hướng khác • Dải tìm kiếm Độ dịch chuyển cho phép tối đa hay cịn gọi dải tìm kiếm có ảnh hưởng trực tiếp đến độ phức tạp tính tốn chất lượng dự đốn BMA Gía trị nhỏ cho bù chuyển động vùng chuyển động nhanh chất lượng dự đốn Mặt khác lớn cho chất lượng dự đốn tốt tăng độ phức tạp tính tốn (vì có block ứng cử viên cần đối sánh cửa sổ tìm kiếm) 2.1.1 Thuật tốn tìm kiếm đẩy đủ FSA (Full Search Algorithm) Trong BMA tìm kiếm đầy đủ, tất ứng cử viên tìm kiếm cửa sổ tìm kiếm đánh giá,và ứng cử viên tìm kiếm có SAD nhỏ chọn đối sánh tốt ứng cử viên tìm kiếm MV cuối lấy từ vị trí phù hợp nhấtứng cử viên tìm kiếm Thuật tốn cho ME dựa tìm kiếm đầy đủ trình bày Vì tất ứng cử viên tìm kiếm kiểm tra tồn tìm kiếm, ME dựa toàn kiếm cung cấp giải pháp tối ưu Mặc dù tìm kiếm đầy đủ mang lại kết tối ưu, địi hỏi lượng lớn tính tốn 2.1.2 Thuật tốn tìm kiếm nhanh (Fast Search Algorithm) Để giảm u cầu tính tốn khổng lồ ước tính chuyển động dựa thuật tốn tìm kiếm đầy đủ, tìm thấy số lượng lớn BMA nhanh chưa tối ưu văn học Các thuật toán làm giảm thời gian tính tốn chi phí phần cứng mức độ đáng kể Tuy nhiên, nhược điểm lớn liên quan với thuật toán tìm kiếm nhanh này, thường xun chúng bị mắc kẹt số cực tiểu cục tạo kết mức tối ưu Các thuật tốn tìm kiếm nhanh phân loại rộng rãi thành ba loại, cụ thể giảm số lượng tìm kiếm ứng viên, khai thác tiêu chí đối sánh khác thay tiêu chí cổ điển SAD, tìm kiếm dự đốn dựa đặc điểm chúng Các thuật toán dựa giả định biến dạng đơn điệu giảm ứng viên tìm kiếm tiếp cận ứng cử viên tối ưu Đó là, tất ứng cử viên tìm kiếm khơng phù hợp, ứng viên tìm kiếm tối ưu theo sau ứng viên tìm kiếm có độ méo nhỏ Từ ta có thuật tốn: Tìm kiếm ba bước, tìm kiếm kim cương… 12 2.2 Thuật tốn tìm kiếm ba bước TSS (Three-step search algorithm) Thuật toán dựa cách tiếp cận “từ thô đến tinh” (coarse to fine) với việc giảm kích thước bước theo hàm logarithm mơ tả hình 2.2 Thuật tốn tìm kiếm ba bước TSS (Three-step search algorithm) kiểm tra tám điểm xung quanh tâm Hình 2.2: Mơ tìm kiếm ba bước Thuật tốn tìm kiếm ba bước sử dụng phổ biến nhờ đơn giản nó, tổng quát lại sau: B1: kích thước bước ban đầu cố định Tám khối khoảng cách bước kích thước từ trung tâm (xung quanh khối trung tâm) chọn để so sánh B2: tâm di chuyển đến điểm tạo biến dạng tối thiểu với bướckích thước giảm nửa B3: Điều lặp lại kích thước bước trở nên nhỏ 2.3 Thuật toán Diamond Search Thuật toán DS sử dụng mẫu điểm tìm kiếm dạng hình thoi thuật tốn chạy xác 4SS Tuy nhiên lại khơng có giới hạn số bước mà thuật toán cần thực Để tìm kiếm có hai loại mẫu cố định khác nhau: • Mẫu tìm kiếm hình thoi lớn (LDSP- Large Diamond Search Pattern) • Mẫu tìm kiếm hình thoi nhỏ (SDSP- Small Diamond Search Pattern) 13 Thuật tốn tìm độ méo xác mẫu tìm kiếm khơng q lớn khơng q nhỏ Thuật tốn có giá trị PSNR gần với tìm kiếm vét cạn chi phí tính tốn giảm đáng kể Hình 2.3: Thuật tốn Diamond Search 2.4 Thuật tốn TZ search Ban đầu, mã hóa tìm khối ứng viên khung hình tham chiếu cách tìm MV tốt Cụ thể, mã hóa sử dụng thuật tốn AMVP để tìm khối bắt đầu thuật tốn TZ Sau tìm khối có RDcost nhỏ nhất, mã hóa bắt đầu với thuật tốn TZ: Step 1: Bộ mã hóa tính distortion điểm theo hình Diamond Có trường hợp khoảng cách từ block có distortion nhỏ tới điểm block bắt đầu: khoảng cách 1, từ đến lớn điểm ảnh 14 Bắt đầu Khởi tạo điểm tìm kiếm Thực tìm kiếm lần đầu (Diamond search) Khoảng cách tốt = Đúng Sai Khoảng cách tốt = Đúng Sai Sai Khoảng cách tốt > Đúng Tìm kiếm bổ sung điểm Tìm kiếm kiểu raster Khoảng cách tốt = Đúng Sai Lưu vector chuyển động Sai Tìm kiếm vòng (7-round Diamond search) Khoảng cách tốt = Đúng End Hình 2.4: Mơ tả tồn thuật toán TZ search Nếu khoảng cách 1, mã hóa thực tính distortion khối vị trí Missing point: Nếu khoảng cách từ đến 5: mã hóa thực q trình Star refinement Quá trình thực chất (is indeed to) thực lại lần vịng tính tốn hình điểm bắt đầu thay điểm vừa tìm lần trước Quá trình dừng lại mã hóa tìm khối có khoảng cách Khi khoảng cách dừng lại Khi khoảng cách lại thực tìm block vị trí missing point dừng lại Nếu khoảng cách lớn 5: Bộ mã hóa thực trình Raster search Chiến thuật (strategy) Raster search đơn giản thực full search cửa sổ có tâm khối vừa tìm dịch chuyển điểm ảnh sang trái, phải, trên, khối ảnh Sau tìm khối có độ méo thấp q trình Raster search, mã hóa chuyển sang trình Raster refinement Khác với trình Star refinement trên, mã hóa khơng thực tìm kiếm 7-vịng thêm lần mà thực tìm kiếm 1-vịng 15 hình kim cương (single-round Diamond search) với khoảng cách nửa khoảng cách tốt vừa tìm Quá trình lặp lại khối tốt có khoảng cách Nếu dừng lại Nếu thực tìm khối vị trí missing point dừng lại 2.5 Thuật toán OTA (One-at-a-time Search Algorithm) Thuật toán OTA (One-at-a-time Search Algorithm) thuật toán đơn giản hiệu Thuật tốn có giai đoạn theo chiều dọc theo chiều ngang OTA bắt đầu trình tìm kiếm tâm cửa sổ tìm kiếm Các điểm tâm hai điểm lân cận theo chiều ngang, nghĩa (0,0); (0,-1) (0,+1) tìm kiếm Nếu độ méo nhỏ thuộc điểm tâm bắt đầu giai đoạn theo chiều dọc, khơng tìm kiếm điểm theo chiều ngang gần điểm có độ méo nhỏ nhất, tiếp tục theo hướng bạn tìm điểm có độ méo nhỏ Kích thước bước ln ln OTA dừng lại điểm có độ méo tối thiểu giữ hai điểm có độ méo cao Qúa trình lặp lại theo chiều dọc xung quanh điểm có độ méo nhỏ theo chiều ngang Mẫu tìm kiếm OTA mơ tả hình 2.10 Thuật tốn tìm kiếm tiêu tốn thời gian nhiên chất lượng tìm kiếm khơng tốt Hình 2.5: Thuật tốn OTA 2.6 Kết Luận chương Nội dung chương hai nêu thuật toán ước lượng chuyển động dùng nén video Chương cuối thực mơ đánh giá thuật tốn đề xuất cải thiện thuật toán ước lượng chuyển động 16 CHƯƠNG III: MÔ PHỎNG VÀ ĐÁNH GIÁ CÁC THUẬT TỐN ƯỚC LƯỢNG CHUYỂN ĐỘNG TRONG MÃ HĨA VIDEO 3.1 Giới thiệu phần mềm mô Để đánh giá hiệu nén chuẩn HEVC, luận văn sử dụng phần mềm mã nguồn mở HM (HEVC Test Model) Đây phần mềm tham chiếu sử dụng để mã hóa giải mã video theo tiêu chuẩn HEVC Phần mềm tảng cho phép thực mô đánh giá hiệu thuật toán ước lượng chuyển động thuật toán đề xuất 3.2 Các thơng số đánh giá 3.2.1 Tỉ lệ tín hiệu nhiễu đỉnh (Peak Signal-to-Noise Ratio) Tham số PSNR sử dụng để đo mức độ giống hai chuỗi video trước nén sau giải nén Tham số PSNR phản ánh chất lượng chuỗi video sau giải mã Tham số lớn đồng nghĩa với chất lượng chuỗi video sau giải nén giống với chất lượng chuỗi video gốc Trong thực tế, chuỗi video có giá trị PSNR từ 30 dB trở lên coi có chất lượng tốt Tham số PSNR đo sau: - Bước 1: Tìm vector chuyển động cho frame chuỗi video thuật toán ước lượng chuyển động - Bước 2: Dựa vector chuyển động frame 1, frame tái tạo (bù chuyển động) - Bước 3: Giá trị PSNR tính dựa frame gốc frame tái tạo 3.2.2 Số lượng bit dùng để mã hóa giây (Bitrate) thời gian mã hóa Tham số bitrate lớn thể số bit để mã hóa video lớn Nếu giá trị PSNR, chuỗi video có bitrate nhỏ nghĩa hiệu nén chuỗi video cao Thời gian mã hóa video tham số thiết yếu Trong trường hợp giá trị PSNR bitrate không thay đổi, phương pháp pháp có thời gian nén nhỏ hiệu nén cao 17 3.3 So sánh đánh giá thuật tốn thơng qua phần mềm mô 3.3.1 Các chuỗi video dùng để đánh giá Luận văn sử dụng chuỗi video độ phân giải 832x480 176x144 Các chuỗi video chọn lựa với nội dung khác để tăng tính đa dạng Tốc độ khung hình gồm có 30, 50, 60 khung hình giây BasketballDrill_832x480_50 Akiyo_qcif_176_144_30 BQMall_832x480_60 Carphone_qcif_176_144_30 PartyScene_832x480_50 Coastguard_qcif_176_144_30 RaceHorses_832x480_30 Foreman_qcif_176_144_30 Bảng 3.1: chuỗi video đầu vào 3.3.2 Kết mô a Thử nghiệm hiệu số thuật tốn tìm kiếm vector chuyển động Bốn chuỗi video được lựa chọn chế độ nén với thông số lượng tử 37 Số lượng frame nén 30f Hình 3.1: Kết mô Kết mô thể đặc điểm giống khác thuật toán ước lượng chuyển động: Full search (MT0), TZ search (MT1), Selective (MT2), Enhanced Diamond (MT3) 18 Bảng 3.2: Kết mô so sánh thuật toán ước lượng chuyển động Nhận xét: Qua kết mô ta thấy nén chuỗi video kết Bitrate PSNR thuật toán ước lượng chuyển động gần nhau, khơng sai lệch q lớn Tuy nhiên nhìn vào tham số thời gian nén ta thấy tốc độ nén thuật tốn TZ search nhanh Sau thuật toán Selective, Enhanced Diamond cuối thuật toán full search Nhưng chuỗi video RaceHorses foreman với tốc độ 30frame/second thuật tốn Enhanced Diamond lại thể vượt trội Bitrate thời gian nén Từ q trình mơ kết thuật toán TZ search thể hiệu nén tốt nhất, dù không đạt hiệu tốt chuỗi video 19 b Đề xuất phương pháp cải thiện thời gian mã hóa cho thuật tốn TZ search Cụ thể, ngồi khoảng cách vịng tìm kiếm tăng theo bội số chuẩn HEVC, luận văn thử nghiệm với khoảng cách tìm kiếm vịng tìm kiếm tăng theo bội số Thử nghiệm thực chuỗi video có độ phân giải cao với độ dài 300 khung hình Kết thể bảng 3.4 Kết đo trung bình 300 khung hình VIDEO PSNR Time Bits Dist = Dist = Dist = Dist = Dist = Basketball 34.1612 34.1560 82.6266 69.786 16293.973 16292.346 BQMall 33.9312 33.9257 65.1933 63.8 16078.373 16083.653 PartyScene 30.6911 30.6951 91.2066 76.3933 37105.28 RaceHorses 32.9212 32.9212 90.9066 91.3 Dist = 37038.506 33622.266 33628 Bảng 3.3: Kết mô sau thay đổi Dist Kết sau thay đổi dist từ lên 3: - BasketballDrill giảm xấp xỉ 15% thời gian mã hóa - BQMall giảm 2.13% thời gian mã hóa - PartyScene giảm 16.2% thời gian mã hóa(giảm cao nhất) - Video RaceHorse tăng nhẹ 0.5% - Thông số cịn lại PSNR Bits khơng thay đổi q nhiều Đây kết chấp nhận 3.4 Kết luận Chương trình bày kết so sánh thuật toán ước lượng chuyển động, thông qua tham số thời gian nén, số bit dùng để nén video, tỉ lệ tín hiệu nhiễu đỉnh (PSNR) từ tìm thuật tốn có hiệu tốt TZ search Ngồi ra, luận văn đề xuất cải thiện thuật toán TZ searh để giảm thời gian mã hóa 20 KẾT LUẬN VÀ KIẾN NGHỊ Kết đạt Luận văn trình bày tổng quan q trình mã hóa giải mã video Nguyên lý hoạt động thuật toán ước lượng chuyển động nay, phát triển thuật tốn Qua q trình mơ mã hóa video dùng phần mềm mã nguồn mở HM, luận văn so sánh đặc điểm thuật toán ước lượng chuyển động, đánh giá ưu nhược điểm thuật toán lựa chọn thuật toán tối ưu Dựa vào kết tiếp tục nghiên cứu đề xuất cải thiện thuật toán TZ search đạt kết Sau thay đổi thông số đầu vào kết cho thấy thời gian mã hóa giảm so với ban đầu Hạn chế Kết sau cải thiện thuật toán TZ search tốt Tuy nhiên với số lượng bốn video để mô chưa đủ có liệu tăng nhẹ so với ban đầu cho thấy việc cải thiện thuật tốn chưa hồn chỉnh Cần tiếp tục nghiên cứu phát triển thêm Hướng phát triển Kết thúc luận văn với kết nghiên cứu thu làm tiền đề cho nghiên cứu cải thiện thuật toán ước lượng chuyển động sau xa đề xuất thuật toán ước lượng chuyển động có hiệu suất cao so với thuật tốn trước mặt thời gian tìm kiếm chất lượng hình ảnh ... nén Đối tượng phạm vi nghiên cứu: 4.1 Đối tượng nghiên cứu: - Đối tượng nghiên cứu đề tài thuật toán ước lượng chuyển động video 4.2 Phạm vi nghiên cứu: - Nghiên cứu đánh giá hiệu số thuật toán... làm nội dung nghiên cứu cho luận văn Đây chủ đề cấp thiết cho việc ứng dụng truyền video mạng viễn thông đa môi trường hệ Tổng quan vấn đề nghiên cứu: Trên thực tế, có nhiều nghiên cứu thuật tốn... Search Algorithm), thuật tốn cải tiến khác Mục đích nghiên cứu: - Nghiên cứu số chuẩn nén video ứng dụng rộng rãi bao gồm MPEG H.26x - Nghiên cứu số thuật toán ước lượng chuyển động áp dụng chuẩn

Ngày đăng: 15/04/2022, 10:59

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w