Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 39 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
39
Dung lượng
1,53 MB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ──────── * ─────── BÁO CÁO MÔN: XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN Đề 18: ‘Đồng tích hợp liệu audio - video’ Sinh viên thực hiện: Nguyễn Việt Anh 20121230 CNTT-TT 1.01 K57 Nguyễn Hoàng Tùng 20122745 CNTT-TT 1.02 K57 Vũ Quang Đại 20121475 CNTT-TT 1.02 K57 Giáo viên hướng dẫn: PGS.TS Nguyễn Thị Hoàng Lan Hà Nội, tháng năm 2016 PHÂN CÔNG CÔNG VIỆC Vũ Quang Đại Tìm hiểu chung kĩ thuật đồng tích hợp liệu audio – video định dạng file video Nguyễn Hoàng Tùng Tìm hiểu cấu trúc file : *.avi Giải thích đồng tích hợp liệu audio – video cấu trúc file *.avi Nguyễn Việt Anh Tìm hiểu thuật toán đồng audio – video trình diễn file *.avi thời gian thực thử nghiệm đánh giá kết MỤC LỤC Nội dung TÌM HIỂU ĐỒNG BỘ TÍCH HỢP AUDIO – VIDEO TRONG FILE VIDEO I TỔNG QUAN VỀ ĐỒNG BỘ ĐA PHƯƠNG TIỆN 1.1 Khái niệm chung………………………………………………………………………………………………………………… 1.2 Phân loại CÁC NGUYÊN TẮC ĐỒNG BỘ 2.1 VỀ PHƯƠNG DIỆN THỜI GIAN 2.2 Về phương diện cảm thụ CÁC MÔ HÌNH ĐỒNG BỘ 3.1 MÔ HÌNH DÒNG THỜI GIAN (TIMELINE) .5 3.2 Mô hình điểm tham chiếu (Reference point)………………………………………………………………………………… 3.3 Đồng dựa kiện ……………………………………………………………………………………………………… 3.4 Đồng audio -video thời gian thực nơi nhận…………………………………………………………………………….6 3.5.Tích hợp audio –video DÒNG CƠ SỞ ĐÓNG GÓI (PACKETIZED ELEMENTARY STREAM) 4.1 DÒNG CƠ SỞ ( ELEMENTARY STREAM) 4.2 Giới thiệu chung dòng sở đóng gói II TIM HIỂU CẤU TRUC FILE *.AVI 18 RIFF FILE FORMAT 18 AVI RIFF FORM .19 AVI MAIN HEADER III .20 AVI Stream Headers 20 Stream data (‘movi’ list) 21 AVI Index Entries 22 Các cấu trúc 23 TIM HIỂU CONG CỤ VA THỬ NGHIỆM .32 PHẦN MỀM AUDIO VIDEO SYNCHRONIZER 32 GIAO DIỆN CHÍNH VÀ CÁC BƯỚC ĐỒNG BỘ AUDIO-VIDEO VỚI AUDIO VIDEO SYNCHRONIZER 32 IV TAI LIỆU THAM KHẢO 38 I Tìm hiểu đồng tích hợp audio – video file Video Tổng quan đông đa phương tiện 1.1 Khái niệm chung Đồng đa phương tiện bao gồm việc định nghĩa thiết lập mối quan hệ thời gian kiểu phương tiện Nó áp dụng lĩnh vực phim ảnh, ghi băng từ, đĩa, trình diễn đặc biệt ứng dụng truyền thông đa phương tiện hội nghị truyền hình, đào tạo điện tử… Khi dòng kết hợp với nhau, ràng buộc mặt thời gian chặt chẽ Ví dụ: Bộ trộn tín hiệu audio số đòi hỏi mẫu phải đến trùng với xung nhịp đồng hồ Trong trình thể hiện, ràng buộc chặt chẽ giới hạn cảm thụ người cho phép có sai số định mặt thời gian Sai số cho phép trình tạo, trình diễn chuyển đổi gọi khả chiu lỗi thành phần Một điểm đáng ý khả chịu lỗi trình trình diễn phụ thuộc vào kiểu phương tiện nội dung Ví dụ: Lỗi định thời dòng audio dễ nhận so với dòng video khả chịu lỗi dòng audio audio kết hợp với nội dung trực quan khác video đồ hoạ 1.2 Phân loại Có kiểu đồng : - Đồng liên tục: đồng bám liên tục theo thời gian, ta phải luôn theo dõi, điều chỉnh luồng dòng - Đồng điểm : đồng khối liệu thời điểm tham chiếu Các nguyên tắc đồng 2.1 Về phương diện thời gian Ràng buộc mặt thời gian thuộc tính vốn có (ví dụ tốc độ lấy mẫu ảnh hưởng đến việc định thời dòng audio ) kết trình kết hợp nhiều phương tiện khác Vấn đề đặt đồng đa phương tiện thoả mãn phần: cung cấp (producer), tiếp nhận (consumer) biến đổi (transformer) Như vậy, môt hệ thống đa phương tiện kết hợp thành phần kết nối với nhaumột mạng thành phần (component network) - kết nối mang giá trị phương tiện (media value) từ thành phần sang thành phần khác Dùng khung nhìn (view) hệ đa phương tiện, ta liên hệ đồng với số đo định thời thành phần mạng Số đo lấy môt thành phần phương tiện đơn lẻ (một khung hình mẫu…) đến rời cổng (port) Mỗi số đo bao gồm nhãn thời gian (timestamp) cho phần tử cổng giá trị tham chiếu (reference value) Giá trị lấy từ thân dòng, giá trị thứ hai từ tín hiệu tham chiếu (reference signal) gắn với cổng Trong thực tế, nhãn thời gian đặt cách đo lường (sử dụng đếm byte, đếm số phần tử) vào mã thời gian(time code) nhúng dòng giá trị tham chiếu thường lấy từ nguồn bên đồng hồ hệ thống… 2.2 Về phương diện cảm thụ Đồng đa phương tiện đảm bảo làm trơn hiệu ứng trễ điều khiển phối hợp thời gian trình diễn đồng thời dòng liệu đa phương tiện để thỏa mãn độ cảm thụ audio-video Các mô hình đồng 3.1 Mô hình dòng thời gian (Timeline) Các hành động xác định thời điểm bắt đầu, thực đồng bám theo thời gian tồn đối tượng Mô hình sử dụng dòng thời gian tổng thể Đồng bám liên tục theo dòng thời gian, yêu cầu cần phải có đồng đồng hồ Mô hình cho chất lượng cao có yêu cầu chi phí cao 3.2 Mô hình điểm tham chiếu (Reference point) Trong mô hình thời điểm tham chiếu hay điểm đồng xác định bên thời gian tồn đối tượng đa phương tiện, thời điểm thực đồng thời gian dòng liệu đa phương tiện để trình diễn (player) Mô hình dùng nhãn thời gian đánh dấu bên đối tượng thời điểm cần đồng Tuy nhiên thời điểm cần đồng điểm bắt đầu hay kết thúc đối tượng mà nằm đối tượng bị phân mảnh 3.3 Đồng dựa kiện Ở hành động, thao tác bắt đầu kết thúc thời điểm xác định Ví dụ: ứng dụng tương tác, việc ấn nút, kích hoạt menu làm hiển thị lên hình ảnh chơi đoạn audio số…Ở ta muốn hình ảnh xuất lúc âm phát 3.4 Đồng audio -video thời gian thực nơi nhận Mô hình thiết lập lại quan hệ thời gian gói liệu audio – video để trình diễn liên tục, cảm thụ trung thực nơi nhận so với nguồn, kỹ thuật đồng tín hiệu audio video 3.5 Tích hợp audio –video Sự kết hợp, bổ sung vào hệ thống có loại liệu, ứng dụng trình diễn thể đa phương tiện (tích hợp định dạng file, vào định dạng Web, tích hợp vào CSDL…) Dòng sở đóng gói (packetized elementary stream) 4.1 Dòng sở ( Elementary Stream) Tín hiệu video số dạng thức CCIR-601 (tiêu chuẩn truyền hình số bản) sau nén MPEG có dạng dòng liệu video sở (Elementary Stream ES) Dòng ES chứa thông tin cần thiết để khôi phục lại hình ảnh ban đầu Tương tự, tín hiệu audio số dạng thức AES/EBU (Tần số lấy mẫu 48kHz, 24bit/mẫu, tốc độ bít 1152kbps) mã hóa thành dòng sở audio (audio ES) Dòng sở tín hiệu gốc đầu mã hóa chứa thông tin cần thiết để giúp giải mã tái tạo lại hình ảnh, âm ban đầu Tín hiệu video sau qua mã hóa hai chiều, cho kết thông tin vector chuyển động, bảng lượng tử, liệu không gian Những liệu sau mã hóa phương thức khác trộn vào thành dòng sở Dữ liệu sau ghép (mux) nhiều hay tùy vào lượng thông tin có ảnh Nhưng tốc độ bit dòng sở không đổi nhờ qua đệm Bộ đệm có khả cảm nhận tốc độ liệu để điều khiển tốc độ mã hóa liệu đầu vào Tốc độ dòng qui định thiết bị đồng hồ yêu cầu (demand clock) Đồng hồ kênh truyền thiết bị lưu trữ định Hình thành dòng sở Cấu trúc dòng sở mô tả sau: Đầu tiên tập hợp hợp hệ số biểu diến khối DCT Sáu tám khối DCT tạo nên macro block Ở ảnh B ảnh P macro block tương ứng với vector bù chuyển động Một số macro block tạo thành lát ảnh (slice) biểu thị sọc ngang hình ảnh từ trái sang phải Tập hợp lát ảnh tạo thành ảnh, ảnh cần biết giá trị cờ I/P/B để biết loại ảnh tương ứng Một số ảnh tạo thành nhóm ảnh (GOP - Group of Picture) Một nhóm ảnh bắt đầu ảnh I, hai ảnh I liền số ảnh P có thêm ảnh B Một tập hợp nhóm ảnh tạo thành đoạn liệu video Bắt đầu chuỗi video 4.2 Giới thiệu chung dòng sở đóng gói Do dòng liệu sở liên tục, có chiều dài tùy thuộc vào lượng liệu đưa vào mã hóa, để truyền với độ tin cậy cao, dòng ES đóng gói thành dòng sở đóng gói ( Packetized Elementary Stream - PES ) Mỗi gói PES gồm tiêu đề liệu dòng sở Dòng sở video Đóng gói Video PES Đóng gói Audio PES (Video ES) Dòng sở audio (Audio ES) Hình 2.1: Dòng sở đóng gói Start code Stream ID PTS DTS Hình 2.2: Cấu trúc gói PES Data Dòng sở video dòng bit liên tục mang thông tin hình ảnh Trong việc lưu trữ truyền dẫn thích hợp nhiều sử dụng khối liệu rời rạc, dòng sở đóng gói tạo thành dòng sở đóng gói PES (packetized elementary stream) Tương tự vậy, liệu audio cần đóng gói Cấu trúc gói mô tả hình 2.2 Gói bắt đầu phần tiêu đề chứa mã bắt đầu gói mã để phân biệt loại liệu chứa gói Ngoài có thêm số nhãn thời gian để đồng với giải mã hình ảnh thời gian thực đồng với âm Hình 2.3 nhãn thời gian thực chất lấy mẫu trạng thái đếm điều khiển đồng hồ 90kHz Đồng hồ có nhờ chia tần đồng hồ chủ 27MHz cho 300 Có hai loại nhãn thời gian nhãn thời gian trình diễn PTS (presentation time stamp) nhãn thời gian giải mã DTS (decode time stamp) Nhãn thời gian trình diễn dùng để xác định hình ảnh thể ảnh, nhãn thời gian giải mã xác định hình ảnh giải mã Trong mã hóa hai chiều, nhãn thời gian không khác 27 MHz Encoder clock : 300 90 kHz 33-bit count Time stamp Hình 2.3: Nhãn thời gian Gói liệu âm có nhãn thời gian trình diễn Vì có đồng âm thanh, dòng liệu audio video phải gán nhãn từ đếm Một minh họa cho hình 2.4 Nhóm ảnh bắt đầu ảnh I, sau ảnh P gửi trước ảnh B1 B2 Ảnh P phải giải mã trước B1 B2 giải mã Tại thời điểm có ảnh giải mã, ảnh I giải mã thời điểm N phải tới thời điểm N+1 thể ảnh Khi ảnh I thể ảnh P1 giải mã P1 lưu giữ RAM 24 - AVIF_MUTSUSEINDEX :chỉ ứng dụng nên sử dụng số xếp chunk tệp tin để xác định thứ tự trình bày liệu - AVIF_WASCAPTUREFILE : file avi file đặc biệt định để thu video thời gian thực ứng dụng nên cảnh báo người dùng trước ghi lên file với cờ người sử - dwInitialFrames : xác định khung hình ban đầu tệt tin xen kẽ tệp tin ko xen kẽ nên để giá trị Nếu bạn tạo tệp tin xen kẽ, định rõ số khung hình trước tới khung hình ban đầu - dwStreams : số Stream tệp tin - dwSuggestedBufferSize : định kích thước đệm đề nghĩ để đọc file - dwWidth : Chỉ định chiều rộng tập tin AVI theo pixel - dwHeight : Chỉ định chiều cao tập tin AVI theo pixel - dwReserved : dành riêng Thiết lập mảng không 25 AVISTREAMHEADER : chứa thông tin stream file avi - fcc : mã FOURCC Giá trị ‘strh’ - cb : kích thước cấu trúc, không bao gồm byte ban đầu - fccType : chứa mã FOURCC loại liệu dòng Các giá trị tiêu chuẩn : ‘auds’ dòng âm (audio stream), ‘mids’ dòng MIDI, ‘txts’ dòng văn bản, ‘vids’ dòng hình ảnh( video stream) - fccHandler chứa mã Fourcc định danh kiểu xử lý liệu việc xử lý liệu ưu tiên cho dòng Đối với dòng video audio, điều quy định cụ thể codec để giải mã dòng - dwFlags : chứa cờ cho dòng liệu giá trị: AVISF_DISABLED: cho biết dòng không nên cho phép mặc định AVISF_VIDEO_PALCHANGES: cho biết dòng video chứa thay đổi bảng màu Cờ cảnh báo phần mềm phát lại cần phải tạo hiệu ứng bảng màu 26 - wPriority : xác định ưu tiên loại dòng.ví dụ tệp tin có nhiều dòng âm thanh, dòng với ưu tiên cao dòng mặc định - wLanguage: ngôn ngữ tag - dwInitialFrame: xác định khoảng cách liệu âm thang bị lệch phía trước tệp tin xen kẽ.thông thường 0,75s - dwScale: sử dụng với dwRate để định quy mô thời gian dòng sử dụng chia dwRate cho dwScale cho số lượng mẫu s dòng video, tỉ lệ khung hình Trong dòng audio, tỉ lệ tương ứng với thời gian cần để mở nBlockAlign bytes audio - dwRate : xem dwScale - dwStart : định thời gian bắt đầu cho dòng Các đơn vị định nghĩa dwRate vad dwScale Thông thường,có giá trị 0, định thời gian trễ cho dòng không bắt đầu đông thời với file - dwLength: xác định độ dài dòng Các đơn vị định nghĩa dwRate dwScale - dwSuggestedBufferSize: xác định độ lớn đệm nên sử dụng để đọc dòng Thông thường,nó chứa giá trị tương ứng để thể chunk lớn dòng - dwQuality: xác định số chất lượng liệu dòng Có giá trị từ đến 10000 Đối với việc nén liệu, thường đại diện cho giá trị tham số qua phần mềm nén Nếu giá trị -1, điều khiển sử dụng giá trị chất lượng mặc định - dwSampleSize: kích thước mẫu đơn liệu thiết lập mẫu có kích thước khác Nếu giá trị khác 0, sau nhiều mẫu liệu nhóm vào chunk dơn file Nếu giá 27 trị 0, mẫu liệu (ví khung hình) phải ỏ chunk riêng biệt dòng video, giá trị thông thường 0, măc dù khác tất khung hình có giá trị Với dòng âm thanh, giá trị nên giống nBLockAlign cấu trúc WAVEFORMATEX BITMAPINFO chứa thông tin kích thước định dạng máu sắc thiết bị độc lập bitmap (device-independent bitmap (DIB)) Cú pháp: - biSize: số byte yêu cầu cấu trúc Giá trị không bao gồm kích thước bảng màu hay kích thước mặt nạ màu sắc chúng thêm vào cuồi cấu trúc - biWidth: xác định độ rộng bitmap tính pixel biHeight: xác định chiều cao bitmap tính pixel biPlanes: số sơ đồ cho thiết bị mục tiêu Giá trị phải - biBitCount xác định số bit pixel(bpp) Với dạng không nén, giá trị số trung bình số bit pixel Với dạng nén, ngụ ý độ sâu ảnh không nén sau ảnh giải mã - biCompression: với video nén dạng YUV, mã FOURCC.với 28 dạng không nén có giá trị sau: BI_RGB: không nén RGB BI_BITFIELDS: RGB không nén với mặt nạ màu sắc có hiệu lực với 16 - bpp 32 - bpp - biSizeImage: kích thước ảnh tính byte.có thể đặt với bitmap RGB không nén - biYPelsPerMeter: xác định độ phân giải theo chiều dọc, tính pixel mét thiết bị mục tiêu cho bitmap - biClrUser: định số lượng số màu bảng sử dụng bitmap biClrImportant:chỉ định số lượng màu coi quan trọng hiển thị bitmap Nếu tất màu sắc quan trọng WAVEFORMATEX :định nghĩa dạng liệu âm thang dạng sóng Cú pháp - wFormatTag: loại âm dạng sóng nChannels: số kênh liệu âm thang dạng sóng nSamplesPerSec: số mẫu giây(Hz) - nAvgBytesPerSec: tỉ lệ truyền liệu trung bình đơn vị byte/s nBlockAlign: - wBitsPerSample: số bit mẫu cho loại wFormatTag cbSize: 29 AVIPALCHANGE: định nghĩ thay đổi dảng màu file avi Cú pháp: - bFirstEntry: số mầu sắc thay đổi - bNumEntries: số màu sắc thay đổi thay đổi tất 256 giá trị wFlags: dự trữ - peNew: định mảng cấu trúc PALETTEENTRY - fcc: mã FOURCC ‘idx1’ - cb: kích thước cấu trúc, không bao gồm byte ban đầu aIndex: mảng cấu trúc có biến sau đây: dwChunkId: mã FOURCC định danh dòng file avi Mã FOURCC phải có dạng ‘xxyy’: xx số thứ tự dòng yy kí tự định dang nội dung dòng: - db: khung hình không dược nén dc: khung hình nén - pc: htay đổi bảng màu wb: liệu âm - dwlags: có giá trị kết hợp từ nhiều cờ sau: AVIF_KEYFRAME: chunk liệu mổ khung chiều khóa AVIF_LIST: chunk liệu danh sách ‘rec’ - AVIF_NO_TIME: chunk liệu không làm ảnh hưởng đến định 30 dòng - dwOffset: vị trí chunk liệu file Giá trị nên đặt khoảng trống tính bảng byte tính từ bắt đầu danh sách ‘movi’; nhiên vài file avi đặt khoảng trống tính từ bắt đầu file - dwSize: kích thước chunk liệu tính bàng byte AVIMETAINDEX: cấu trúc cho số avi 2.0 Cấu trúc - fcc: mã FOURCC giá trị ‘indx’ ‘nnix’, nn số thứ tự dòng cb: kích thước cấu trúc,không bao gồm byte ban đầu wLongsPerEntry: kích thước mục đơn vị 4byte - bIndexSubType: số loại Ý nghĩa phụ thuộc vào giá trị bIndexType bIndexType: loại số - nEntriesInUse: số mục có hiệu lực mảng adwIndex - dwChunkId: mã FOURCC xác định đối tượng lấp mục đối tượng lập mục dòng, có giá trị dwChunkId cấu trúc AVIOLDINDEX - dwReserved: có ý nghĩ phụ thuộc vào loại số 31 - adwIndex: mảng mục định dạng liệu phụ thuộc vào loại số 32 III Tìm hiểu công cụ thử nghiệm Phần mềm Audio Video Synchronizer Audio Video Synchronizer dùng để đồng hóa âm video phim Chương trình tách dòng thời gian video audio riêng biệt So sánh âm hình miệng người nói,hoặc phụ đề nhận không đồng phim,nếu âm phát trước video chỉnh âm lùi lại,hoặc âm phát sau video điều chỉnh âm phía trước Có thể chọn nhiều điểm đồng để đoạn phim đồng tốt Cho phép biết thay đổi thời gian bắt đầu kết thúc audiovideo Chúng ta xem trước đoạn phim vừa chỉnh sửa,nếu tốt vấn đề lưu lại đoạn phim theo định dạng Chương trình hỗ trợ định dạng video AVI, WMV, MPG, ASF, DAT, MPEG Và xuất hai định dạng chuẩn AVI, WMV Nếu có cài đặt giải mã đọc định dạng DIVX, XVID, DV, MKV, OSM, FLV, MP4… xuất nhiều định dạng khác Vì chương trình xem chương trình chuyển đổi định dạng video Đây phần mềm có quyền, thông tin phần mềm có tại: http://www.weqsoft.com/audio-video-synchronizer.htm Giao diện bước đồng audio-video với Audio Video Synchronizer 33 2.1 Giao diện Hình 1: giao diện Audio Video Synchronizer 34 2.2 Các bước đồng audio-video với Audio Video Synchronizer Bấm vào nút Open Video để chọn đoạn phim cần chỉnh sửa Sau chọn video chương trình mởi đoạn video lên thao tác play, pause, stop, dùng chuột di chuyển bấm vào Skip forward hay Skip backward để dịch tời đoạn video tới điểm cần thiết So sánh giọng nói với môi người nói với phụ đề để đồng Nếu âm phát trước video bấm vào Audio skip forward để điều chỉnh âm phía trước (chậm lại), âm phát chậm so với hình ảnh bấm vào Audio skip backward để điều chỉnh âm phát nhanh lên Bấm nút Skip backward để lặp lại cảnh gần cuối bạn chỉnh lại thay đổi thời gian âm video cảnh nhiều lần Nhấp vào nút Original audio để thiết lập lại âm cần thiết Nếu cảm thấy vị trí đồng âm hình ảnh bấm vào Add a synchronization point to the list để thêm điểm đồng vào danh sách Có có nhiều điểm đồng tốt nên có ba điểm đồng lúc bắt đầu kết thúc đoạn phim Có thể thay đổi điểm đồng bộ: bấm nút Edit để thay đổi thời gian video, audio điểm đồng Bấm Delete để xóa điểm đồng bộ, hoăc bấm Clearall để xóa list điểm đồng Hình 2: Edit điểm đồng 35 Chúng ta load list điểm đồng sẵn có bấm vào Load sync list lưa list mà đồng bấm nút Save sync list Bấm vào Calculate start button để thiết lập Video start time Audio start time tự động Bấm vào Calculate end button để thiết lập Video end time Audio end time tự động Chương trình cho biết tổng thời gian ban đầu video audio (Original video duration, Original audio duration) , thời điểm bắt đầu, kết thúc audio video ( Video(Audio) start time, Video(Audio) end time) Ở nhập vào thời gian bắt đầu, kết thúc âm hình ảnh Preview cho xem thử kết trình chỉnh sử Hình 3: preview 36 Sau xem thử đạt yêu cầu vào Options để tùy chọn đầu đoạn phim Chọn định dạng đầu WMV: - Output File: chọn thư mục lưu video xuất - Resolution: chọn kích thước cho video,mặc định kích thước ban đầu video, chọn kích thước khác custom size khác - Frame rate: tốc độ khung hình - Resize mode: + Preserve aspect ratio: thay đổi kích thước giữ tỷ lệ video (không bị vỡ hình) + Stretch: video giãn theo chiều theo ý muốn( bị vỡ hình) không nên dung - Video(Audio) compressor: cho chọn chuẩn nén video, audio - Play control để cài đặt thời dịch chuyển video, audio player chương trình ta ấn nút Skip foward(backward) hay Audio skip foward(backward) 37 Hình 4: Output options 38 IV Tài liệu tham khảo - http://www.yodot.com/avi-repair/audio-video-sync-problems-in-avifiles.html - http://www.ezr8.com/avi.html - http://howto-pages.org/ffmpeg/ - Slide, giảng môn học [...]... điểm đồng bộ vào danh sách Có thế có nhiều điểm đồng bộ càng tốt nhưng chúng ta nên có ba điểm đồng bộ lúc mới bắt đầu ở giữa và kết thúc đoạn phim Có thể thay đổi các điểm đồng bộ: bấm nút Edit để thay đổi thời gian video, audio điểm đồng bộ Bấm Delete để xóa điểm đồng bộ, hoăc bấm Clearall để xóa cả list điểm đồng bộ Hình 2: Edit điểm đồng bộ 35 Chúng ta cũng có thể load một list các điểm đồng bộ sẵn... trình chuyển đổi định dạng video Đây là phần mềm có bản quyền, thông tin phần mềm có tại: http://www.weqsoft.com /audio- video- synchronizer.htm 2 Giao diện chính và các bước đồng bộ audio- video với Audio Video Synchronizer 33 2.1 Giao diện chính Hình 1: giao diện chính Audio Video Synchronizer 34 2.2 Các bước đồng bộ audio- video với Audio Video Synchronizer 1 Bấm vào nút Open Video để chọn đoạn phim cần... mềm Audio Video Synchronizer Audio Video Synchronizer được dùng để đồng bộ hóa âm thanh và video của bộ phim Chương trình có thể tách dòng thời gian của video và audio riêng biệt So sánh âm thanh và khẩu hình miệng của người nói,hoặc phụ đề chúng ta có thể nhận ra được sự không đồng bộ của bộ phim,nếu âm thanh được phát trước video chúng ta có thể chỉnh âm thanh lùi lại,hoặc nếu âm thanh phát sau video. .. ta đồng bộ khi bấm nút Save sync list 4 Bấm vào Calculate start button để thiết lập Video start time hoặc Audio start time tự động Bấm vào Calculate end button để thiết lập Video end time hoặc Audio end time tự động 5 Chương trình cho chúng ta biết tổng thời gian ban đầu của video và audio (Original video duration, Original audio duration) , thời điểm bắt đầu, kết thúc của audio và video ( Video (Audio) ... truyền dẫn, phát sóng thực tế luôn có lỗi, trong trường hợp này ta cần phải sử dụng dòng truyền tải (Transport Stream) 17 DỮ LIỆU MÃ HOÁ ES VIDEO PES ĐÓNG GÓI VIDEO VIDEO GHÉP KÊNH CHƯƠNG TRÌNH AUDIO PES DỮ LIỆU MÃ HOÁ AUDIO AUDIO VIDEO PES AUDIO PES ES DÕNG CHƯƠNG TRÌNH ( PROGRAM STREAM ) ĐÓNG DÕNG TRUYỀN GÓI TẢI GHÉP KÊNH DÒNG TRUYỀN TẢI VIDEO PES AUDIO PES Hình 2.6: Sơ đồ mạch mã hóa MPEG ( TRANSPORT... điểm đồng bộ để đoạn phim đồng bộ tốt hơn Cho phép chúng ta biết và có thể thay đổi thời gian bắt đầu và kết thúc của audiovideo Chúng ta cũng có thể xem trước đoạn phim vừa chỉnh sửa,nếu tốt không có vấn đề gì thì có thể lưu lại đoạn phim theo các định dạng Chương trình hỗ trợ các định dạng video như AVI, WMV, MPG, ASF, DAT, MPEG Và có thể xuất ra hai định dạng chuẩn AVI, WMV Nếu có cài đặt bộ. .. Video để chọn đoạn phim cần chỉnh sửa Sau khi chọn video chương trình mởi đoạn video đó lên và chúng ta có thể thao tác play, pause, stop, dùng chuột di chuyển hoặc bấm vào Skip forward hay Skip backward để dịch tời đoạn video tới điểm cần thiết 2 So sánh giọng nói với môi người nói hoặc với phụ đề để đồng bộ Nếu âm thanh được phát trước video thì bấm vào Audio skip forward để điều chỉnh âm thanh về phía... TẢI VIDEO PES AUDIO PES Hình 2.6: Sơ đồ mạch mã hóa MPEG ( TRANSPORT STREAM ) 18 II Tìm hiểu cấu trúc file *.avi Microsoft AVI (Audio Video Interleave - âm thanh hình ảnh xen kẽ) file là 1 loại RIFF file được sử dụng trong những ứng dụng thu, sửa, xem lại audio- video kết hợp Nhìn chung, AVI file chứa nhiều dòng của những kiểu dữ liệu khác nhau Hầu hết các file avi đều sử dụng cả dòng dữ liệu tiếng... thanh phát chậm hơn so với hình ảnh thì bấm vào Audio skip backward để điều chỉnh âm thanh phát nhanh lên Bấm nút Skip backward để lặp lại cảnh gần nhất cuối cùng bạn có thể chỉnh lại thay đổi thời gian giữa âm thanh và video cùng một cảnh nhiều lần Nhấp vào nút Original audio để thiết lập lại âm thanh nếu cần thiết 3 Nếu cảm thấy tại một vị trí đã đồng bộ giữa âm thanh và hình ảnh thì bấm vào Add a... chứa một mã FOURCC chỉ ra loại dữ liệu trong dòng Các giá trị tiêu chuẩn : ‘auds’ dòng âm thanh (audio stream), ‘mids’ dòng MIDI, ‘txts’ dòng văn bản, ‘vids’ dòng hình ảnh( video stream) - fccHandler chứa một mã Fourcc định danh kiểu xử lý dữ liệu việc xử lý dữ liệu được ưu tiên cho dòng Đối với dòng video và audio, điều này quy định cụ thể các codec để giải mã các dòng - dwFlags : chứa những cờ cho dòng