1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Bài giảng nhập môn đa phương tiện

65 1,3K 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 65
Dung lượng 1,07 MB

Nội dung

Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG BỘ MÔN TRUYỀN THÔNG ĐA PHƢƠNG TIỆN BÀI GIẢNG NHẬP MÔN ĐA PHƢƠNG TIỆN Thông tin môn học : Số tín 24 : Số tiết lý thuyết : Số tiết thực hành 12 : Số tiết thảo luận Đại học : Hệ đào tạo Truyền thông đa phương tiện : Ngành đào tạo Công nghệ truyền thông Thái Nguyên, 2015 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT MỤC LỤC Chƣơng 1: Tổng quan đa phƣơng tiện 1.1 Giới thiệu chung 1.2 Một số khái niệm 1.2.1 Thế phương tiện 1.2.2 Thế đa phương tiện 1.2.3 Thế truyền thông đa phương tiện 1.3 Hoàn cảnh sử dụng Multimedia 10 1.3.1 Ứng dụng đa phương tiện 10 1.3.2 Tính hiển thị 11 1.4 Các chuẩn Multimedia thông dụng 12 1.4.1 Định nghĩa chuẩn 12 1.4.2 Vai trò chuẩn 13 1.4.3 Giới thiệu số chuẩn 14 1.5 Các vấn đề quyền tác phẩm đa phương tiện 18 1.5.1 Bản quyền 18 1.5.2 Vi phạm quyền 19 1.5.3 Kết luận 19 1.6.Tổng quan trính phát triển Multimedia 20 1.7 Quá trính phát triển sản phẩm Multimedia 21 1.8 Các yêu cầu hệ thống đa phương tiện 30 1.8.1 Các vấn đề QoS 30 1.8.2 Các phần tử quan trọng nhiệm vụ quản trị QoS 31 1.8.3 Thiết bị lưu trữ quản lý liệu multimedia 32 Chƣơng 2: Ứng dụng đa phƣơng tiện 34 2.1 Giáo dục đào tạo 34 2.2 Thông tin bán hàng 49 2.3 Y học 49 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT 2.4 Hội thảo trực tuyến 50 2.5 Giải trí 50 2.6 Các ứng dụng khác 51 Chƣơng 3: Dữ liệu văn 54 3.1 Văn – định nghĩa 54 3.2 Kỹ thuật nén văn 54 3.2.1 Nén Huffman 55 3.2.2 Nén RLE 59 3.2.3 Nén LZW 61 Chƣơng 4: Dữ liệu ảnh 66 4.1 Một số khái niệm 66 4.2 Lĩnh vực ứng dụng kỹ thuật xử lý ảnh 67 4.3 Các giai đoạn chình xử lý ảnh 69 4.4 Các phần tử hệ thống xử lý ảnh số 70 4.5 Hệ màu 74 4.5.1 Màu sắc 74 4.5.2 Mô hình màu RGB 74 4.5.3 Mô hình màu CMYK 75 4.5.4 Mô hình màu HSV 76 4.6 Thu nhận thiết bị thu nhận ảnh 77 4.7 Biểu diễn ảnh 77 4.7.1 Mô hình Raster 77 4.7.2 Mô hình Vector 78 4.8 Nén ảnh 79 4.8.1 Nén JPEG 79 4.8.2 Nén Fractal 82 Chƣơng 5: Dữ liệu âm 84 5.1 Một số khái niệm 84 5.2 Ứng dụng âm 84 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT 5.3 Kỹ thuật Audio số 85 5.4 Giới thiệu âm hệ thống xử lý âm 86 5.4.1 Âm thanh(Sound) 86 5.4.2 Đặc tình âm tương tự 88 5.4.3 Khái niệm tìn hiệu 89 5.4.4 Phân loại tìn hiệu 90 5.4.5 Phân loại hệ thống xử lý 92 5.5 Nén âm 92 5.5.1 Các phương pháp nén âm đơn giản 92 5.5.2 Nén âm dùng mô hình âm – tâm lý 93 5.5.3 Neùn aâm MPEG 94 Chƣơng 6: Dữ liệu video 96 6.1 Một số khái niệm 96 6.2 Nén video 96 6.3.1 Độ dư thừa tìn hiệu video 97 6.3.2 Nhu cầu cần thiết nén video 99 6.3.3 Khái niệm nén video 99 6.3.4 Một số kỹ thuật nén video 100 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Chƣơng 1: Tổng quan đa phƣơng tiện 1.1 Giới thiệu chung Sản phẩm công nghệ Multimedia xâm nhập ngày sâu, rộng vào lĩnh vực đời sống xã hội Có thể nói sản phẩm công nghệ có mặt khắp nơi, từ công sở đến gia đính Nó xuất nhiều lĩnh vực từ giáo dục, y tế, đến vui chơi giải trì, nghiên cứu khoa học v v Sức mạnh sản phẩm công nghệ Multimedia mang lại đa dạng phong phú dạng thông tin Người ta thu nhận, xử lý thông tin thông qua thị giác, thính giác nhờ âm thanh, hính ảnh, văn mà công nghệ Multimedia mang lại Điều làm cho hiệu thu nhận, xử lý thông tin cao so với thông tin dạng văn Ý tưởng đặt móng cho lĩnh vực công nghệ có từ năm 1945 Ông Vanner Brush ,giám đốc quan nghiên cứu phát triển khoa học chình phủ Mỹ lúc (Director ofthe office Scientific Research and Development in the US Gouverment) đưa câu hỏi là, liệu chế tạo loại thiết bị cho phép lưu trữ dạng thông tin để thay cho sách, nói cách khác chẳng nhẽ thông tin lưu trữ dạng sách? Nhận thức ý nghĩa quan trọng loại thiết bị có tình chất trên, hàng loạt nhà khoa học, công nghệ tập trung nghiên cứu Nó cở sở hay tảng công nghệ Multimedia ngày Năm 1960 Ted Nelson Andrries Van Dam công bố công trính nói kỹ thuật truy nhập liệu tên gọi Hypertext Hypermedia Kỹ thuật giữ nguyên tên sử dụng rộng rãi dịch vụ Web Internet Năm 1968 Engleband đưa hệ thống sử dụng Hypertext máy tình với tên NLS Bộ quốc phòng Mỹ thành lập tổ chức DARPA (US deference advanced Research Prọject Agency) để nghiên cứu công nghệ Multimedia Năm 1978 phòng nghiệm khổng lồ MIT Media Laboratory chuyên nghiên cứu công nghệ Multimedia thành lập Chỉ sau thời gian ngắn hoạt động, nhận thức tầm quan trọng ý nghĩa xã hội công nghệ Multimedia, người ta đầu tư gần 40 triệu USD cho phòng thí nghiệm Một loạt công ty, hãng lớn cho đời phòng nghiệm Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Multimedia AT & T, BELL, Olivity Những nỗ lực không ngừng nhà khoa học,công nghệ cho phep người ta gặt hái nhiều kết có tình chất móng cho lĩnh vực Multimedia Những kết đa nhanh chóng triển khai ứng dụng lĩnh vực truyền hính, viễn thông v.v  Dữ liệu Multimedia Thông thường thường ghi nhận thông tin dạng văn bản, văn mã hoá lưu giữ máy tình, có liệu dạng văn Một câu hỏi đặt thông tin thu nhận dạng khác âm (voice) , hính ảnh (Image) thí liệu dạng nào? Chình điều dẫn đến khái niệm ta gọi liệu Multimedia Dữ liệu Multimedia liệu dạng thông tin khác Vì dụ liệu Multimedia liệu dạng thông tin - Âm (Sound) - Hính ảnh (image) -Văn (text) - Kết hợp ba dạng Khi nghiên cứu liệu dạng thông tin trên, người ta nhận cần phải phân chia liệu Multimedia nhỏ Bởi ví liệu dạng âm thanh, hính ảnh trính "vận động" theo thời gian có tình chất khác so với dạng tĩnh Điều đòi hỏi kỹ thuật, công nghệ xử lý khác nhau.Ví lĩnh vực công nghệ Multimedia người ta chia liệu multimedia dạng: Văn (Text) Âm (sound) Audio (âm động, có điệu) Image/ Picture (Hính ảnh) Motion picture (ảnh động) Video (ảnh động kết hợp âm động) Animation (hính ảnh sử dụng theo nguyên tắc chiếu phim) Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT AVI (Audio-Video Interleaved AVI) Kết hợp dạng  Công nghệ Multimedia Một cách đơn giản công nghệ Multimedia công nghệ xử lý liệu multimedia Chúng ta cần lưu ý khái niệm xử lý liệu công nghệ thông tin bao hàm công việc sau: mã hóa, lưu trữ, vận chuyển, biến đổi, thể liệu Với ý nghĩa công nghệ Multimedia công nghệ mã hóa, lưu trữ, vận chuyển, biến đổi, thể liệu multimedia 1.2 Một số khái niệm 1.2.1 Thế phƣơng tiện Trong suốt chiều dài lịch sử, thông tin chuyển tải thông qua phương tiện Âm thanh, chẳng hạn giọng nói người, chình loại phương tiện qua nhiều kỉ trước chữ viết sử dụng rộng rãi thí nói chuyện cách thức chủ yếu để trao đổi thông tin Sau người bắt đầu kể chuyện để lại thông tin sống mính thông qua hính vẽ, tranh Sự đời chữ viết cho người phương tiện khác để diễn đạt ý nghĩ mính Ngày nay, người thường sử dụng lời nói, âm thanh, âm nhạc, văn bản, hính ảnh, đồ hoạ, hoạt ảnh video để truyền tải thông tin Những thứ tất loại phương tiện khác (thuật ngữ media số nhiều medium) phương tiện thường dùng để biểu đạt loại thông tin định Như ý nghĩa này, phương tiện đơn giản cách thức để truyền đạt thông tin 1.2.2 Thế đa phƣơng tiện Trước tiên người ta hỏi đa phương tiện ? Đa phương tiện tích hợp văn bản, âm thanh, hình ảnh tất loại phần mềm có điều khiển môi trường thông tin số Định nghĩa đa phương tiện đề cập sau Dữ liệu đa phương tiện gồm liệu : Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Văn bản; Hình ảnh; Âm thanh; Hính động Con người có nhu cầu diễn tả trạng thái minh; họ có nhiều loại hình thể Con người có nhu cầu truyền thông, cách thể đường truyền quan trọng Trên Internet thông dụng với người, đẹp trang Web phải thể nội dung hình thức Đa phương tiện có nhiều loại, phương tiện công cộng đa phương tiện: Radio, vô tuyến, quảng cáo, phim, ảnh Nhu cầu tương tác người-máy đặt hệ thống thông tin Vấn đề tương tác người-máy không quan hệ người với máy tính mà người với người Con người có vai trò quan trọng hệ thống thông tin Định nghĩa Định nghĩa đa phương tiện (theo nghĩa rộng) bao gồm phương tiện: văn bản, hình vẽ tĩnh (vẽ, chụp), hoạt hình (hình ảnh động), âm Cuối người ta định nghĩa đa phương tiện; đa phương tiện kỹ thuật mô sử dụng đồng thời nhiều dạng phương tiện chuyển hoá thông tin tác phẩm từ kỹ thuật Liên quan đến định nghĩa đa phương tiện, người ta cần lưu ý khía cạnh sau: - Thông tin cần phải số hoá, phù hợp với xu rẻ; - Phải dùng mạng máy tình, để đảm bảo truyền bá, hay truyền tải tốt; - Sử dụng phần mềm có tương tác, cho phép người dùng trao đổi với phần mềm thay đổi theo ý người dùng; - Phải thiết kế giao diện người máy phù hợp với phát triển đa phương tiện, tức giao diện người dùng đa phương tiện lưu ý nhiều năm gần 1.2.3 Thế truyền thông đa phƣơng tiện Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Kể từ lâu người khám phá thông điệp trở nên tác động (có nghĩa người nghe hiểu nhớ chúng dễ hơn) chúng biểu đạt thông qua kết hợp phương tiện khác Loại kết hợp chình ý nghĩa thuật ngữ truyền thông đa phương tiện Truyền thông đa phương tiện sử dụng nhiều loại phương tiện vào thời điểm Ví dụ: - G iáo viên sử dụng bảng đen lớp học để viết lời giải thìch cho giảng họ - S dụng phim ảnh, truyền hính kết hợp nhiều loại phương tiện (âm thanh, video, hoạt ảnh, hính ảnh tĩnh chữ) để tạo nhiều loại thông điệp khác có khả cung cấp thông tin tiêu khiển cho người theo cách thức độc đầy ý nghĩa Thế hệ truyền thông đa phƣơng tiện? Các hệ thống thông tin đa phương tiện dùng nhiều phương tiện giao tiếp khác (văn bản, liệu ghi, liệu số, đồ hoạ, hính ảnh, âm thanh, video ) Nhiều ứng dụng đa phương tiện theo ý nghĩa chúng dùng nhiều dạng Tuy nhiên, thuật ngữ “đa phương tiện” thường dùng để mô tả hệ thống phức tạp hơn, hệ thống hỗ trợ hính ảnh âm Các thông tin chủ yếu tạo bên máy tình Lời nói, nhạc, hính ảnh phim chuyển từ dạng Analog (tương tự) sang Digital (số) trước dùng ứng dụng máy tình Ngược lại, với văn bản, đồ hoạ chì phim hoạt hính tạo máy tình ví đáp ứng mục tiêu định, mở rộng ứng dụng Một hệ máy tình, mạng thông tin hay dụng cụ phần mềm hệ đa phương tiện hỗ trợ ứng dụng tương tác cho ìt dạng Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT thông tin sau, không kể văn đồ hoạ: âm thanh, hính ảnh tĩnh phim video chuyển động 1.3 Hoàn cảnh sử dụng Multimedia 1.3.1 Ứng dụng đa phƣơng tiện Trong nhiều tài liệu quảng cáo, người ta khuyếch trương vai trò đa phương tiện Chính mà người ta xem (i) đa phương tiện thuộc nhiều lĩnh vực; (ii) ngược lại, đa phương tiện khía cạnh riêng, đáng để nghiên cứu Tuy nhiều năm qua, người ta phủ nhận vai trò đa phương tiện, tức (i) văn bản; (ii) hình ảnh; (iii) âm thanh; (iv) hình động : ‰ Chương trình video theo yêu cầu VOD; ‰ Trò chơi điện tử, video; ‰ Giao dịch, thương mại điện tử; Phòng học thiết bị thực ảo Thư điện tử cao cấp có kèm hình ảnh âm Giáo dục từ xa, dạy học với trợ giúp máy tính, dạy qua sóng đài phát TV, mạng máy tính Xu học điện tử nhiều tác giả nhắc đến Các hoạt động tiến đến quyền điện tử làm việc nhà Vậy, dùng đa phương tiện ứng dụng sau: - Đào tạo máy CBT; - Mô phỏng, ví dụ lái máy bay buồng lái mô phỏng, giải phẫu từ xa; - Hiện thức ảo; - Vui chơi, học sáng tạo; - Thể đa phương tiện, chẳng hạn làm trang WEB theo đặt hàng; - Trò chơi giải trí 10 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT 2.6 Các ứng dụng khác  Công nghiệp du lịch Rất nhiều người lập kế hoạch nghỉ hè cho gia đính hàng năm phải đến đại lý du lịch hay sách quảng cáo du lịch để tím địa điểm du lịch phù hợp tài thoả mãn nhu cầu nghỉ ngơi họ Nhưng ta lập kế hoạch toàn chuyến du lịch nhà Hệ thống đa phương tiện cài đặt đại lý du lịch thông minh cho người sử dụng khả khớp nối nhu cầu du lịch họ, sau hỏi hệ thống để tìm vị trí thoả mãn Hệ thống cho lại nhiều điểm đến thoả mãn yêu cầu người sử dụng Hệ thống in toàn hành trình, chi tiết khách sạn, lịch bay  Điều tra tội phạm - Hãy xem xét điều tra với quy mô lớn cảnh sát tính hính buôn bán ma túy Thông thường, để thực thành công điều tra lực lượng cảnh sát sử dụng số lượng lớn thiết bị điện tử để thực theo dõi đối tượng nghi ngờ dình lìu đến tổ chức ma tuý Với điều tra sử dụng thiết bị để thu thập thông tin: - Cảnh sát sử dụng camera theo dõi (surveillance camera) để ghi lại hính ảnh hoạt động diễn địa điểm khác Vì dụ camera theo dõi giám sát hoạt động diễn địa điểm khoảng thời gian tương đối dài (có thể tháng) Tại địa điểm họ thu khoảng vài triệu hính ảnh Ví điều tra đòi hỏi từ 50 đến 100 camera theo dõi đặt địa điểm khác nhau, số hính ảnh video cần quản lý nhiều đáng kể Quan trọng với thúc ép pháp luật, cần thực hàng trăm điều tra địa điểm xác định khoảng thời điểm nhiều vùng khác với nhiều hính thức tội phạm tương tự điều tra ma điều tra đường dây lừa đảo, tội phạm liên quan đến tài chình, điều tra khủng bố, điều tra gián điệp… Số lượng liệu video thu theo cách phục vụ cho điều tra lớn khủng khiếp 51 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT - Một tính khác, lực lượng cảnh sát lệnh thực nghe trộm điện thoại (telephone wiretaps) địa điểm sau tập hợp lại liệu âm đàm thoại cho đáng ngờ Mặc dù số lượng cú điện thoại khác tội phạm, tổ chức tội phạm (như đường dây ma tuy) hay sử dụng liên lạc điện thoại Theo chiều hướng số lượng chuỗi âm thu khoảng thời gian từ điều tra lớn Do việc tổ chức tím kiếm liệu audio có ý nghĩa vô lớn - Ngoài tất gí trính bày trên, lực lượng cảnh sát có số lượng lớn ảnh chụp (still photographs) từ điều tra viên (có thể trính theo dõi kẻ tính nghi) Hơn nữa, điều tra tội phạm quy mô lớn phát số lượng đáng kể tội phạm với tội danh nhẹ (vì dụ hính ảnh kẻ buôn bán ma tuý lẻ bị chụp tiến hành bán ma tuý hay hành vi liên quan đến ma tuý phát mà thân có liên quan đến người ảnh) Tất hính ảnh phải lưu lại dạng kỹ thuật số, sẵn sàng cho công việc tím kiếm khai thác cần - Cảnh sát phải xem xét số lượng lớn tư liệu (document) tím nơi có liên quan đến vụ án điều tra hay vụ án khác Một lượng lớn tư liệu liên quan trực tiếp đến vụ án vào thời điểm ban đầu thí chúng không rõ ràng Khi điều tra ma tuý diễn ra, trở nên minh bạch mà ngày có nhiều mối liên hệ với chứng thu điều tra hay điều tra trước điều tra diễn thời điểm - Một tính khác, cảnh sát xâm nhập đến liệu có quan hệ cấu trúc (structured relational data) Dữ liệu dạng bao gồm, dụ liệu giao dịch ngân hàng vài tội phạm Điều đặc biệt quan trọng ví số trùm ma tuý sử dụng nhiều hính thức rửa tiền, việc “Lần theo dấu vết đồng tiền” thường khám phá nhiều điều thú vị Các liệu khác thuộc thể loại bao gồm thông tin chán ngắt danh bạ điện thoại để xác định, nhận dạng người bị tính nghi 52 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT - Cảnh sát sử dụng hệ thống thông tin địa lý (GIS) chứa đựng liệu địa lý liên quan đến điều tra ma tuý triển khai Vì dụ cảnh sát nghi ngờ tuyến đường sử dụng để vận chuyển ma tuý Để kiểm tra giả thuyết trên, họ phong toả tuyến đường (có lẽ ban đầu kiểm tra cách khắt khe tuyến đường này), theo cách làm tập trung hướng vận chuyển ma tuý Mẫu (pattern) luồng ma tuý cung cấp cho cảnh sát thông tin quan trọng vị trì đầu mối ma tuý Để thực thi chiến dịch trên, cảnh sát sử dụng hệ thống GIS để quản lý liệu địa lý Các hệ thống GIS quản lý thông thông tin bao gồm thông tin đồ đường đi, thông tin thu địa hính vùng lân cận thủ phủ núi (như Medellin, Colombia) Nhận thức địa hính hính thức sử dụng phương tiện để vận chuyển ma tuý mang lại cho cảnh sát đầu mối có giá trị để xác định tuyến đường qua địa hính có khả vùng hoạt động tội phạm 53 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Chƣơng 3: Dữ liệu văn 3.1 Văn – định nghĩa  Văn túy - Đây khuôn mẫu sở nhất, văn túy bao gồm ký tự chữ số, hầu hết biểu diễn mã ASCII (American Standard Code for Information Interchange) Sử dụng ASCII bit ASCII bit sử dụng thêm bìt parity cho văn tiếng Anh - Ký tự biểu diễn nhất, mục (item) văn ký tự hay từ, dễ nhận biết Không gian lưu trữ trung bính - Khó khăn truy tím tài liệu text: Các tài liệu text thuộc tình cố định ghi CSDL truyền thống Các từ (word) hay thuật ngữ (term) có nhiều nghĩa  Văn có cấu trúc - Phần lớn tài liệu văn có cấu trúc, bao gồm tiêu đề, chương, mục, đoạn… - Có nhiều chuẩn khuôn mẫu mã hóa thông tin cấu trúc Thì dụ, khuôn mẫu hay sử dụng chương trính xử lý văn SGML (Standard General Markup Language), ODA (Office Document Architecture), LaText PDF (Portable Document Format) - Thông thường, file header sử dụng để khuôn mẫu tài liệu Khi biết khuôn mẫu tệp, trìch trọn thông tin cấu trúc để truy tím văn Thì dụ, từ hay thuật ngữ xuất tiêu đề hay tên chương mục quan trọng từ text Do vậy, có trọng lượng lớn tiến trính mục tím kiếm 3.2 Kỹ thuật nén văn  Mặc dù dung lượng lưu trữ văn tương đối ìt so với loại liệu khác liệu âm thanh, video, có nhu cầu nén văn cần lưu trữ nhiều tệp  Đặc trưng chình văn nén nén không mát thông tin, có nghĩa khôi phục chình xác văn trước nén 54 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT  Có thể nén văn ví có nhiều ký tự xuất thường xuyên số ký tự khác hay số ký tự xuất liên tục văn Thì dụ phương pháp nén văn bản: Huffman, RLE LZW 3.2.1 Nén Huffman  Nguyên tắc Phương pháp mã hóa Huffman phương pháp dựa mô hính thống kê Dựa vào liệu gốc, người ta tình tần suất xuất ký tự Việc tình tần suất thực cách duyệt tệp gốc từ đầu đến cuối Việc xử lý tình theo bit Trong phương pháp này, người ta gán cho ký tự có tần suất cao từ mã ngắn, ký tự có tần suất thâp từ mã dài Nói cách khác, ký tự có tần suất cao gán mã ngắn ngược lại Rõ ràng với cách thức này, ta làm giảm chiều dài trung bính từ mã cách dùng chiều dài biến đổi Tuy nhiên, số tính tần suất thấp, ta không thu lợi chút nào, chí bị thiệt ìt bit  Thuật toán nén Thuật toán gồm bước chình: - Bước 1: tính tần suất ký tự liệu gốc Duyệt tệp gốc cách từ đầu đến cuối để xây dựng bảng mã Tiếp sau xếp lại bảng mã theo thứ tự tần suất giảm dần - Bước 2: mã hóa Duyệt bảng tần suất từ cuối lên đầu để thực ghép phần tử có tần suất thấp thành phần tử Phần tử có tần suất tổng tần suất thành phần Tiến hành cập nhật lại bảng đương nhiên loại bỏ phần tử xét Quá trính lặp lại bảng phần tử Quá trình gọi trình tạo mã Huffman việc tập hợp tiến hành nhơ nhị phân với nhánh Phần tử có tần suất thấp bên phải, phần tử bên trái Với cách tạo này, tất bit liệu/ ký tự nút lá, nút nút tổng hợp Sau tạo xong, người ta tiến hành gán mã cho nút Việc mã hóa đơn giản: lần xuống bên phải ta thêm bit “1” vào từ mã, 55 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT lần xuống bên trái ta thêm bit “0” Tất nhiên làm ngược lại, có giá trị mã thay đổi tổng chiều dài không đổi Cũng chình ví lý mà có tên gọi mã Huffman Quá trình giải nén tiến hành theo chiều ngược lại đơn giản Người ta phải dựa vào bảng mã tạo giai đoạn nén  Ví dụ Một tệp liệu mà tần suất ký tự cho bởi: Ký tự Tần suất “1” 152 “2” 323 “3” 412 “4” 226 “5” 385 “6” 602 “7” 92 “8” 112 “9” 87 “0” 1532 “.” 536 “+” 220 “-” 315 “” 535 Bảng tần suất xếp theo thứ tự giảm dần: Ký tự Tần suất Xác suất “0” 1532 0.2770 “6” 602 0.1088 “.” 536 0.0969 “” 535 0.0967 “3” 412 0.0746 56 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT “5” 385 0.0696 “2” 323 0.0585 “-” 315 0.0569 “4” 226 0.0409 “+” 220 0.0396 “1” 152 0.0275 “8” 112 0.0203 “7” 92 0.0167 “9” 87 0.0158 Lưu ý rằng, phương pháp Huffman, mã ký tự không mã phần bắt đầu mã khác Ví vậy, đọc tệp nén bit từ đầu đến cuối ta duyệt mã lá, tức ký tự giải nén Cây mã Huffman Bảng từ mã gán cho ký tự mã hóa Huffman: Ký tự Từ mã “0” 10 “6” 010 57 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT “.” 001 “” 000 “3” 1110 “5” 1100 “2” 0111 “-” 0110 “4” 11110 “+” 11011 “1” 111111 “8” 111110 “7” 110101 “9” 110100  Thuật toán giải nén - Bước 1: Đọc bit tập tin nén duyệt nhị phân xác định hết Lấy ký tự ghi tệp giải nén - Bước 2: Trong chưa hết tập tin nén thực bước một, ngược lại thực bước - Kết thúc thuật toán  Ƣu nhƣợc điểm: Ưu điểm: Thuật toán Huffman có ưu điểm hệ số nén tương đối cao, phương pháp thực tương đối đơn giản, đòi hỏi nhớ, xây dựng dựa mảng bé 64KB Nhược điểm: - Mã Huffman thực biết tần suất xuất ký tự - Mã Huffman giải độ dư thừa phân bố ký tự 58 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT - Huffman tĩnh đòi hỏi phải xây dựng nhị phân sẵn chứa khả Điều đòi hỏi thời gian không ta trước kiểu liệu thực nén - Quá trình giải nén phức tạp chiều dài mã trước ký tự tìm 3.2.2 Nén RLE Mã hóa loạt dài RLE phương pháp nén ảnh dựa cắt bớt dư thừa không gian (một vài hính ảnh có vùng màu lớn không đổi đặc biệt ảnh nhị phân) Loạt định nghĩa dãy phần tử điểm ảnh (pixel) liên tiếp có chung giá trị Phương pháp mã hóa loạt dài lúc đầu phát triển dành cho ảnh nhị phân văn trắng, trang in, vẽ kỹ thuật  Nguyên tắc Phát loạt bit lặp lại, dụ loạt bit nằm bit hay ngược lại, loạt bit nằm bit Vì dụ: 110000000000000011 Dãy bit lặp gọi loạt hay mạch (run) Tiếp theo, thay chuỗi chuỗi gồm thông tin: chiều dài chuỗi bit lặp (ký tự lặp) Như vậy, chuỗi thay có chiều dài ngắn chuỗi cần thay - Ví dụ: Cho chuỗi nguồn d: d= 5 5 5 5 5 19 19 19 19 19 0 0 0 23 23 23 23 23 23 23 23 Ta có chuỗi là: (10 5) (5 19) (7 0) (8 23) Tỷ số nén = 30/8 = 3.75 Đối với ảnh đen trắng sử dụng bit để biểu diễn điểm ảnh thí phương pháp tỏ hiệu - Ví dụ: Cho chuỗi nguồn: d= 000000000000000111111111100000000001111111111000000000000000 Ta có chuỗi mới: (15, 10, 10, 10, 15) 59 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Tỷ số nén = 60/(5*4) = (chỉ sử dụng bit để thể độ dài loạt giá trị loạt ví ảnh đen trắng có giá trị bit 1)  Chú ý: - Cần lưu ý rằng, liệu ảnh, chiều dài chuỗi lặp lớn 255, ta dùng byte để lưu trữ chiều dài thí không đủ Giải pháp dùng tách chuỗi thành chuỗi: chuỗi có chiều dài 255, chuỗi số bit lại - Phương pháp có hiệu chiều dài dãy lặp lớn ngưỡng hay nói cách khác ảnh cần nén phải có nhiều điểm ảnh kề có giá trị màu Do đó, phương pháp không đem lại cho ta kết cách ổn định phụ thuộc hoàn toàn vào ảnh nén, thích hợp cho ảnh đen trắng hay ảnh đa cấp xám - Ví dụ: Ta có chuỗi nguồn: d = 11 13 18 28 38 48 58 30 35 40 45 Chuỗi kết sau mã hóa: 11 18 28 38 48 58 30 35 40 45 Tỷ số nén = 14/ 28 = 0.5 Như vậy, chuỗi sau mã hóa lớn nhiều chuỗi nguồn ban đầu Do đó, cần phương pháp cải tiến để xử lý trường hợp tránh làm mở rộng chuỗi liệu nguồn nghĩa mã hóa độ dài loạt liệu lặp lại Người ta đưa cách thêm ký tự tiền tố vào trước độ dài loạt, việc giải mã thực gặp ký tự tiền tố với độ dài loạt giá trị điểm ảnh theo sau - Ví dụ: Ta có chuỗi nguồn: d= 8 8 8 8 10 10 10 10 10 10 10 10 10 Giả sử ký tự tiền tố “@” ta có chuỗi sau mã hóa: @ @ 10 Tỷ số nén = 19/9/ 2.1 60 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Tuy nhiên, số trường hợp điểm ảnh có độ tương quan với giá trị mức xám dụ ta tiến hành xử lý sau: - Ví dụ: Ta có chuỗi nguồn: d= 11 13 18 28 38 48 58 55 60 65 70 75 80 85 90 95 100 Ta dựa vào độ tương quan để có hiệu nén cao, việc áp dụng e(i) = d(i) – d(i-1) thu được: 2 2 10 10 10 10 10 -3 5 5 5 5 Áp dụng phương pháp nén RLE ta thu được: (1 5)(4 2)(1 5)(5 10)(1 -3)(9 5) 3.2.3 Nén LZW a Phương pháp mã hóa LZ78  Mô hình từ điển (Dictionary – based compression): Có loại: - Mã hóa từ điển tĩnh ( Static dictionary coding) - Mã hóa từ điển động ( Dynamic dictionary coding) Có nhiều thuật toán áp dụng kỹ thuật như: LZ77, LZK, LZSS, LZH…nhưng đề cập đến hai thuật toán chình là: - Thuật toán LZ78 - Thuật toán LZW Jacob Ziv Abraham Lempel mô tả kỹ thuật dựa từ điển mã hóa LZ77 LZ78 Ý tưởng dựa việc thay cụm ký tự trỏ, trỏ đến vị trì xuất trước cụm ký tự LZW mã hóa họ LZ, hoàn thiện LZ77 – LZ78 sử dụng phổ biến  Nguyên tắc: Thay ví thông báo vị trì đoạn văn lặp lại khứ, mã LZ78 đánh số tất đoạn văn cho đoạn ghi nhận số hiệu đoạn văn lặp lại khứ cộng với ký tự mà làm cho đoạn khác với đoạn khứ Như vậy, đoạn 61 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT đoạn ký tự khứ cộng với ký tự khứ Chình ví đoạn khác với đoạn cũ khứ  Ví dụ: Giả sử ta có đoạn văn sau: “aaabbabaabaaabab” Theo thuật toán LZ78 thí chúng phân thành đoạn sau: Input a aa b ba baa baaa bab Đoạn Output 0+a 1+a 0+b 3+a 4+a 5+a 4+b Như vậy, nén là: (0, a); (1, a); (0, b); (3, a); (4, a); (5, a); (4, b) Nói chung thuật toán LZ78 thuật toán nén vă tốt, có thời gian chạy chương trính tương đối nhanh, nhiên khả tiết kiệm chưa khai thác tối đa b Phương pháp mã hóa LZW Khái niệm nén từ điển Jocob Lempe Abraham Ziv đưa lần năm 1977 lấy tên LZ77 Năm 1978 cải tiến dựa LZ77 lấy tên LZ78 Năm 1984, Welch cải tiến giải thuật LZ thành giải thuật hiệu đặt tên LZW (Lempe – Ziv - Welch) Phương pháp xây dựng từ điển lưu chuỗi ký tự có tần suất lặp lại cao thay từ mã tương ứng gặp lại chúng, hay phương pháp trước kỹ thuật tổ chức từ điển cho phép nâng cao tỷ lệ nén Giải thuật LZW dùng cho tất loại file nhị phân, thường dùng để nén loại liệu như: văn bản, ảnh đen trắng, ảnh màu, ảnh đa cấp xám… chuẩn nén cho dạng ảnh GIF TIFF Số bit/pixel không ảnh hưởng đến hiệu LZW  Nguyên tắc Giải thuật nén LZW xây dựng từ điển lưu mẫu có tần suất xuất cao ảnh Từ điển tập hợp cặp từ vựng nghĩa từ vựng Trong đó, từ vựng từ mã xếp theo thứ tự định, nghĩa chuỗi liệu ảnh, từ điển xây dựng song song với trính đọc liệu Sự xuất chuỗi từ điển khẳng định chuỗi xuất phần liệu đọc 62 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT qua.Thuật toán liên tục tra cứu sau lần đọc ký tự liệu đầu vào thí tiến hành cập nhật lại từ điển Do giới hạn nhớ để đảm bảo tốc độ tím kiếm nhanh, từ điển có giới hạn 4096 phần tử dùng để lưu trữ giá trị từ mã Như vậy, độ dài lớn từ mã 12 bit (4096 = ) Cấu trúc từ điển sau: - 256 từ mã theo thứ tự từ 0…255 chứa số nguyên từ 0…255 Đây mã 256 ký tự bảng mã ASCII - Từ mã 256 chứa mã đặc biệt mã xóa (CC – Clear Code) Khi số mẫu lặp lớn 4096 thí người ta coi ảnh gồm nhiều mảnh ảnh từ điển gồm nhiều từ điển Khi hết mảnh ảnh gửi mã xóa CC để báo hiệu kết thúc mảnh ảnh cũ bắt đầu mảnh ảnh đồng thời khởi tạo lại từ điển - Từ mã thứ 257 chứa mã kết thúc thông tin (EOI – End Of Information) Thông thường file ảnh GIF chứa nhiều mảnh ảnh, mảnh ảnh mã hóa riêng Chương trính giải mã lặp lặp lại thao tác giải mã ảnh gặp mã kết thúc thông tin dừng lại - Các từ mã lại (từ 258 đến 4095) chứa mẫu thường lặp lại ảnh 512 phần tử từ điển biểu diễn bit Các từ mã từ 512 đến 1023 biểu 63 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT diễn 10 bit, từ 1024 đến 2047 biểu diễn 11 bit từ 2048 đến 4095 biểu diễn 12 bit  Ví dụ Cho chuỗi đầu vào: “HELLOHELLOHELL” Từ điển ban đầu gồm 256 ký tự Kìch thước đầu vào: 14 x = 112 bit Đầu vào Đầu Thực H có từ điển -> đọc tiếp H(72) E(69) 72 Thêm vào từ điển mã 258 đại diện chuỗi HE L(76) 69 Thêm vào từ điển mã 259 đại diện chuỗi EL L 76 Thêm vào từ điển mã 260 đại diện chuỗi LL O(79) 76 Thêm vào từ điển mã 261 đại diện chuỗi LO H 79 Thêm vào từ điển mã 262 đại diện chuỗi OH HE có từ điển -> đọc tiếp E L 258 Thêm vào từ điển mã 263 đại diện chuỗi HEL LL có từ điển -> đọc tiếp L O 260 Thêm vào từ điển mã 264 đại diện chuỗi LLO OH có từ điển -> đọc tiếp H E 262 Thêm vào từ điển mã 265 đại diện chuỗi OHE EL có từ điển -> đọc tiếp L L 259 Thêm vào từ điển mã 266 đại diện chuỗi ELL 76 Input = FALSE EOI Chuỗi đầu là: 72 69 76 76 79 258 260 262 259 76 Kìch thước đầu ra: x + x = 84 bit Tỷ số nén = 112/ 84 = 1.3 Quá trính giải nén thực sau: Code Outbuff() AddToDictionary() 64 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT CodeWord String 72 H 69 E 258 HE 76 L 259 EL 76 L 260 LL 79 O 261 LO 258 HE 262 OHE 260 LL 263 HEL 262 OH 264 LLO 259 EL 265 OHE 76 L 266 ELL EOI Chuỗi thu sau giải nén: “HELLOHELLOHELL” 65 Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông ... Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Một lưu ý triển khai đa phương tiện tác động đa phương tiện, ... cụ phần mềm hệ đa phương tiện hỗ trợ ứng dụng tương tác cho ìt dạng Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT,... phương tiện đề cập sau Dữ liệu đa phương tiện gồm liệu : Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin Truyền thông Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT Văn

Ngày đăng: 08/12/2016, 19:45

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w