- Sau khi gửi request và nhận trả lời xong, kết nối có thể được thiết lập, hos tA có thể gửi packet data đầu tiên với block number = 1 Trong các bước tiếp theo, các host sẽ kiểm tra
Nén ảnh cho World Wide Web
Một ảnh màu nhỏ có dung lượng nhớ khá lớn, do đó thời gian truyền trên mạng rất đáng kể, dễ làm cho World Wide Web trở thành World Wide Wait. Giải pháp tự nhiên là sử dụng các kỹ thuật nén ảnh hiện đại. Hai dạng thức đang được các Web browser hổ trợ rộng rãi là
CompuServe GIF (Graphics Interchange Format) và JPEG (Joint Photographic Experts Group). Mặc dù đã xuất hiện một số công nghệ mới (đáng chú ý nhất là Netscape Navigator 2.0 với kiến trúc Plug-in), GIF và JPEG vẫn là hai kỹ thuật nền tảng, có các mục đích sử dụng hồn tồn khác nhau. Cần phải hiểu rõ những khác biệt để có được lựa chọn thích hợp.
Cả thế giới dùng GIF
Có 2 dạng nén ảnh: lossless (trung thực) và lossy (không trung thực). Dùng lossless, ảnh sau khi tời (decompressed image) hoàn toàn giống với bản ban đầu (trước khi nén). Nén kiểu lossy làm mất một số thơng tin. Nghe qua thì có vẻ đáng ngại, nhưng nếu được thực thi tốt, bằng mắt thường không thể phân biệt ảnh tời với ảnh gốc, mà kỹ thuật này đảm bảo được tỉ lệ nén rất cao. Với các ảnh đen trắng, GIF là sơ đồ nén thực sự trung thực. Aấnh màu là vấn đề khác. GIF chỉ làm việc được với ảnh màu lập sẵn chỉ mục (indexed color image) và một lượng lớn thông tin bị mất khi chuyển ảnh màu 24 bit thành ảnh màu 8 bit có chỉ mục - bạn giảm số màu có thể từ 16,7 triệu xuống cịn 256. Một ảnh nhỏ cỡ 320x240 điểm có thể nhiều màu hơn 300 lần so với trường hợp màu có chỉ mục, kết quả là ảnh GIF 8 bit hoặc 5 bit không được mịn và rõ.
Tuy vậy, GIF có nhiều mặt mạnh. Trước hết, và quan trọng nhất, đây là chuẩn de facto (về thực tế), được mọi Web browser đồ họa hổ trợ. Nếu bạn dùng GIF, chắc chắn bất cứ ai, ở bất cứ đâu, đều có thể sử dụng được tập tin của bạn.
GIF còn là dạng thức duy nhất được chấp nhận rộng rãi cho phép sử dụng các điểm trong suốt (transparent pixels) trong file ảnh. Nó cịn hổ trợ interlacing (đan xen), một phương thức cấu trúc hóa thơng tin trong tập tin, cho phép ảnh được đưa liên tục ra màn hình, ảnh cũ mờ dần, ảnh mới rõ nét lên.
Giải thuật
Một chuyên gia giải thích kỹ thuật nén lossless như sau: "Giả sử bạn có một ngăn kéo với 2 chiếc tất màu trắng, 2 chiếc tất màu đen. Thay vì nói: "Tơi có 1 tất trắng, 1 tất trắng nữa, 1 tất đen, 1 tất đen nữa", bạn sẽ giảm câu đi khoảng một nửa nếu nói: "Tơi có 1 cặp tất trắng và một cặp tất đen".
Run Length Encoding (RLE), một kiểu nén lossless đơn giản nhất, làm việc như sau: Khi nén, tìm các đoạn lặp đi lặp lại - nếu thấy có hàng gồm 9 số khơng, tiếp theo là 3 số một, 12 số
không, tất cả sẽ được thay bằng 3 số: 9, 3, 12. Cách này hiệu quả nhất đối với các ảnh có vùng lớn đồng màu, nhưng kém hiệu lực với các ảnh phức tạp.
Phương pháp Lempel-Ziv-Welch (LZW) và kỹ thuật mã hóa kiểu Huffman phân tích và quan sát các đoạn lặp lại. Nếu LZW hoặc Huffman thấy có đoạn 010101, chúng đủ thơng minh đánh dấu các đoạn như vậy và thay bằng một ký tự, bằng cách đó dữ liệu được nén lại.
GIF sử dụng LZW cho TIFF nén. Tỉ lệ nén đạt ở mức vừa phải là 2:1. Để đạt được tỉ lệ cao hơn, cần đến kỹ thuật JPEG.
JPEG
GIF là chuẩn de facto, nhưng JPEG mới là chuẩn được ISO chấp nhận (mã số: ISO 10918- 1). JPEG viết tắt từ tên của ủy ban thiết lập ra nó là Joint Photographic Expert Group. Chuẩn này cũng có phương thức nén lossless, nhưng thực tế chẳng ai chấp nhận cả vì người ta thường dùng các kỹ thuật khác. Tuy nhiên, nén lossy của JPEG lại được hổ trợ rộng rãi. Bạn có thể đạt tới tỉ lệ nén 100:1 hoặc cao hơn, tất nhiên phải trả giá cho chất lượng. Tỉ lệ càng thấp, ảnh càng đỡ thô hơn. Phần lớn chuyên gia thống nhất rằng tỉ lệ 10:1 là tối ưu nhất vì vừa đủ cao vừa đảm bảo chất lượng (bằng mắt thường khó thấy được sự khác biệt giữa ảnh tời và ảnh gốc).
Nén theo chuẩn JPEG là một tiến trình nhiều bước. Trước hết là bước qui tắc hóa (regularizing stage) để làm cho ảnh có nhiều đoạn giống nhau hơn thực tế. Aảnh màu được chuyển sang dạng YUV hoặc CIELAB, trong đó thơng tin về độ sáng (luminance) được tách rời với thông tin về độ màu (chrominance). Một yếu tố được tính tới là mắt người ta nhạy cảm với những thay đổi nhỏ về độ sáng hơn là những thay đổi về màu sắc, đặc biệt ở đầu xanh của phổ. Ngồi ra cách làm này cịn khai thác thực tế là ảnh thường có nhiều vùng lớn tại đó các điểm kế nhau rất giống nhau về kênh màu.
Bước tiếp theo là lấy mẫu cho các kênh màu. Đây là 1 trong 2 công đoạn làm mất thông tin và chỉ thực hiện khi bạn chọn xác lập high compression/low quality (tỉ lệ nén cao/chất lượng thấp) của JPEG.
Lấy mẫu (subsampling) nghĩa là loại bỏ có hệ thống các thơng tin màu sắc đối với các hàng hoặc cột điểm ở tỉ lệ cho trước. Nếu bạn thực hiện cứ hai hàng loại bỏ một hàng và hai cột loại bỏ một cột, bạn giảm được dữ liệu màu đi 75%. Khi tời ảnh, trị của các điểm loại bỏ trước đó được ngoại suy từ những gì cịn lại.
Bước tiếp là sắp xếp lại dữ liệu bằng hàm toán học gọi là DCT (Discrete Cosine
Transform). Làm việc với các khối điểm 8x8, hàm DCT phân tích các tần số vùng theo cả chiều ngang lẫn chiều dọc. Công đoạn này được gọi là lượng tử hóa (quantization) - cách gọi kỹ thuật của bước làm giảm số bit cần thiết để biểu diễn mổi giá trị tần suất. Các trị này được nén trung thực trước hết bằng RLE sau đó mã hóa theo kỹ thuật Huffman. Đây là cơng đoạn của JPEG cho phép đạt tỉ số nén rất cao.
Quá trình tời (decompression) là quá trình ngược lại. Dữ liệu được giải mã bằng thuật toán Huffman, các trị kết quả được nhân lên, hàm DCT ngược được áp dụng, các vùng luminance và chrominance được chuyển trở lại RGB.
Lựa chọn
Tỉ lệ nén của JPEG đạt được chủ yếu nhờ bước lượng tử hóa. Khi thực thi, chất lượng khác nhau vẫn đạt được, cho dù tỉ lệ nén không thay đổi, nếu chọn các lượng tử khác nhau cho kênh màu và độ sáng.
ảnh nén theo JPEG thường nhỏ hơn nếu dùng GIF mà khi tời vẫn được ảnh màu 24 bit thực sự. Tất nhiên là mất nhiều thời gian hơn để mở file của JPEG, đền bù lại là thời gian truyền ít đi. Nhược điểm của JPEG là không hổ trợ transparency và interlacing. Một số trình duyệt xem, bao gồm Netscape Navigator 2.0 và Spyglass's Mosaic hỗ trợ dạng thức mới gọi là progressive JPEG (PJPEG) cho phép hiện ảnh trên màn hình như trường hợp GIF đan xen, hiệu ứng mờ dần diễn ra có nhanh hơn.
Để quyết định chọn phương thức nén nào cần xem xét một vài yếu tố. Thế mạnh của GIF là tính phổ dụng, nhưng lại chỉ hổ trợ màu lập sẵn chỉ mục, tối đa 256 màu.
Nếu bạn không cần tới transparency và muốn có ảnh màu 24 bit chất lượng cao, JPEG là lựa chọn tốt nhất. Photoshop chỉ đưa ra 4 xác lập nén cho JPEG (low, medium, high và maximum). Các tiện ích khác như Image Alchemy và ProJPEG có nhiều tùy chọn hơn, nhưng giá trị thực sự của chúng so với Photoshop là cho phép đạt tỉ lệ nén cao hơn: với tỉ lệ 40:1 chất lượng ảnh sau khi tời vẫn chấp nhận được.
Tương lai
Khi bài báo này tới tay bạn đọc, Netscape Navigator 2.0 hẳn đã được tung ra. Đặc tính mới đáng giá nhất là kiến trúc plug-in cho phép các browser thơng dụng có nhiều khả năng mới, chẳng hạn hổ trợ nhiều dạng thức hơn là một số đã biết như GIF, JPEG và PJPEG. Electronic Book Technologies cũng vừa cơng bố bộ plug-in Figleaf Inline của mình, cho phép Web browser hiển thị được các tập tin vector của CGM cũng như các dạng thức TIFF, EPS, WMF và nhiều kiểu khác. Corel cũng triển khai sản phẩm tương tự là CMX Viewer cho phép Navigator hiển thị các tập tin Vector CMX của CorelDraw.