Nghiên cứu các kỹ thuật giấu tin trong môi trường dữ liệu ảnh số và đềxuất phương pháp giấu tin đảm bảo tính ẩn của dữ liệu được giấu và tăng tínhan toàn, bền vững cho tin giấu trước tấn
Trang 1MỤC LỤC
Trang 2• Chương II Tổng quan về kỹ thuật giấu tin
Giới thiệu tổng quan về giấu tin : Khái niệm, mô hình, phân loại và ứng dụng trong thực tế Giấu tin trên dữ liệu đa phương tiện : Khái niệm đa phươngtiện, các khái niệm và mô hình giấu tin trong dữ liệu đa phương tiện (ảnh số,
âm thanh, video, văn bản) Trình bày về một số mô hình giấu tin cơ bản : Mô hình chèn (Injection/Insertion), mô hình thay thế (Subsitiuation), mô hình tự sinh (Generation)
• Chương III Giấu tin trong ảnh số
Giới thiệu về các mô hình giấu tin trong ảnh số : Phương pháp LSB, kỹ thuật Wu-Lee, CPT, HT, Mavel Shoemarker Giới thiệu và phân loại các kỹ thuật giấu tin trong ảnh số : Nhóm sử dụng miền không gian, nhóm sử dụng miền biến đổi, nhóm sử dụng phương pháp kết hợp
• Chương IV Nâng cao tính an toàn cho tin giấu
Đưa ra vấn đềvề tính bền vững trong giấu tin cần nâng cao, bảo toàn tin giấu trước các tấn công sử dụng kỹ thuật xử lý ảnh Đề xuất phương pháp giấu tin tăng tính an toàn, bền vững
Trang 3• Chương V Cài đặt và thử nghiện
Cài đặt chương trình Demo thử nghiệm và đánh giá kết quả với một số phần mềm giấu tin thương mại, miễn phí khác
• Kết luận
Tóm lược kết quả đã nghiên cứu , hướng phát triển của đề tài trong tương lai
Trang 4DANH MỤC CÁC KÝ HIỆU VIẾT TẮT
LSB Least Significant Bit (Bit có trọng số thấp)
WL Thuật toán giấu tin trong ảnh của Wu M.Y và Lee J.H
CPT Thuật toán giấu tin của Chen-Pan-Tseng
HT Thuật toán giấu tin của Nguyễn Văn Tảo – Bùi Thế Hồng
GIF Graphics Interchange Format
JPEG Joint Photographic Expert Group
PSNR Peak signal-to-noise ratio
DFT Discrete fourier transform (Biến đổi Fourier rời rạc)
IDFT Invert discrete fourier transform (Biến đổi Fourier ngược rời rạc)DCT Discrete cosine transform (Biến đổi cosin rời rạc)
IDCT Invert dscrete cosine transform (Biến đổi cosin ngược rời rạc)DWT Discrete wavelet transform (Biến đổi wavelet thuận)
IDWT Invert discrete wavelet transform (Biến đổi wavelet ngược)
Trang 5DANH MỤC HÌNH ẢNH SỬ DỤNG
Trang 6MỞ ĐẦU
• Tính cấp thiết của đề tài
Cuộc cách mạng thông tin kỹ thuật số đã đem lại những thay đổi sâu sắctrong xã hội và trong cuộc sống của chúng ta, với sự ra đời của những máy tính
có tốc độ xử lý cao, các thiết bị mới như máy ảnh kỹ thuật số, máy quét chấtlượng cao, máy in, máy ghi âm kỹ thuật số, đã thúc đẩy việc phát triển cácphần mềm và nghiên cứu về dữ liệu đa phương tiện (multimedia) MạngInternet với sự phổ biến trên khắp thế giới đã, đang dần trở thành một môitrường trao đổi thông tin trong mọi lĩnh vực của cuộc sống như chính trị, quân
sự, quốc phòng, kinh tế, giải trí… Và chính trong môi trường mở và tiện nghinhư thế xuất hiện những vấn nạn, tiêu cực đang rất cần đến các giải pháp hữuhiệu cho vấn đề an toàn thông tin như nạn ăn cắp bản quyền, nạn xuyên tạcthông tin, truy nhập thông tin trái phép …
Trước thực trạng này, rất nhiều giải pháp khác nhau đã được đưa ra Ẩn
dữ liệu số ra đời như một hướng tiếp cận mang đầy hứa hẹn trong giai đoạnmới của sự phát triển công nghệ Hướng tiếp cận của phương pháp này lànhúng một lượng dữ liệu cần bảo vệ vào trong chuỗi dữ liệu mang sao cho sựthay đổi của chuỗi dữ liệu mang này là nhỏ nhất Chuỗi dữ liệu chứa có thể làmột đoạn văn bản, một hình ảnh, logo, Hiện nay, có rất nhiều hướng pháttriển với nhiều mục đích ứng dụng khác nhau
Với việc ảnh số đang ngày càng phổ biến thì việc lựa chọn giấu tin trongảnh số là vấn đề mà nhiều nhà nghiên cứu quan tâm Trong báo cáo đồ án tốtnghiệp này em lựa chọn chủ đề nghiên cứu về giấu tin trong ảnh số với mongmuốn được tìm hiểu nhiều hơn nữa và nâng cao tính an toàn cho tin giấu, đưa
ra ứng dụng giấu tin trong ảnh số
• Mục tiêu nghiên cứu của đề tài
Trang 7Nghiên cứu các kỹ thuật giấu tin trong môi trường dữ liệu ảnh số và đềxuất phương pháp giấu tin đảm bảo tính ẩn của dữ liệu được giấu và tăng tính
an toàn, bền vững cho tin giấu trước tấn công sử dụng kỹ thuật xử lý ảnh
• Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu : Các kỹ thuật giấu tin trong ảnh số.
- Phạm vi nghiên cứu :
+ Nghiên cứu về lý thuyết xử lý ảnh số
+ Nghiên cứu về các kỹ thuật giấu tin trong ảnh số
+ Đề xuất phương pháp giấu tin làm tăng tính an toàn, bền vững chothông tin giấu trước các tấn công sử dụng kỹ thuật xử lý ảnh
+ Cài đặt thử nghiệm so sánh kết quả thử nghiệm với một số phầnmềm giấu tin khác
• Phương pháp nghiên cứu
- Tổng hợp và phân tích cơ sở lý thuyết các phương pháp giấu tin
- Lập luận để đưa ra một số cải tiến trong phương pháp giấu tin mới
- So sánh, đánh giá kết quả giấu tin thông qua công thức và thử nghiệm
- Cài đặt, đánh giá phần mềm theo quy trình xây dựng phần mềm
• Đóng góp mới của đề tài
Đề tài nghiên cứu đề xuất phương pháp giấu tin làm tăng tính an toàn,bền vững cho tin giấu trước các tấn công sử dụng kỹ thuật xử lý ảnh
Phương pháp đề xuất thể hiện được ưu điểm so với các phương phápkhác Kết quả thử nghiệm tính bền vững trước một số tấn công sử dụng kỹthuật xử lý ảnh tốt hơn một số phần mềm giấu tin thương mại hiện có
Trang 8- Chương II Tổng quan về giấu tin
Chương này trình bày tổng quan về giấu tin : Khái niệm, mô hình giấutin, phân loại giấu tin, các yêu cầu đối với một hệ thống giấu tin và ứng dụngthực tế của giấu tin
- Chương III Giấu tin trong ảnh số
Chương này trình bày về các phương pháp giấu tin trong ảnh số, phânloại giấu tin trong ảnh số
- Chương IV Nâng cao tính an toàn cho tin giấu
Chương này trình bày về vấn đề và đề xuất phương pháp giấu tin nhằmtăng tính an toàn, bền vững cho tin giấu trước các tấn công sử dụng kỹ thuật xử
lý ảnh
- Chương V Cài đặt và thử nghiệm
Chương này đưa ra một số kết quả thử nghiệm và so sánh với một sốphần mềm giấu tin hiện nay
• Môi trường thử nghiệm
Chương trình được cài đặt thử nghiệm và phát triển trên môi trườngchính là Microsoft Visual Studio 2010
Trang 9LỜI CẢM ƠN
Em xin chân thành cảm ơn giáo viên hướng dẫn TS Nguyễn Ái Việt,ThS Nguyễn Hồng Tân, Ks Nguyễn Đức Thiện đã tận tình giúp đỡ em trongquá tình thực hiện đề tài
Em xin chân thành cảm ơn giáo viên TS Nguyễn Văn Tảo đã giúp đỡ
em thực hiện hoàn thành đề tài Em xin chân thành cảm ơn các thầy cô giáokhoa Công nghệ thông tin Đại học CNTT&TT Thái Nguyên cũng như đã trựctiếp giảng dạy và trang bị cho em kiến thức cơ bản để giúp em thực hiện hoànthành đề tài này
Xin chân thành cảm ơn các bạn đã động viên và đóng góp ý kiến xâydựng đề tài, giúp đề tài được hoàn thiện hơn
Trong quá trình thực hiện đồ án không tránh khỏi những thiếu xót, vìvậy rất mong nhận được sự góp ý của các thầy, cô giáo và các bạn
Trang 10LỜI CAM ĐOAN
Em xin cam đoan đây là phần nghiên cứu và thể hiện đồ án tốt nghiệpcủa riêng em, không sao chép các đồ án khác, nếu sai em xin chịu hoàn toàntrách nhiệm và chịu mọi kỷ luật của khoa và nhà trường đề ra
Sinh viên thực hiện Trần Quang Tú
Trang 11CHƯƠNG I TỔNG QUAN VỀ ẢNH SỐ
1.1 Khái niệm ảnh số
Ảnh số được tạo bởi tập hợp các điểm ảnh, điểm ảnh đặc trưng cho một
giá trị nào đó là một hàm n biến Ảnh trong thực tế là một ảnh liên tục về
không gian và về giá trị độ sáng Để có thể xử lý ảnh bằng máy tính cần thiếtphải tiến hành số hoá ảnh Trong quá trình số hoá, người ta biến đổi tín hiệuliên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hoá về khônggian) và lượng tử hoá thành phần giá trị mà về nguyên tắc bằng mắt thườngkhông phân biệt được hai điểm kề nhau
- Điểm ảnh hay còn gọi là pixel (hay picture element, pels, image elements)được xem như là dấu hiệu hay cường độ sáng tại một toạ độ trong khônggian của đối tượng
- Ảnh được xem như là một tập hợp các điểm ảnh Khi được số hoá nó
thường được biểu diễn là ma trận hai chiều a[i][j] mà mỗi phần tử có một giá trị nguyên hoặc là một véc tơ cấu trúc màu
- Mức xám (gray level) : Mức xám là kết quả sự mã hoá tương ứng mộtcường độ sáng của mỗi điểm ảnh với một giá trị số-kết quả của quá trìnhlượng hoá
1.2 Màu sắc
Mắt người có thể phân biệt được vài chục màu nhưng chỉ có thể cảmnhận được hàng ngàn màu Ba thuộc tính của một màu đó là: Sắc (Hue), Độthuần khiết (Saturation), và độ sáng hay độ chói (Itensity)
Trong xử lý ảnh và đồ họa, mô hình màu là một chỉ số kỹ thuật của một hệ tọa
độ màu 3 chiều với tập các màu nhỏ thành phần có thể trông thấy được trong
hệ thống tọa độ màu thuộc một gam màu đặc trưng Ví dụ như mô hình màuRGB (Red, Green, Blue): là một đơn vị tập các màu thành phần sắp xếp theohình lập phương của hệ trục tọa độ Đề các
Mục đích của mô hình màu là cho phép các chỉ số kỹ thuật quy ước của một sốloại màu sắc thích hợp với các màu sắc của một số gam màu khác Chúng ta cóthể nhìn thấy trong mô hình màu này, không gian màu là một tập hợp nhỏ hơn
Trang 12của không gian các màu có thể nhìn thấy được, vì vậy một mô hình màu khôngthể được sử dụng để định rõ tất cả có thể nhìn thấy Sau đây, ta xem xét một số
mô hình hay được sử dụng nhất
1.2.1 Mô hình màu RGB
Màu đỏ, lục – xanh lá cây, lam – xanh da trời (RGB) được sử dụng phổbiến nhất Những màu gốc RGB được thêm vào những màu gốc khác điều đótạo nên sự đóng góp riêng của từng màu gốc được thêm cùng nhau để mang lạikết qaủ Tập hợp màu nhỏ thành phần sắp xếp theo khối lập phương đơn vị.Đường chéo chính của khối lập phương với sự cân bằng về số lượng từng màugốc tương ứng với các mức độ xám với đen là (0,0,0) và trắng (1,1,1)
Hình 1.1 Mô hình màu RGB
1.2.2 Mô hình màu YUV
Mô hình YUV quy định một không gian màu được tạo bởi một độ sáng
và hai thành phần màu (chrominance) YUV được sử dụng trong hệ thống phát
sóng truyền hình theo chuẩn PAL, đây là chuẩn ở phần lớn các nước
Mô hình YUV giúp tạo ra màu đúng với nhận thức của con người hơnchuẩn RGB, là loại được dùng trong các thiết bị đồ hoạ máy tính, nhưng khôngchuẩn bằng không gian màu HSV
Giá trị Y đại diện cho thành phần độ sáng, U và V là đại diện cho cácthành phần màu Không gian màu YCbCr hay YPbPr, được sử dụng trong cácthiết bị phát hình, đều xuất phát từ nó (Cb/Pb và Cr/Pr là những phiên bản biếnthể của U và V), và đôi khi bị gọi một cách không chính xác là "YUV" Không
Trang 13gian màu YIQ được dùng trong các hệ thống truyền hình NTSC cũng liên quanđến nó, tuy nhiên lại đơn giản hơn nó nhiều.
Các tín hiệu YUV đều xuất phát từ các nguồn RGB Các giá trị trọng sốcủa R, G và B được cộng lại với nhau để tạo ra một tín hiệu Y đơn, để biểudiễn độ sáng chung tại một điểm đó Tín hiệu U sau đó được tạo ra bằng các trừ
Y khỏi tín hiệu xanh lam (B của RGB), và được nhân với một tỉ lệ có sẵn; còn
V được tính bằng cách trừ Y khỏi màu đỏ (R của RGB), và nhân tỉ lệ với một
1.3 Biểu diễn ảnh
Ảnh trên máy tính là kết quả thu nhận theo các phương pháp số hoáđược nhúng trong các thiết bị kỹ thuật khác nhau Quá trình lưu trữ ảnh nhằm 2mục đích:
• Tiết kiệm bộ nhớ
• Giảm thời gian xử lý
Việc lưu trữ thông tin trong bộ nhớ có ảnh hưởng rất lớn đến việc hiểnthị, in ấn và xử lý ảnh được xem như là một tập hợp các điểm với cùng kíchthước nếu sử dụng càng nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn vàcàng thể hiện rõ hơn chi tiết của ảnh người ta gọi đặc điểm này là độ phân giải.Việc lựa chọn độ phân giải thích hợp tuỳ thuộc vào nhu cầu sử dụng và đặctrưng của mỗi ảnh cụ thể, trên cơ sở đó các ảnh thường được biểu diễn theo 2
mô hình cơ bản là mô hình Raster và mô hình Vector
Trang 141.3.1 Mô hình Raster
Đây là cách biểu diễn ảnh thông dụng nhất hiện nay, ảnh được biểu diễndưới dạng ma trận các điểm (điểm ảnh) Thường thu nhận qua các thiết bị nhưcamera, scanner Tuỳ theo yêu cầu thực thế mà mỗi điểm ảnh được biểu diễnqua một hay nhiều bít
Mô hình Raster thuận lợi cho hiển thị và in ấn Ngày nay công nghệ phầncứng cung cấp những thiết bị thu nhận ảnh Raster phù hợp với tốc độ nhanh vàchất lượng cao cho cả đầu vào và đầu ra Một thuận lợi cho việc hiển thị trongmôi trường Windows là Microsoft đưa ra khuôn dạng ảnh DIB (DeviceIndependent Bitmap) làm trung gian Hình 1.2 dưới đây thể hình quy trìnhchung để hiển thị ảnh Raster thông qua DIB
Một trong những hướng nghiên cứu cơ bản trên mô hình biểu diễn này là
kỹ thuật nén ảnh các kỹ thuật nén ảnh lại chia ra theo 2 khuynh hướng là nénbảo toàn và không bảo toàn thông tin nén bảo toàn có khả năng phục hồi hoàntoàn dữ liệu ban đầu còn nếu không bảo toàn chỉ có khả năng phục hồi độ sai
số cho phép nào đó Theo cách tiếp cận này người ta đã đề ra nhiều quy cáchkhác nhau như BMP, TIF, GIF, PCX…
Hiện nay trên thế giới có trên 50 khuôn dạng ảnh thông dụng bao gồm cảtrong đó các kỹ thuật nén có khả năng phục hồi dữ liệu 100% và nén có khảnăng phục hồi với độ sai số nhận được
Hình 1.2 Quá trình hiển thị và chỉnh sửa, lưu trữ ảnh thông qua DIB
Trang 15RASTER Vector VECTOR RASTER
hóa
Raster hóa
1.3.2 Mô hình Vector
Biểu diễn ảnh ngoài mục đích tiết kiệm không gian lưu trữ dễ dàng chohiển thị và in ấn còn đảm bảo dễ dàng trong lựa chọn sao chép di chuyển tìmkiếm… Theo những yêu cầu này kỹ thuật biểu diễn vector tỏ ra ưu việt hơn
Trong mô hình vector người ta sử dụng hướng giữa các vector của điểmảnh lân cận để mã hoá và tái tạo hình ảnh ban đầu ảnh vector được thu nhậntrực tiếp từ các thiết bị số hoá như Digital hoặc được chuyển đổi từ ảnh Rasterthông qua các chương trình số hoá
Công nghệ phần cứng cung cấp những thiết bị xử lý với tốc độ nhanh vàchất lượng cho cả đầu vào và ra nhưng lại chỉ hỗ trợ cho ảnh Raster
Do vậy, những nghiên cứu về biểu diễn vectơ đều tập trung từ chuyểnđổi từ ảnh Raster
Hình 1.3 Sự chuyển đổi giữa các mô hình biểu diễn ảnh
1.4 Một số định dạng ảnh số
Hiện nay có rất nhiều định dạng ảnh số đã được ra đời và một số địnhdạng đã được sử dụng phổ biến và nhiều chương trình xử lý ảnh hỗ trợ như :Bitmap, Jpeg, Png, Gif, Tiff
Cấu trúc chung của một tệp tin ảnh bao gồm hai phần là header và data.Phần header thường có dung lượng lưu trữ nhỏ hơn rất nhiều so với phần datacủa ảnh và lưu trữ các thông tin về ảnh như kích thước ảnh, kiểu nén, màu sắc,bảng màu sử dụng, … Phần data lưu trữ dữ liệu về thông tin màu sắc của ảnh,thông tin biểu diễn điểm ảnh, vì vậy nên có dung lượng chiếm gần hết dunglượng tệp tin
Một bức ảnh số trong thực tế được tạo ra qua các thiết bị thu nhận tínhiệu và quá trình lượng tử hóa, để lưu trữ dữ liệu của một bức ảnh số có thể cầndung lượng khá lớn từ thiết bị lưu trữ Vì vậy để giảm dung lượng lưu trữ củamột bức ảnh người ta sử dụng các thuật toán nén dữ liệu ảnh Việc phân loạicác phương pháp nén ảnh dựa trên một số tiêu chí như nguyên lý nén, cáchthức nén, thế hệ nén
Trang 16+ Thuật toán nén gây mất dữ liệu (lossy) : Là thuật toán có khả năng nénmạnh, giảm dung lượng ảnh bằng cách lược bỏ bớt các phần thông tinkhông quan trọng của ảnh, do đó gây mất dữ liệu khi giải nén Lượng dữliệu bị mất nhiều hay ít, chất lượng ảnh giảm nhiều hay ít tùy thuộc vàomức độ nén của thuật toán Định dạng ảnh Jpeg sử dụng thuật toán nénnhóm này.
+ Thuật toán nén bảo toàn dữ liệu (lossless) : Nhóm thuật toán này khôngnén mạnh như nhóm thuật toán nén gây mất dữ liệu nhưng lại có khảnăng bảo toàn dữ liệu, dữ liệu không bị mất sau khi giải nén, do đó đảmbảo chất lượng ảnh sau khi giải nén Một số thuật toán nén thuộc nhómnày như : RLC (Run Length Coding), Huffman, LZW (Lempel–Ziv–Welch), … Và một số định dạng ảnh sử dụng thuật toán nén thuộc nhómnày như : Bitmap, Gif, Png, Tiff, …
+ Phương pháp không gian : Là phương pháp thực hiện nén bằng cách tácđộng trực tiếp lên việc lấy mẫu của ảnh trong miền không gian
+ Phương pháp sử dụng biến đổi : Là phương pháp tác động lên sự biến đổicủa ảnh gốc chứ không tác động trực tiếp
+ Các phương pháp nén thế hệ thứ nhất : Gồm các phương pháp có mức
độ tính toán đơn giản như lấy mẫu, gán từ mã, …
+ Các phương pháp nén thế hệ thứ hai : Gồm các phương pháp dựa vàomức độ bão hòa của tỷ lệ nén bằng cách sử dụng các phép toán tổ hợpđầu ra một cách hợp lý hoặc sử dụng biểu diễn ảnh như : Phương phápkim tự tháp Laplace, phương pháp dựa vào vùng gia tăng, phương pháptách hợp
Trang 17Trong đó, các kiểu dữ liệu được định nghĩa như sau:
typedef struct tagBITMAPFILEHEADER { /* bmfh */
Trang 18Ý nghĩa của các trường như sau :
biSize Kích thước của BITMAPINFOHEADER
biWidth Chiều rộng của ảnh, tính bằng số điểm ảnh
biHeight Chiều cao của ảnh, tính bằng số điểm ảnh
biPlanes Số plane của thiết bị, phải bằng 1
biBitCount Số bit cho một điểm ảnh
biCompression Kiểu nén
biSizeImage Kích thước của ảnh tính bằng byte
biXPelsPerMeter Độ phân giải ngang của thiết bị, tính bằng điểm ảnhtrên metbiYPelsPerMeter Độ phân giải dọc của thiết bị, tính bằng điểm ảnh trênmetbiClrUsed Số lượng các màu thực sự được sử dụng
biClrImportant Số lượng các màu cần thiết cho việc hiển thị, bằng 0
nếu tất cả các màu đều cần để hiển thị
Hình 1.4 Ý nghĩa của các trường trong cấu trúc ảnh Bitmap
Nếu giá trị trường bmih.biBitCount > 8 thì ảnh không sử dụng bảng
màu, ngược lại thì ảnh sử dụng bảng màu có 2 bmih.biBitCount giá trị màu Phần tửtrong bảng màu được định nghĩa như sau :
typedef struct tagRGBQUAD { /* rgbq */
Trang 19• Phần Header(IFH)
Có kích thước 8 byte :
Hai loại này khác nhau rất lớn ở thứ tự các byte lưu trữ trong các sốdài 2 hay 4 byte Nếu trường này có giá trị là 4D4Dh thì đó là ảnhcho máy Macintosh, nếu là 4949h là của máy PC
và không thay đổi
trúc thứ hai của file Thứ tự các byte này phụ thuộc vào dấu hiệutrường đầu tiên
• Phần thứ 2(IFD)
Không ở ngay sau cấu trúc IFH mà vị trí được xác định bởi trường Offsettrong đầu tệp Có thể có một hay nhiều IFD cùng tồn tại trong một file.Một IFD bao gồm:
thì trường này có giá trị 0
• Phần thứ 3(DE)
Các DE có dộ dài cố định gồm 12 byte và chia làm 4 phần:
+ 1 : BYTE (1 byte)
+ 2 : ASCII (1 byte)
Trang 20+ 3 : SHORT (2 byte).
+ 4 : LONG (4 byte)
+ 5 : RATIONAL (8 byte)
ra Nó không phải là tổng số byte cần thiết để lưu trữ Để có số liệunày ta cần nhân số chỉ mục với kiểu dữ liệu đã dùng
- 4 byte : đó là Offset tới điểm bắt đầu dữ liệu liên quan tới dấu hiệu,
tức là liên quan với DE không phải lưu trữ vật lý cùng với nó nằm ởmột vị trí nào đó trong file
Dữ liệu chứa trong tệp thường được tổ chức thành các nhóm dòng (cột)quét của dữ liệu ảnh Cách tổ chức này làm giảm bộ nhớ cần thiết cho việc đọctệp Việc giải nén được thực hiện theo 4 kiểu khác nhau được lưu trữ trong bytedấu hiệu nén
1.4.3 Định dạng ảnh PCX
Định dạng ảnh PCX là một trong những định dạng ảnh cổ điển Nó sửdụng phương pháp mã hoá loạt dài RLE (Run Length Encoded) để nén dữ liệuảnh Quá trình nén và giải nén được thực hiện trên từng dạng ảnh Thực tế,phương pháp giải nén PCX kém hiệu quả hơn so với kiểu IMG Tệp PCX gồm
3 phần: đầu tệp (header), dữ liệu ảnh (Image data) và bảng màu mở rộng
Header của tệp PCX có kích thước cố định gồm 128 byte và được phân
+ 2 : Phiên bản 2.8 với bảng màu
+ 3 : Phiên bản 2.8 hay 3.0 không có bảng màu
+ 5 : Phiên bản 3.0 có bảng màu
Trang 21- 1 byte : Chỉ ra phương pháp mã hoá Nếu là 0 thì mã hoá theo phương
pháp BYTE PACKED, ngược lại là phương pháp RLE
- 1 byte : Số bít cho một điểm ảnh plane.
- 1 word : Toạ độ góc trái của ảnh Với kiểu PCX nó có giá trị là (0,0),
cũn PCC thì khác (0,0)
- 1 word : Toạ độ góc phải dưới.
- 1 word : Kích thước bề rộng và bề cao của ảnh.
- 1 word : Số điểm ảnh.
- 1 word : Độ phân giải màn hình.
- 1 word.
- 48 byte : Chia nó thành 16 nhóm, mỗi nhóm 3 byte Mỗi nhóm này
chứa thông tin về một thanh ghi màu Như vậy ta có 16 thanh ghi màu
- 1 byte : Không dùng đến và luôn đặt là 0.
- 1 byte : Số bớt plane mà ảnh sử dụng Với ảnh 16 màu, giá trị này là 4,
với ảnh 256 mầu (1pixel/8bits) thì số bit plane lại là 1
- 1 byte : Số bytes cho một dòng quét ảnh.
- 1 word : Kiểu bảng màu.
- 58 byte : Không dùng.
Định dạng ảnh PCX thường được dùng để lưu trữ ảnh và thao tác đơngiản, cho phép nén và giải nén nhanh Tuy nhiên, vì cấu trúc của nó cố định,nên trong một số trường hợp làm tăng kích thước lưu trữ Cũng vì nhược điểmnày mà một số ứng dụng sử dụng một kiểu định dạng khác mềm dẻo hơn: địnhdạng TIFF (Targed Image File Format) sẽ mô tả ở trên
Trang 221.5 Một số chuẩn nén ảnh hiện nay
1.5.1 Phương pháp nén mã hóa loạt dài RLC
Phương pháp mã hoá loạt dài RLC (Run Length Coding) lúc đầu được
phát triển dành cho ảnh số 2 mức: mức đen(1) và mức trắng (0) như các vănbản trên nền trắng, trang in, các bức vẽ kỹ thuật
Nguyên tắc của phương pháp là phát hiện một loạt các bit lặp lại, thí dụnhư một loạt các bit 0 nằm giữa 2 bit 1hay ngược lại một loạt các bit 1 nằmgiữa 2 bit 0 Phương pháp này chỉ có hiệu qủa khi chiều dài của dãy lặp lớn
hơn một ngưỡng nào đó Dãy các bit lặp gọi là loạt hay mạch (run) Tiếp theo
thay thế chuỗi đó bởi một chuỗi mới gồm 2 thông tin: chiều dài chuỗi và bit lặp(ký tự lặp) Như vậy chuỗi thay thế có chiều dài ngắn hơn chuỗi cần thay thế
Đối với ảnh, chiều dài của chuỗi lặp có thể lớn hơn 255, nếu ta dùng 1byte để mã hoá thì sẽ không đủ Giải pháp được dùng là tách chuỗi đó thành 2chuỗi: một chuỗi có chiều dài 255, chuỗi kia là số bit còn lại
Phương pháp RLC được sử dụng trong việc mã hoá lưu trữ các ảnhbitmap theo dạng PCX, BMP
Phương pháp RLC có thể chia thành 2 phương pháp nhỏ: phương phápdùng chiều dài từ mã cố định và phương pháp thích nghi như kiểu mãHuffman
Giả thiết mạch có độ dài cực đại M, M=2 m - l Khi đó sẽ lấy m bit để mã
hoá mỗi mạch Nếu các mã 0 liên tiếp độc lập, khi đó phân bố xác suất của độ dài mạch sẽ được phân bố như sau :
Khi độ dài mạch cả l ≤ M - 1 dẫn đến một dãy l bit 0 theo sau bởi một bit
1, ( l+1) ký hiệu, số trung bình các ký tự trên mạch ký hiệu:
)1(
)1()
1()1(1
p Mp
p p
−+
=∑−
=
µ
Trang 23Do đó nó lấy m bit để ước lượng độ dài mã loạt cho ký hiệu nhị phân µ
Độ nén thu được :
)1(
1
p m
p m
RLC có thể cải thiện tốt hơn bởi mã độ dài thay đổi như mã Huffman
Với chiều dài cố định, việc cài đặt thuật toán là đơn giản Tuy nhiên tỷ
lệ nén sẽ không tốt bằng dùng chiều dài biến đổi hay gọi là mã RLC thích nghi
1.5.2 Phương pháp nén mã hóa Huffman
Phương pháp Hufman là phương pháp dựa vào mô hình thống kê Dựavào dữ liệu gốc người ta tính tần suất xuất hiện của các ký tự Người ta gán chocác ký tự có tần suất cao một từ mã ngắn, các ký tự có tần suất thấp từ mã dài.Nói một cách khác, các ký tự có tần suất càng cao được gán mã càng ngắn vàngược lại Với cách thức này ta đã giảm được chiều dài trung bình của từ mãhóa bằng cách dùng chiều dài biến đổi
• Phương pháp
xếp lại bảng mã theo thứ tự tần suất giảm dần
ghép 2 phần tử có tần suất thấp nhất thành một phần tử duy nhất Phần tửnày có tần suất bằng tổng hai tần suất thành phần Tiến hành cập nhật lạibảng và đương nhiên loại bỏ hai phần tử đang xét Quá trình được lặp lạicho đến khi bẳng chỉ có một phần tử Quá trình này gọi là quá trình tạocây mã Huffman vì việc tập hợp được tiến hành nhờ một cây nhị phânvới hai nhánh Phần tử với tần suất thấp ở bên phải, phần tử với tần suấtcao ở bên trái Với cách tạo cây này, tất cả các bit dữ liệu/ký tự là nút lá,các nút trong là các nút tổng hợp Sau khi cây tạo xong, người ta tiến
Trang 24hành gán mã cho các nút lá Việc mã hóa rất đơn giản, mỗi lần xuống bênphải ta them một bit “1” vào từ mã, mỗi lần xuống bên trái ta thêm m ộtbit “0” Có thể làm ngược lại, chỉ có giá trị mã thay đổi còn tổng chiềudài là không thay đổi.
Quá trình giải nén tiến hành theo các bước ngược lại và dựa vào bảng
mã tạo ra trong giai đoạn nén (bảng này được giữ lại trong cấu trúc đầu của tệpnén cùng với dữ liệu nén)
Ví dụ : Với một tệp dữ liệu mà tần suất các ký tự cho bới:
Trang 25kỹ thuật tổ chức từ điển cho phép nâng cao tỷ lệ nén.
Giải thuật LZW được sử dụng cho tất cả các loại tệp tin nhị phân Nóthường được dùng để nén các loại văn bản, ảnh đen trắng, ảnh màu, ảnh đamức xám …và là chuẩn nén cho các dạng ảnh GIF và TIFF Mức độ hiệu quảcủa LZW không phụ thuộc vào số bit màu của ảnh
• Phương pháp
Trang 26Giải thuật nén LZW xây dựng một từ điển lưu các mẫu có tần suất xuấthiện cao trong ảnh Từ điển là tập hợp những cặp từ vựng và nghĩa của nó.Trong đó từ vựng sẽ là các từ mã được sắp xếp theo thứ tự nhất định Nghĩa làmột chuỗi con trong dữ liệu ảnh Từ điển được xây dựng đồng thời với quátrình đọc dữ liệu Sự có mặt của một chuỗi con trong từ điển khẳng định rằngchuỗi đó đã từng xuất hiện trong phần dữ liệu đã đọc Thuật toán liên tục “tracứu” và cập nhật từ điển sau mỗi lần đọc một ký tự ở dữ liệu đầu vào.
Do kích thước bộ nhớ không phải vô hạn và dể đảm bảo tốc độ tìmkiếm, từ điển chỉ giới hạn 4096 phần tử dùng để lưu lớn nhất là 4096 giá trị củacác từ mã Như vậy độ dài lớn nhất của từ mã là 12 bits (4096 = 212) Cấu trúc
từ điển như sau :
01
…
…
Chuỗi
Hình 1.7 Cấu trúc từ điển trong mã hóa LZW
Với 256 từ mã đầu tiên theo thứ tự 0 255 chứa các số nguyên từ 0 255.Đây là mã của 256 ký tự cơ bản trong mã ASCII Từ mã thứ 256 chứa một mã
đặc biệt gọi là “mã xoá” (CC-Clear Code) Mục đích việc dùng mã xóa nhằm
khắc phục tình trạng số mẫu lặp trong ảnh lớn hơn 4096 Khi đó một ảnh đượcquan niệm là nhiều mảnh ảnh, và từ điển là một bộ từ điển gồm nhiều từ điểncon Cứ hết một mảnh ảnh người ta lại gửi một mã xoá để báo hiệu kết thúcmảnh ảnh cũ, bắt đầu mảnh ảnh mới đồng thời khởi tạo lại từ điển cho mảnh
ảnh mới Từ mã thứ 257 chứa mã kết thúc thông tin (EOI- End of Information).
Các từ mã còn lại (từ 258 đến 4095) chứa các mẫu thường lặp lại trong ảnh
0
4095
Trang 27(Clear code) (End of Information) 0
4095
(Clear code) (End of Information) 0
4095
512 phần tử đầu tiên của từ điển biểu diễn bằng 9 bit Các từ mã từ 512 đến
1023 biểu diễn bởi 10 bit, từ 1024 đến 2047 biểu diễn bởi 11 bit và từ 2048 đến
4095 biểu diễn bởi 12 bit.
1.6 Một số kỹ thuật xử lý ảnh
1.6.1.Tăng giảm độ sáng
Giả sử ta có I với kích thước m × n và số nguyên c
Khi đó, kỹ thuật tăng, giảm độc sáng được thể hiện
for (i = 0; i < m; i + +)
for (j = 0; j < n; j + +) {
I [i, j] = I [i, j] + c;
}+ Nếu c > 0: Ảnh sáng lên
+ Nếu c < 0: Ảnh tối đi
n m TB
Trang 28TB
g t round g
Trang 291.6.3. Biến đổi thành ảnh âm bản
Ảnh âm bản có màu sắc là các màu bù của ảnh gốc Kỹ thuật này được biểu diễn như sau : F(I(x, y)) = L - I(x, y) với I(x, y) ∈ [0, L]
Ứng dụng : Nếu Min = 0, Max = 1 kỹ thuật chuyển ảnh thành ảnh đen
trắng được ứng dụng khi quét và nhận dạng văn bản có thể xảy ra sai sót nền thành ảnh hoặc ảnh thành nền dẫn đến ảnh bị đứt nét hoặc dính
1.6.5. Tăng giảm độ tương phản
Độ tương phản biểu diễn sự thay đổi sáng của đối tượng so với nền Ảnhvới độ tương phản thấp có thể do điều kiện sáng không đủ hay không đều, thiếuphạm vi động trong bộ cảm biến ảnh
Giả sử ta có ảnh I với kích thước m × n, tăng giảm độ tương phản đượcthể hiện qua công thức sau, áp dụng trên từng điểm ảnh :
F(I(x, y)) = αI(x, y) + βVới α , β là các hằng số, α > 1 độ tương phản tăng; α < 1 độ tương phản giảm
Trang 30CHƯƠNG II TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN
Cuộc cách mạng thông tin kỹ thuật số đã đem lại những thay đổi sâu sắctrong xã hội và trong cuộc sống của chúng ta, với sự ra đời của những máy tính
có tốc độ xử lý cao, các thiết bị mới như máy ảnh kỹ thuật số, máy quét chấtlượng cao, máy in, máy ghi âm kỹ thuật số, đã thúc đẩy việc phát triển cácphần mềm và nghiên cứu về dữ liệu đa phương tiện (multimedia) MạngInternet với sự phổ biến trên khắp thế giới đã, đang dần trở thành một môitrường trao đổi thông tin trong mọi lĩnh vực của cuộc sống như chính trị, quân
sự, quốc phòng, kinh tế, giải trí… Và chính trong môi trường mở và tiện nghinhư thế xuất hiện những vấn nạn, tiêu cực đang rất cần đến các giải pháp hữuhiệu cho vấn đề an toàn thông tin như nạn ăn cắp bản quyền, nạn xuyên tạcthông tin, truy nhập thông tin trái phép … Trên con đường đi tìm giải pháp chonhững vấn đề này, hình thức giấu tin mật đã ra đời với nhiều phương pháp,cách thức khác nhau liên tục được phát triển như giấu tin trong ảnh số, trong
âm thanh số, trong tệp văn bản, trong các dữ liệu đa phương tiện …
2.1 Giấu tin
2.1.1 Khái niệm giấu tin
Giấu thông tin (Datahiding) là một kỹ thuật nhúng thông tin (embeding) vào trong một đối tượng dữ liệu vỏ (host data) mà không gây ra sự nhận biết về
sự tồn tại của thông tin giấu (invisible).
Các yêu cầu đòi hỏi chính trong một giải thuật Datahiding chung là :
- Dung lượng chứa (capacity).
- Chất lượng tín hiệu mang (cover) sau khi nhúng còn gọi là khả năng vô hình (invisible).
- Tính bền vững trước các tác nhân tấn công (robust).
Trang 312.1.2 Mô hình tổng quan về giấu tin
Giấu thông tin vào phương tiện chứa và tách lấy thông tin ra là hai quátrình trái ngược nhau và có thể mô tả qua sơ đồ khối của hệ thống như sau :
Hình 2.1 Mô hình tổng quan về giấu tin
- Thông tin cần giấu tùy theo mục đích của người sử dụng, nó có thể làthông tin mật hay các logo, hình ảnh bản quyền, …
- Phương tiện chứa: Các tệp tin hình ảnh, văn bản, âm thanh… là môitrường để nhúng tin
- Bộ nhúng thông tin: Là những chương trình thực hiện việc giấu tin
- Đầu ra là các phương tiện chứa đã có tin giấu trong đó
Tách thông tin từ các phương tiện chứa diễn ra theo quy trình ngược lạivới đầu ra là các thông tin đã được giấu vào phương tiện chứa Phương tiệnchứa sau khi tách lấy thông tin có thể được sử dụng, quản lý theo những yêucầu khác nhau
Hình 2.2 Mô hình tổng quan về tách tin
Trang 32Lược đồ chỉ ra các công việc giải mã thông tin đã giấu Sau khi nhậnđược đối tượng chứa có giấu thông tin, quá trình giải mã được thực hiện thôngqua một bộ giải mã tương ứng với bộ nhúng thông tin cùng với khoá của quátrình nhúng Kết quả thu được gồm phương tiện chứa gốc và thông tin đã giấu.Bước tiếp theo thông tin đã giấu sẽ được xử lý kiểm định so sánh với thông tinban đầu.
2.1.3 Các yêu cầu đối với một hệ thống giấu tin
Ví dụ : Đối với các hệ thống giấu tin bền vững – Watermark sử dụng trong bảo
vệ bản quyền số, … thì yêu cầu về tính bền vững cao hơn so với các hệ thốnggiấu tin không bền vững – Steganography
2.1.3.2 Khả năng không bị phát hiện
Tính chất này thể hiện ở khả năng khó bị phát hiện, nghĩa là khó xácđịnh được một đối tượng có chứa thông tin mật hay không Để nâng cao khảnăng này, hầu hết các phương pháp ẩn dữ liệu dựa trên đặc điểm của hai hệ trigiác con người là : Hệ thị giác (HVS – Human Vision System), hệ thính giác(HAS) Đây là hai cơ quan chủ yếu được dùng để đánh giá chất lượng của mộttín hiệu
Khả năng khó bị phát hiện tin giấu phụ thuộc vào hai yếu tố sau :
- Kỹ thuật nhúng : Dữ liệu được nhúng phải phù hợp với đối tượng chứa và
thuật toán nhúng Để thực hiện tốt yêu cầu này, ngoài những kinh nghiệm
Trang 33Tính bảo mật thấp
Bản quyền Tính bảo mật cao
Tính bền vững
Khả năng lưu trữ
Khả năng không bị phát hiện
có trong lĩnh vực ẩn dữ liệu, người thực hiện cần phải có kiến thức về cácloại định dạng tệp tin Vì có thể với cùng một thông tin mật nhưng nó sẽ rấtkhó bị phát hiện trên đối tượng A, nhưng lại quá dễ thấy khi giấu vào đốitượng B
- Kinh nghiệm của kẻ tấn công : Nếu như kẻ tấn công có nhiều kinh nghiệm
thì khả năng phát hiện ra một đối tượng có chứa thông tin mật là có thể
2.1.3.3 Khả năng lưu trữ
Khả năng này thể hiện ở lượng thông tin của thông điệp mật có thểnhúng trong đối tượng chứa Do tính bảo mật nên khả năng lưu trữ luôn bị hạnchế Do đó trong trường hợp muốn ẩn một thông tin có kích thước tương đốilớn, ta thường chia làm nhiều phần và thực hiện nhúng từng phần
Trong thực tế, khi quyết định chọn phương pháp nào, ta thường lấy batiêu chí trên làm cơ sở Tùy thuộc vào từng ứng dụng mà người ta sẽ ưu tiêncho tiếu chí nào hơn Có thể minh họa tiêu chí trên như sau :
Hình 2.3 Mối tương quan giữa ba tiêu chí
Trang 342.1.3.4 Khả năng vô hình
Tùy theo mục đích sử dụng, yêu cầu về tính chất này khác nhau :
- Ứng dụng giấu tin mật : Thông tin mật được giấu phải tuyệt đối bí mật,phải ẩn trước các giác quan của con người, khi đó tiêu chí này được chú
ý nhiều
- Ứng dụng thủy vân số : Trong một ứng dụng, người dùng có thể đọcthấy thông tin thủy vân nhưng không chỉnh sửa được (thủy vân hiện),hoặc có những ứng dụng mà thông tin thủy vân được giữ bí mật, ẩntrước các giác quan của con người (thủy vân ẩn)
2.1.3.5 Tính bảo mật
Có nhiều mức bảo mật khác nhau nhưng nhìn chung có mức chính là :
- Người dùng hoàn toàn không biết đến sự tồn tại của tin mật
- Người dùng biết có thông tin mật nhưng phải có khóa truy cập
2.1.4 Phân loại giấu tin
Kỹ thuật giấu tin nhằm mục đích đảm bảo an toàn và bảo mật thông tin
ở hai khía cạnh:
- Bảo mật cho dữ liệu được đem giấu
- Bảo mật cho chính đối tượng được dùng để giấu tin
Sơ đồ phân loại các kỹ thuật giấu tin :
Trang 35Giấu tin mật
(Steganography)
Thuỷ vân số (Watermarking)
Giấu thông tin (Information hiding)
Thủy vân bền vững (Robust Watermarking)
Thủy vân dễ vỡ (Fragile Watermarking)
Hình 2.4 Mô hình phân loại giấu tin
Theo sơ đồ này thì kỹ thuật giấu tin được chia làm hai hướng kỹ thuậtchủ yếu là:
Giấu tin mật (Steganography): Là kỹ thuật nhúng thông tin mật vào
trong một nguồn đa phương tiện mà không để người khác nhận biết được về sựtồn tại của thông tin được giấu Kỹ thuật này đang được nghiên cứu và ứngdụng rất mạnh mẽ ở nhiều nước trên thế giới Khuynh hướng này tập trung vàocác kỹ thuật giấu tin sao cho thông tin giấu được càng nhiều càng tốt và quantrọng là người khác khó phát hiện được một đối tượng có bị giấu tin bên tronghay không bằng kỹ thuật thông thường
Thủy vân số (Watermarking): Trong kỷ nguyên số, thông tin số được
sử dụng rộng rãi trong một môi trường mở: tài nguyên được phân phối chonhiều người sử dụng, nhu cầu được bảo vệ bản quyền và sở hữu trí tuệ các sảnphẩm số đã trở thành một vấn đề quan trọng và được nhiều cơ sở nghiên cứuquan tâm Thuỷ ấn hay nhúng thuỷ vân trong một phương tiện là một côngnghệ mới được đánh giá mang lại nhiều hứa hẹn trong ứng dụng bảo vệ bảnquyền, phát hiện xuyên tạc, điều khiển truy cập đối với các dữ liệu đa phươngtiện Đánh giấu vào đối tượng nhằm khẳng định bản quyền của đối tượng chứathông tin tập chung đảm bảo một số các yêu cầu như đảm bảo tính bền vữngcủa thông tin giấu, đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân số Thủy
Trang 36vân số đựợc chia làm hai loại là thủy vân bền vững và thủy vân dễ vỡ Thủyvân bền vững cần bảo toàn được các thông tin thủy vân trước các tấn công nhưdịch chuyển, cắt xén, xoay đổi với ảnh.Ngược lại thủy vân dễ vỡ cần phải dễ bịphá hủy khi gặp các sự tấn công nói trên.
2.1.5 Ứng dụng thực tế của giấu tin
• Giấu thông tin mật: Các thông tin cần bảo mật được giấu trong các đối
tượng vỏ bọc và các đối tượng này có thể truyền công khai tới người nhận
mà không gây sự chú ý nào của các bên thứ ba Người nhận sẽ sử dụng cácthuật toán và khóa nào đó (đã thỏa thuận giữa người gửi và người nhận) đểkhôi phục lấy thông tin mật Yêu cầu kỹ thuật này là tỷ lệ giấu tin cần lớnnhưng bằng các giác quan không thể nhận thấy được sự khác biệt của đốitượng trước và sau khi giấu tin, về tính bền vững thì không cần yêu cầu caonhư đối với thủy vân số
• Bảo vệ bản quyền tác giả: Đây là ứng dụng phổ biến nhất của thủy vân số.
Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả được nhúng vàotrong các sản phẩm, thuỷ vân đó chỉ một mình người chủ sở hữu hợp phápcác sản phẩm đó có và được dùng làm minh chứng cho bản quyền sảnphẩm Giả sử có một thành phẩm dữ liệu dạng đa phương tiện như ảnh, âmthanh, video và cần được lưu thông trên mạng Để bảo vệ các sản phẩmchống lại các hành vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật để
“dán tem bản quyền” vào sản phẩm này Việc dán tem hay chính là việcnhúng thuỷ vân cần phải đảm bảo không để lại một ảnh hưởng lớn nào đếnviệc cảm nhận sản phẩm Yêu cầu kỹ thuật đối với ứng dụng này là thuỷvân phải tồn tại bền vững cùng với sản phẩm, muốn bỏ thuỷ vân này màkhông được phép của người chủ sở hữu thì chỉ còn cách là phá huỷ sảnphẩm
• Nhận thực thông tin hay phát hiện xuyên tạc thông tin: Một tập các thông
tin sẽ được giấu trong phương tiện chứa sau đó được sử dụng để nhận biếtxem dữ liệu trên phương tiện gốc đó có bị thay đổi hay không Các thuỷ vânnên được ẩn để tránh được các tấn công cố ý phá hủy, thay đổi thủy vân,
Trang 37hơn nữa việc làm giả các thuỷ vân hợp lệ hay xuyên tạc thông tin nguồncũng rất được quan tâm Trong các ứng dụng thực tế, người ta mong muốntìm được vị trí bị xuyên tạc cũng như phân biệt được các thay đổi (ví dụnhư phân biệt xem một đối tượng đa phương tiện chứa thông tin giấu đã bịthay đổi, xuyên tạc nội dung hay là chỉ bị nén mất dữ liệu) Yêu cầu chungđối với ứng dụng này là khả năng giấu thông tin cao và thuỷ vân không cầnbền vững.
• Điều khiển truy cập: Các thuỷ vân trong những trường hợp này được sử
dụng để điều khiển truy cập đối với các thông tin Các thiết bị phát hiện rathuỷ vân thường được gắn sẵn vào trong các hệ thống đọc ghi Ví dụ như hệthống quản lí sao chép DVD đã được ứng dụng ở Nhật Các ứng dụng loạinày cũng yêu cầu thuỷ vân phải được bảo đảm an toàn và cũng sử dụngphương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc
• Giấu vân tay hay dán nhãn: Thuỷ vân trong những ứng dụng này đựơc sử
dụng để nhận diện người gửi hay người nhận của một thông tin nào đó Ví
dụ như các vân khác nhau sẽ được nhúng vào các bản sao khác nhau củathông tin gốc trước khi chuyển cho nhiều người Với những ứng dụng nàythì yêu cầu là đảm bảo độ an toàn cao cho các thuỷ vân tránh sự xoá giấuvết trong khi phân phối
2.2 Giấu tin trong dữ liệu đa phương tiện
2.2.1 Khái niệm về đa phương tiện
Đa phương tiện (Multimedia) là nhiều hệ thống truyền thông, các dữ liệu hay thông tin đa phương tiện gồm : văn bản (text), hình họa (graphic), hoạt hình (animation), ảnh chụp (image), audio, video,
2.2.2 Giấu tin trong ảnh số
Giấu thông tin trong ảnh, hiện nay, là một bộ phận chiếm tỉ lệ lớn nhấttrong các chương trình ứng dụng, các phần mềm, hệ thống giấu tin trong đaphương tiện bởi lượng thông tin được trao đổi bằng ảnh là rất lớn và hơn nữa
Trang 38giấu thông tin trong ảnh cũng đóng vai trò hết sức quan trọng trong hầu hết cácứng dụng bảo vệ an toàn thông tin như : xác thực thông tin, xác định xuyên tạcthông tin, bảo vệ bản quyền tác giả, điều khiển truy cập, giấu thông tin mật Chính vì thế mà vấn đề này đã nhận được sự quan tâm rất lớn của các cá nhân,
tổ chức, trường đại học, và viện nghiên cứu trên thế giới
Ngày nay, khi ảnh số đã được sử dụng rất phổ biến, thì giấu thông tintrong ảnh đã đem lại rất nhiều những ứng dụng quan trọng trên nhiều lĩnh vựctrong đời sống xã hội Ví dụ như đối với các nước phát triển, chữ kí tay đãđược số hoá và lưu trữ sử dụng như là hồ sơ cá nhân của các dịch vụ ngân hàng
và tài chính, nó được dùng để xác thực trong các thẻ tín dụng của người tiêudùng Phần mềm WinWord của MicroSoft cũng cho phép người dùng lưu trữchữ kí trong ảnh nhị phân rồi gắn vào vị trí nào đó trong tệp tin văn bản để đảmbảo tính an toàn của thông tin Tài liệu sau đó được truyền trực tiếp qua máyfax hoặc lưu truyền trên mạng Theo đó, việc xác thực chữ kí, xác thực thôngtin đã trở thành một vấn đề cực kì quan trọng khi mà việc ăn cắp thông tin hayxuyên tạc thông tin bởi các tin tặc đang trở thành một vấn nạn đối với bất kìquốc gia nào, tổ chức nào Thêm vào đó, lại có rất nhiều loại thông tin quantrọng cần được bảo mật như những thông tin về an ninh, thông tin về bảo hiểmhay các thông tin về tài chính, các thông tin này được số hoá và lưu trữ trong
hệ thống máy tính hay trên mạng, do đó chúng rất dễ bị lấy cắp và bị thay đổibởi các phần mềm chuyên dụng Việc xác thực cũng như phát hiện thông tinxuyên tạc đã trở nên vô cùng quan trọng, cấp thiết
2.2.3 Giấu tin trong audio
Giấu thông tin trong audio mang những đặc điểm riêng khác với giấuthông tin trong các đối tượng đa phương tiện khác Một trong những yêu cầu cơbản của giấu tin là đảm bảo tính chất ẩn của thông tin được giấu đồng thờikhông làm ảnh hưởng đến chất lượng của dữ liệu gốc Để đảm bảo yêu cầunày, kỹ thuật giấu thông tin trong ảnh phụ thuộc vào hệ thống thị giác của conngười - HVS (Human Vision System) còn kỹ thuật giấu thông tin trong audiolại phụ thuộc vào hệ thống thính giác HAS (Human Auditory System) Và một
Trang 39vấn đề khó khăn ở đây là hệ thống thính giác của con người nghe được các tínhiệu ở các giải tần rộng và công suất lớn nên đã gây khó dễ đối với các phươngpháp giấu tin trong audio Nhưng thật may là HAS lại kém trong việc phát hiện
sự khác biệt các dải tần và công suất điều này có nghĩa là các âm thanh to, caotần có thể che giấu được các âm thanh nhỏ thấp một cách dễ dàng Các mô hìnhphân tích tâm lí đã chỉ ra điểm yếu trên và thông tin này sẽ giúp ích cho việcchọn các audio thích hợp cho việc giấu tin
Vấn đề khó khăn thứ hai đối với giấu thông tin trong audio là kênhtruyền tin Kênh truyền hay băng thông chậm sẽ ảnh hưởng đến chất lượngthông tin sau khi giấu Ví dụ để nhúng một đoạn java applet vào một đoạnaudio (16 bit, 44.100 Hz) có chiều dài bình thường thì các phương pháp nóichung cũng cần ít nhất là 20 bit/s và điều đó thì không hề dễ dàng
Giấu thông tin trong audio đòi hỏi yêu cầu rất cao về tính đồng bộ vàtính an toàn của thông tin Các phương pháp giấu thông tin trong audio chủ yếuđều lợi dụng điểm yếu trong hệ thống thính giác của con người
2.2.4 Giấu tin trong video
Cũng giống như giấu thông tin trong ảnh hay trong audio, giấu tin trongvideo cũng được quan tâm và được phát triển mạnh mẽ cho nhiều ứng dụngnhư điều khiển truy cập thông tin, nhận thực thông tin và bảo vệ bản quyền tácgiả Ta có thể lấy một ví dụ là các hệ thống chương trình trả tiền xem theo đoạnvới các video clip Các kỹ thuật giấu tin trong video cũng được phát triển mạnh
mẽ và cũng theo hai khuynh hướng là thuỷ vân số và giấu thông tin mật Cónhiều phương pháp giấu tin trong video đã được đưa ra, một trong nhữngphương pháp giấu tin trong video được đưa ra bởi Cox là phương pháp phân bốđều Ý tưởng cơ bản của phương pháp này là phân phối thông tin giấu dàn trảitheo tần số của dữ liệu gốc Nhiều nhà nghiên cứu đã dùng những hàm cosinriêng và các hệ số truyền sóng riêng để giấu tin Trong các thuật toán khởinguồn thì thường các kỹ thuật cho phép giấu các ảnh vào trong video nhưngthời gian gần đây các kỹ thuật cho phép giấu cả âm thanh và hình ảnh vào
Trang 40video Như phương pháp của Swanson đã sử dụng phương pháp giấu theo khối,phương pháp này đã giấu được hai bit dữ liệu vào khối 8*8 Hay gần đây nhất
là phương pháp của Mukherjee là kỹ thuật giấu audio vào video sử dụng cấutrúc lưới đa chiều Kỹ thuật giấu thông tin trong video áp dụng cả đặc điểm thịgiác và thính giác của con người
2.2.5 Giấu tin trong văn bản
Giấu tin trong văn bản khó thực hiện hơn do có ít các thông tin dư thừa,không quan trọng Để làm được điều này người ta phải khéo léo khai thác các
dư thừa tự nhiên của ngôn ngữ, tận dụng các định dạng văn bản, ẩn dữ liệu giấudựa trên các lỗi đánh máy, ngữ pháp thường gặp, ví dụ có thể mã hóa thông tinvào khoảng cách giữa các từ hay các dòng văn bản
2.3 Một số kỹ thuật giấu tin cơ bản
2.3.1 Kỹ thuật chèn (Injection/Insertion)
Kỹ thuật Injection hay còn gọi là kỹ thuật Insertion – Sự thêm vào, sửdụng kỹ thuật này để giấu dữ liệu ẩn vào một đoạn của tệp tin, mà đoạn đó hầunhư không được để ý trong các ứng dụng xử lý Bằng cách làm này, có thểtránh được sự thay đổi những bit của tệp tin đó Ví dụ có thể cộng thêm mộtlượng dữ liệu vô hại vào một tệp tin thực thi hay tệp tin nhị phân, bởi vì lượng
dữ liệu đó không ảnh hưởng tới quá trình xử lý, đồng thời người sử dụng cũngkhông thể nhận ra được rằng tệp tin đó đã chứa các dữ liệu đã được cộng thêmvào Mặc dù vậy khi sử dụng kỹ thuật này thì nó sẽ làm tăng kích thước của tệptin chứa tin đó, tăng rất nhiều nếu số lượng tin giấu lớn và do đó sẽ gây ra sựnghi ngờ Nếu ứng dụng kỹ thuật này vào giấu tin trong ảnh số thì chỉ có thểgiấu tin với số lượng có hạn nhất định và không mang tính an toàn cao, nếu bịphát hiện có thể dễ dàng loại bỏ tin giấu
2.3.2 Kỹ thuật thay thế (Substiuation)
Kỹ thuật này có nghĩa là sự thay thế Phương pháp này sử dụng việcthay thế các thông tin ít quan trọng trong việc quyết định nội dung của tệp tin