2. Với mọi 1 £ i < n, p i+1 là láng giềng của p i ; nếu p i = (x i , y i ) và p i+1 = (x i+1 ,y i+1 ) thì (x i+1 ,y i+1 ) thoả mãn 1 trong các điều kiện sau đây: (x i+1 ,y i+1 ) = (x i +1,y i ) (x i+1 ,y i+1 ) = (x i -1,y i ) (x i+1 ,y i+1 ) = (x i ,y i +1) (x i+1 ,y i+1 ) = (x i ,y i -1) (x i+1 ,y i+1 ) = (x i +1,y i +1) (x i+1 ,y i+1 ) = (x i +1,y i -1) (x i+1 ,y i+1 ) = (x i -1,y i +1) (x i+1 ,y i+1 ) = (x i -1,y i -1) Cái mà định nghĩa trên đây đề cập đến là với hai điểm bất kỳ của tập các điểm ảnh đang xem xét trong hình dạng, tồn tại một đường đi giữa chúng và nó nằm hoàn toàn trong hình dạng. Định nghĩa 3.4 Chữ nhật là hình dạng đối tượng, P, mà tồn tại các số nguyên XLB, XUB, YLB, YUB thoả mãn P={(x, y) | XLB £ x <XUB & YLB £ y < YUB} Định nghĩa 3.5 CSDL ảnh (IDB-Image Database) bao gồm bộ ba (GI, Prop, Rec) trong đó: 1. GI là tập các ảnh lưới có dạng (Image, m, n), 2. Prop là tập các đặc tính tế bào, và 3. Rec là ánh xạ để kết hợp tập các chữ nhật mô tả đối tượng trong mỗi ảnh. Chú ý rằng nếu biểu diễn dữ liệu ảnh theo hình thức trên đây thì phải quan tâm đến hai nhân tố quan trọng: · Ảnh thường là đối tượng rất lớn bao gồm trường (p 1 x p 2 ) pixel. Việc lưu trữ các đặc tính trên cơ sở pixel là không hiện thực. Do vậy phải sử dụng các giải thuật nén ảnh. · Cho trước ảnh I (nén hay để thô), điều quan trọng là phải xác định đặc trưng nào xuất hiện trong ảnh. Việc này thường được thực hiện bằng cách chia ảnh thành tập các vùng chữ nhật đồng nhất, mỗi chúng được gọi là đoạn (segment). Tiến trình tìm kiếm các đoạn này gọi là phân đoạn ảnh (segmentation). Một khi dữ liệu ảnh được phân đoạn, ta cần có thao tác khớp ảnh (match) để ánh xạ toàn bộ hay một phần ảnh này với toàn bộ hay một phần ảnh khác. 3.2 Biểu diễn ảnh nén Error! Hãy xem xét ảnh hai chiều I có (p 1 x p 2 ) pixel. I(x, y) mô tả một hay nhiều thuộc tính của pixel. Thí dụ, I(x, y) có thể có giá trị trong khoảng [0, 255] để biểu diễn mã hóa giá trị RGB của ảnh. Tổng quát thì lập luận về ảnh bằng xem xét mọi pixel là không thực tế bởi vì mỗi p 1 và p 2 có thể có tới 1024 hay nhiều hơn. Dẫn tới có đến hàng triệu phần tử trong ma trận ảnh I. Quan điểm chung là biến đổi ma trận I thành biểu diễn nén của ma trận như hình 3.2. Việc tạo lập biểu diễn nén (Compressed Representation) cr(I) của ảnh I bao gồm hai phần: 1. Chọn kích thước. Người thiết kế CSDL ảnh chọn kích thước h cho ảnh nén. Kích thước ảnh càng lớn thì càng có ảnh gần gũi với ảnh gốc. Tuy nhiên khi kích thước tăng thì việc làm chỉ số cho biểu diễn ảnh càng phức tạp. Do vậy phải cân bằng các yếu tố. Giả sử rằng kích thước lựa chọn cho cr(I) là cặp số nguyên dương (h 1 , h 2 ). 2. Lựa chọn phép biến đổi. Người sử dụng phải lựa chọn phép biến đổi để có khả năng chuyển đổi ảnh thành dạng nén. Nói cách khác, họ phải chọn phép biến đổi sao chovới ảnh I cho trước và bất kỳ cặp số 1£i£h 1 và 1£j£h 1 , thì sẽ xác định được giá trị cr(i, j) nào đó. 3.2.1 Biến đổi Fourier rời rạc (DFT - Discrete Fourier Transform) Error! Đây là biến đổi rất nổi tiếng, được nghiên cứu khá nhiều. Theo biến đổi Fourier rời rạc ta có: trong đó, j là số phức Error! . DFT có rất nhiều đặc tính hay. Thí dụ, có thể khôi phục ảnh gốc I từ biểu diễn DFT. Cho trước ảnh I với (p 1 x p 2 ) và biểu diễn DFT(I), ta có thể áp dụng đảo DFT (ký hiệu là DFT -1 ) lấy bất kỳ điểm ảnh (x, y) nào trong I làm đầu vào và sử dụng giá trị của DFT(x, y) để tính các giá trị của ảnh gốc. Đặc tính này của DFT có thể ứng dụng vào nén và giải nén ảnh. Nhưng chú ý rằng, không phải tất cả các lược đồ nén đều được 100% biến đổi ngược, như vậy một số dữ liệu bị mất mát. 3.2.2 Biến đổi cosin rời rạc (DCT – Discrete Cosine Transform) Error! Đây là giải thuật nổi tiếng, là nền tảng của nén ảnh JPEG. Tương tự DFT, DCT có thể lấy đảo và cho bởi Error! trong đó, Việc tính toán DCT được thực hiện khá nhanh. Cả DFT và DCT thường được cải tiến nhằm tính toán nhanh hay nâng cao chất lượng nén. Nhóm kỹ thuật nén ảnh khác hay được sử dụng là dựa trên biến đổi wavelet. Error! Giả sử IDB là tập hợp các ảnh và các vùng quan tâm được đánh dấu bởi các chữ nhật như trên hình 3.3. Giả sử r 1 , , r n là các vùng quan tâm. Sau đó tập {cr(r 1 ), ,cr(r n )} được biểu diễn dễ dàng bởi các kỹ thuật chỉ số hóa đa chiều (thí dụ cây R). 3.3 Xử lý ảnh: Phân đoạn Cho đến bây giờ ta đã giả sử rằng các vùng trong ảnh nơi chứa các đặc trưng quan tâm, có thể nhận ra bằng cách nào đó, và nội dung của các vùng quan tâm được xác định bằng cách nào đó. Phần này khảo sát nhanh cách phân chia ảnh cho trước thành các vùng đồng nhất, gọi chúng là đoạn (segment). Giả sử ảnh I chứa (m x n) tế bào. Trường hợp tồi nhất là tế bào tương ứng pixel, nhưng tổng quát thì tế bào là tập chữ nhật các pixel. Vùng liên thông  trong ảnh I là tập các tế bào mà nếu các tế bào (x 1 , y 1 ), (x n , y n )ÎÂ, tồn tại trật tự các tế bào C 1 , ,C n trong  thoả mãn 1. C 1 =(x 1 ,y 1 ) và 2. C n =(x n ,y n ) và 3. khoảng cách Euclidean giữa C i và C i+1 với mọi 1£ i<n là 1. Hình 3.4 chỉ ra ba vùng R1, R2, R3, mỗi chúng là vùng liên thông. Hơn nữa, ta có: 1. (R 1 ÈR 2 ) là vùng liên thông. 2. (R 2 ÈR 3 ) là vùng liên thông. 3. (R 1 ÈR 2 ÈR 3 ) là vùng liên thông. 4. Nhưng (R 1 ÈR 3 ) không phải là vùng liên thông. Khoảng cách Đề các giữa tế bào (2,3) của R 1 và (3,4) của R 3 là Error! Thuộc tính đồng nhất kết hợp với ảnh I là hàm H lấy vùng liên thông bất kỳ  trong ảnh I làm đầu vào và cho lại “true” hay “false”. Dưới đây là các thí dụ về tính chất đồng nhất: 1. Giả sử d là số thực trong khoảng từ 0 đến 1 và ảnh khảo sát là ảnh đen-trắng. Có thể định nghĩa tính chất đồng nhất Error! như sau: Error! cho lại “true” nếu trên (100*d)% của tế bào trong vùng R có cùng màu. Giả sử ta mô tả ba vùng như biểu diễn trong bảng dưới đây: Vùng Tổng số pixel đen Tổng số pixel trắng Error! R 1 800 200 R 2 900 100 R 3 100 900 Error! Giả sử ta xem xét một vài tính chất khác như Error! , Error! và Error! . Bảng sau đây chỉ ra cho chúng ta thấy kết quả các thuộc tính đồng nhất cho lại: Vùng Error! Error! Error! Error! R 1 true false false R 2 true true false Error! R 3 true true false 2. Error! Giả sử ảnh xem xét với các pixel có giá trị thực giữa từ 0 đến 1. Giá trị này ta gọi là mức đen trắng (b-w level). Giá trị 0 mô tả trắng, 1 mô tả đen và độ xám được biểu diễn bởi giá trị nào đó xác định trong khoảng 0 và 1. Hãy khảo sát tính đồng nhất khác chút ít so với trên đây. Ta có hàm f thực hiện gắn các số từ 0 đến 1 vào từng pixel. Hơn nữa, ta còn có hệ số nhiễu (noise factor) 0£h£1, và mức ngưỡng d như trường hợp trên đây. Error! là true nếu . (x i+1 ,y i+1 ) = (x i -1 ,y i ) (x i+1 ,y i+1 ) = (x i ,y i +1) (x i+1 ,y i+1 ) = (x i ,y i -1 ) (x i+1 ,y i+1 ) = (x i +1,y i +1) (x i+1 ,y i+1 ) = (x i +1,y i -1 ) (x i+1 ,y i+1 ) = (x i -1 ,y i +1) (x i+1 ,y i+1 ). (x i+1 ,y i+1 ) = (x i +1,y i -1 ) (x i+1 ,y i+1 ) = (x i -1 ,y i +1) (x i+1 ,y i+1 ) = (x i -1 ,y i -1 ) Cái mà định nghĩa trên đây đề cập đến là với hai điểm bất kỳ của tập các điểm ảnh đang. CSDL ảnh (IDB-Image Database) bao gồm bộ ba (GI, Prop, Rec) trong đó: 1. GI là tập các ảnh lưới có dạng (Image, m, n), 2. Prop là tập các đặc tính tế bào, và 3. Rec là ánh xạ để kết hợp tập các