MultiBooks - Tổng hợp IT - PC part 15 ppsx

d(x,x)=0 Gọi d Obj là hàm khoảng cách trong không gian mọi đối tượng. Tuy nhiên, chương trước cho ta thấy đối tượng được xem như tập các điểm trong không gian k-chiều với k=n+2. Do vậy việc tính toán cho d Obj là khá phức tạp. Error! Thí dụ, hãy xem xét tập Obj gồm các ảnh với kích thước (256x256), có ba thuộc tính (red, green, blue) được gán giá trị từ tập {0, , 7}. Ta định nghĩa hàm khoảng cách d 1 giữa hai ảnh như sau: Rõ ràng tính toán trên là tiến trình khá nặng nề bởi vì tổng kép này dẫn tới 65536 phép tính. Ngay việc sử dụng cấu trúc dữ liệu cây R hay cây tứ phân nào đó cũng không cho kết quả khả quan. Để giải quyết vấn đề này, nhiều nhà nghiên cứu đã gợi ý kỹ thuật quan trọng khác thay thế. Các kỹ thuật này hình thành dựa trên việc sử dụng hàm tách đặc trưng “tốt” có tên fe (Feature Extraction Function). Thí dụ các hàm này có thể là DFT và DCT. Dựa trên quan điểm này, hàm fe ánh xạ các đối tượng vào các điểm đơn trong không gian s-chiều, trong đó s thông thường hơi nhỏ so với (n+2). Do vậy có thể có hai rút gọn có thể đạt được: 1. Hãy nhớ lại rằng đối tượng o là tập các điểm trong không gian (n+2) chiều. Ngược lại, fe(o) là điểm đơn. 2. fe(o) là điểm trong không gian s chiều và s<<(n+2). Hình 3.7 biểu diễn tiệm cận thước đo. Ý tưởng cơ bản là trước hết ánh xạ các đối tượng vào các điểm trong không gian s chiều, sau đó tổ chức mọi đối tượng nhờ cấu trúc dữ liệu không gian như cây R. Tuy nhiên, bằng trực giác thì ánh xạ có thể bảo toàn khoảng cách: Nếu o 1 , o 2 , o 3 là các đối tượng mà d(o 1 , o 2 )£d(o 1 , o 3 ) thì d’(fe(o 1 ), fe(o 2 ))£d’(fe(o 1 ), fe(o 3 )), trong đó d là thước đo trong không gian gốc n+2 chiều và d’ là thước đo trong không gian mới s chiều. Nói cách khác, ánh xạ tách đặc trưng có thể bảo toàn quan hệ khoảng cách trong không gian gốc. Error! Kết quả là, cho trước đối tượng truy vấn o, ta chuyển đổi o sang fe(o) và thử tìm ra điểm p trong không gian s-d sao cho d’(p,fe(o)) nhỏ nhất có thể. Thuật toán hình thức dưới đây sử dụng ký pháp d làm thước đo trong không gian (n+2)-d và d’ là thước đo trong không gian s ít chiều hơn. Thuật toán 3.2 IndexCreation Input: Obj - tập các đối tượng. 1. T=NIL. (* T là cây tứ phân hay cây R rỗng cho dữ liệu s-chiều*) 2. if Obj=Æ then return T and Halt 3. else a. Compute fe(o). b. Insert fe(0) into T. c. Obj=Obj-{0}. d. Go to 2. Tiến trình hình thức để tìm câu trả lời tốt nhất khi truy vấn đối tượng thể hiện bằng giải thuật sau: Thuật toán 3.3 FindMostSimilarObject Input: Cây T có kiểu đã mô tả trên đây, đối tượng o. 1. bestnode=NIL; 2. if T=NIL then return bestnode. Halt 3. else tìm láng giềng trong T gần fe(o) nhất nhờ kỹ thuật tìm kiếm láng giềng gần nhất. Nếu tồn tại nhiều láng giềng như vậy thì trả lại tất cả chúng. Để tìm mọi đối tượng tương tự khi truy vấn đối tượng trong khoảng cho trước e, ta có thể sử dụng tiệm cận trên cơ sở truy vấn khoảng. Giả sử rằng o 1 , o 2 trong Obj ta có d(o 1 , o 2 ) £ d’(fe(o 1 ),fe(o 2 )) Giải thuật 3.4 FindSimilarObjects Input: Cây T có kiểu như trên. Đối tượng o. Dung sai 0< e£ 1. 1. Thực hiện truy vấn khoảng trên cây T với tâm fe(o) và bán kính e. 2. Gọi p 1 , ,p r là các điểm cho lại. 3. for i=1 to r do a. if d(o, fe -1 (p i )) £e then print fe -1 (p i ). Giải thuật trên đây của Faloutsos chỉ làm việc khi thước đo khoảng cách trong không gian có kích thước nhỏ (thí dụ, không gian s) lớn hơn hoặc bằng thước đo khoảng cách d. 3.4.2 Tiệm cận biến đổi Tiệm cận trên cơ sở biến đổi là tổng quát hơn tiệm cận thước đo. Cho trước hai đối tượng o 1 , o 2 , mức không tương tự giữa chúng tương ứng với giá (tối thiểu) của biến đổi đối tượng o 1 vào o 2 , hoặc ngược lại. Trong mô hình này tồn tại tập các toán tử biến đổi to 1 , ,to r . Trong trường hợp ảnh, các toán tử này có thể là dịch chuyển, quay và co dãn. Toán tử mở rộng cũng có thể được bao gồm việc sửa đổi một hình dạng bằng cách thêm hình dạng mới vào nó. Toán tử cắt có thể lựa chọn hình dạng từ đối tượng đang tồn tại. Người sử dụng có thể lựa chọn ra tập con của các toán tử để sử dụng. Hơn nữa họ có thể bổ sung toán tử mới nếu họ muốn. Mỗi toán tử có một hàm đánh giá (cost) kết hợp. Chi phí (cost) càng cao thì thao tác càng ít có cơ hội được sử dụng.Thí dụ ta có hàm tên là paint với bốn đối số: paint(color1, val1, color2, val2), giá của hàm này được xác định như sau: cost(paint(color1, val1, color2, val2))=diff(color1, color2) 3 +(val1-val2) 2 trong đó, diff(red, green)=3=diff(green, red), Biến đổi đối tượng o thành đối tượng o’ là trật tự các thao tác biến đổi to 1 , ,to r và trật tự các đối tượng o 1 , ,o r sao cho 1. to 1 (o)=o, 2. to i (o i-1 )=o i , và 3. to(o r )=o’. Error! Chi phí của trình tự biến đổi trên đây (Transformation Sequence – TS) được tính như sau: Error! Chú ý rằng có thể có 1, 2, nhiều hay không có trình tự biến đổi nào cho phép ta chuyển đổi đối tượng o thành đối tượng o’. Giả sử TSeq(o,o’) là tập các trình tự biến đổi để chuyển đổi từ o sang o’. Tính không đồng dạng (dissimilarity) giữa o và o’, ký hiệu là dis(o,o’), đối với tập toán tử biến đổi TR và tập hàm chi phí CF được xác định như sau: Thí dụ ta xem xét hai đối tượng o, o’ trên hình 3.8. Hãy khảo sát một vài cách biến đổi từ đối tượng này sang đối tượng khác. 1. TS 1 : Trình tự biến đổi này bao gồm thao tác co dãn (co phần tô vạch ngang 50%), tiếp theo thực hiện thao tác co dãn khác (dãn phần tô dọc 100%). Thao tác thứ ba là tô (paint) để tô hai pixel tô dọc sử dụng mẫu tô ô vuông. Hình 3.9 mô tả từng bước của cách làm này. 2. TS 2 : Trình tự biến đổi theo cách này bao gồm thao tác co dãn (co phần tô ngang 50%). Sau đó áp dụng thao tác paint để tô vùng sọc đứng sử dụng mẫu tô ô vuông. Cuối cùng áp dụng thao tác co dãn (dãn phần gạch ô vuông 100%). Hình 3.10 mô tả các bước này. Nếu hàm giá (cost function) kết hợp với co dãn không đồng nhất là độc lập với màu và thao tác paint chỉ đơn thuần đếm tổng số pixel đang được tô, thì dễ dàng thấy rằng biến đổi TS 2 bao gồm các biến đổi với giá rẻ hơn (vì tô ít hơn TS 1 một pixel). Mô hình biến đổi có độ mềm dẻo cao hơn mô hình thước đo theo hai lý do sau đây: 1. Người sử dụng có thể đưa ra quan điểm về tính tương tự bằng cách chỉ ra các toán tử biến đổi nào được sử dụng hay không được sử dụng. 2. Người sử dụng có thể kết hợp với mỗi thao tác biến đổi một hàm giá để đánh giá mỗi thao tác được áp dụng, phụ thuộc vào các đối số của tóan tử biến đổi. Điều này cho phép người sử dụng có thể có quan điểm cá nhân về tương tự theo nhu cầu của họ. Mô hình trên cơ sở thước đo có hai lợi thế: Trước hết, bắt buộc người sử dụng chỉ sử dụng một thước đo tính tương tự (hay tính khác biệt), hệ thống có thể dễ dàng chỉ số hóa dữ liệu để tối ưu thao tác tìm kiếm đối tượng láng giềng gần nhất. Lợi thế thứ hai, việc tính toán để hiệu quả là tương đối dễ. 3.5 Các hình mẫu khác của CSDL ảnh Phần này phải trả lời câu hỏi: Tập ảnh được lưu trữ như thế nào để hỗ trợ các thao tác truy vấn ảnh? Tổng quát thì có nhiều cách biểu diễn CSDL ảnh: · Biếu diễn IDB (Image Database) như các quan hệ: Cách dễ làm nhất là biểu diễn IDB như tập các quan hệ. · Biểu diễn IDB bằng các cấu trúc dữ liệu không gian: Ý tưởng cơ bản của kỹ thuật này khá đơn giản. Nếu mọi đối tượng được biểu diễn bằng chữ nhật (hay khái quát hóa chữ nhật thành không gian có số chiều cao hơn), thì ta có thể biểu diễn tập chữ nhật nhờ các cấu trúc dữ liệu không gian như cây R · Biểu diễn IDB bằng biến đổi ảnh: Ý tưởng cơ bản của phương pháp này xuất phát từ số lượng pixel trọng yếu trong ảnh (thí dụ,1024x1024) là rất lớn. Tuy nhiên, có thể tồn tại tính tương tự giữa các phần khác nhau của ảnh. Ta có thể biểu diễn ảnh bằng nén nội dung cơ bản thành véctơ đơn có giá trị thực với độ dài k (người thiết kế lựa chọn k)? Thông thường, k nhỏ hơn 100 hay 200, thủ tục tính các giá trị véctơ được thực hiện thông qua biến đổi như DFT hat DCT. Khi truy vấn ảnh, tính chất ảnh phụ thuộc vào các hệ số như điều kiện ánh sáng, vị trí máy chụp, vị trí vật thể Thí dụ trong CSDL ảnh mặt người đang khảo sát, hai ảnh của cùng một người có thể khác nhau, nó phụ thuộc vào các hệ số thực tế như thời gian chụp, ánh sáng, máy ảnh Do vậy, CSDL ảnh phải có khả năng truy vấn dữ liệu trên cơ sở tính tương tự giữa ảnh truy vấn và ảnh chứa trong CSDL ảnh. . Obj - tập các đối tượng. 1. T=NIL. (* T là cây tứ phân hay cây R rỗng cho dữ liệu s-chiều*) 2. if Obj=Æ then return T and Halt 3. else a. Compute fe(o). b. Insert fe(0) into T. c. Obj=Obj-{0} tìm ra điểm p trong không gian s-d sao cho d’(p,fe(o)) nhỏ nhất có thể. Thuật toán hình thức dưới đây sử dụng ký pháp d làm thước đo trong không gian (n+2)-d và d’ là thước đo trong không. kính e. 2. Gọi p 1 , ,p r là các điểm cho lại. 3. for i=1 to r do a. if d(o, fe -1 (p i )) £e then print fe -1 (p i ). Giải thuật trên đây của Faloutsos chỉ làm việc khi thước đo khoảng cách

Định dạng
Số trang	6
Dung lượng	198,76 KB