-62- TÌM HIỂUPHƯƠNGPHÁP TÌM KIẾM ẢNHTHEONỘIDUNG Đỗ Khắc Sĩ MSV: 0320258 Email: sydk@fpt.com.vn Người hướng dẫn: PGS.TS. Ngô Quốc Tạo 1. Giới thiệu Tìm kiếm ảnhtheonộidung là một đề tài mới, phức tạp. Việc tìm kiếm một bức ảnh với độ chính xác cao là rất khó. Để giải quyết vấn đề này tôi nghiên cứu một phươngpháp tìm kiếm ảnh dựa trên các đặc trưng màu sắc, kết cấu và hình thù. Theo cách tìm kiếm này ảnh thu được sẽ có các đặc trưng về màu sắc, hình thù và kết cấu tương tự với ảnh đầu vào. 2. Cơ sở lý thuyết Tìm kiếm ảnh dựa trên các đặc trưng màu sắc, kết cấu và hình thù là cách tiếp cận tương đối phổ biến và đang được hầu hết các hệ thống tìm kiếm ảnh lớn trên thế giới áp dụng. Phươngpháp này thực hiện việc tìm kiếm ảnh bằng cách tính khoảng cách của bức ảnh đầu vào với mỗi bức ảnh trong cơ sở dữ liệu. Kết quả trả về là những bức ảnh có khoảng cách gần nhất so với ảnh đầu vào. Khoảng cách mỗi bức ảnh sẽ được tính dựa trên khoảng cách các đặc trưng màu sắc, kết cấu, hình thù và độ ưu tiên của mỗi đặc trưng. Các bước trong quá trình so sánh hai ảnh: tính khoảng cách đặc trưng màu, tính khoảng cách kết cấu, tính khoảng cách hai ảnh. Phươngpháp này tương đối phù hợp với việc tìm ki ếm ảnh có nộidung tương tự ảnh đầu vào. 3. Phươngpháp tìm kiếm ảnhtheonộidung Giải pháp được tôi lựa chọn để giải quyết việc tìm kiếm ảnhtheonộidung là tính khoảng cách ảnhtheo các đặc trưng màu sắc, kết cấu và hình thù. Cơ sở dữ liệu lưu ảnh mẫu bao gồm thông tin và nộidungảnh nguyên gốc do người sử dụng đưa vào. Ngòai ra cơ sở dữ liệu còn chứa ảnh mẫu đã được chuyển đổi về định dạng, kích thước về chuẩn chung nhằm phục vụ cho việc tính khoảng cách nhanh hơn, chính xác hơn. Mỗi quá trình tìm kiếm ảnh gồm các bước: đưa ảnh đầu vào, chuyển đổi về định dạng chuẩn, tính khoảng cách với mỗi ảnh trong cơ sở dữ liệu. Việc tính khoảng cách ảnh so với ảnh cơ sở dữ liệu gồm các bước chính: tính khoảng cách mầu, tính khoảng cách kết cấu. Sau đó tổng hợp để tính khoảng cách ảnh. 1) Khoảng cách màu: Với hai ảnh đã đưa về cùng định dạng kích cỡ. Ta sử dụng khoảng cách bình phương để tính khoảng cách mầu của hai bức ảnh. )()(),( IQ T IQ HHAHHIQd −−= Trong đó, Q và I là hai ảnh Q H là lược đồ màu của ảnh Q còn I H là lược đồ màu của ảnh I, còn A là ma trận NxN, N là số thùng trong mỗi lược đồ màu còn ij a mô tả sự giống nhau màu i và màu j. 2) Khoảng cách kết cấu: Việc tính khoảng cách kết cấu chia làm hai phần. a.Tính mức năng lượng: B1. Phân tích ảnh đầu vào thành 4 ảnh con. B2. Tính mức năng lượng của ảnh với cỡ tương ứng. Sử dụng công thức ∑∑ == = m i n j jiX MN E 11 |),(| 1 Trong đó, M và N là độ rộng của ảnh. X là cường độ sáng của điểm ảnh tại hàng i và cột j. B3. Lặp lại bước 2 với mỗi bức ảnh. Giá trị mức năng lượng được lưu trữ lại để phục vụ cho việc tính khoảng cách Euclidean. b.Tính khoảng cách Euclidean: B1. Phân tích ảnh đầu vào B2. Lấy mức năng lượng của kênh k trội nhất. B3. Với mỗi bức ảnh i trong cơ sở dữ liệu lấy mức năng lượng ở kênh k. B4. Tính khoảng cách Euclidean ở hai bức ảnh với mức năng lượng được chọn. -63- () ∑ = −= k k kiki yxD 1 2 , B5. Tăng biến i và lặp lại bước 3. 3) Khoảng cách ảnh: Khoảng cách ảnh được tính dựa vào khoảng cách màu và khoảng cách kết cấu. Ngoài ra hệ thống cho phép người dùng đưa vào các thông tin về độ ưu tiên màu và kết cho việc khoảng cách. Khi đó khoảng cách ảnh được tính theo công thức: D(Q,I)= D C * W C + D T *W T Trong đó D(Q,I) là khoảng cách ảnh, D C và D T lần lượt là khoảng cách mầu và kết cấu. W C và W T lần lượt là độ ưu tiên màu và kết cấu. 4. Thực nghiệm Chúng tôi đã cài đặt hệ thống trên ngôn ngữ lập trình java và hệ quản trị cơ sở dữ liệu oracle. Hệ thống đã đạt được tốc độ chấp nhận được. Việc tìm kiếm ảnh là khá khả quan tuy nhiên đôi khi vẫn thu được những bức ảnh không mong muốn. Tuy nhiên, do thời gian hạn hẹp hệ thống mới chỉ đáp ứng được việc tìm kiếm trên 2 đặc trưng là màu sắc và kết cấu nên độ chính xác là chưa cao. Số lượng ảnh trong cơ sở dữ liệu còn ít và chưa đa dạng nên việc đánh giá độ ổn định và tốc độ là chưa khách quan. 5. Kết luận Trong khóa luận này, chúng tôi đã xây dựng hệ thống tìm kiếm ảnhtheonộidung dựa trên các đặc trưng màu và kết cấu. Hệ thống đáp ứng được về mặt tốc độ với cơ sở dữ liệu nhỏ. Tuy nhiên với hệ cơ sở dữ liệu lớn thì tốc độ chưa được khả quan. Về hiệu quả tìm kiếm do mới chỉ đáp ứng trên việc tìm kiếm ảnhtheo khoảng cách màu và kết cấu nên độ chính xác cũng chưa cao. Các vấn đề cần tiếp tục nghiên cứu: xây dựng thuật toán tính khoảng cách các đặc trưng khác như hình thù, vị trí, không gian…để cải thiện độ chính xác của việc tìm kiếm. Xây dựng chỉ mục cho cơ sở dữ liệu để cải thiện tốc độ tìm kiếm. Tài liệu tham khảo [1] R. Jain, R. Kasturi, and B. G. Schunck, Machine Vision , McGraw Hill International Editions, 1995. [2] Sharmin Siddique, “A Wavelet Based Technique for Analysis and Classification of Texture Images,” Carleton University, Ottawa, Canada, Proj. Rep. 70.593, April 2002. [3] Shengjiu Wang, “A Robust CBIR Approach Using Local Color Histograms,” Department of Computer Science, University of Alberta, Edmonton, Alberta, Canada, Tech. Rep. TR 01-13, October 2001. . có nội dung tương tự ảnh đầu vào. 3. Phương pháp tìm kiếm ảnh theo nội dung Giải pháp được tôi lựa chọn để giải quyết việc tìm kiếm ảnh theo nội dung là. -62- TÌM HIỂU PHƯƠNG PHÁP TÌM KIẾM ẢNH THEO NỘI DUNG Đỗ Khắc Sĩ MSV: 0320258 Email: sydk@fpt.com.vn Người hướng dẫn: PGS.TS. Ngô Quốc Tạo 1. Giới thiệu Tìm