Chương trình được xây dựng với mục đích tra cứu ảnh danh lam thắng cảnh dựa trên đặc trưng màu cục bộ, sử dụng kỹ thuật đánh chỉ số dựa vào phân cụm. Không gian màu sử dụng trong chương trình là không gian màu RGB, do khuôn dạng của không gian màu RGB là định dạng phổ biến nhất của ảnh số. Với việc lượng hóa 3 kênh màu R (Red), G (Green), B (Blue) từ 256 giá trị giảm xuống còn 3 giá trị cho mỗi kênh màu tương ứng tạo thành 16 màu đơn tổ hợp từ 3 kênh màu đó sẽ làm giảm không gian lưu trữ trong CSDL và tăng tốc độ tra cứu của hệ thống.
Mô hình chung của hệ thống như sau :
Hình 3.2. Mô hình chi tiết của hệ thống tra cứu ảnh Modul tiền xử lý được thực hiện như sau:
B1. Các màu trội của các ảnh trong tập ảnh được trích rút và được mô tả bởi các vector đặc trưng.
B2. Từ tập các vector đặc trưng tiến hành phân cụm ảnh. Quá trình phân cụm gồm các bước:
B2.1. Phân ảnh thành các cụm có độ tương tự nhau. B2.2. Tính tâm của các cụm.
B2.3. Tối ưu các tâm cụm tức là có một số ảnh không nằm đúng cụm cần phải di chuyển các ảnh vềđúng cụm của nó.
Modul tra cứu được thực hiện như sau:
Người sử dụng cung cấp cho hệ thống ảnh truy vấn thông qua giao diện đồ họa. Sau đó hệ thống trích rút các màu trội và biểu diễn ảnh bởi vector đặc trưng. Ảnh truy vấn sẽ được so sánh với các tâm cụm. Kết quả trả về là tập các ảnh thuộc cụm có tâm gần nhất với ảnh truy vấn. Tập ảnh kết quảđược phân hạng theo thứ tự giảm dần của độ tương tự.
3.3.1. Các chức năng của chương trình
Chương trình được xây dựng với mục đích tra cứu các ảnh danh lam thắng cảnh trong CSDL tương tự nhất với ảnh truy vấn theo sai số do người dùng lựa chọn. Vì vậy chương trình xây dựng phải bao gồm các chức năng sau:
- Phần tìm kiếm: Đây là phần dành cho người sử dụng, người sử dụng chọn bức ảnh cân tìm kiếm với sai số của phép tìm kiếm.
- Phần CSDL: Đây là phần dành cho người quản trị chương trình. Trong quá trình tìm kiếm, người quản trị có thể thêm vào CSDL khi mà họ muốn lưu trữ bức ảnh vào trong CSDL để tiện cho việc tìm kiếm sau này.
Ngoài ra, chương trình cũng thực hiện chức năng phân quyền cho người dùng khi sử dụng hệ thống. Với các quyền khác nhau của người dùng, hệ thống sẽ có các đáp ứng khác nhau. Trong phạm vi của Luận văn, hệ thống được phân thành hai mức quyền: Quyền quản trị và Quyền người dùng, trong đó Quyền người dùng chỉ có thể thực hiện chức năng tìm kiếm ảnh.
3.3.2. Biểu đồ Use Case của hệ thống
Hình 3.3. Biểu đồ Use Case đối với chức năng Quản trị hệ thống.
3.3.3. Biểu đồ trình tự và biểu đồ hoạt động 3.3.3.1. Tác nhân Quản lý CSDL ảnh
* Mô tả dòng công việc:
+ Người sử dụng chọn thêm ảnh vào CSDL: Có thể thực hiện thêm một nhóm ảnh hoặc thêm cả một thư mục ảnh vào CSDL. Quá trình thực hiện như sau:
- Lựa chọn các tập tin ảnh hoặc lựa chọn thư mục chứa ảnh để đưa vào CSDL.
- Hệ thống tiến hành lấy thông tin về các ảnh và trích chọn lược đồ màu tương ứng với các ảnh. Nếu lựa chọn thêm nhiều ảnh thì hệ thống lần lượt lấy thông tin về các ảnh trong tập hợp các ảnh đã chọn.
- Nếu không có lỗi thì cập nhật vào CSDL, ngược lại thông báo lỗi. + Người sử dụng chọn xóa một ảnh trong CSDL:
- Chọn một ảnh muốn xóa.
- Hệ thống kiểm tra nếu ảnh đang được sử dụng thì không cho phép xóa, ngược lại thì tiến hành xóa ảnh.
Hệ thống thực hiện phân vùng mỗi ảnh trong thư mục ảnh thành 16 vùng. Mỗi vùng được biểu diễn bởi một lược đồ màu. Vậy tập các ảnh được biểu diễn bởi tập các vector đặc trưng biểu diễn các lược đồ màu.
Tác nhân này chỉ áp dụng cho người dùng có quyền quản trị trên hệ thống (Admin), với quy trình thực hiện theo các bước như sau:
1. Cập nhật các ảnh vào CSDL.
2. Thực hiện phân cụm các ảnh trong CSDL. 2.1. Lựa chọn số lượng cụm cần phân chia. 2.2. Thực hiện tính tâm cụm.
2.3. Thực hiện tối ưu tâm cụm. 3. Thực hiện lưu CSDL.
* Biểu đồ trình tự:
Hình 3.5. Biểu đồ trình tự của tác nhân xử lý dữ liệu
* Biểu đồ hoạt động:
Hình 3.6. Sơđồ hoạt động của tác nhân xử lý dữ liệu
: Admin
: Admin : FrmCapnhatanh : Images
: Regions
: Regions : Histograms : Histograms : CSDL : CSDL Chon thu muc anh
Trich chon dac trung
TrichChonDacTrung( )
KhoiTao( )
KhoiTao( )
Phan cum anh
KhoiTao( )
PhanCumAnh( )
Tinh tam cum
TinhTamCum( )
Toi uu tam cum
ToiUuTamCum( ) Luu CSDL
LuuCSDL( )
LuuCSDL( ) Nhap so cum
Nhap nguong toi uu
3.3.3.2. Tác nhân tra cứu ảnh
* Mô tả dòng công việc:
+ Người sử dụng lựa chọn ảnh truy vấn, chọn phương pháp tra cứu, số lượng ảnh thỏa mãn tiêu chí tìm kiếm và nhấn nút tra cứu.
+ Hệ thống sẽ tiến hành tìm kiếm ảnh theo phương pháp phân cụm ảnh dựa vào các tâm cụm và sai số người dùng lựa chọn, sau đó hiển thị kết quả.
Hệ thống sẽ thực hiện trích rút biểu đồ màu của ảnh truy vấn, so sánh với các tâm cụm và trả về kết quả là tập ảnh trong cụm có tâm gần nhất với ảnh truy vấn. Tập ảnh kết quảđược sắp xếp giảm dần theo độ tương tự. Hệ thống chỉ trả về một lượng ảnh không vượt quá số lượng do người dùng yêu cầu.
Tác nhân này được áp dụng cho mọi người dùng sử dụng hệ thống, với quy trình thực hiện theo các bước như sau:
1. Chọn ảnh truy vấn dùng để tìm kiếm. 2. Chọn số lượng ảnh thỏa mãn.
3. Thực hiện tìm kiếm.
Hệ thống sẽ thực hiện tìm kiếm và đưa ra kết quả là các ảnh trong CSDL thỏa mãn tiêu chí tìm kiếm, trong đó ảnh có độ tương tự lớn nhất sẽ hiển thị ngay phía dưới ảnh tìm kiếm, các ảnh thõa mãn khác được hiển thị theo thứ tự giảm dần của độ tương tự so với ảnh cần tìm kiếm.
Hình 3.7. Biểu đồ trình tự của tác nhân tra cứu ảnh.
* Biểu đồ hoạt động:
Hình 3.8. Sơđồ hoạt động của tác nhân Tra cứu ảnh.
: User : FrmTimkiemanh : FrmTraCuu : CSDL : CSDL
Chon anh truy van
Click tra cuu
TraCuuCSDL( ) TraCuuCSDL( )
Tra ve ket qua
TrichChonDacTrung() SoSanhVoiCacCumAnh() : Admin
3.3.4. Thiết kế CSDL 3.3.4.1. Bảng Clusters
Tên trường Kiểu dữ liệu Khóa Mô tả Ý nghĩa
ClusterID int X Not Null
ImageName nvarchar(200) Not Null Tên của tập tin ảnh FullImageName nvarchar(500) Not Null Đường dẫn đầy đủ
IDParent int Not Null Địa chỉ của nút cha
IDLC int Not Null Địa chỉ của nút con trái
IDRC int Not Null Địa chỉ của nút con phải
3.3.4.2. Bảng Regions
Tên trường Kiểu dữ liệu Khóa Mô tả Ý nghĩa
ClusterID int X Not Null
RegionNumber int Not Null Số hiệu của cụm
IndexColor int Not Null Chỉ số màu
ValueColor int Not Null Giá trị màu
3.3.4.3. Bảng Cluster_Images
Tên trường Kiểu dữ liệu Khóa Mô tả Ý nghĩa
ClusterID int Not Null
3.3.5. Sơđồ liên kết các bảng trong CSDL
Hình 3.9. Sơđồ liên kết các bảng dữ liệu trong CSDL. 3.3.6. Giao diện chương trình
3.3.6.1. Giao diện chính của chương trình
3.3.6.2. Giao diện cập nhật ảnh
Hình 3.11. Giao diện Cập nhật ảnh. 3.3.6.3. Giao diện phân cụm ảnh
3.3.6.4. Giao diện tìm kiếm ảnh
Hình 3.13. Giao diện Tìm kiếm ảnh 3.3.6.5. Giao diện so sánh hai ảnh
3.3.6.6. Giao diện duyệt CSDL ảnh
Hình 3.15. Giao diện Xem CSDL ảnh dưới dạng Preview.
3.4. Một số kết quả
Chương trình được chạy thử với CSDL gồm 300 được sưu tầm và lấy từ Internet. Nhằm mục đích so sánh hiệu quả của các phương pháp nên trong phần chạy Demo chỉ dùng số lượng ảnh là 100 và được chia thành 5 cụm.
+. Khi sử dụng một ảnh trong CSDL làm ảnh truy vấn, kết quả thu được như sau:
+. Khi sử dụng một ảnh không có trong CSDL làm ảnh truy vấn, kết quả thu được như sau:
Hình 3.17. Kết quả tìm kiếm với ảnh truy vấn không có trong CSDL.
+. Độ chính xác và hiệu quả của phương pháp tìm kiếm dựa vào phân cụm so với phương pháp tìm kiếm vét cạn:
3.5. Kết luận Chương 3
Qua các kết quả thu được ta có thể nhận thấy rằng sử dụng phương pháp đánh chỉ sốảnh dựa vào phân cụm cho kết quả nhanh hơn so với các phương pháp khác, nhất là khi số lượng ảnh trong CSDL là rất lớn.
Quá trình tìm kiếm ảnh dựa vào lược đồ màu cục bộ bằng cách phân hoạch các ảnh thành 16 vùng hình chữ nhật, và không xét đến các yếu tố khác của ảnh như thông tin không gian ảnh cho nên kết quảđôi khi chưa thật sự tốt.
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Việc tìm kiếm được một bức ảnh mong muốn trong hàng triệu bức ảnh thuộc đủ loại chủđề khác nhau là rất khó khăn. Vấn đềđặt ra là phải có những phương pháp tổ chức cơ sở dữ liệu ảnh tốt cùng với những kỹ thuật tìm kiếm, tra cứu ảnh hiệu quả, có độ chính xác cao và có hiệu năng tốt. Do đó, nghiên cứu về tra cứu ảnh dựa vào nội dung là cần thiết.
Luận văn đã trình bày tổng quan về tra cứu ảnh dựa vào nội dung và một số kỹ thuật nền tảng của các hệ thống tra cứu ảnh theo nội dung, bao gồm mô tả nội dung trực quan, đánh giá độ tương tự, sơ đồ đánh chỉ số, tương tác với người sử dụng và đánh giá hiệu năng hệ thống. Sau đó, luận văn nhấn mạnh vào các kỹ thuật đánh chỉ số ảnh cơ sở dữ liệu, cụ thể là thuật toán tra cứu ảnh theo đặc trưng màu với các cơ sở dữ liệu ảnh lớn. Trong thuật toán, các ảnh được biểu diễn bởi các lược đồ màu cục bộ. Độ tương tự giữa các ảnh được tính toán dựa trên lược đồ màu cục bộ. Các ảnh trong cơ sở dữ liệu được phân cụm thành các nhóm có nội dung màu tương tự. Cách phân nhóm này cho phép chỉ tìm kiếm các ảnh liên quan đến ảnh truy vấn. Phần cuối của luận văn đã đưa ra một ứng dụng cụ thể cho phương pháp tra cứu ảnh theo nội dung trong tra cứu CSDL ảnh danh lam thắng cảnh.
Những vấn đềđã được giải quyết trong luận văn:
- Giới thiệu tổng quan về tra cứu ảnh theo nội dung.
- Nghiên cứu được phương pháp tra cứu ảnh nhanh dựa vào phân cụm. - Xây dựng được hệ thống tra cứu ảnh danh lam thắng cảnh có tốc độ nhanh.
Những vấn đề còn tồn tại:
Do thời gian tìm hiểu chưa được nhiều và những hạn chế về khả năng lập trình nên một số mục tiêu đặt ra từ khi bắt tay nghiên cứu chưa thực hiện được trong chương trình chạy thử này, bao gồm:
- Chưa thực hiện tra cứu ảnh bằng cách kết hợp nhiều đặc điểm. - Chưa thực hiện chuẩn hóa các ảnh nhưđưa về cùng kích thước ảnh. - Chưa thực sự chọn được cách cài đặt tối ưu cho kỹ thuật đánh chỉ số.
Trong thời gian tới, tôi hy vọng sẽ có thể giải quyết được những vấn đề còn tồn tại trên để có thể xây dựng được một chương trình thực sự hữu ích, đáp ứng được những yêu cầu của bài toán.
TÀI LIỆU THAM KHẢO
[1] A. K. Jain and R. C. Dubes, Algorithms for Clustering Data, Prentice Hall,
New Jersey, 1988.
[2] C. Faloutsos and K.-I. (David) Lin, Fastmap: A fast alogorithm for indexing,
data-mining and visualization of traditional and multimedia datasets, in Proc.
of SIGMOD, 1995, pp. 163–174.
[3] G. Pass, and R. Zabith (1996), "Histogram refinement for content-based
image retrieval", IEEE Workshop on Applications of Computer Vision, pp.
96-102.
[4] G. Salton and M. J. McGill, Introduction to Modern Information Retrieval,
McGraw-Hill, New York, 1983.
[5] H. Samet, "The quadtree and related hierarchical data structures," ACM
Computing Surveys, Vol.16, No.2, pp.187-260, 1984.
[6] H. J. Zhang and D. Zhong, A scheme for visual feature based image retrieval,
in Proc. SPIE Storage and Retrieval for Image and Video DBs, 1995.
[7] J. D. Foley, A. van Dam, S. K. Feiner, and J. F. Hughes, Computer graphics:
principles and practice, 2nd ed, Reading, Mass, A. Wesley, 1990.
[8] J. Huang, "Image indexing using color correlogram", IEEE Int. Conf. on Computer Vision & Pattern Recognition, pp. 762-768, Puerto Rico, June 1997. [9] J. M. Francos. "Orthogonal decompositions of 2D random fields and their
applications in 2D spectral estimation," N. K. Bose and C. R. Rao, editors,
Signal Processing and its Application, pp.20-227. North Holland, 1993.
[10] J. R. Smith and S.-F. Chang, Tools and techniques for color image retrieval,
in IS & T/SPIE Proceedings, Vol. 2670, Storage & Retrieval for Image and
Video Databases IV, 1995.
[11] M. Charikar, C. Chekur, T. Feder, and R.Motwani, Incremental clustering
and dynamic information retrieval, in Proc. of the 29th Annual ACM
[12] M. Stricker, and M. Orengo (1995), "Similarity of color images", SPIE
Storage and Retrieval for Image and Video DBs III, vol. 2185, pp. 381-392.
[13] N. Beckmann, H.-P.Kriegel, R. Schneider, and B. Seeger, The R*-tree: An
efficient and robust accessmethod for points and rectangles, in Proc. ACM
SIGMOD, 1990.
[14] P. Brodatz, "Textures: A photographic album for artists & designers,"
Dover, NY, 1966.
[15] Quynh, N. H. and Tao, N. Q (2008), “Segmenting the images into
homogeneous clusters for retrieving landscape images”, Posts, Telecoms and
Information Technology Journal (PTITJ), Issue 3, pp. 54-59.
[16] Quynh, N. H. and Tao, N. Q, A Novel CBIR Method Based on Splitting the
Image into Homogeneous Regions, International Journal of Innovative
Computing, Information and Control, pp. 4029 - 4041, Vol.6, No.10, 2010.
[17] R. Ng and A. Sedighian, Evaluating multi-dimensional indexing structures
for images transformed by principal component analysis, in Proc. SPIE Storage and Retrieval for Image and Video Databases, 1996.
[18] Swain, M. J. and Ballard, D. H. (1991), ‘‘Color indexing’’, International
Journal of Computer Vision, 7(1), pp. 11-32.
[19] J.P. Eakins and M.E. Graham. Content-based image retrieval. Technical report, JISC Technology Applications Programme, Institute for Image Data Research, University of Northumbria at Newcastle, UK, 1999.
[20] Y. Liu, F. Dellaert, and W.E. Rothfus. Classification driven semantic based medical image indexing and retrieval. Technical Report CMU-R1-TR-98-25, Carnegie Mellon University, 1998.
[21] G. Sheikholeslami, A. Zhang, and L. Bian. A multi-resolution content-based retrieval approach for geographic images. Geo-Informatica, 3(2):109–139, 1999.