Thiết kế hệ thống

Một phần của tài liệu 27823 (Trang 56 - 73)

Chương trình được xây dựng với mục đích tra cứu ảnh danh lam thắng cảnh dựa trên đặc trưng màu cục bộ, sử dụng kỹ thuật đánh chỉ số dựa vào phân cụm. Không gian màu sử dụng trong chương trình là không gian màu RGB, do khuôn dạng của không gian màu RGB là định dạng phổ biến nhất của ảnh số. Với việc lượng hóa 3 kênh màu R (Red), G (Green), B (Blue) từ 256 giá trị giảm xuống còn 3 giá trị cho mỗi kênh màu tương ứng tạo thành 16 màu đơn tổ hợp từ 3 kênh màu đó sẽ làm giảm không gian lưu trữ trong CSDL và tăng tốc độ tra cứu của hệ thống.

Mô hình chung của hệ thống như sau :

Hình 3.2. Mô hình chi tiết ca h thng tra cu nh Modul tin xđược thc hin như sau:

B1. Các màu trội của các ảnh trong tập ảnh được trích rút và được mô tả bởi các vector đặc trưng.

B2. Từ tập các vector đặc trưng tiến hành phân cụm ảnh. Quá trình phân cụm gồm các bước:

B2.1. Phân ảnh thành các cụm có độ tương tự nhau. B2.2. Tính tâm của các cụm.

B2.3. Tối ưu các tâm cụm tức là có một số ảnh không nằm đúng cụm cần phải di chuyển các ảnh vềđúng cụm của nó.

Modul tra cu được thc hin như sau:

Người sử dụng cung cấp cho hệ thống ảnh truy vấn thông qua giao diện đồ họa. Sau đó hệ thống trích rút các màu trội và biểu diễn ảnh bởi vector đặc trưng. Ảnh truy vấn sẽ được so sánh với các tâm cụm. Kết quả trả về là tập các ảnh thuộc cụm có tâm gần nhất với ảnh truy vấn. Tập ảnh kết quảđược phân hạng theo thứ tự giảm dần của độ tương tự.

3.3.1. Các chc năng ca chương trình

Chương trình được xây dựng với mục đích tra cứu các ảnh danh lam thắng cảnh trong CSDL tương tự nhất với ảnh truy vấn theo sai số do người dùng lựa chọn. Vì vậy chương trình xây dựng phải bao gồm các chức năng sau:

- Phn tìm kiếm: Đây là phần dành cho người sử dụng, người sử dụng chọn bức ảnh cân tìm kiếm với sai số của phép tìm kiếm.

- Phn CSDL: Đây là phần dành cho người quản trị chương trình. Trong quá trình tìm kiếm, người quản trị có thể thêm vào CSDL khi mà họ muốn lưu trữ bức ảnh vào trong CSDL để tiện cho việc tìm kiếm sau này.

Ngoài ra, chương trình cũng thực hiện chức năng phân quyền cho người dùng khi sử dụng hệ thống. Với các quyền khác nhau của người dùng, hệ thống sẽ có các đáp ứng khác nhau. Trong phạm vi của Luận văn, hệ thống được phân thành hai mức quyền: Quyền quản trị và Quyền người dùng, trong đó Quyền người dùng chỉ có thể thực hiện chức năng tìm kiếm ảnh.

3.3.2. Biu đồ Use Case ca h thng

Hình 3.3. Biu đồ Use Case đối vi chc năng Qun tr h thng.

3.3.3. Biu đồ trình t và biu đồ hot động 3.3.3.1. Tác nhân Qun lý CSDL nh

* Mô t dòng công vic:

+ Người sử dụng chọn thêm ảnh vào CSDL: Có thể thực hiện thêm một nhóm ảnh hoặc thêm cả một thư mục ảnh vào CSDL. Quá trình thực hiện như sau:

- Lựa chọn các tập tin ảnh hoặc lựa chọn thư mục chứa ảnh để đưa vào CSDL.

- Hệ thống tiến hành lấy thông tin về các ảnh và trích chọn lược đồ màu tương ứng với các ảnh. Nếu lựa chọn thêm nhiều ảnh thì hệ thống lần lượt lấy thông tin về các ảnh trong tập hợp các ảnh đã chọn.

- Nếu không có lỗi thì cập nhật vào CSDL, ngược lại thông báo lỗi. + Người sử dụng chọn xóa một ảnh trong CSDL:

- Chọn một ảnh muốn xóa.

- Hệ thống kiểm tra nếu ảnh đang được sử dụng thì không cho phép xóa, ngược lại thì tiến hành xóa ảnh.

Hệ thống thực hiện phân vùng mỗi ảnh trong thư mục ảnh thành 16 vùng. Mỗi vùng được biểu diễn bởi một lược đồ màu. Vậy tập các ảnh được biểu diễn bởi tập các vector đặc trưng biểu diễn các lược đồ màu.

Tác nhân này chỉ áp dụng cho người dùng có quyền quản trị trên hệ thống (Admin), với quy trình thực hiện theo các bước như sau:

1. Cập nhật các ảnh vào CSDL.

2. Thực hiện phân cụm các ảnh trong CSDL. 2.1. Lựa chọn số lượng cụm cần phân chia. 2.2. Thực hiện tính tâm cụm.

2.3. Thực hiện tối ưu tâm cụm. 3. Thực hiện lưu CSDL.

* Biu đồ trình t:

Hình 3.5. Biu đồ trình t ca tác nhân x lý d liu

* Biu đồ hot động:

Hình 3.6. Sơđồ hot động ca tác nhân x lý d liu

: Admin

: Admin : FrmCapnhatanh : Images

: Regions

: Regions : Histograms : Histograms : CSDL : CSDL Chon thu muc anh

Trich chon dac trung

TrichChonDacTrung( )

KhoiTao( )

KhoiTao( )

Phan cum anh

KhoiTao( )

PhanCumAnh( )

Tinh tam cum

TinhTamCum( )

Toi uu tam cum

ToiUuTamCum( ) Luu CSDL

LuuCSDL( )

LuuCSDL( ) Nhap so cum

Nhap nguong toi uu

3.3.3.2. Tác nhân tra cu nh

* Mô t dòng công vic:

+ Người sử dụng lựa chọn ảnh truy vấn, chọn phương pháp tra cứu, số lượng ảnh thỏa mãn tiêu chí tìm kiếm và nhấn nút tra cứu.

+ Hệ thống sẽ tiến hành tìm kiếm ảnh theo phương pháp phân cụm ảnh dựa vào các tâm cụm và sai số người dùng lựa chọn, sau đó hiển thị kết quả.

Hệ thống sẽ thực hiện trích rút biểu đồ màu của ảnh truy vấn, so sánh với các tâm cụm và trả về kết quả là tập ảnh trong cụm có tâm gần nhất với ảnh truy vấn. Tập ảnh kết quảđược sắp xếp giảm dần theo độ tương tự. Hệ thống chỉ trả về một lượng ảnh không vượt quá số lượng do người dùng yêu cầu.

Tác nhân này được áp dụng cho mọi người dùng sử dụng hệ thống, với quy trình thực hiện theo các bước như sau:

1. Chọn ảnh truy vấn dùng để tìm kiếm. 2. Chọn số lượng ảnh thỏa mãn.

3. Thực hiện tìm kiếm.

Hệ thống sẽ thực hiện tìm kiếm và đưa ra kết quả là các ảnh trong CSDL thỏa mãn tiêu chí tìm kiếm, trong đó ảnh có độ tương tự lớn nhất sẽ hiển thị ngay phía dưới ảnh tìm kiếm, các ảnh thõa mãn khác được hiển thị theo thứ tự giảm dần của độ tương tự so với ảnh cần tìm kiếm.

Hình 3.7. Biu đồ trình t ca tác nhân tra cu nh.

* Biu đồ hot động:

Hình 3.8. Sơđồ hot động ca tác nhân Tra cu nh.

: User : FrmTimkiemanh : FrmTraCuu : CSDL : CSDL

Chon anh truy van

Click tra cuu

TraCuuCSDL( ) TraCuuCSDL( )

Tra ve ket qua

TrichChonDacTrung() SoSanhVoiCacCumAnh() : Admin

3.3.4. Thiết kế CSDL 3.3.4.1. Bng Clusters

Tên trường Kiu d liu Khóa Mô tÝ nghĩa

ClusterID int X Not Null

ImageName nvarchar(200) Not Null Tên ca tp tin nh FullImageName nvarchar(500) Not Null Đường dn đầy đủ

IDParent int Not Null Địa ch ca nút cha

IDLC int Not Null Địa ch ca nút con trái

IDRC int Not Null Địa ch ca nút con phi

3.3.4.2. Bng Regions

Tên trường Kiu d liu Khóa Mô tÝ nghĩa

ClusterID int X Not Null

RegionNumber int Not Null S hiu ca cm

IndexColor int Not Null Ch s màu

ValueColor int Not Null Giá tr màu

3.3.4.3. Bng Cluster_Images

Tên trường Kiu d liu Khóa Mô tÝ nghĩa

ClusterID int Not Null

3.3.5. Sơđồ liên kết các bng trong CSDL

Hình 3.9. Sơđồ liên kết các bng d liu trong CSDL. 3.3.6. Giao din chương trình

3.3.6.1. Giao din chính ca chương trình

3.3.6.2. Giao din cp nht nh

Hình 3.11. Giao din Cp nht nh. 3.3.6.3. Giao din phân cm nh

3.3.6.4. Giao din tìm kiếm nh

Hình 3.13. Giao din Tìm kiếm nh 3.3.6.5. Giao din so sánh hai nh

3.3.6.6. Giao din duyt CSDL nh

Hình 3.15. Giao din Xem CSDL nh dưới dng Preview.

3.4. Mt s kết qu

Chương trình được chạy thử với CSDL gồm 300 được sưu tầm và lấy từ Internet. Nhằm mục đích so sánh hiệu quả của các phương pháp nên trong phần chạy Demo chỉ dùng số lượng ảnh là 100 và được chia thành 5 cụm.

+. Khi sử dụng một ảnh trong CSDL làm ảnh truy vấn, kết quả thu được như sau:

+. Khi sử dụng một ảnh không có trong CSDL làm ảnh truy vấn, kết quả thu được như sau:

Hình 3.17. Kết qu tìm kiếm vi nh truy vn không có trong CSDL.

+. Độ chính xác và hiệu quả của phương pháp tìm kiếm dựa vào phân cụm so với phương pháp tìm kiếm vét cạn:

3.5. Kết lun Chương 3

Qua các kết quả thu được ta có thể nhận thấy rằng sử dụng phương pháp đánh chỉ sốảnh dựa vào phân cụm cho kết quả nhanh hơn so với các phương pháp khác, nhất là khi số lượng ảnh trong CSDL là rất lớn.

Quá trình tìm kiếm ảnh dựa vào lược đồ màu cục bộ bằng cách phân hoạch các ảnh thành 16 vùng hình chữ nhật, và không xét đến các yếu tố khác của ảnh như thông tin không gian ảnh cho nên kết quảđôi khi chưa thật sự tốt.

KT LUN VÀ HƯỚNG PHÁT TRIN

Việc tìm kiếm được một bức ảnh mong muốn trong hàng triệu bức ảnh thuộc đủ loại chủđề khác nhau là rất khó khăn. Vấn đềđặt ra là phải có những phương pháp tổ chức cơ sở dữ liệu ảnh tốt cùng với những kỹ thuật tìm kiếm, tra cứu ảnh hiệu quả, có độ chính xác cao và có hiệu năng tốt. Do đó, nghiên cứu về tra cứu ảnh dựa vào nội dung là cần thiết.

Luận văn đã trình bày tổng quan về tra cứu ảnh dựa vào nội dung và một số kỹ thuật nền tảng của các hệ thống tra cứu ảnh theo nội dung, bao gồm mô tả nội dung trực quan, đánh giá độ tương tự, sơ đồ đánh chỉ số, tương tác với người sử dụng và đánh giá hiệu năng hệ thống. Sau đó, luận văn nhấn mạnh vào các kỹ thuật đánh chỉ số ảnh cơ sở dữ liệu, cụ thể là thuật toán tra cứu ảnh theo đặc trưng màu với các cơ sở dữ liệu ảnh lớn. Trong thuật toán, các ảnh được biểu diễn bởi các lược đồ màu cục bộ. Độ tương tự giữa các ảnh được tính toán dựa trên lược đồ màu cục bộ. Các ảnh trong cơ sở dữ liệu được phân cụm thành các nhóm có nội dung màu tương tự. Cách phân nhóm này cho phép chỉ tìm kiếm các ảnh liên quan đến ảnh truy vấn. Phần cuối của luận văn đã đưa ra một ứng dụng cụ thể cho phương pháp tra cứu ảnh theo nội dung trong tra cứu CSDL ảnh danh lam thắng cảnh.

Nhng vn đềđã được gii quyết trong lun văn:

- Giới thiệu tổng quan về tra cứu ảnh theo nội dung.

- Nghiên cứu được phương pháp tra cứu ảnh nhanh dựa vào phân cụm. - Xây dựng được hệ thống tra cứu ảnh danh lam thắng cảnh có tốc độ nhanh.

Nhng vn đề còn tn ti:

Do thời gian tìm hiểu chưa được nhiều và những hạn chế về khả năng lập trình nên một số mục tiêu đặt ra từ khi bắt tay nghiên cứu chưa thực hiện được trong chương trình chạy thử này, bao gồm:

- Chưa thực hiện tra cứu ảnh bằng cách kết hợp nhiều đặc điểm. - Chưa thực hiện chuẩn hóa các ảnh nhưđưa về cùng kích thước ảnh. - Chưa thực sự chọn được cách cài đặt tối ưu cho kỹ thuật đánh chỉ số.

Trong thời gian tới, tôi hy vọng sẽ có thể giải quyết được những vấn đề còn tồn tại trên để có thể xây dựng được một chương trình thực sự hữu ích, đáp ứng được những yêu cầu của bài toán.

TÀI LIU THAM KHO

[1] A. K. Jain and R. C. Dubes, Algorithms for Clustering Data, Prentice Hall,

New Jersey, 1988.

[2] C. Faloutsos and K.-I. (David) Lin, Fastmap: A fast alogorithm for indexing,

data-mining and visualization of traditional and multimedia datasets, in Proc.

of SIGMOD, 1995, pp. 163–174.

[3] G. Pass, and R. Zabith (1996), "Histogram refinement for content-based

image retrieval", IEEE Workshop on Applications of Computer Vision, pp.

96-102.

[4] G. Salton and M. J. McGill, Introduction to Modern Information Retrieval,

McGraw-Hill, New York, 1983.

[5] H. Samet, "The quadtree and related hierarchical data structures," ACM

Computing Surveys, Vol.16, No.2, pp.187-260, 1984.

[6] H. J. Zhang and D. Zhong, A scheme for visual feature based image retrieval,

in Proc. SPIE Storage and Retrieval for Image and Video DBs, 1995.

[7] J. D. Foley, A. van Dam, S. K. Feiner, and J. F. Hughes, Computer graphics:

principles and practice, 2nd ed, Reading, Mass, A. Wesley, 1990.

[8] J. Huang, "Image indexing using color correlogram", IEEE Int. Conf. on Computer Vision & Pattern Recognition, pp. 762-768, Puerto Rico, June 1997. [9] J. M. Francos. "Orthogonal decompositions of 2D random fields and their

applications in 2D spectral estimation," N. K. Bose and C. R. Rao, editors,

Signal Processing and its Application, pp.20-227. North Holland, 1993.

[10] J. R. Smith and S.-F. Chang, Tools and techniques for color image retrieval,

in IS & T/SPIE Proceedings, Vol. 2670, Storage & Retrieval for Image and

Video Databases IV, 1995.

[11] M. Charikar, C. Chekur, T. Feder, and R.Motwani, Incremental clustering

and dynamic information retrieval, in Proc. of the 29th Annual ACM

[12] M. Stricker, and M. Orengo (1995), "Similarity of color images", SPIE

Storage and Retrieval for Image and Video DBs III, vol. 2185, pp. 381-392.

[13] N. Beckmann, H.-P.Kriegel, R. Schneider, and B. Seeger, The R*-tree: An

efficient and robust accessmethod for points and rectangles, in Proc. ACM

SIGMOD, 1990.

[14] P. Brodatz, "Textures: A photographic album for artists & designers,"

Dover, NY, 1966.

[15] Quynh, N. H. and Tao, N. Q (2008), “Segmenting the images into

homogeneous clusters for retrieving landscape images”, Posts, Telecoms and

Information Technology Journal (PTITJ), Issue 3, pp. 54-59.

[16] Quynh, N. H. and Tao, N. Q, A Novel CBIR Method Based on Splitting the

Image into Homogeneous Regions, International Journal of Innovative

Computing, Information and Control, pp. 4029 - 4041, Vol.6, No.10, 2010.

[17] R. Ng and A. Sedighian, Evaluating multi-dimensional indexing structures

for images transformed by principal component analysis, in Proc. SPIE Storage and Retrieval for Image and Video Databases, 1996.

[18] Swain, M. J. and Ballard, D. H. (1991), ‘‘Color indexing’’, International

Journal of Computer Vision, 7(1), pp. 11-32.

[19] J.P. Eakins and M.E. Graham. Content-based image retrieval. Technical report, JISC Technology Applications Programme, Institute for Image Data Research, University of Northumbria at Newcastle, UK, 1999.

[20] Y. Liu, F. Dellaert, and W.E. Rothfus. Classification driven semantic based medical image indexing and retrieval. Technical Report CMU-R1-TR-98-25, Carnegie Mellon University, 1998.

[21] G. Sheikholeslami, A. Zhang, and L. Bian. A multi-resolution content-based retrieval approach for geographic images. Geo-Informatica, 3(2):109–139, 1999.

Một phần của tài liệu 27823 (Trang 56 - 73)

Tải bản đầy đủ (PDF)

(73 trang)