Cải tiến thuật toán JSEG (Thuật toán O-JSEG)- 123docz.net

4. Áp dụng thuật toán Octrees cho bƣớc lƣợng tử trong quá trình phân đoạn ảnh màu

4.2. Cải tiến thuật toán JSEG (Thuật toán O-JSEG)

Các thử nghiệm đã cho thấy rằng JSEG đã cung cấp các kết quả phân đoạn tốt trên các loại ảnh đa dạng. Chúng ta khó có thể đƣa ra nhận xét chung cho một thuật toán phân đoạn bởi luôn luôn tồn tại những ƣu, khuyết điểm trên những lớp ảnh cụ thể. Thuật toán

JSEG còn một số hạn chế khi làm việc với các ảnh thiên nhiên. Ví dụ trƣờng hợp hai vùng cạnh nhau có ranh giới không rõ ràng.

Ngoài ra, kết quả của bƣớc lƣợng tử có ảnh hƣởng lớn đến độ phức tạp của các bƣớc sau, vì vậy việc cải tiến bƣớc lƣợng tử để giảm khối lƣợng tính toán cho bƣớc các bƣớc tiếp theo là cần thiết. Điều này phụ thuộc cơ bản vào bản đồ lớp màu (là kết quả của quá

trình lƣợng tử hóa). Nhƣ vậy, bƣớc lƣợng tử có vai trò hết sức quan trọng. Sự phân vùng của JSEG phụ thuộc trực tiếp vào chất lƣợng của ảnh lƣợng tử.

Thuật toán JSEG có độ phức tạp tính toán trên các điểm ảnh là tƣơng đối lớn, nên khi lƣợng tử chỉ nên đƣa ra ảnh có số màu biểu diễn nhỏ (từ 10 đến 20 màu) để giảm khối lƣợng tính toán. Nếu xem xét để lựa chọn một thuật toán lƣợng tử kết hợp với JSEG thì tiêu trí đầu tiên phải là ảnh ít bị nhiễu, các đối tƣợng trong ảnh đƣợc phân biệt rõ ràng. Sau đó, ta mới xét đến tiêu trí về màu cảm nhận gần với màu thật. Nếu ảnh đầu vào của thuật toán JSEG đạt đƣợc tiêu trí thứ nhất thì khối lƣợng tính toán sẽ giảm đi rất nhiều mà vẫn đảm bảo yêu cầu cho kết quả phân đoạn tốt. Chúng tôi lựa chọn thuật toán OCTREES để kết hợp với JSEG. Ngƣời ta xây dựng cây OCTREES theo tiêu chuẩn hợp nhất các lá nhƣ sau:

1. Rút gọn các lá sâu nhất trong cây là lựa chọn đầu tiên và chúng miêu tả các màu sắc nằm gần nhau nhất.

Ảnh màu

Lƣợng tử hoá không gian màu với thuật toán OCTREES

Bản đồ lớp màu

Khởi tạo Scale

Với mỗi phân vùng

Scale < ngƣỡng? Tính toán giá trị J J-image Phát hiện Valley Phát triển Valley Các phân vùng

Kết quả phân đoạn

Hình 3.11: Sơ đồ thuật toán O-JSEG

a/ 4 liên thông Trộn các phân vùng đúng sai Tă ng s ca le lên 1

2. Chọn các lá là biểu diễn số điểm ảnh ít nhất trong cây.

Hình 3.11 là sơ đồ thuật toán O-JSEG (thuật toán JSEG cải tiến theo hƣớng kết hợp với thuật toán lƣợng tử OCTREES).

4.3. Thực nghiệm

Chúng tôi đã tiến hành thực nghiệm đối với 100 ảnh thiên nhiên của bộ dữ liệu ảnh MISC [25] (có 9908 ảnh). Kết quả: 79 ảnh cho kết quả phân đoạn tốt. Thuật toán O-JSEG cơ bản khắc phục đƣợc nhƣợc điểm của thuật toán JSEG trong trƣờng hợp hai vùng cạnh nhau có ranh giới không rõ ràng. Một số ảnh cho kết quả chƣa chính xác trong trƣờng hợp đối tƣợng có bóng do chiếu sáng, khi đó đối tƣợng sẽ bị chia thành nhiều phần (thân cây trong ảnh 7567.jpg), đây cũng là điểm tồn tại của thuật toán JSEG. Hình 3.12 biểu diễn một số kết quả thử nghiệm với việc sử dụng thuật toán O-JSEG.

File ảnh Ảnh gốc J-Image Kết quả phân đoạn Đánh giá

66.jpg Tốt

59.jpg Tốt

79.jpg Tốt

9283.jpg Tốt

7567.jpg Chƣa tốt

Hình 3.12: Kết quả quá trình phân đoạn bằng thuật toán O-JSEG trên một số ảnh thiên nhiên của cơ sở dữ liệu ảnh MISC

4.4. Kết luận

Các tác giả [54] đã kết hợp với lƣợng tử PGF and PCI với JSEG cho kết quả tƣơng đối tốt. Chúng tôi đã đề xuất cải tiến thuật toán JSEG và tiến hành thử nghiệm theo hƣớng kết hợp thuật toán lƣợng tử OCTREES với JSEG (thuật toán O-JSEG). Kết quả thực nghiệm cho thấy: với một số trƣờng hợp ảnh thiên nhiên, O-JSEG cho kết quả tốt hơn. Đối với các thuật toán phân đoạn, không thể kết luận thuật toán nào là tối ƣu hơn vì với trƣờng

hợp này sự kết hợp của thuật toán PGF and Perceptual với JSEG là tốt, nhƣng trƣờng hợp khác thì sự kết hợp giữa OCTREES và JSEG lại cho kết quả phân đoạn đạt yêu cầu hơn (phụ thuộc mục đích sử dụng và lĩnh vực áp dụng). Chúng tôi dự định tiếp tục nghiên cứu nâng cao chất lƣợng của O-JSEG để áp dụng xây dựng hệ thống tra cứu trên cơ sở dữ liệu ảnh thiên nhiên.

KẾT QUẢ VÀ THẢO LUẬN

Chúng tôi đã hoàn thành mục tiêu nghiên cứu đề ra. Đã có 04 bài báo đƣợc đăng và nhận đăng tại Tạp chí Khoa học và công nghệ của Đại học Thái Nguyên [2,3,4], Kỷ yếu Hội thảo quốc gia “Một số vấn đề chọn lọc của Công nghệ thông tin và Truyền thông” [1] trong đó 3 bài là kết quả liên quan trực tiếp đến mục tiêu của đề tài [1,3,4] (nội dung cải tiến các phƣơng pháp tra cứu ảnh), một bài là kết quả phát sinh trong quá trình thực hiện đề tài (nội dung cải tiến phƣơng pháp phân đoạn ảnh màu) [2]. Cụ thể nhƣ sau:

Trong [3], chúng tôi đã đƣa ra đề xuất cải tiến phƣơng pháp cơ sở tra cứu ảnh dựa trên màu sắc. Thay vì chia không gian màu thành các bins cố định, đều nhau nhƣ kỹ thuật cơ sở thì chúng tôi sử dụng kỹ thuật phân lớp dữ liệu để tính toán các bins màu động. Cải tiến này đã khắc phục đƣợc một số nhƣợc điểm của kỹ thuật cơ sở. Tuy nhiên tốc độ tính toán các bins màu chậm. Trong tƣơng lai, chúng tôi sẽ nghiên cứu nhằm nâng cao tốc độ của bƣớc tính toán các bins màu; thử nghiệm với nhiều độ đo khác nhau và kết hợp những đặc trƣng khác nhƣ thông tin về không gian.

Trong [4], chúng tôi đƣa ra hƣớng tiếp cận kết hợp phƣơng pháp tra cứu ảnh dựa trên vùng của Yxin Chen và phƣơng pháp biểu diễn đặc trƣng vùng do Cheng Chang đề xuất. Tiếp cận này sử dụng thuật toán phân lớp dữ liệu K-Means để phân đoạn ảnh sau đó trích chọn các đặc trƣng toàn cục và cục bộ dựa trên màu sắc, hình dạng của các vùng từ đó tính toán mức độ tƣơng tự giữa các ảnh. Kết quả thực nghiệm cho thấy hƣớng tiếp cận cho kết quả tốt trên tập dữ liệu ảnh thử nghiệm gồm các ảnh chụp tại biển Cát Bà. Chúng tôi mới chỉ thực hiện đƣợc việc cài đặt và kiểm nghiệm sự hợp lý của kỹ thuật cải tiến trên tập dữ liệu ảnh mẫu, chƣa có so sánh với các kỹ thuật khác. Trong tƣơng lai, chúng tôi thực hiện so sánh hiệu năng của kỹ thuật cải tiến này với các kỹ thuật chƣa cải tiến liên quan và các kỹ thuật tƣơng đƣơng từ đó tiếp tục nghiên cứu nâng cao hiệu năng của kỹ thuật.

Trong [1], chúng tôi đƣa ra kỹ thuật tra cứu ảnh dựa vào các đặc tính cục bộ của vùng bao gồm màu và không gian áp dụng trong tra cứu các ảnh phong cảnh. Kết quả thực nghiệm cho thấy kỹ thuật này tốt hơn các kỹ thuật sử dụng vector gắn kết màu (CCV) và kỹ thuật sử dụng lƣợc đồ CCH. Trong tƣơng lai, chúng tôi thử nghiệm phƣơng pháp này trên các tập dữ liệu khác nhau, tiến hành đánh chỉ số cho các tập ảnh khác nhau theo các chỉ tiêu khác nhau.

Ngoài ra, chúng tôi cũng biên soạn tài liệu tham khảo “Tra cứu ảnh” dùng cho sinh viên và giảng viên Khoa Công nghệ thông tin (lƣu hành nội bộ).

Những đóng góp cho lĩnh vực của đề tài tuy còn khiêm tốn so với những nghiên cứu trên thế giới nhƣng việc hoàn thành đề tài đã đặt nền móng cho những nghiên cứu, học tập tiếp theo tại Khoa. Trên cơ sở kết quả của đề tài, chúng tôi sẽ tiếp tục nghiên cứu và tiến tới triển khai những ứng dụng liên quan. Đây là một lĩnh vực có rất nhiều ứng dụng thực tiễn và đồng thời có tính học thuật cao. Trong tƣơng lai, chúng tôi tiếp tục nghiên cứu nhƣ những định hƣớng cụ thể nêu trên đồng thời áp dụng kết quả nghiên cứu để xây dựng phần mềm tiện ích Photo Explore (PE) và đề xuất xây dựng các phần mềm ứng dụng cụ thể trong các lĩnh vực.

TÀI LIỆU THAM KHẢO

Danh sách công trình là kết quả của đề tài

[1] Nguyễn Hữu Quỳnh, Ngô Quốc Tạo, (2007), Sử dụng đặc tính cục bộ của vùng phục vụ tra cứu ảnh phong cảnh, Kỷ yếu Hội thảo quốc gia “Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông”, Đại Lải 14-15/9/2007, trang 608-616.

[2] Đỗ Năng Toàn, Nguyễn Văn Tới, Nguyễn Thị Thu Hiền, (2008), “Áp dụng thuật toán Octrees cho bƣớc lƣợng tử trong quá trình phân đoạn ảnh màu bằng thuật toán Jseg”, Tạp chí Khoa học và Công nghệ, Đại học Thái Nguyên, Tập 2(1), trang 80-84. [3] Nguyễn Văn Tới, Phạm Việt Bình, Nguyễn Tiến Thành, (2009), “Sử dụng kỹ thuật phân lớp dữ liệu để tính toán các bins màu động trong tra cứu ảnh dựa trên màu sắc”, Tạp chí Khoa học và Công nghệ, Đại học Thái Nguyên, nhận đăng.

[4] Dominic Mai, Nguyen Van Toi, (2009), “An Approach to CBIR using K-Means clustering and Polygon Based Shape Features”, Tạp chí Khoa học và Công nghệ, Đại học Thái Nguyên, nhận đăng.

Các tài liệu tham khảo khác Tiếng Việt

[5] Lƣơng Mạnh Bá, Nguyễn Thanh Thuỷ (2003), Nhập môn xử lý ảnh số, Nhà xuất bản Khoa học Kỹ thuật.

[6] Phạm Việt Bình, (2007), Phát triển kỹ thuật dò biên, phát hiện biên và ứng dụng, Luận án tiến sỹ ngành Bảo đảm toán học cho máy tính và hệ thống tính toán, Viện Công nghệ thông tin – Viện Khoa học và Công nghệ Việt Nam.

[7] Đặng Văn Đức, Hệ quản trị CSDL đa phương tiện, Giáo trình dành cho lớp Cao học - Khoa Công nghệ thông tin – Đại học Thái Nguyên.

[8] Trần Công Thự, (2006), Nghiên cứu một số kỹ thuật tra cứu ảnh và ứng dụng vào bài toán kiểm chứng cổ vật, Luận văn thạc sỹ ngành Công nghệ thông tin, Trƣờng ĐH Công nghệ - ĐH Quốc gia Hà nội.

Tiếng Anh

[9] Abhishek Krovi, Shahram Rahimi (2000), A distributed approach to content based image retrieval, Department of Computer Sciense, Southern Illinois University, wotan.liu.edu/docis/dbl/pdptap/2003__458_ADATCB.htm

[10] J. Ashley, R. Barber, M. Flickner, J. Hafner, D. Lee W. Niblack, D. Petkovic, Automatic and semiautomatic methods for image annotation and retrieval in QBIC, In Proc. of Storage and Retrieval for Image and Video Databases (SPIE) III, volume 2420, pages 24–35, 1995.

[11] J. Beck, Perceptual grouping produced by line _gures, Percept. Pyschophys, 2, (1967) 491.

[12] S. K. Chan, National University of Singapore, (1994), Content-based Image Retrieval, MSc thesis.

[13] S. -K Chang et al (1987), Iconic Indexing by 2-D Strings, IEEE Trans. Pattern Analysis and Machine Intelligence, pp 413-428

[14] Cheng Chang, Liu Wenyin, Hongjiang Zhang (2001), Image retrieval based on region shape similarity, Microsoft Research China, www.eecs.berkeley.edu/~cchang/docs/Spie01.pdf

[15] Cheng Chang, Liu Wenyin, Hongjiang Zhang, (2001), Image retrieval based on region shape similarity, Proceedings of SPIE, the International Society for Optical Engineering ISSN 0277-786X, vol. 4315, pp. 31-38.

[16] Chua T. S., Lim S. K., Pung H. K., Content-based retrieval of segmented images, ACM Multimedia, (1994) 211.

[17] Colin C. Venteres and Dr. Matthew Cooper, A Review of Content-Based Image Retrieval Systems, http://www.jtap.ac.uk/reports/htm/jtap-054.html

[18] Dengsheng Zhang, Aylwin Wong, Maria Indrawan, Guojun Lu, Content-based Image Retrieval Using Gabor Texture Features, personal.gscit.monash.edu.au/~dengs/resource/papers/pcm00.pdf

[19] Do Nang Toan (2002), The boundaries of the region and properties, Science and Technology Journal, Vol.40, Special No, pp 41-48.

[20] 20 Eero Hyvönen et al (2002), Ontology Image Retrieval, www.seco.tkk.fi/publications/2003/hyvonen-saarela-et-al-ontology-based-imageretrieval

[21] 21 Fuhui Long, Hongjiang Zhang, David Dagan Feng (2002), Fundamentals of Content-based Image Retrieval, in Multimedia Information Retrieval and Management - Technological Fundamentals and Applications, Springer, Chapter 1, pp. 1-26.

[22] 22 M. Gervautz and W. Purgathofer, “A simple method for color quantization: octree quantization” in A. Glassner, ed, Graphics Gems I, Acad. Press, 1990, pp. 287-293.

[23] 23 Gunhan Park, Yunju Baek, Heung-Kyu Lee (2002), A Ranking Algorithm Using Dynamic Clustering for Content-Based Image Retrieval, Springer Berlin / Heidelberg, ISSN 0302-9743

[24] 24 Guojun Lu; Phillips, J., (1998), Using perceptually weighted histograms for colour-based imageretrieval, Signal Processing Proceedings, 1998. ICSP apos’98. Fourth International Conference on Volume 2, Issue, Page(s):1150 - 1153.

[25] 25 Jame Z Wang, J. Li. CSDL ảnh MISC.

http://wang.ist.psu.edu/docs/related.shtml

[26] 26 James Hafner, Harpreet S. Sawhney, Will Equitz, Myron Flickner, Wayne Niblack, (July 1995), Efficient Color Histogram Indexing for Quadratic Form Distance Functions, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 17, no. 7, pp. 729-736.

[27] 27 Julia Vogel and Bernt, (2002), On Performance Characterization and Optimization for Image Retrieval, Proceedings of 7th European Conference on Computer Vision, Springer, pp. 49-63.

[28] 28 Low (1991), A Introductory Computer Vision and Image Processin, McGraw- hill, 244p. ISBN 0077074033

[29] 29 J. B. MacQueen, (1967), Some Methods for classification and Analysis of Multivariate Observations, Proceedings of 5-th Berkeley Symposium on Mathematical Statistics and Probability, Berkeley, University of California Press, 1:281-297.

[30] 30 Michael J. Swain, Dana H. Ballard, Color indexing, International Journal of Computer Vision, 7(1), (1991) 11.

[31] 31 Mike D Sutton (2005), Using Device Independent Bitmaps (DIBs) in Visual Basic, Part 1, EDAIS, http://edais.mvps.org/

[32] 32 Nagasaka A., Tanaka Y., Automatic video indexing and full-video search for object appearances, Visual Database Systems, II, IFIP, (1992) 113.

[33] 33 A. Natsev, R. Rastogi, K. Shim, WALRUS: A similarity retrieval algorithm for image databases, In Proc. ACM SIGMOD Intl. Conf. on Management of Data, pages 395–406, 1999.

[34] 34 Nguyen Huu Quynh, Ngo Quoc Tao, Improving Harbin method for retrieving landscape image, Proc of IEEE on Intelligent Information Hiding and Multimedia Signal Processing, 2008.

[35] 35 G. Pass, R. Zabih, Histogram refinement for content-based image retrieval, In Proc. of IEEE Workshop on Applications of Computer Vision, pages 96–102, 1996.

[36] 36 Peter Howarth, Stefan Ruger (2000), Evaluation of Texture Features for Content-based Image Retrieval, Department of Computing, Imperial College

London

mmis.doc.ic.ac.uk/www-pub/civr04-texture.pdf

[37] 37 Randy Crane (1997), A simplied approach to Image Processing: clasical and modern technique in C, Prentice Hall, ISBN 0-13-226616-1.

[38] 38 Ritendra Datta, Dhiraj Joshi, Jia Li and James Z. Wang, ``Image Retrieval: Ideas, Influences, and Trends of the New Age,'' ACM Computing Surveys, vol. 40, no. 2, article 5, pp. 5:1-60, April 2008

[39] 39 Sanghoon Sull et al (2001), Relevance Graph-based Image Retrieval, School of

Electrical Engineering Korea University,

www.informatik.uni-trier.de/~ley/db/indices/a-tree/s/Sull:Sanghoon.html

[40] 40 E.D. Sciascio, G. Mingolla, M. Mongiello, Content-based image retrieval over the web using query by sketch and relevance feedback, In Proc. of the Intl. Conf. on Visual Information Systems, pages 123–130, 1999.

[41] 41 Shengjiu Wang (2001), A Robust CBIR Approach Using Local Color Histograms, Department of Computer Science, University of Alberta, Edmonton,

Alberta, Canada, Tech. Rep. TR 01-13,

http://citeseer.nj.nec.com/wang01robust.html

[42] 42 R.O. Stehling, M.A. Nascimento, A.X. Falc˜ao, Techniques for color-based image retrieval, Technical Report 16, University of Alberta, 2001.

[43] 43 R.O Stehling, M.A. Nascimento, A.X. Falc˜ao, Cell histograms versus color histograms for image representation and retrieval. Knowledge and Information Systems (KAIS) Journal (To Appear), 2002.

[44] 44 R.O. Stehling, M.A. Nascimento, and A.X Falc˜ao, An adaptive and efficient clustering-based approach for content based image retrieval in image databases, In Proc. of the Intl. Data Engineering and Application Symposium, pages 356–365, 2001. [45] 45 M.A. Stricker, M. Orengo, Similarity of color images, In Proc. of Storage and Retrieval for Image and Video Databases (SPIE)-III, volume 2420, pages 381–392, 1995.

[46] 46 D. Symon D’O. Cotton, School of Computer Science, University of Birmingham, England, (1995), Colour, colour spaces and the human visual system, Technical report. [47] 47 Tanner Helland, Graphics Programming in Visual Basic,

tannerhelland.tripod.com/VBGraphicsTutorial.htm

[48] 48 A. Treisman, R. Paterson, A feature integration theory of attention, Cognit. Psychol, vol. 12, (1980) 97.

[49] 49 S. Wang, A robust CBIR approach using local color histograms, Master’s thesis, University of Alberta, 2001.

[50] 50 Wei-Ying Ma, HongJiang Zhang, Content-Based Image Indexing and Retrieval, Handbook of Multimedia Computing, CRC Press, (1999).

[51] 51 Wong, J. A. Hartigan and M. A., (1979), Algorithm AS136: A k- means Clustering Algorithm. Applied Statistics, vol. 28, pp. 100-108.

[52] 52 Xia Wan; Kuo, C.-C.J., (Sep 1998), A new approach to image retrieval with hierarchical colorclustering, Circuits and Systems for Video Technology, IEEE Transactions on Volume 8, Issue 5, Page(s):628 – 643

[53] 53 B. Yates, R. Neto, Modern Information Retrieval, Addison Wesley, 1999. [54] 54 Yining Deng, B. S. Manjunath and Hyundoo Shin, “Color Image

Segmentation”, Department of Electrical and Computer Engineering

University of California, Santa Barbara,

http://www-iplab.ece.ucsb.edu/publications/99CVPRSeg.htm

[55] 55 Y. Deng, C. Kenney, M.S. Moore, and B.S. Manjunath, “Peer group filtering and perceptual color image quantization”, to appear in Proc. of ISCAS, 1999. [56] 56 Yixin Chen, James Z. Wang and Robert Krovetz, ``CLUE: Cluster-based

Retrieval of Images by Unsupervised Learning,'' IEEE Transactions on Image Processing, vol. 14, no. 8, pp. 1187-1201, 2005.

[57] 57 Yixin Chen, Department of Computer Science and Engineering, The Pennsylvania State University, (June 2003), A Machine Learning Approach to Content-Based Image Indexing and Retrieval, Ph.D. Dissertation.

[58] 58 Yong Rui, Thomas S. Huang, Image Retrieval: Current Techniques, Promising Directions and Open Issues, Journal of Visual Communication and Image Representation, (1999).

CHỮ KÝ CỦA CHỦ NHIỆM ĐỀ TÀI VÀ XÁC NHẬN CỦA ĐƠN VỊ

Chủ nhiệm đề tài Thủ trƣởng đơn vị

Cải tiến thuật toán JSEG (Thuật toán O-JSEG)

Trích rút đặc trƣng

Thuật toán phân lớp dữ liệu K-means