Độ tròn được tính như sau:
2 4
P S
(2.45) Trong đó S là diện tích và P là chu vi của đối tượng. Giá trị độ tròn thay đổi giữa 0 (đường thẳng tuyệt đối) và 1 (đường tròn tuyệt đối).
Hướng trục chính có thể được định nghĩa là hướng của véc tơ riêng lớn nhất của ma trận hiệp phương sai bậc hai của một vùng hay của một đối tượng.
Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Chƣơng 3:
CHƢƠNG TRÌNH THỬ NGHIỆM 3.1. Giới thiệu bài toán tra cứu địa danh du lịch qua ảnh
Ảnh địa danh du lịch là kiểu đối tượng có tính chất hình học và màu sắc đặc trưng, thường là ảnh của những danh lam thắng cảnh, những khu vui chơi các bãi biển, những di tich lịch sử văn hóa tâm linh.
Tuy nhiên các ảnh địa danh thì không có quy luật mà chỉ là hệ thống các ảnh, các ký hiệu với ý nghĩa qui ước kèm theo. Việc ghi nhớ hình dạng và ý nghĩa của tất cả các loại ảnh địa danh du lịch đối với chúng ta sẽ là một khó khăn lớn, Vì lý do trên, tôi mong muốn xây dựng một ứng dụng nhỏ gọn, đơn giản cho phép người dùng có thể tra cứu trực quan thông tin của từng địa danh du lịch theo nhu cầu và sở thích.
Với số lượng ảnh địa danh lớn như vậy, đồng thời có nhiều ảnh địa danh có hình thức, màu sắc tương tự nhau để biết và nhớ hết được các địa danh không phải là đơn giản. Để giải quyết vấn đề này chúng ta có thể sử dụng phương pháp đơn giản hơn là tìm cách so sánh ảnh mẫu địa danh du lịch cần xác định với ảnh các địa danh du lịch đã được lưu trữ để tìm ra những địa danh "giống" với địa danh du lịch cần xác định nhất.
Chức năng chính cơ bản của ứng dụng là tra cứu thông tin trực quan. Từ một ảnh có sẵn ứng dụng sẽ tìm các hình ảnh tương tự trong cơ sở dữ liệu và mục đích là tìm ra ảnh đích hoặc các thông tin liên quan đến ảnh cần truy vấn.
Việc so sánh hai ảnh không thực hiện trực tiếp như so sánh văn bản, để so sánh hai ảnh phải dựa vào các đặc trưng của ảnh như màu sắc, kết cấu, hình dạng. Các đặc tính này có thể nhận thấy bằng mắt thường nhưng để máy nhận biết được các đặc tính đó là rất khó.
Yêu cầu chính với bài toán này là phải tìm kiếm chính xác, kết quả trả về trong thời gian nhanh nhất có thể chấp nhận được và hoạt động trên một cơ sở dữ liệu ảnh lớn.
Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
trong một cơ sở dữ liệu ảnh địa danh du lịch những ảnh có nội dung ( màu sắc ) giống với một ảnh địa danh du lịch mẫu nhất, sau đó sắp xếp theo thứ tự giảm dần của độ tương tự.
3.2. Phấn tích bài toán
Với mục đích là lưu trữ hình ảnh của các địa danh du lịch nên thông thường mỗi ảnh địa danh du lịch chỉ có một đối tượng ảnh duy nhất trên nền ảnh đồng nhất và có màu sắc tương phản rõ rệt để làm nổi đối tượng ảnh.
Chúng ta cũng nhận thấy rằng để so sánh, phân loại ảnh địa danh du lịch thì hai đặc điểm quan trọng nhất là hình dạng và màu sắc của đối tượng ảnh.
Các ảnh địa danh thường có các đặc điểm kết cấu rất phức tạp và không phản ánh được đặc trưng của đối tượng còn bố cục không gian thì rõ ràng là không có ý nghĩa đối với các trường hợp ảnh chỉ có một đối tượng ảnh.
Từ những phân tích trên có thể áp dụng một số giới hạn sau với bài toán tra cứu địa danh du lịch.
Nhiệm vụ của bài toán là xây dựng hệ thống tra cứu ảnh địa danh du lịch có một số các chức năng sau:
Khi người sử dụng cung cấp một ảnh mẫu địa danh du lịch cần tra cứu có định dạng thông dụng JPEG, BMP, GIF. Hệ thống có nhiệm vụ tìm kiếm trong một cơ sở dữ liệu ảnh đã có sẵn và cho ra một danh sách tất cả các ảnh tương tự như ảnh mẫu theo thứ tự ảnh nào được coi là giống với ảnh mẫu hơn thì được xếp phía trên.
Người sử dụng có thể lựa chọn theo một trong hai đặc điểm để so sánh: so sánh theo màu sắc, so sánh theo hình dạng hoặc kết hợp cả hai đặc điểm để so sánh.
Người sử dụng có thể thiết lập khoảng cách ngưỡng cho từng đặc điểm: chương trình chỉ trả lại các kết quả mà khoảng cách giữa ảnh kết quả và ảnh mẫu không vượt quá ngưỡng
Hoặc người sử dụng có thể qui định số lượng ảnh kết quả trả lại. Để đơn giản, chúng ta chỉ xét bài toán trong những hạn chế sau:
Chỉ xét những ảnh có một đối tượng ảnh duy nhất trên nền có màu đồng nhất.
Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Các đối tượng ảnh có hình dạng không quá phức tạp và có đường biên tương đối đơn giản.
Ảnh có định dạng phổ biến JPG, BMP, GIF, PCX, đã qua khâu tiền xử lý để loại bỏ nhiễu.
3.3. Xây dựng chƣơng trình
3.3.1. Sơ đồ khối tổng quát
Hình 3.1. Sơ đồ khối tổng quát của chương trình
Sơ đồ này thể hiện các khối chức năng chính của mỗi modul chương trình: Đọc ảnh: sử dụng các thư viện chuẩn của Windows để đọc ảnh mẫu hoặc ảnh trong cơ sở dữ liệu vào một cấu trúc DIB.
Trích chọn đặc điểm: tuỳ thuộc vào đặc điểm cần trích chọn là màu sắc hay hình dạng mà khối này sử dụng các thuật toán trích chọn tương ứng.
Tạo véc tơ đặc trưng: các đặc điểm được trích chọn ra dưới dạng các véc tơ đặc trưng nhiều chiều.
Đọc ảnh mẫu Trích chọn đặc điểm Tạo Véc tơ đặc trưng ơ Đọc ảnh từ cơ sở DL Tạo Véc tơ đặc trưng Tính khoảng cách Thêm vào danh sách ở vị trí thích hợp Trích chọn đặc điểm
Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Tính khoảng cách: dựa vào một trong số những phương pháp tính khoảng cách đã được trình bày ở chương 2 để tính khoảng cách tương ứng giữa các véc tơ đặc trưng của ảnh mẫu và ảnh trong cơ sở dữ liệu.
Cuối cùng dựa theo khoảng cách đã tính được, chương trình sẽ sắp xếp các kết quả theo chiều giảm dần của độ tương tự giữa các véc tơ đặc trưng.
3.3.2. Tra cứu theo màu sắc
Hình 3.2. Sơ đồ khối phần tra cứu ảnh theo màu sắc
Sử dụng phương pháp histogram màu như trình bày trong chương 2.
Ảnh mẫu được đọc vào cấu trúc DIB và hiển thị bằng thủ tục DisplayImage Giảm số lượng bin màu xuống 256 bằng cách chuyển đổi màu thực của mỗi điểm ảnh thành một trong số những màu trong bảng màu chuẩn của Windows bằng hàm GetClosetIndex.
Tính toán số điểm ảnh của từng bin màu bằng hàm GenerateColorSignature, thu được một véc tơ 256 chiều chính là véc tơ đặc trưng màu sắc của ảnh.
Làm các bước tương tự như trên với từng ảnh trong cơ sở dữ liệu.
Tính khoảng cách Euclide giữa véc tơ đặc trưng của ảnh mẫu và từng ảnh trong cơ sở dữ liệu bằng hàm GetColorDistance sắp xếp vào trong danh sách với
Đọc ảnh mẫu Tính histogram màu Đọc ảnh từ cơ sở DL Tính k/c Euclide Thêm vào danh sách ở vị trí thích hợp Chuyển đổi 256 màu Tính histogram màu Chuyển đổi 256 màu
Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/ khoảng cách nhỏ nhất được xếp trước tiên.
3.3.3. Sử dụng chương trình ứng dụng
Khởi động chương trình, chọn file ảnh mẫu, ảnh mẫu sẽ được hiển thị ô khung "Sample Image".
Chọn phương pháp so sánh: bằng màu sắc, nhập số đo khoảng cách tối đa (giá trị ngưỡng) trong hộp Similarity Distance.
Nhấn nút Find, chương trình sẽ yêu cầu người dùng chọn thư mục chứa các file ảnh cần tìm. Chương trình sau đó sẽ liệt kê tất cả các ảnh có khoảng cách Euclide nhỏ hơn giá trị ngưỡng theo thứ tự tăng dần của khoảng cách Euclide, những ảnh được coi là giống hơn được xếp trước. Khi chọn một ảnh trong danh sách ảnh tìm thấy (Found Image List), chương trình sẽ hiển thị ảnh đó trong khung Retrieved Image.
Hình 3.3. Giao diện của chương trình
Dưới đây là một số kết quả chạy chương trình để tìm kiếm các ảnh tương tự với ảnh mẫu.
Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
Hình 3.4. Một số kết quả chạy chương trình
3.4. Khả năng mở rộng của chƣơng trình
3.4.1. Những hạn chế của chương trình
Các ảnh ban đầu chưa được xử lý “sơ chế” như lọc nhiễu và yêu cầu ở một định dạng đơn giản nên phạm vi so sánh bị hạn chế.
Chương trình thiết lập kích thước cố định cho ảnh trước khi xử lý là 256×256, kích thước các khối là 16×16, số chiều của vector đặc trưng là 256 làm hạn chế tính mềm dẻo của chương trình
3.4.2. Khả năng mở rộng
Kỹ thuật “tra cứu ảnh theo nội dung” có rất nhiều hướng nghiên cứu phát triển tạo ra những thuật toán rất hiệu quả làm cho máy tính “hiểu” được nội dung của ảnh. Chúng ta hoàn toàn có thể xây dựng một thuật toán tốt hơn để trích chọn được những đặc điểm đặc trưng khác như màu sắc, kết cấu, hình dạng của đối tượng ảnh để phát triển cho bài toán nhận dạng vật thể.
Sử dụng các phương pháp tính toán độ tương tự phù hợp hơn cho từng loại đặc điểm để có được những kết quả so sánh gần với trực giác hơn.
Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
KẾT LUẬN
Luận văn đã trình bày một vài kỹ thuật nền tảng của các hệ thống tra cứu ảnh theo nội dung bao gồm mô tả nội dung trực quan, đánh giá độ tương tự, sơ đồ đánh chỉ số, giao tiếp với người sử dụng và đánh giá hiệu năng hệ thống, trong đó nhấn mạnh vào các kỹ thuật mô tả các đặc điểm trực quan.
Các đặc điểm trực quan tổng quát được sử dụng nhiều nhất trong các hệ tra cứu ảnh theo nội dung là màu sắc, kết cấu và hình dạng.
Màu sắc thường được biểu diễn thông quan histogram màu, sơ đồ tương quan màu, véc tơ gắn kết màu và các moment màu trong một không gian màu nhất định.
Kết cấu có thể được biểu diễn thông qua đặc điểm Tamura, phân tích Wold, mô hình SAR, biến đổi Gabor và biến đổi dạng sóng.
Hình dạng có thể biểu diễn thống qua các bất biến moment, các hàm xoay, mô tả Fourier, độ tròn, độ lệch tâm, hướng trục chính và cả biến đổi radon.
Ngoài ra các đặc điểm trực quan của mỗi điểm ảnh lại có thể được sử dụng để phân tách mỗi ảnh thành các vùng đồng nhất hoặc các đối tượng ảnh. Các đặc điểm cục bộ của các vùng ảnh hoặc các đối tượng ảnh có thể dùng trong các hệ thống tra cứu ảnh theo vùng.
Có nhiều cách để đánh giá khoảng cách giữa các đặc điểm trực quan, một số cách được sử dụng phổ biến như khoảng cách Minkowski, khoảng cách toàn phương, khoảng cách Mahalanobis, độ phân kỳ Kullback-Leibler và độ phân kỳ Jeffrey. Đến thời điểm này thì phương pháp tính khoảng cách Minkowski và khoảng cách toàn phương được sử dụng rộng rãi nhất trong các hệ thống tra cứu ảnh.
Mặc dù kỹ thuật tra cứu ảnh theo nội dung đưa ra được một giải pháp thông minh và tự động để tìm kiếm ảnh một cách hiệu quả thì vấn đề chính của kỹ thuật này vẫn chỉ dựa trên những đặc điểm ở mức thấp. Nói chung mỗi đặc điểm mức thấp này chỉ có thể phản ánh đựơc một khía cạnh nào đó của ảnh. Không có một đặc điểm nào có thể phản ánh được ngữ nghĩa của một bức ảnh, kể cả khi sử dụng kết
Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/ hợp nhiều đặc điểm.
Phần cuối của luận văn đã đưa ra một áp dụng cụ thể cho phương pháp tra cứu ảnh theo nội dung.
Luận văn đã đạt đƣợc các kết quả sau:
Trình bày Khái quát về tra cứu ảnh và bài toán tra cứu địa danh du lịch . Giới thiệu đầy đủ về các kiến thức nền tảng được sử dụng trong khóa luận bao gồm kiến thức về xử lý ảnh và giới thiệu về bài toán tra cứu địa danh du lịch.
Trình bày hai kỹ thuật tra cứu địa danh du lịch là kỹ thuật tra cứu ảnh dựa vào màu sắc và kỹ thuật tra cứu ảnh dựa vào hình dạng.
Xây dựng một ứng dụng của phương pháp tra cứu ảnh theo nội dung áp dụng vào bài toán tra cứu địa danh du lịch qua ảnh, các sơ đồ chức năng và thiết kế giao diện của chương trình.
Những vấn đề còn tồn tại:
Do thời gian tìm hiểu về đề tài chưa được nhiều và những hạn chế về khả năng lập trình đồ hoạ nên một số mục tiêu đặt ra từ khi bắt tay nghiên cứu chưa thực hiện được trong chương trình chạy thử này, bao gồm:
Chưa có chức năng tra cứu ảnh bằng cách kết hợp nhiều đặc điểm.
Chưa cài đặt các kỹ thuật đánh chỉ số hiệu quả đã đề cập trong phần bài luận. Chưa cài đặt các kỹ thuật tăng hiệu năng của hệ thống bằng cách giảm số chiều các véc tơ đặc trưng.
Trong thời gian tới, tôi hy vọng sẽ có thể giải quyết được những vấn đề còn tồn tại trên để có thể xây dựng được một chương trình thực sự hữu ích, đáp ứng được những yêu cầu của bài toán.
Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
TÀI LIỆU THAM KHẢO
1. Fuhui Long, Hongjiang Zhang, David Dagan Feng (2002), Fundamentals of Content-based Image Retrieval, in Multimedia Information Retrieval and Management - Technological Fundamentals and Applications.
2. Do Nang Toan (2002), The boundaries of the region and properties, Science and Technology Journal, Vol.40, Special No, pp 41-48.
3. Low (1991), A Introductory Computer Vision and Image Processin, McGraw- hill, 244p. ISBN 0077074033
4. Randy Crane (1997), A simplied approach to Image Processing: clasical and modern technique in C, Prentice Hall, ISBN 0-13-226616-1.
5. Lương Mạnh Bá, Nguyễn Thanh Thuỷ (2003), Nhập môn xử lý ảnh số, Nhà xuất bản Khoa học Kỹ thuật.
6. Shengjiu Wang (2001), A Robust CBIR Approach Using Local Color Histograms, Department of Computer Science, University of Alberta, Edmonton, Alberta, Canada, Tech. Rep. TR 01-13, http://citeseer.nj.nec.com/wang01robust.html
7. Peter Howarth, Stefan Ruger (2000), Evaluation of Texture Features for Content-based Image Retrieval, Department of Computing, Imperial College London mmis.doc.ic.ac.uk/www-pub/civr04-texture.pdf
8. Eero Hyvönen et al (2002), Ontology Image Retrieval, www.seco.tkk.fi/publications/2003/hyvonen-saarela-et-al-ontology-based- image-retrieval
9. Lương Mạnh Bá, Nguyễn Thanh Thủy, (1999), Nhập môn Xử lý ảnh số, Nhà xuất bản Khoa học và Kỹ thuật, Hà Nội.
10. Võ Đức Khánh, (2003) Giáo trình xử lý ảnh, Nxb Thống kê, Hà Nội.
11. Đỗ Năng Toàn, Phạm Việt Bình, (2008), Giáo trình Xử lý ảnh, Nhà xuất bản Khoa học và Kỹ thuật, Hà Nội.
Số hóa bởi trung tâm học liệu http://lrc.tnu.edu.vn/
PHỤ LỤC