Thiết kế Hệ thống truy tìm ảnh dựa trên đặc trưng cấp thấp và đặc trưng màu sắc

MỤC LỤC

Thuật ngữ chuyên ngành

CÁC KHÁI NIỆM CƠ BẢN

  • Màu sắc
    • Vân (textture)
      • Hình dáng
        • Độ đo

          Nhưng đối tượng đó sẽ có màu tím khi chiếu ánh sáng đỏ vào.Với sự phát triển mạnh mẽ của các thiết bị kinh tế, máy móc xử lý màu sắc trở nên thông dụng: Chúng ta có các thiết bị như máy quay phim màu, thiết bị chiếu màu và những phần mềm xử lý ảnh màu. Đặc biệt, màu sắc thuận tiện bởi vì nó cung cấp phép đo lường đa dạng tại mỗi điểm ảnh đơn, có thể phân lớp, phân loại mà không cần đến những sự xử lý không gian phức tạp để đưa đến quyết định. Các không gian màu màn hình là các biến thể của không gian màu RGB, các không gian màu video - tất cả đều tương tự như không gian màu YUV được phân thành các không gian màu riêng tuỳ vào ứng dụng.

          Để lấy được các giá trị RGB từ tập YIQ, chúng ta chỉ cần thực hiện toán tử đảo ma trận .Hệ màu YIQ được thiết kế giúp cho sự cảm nhận của con người về sự thay đổi độ sáng chói tốt hơn sự thay đổi đặc trưng màu sắc (Hue) và độ thuần khiết (Sataration). Tuy nhiên vì lược đồ màu chỉ thể hiện tính phân bố màu toàn cục của ảnh mà không xét đến tính phân bố cục bộ của điểm ảnh nên có thể có 2 ảnh trông rất khác nhau nhưng lại có cùng lược đồ màu. Vân thu được từ biến đối wavelet được hầu hết các nghiên cứu công nhận là đặc trưng về vân tốt nhất cho việc phân đoạn ảnh.Từ một vùng kích thước nxn ta có thể thu được một vector có 3 thành phần đặc trưng cho texture với biến đối wavelet ở mức 1.

          Hình 18: Hệ màu RGB
          Hình 18: Hệ màu RGB

          TRUY TÌM ẢNH DỰA VÀO ĐẶC TRƯNG CẤP THẤP

          • Các đặc trưng được sử dụng để truy tìm ảnh

            Nú thể hiện rừ ràng hơn về hỡnh dỏng của ảnh: thể hiện mối liên kết chặt chẽ giữa các điểm biên cạnh (các điểm biên cạnh có cùng góc độ), cũng như là những điểm không phải là biên cạnh. Vectơ liên kết hệ số góc còn có thể khắc phục được khuyết điểm của lược đồ hệ số góc đó là: 2 ảnh có lược đồ hệ số góc giống nhau nhưng khác nhau về ngữ nghĩa. Việc tìm kiếm theo đặc trưng vector liên kết hệ số góc giúp cho kết quả chính xác hơn, ảnh tìm được mang ngữ nghĩa gần ảnh truy vấn hơn.

            Việc chọn đặc trưng vectơ liên kết hệ số góc cho việc tìm kiếm, giúp ta có thể phân biệt ảnh thiên nhiên và ảnh thành phố.

            Agglomerative Clustering Algorithm- HAC) và áp dụng giải thuật trong phân lớp ảnh theo các đặc

            Giải thuật

            Ảnh thành phố có khuynh hướng tạo các điểm liên kết hệ số góc theo hướng ngang dọc. Ảnh thiên nhiên có khuynh hướng ít tạo các điểm liên kết hệ số góc theo hướng ngang dọc. Vì vậy nó là đặc trưng có ưu điểm hơn lược đồ hệ số góc đối với việc phân lớp ảnh thiên nhiên và thành phố.

            Thêm dòng mới và cột mới chứa khỏang cách giữa lớp mới tạo và các lớp cũ.

            Áp dụng giải thuật phân lớp phân cấp vào việc xây dựng cây phân cấp theo các đặc trưng của ảnh

            Sau khi xây dựng câp phân cấp xong, chúng ta cần thực hiện việc rút gọn cây, để gôm những nút giống nhau về cùng một nhóm. Mỗi nhóm sau khi đuợc gôm lại sẽ được trích chọn một phần tử đại diện. Phần tử đại diện được chọn là phần tử có tổng khoảng cách đến các phân tử còn lại nhỏ nhất.

            Nó giúp rút ngắn thời gian tìm kiếm nhờ vào việc tránh phải duyệt toàn bộ cơ sở dữ liệu.

            Hình 52:Cây phân cấp theo lược đồ màu
            Hình 52:Cây phân cấp theo lược đồ màu

            Các chiến lược truy tìm ảnh

            • Truy tìm ảnh xét đến tính phân bố toàn cục .1 Tìm kiếm theo màu sắc
              • Truy tìm ảnh xét đến tính phân bố cục bộ (yếu tố không gian)

                Thừơng tìm kiếm theo từng đặc trưng có thể cho ra kết quả khá nhiều, xuất hiện những tấm ảnh không cần thiết nên để nâng cao hiệu quả của việc tìm kiếm, làm cho việc tìm kiếm được chính xác hơn thì chúng ta nên kết hợp các đặc trưng lại với nhau. Ví dụ người dùng cần tìm kiếm những tấm ảnh có người mặc áo màu vàng và có dáng đứng thẳng thì người dùng có thể kết hợp 2 đặc trưng lược đồ màu (Histogram) và lược đồ hệ số góc (Edge Direction Histogram) lại với nhau. Ví dụ, người dùng chỉ muốn tìm một bông hồng nhỏ ở ngay tại vị trí nào đó trong ảnh thì khi tìm kiếm theo tính phân bố toàn cục thì có thể có ảnh cũng có bông hồng nhỏ nhưng khác nhau về vị trí hay là cũng có bông hồng tại vị trí đó nhưng chỉ giống nhau về màu hồng không đủ để 2 ảnh giống nhau theo yêu cầu về độ giống nhau đưa ra, nên kết quả sẽ không có bông hồng này.

                Với việc chia lưới trên người dùng có thể thực hiện ý tưởng tìm kiếm cảnh thành phố lúc hoàn hôn như sau: người dùng chọn block 0 tìm kiếm theo đặc trưng màu, block 1 và block 2 tìm kiếm theo đặc trưng lược đồ hệ số góc.

                TRUY TÌM ẢNH DỰA VÀO ĐẶC TRƯNG CẤP CAO

                • Bài toán phân đoạn ảnh
                  • Các chiến lược truy tìm theo đặc trưng cấp cao

                    Với đặc trưng vùng sẽ giúp cho chúng ta có thể giải quyết được một vấn đề lớn đang cản trở bước phát triển việc truy tìm ảnh dựa vào nội dung là dữ liệu nhập chưa được mô phỏng gần gũi hơn với suy nghĩ của con người và ảnh tìm được có thể mang nội dung ngữ nghĩa rất khác so với ảnh truy vấn. Quá trình phân đoạn vùng của ảnh đòi hỏi phải tốn nhiều thời gian, do đó khi tìm kiếm trên một cơ sở dữ liệu ảnh lớn thì vấn đề thời gian là một trong những vấn đề gây khó khăn cho bài toán, do đó cần phải có biện pháp tổ chức cơ sở dữ liệu hiệu quả giúp cho việc tìm kiếm được nhanh hơn, hiệu quả hơn. Trong việc phát triển truy tìm ảnh dựa vào nội dung, một vấn đề lớn đang cản trở bước phát triển này là dữ liệu nhận cần phải mô phỏng gần gũi hơn với suy nghĩ của con người và ảnh tìm được không được mang nội dung ngữ nghĩa quá khác so với ảnh truy vấn.

                    Một cách truyền thống là họ chọn một ảnh truy vấn phù hợp với yêu cầu, tuy nhiên họ có thể không có sẵn bức ảnh truy vấn mà chỉ có một số ý niệm nào đó về bức ảnh (ví dụ họ cần tìm các bức ảnh có dáng vẻ như sau: cỏ non xanh tận chân trời, cành lê trắng điểm một vài bông hoa), hoặc nhiều khi có được bức ảnh truy vấn nhưng họ chỉ muốn tìm các ảnh giống một số đối tượng nào đó trong ảnh.

                    Hình 94: Cơ sở dữ liệu dùng để phân vùng ảnh
                    Hình 94: Cơ sở dữ liệu dùng để phân vùng ảnh

                    TRUY TÌM ẢNH DỰA VÀO NGỮ NGHĨA

                    Cách truy vấn này là dùng đặc trưng cấp cao là vùng mà chúng em còn gọi là vần ảnh (cùng với đặc trưng cấp thấp như màu, vân, hình dáng) để bắt cầu nối giữa đặc trưng cấp thấp và ngữ nghĩa ảnh. Điều này dẫn đến một khả năng truy tìm mới là dựa vào câu truy vấn dạng ngôn ngữ, liên kết giữa các vùng đại diện theo một lý luận để truy tìm ảnh. Trong từng nhóm ảnh đã được phân loại bằng tay, trích ra các vùng đặc thù cho nhóm ảnh để khi truy vấn ta có thể diễn dịch từ ngôn ngữ sang vần ảnh.

                    Ví dụ như tìm cảnh bãi biển lúc bình minh, thì liên kết nhóm từ bãi biển với vùng đại diện cho bãi biển và liên kết nhóm từ bình minh với vùng đại diện cho bình minh.

                    Hình 106: Các vùng đã được gán nhãn
                    Hình 106: Các vùng đã được gán nhãn

                    CÀI ĐẶT VÀ THỬ NGHIỆM

                    • Cài đặt
                      • Thử nghiệm
                        • Kết quả thực nghiệm của hệ thống

                          ƒ Tìm kiếm dạng cơ bản: gồm các đặc trưng lược đồ màu (Histogram), lược đồ hệ số góc (Edge Direction Histogram), Vector liên kết màu (Color Coherence Vector), Vector liên kết hệ số góc(Edge Direcrion Coherence Vector), Correlogram. ƒ Tìm kiếm theo vùng, đối tượng: Từ ảnh truy vấn có sẵn, chương trình tách thành các vùng (vần) cấu thành nên ảnh, tiếp theo người dùng chọn các vùng cần thiết cho việc tìm kiếm. Vẫn là ảnh tìm theo lược đồ hệ số góc nhưng người dùng không tìm theo lược đồ hệ số góc mà tìm theo Vector liên kết hệ số góc.

                          Nhưng ở đây tìm theo đặc trưng màu (Histogram) là 55% và lược đồ hệ số góc (Edge Direction Histogram)là 75%.

                          Hình 111: Mô hình hệ thống
                          Hình 111: Mô hình hệ thống

                          TỔNG KẾT VÀ HƯỚNG PHÁT TRIỂN

                            Với các chức năng trên hệ thống đã hòan thành các mục tiêu đề ra ban đầu là xây dựng hệ thống truy tìm ảnh dựa vào đặc trưng cấp thấp, đặc trưng cấp cao và hướng tới việc tìm kiếm ảnh dựa vào ngữ nghĩa. Với hệ thống này, chúng em đã xây dựng được một nền tảng vững chắc giúp ta lấp dần hố ngăn cách giữa các đặc trưng cấp thấp, cấp cao với ngữ nghĩa của ảnh. Cùng với đó kết hợp với việc xây dựng một bộ luật ngôn ngữ riêng, giúp ta tiến lên một bước truy tìm ảnh cao hơn là: truy tìm ảnh chỉ bằng câu truy vấn dạng ngôn thông thường.

                            Nhận thức rừ ý nghĩa to lớn này, chỳng em nguyện cố gắng nhiều hơn nữa, tìm hiểu cải tiến chất lượng cho hệ thống càng hòan thiện hơn.