Ứng dụng kỹ thuật tra cứu ảnh dựa trên nội dung trong việc tra cứu cây thuốc

MỤC LỤC

MỘT SỐ KỸ THUẬT TRA CỨU ẢNH DỰA VÀO NỘI DUNG

Tra cứu ảnh dựa vào màu sắc

    Theo uỷ ban quốc tế về màu sắc CIE (Commission International d'E clairage), hue là “thuộc tính của cảm giác trực quan theo đó một vùng xuất hiện là tương ứng với một vùng màu được nhận thức, đỏ (red), vàng (yellow), xanh lục (green), và xanh lơ (blue), hoặc kết hợp của hai trong chúng”. Sử dụng một số màu sẽ giảm khả năng các màu tương tự được gán vào các bin khác nhau, nhưng cũng tăng khả năng các màu riêng biệt được gán vào cùng các bin, nội dung thông tin của các ảnh sẽ giảm. Ở đây Pij là giá trị của kênh màu thứ i tại pixel ảnh thứ j, Ei là màu trung bình của kênh màu thứ i, σi là độ lệch chuẩn của kênh màu thứ i, si là căn bậc ba của kênh màu thứ i, và F là tổng số các pixel.

    Hình 2.1: Mô tả không gian màu RGB
    Hình 2.1: Mô tả không gian màu RGB

    Tra cứu ảnh dựa vào hình dạng 1. Khái niệm về hình dạng

      Kỹ thuật dùng đường biên thì đặc hiệu hơn phương pháp trước, chúng làm việc với sự hiện hữu của đường biên của hình dạng đối tượng và đồng thời cũng tìm kiếm những hình dạng đối tượng gần giống với đường biên nhất. Phương pháp vẽ phác họa cú thể là phương phỏp cú nhiều đặc trưng rừ ràng hơn, khụng chỉ tỡm kiếm những đường biên đối tượng đơn, mà còn đối với tập những đối tượng đã được phân đoạn trong một ảnh mà người dùng vẽ hay cung cấp. Hai hướng được quan tâm khi truy tìm bằng cách biểu diễn nó trong câu truy vấn hình dạng bằng hai dãy nhị phân, chúng được so sánh với từng chỉ mục hình dạng bằng hay dãy nhị phân, chúng được so sánh với từng chỉ mục hình dạng lưu trữ trong CSDL.

      Hình 2.7: Hình dạng trên hình 2.6 sau khi đã được chuẩn hóa
      Hình 2.7: Hình dạng trên hình 2.6 sau khi đã được chuẩn hóa

      Tra cứu ảnh dựa vào vân 1. Vân là gì?

        Để sử dụng hai thao tác này và vẫn tiết kiệm lưu trữ, ta chỉ cần lưu một chỉ mục cho mỗi hình nhưng ta sẽ sinh ra bốn dãy nhị phân cho mỗi hình dạng trong câu truy vấn khi truy tìm. Những kết quả từ tám điểm ảnh lân cận được sử dụng để xây nên một số nhị phân tám chữ số là b1b2b3b4b5b6b7b8, trong đó bi=0 nếu cường độ intensity của láng giềng thứ i nhỏ hơn hay bằng với p và bi=1 trong trường hợp ngược lại. Bất kỳ độ đo một vân nào, cung cấp một giá trị hay vectơ giá trị tại mỗi điểm ảnh, mô tả vân trong những điểm láng giềng của điểm ảnh đó, có thể được dùng để phân đoạn ảnh thành những vùng có vân giống nhau.

        Hình 2.9: Một số loại vân tiêu biểu
        Hình 2.9: Một số loại vân tiêu biểu

        Phương pháp tra cứu ảnh sử dụng dấu hiệu nhị phân 1. Giới thiệu

          Phân hoạch vùng nhị phân cục bộ. Một cách khác rất đơn giản, nhưng là độ đo vân hữu dụng là độ phân hoạch vùng nhị phân cục bộ. Đối với mỗi điểm ảnh p trong ảnh, tám điểm lân cận được xem xét rằng cường độ intensity của chúng có lớn hơn của điểm ảnh p hay không. Những kết quả từ tám điểm ảnh lân cận được sử dụng để xây nên một số nhị phân tám chữ số là b1b2b3b4b5b6b7b8, trong đó bi=0 nếu cường độ intensity của láng giềng thứ i nhỏ hơn hay bằng với p và bi=1 trong trường hợp ngược lại. Một lược đồ của những số này được dùng để biểu thị cho vân của ảnh. Hai ảnh hay hai khu vực ảnh được so sánh bởi việc tính toán độ dài L1 giữa lược đồ của chúng được định nghĩa ở trên. Phân đoạn vân. Bất kỳ độ đo một vân nào, cung cấp một giá trị hay vectơ giá trị tại mỗi điểm ảnh, mô tả vân trong những điểm láng giềng của điểm ảnh đó, có thể được dùng để phân đoạn ảnh thành những vùng có vân giống nhau. Như những thuật toán phân đoạn ảnh khác, thuật toán phân đoạn vân có hai loại chính là cách tiếp cận dựa vào vùng và cách tiếp cận dựa vào đường biên. Cách tiếp cận dựa vào vùng có ý tưởng chính là nhóm hay phân chia những điểm ảnh với những đặc tính vân giống nhau. Cách tiếp cận dựa vào đường biên có ý tưởng là đi tìm những đường biên vân giữa những điểm ảnh đến từ những sự phân bổ vân khác nhau. Phương pháp tra cứu ảnh sử dụng dấu hiệu nhị phân. hn), với hj đại diện cho tỷ lệ phần trăm của các điểm ảnh màu sắc trong một hình ảnh với mỗi yếu tố màu cj. Để giảm thiểu việc tiêu tốn không gian lưu trữ, tôi đề xuất việc sử dụng của một đại diện nhỏ gọn của các vector bằng cách sử dụng dấu hiệu nhị phân, là các chuỗi bit nhị phân có kích thước được xác định trước đại diện cho sự phân bố màu sắc của một hình ảnh. • Mỗi ảnh trong cơ sở dữ liệu được lượng hóa thành n màu cố định C=(c1, c2,…cn) để loại bỏ sự ảnh hưởng của các biến thể nhỏ trong phạm vi các ảnh và cũng tránh sử dụng tệp lớn do biểu diễn độ phân giải cao. ) có khả năng chứa bằng nhau hoặc khác nhau, gọi là cỡ bin.

          Hình 2.10: Kiến trúc của kỹ thuật tra cứu ảnh sử dụng dấu hiệu nhị phân.
          Hình 2.10: Kiến trúc của kỹ thuật tra cứu ảnh sử dụng dấu hiệu nhị phân.

          Bpos

          Cuối cùng, bằng cách sử dụng các khoảng cách tương tự thu được, các thiết lập hình ảnh sau đó được sắp xếp lại đối với khoảng cách tăng dần của các ảnh trong cơ sở dữ liệu ảnh (so với hình ảnh truy vấn) và ảnh nào có khoảng cách tương tự so với ảnh truy vấn nhỏ nhất, nó chính là ảnh giống với ảnh truy vấn nhất. Tóm lại trong chương này tôi đã trình bày các phương pháp tra cứu ảnh, nhấn mạnh đến phương pháp tra cứu ảnh dựa vào màu sắc và đi sâu tìm hiểu kỹ thuật tra cứu ảnh sử dụng dấu hiệu nhị phân. Kỹ thuật này gồm các bước: xác định vector đặc trưng của mỗi pixel màu trội, xác định chuỗi dấu hiệu nhị phân của ảnh và tính tổng tất cả các khoảng cách giữa các ảnh theo bin để tìm ra ảnh gần giống nhau nhất.

          Bảng 2.3: Chuỗi dấu hiệu nhị phân minh họa sự giống và khác nhau của ảnh
          Bảng 2.3: Chuỗi dấu hiệu nhị phân minh họa sự giống và khác nhau của ảnh

          XÂY DỰNG CHƯƠNG TRÌNH TRA CỨU ẢNH CÂY THUỐC

          Giới thiệu bài toán tra cứu ảnh cây thuốc

          Trong phạm vi luận văn này, ứng dụng của đề tài tập trung vào cài đặt thực nghiệm cho việc nghiên cứu và tra cứu cây dược liệu Việt Nam dựa vào hình ảnh lá cây trên cơ sở thu thập, quản lý dữ liệu về cây dược liệu. Chương trình thử nghiệm được xây dựng dựa trên kỹ thuật tra cứu ảnh sử dụng dấu hiệu nhị phân của màu. Với kết quả của kỹ thuật tra cứu này sẽ góp phần giúp cho các nhà quản lý, nhà nghiên cứu dược liệu có những giải pháp nhận dạng, xử lý và phát hiện những cây dược liệu quý một cách nhanh chóng, hiệu quả trên cơ sở những đặc trưng, đặc tính và công dụng của chúng [17].

          Phân tích bài toán

          Công đoạn tra cứu nhận dạng ảnh truy vấn từ người sử dụng thông qua giao diện đồ họa, trích rút các véc tơ đặc trưng từ ảnh truy vấn, so sánh với các cụm ảnh trong cơ sở dữ liệu ảnh và trả về các ảnh có độ tương tự lớn nhất với ảnh truy vấn. Ảnh cây dược liệu thu được ở giai đoạn thu nhận ảnh vẫn còn nhiều “nhiễu” làm cho quá trình nhận dạng ảnh và quản lý phức tạp gây chậm hệ thống, do đó cần phải xử lý trước khi trích rút các đặc trưng. Tập ảnh thô ban đầu được xử lý để trích rút ra các lá tương ứng với mỗi loại cây và lưu trữ dưới các định dạng .JPG, .JPEG, hay .GIF để giảm độ lớn dung lượng khi lưu vào cơ sở dữ liệu.

          Hình 3.1: Kiến trúc tổng quát của hệ thống tra cứu ảnh .
          Hình 3.1: Kiến trúc tổng quát của hệ thống tra cứu ảnh .

          So sánh độ tương tự

          Thông qua bước này, ảnh sẽ được loại bỏ những thông tin nhiễu hay những thông tin không cần thiết.

          TRA CỨU

          Kết quả

          • Các biểu đồ
            • Xây dựng chương trình 1. Ngôn ngữ sử dụng

              Dựa trên cơ sở lý thuyết và mô hình đề xuất ở chương 2, luận văn thực nghiệm việc trích chọn các véc tơ đặc trưng từ ảnh truy vấn và ảnh trong CSDL, xác định chuỗi dấu hiệu nhị phân của ảnh và tính tổng tất cả các khoảng cách giữa các ảnh theo bin để tìm ra ảnh gần giống nhất với ảnh truy vấn. Sau khi thực hiện quá trình truy vấn trên hai loại ảnh có hoặc không có trong CSDL, chương trình đã thu được những kết quả nhất định cho phép tìm kiếm ra ảnh gốc nếu như trường hợp ảnh đó có trong CSDL ảnh và tập các ảnh sắp xếp giảm dần theo mức độ tương tự với ảnh truy vấn, hiển thị được thông tin của các ảnh trong tập ảnh trả về. Chương trình tiến hành thực nghiệm trên ảnh của một số loại lá cây dược liệu như: Cây đơn lá đỏ, xuân hoa, mã đề, mần tưới, trầu không, lá lốt, trinh nữ hoàng cung, dâm bụt, bạch hoa xà..Kết quả thực nghiệm đã trả về ảnh cần tra cứu hoặc giống nhất với ảnh cần tra cứu, hiển thị một số thông tin về đặc tính, công dụng của cây dược liệu cần tra cứu với độ chính xác khá cao [17].

              Hình 3.4: Biểu đồ Use Case.
              Hình 3.4: Biểu đồ Use Case.

              PHẦN KẾT LUẬN