Nhiệm vụ của bài toán là xây dựng hệ thống tra cứu ảnh cây dƣợc liệu dựa vào hình ảnh lá cây có một số các chức năng sau:
o Khi ngƣời sử dụng cung cấp một ảnh lá cây dƣợc liệu mẫu cần tra cứu. Hệ thống có nhiệm vụ tìm kiếm trong một cơ sở dữ liệu ảnh đã có và cho ra một danh sách tất cả các ảnh tƣơng tự nhƣ ảnh mẫu theo thứ tự ảnh nào tƣơng tự với ảnh mẫu hơn thì đƣợc phân hạng ở phía trên.
o Ngƣời sử dụng có thể thiết lập khoảng cách ngƣỡng tƣơng tự cho từng lần tra cứu (chƣơng trình chỉ trả lại các kết quả mà khoảng cách giữa ảnh kết quả và ảnh mẫu không vƣợt quá ngƣỡng).
Bài toán đặt ra ở đây là sử dụng không gian RGB vào chƣơng trình, do khuôn dạng của không gian màu RGB là định dạng phổ biến nhất của ảnh số. Với việc lƣợng hóa 3 kênh màu R (Red), G (Green), B (Blue) từ 256 giá trị giảm xuống còn 3 giá trị cho mỗi kênh màu tƣơng ứng tạo thành 27 màu đơn tổ hợp từ 3 kênh màu đó sẽ làm giảm không gian lƣu trữ trong cơ sở dữ liệu và tăng tốc độ tra cứu của hệ thống.
Hệ thống đƣợc thiết kế và thực hiện trên hệ điều hành Windows XP, sử dụng ngôn ngữ lập trình C# trên môi trƣờng Visual Studio 2008. Kiến trúc toàn bộ hệ thống đƣợc chỉ ra trong Hình 3.1. Mô tả chi tiết hoạt động của hệ thống đƣợc thể hiện trên Hình 3.2. Kiến trúc này gồm hai công đoạn chính: Công đoạn tiền xử lý đƣợc thực hiện ngoại tuyến và công đoạn tra cứu đƣợc thực hiện trực tuyến.
Ban đầu, CSDL ảnh đƣợc tiền xử lý (bởi công đoạn tiền xử lý) để trích rút các véc tơ đặc trƣng. Công đoạn tra cứu nhận dạng ảnh truy vấn từ ngƣời sử dụng thông qua giao diện đồ họa, trích rút các véc tơ đặc trƣng từ ảnh truy vấn, so sánh với các cụm ảnh trong cơ sở dữ liệu ảnh và trả về các ảnh có độ tƣơng tự lớn nhất với ảnh truy vấn.
Hình 3.2: Mô hình chi tiết của hệ thống tra cứu ảnh Công đoạn tiền xử lý đƣợc thực hiện nhƣ sau:
Ảnh cây dƣợc liệu thu đƣợc ở giai đoạn thu nhận ảnh vẫn còn nhiều “nhiễu” làm cho quá trình nhận dạng ảnh và quản lý phức tạp gây chậm hệ thống, do đó cần phải xử
. . . Ảnh truy vấn Ảnh trong CSDL đặc trƣng So sánh độ tƣơng tự TRA CỨU Trích rút đặc trƣng Trích rút đặc trƣng Dấu hiệu đặc trƣng Kết quả
lý trƣớc khi trích rút các đặc trƣng. Thông qua bƣớc này, ảnh sẽ đƣợc loại bỏ những thông tin nhiễu hay những thông tin không cần thiết. Tập ảnh thô ban đầu đƣợc xử lý để trích rút ra các lá tƣơng ứng với mỗi loại cây và lƣu trữ dƣới các định dạng .JPG, .JPEG, hay .GIF để giảm độ lớn dung lƣợng khi lƣu vào cơ sở dữ liệu. Kích thƣớc của ảnh cũng đƣợc giảm xuống còn 1x1 cm.
Hình 3.3: Tiền xử lý ảnh dữ liệu
Công đoạn tiền xử lý thực hiện hai nhiệm vụ sau:
- Trích rút vector đặc trƣng của các ảnh.
- Biểu diễn hình ảnh dƣới dạng chuỗi dấu hiệu nhị phân
Công đoạn tra cứu đƣợc thực hiện nhƣ sau:
Ngƣời sử dụng cung cấp cho hệ thống ảnh truy vấn thông qua giao diện đồ họa. Sau đó hệ thống phân đoạn ảnh truy vấn thành các vùng ảnh và trích rút các véc tơ đặc trƣng của các ảnh. Chuỗi dấu hiệu nhị phân của ảnh truy vấn sẽ đƣợc so sánh với chuỗi dấu hiệu nhị phân của các ảnh trong cơ sở dữ liệu.
Kết quả trả về là tập các ảnh có độ tƣơng tự với ảnh truy vấn nhất. Tập ảnh kết quả đƣợc phân hạng theo thứ tự giảm dần của độ tƣơng tự.
Tiền xử lý (*.JPG) 1x1 cm (*.JPG) 1x1 cm (*.JPG) 1x1 cm (*.JPG) 1x1 cm Tập ảnh thô đƣợc thu nhận bằng máy ảnh, scanner,.. (Các công cụ nhƣ Photoshop, Paint, Corel Draw, ..) Tập ảnh tinh đã qua xử lý