Chương 3. XÂY DỰNG CHƯƠNG TRÌNH TRA CỨU ẢNH CÂY THUỐC
3.2. Phân tích bài toán
Nhiệm vụ của bài toán là xây dựng hệ thống tra cứu ảnh cây dƣợc liệu dựa vào hình ảnh lá cây có một số các chức năng sau:
o Khi người sử dụng cung cấp một ảnh lá cây dược liệu mẫu cần tra cứu.
Hệ thống có nhiệm vụ tìm kiếm trong một cơ sở dữ liệu ảnh đã có và cho ra một danh sách tất cả các ảnh tương tự như ảnh mẫu theo thứ tự ảnh nào tương tự với ảnh mẫu hơn thì được phân hạng ở phía trên.
o Người sử dụng có thể thiết lập khoảng cách ngưỡng tương tự cho từng lần tra cứu (chương trình chỉ trả lại các kết quả mà khoảng cách giữa ảnh kết quả và ảnh mẫu không vƣợt quá ngƣỡng).
Bài toán đặt ra ở đây là sử dụng không gian RGB vào chương trình, do khuôn dạng của không gian màu RGB là định dạng phổ biến nhất của ảnh số. Với việc lƣợng hóa 3 kênh màu R (Red), G (Green), B (Blue) từ 256 giá trị giảm xuống còn 3 giá trị cho mỗi kênh màu tương ứng tạo thành 27 màu đơn tổ hợp từ 3 kênh màu đó sẽ làm giảm không gian lưu trữ trong cơ sở dữ liệu và tăng tốc độ tra cứu của hệ thống.
Hệ thống đƣợc thiết kế và thực hiện trên hệ điều hành Windows XP, sử dụng ngôn ngữ lập trình C# trên môi trường Visual Studio 2008. Kiến trúc toàn bộ hệ thống đƣợc chỉ ra trong Hình 3.1. Mô tả chi tiết hoạt động của hệ thống đƣợc thể hiện trên Hình 3.2. Kiến trúc này gồm hai công đoạn chính: Công đoạn tiền xử lý đƣợc thực hiện ngoại tuyến và công đoạn tra cứu đƣợc thực hiện trực tuyến.
Ban đầu, CSDL ảnh đƣợc tiền xử lý (bởi công đoạn tiền xử lý) để trích rút các véc tơ đặc trưng. Công đoạn tra cứu nhận dạng ảnh truy vấn từ người sử dụng thông qua giao diện đồ họa, trích rút các véc tơ đặc trƣng từ ảnh truy vấn, so sánh với các cụm ảnh trong cơ sở dữ liệu ảnh và trả về các ảnh có độ tương tự lớn nhất với ảnh truy vấn.
Hình 3.1: Kiến trúc tổng quát của hệ thống tra cứu ảnh.
Hình 3.2: Mô hình chi tiết của hệ thống tra cứu ảnh
Công đoạn tiền xử lý đƣợc thực hiện nhƣ sau:
Ảnh cây dƣợc liệu thu đƣợc ở giai đoạn thu nhận ảnh vẫn còn nhiều “nhiễu” làm cho quá trình nhận dạng ảnh và quản lý phức tạp gây chậm hệ thống, do đó cần phải xử
. . .
Ảnh truy vấn
Ảnh trong CSDL
đặc trƣng
So sánh độ tương tự
TRA CỨU
Trích rút đặc trƣng Trích rút đặc trƣng
Dấu hiệu đặc trƣng
Kết quả
lý trước khi trích rút các đặc trưng. Thông qua bước này, ảnh sẽ được loại bỏ những thông tin nhiễu hay những thông tin không cần thiết. Tập ảnh thô ban đầu đƣợc xử lý để trích rút ra các lá tương ứng với mỗi loại cây và lưu trữ dưới các định dạng .JPG, .JPEG, hay .GIF để giảm độ lớn dung lượng khi lưu vào cơ sở dữ liệu. Kích thước của ảnh cũng đƣợc giảm xuống còn 1x1 cm.
Hình 3.3: Tiền xử lý ảnh dữ liệu
Công đoạn tiền xử lý thực hiện hai nhiệm vụ sau:
- Trích rút vector đặc trƣng của các ảnh.
- Biểu diễn hình ảnh dưới dạng chuỗi dấu hiệu nhị phân Công đoạn tra cứu đƣợc thực hiện nhƣ sau:
Người sử dụng cung cấp cho hệ thống ảnh truy vấn thông qua giao diện đồ họa.
Sau đó hệ thống phân đoạn ảnh truy vấn thành các vùng ảnh và trích rút các véc tơ đặc trƣng của các ảnh. Chuỗi dấu hiệu nhị phân của ảnh truy vấn sẽ đƣợc so sánh với chuỗi dấu hiệu nhị phân của các ảnh trong cơ sở dữ liệu.
Kết quả trả về là tập các ảnh có độ tương tự với ảnh truy vấn nhất. Tập ảnh kết quả được phân hạng theo thứ tự giảm dần của độ tương tự.
Tiền xử lý
(*.JPG) 1x1 cm (*.JPG) 1x1 cm
(*.JPG) 1x1 cm (*.JPG) 1x1 cm
Tập ảnh thô đƣợc thu nhận bằng máy ảnh, scanner,..
(Các công cụ nhƣ Photoshop, Paint, Corel Draw, ..)
Tập ảnh tinh đã qua xử lý