Bài báo này đề xuất việc nghiên cứu và áp dụng kỹ thuật tra cứu ảnh về cây dược liệu theo nội dung sử dụng dấu hiệu nhị phân của ảnh như xác định véc tơ đặc trưng, biểu diễn và trích rút đặc trưng và tính độ tương tự nhằm hỗ trợ cho công tác tìm kiếm, nhận dạng và phát hiện về cây dược liệu. Đồng thời, đề xuất cài đặt ứng dụng thực nghiệm có sử dụng kỹ thuật tra cứu ảnh cây dược liệu vào phục vụ cho việc quản lý, khai thác và duy trì một cách có hiệu quả các nguồn cây dược liệu của Việt Nam. Mời các bạn cùng tham khảo!
HộiHội Thảo Quốc Gia 2015 Công CôngNghệ Nghệ Thông (ECIT 2015) Thảo Quốc Gia 2015về vềĐiện ĐiệnTử, Tử,Truyền TruyềnThông Thông Thông TinTin (ECIT 2015) Kỹ Thuật Tra Cứu Ảnh Cây Dược Liệu Dựa Vào Nội Dung Phục Vụ Cho Phát Hiện, Quản Lý Và Khai Thác Nguyễn Văn Huân Nguyễn Văn Tảo Trường Đại Học Công Nghệ Thông Tin Truyền Thông – Đại Học Thái Nguyên Email: nvhuan@ictu.edu.vn, nvtao@ictu.edu.vn Abstract—Bài báo đề xuất việc nghiên cứu áp dụng kỹ thuật tra cứu ảnh dược liệu theo nội dung sử dụng dấu hiệu nhị phân ảnh xác định véc tơ đặc trưng, biểu diễn trích rút đặc trưng tính độ tương tự nhằm hỗ trợ cho cơng tác tìm kiếm, nhận dạng phát dược liệu Đồng thời, đề xuất cài đặt ứng dụng thực nghiệm có sử dụng kỹ thuật tra cứu ảnh dược liệu vào phục vụ cho việc quản lý, khai thác trì cách có hiệu nguồn dược liệu Việt Nam Kết đề xuất góp phần giúp cho nhà quản lý, nhà dược liệu có cơng cụ hữu ích nhằm theo dõi, thống kê, nhận dạng quản lý dược liệu cách hiệu nhận dạng trích đường viền đặc trưng sau so sánh với mẫu có sở liệu Tuy nhiên, số lượng ảnh lưu trữ trở nên lớn vấn đề đặt phải có phương pháp tổ chức sở liệu ảnh tốt với kỹ thuật tra cứu, tra cứu ảnh hiệu quả, có độ xác cao có hiệu tốt đáp ứng nhu cầu ngày cao người Việc xây dựng hệ thống tra cứu ảnh cần thiết Trong thực tế, toán tra cứu ảnh số có nhiều ứng dụng quan trọng Ví dụ lĩnh vực ngân hàng việc so sánh chữ ký khách hàng với mẫu chữ ký lưu trữ sẵn thực nhanh xác có phần mềm so sánh mẫu chữ ký tốt Các ứng dụng phức tạp so sánh mẫu vân tay, tra cứu ảnh tội phạm v.v toán tra cứu ảnh áp dụng ngành khoa học hình Phần lại báo tổ chức sau: phần II, chúng tơi trình bày kỹ thuật đề xuất Trong phần III, đưa kết thực nghiệm Phần IV đánh giá kết phân tích lý thuyết Cuối cùng, chúng tơi kết luận báo phần V Keywords- Cây dược liệu, Véc tơ đặc trưng, Tính độ tương tự, Đo khoảng cách I GIỚI THIỆU Cây thuốc (cây dược liệu) có vai trò quan trọng đời sống người, đặc biệt chăm sóc sức khỏe Ngày nay, dược liệu người phát hiện, nhận dạng khai thác sở công dụng chúng đời sống chúng ta, đặc biệt dược liệu đem lại giá trị kinh tế cao Tuy nhiên nay, nguồn dược liệu ngày bị cạn kiệt nhiều nguyên nhân Việc ứng dụng Cơng nghệ thơng tin vào quản lý lồi dược liệu phát khơng cịn mới, nhiên ứng dụng vào phát tra cứu, cụ thể kỹ thuật xử lý ảnh [3] khơng có nhiều Liên quan tới vấn đề dược liệu nhận dạng có số cơng trình, báo ngồi nước nghiên cứu vấn đề cơng trình nghiên cứu tác giả Đỗ Tất Lợi [4] dược liệu có vai trị quan trọng sống chúng ta, nguyên liệu để chăm sóc sức khỏe người góp phần phát triển kinh tế Trong cơng trình nghiên cứu tác giả nhiều loài dược liệu với cơng dụng quan trọng Trong cơng trình nghiên cứu nhóm tác giả K Lee cộng [8], A Bhardwaj cộng [1], C Sari [2] sử dụng kỹ thuật nhận dạng dựa vào đường viền hình dạng để nhận dạng Kết báo nhận dạng phát với khoảng gần 2000 32 loài khác Cơng trình nghiên cứu nhóm tác giả Patil cộng [10] sử dụng kỹ thuật nhận dạng ảnh dựa vào mầu, cấu trúc hình dạng ảnh Một sở liệu ảnh gồm thông tin tạo ảnh cần nhận dạng trích rút đặc trưng so sánh với ảnh mẫu sở liệu ảnh Kết nghiên cứu nhóm tác giả J Du cộng [6], [5,7,9] sử dụng kỹ thuật phân lớp Các mẫu phân lớp lưu vào sở liệu, ISBN: 978-604-67-0635-9 II KỸ THUẬT TRA CỨU ẢNH CÂY DƯỢC LIỆU THEO NỘI DUNG DỰA VÀO DẤU HIỆU NHỊ PHÂN Trong báo sử dụng kỹ thuật tra cứu ảnh dược liệu theo nội dung dựa vào dấu hiệu nhị phân vector đặc trưng - Dựa vào dấu hiệu nhị phân: Việc lưu trữ đặc trưng ảnh tốn nhiều khơng gian lưu trữ Để giảm bớt việc tiêu tốn không gian lưu trữ, tác giả sử dụng dấu hiệu nhị phân, chuỗi bit nhị phân có kích thước xác định trước đại diện cho phân bố màu sắc hình ảnh Khi ta tra cứu ảnh, giả định dấu hiệu nhị phân hình ảnh lưu trữ tập tin Để xử lý tra cứu, tập tin quét tất dấu hiệu nhị phân hình ảnh so sánh với dấu hiệu nhị phân hình ảnh tra cứu cách sử dụng số liệu tương tự xác định Các hình ảnh so sánh lấy xếp hạng theo tương đồng với hình ảnh truy vấn Hệ thống tra cứu ảnh dựa vào dấu hiệu nhị phân gồm hai pha Pha thứ nhất, tạo sở liệu đặc trưng Các ảnh sở liệu xác định để lấy vector đặc trưng, đặc trưng trích rút thành sở liệu đặc trưng Pha thứ hai, truy vấn sở liệu Khi ảnh dược liệu cần truy vấn đưa vào hệ thống, xác định vector đặc trưng đối sánh với đặc trưng ảnh dược liệu mẫu 353 353 Hội Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Công Nghệ Thông Tin (ECIT 2015) Hình Kiến trúc kỹ thuật tra cứu ảnh dược liệu sử dụng dấu hiệu nhị phân Trong đó, pos( BQj ), pos( B I ) vị trí bit j Các đặc trưng ảnh dược liệu truy vấn so sánh với đặc trưng tất ảnh dược liệu mẫu sử dụng độ đo tương tự Vì thế, ba trình quan trọng hệ thống tra cứu ảnh theo nội dung sử dụng dấu hiệu nhị phân là: xác định vector đặc trưng; biểu diễn, trích rút đặc trưng tính độ tương tự - Đo độ tương tự: Khi ta đưa ảnh dược liệu vào để thực tra cứu, ảnh đầu vào xác định chuỗi dấu hiệu nhị phân Tiếp theo chuỗi so sánh với tập chuỗi dấu hiệu nhị phân tập ảnh dược liệu mẫu Nó việc tính tốn độ tương tự chuỗi dấu hiệu nhị phân hình ảnh dược liệu truy vấn người dùng định tất hình ảnh dược liệu mẫu khác Ngay từ đầu, sử dụng phương pháp sau để tính độ tương tự ảnh truy vấn ảnh mẫu: d (Q, I ) n j ( pos( BQj ) pos( BIj ) thiết lập chuỗi dấu hiệu nhị phân ảnh Q I (hay bin thiết lập) bin Bj hình ảnh Q I Ta có pos( B A = 2, pos( B A ) = 1,và pos( B A ) = Tuy nhiên phương pháp không mạnh mẽ khác biệt rõ ràng ảnh Để minh họa cho thuật toán ta xét dấu hiệu nhị phân ba ảnh A, B C Ta thấy mật độ màu (cột thứ hai bảng), hình ảnh A C tương tự so với hình ảnh A B Tuy nhiên, có: d0(A, B) = (4 - 4) + (4-4) + (5 - 3) = d0 (A, C) = (4 - 3) + (4-3) + (5-5) = 2, điều cho thấy ảnh B C có giá trị tương tự ảnh A, trái ngược với trực giác Nhưng bình phương khoảng cách số nhị phân, có thấy khác biệt rõ ràng hình ảnh Và khoảng cách số nhị phân là: (1) 354 354 Hội Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Công Nghệ Thông Tin (ECIT 2015) Bảng Chuỗi dấu hiệu nhị phân minh họa giống khác ảnh Bin màu sắc Mật độ màu thiết Dấu hiệu nhị phân b1 lập b2 b3 b4 b5 b6 b7 b8 b9 b10 Ảnh A c1/B1A 30% 0 0 0 0 A 30% 0 0 0 0 c3/B3A 40% 0 0 0 0 c2/B Ảnh B c1/B1B c2/B c3/B c1/B 39% 0 0 0 0 B 39% 0 0 0 0 B 22% 0 0 0 0 Ảnh C C 29% 0 0 0 0 c2/B2C 29% 0 0 0 0 42% 0 0 0 0 c3/B C Thuật tốn tính độ tương tự hai ảnh Q I: III Đầu vào: Các chuỗi dấu hiệu nhị phân ảnh Q I Đầu ra: Khoảng cách d(Q, I) j Tìm Pos( BQ ) Pos( B I ) j j j Pos( BQ ) Pos( B I ) vị trí bit thiết lập chuỗi dấu hiệu nhị phân ảnh Q I (hay bin thiết lập) bin Bj hình ảnh Q I Tính khoảng cách d(Q, I) n d(Q, I)= j j [pos ( BQ ) – pos ( B I )]2 j KẾT QUẢ THỰC NGHIỆM Bài toán đặt người sử dụng cung cấp ảnh dược liệu cần tra cứu Hệ thống có nhiệm vụ tìm kiếm liệu ảnh dược liệu có đưa kết tỷ lệ độ tương đồng ảnh cần truy vấn với ảnh sở liệu ảnh Ban đầu, ảnh dược liệu mẫu tiền xử lý (bởi công đoạn tiền xử lý) để trích rút véc tơ đặc trưng Cơng đoạn tra cứu nhận dạng ảnh dược liệu truy vấn từ người sử dụng thông qua giao diện đồ họa, trích rút véc tơ đặc trưng từ ảnh truy vấn, so sánh với cụm đặc trưng ảnh dược liệu mẫu sở liệu ảnh trả ảnh có độ tương tự lớn với ảnh truy vấn - Công đoạn tiền xử lý thực sau: Thông qua bước này, ảnh truy vấn loại bỏ thông tin nhiễu hay thông tin không cần thiết Tập ảnh thô ban đầu xử lý lưu trữ định dạng JPG, JPEG, hay GIF để giảm độ lớn dung lượng lưu vào sở liệu ảnh Kích thước ảnh giảm xuống cịn 1x1 cm Tại cơng đoạn ảnh truy vấn sau loại bỏ nhiễu trích rút vector đặc trưng ảnh biểu diễn hình ảnh dạng chuỗi dấu hiệu nhị phân Hình minh họa trình tiền xử lý ảnh, cụ thể: với tập ảnh thô thu nhận cách sử dụng máy ảnh, scanner,… Sau đó, sử dụng công cụ Photoshop, Paint,… xử lý ảnh thơ ảnh tinh với kích thước 1x1 cm để phục vụ cho trình nhận dạng tra cứu sau (2) Return d(Q, I) Nhận xét: Bằng cách sử dụng khoảng cách tương tự thu được, thiết lập hình ảnh sau xếp lại khoảng cách tăng dần ảnh dược liệu mẫu (so với hình ảnh truy vấn) ảnh có khoảng cách tương tự so với ảnh truy vấn nhỏ nhất, ảnh giống với ảnh truy vấn Trước ảnh dược liệu cho vào sở liệu ảnh ảnh truy vấn, ảnh tiền xử lý Ảnh dược liệu thu giai đoạn thu nhận ảnh nhiều “nhiễu” làm cho trình nhận dạng ảnh quản lý phức tạp gây chậm hệ thống, cần phải xử lý trước trích rút đặc trưng 355 355 Hội Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 Điện Tử, Truyền Thông Cơng Nghệ Thơng Tin (ECIT 2015) Hình Tiền xử lý ảnh liệu - Công đoạn tra cứu thực sau: Người sử dụng cung cấp cho hệ thống ảnh truy vấn thông qua giao diện đồ họa Sau hệ thống phân đoạn ảnh truy vấn thành vùng ảnh trích rút véc tơ đặc trưng ảnh Chuỗi dấu hiệu nhị phân ảnh truy vấn so sánh với chuỗi dấu hiệu nhị phân ảnh sở liệu Kết trả tập ảnh có độ tương tự với ảnh truy vấn Tập ảnh kết phân hạng theo thứ tự giảm dần độ tương tự Hình Hiển thị kết tra cứu Đồng thời, hiển thị kết ảnh đích xếp theo thứ tự từ ảnh có độ xác cao đến độ xác thấp so với ảnh nguồn Hình cho biết, với ảnh nguồn đưa vào (Source) ảnh đích – kết cần tìm (Destination) Sau đó, thực tra cứu, q trình thực tra cứu, hệ thống thị độ tương tự hai ảnh nguồn đích dạng biểu đồ 356 356 HộiHội Thảo Quốc Gia 2015 Công CôngNghệ NghệThông Thông (ECIT 2015) Thảo Quốc Gia 2015vềvềĐiện ĐiệnTử, Tử,Truyền TruyềnThông Thông TinTin (ECIT 2015) IV thấy độ xác ứng với số lượng ảnh nguồn 20; 30; 50 cho kết tương ứng 52%; 50%; 45% Như vậy, với kết khẳng định độ xác kết truy vấn tương đối cao ĐÁNH GIÁ KẾT QUẢ Chương trình thử nghiệm xây dựng dựa kỹ thuật tra cứu ảnh sử dụng dấu hiệu nhị phân màu Với kết kỹ thuật tra cứu góp phần giúp cho nhà quản lý, nhà nghiên cứu dược liệu có giải pháp nhận dạng, xử lý phát dược liệu quý cách nhanh chóng, hiệu sở đặc trưng, đặc tính cơng dụng chúng Ảnh dược liệu đầu vào thực với loài Rau má, Ráy, Diệp hạ châu,… Mỗi ảnh cần truy vấn thực tối thiểu lần tương ứng với số lượng ảnh dược liệu nguồn đầu vào 20, 30 50 Nhận xét: Qua ba nhóm liệu cuả ba nhóm nguồn ảnh thử nghiệm đầu vào trên, cho thấy qua lần thử nghiệm khác với số lượng ảnh nguồn đầu vào tăng dần khác kết cho thấy độ xác kết nhận dạng, tra cứu giảm dần V Cây dược liệu lồi khơng có vai trị quan trọng chăm sóc sức khỏe cho người, động vật,… mà đem lại giá trị kinh tế cao cho đất nước Nhằm tìm kiếm, khai thác, sử dụng, bảo vệ, quản lý, trì phát triển cách hiệu dược liệu Việt Nam Trong báo này, nghiên cứu đề xuất áp dụng kỹ thuật tra cứu ảnh dựa vào nội dung sử dụng dấu hiệu nhị phân véc tơ đặc trưng vào thực truy vấn ảnh dược liệu Kết báo đánh giá tỷ lệ phần trăm độ tương tự thực truy vấn ảnh dược liệu kho liệu ảnh mẫu xây dựng thông qua công đoạn từ việc thu thập ảnh, tiền xử lý đến thực trích chon đặc trưng ảnh Kết báo giúp cho nhà quản lý xem xét áp dụng vào quy trình quản lý, bảo tồn loài quý đặc biệt loài dược liệu quý cách hiệu Kết báo cài đặt, thử nghiệm đánh giá thông qua hệ thống phần mềm kết cho thấy độ xác cao, bước đầu thấy khả quan Bảng Kết thực truy vấn STT Số lượng ảnh nguồn Kết 20 98 30 98 50 97 20 54 30 53 50 47 20 52 30 50 Lần thử Ảnh đầu vào 1 2 Rau má Ráy Diệp hạ châu 50 KẾT LUẬN (%) TÀI LIỆU THAM KHẢO [1] A Bhardwaj, M Kaur, and A Kumar, “Recognition of plants by Leaf Image using Moment Invariant and Texture Analysis”, International Journal of Innovation and Applied Studies, Vol 3, No 1, pp 237-248, 2013 [2] C Sari (2013), “Shape Based Leaf Recognition”, Proceedings of Sistem ve Kontrol Mühendisli˘gi Bưlümü [3] Đỗ Năng Tồn, Phạm Việt Bình, Xử lý ảnh (Nhà xuất Khoa học kỹ thuật), 2008 [4] Đỗ Tất Lợi, Những thuốc vị thuốc Việt Nam, NXB Y Học, 2004 [5] H Ehsanirad and S Kumar Y, “Leaf recognition for plant classification using GLCM and PCA methods”, Oriental Journal of Computer Science & Technology, Vol 3, No 1, pp 36-38, 2010 [6] J Du, X Wang and G Zhang, “Leaf shape based plant species recognition”, Applied Mathematics and Computation, Vol 185, No 2007, pp 883-893, 2007 [7] J Chaki and R Parekh, “Plant Leaf Recognition using Shape based Features and Neural Network classifiers”, International Journal of Advanced Computer Science and Applications, Vol 2, No 10, 2011 [8] K Lee, K Hong, “Advanced Leaf Recognition based on Leaf Contour and Centroid for Plant Classification”, International Journal of BioScience and Bio-Technology, Vol 5, No 2, 2012 [9] N.Valliammal and Dr.S.N.Geethalakshmi, “Automatic Recognition System Using Preferential Image Segmentation For Leaf And Flower Images”, Computer Science & Engineering: An International Journal (CSEIJ), Vol.1, No.4, 2011 [10] S R Raj, V R Patil, P.S Jaiswal, N Subhash, Plant regeneration from leaf explants of mature sandalwood (Santalum album L.) trees under in vitro conditions In Vitro Cell Dev Biol Plant 49, 216–222, 2013 45 Kết truy vấn tỷ lệ phần trăn độ tương đồng ảnh truy vấn với sở liệu ảnh nguồn Tỷ lệ phần trăm lớn có nghĩa ảnh dược liệu cần truy vấn giống với ảnh liệu đầu vào Trong bảng Minh họa độ xác kết thử nghiệm ba nhóm liệu đầu vào: - Nhóm 1: Ảnh đầu vào Rau má với ba lần thử nghiệm với số lượng ảnh nguồn khác Kết cho thấy độ xác ứng với số lượng ảnh nguồn 20; 30; 50 cho kết tương ứng 98%; 98%; 97% Như vậy, với kết khẳng định độ xác kết truy vấn tương đối cao - Nhóm 2: Ảnh đầu vào Ráy với ba lần thử nghiệm với số lượng ảnh nguồn khác Kết cho thấy độ xác ứng với số lượng ảnh nguồn 20; 30; 50 cho kết tương ứng 54%; 53%; 47% Như vậy, với kết khẳng định độ xác kết truy vấn cao - Nhóm 3: Ảnh đầu vào Diệp Hạ Châu với ba lần thử nghiệm với số lượng ảnh nguồn khác Kết cho 357 357 ... với ảnh truy vấn nhỏ nhất, ảnh giống với ảnh truy vấn Trước ảnh dược liệu cho vào sở liệu ảnh ảnh truy vấn, ảnh tiền xử lý Ảnh dược liệu thu giai đoạn thu nhận ảnh cịn nhiều “nhiễu” làm cho q... kỹ thuật tra cứu ảnh dựa vào nội dung sử dụng dấu hiệu nhị phân véc tơ đặc trưng vào thực truy vấn ảnh dược liệu Kết báo đánh giá tỷ lệ phần trăm độ tương tự thực truy vấn ảnh dược liệu kho liệu. .. kết kỹ thuật tra cứu góp phần giúp cho nhà quản lý, nhà nghiên cứu dược liệu có giải pháp nhận dạng, xử lý phát dược liệu quý cách nhanh chóng, hiệu sở đặc trưng, đặc tính cơng dụng chúng Ảnh dược