Trong những năm gần đõy, nhiều nhà khoa học quan tõm đến việc ứng dụng cỏc phộp phõn tớch hỡnh dạng của đối tượng để tỡm ra được những đặc trưng của đối tượng đú, nhằm phục vụ cho quỏ trỡnh nhận dạng và phõn loại đối tượng. Những lý thuyết và cơ sở toỏn học về lĩnh vực phõn tớch hỡnh dạng đó được phỏt triển từ thập niờn 80 của thế kỷ 20. Từ đú đến nay, nhiều nhà khoa học đó ứng dụng vào trong lĩnh vực nụng nghiệp nhằm phõn tớch hỡnh dạng của một số nụng sản để phõn loại, phỏt hiện sớm đặc tớnh giống của nụng sản như quả đậu tương, lỏ non của cõy đậu tương, và nhõn lỳa mạch. Những kết quả này đó được ứng dụng phổ biến tại cỏc nước như Nhật Bản, Hàn Quốc.
Trong luận văn này, em nghiờn cứu và cài đặt một số kỹ thuật như phỏt hiện biờn ảnh nhị phõn, biến đổi ảnh, và ứng dụng mó chuỗi (chain code) để “số húa” hỡnh dạng biờn của đối tượng ảnh.
3.2. Số húa biờn đối tƣợng ảnh
Như chỳng ta đó biết việc phỏt hiện biờn, và những thụng tin chứa trong biờn của đối tượng ảnh luụn đúng vai trũ then chốt trong xử lý ảnh núi chung, và giai đoạn phõn đoạn, nhận dạng, phõn loại núi riờng. Chớnh vỡ thế, việc số húa những thụng tin lưu trữ trờn biờn luụn được nhiều nhà khoa học quan tõm. Một phương phỏp phổ biến để lưu và biểu diễn biờn của ảnh là kỹ thuật mó chuỗi (chain code). Với kỹ thuật mó chuỗi, thay vỡ chỳng ta phải lưu toàn bộ ảnh để cú được thụng tin về biờn của ảnh, thỡ ta chỉ cần lưu trữ một loạt mó chuỗi mụ tả vị trớ điểm biờn của đối tượng ảnh trong ảnh đú. Quỏ
Bƣớc 1: Biến đổi ảnh sang ảnh đa cấp xỏm
Bƣớc 2: Phõn ngưỡng ảnh
Bƣớc 3: Biến đổi ảnh sang dạng nhị phõn
Bƣớc 4: Phỏt hiện biờn
Bƣớc 5: Số húa biờn bằng thuật thoỏn mó chuỗi
Với 5 bước chớnh thụng tin vị trớ của từng điểm biờn sẽ được lưu trữ ở tập tin và tỏi tạo lại khi cần thiết. Thuật toỏn số húa biờn của đối tượng ảnh.
Thụng tin đầu vào: - Ảnh *.bmp Thụng tin đầu ra:
- Tập tin chứa mó chuỗi.
Hỡnh 3.1. Thuật toỏn số húa biờn của đối tượng ảnh Bắt đầu Tải ảnh Biến đổi cấp xỏm Phõn ngưỡng Biến đổi nhị phõn Phỏt hiện biờn Chain code Kết thỳc
Những quỏ trỡnh biến đổi ảnh cấp xỏm, phõn ngưỡng, biến đổi sang ảnh nhị phõn (ảnh chỉ cú 2 màu trắng và đen) và kỹ thuật phỏt hiện biờn của ảnh nhị phõn đó trỡnh bày ở những phần trờn. Dưới đõy, tụi tập trung trỡnh bày thuật toỏn tớnh mó chuỗi, CHAINCODEALG() đó được cài đặt trong luận văn này.
Thuật toỏn mó chuỗi CHAINCODEALG() gồm những bước chớnh như sau:
Bƣớc 1: Xỏc định vị trớ ban đầu P0, STARTPOS()
Bƣớc 2: Lựa chọn kỹ thuật kết nối (4-kết nối, 8-kết nối)
Bƣớc 3: Lưu trữ vị trớ biờn, STOREDGE()
Bƣớc 4: Xỏc định điểm kế tiếp bằng thủ tục NEXTPOS()
Bƣớc 5: Kiểm tra điểm đầu CHECKSTARTPOI(), nếu trả về giỏ trị False thỡ quay về bước 3, ngược lại thỡ thuật toỏn kết thỳc
Hỡnh 3.2. Thuật toỏn CHAINCODEALG() Bắt đầu Tải ảnh, P0, 4-kết nối; 8-kết nối STOREDGE NEXTPOS Kết thỳc CHECKSTARPOI False True
Tiếp theo, tụi trỡnh bày đoạn chương trỡnh thuật toỏn CHAINCODEALG() CHAINCODEALG(BYTE *lpDIBBytes, DWORD StartPos, DWORD height, DWORD width)
{
DWORD i,j,k,vt,vtx,vty; BYTE mau;
// Quet trong toan bo anh for(i=0;i< height;i++) for(j=0;j<width;j++) {
Position(i,j, width, height, vt); //Tim vi tri diem dau
if(vt==StartPos) { vtx=j; vty=i; for(k=0;k<=height*width;k++) { STOREDGE (vt); vt=NEXTPOS (vt); if(CHECKSTARPOI(vtx,vty,vt)==true) { return 1; } } } } }
3.3 Chƣơng trỡnh thử nghiệm.
Trong chương trỡnh em xin trỡnh bày ứng dụng phỏt hiện biờn, Elliptic Fourier trong việc trớch rỳt đặc tớnh hỡnh dạng của lỏ gấc.
Để trớch rỳt đặc tớnh hỡnh dạng của lỏ gấc cú nghĩa là ta thực hiện biến đổi hỡnh dạng lỏ gấc từ màu RGB sang dạng Gray Scale Histogram.
Thực hiện việc đưa ảnh vào chương trỡnh:
Sau khi load image chọn Gray Scale và make Histogram ta được ảnh lỏ gấc sau khi histogram trong hỡnh 3.4
Hỡnh 3.4 Lỏ gấc sau khi được Histogram
Sau khi Histogram ta thực hiện việc chain code cho lỏ gấc như sau:
Thực hiện chain code với cỏc lỏ gấc khỏc ta được kết quả:
Từ kết quả thử nghiệm ta thấy kết quả của lỏ gấc trước khi được xử lý và sau khi được xử lý được mụ tả trong hỡnh 3.6
Hỡnh 3.6(a). Lỏ gấc trước khi xử lý (b) Sau khi được xử lý
So sỏnh lỏ gấc trước và sau khi xử lý chain code ta thấy trong hỡnh 3.6(a) những điểm được khoanh đỏ sẽ bị mất đi. Lỏ gấc sau khi chain code hỡnh 3.6(b). Như vậy chương trỡnh đó thưc hiện việc chain code cho những điểm biờn đó được xỏc định.
Kết quả thực nghiệm cho thấy việc nghiờn cứu và tỡm hiểu về biờn ảnh, Elliptic Fourier là một hướng phỏt triển để từ đú cú những nghiờn cứu tiếp theo trong việc hỗ trợ phõn loại sớm đặc tớnh giống của cõy Gấc ở nước ta.
PHẦN KẾT LUẬN
Trong lĩnh vực xử lý ảnh, quỏ trỡnh phỏt hiện biờn của những đối tượng ảnh là một giai đoạn rất quan trọng bởi độ chớnh xỏc của quỏ trỡnh nhận diện, lấy đặc tớnh hỡnh dạng và phõn đoạn ảnh chủ yếu dựa vào giai đoạn này. Chớnh vỡ vậy, bài toỏn phỏt hiện biờn luụn được quan tõm và khụng ngừng được phỏt triển.
Cỏc đặc tớnh hỡnh học chứa những thụng tin về vị trớ, kớch thước hỡnh học, hỡnh dạng của cỏc đối tượng trong ảnh, là đặc tớnh rất quan trọng trong xử lý nhận dạng ảnh. Cỏc đặc tớnh này thường được trớch rỳt ra thụng qua việc xỏc định cỏc đường biờn cỏc đối tượng trong ảnh. Biờn chứa cỏc thụng tin về hỡnh dạng ngoài của đối tượng ảnh. Cú thể núi xỏc định biờn là một trong những vấn đề quan trọng và hấp dẫn trong lĩnh vực nghiờn cứu xử lý ảnh bởi khả năng biểu đạt cấu trỳc đối tượng và tớnh ứng dụng rộng rói của nú vào việc giải quyết nhiều bài toỏn như: nhận dạng tự động, thị thực mỏy tớnh, hoạt hỡnh…
Bờn cạnh đú, việc kết hợp phương phỏp phỏt hiện biờn với phương phỏp khỏc nhằm hỗ trợ cho cụng tỏc phỏt hiện sớm một số đặc tớnh của cõy trồng dựa theo hỡnh dạng của lỏ, hay củ đó và đang được nhiều nhúm khoa học trong và ngoài nước quan tõm.
Trong luận văn thạc sỹ với đề tài “Phỏt hiện biờn, biểu diễn Forier Elliptic và ứng dụng” em đó tập trung nghiờn cứu một số phương phỏp phỏt hiện biờn, kỹ thuật biến đổi ảnh và phộp biểu diễn Fourier Elliptic ứng dụng trong việc trớch rỳt đặc trưng hỡnh dạng lỏ của cõy Gấc. Kết quả của luận văn sẽ làm tiền đề cho nghiờn cứu sau này trong việc hỗ trợ phõn loại sớm đặc
Do trỡnh độ và thời gian cú hạn, chắc chắn luận văn cũn nhiều thiếu sút. Vỡ vậy, rất mong nhận được sự gúp ý quý bỏu của cỏc thầy giỏo, cụ giỏo và sự cộng tỏc của cỏc bạn đồng nghiệp để nội dung luận văn được hoàn thiện hơn.
Cuối cựng một lần nữa em xin chõn thành bày tỏ lũng biết ơn sõu sắc đến thầy hướng dẫn TS. Phạm Việt Bỡnh đó giỳp đỡ em hoàn thành luận văn này.
TÀI LIỆU THAM KHẢO Tiếng Việt
[1] Lƣơng Mạnh Bỏ, Nguyễn Thanh Thủy. Nhập mụn xử lý ảnh số.
Nhà xuất bản khoa học và kỹ thuật. Hà Nội, 1999.
[2] Phạm Việt Bỡnh. Luận văn tiến sĩ. Phỏt triển kỹ thuật dũ biờn, phỏt hiện biờn và ứng dụng, 2006
[3] Đặng Văn Đức. Bài giảng Hệ quản trị cơ sở dữ liệu đa phương tiện. Hà Nội, 2005.
[4] Ngụ Quốc Tạo. Bài giảng Xử lý ảnh. Hà Nội, 2005.
[5] Nguyễn Kim Sỏch. Xử lý ảnh và video số. NXB Khoa học và Kỹ
thuật. Hà Nội, 1997.
[6] http://dotnet.chungta.com [7] http://www.handheldvn.com [8] http://www.JavaVietnam.org
Tiếng Anh
[9] Chan Yuk Ming. Shape-based Image Retrieval In Iconic Image Databasesz. The Chinese University of HongKong, 6-1999.
[10] Dan Fergus and Larry Roof. The Definitive Guide to the .NET Compact Framework. 2003.
[11] Dan Fox, Jon Box. Building Solutions with the Microsoft .NET Compact Framework: Architecture and Best Practices for Mobile Development. Addison Wesley, 2003.
[12] David Fox, Roman Verhosek. Micro Java™ Game Development.
[13] Dengsheng Zhang. Image Retrieval Based on Shape. Monash
University, 4-2002.
[14] Erik Rubin, Ronnie Yates. Microsoftđ .NET Compact Framework Kick Start. Sams Publishing, 2003.
[15] John C. Russ. The Image Processing Handbook, Second Edition.
CRC Press, 1995.
[16] John Wiley & Sons. Image Processing Principles and Applications. Wiley-Interscience, 2005.
[17] Parker J. R. Practical Computer Vision Using C. John wiley &
Sons, Inc, 1993.
[18] Remco C. Veltkamp, Michiel Hagedoorn. State-of-the-Art in Shape
Matching. Utrecht University, Netherlands. 1999.
[19] Shuang Fan. Shape Representation and Retrieval Using Distance Histograms. In Technical Report TR 01-14, Deparment of Computing
Science, University of Alberta, Canada, October 17, 2001.
[20] Tinku Acharya, Ajoy K. Ray. Image Processing Principles and Applications. A John Wiley & Sons, Inc.
[21] Y. Alp Aslandogan, Clement T. Yu. Techniques and Systems for
Image and Video Retrieval. Departments of EECS, University of Illinois,
Chicago. 1999. [22] http://amath.colorado.edu/courses/4720/2000Spr/Labs/DB/db.html [23] http://amath.colorado.edu/courses/4720/2000Spr/Labs/Haar/haar.html [24] http://amazon.ece.utexas.edu/~qasim/research.htm [25] http://developers.sun.com/techtopics/mobility/midp/articles/wtoolkit [26] http://download.microsoft.com/download/1/0/c/10c18e4a-f88f-4c7e- b40f-9abc80388620/course-2556-module-1.pdf
[27] http://java.sun.com [28] http://local.wasp.uwa.edu.au/~pbourke/texture [29] http://people.revoledu.com/kardi/tutorial/similarity/ minkowskidistance.html [30] http://samples.gotdotnet.com/quickstart/compactframework/ doc/default.aspx [31] http://wang.ist.psu.edu/docs/home.shtml [32] http://www.codeproject.com [33] http://www.codersource.net [34] http://www.cs.armstrong.edu/burge/pdf/huc/01_J2ME_overview.pdf [35] http://www.ee.surrey.ac.uk/research/vssp/imagedb/squid.html [36] http://www.microsoft.com/mobile/developer [37] http://www.onJava.com/pub/a/onJava/2001/03/08/J2ME.html [38] http://www.pocketpcdn.com [39] http://www.pocketpcmag.com [40] http://www.Wavelet.org 0