Hình 4.2. S đ ch c n ng nh n d ng đ i t ng 4.1.2. Thu t toán s d ng: Rút các đ c tr ng nh: Nh đã nói trong ch ng 2 c a lu n v n, cách ch n ph ng pháp nh m rút ra nh ng đ c tr ng b t bi n c a nh là h t s c quan tr ng. Nó không ch nh h ng t i tính chính xác c a ch ng trình mà còn nh h ng t i hi u xu t n a. Chính vì l đó tác gi đã th c nghi m trên m t s ph ng pháp, nh m đ a ra cách ch n ph ng pháp sao cho hi u qu . Sau đây là m t s hình nh tác gi đã so sánh hi u qu c a các thu t toán.
Hình 4.3: Ph ng pháp SURF
Hình 4.4: Ph ng pháp SIFT Sau đây là b ng so sánh: B ng 4.1: B ng so sánh k t qu các ph ng pháp Ph ng pháp K t qu Th i gian (giây) SURF 38173 5 SIFT 40907 6 Hessian-Laplace 30524 3
Nh v y tác gi nh n th y. V i ph ng pháp Hessian-Laplace tuy th i gian th c hi n là nhanh nh t nh ng s l ng đi m nh rút ra đ c l i th p h n h t. i u này nh h ng không nh t i tính chính xác c a ch ng trình, còn v hai ph ng pháp còn l i SIFT tuy có ch m h n SURF nh ng l i cho k t qu cao h n, đi u này tác gi nh n th y là kh thi và quy t đ nh ch n SIFT làm ph ng pháp rút ra đ c tr ng nh cho ch ng trình.
Phân lo i các đ c tr ng:
Trong mô t bài toán có nêu là các nhóm nh đ c phân lo i th công tr c, sau đó các nh tham gia truy v n s đ c s p x p vào các nhóm này. Tuy nhiên vi c phân lo i th công này nh m m c đích ki m th tính chính xác c a ch ng trình mà thôi. Trong vi c phân lo i đ c tr ng này tác gi s d ng thu t toán K-Mean đ phân lo i. Các nh trong b máy h c s đ c gom chung l i v i nhau sau đó đi qua b c
l y đ c tr ng r i m i phân tách ra thành các nhóm. Qui trình máy h c này đ c th c hi n qua các b c sau:
B1: Áp d ng SIFT đ l y đ c tr ng nh B2: Lo i b t các đ c tr ng không ti m n ng B3: Xác đ nh s nhóm mu n phân lo i
B4: Áp d ng K-Mean cho t p h p các đ c tr ng này B5: Ki m th và gán nhãn cho nhóm đ c tr ng
Công vi c gán nhãn này tác gi th c hi n th công, vì sau khi gom chung các nh tham gia máy h c l i v i nhau và đi qua b c 1 thì các đ c tr ng là không xác đ nh. Ti p đ n b c 4 sau khi có đ c các nhóm đ c tr ng, các nhóm này ch mang tính khái ni m. Chính vì l này ta c n ph i xác đ nh chính xác các nhóm và gán nhãn cho các nhóm b ng ph ng pháp th công. 4.2.Hi n th c bài toán 4.2.1. Môi tr ng B ng 4.2: Môi tr ng th c nghi m Thành ph n Ch s
CPU Core 2 Duo T7300 2.0 Ghz
RAM 2Gb
HDD 160Gb
OS Window 7 Ultimate
4.1.2. Công c s d ng
Công c mã ngu n m đ c s d ng trong ch ng trình:
B ng 4.3: Công c mã ngu n m s d ng
Asift
Công c rút trích đ c tr ng c a tác gi Guoshen Yu, Jean- Michel Morel.
http://www.cmap.polytechnique.fr/~yu/research/ASIFT/de mo.html
Ch ng trình đ c xây d ng trên n n t ng .Net Framework 4 v i công c h tr l p trình Visual studio 2010 (C# 2010).
Ngoài các công c trên, tác gi xây d ng các module x lý sau: Module máy h c. Dùng cho vi c gom nhóm các đ c tr ng.
Module phân lo i. Ti n hành phân lo i nh.
4.1.3. D li u
D li u bao g m 2000 b c nh thu th p t internet ph c v cho vi c máy h c và 100 b c nh khác c ng thu th p t internet ph c v cho vi c ki m th .
4.1.4. Ch ng trình Hình 4.5: giao di n ch ng trình. Module máy h c: Module máy h c. Module phân lo i nh.
Hình 4.6: Công đo n rút trích đ c tr ng.
Hình 4.7: m t ph n góc nhìn c a t p đ c tr ng.
Hình 4.8: Công đo n phân c m các đ c tr ng.
Hình 4.9: Sau khi phân thành 2 c m.
c tr ng các nhóm.
nh tham gia h c máy
Hình 4.10: c tr ng nhóm 1 (class1.lhu). Ki m th : Hình 4.11: K t qu ki m th . 4.1.5. ánh giá. đo Recall-Precision: G i R là t p các hình nh thu c vào m t nhóm nh nh t đ nh, nhóm nh
này do chính tay con ng i t p h p. ây là t p nh tr v c a ch ng trình đáng
l ra ph i tr v sau khi tr v k t qu n u ch ng trình ho t đ ng t t nh t. G i A là t p các nh tr v trong th c t mà ch ng trình ch y và cho ra k t qu , và Ra
Ch s t ng đ ng K t lu n.
là t p h p giao c a A và R (ngh a là Ra ch a các hình nh tr v c a ch ng trình đ c đánh giá trên lý thuy t là đúng so v i l n ch y c a ch ng trình).
Recall = |眺尼| |眺| Precision = |眺尼|
|凋|
Sau khi ti n hành th c nghi m trên b d li u kho ng 2000 nh cho vi c máy h c. Trong đó có:
• 500 nh đ ng v t. • 600 nh hoa.
• 400 nh hoàng hôn. • 500 nh phong c nh.
và 200 nh cho vi c test th nghi m trong đó có:
• 50 nh đ ng v t. • 50 nh hoa. • 50 nh hoàng hôn. • 50 nh phong c nh. B ng 4.4: 4 nhóm nh và s l ng m u dùng trong th c nghi m. Tên nhóm S m u hu n luy n. S m u ki m ch ng. T ng s m u (hình nh). Hoa 600 50 650 Hoàng hôn 400 50 450 ng v t 500 50 550 Phong c nh 500 50 550
B ng 4.5: K t qu ki m ch ng sau khi ch y ch ng trình. Tên nhóm K t qu tr v (trên lý thuy t) S nh th c đúng S nh nh n di n sai Hoa 35 23 12 Hoàng hôn 40 28 12 ng v t 30 20 10 Phong c nh 35 22 13 B ng 4.6: Xác su t c a ch ng trình.
Tên nhóm Precision Recall
Hoa 82.85% 58.00%
Hoàng hôn 70.00% 56.00%
ng v t 83.33% 50.00%
Phong c nh 77.14% 54.00%
K T LU N VÀ KI N NGH .
Lu n v n ti n hành nghiên c u gi i quy t bài toán phân lo i nh d a vào đ c tr ng c c b b t bi n SIFT. Bài toán là n n t ng cho nhi u ng d ng quan tr ng th c t nh h th ng khuy n cáo ng i dùng, c i thi n tìm ki m nh, l c web…
Ph ng pháp gi i quy t c a lu n v n t p trung vào quá trình rút tríchđ c tr ng
nh cho c d li u h c máy và d li u c n phân lo i d a vào đ c tr ng c c b b t bi n SIFT, và bi u di n nh d i d ng vector. Ti p đ n dùng thu t toán K-mean
đ gom nhóm các đ c tr ng l i.
a ra và s d ng đ đo t ng đ ng đ đánh giá phân lo i.
M t mô hình phân lo i c ng đ c đ a ra t các b c ti n x lý cho t i khi đ a giá tr cu i cùng đ t k t qu kh quan, cho th y tính đúng đ n c a vi c l a ch n c ng nh k t h p các ph ng pháp.
Tuy b c đ u đ t m t s k t qu kh quan, nh ng v n t n t i m t s v n đ c n kh c ph c:
+ M t nh đ u vào c n phân lo i sau quá trình phân lo i cho k t qu thu c vào m t th lo i duy nh t.
+ H n ch s l ng và ch t l ng c a kho d li u nh h ng đ n ch t l ng phân lo i c a h th ng.
H ng phát tri n c a lu n v n
Trong khuôn kh lu n v n s l ng nhóm còn h n ch , th i gian th c thi còn lâu c n ph i kh c ph c do đó c n ph i c i ti n các quy trình x lý đ t ng t c cho h th ng.
TÀI LI U THAM KH O. Ti ng Anh:
[1] A flexible scheme for representation, matching, and retrieval of images. C. V. Jawahar, P. J. Narayanan, and S. Rakshit(2000). ICVGIP 2000, pages 271–277. Allied Publishers Ltd., 2000.
[2] Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories c a đ ng tác gi Svetlana Lazebnik, Cordelia Schmid, Jean Ponce. c phát hành vào 08-2009.
[3] Boosting Image Classification with LDA-based Feature Combination for Digital Photograph Management c a đ ng tác gi Xuezheng Liu, Lei Zhang, Mingjing Li, Hongjiang Zhang, Dingxing Wang. c phát hành vào 07-2008.
[4] Combining Local and Global Image Feature for Object Class Recognition c a tác gi Dimitri A. Lisin, Marwan A. Mattar, Matthew B. Blaschko, Mark C. Benfield, Erik G. Learned-Miller. c phát hành vào n m
2010.
[5] Content Based Image Retrieval by K-Means Clustering Algorithm c a tác gi Vanita G. Tonge, Department of Computer Technology, RCERT, Chandrapur (M.S.) pin:442403, India. Match 25, 2009.
[6] Distinctive Image Features from Scale-Invariant Keypoints. David G. Lowe, Computer Science Department University of British Columbia Vancouver, B.C., Canada lowe@cs.ubc.ca January 5, 2004.
[7] Face Recognition using SIFT Features. Mohamed Aly(2006), AlyCNS186 Term Project Winter.
[8] Feature Selection in Example-Based Image Retrieval Systems. V. Shiv Naga Prasad. A.G. Faheema, Subrata Rakshi(2002), Indian Conference on Vision Graphics and Image Processing.
[9] Image Classification using Super-Vector Coding of Local Image Descriptors c a tác gi XiZhou, Kai Yu, Tong Zhang, Thomas S. Huang. c
n ph m vào n m 2008.
[9] Object Recognition from Local Scale-Invariant Features c a tác gi David G. Lowe, thu c khoa khoa h c máy tính, tr ng đ i h c British Columbia.
[10] Object Recognitionusing Local Descriptors c a tác gi Javier Ruiz và Patricio Loncomila thu c trung tâm nghiên c u khoa h c Chile. 12/2004.
[11] Online feature Selection based on Generalized Feature Contrast Model. W. Jiang. M. Li, H. Zhang, J. Gu. (2004. IEEE International Conference on Multimedia and Expo(ICME). pp. 1995-1998
[12] Recognizing Indoor Scenes c a tác gi Ariadna Quattoni, Antonio Torralba. 01/2004.
[13] Similarity-Based Online Feature Selection In Content-Based Image Retrieval. W. Jiang, G. Er, Q. Dai and J. Gu. (2006). IEEE Trans. Image Processing, 15 (3), pp.702-712.
[14] Speeded-up Robust Features (SURF), Herbert Bay, Andreas Ess, Tinne Tuytelaars, Luc Van Gool, 12/2007.
[15] SVM-KNN: Discriminative Nearest Neighbor Classification for Visual Category Recognition c a đ ng tác gi Hao Zhang, Alexander C. Berg, Michael Maire, Jitendra Malik thu c khoa khoa h c máy tính tr ng đ i h c Berkeley, California. N m n hành 2006.
[16] Texture classification of aerial image based on bayesian network augmanted naïve bayes c a đ ng tác gi YU Xin, ZHENG Zhaobao, ZHANG Haitao, YE Zhiwei. 03/2008.
[17] Unsupervised real-time constrained linear discriminant analysis to hyperspectral image classification c a tác gi Qian Du, Department of Electrical and Computer Engineering, Missisippi State University, MS 39762, USA. Accepted 14 August 2006.
[22] A Comparative Study of Three Image Matcing Algorithms: Sift, Surf, and Fast. C a tác gi Maridalia Guerrero thu c Utah State University, n hành vào ngày 01-01-2011.
[23] Viola P. and Jones M. 2001, Rapid object detection using a boosted cascade of simple features, In: CVPR (1).
Ti ng Vi t:
[18] Gi i thi u ng d ng ph ng pháp phân lo i d a trên đ i t ng (Object-based classification) trong thành l p b n đ r ng t nh v tinh c a tác gi Ts. V Anh Tuân. 11/2009.
[19] Nghiên c u ph ng pháp k t h p các đ c tr ng màu s c hình d ng và v trí đ truy v n nh, lu n v n th c s c a tác gi Tr n S n H i, n m 2007.
[20] ph ng pháp trích ch n đ c tr ng nh trong thu t toán h c máy tìm ki m nh áp d ng vào bài toán tìm ki m s n ph m. Khóa lu n t t nghi p c a tác gi Nguy n Th Hoàn n m 2010.
[21] Xác đ nh c m xúc m t ng i c a tác gi Tr n Ng c Ph m. 12/2009.
Web tham kh o
http://bis.net.vn/forums/t/374.aspx Thu t toán K-Means v i bài toán phân c m d li u.