Mô hình bài toán phân lo inh

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Nghiên cứu và xây dựng bộ lọc ảnh thông qua phân loại ảnh kết hợp với gom cụm (Trang 82)

Hình 4.2. S đ ch c n ng nh n d ng đ i t ng 4.1.2. Thu t toán s d ng: Rút các đ c tr ng nh: Nh đã nói trong ch ng 2 c a lu n v n, cách ch n ph ng pháp nh m rút ra nh ng đ c tr ng b t bi n c a nh là h t s c quan tr ng. Nó không ch nh h ng t i tính chính xác c a ch ng trình mà còn nh h ng t i hi u xu t n a. Chính vì l đó tác gi đã th c nghi m trên m t s ph ng pháp, nh m đ a ra cách ch n ph ng pháp sao cho hi u qu . Sau đây là m t s hình nh tác gi đã so sánh hi u qu c a các thu t toán.

Hình 4.3: Ph ng pháp SURF

Hình 4.4: Ph ng pháp SIFT Sau đây là b ng so sánh: B ng 4.1: B ng so sánh k t qu các ph ng pháp Ph ng pháp K t qu Th i gian (giây) SURF 38173 5 SIFT 40907 6 Hessian-Laplace 30524 3

Nh v y tác gi nh n th y. V i ph ng pháp Hessian-Laplace tuy th i gian th c hi n là nhanh nh t nh ng s l ng đi m nh rút ra đ c l i th p h n h t. i u này nh h ng không nh t i tính chính xác c a ch ng trình, còn v hai ph ng pháp còn l i SIFT tuy có ch m h n SURF nh ng l i cho k t qu cao h n, đi u này tác gi nh n th y là kh thi và quy t đ nh ch n SIFT làm ph ng pháp rút ra đ c tr ng nh cho ch ng trình.

Phân lo i các đ c tr ng:

Trong mô t bài toán có nêu là các nhóm nh đ c phân lo i th công tr c, sau đó các nh tham gia truy v n s đ c s p x p vào các nhóm này. Tuy nhiên vi c phân lo i th công này nh m m c đích ki m th tính chính xác c a ch ng trình mà thôi. Trong vi c phân lo i đ c tr ng này tác gi s d ng thu t toán K-Mean đ phân lo i. Các nh trong b máy h c s đ c gom chung l i v i nhau sau đó đi qua b c

l y đ c tr ng r i m i phân tách ra thành các nhóm. Qui trình máy h c này đ c th c hi n qua các b c sau:

B1: Áp d ng SIFT đ l y đ c tr ng nh B2: Lo i b t các đ c tr ng không ti m n ng B3: Xác đ nh s nhóm mu n phân lo i

B4: Áp d ng K-Mean cho t p h p các đ c tr ng này B5: Ki m th và gán nhãn cho nhóm đ c tr ng

Công vi c gán nhãn này tác gi th c hi n th công, vì sau khi gom chung các nh tham gia máy h c l i v i nhau và đi qua b c 1 thì các đ c tr ng là không xác đ nh. Ti p đ n b c 4 sau khi có đ c các nhóm đ c tr ng, các nhóm này ch mang tính khái ni m. Chính vì l này ta c n ph i xác đ nh chính xác các nhóm và gán nhãn cho các nhóm b ng ph ng pháp th công. 4.2.Hi n th c bài toán 4.2.1. Môi tr ng B ng 4.2: Môi tr ng th c nghi m Thành ph n Ch s

CPU Core 2 Duo T7300 2.0 Ghz

RAM 2Gb

HDD 160Gb

OS Window 7 Ultimate

4.1.2. Công c s d ng

Công c mã ngu n m đ c s d ng trong ch ng trình:

B ng 4.3: Công c mã ngu n m s d ng

Asift

Công c rút trích đ c tr ng c a tác gi Guoshen Yu, Jean- Michel Morel.

http://www.cmap.polytechnique.fr/~yu/research/ASIFT/de mo.html

Ch ng trình đ c xây d ng trên n n t ng .Net Framework 4 v i công c h tr l p trình Visual studio 2010 (C# 2010).

Ngoài các công c trên, tác gi xây d ng các module x lý sau: Module máy h c. Dùng cho vi c gom nhóm các đ c tr ng.

Module phân lo i. Ti n hành phân lo i nh.

4.1.3. D li u

D li u bao g m 2000 b c nh thu th p t internet ph c v cho vi c máy h c và 100 b c nh khác c ng thu th p t internet ph c v cho vi c ki m th .

4.1.4. Ch ng trình Hình 4.5: giao di n ch ng trình.Module máy h c: Module máy h c. Module phân lo i nh.

Hình 4.6: Công đo n rút trích đ c tr ng.

Hình 4.7: m t ph n góc nhìn c a t p đ c tr ng.

Hình 4.8: Công đo n phân c m các đ c tr ng.

Hình 4.9: Sau khi phân thành 2 c m.

c tr ng các nhóm.

nh tham gia h c máy

Hình 4.10: c tr ng nhóm 1 (class1.lhu).Ki m th : Hình 4.11: K t qu ki m th . 4.1.5. ánh giá. đo Recall-Precision: G i R là t p các hình nh thu c vào m t nhóm nh nh t đ nh, nhóm nh

này do chính tay con ng i t p h p. ây là t p nh tr v c a ch ng trình đáng

l ra ph i tr v sau khi tr v k t qu n u ch ng trình ho t đ ng t t nh t. G i A là t p các nh tr v trong th c t mà ch ng trình ch y và cho ra k t qu , và Ra

Ch s t ng đ ng K t lu n.

là t p h p giao c a A và R (ngh a là Ra ch a các hình nh tr v c a ch ng trình đ c đánh giá trên lý thuy t là đúng so v i l n ch y c a ch ng trình).

Recall = |眺尼| |眺| Precision = |眺尼|

|凋|

Sau khi ti n hành th c nghi m trên b d li u kho ng 2000 nh cho vi c máy h c. Trong đó có:

• 500 nh đ ng v t. • 600 nh hoa.

• 400 nh hoàng hôn. • 500 nh phong c nh.

và 200 nh cho vi c test th nghi m trong đó có:

• 50 nh đ ng v t. • 50 nh hoa. • 50 nh hoàng hôn. • 50 nh phong c nh. B ng 4.4: 4 nhóm nh và s l ng m u dùng trong th c nghi m. Tên nhóm S m u hu n luy n. S m u ki m ch ng. T ng s m u (hình nh). Hoa 600 50 650 Hoàng hôn 400 50 450 ng v t 500 50 550 Phong c nh 500 50 550

B ng 4.5: K t qu ki m ch ng sau khi ch y ch ng trình. Tên nhóm K t qu tr v (trên lý thuy t) S nh th c đúng S nh nh n di n sai Hoa 35 23 12 Hoàng hôn 40 28 12 ng v t 30 20 10 Phong c nh 35 22 13 B ng 4.6: Xác su t c a ch ng trình.

Tên nhóm Precision Recall

Hoa 82.85% 58.00%

Hoàng hôn 70.00% 56.00%

ng v t 83.33% 50.00%

Phong c nh 77.14% 54.00%

K T LU N VÀ KI N NGH .

Lu n v n ti n hành nghiên c u gi i quy t bài toán phân lo i nh d a vào đ c tr ng c c b b t bi n SIFT. Bài toán là n n t ng cho nhi u ng d ng quan tr ng th c t nh h th ng khuy n cáo ng i dùng, c i thi n tìm ki m nh, l c web…

Ph ng pháp gi i quy t c a lu n v n t p trung vào quá trình rút tríchđ c tr ng

nh cho c d li u h c máy và d li u c n phân lo i d a vào đ c tr ng c c b b t bi n SIFT, và bi u di n nh d i d ng vector. Ti p đ n dùng thu t toán K-mean

đ gom nhóm các đ c tr ng l i.

a ra và s d ng đ đo t ng đ ng đ đánh giá phân lo i.

M t mô hình phân lo i c ng đ c đ a ra t các b c ti n x lý cho t i khi đ a giá tr cu i cùng đ t k t qu kh quan, cho th y tính đúng đ n c a vi c l a ch n c ng nh k t h p các ph ng pháp.

Tuy b c đ u đ t m t s k t qu kh quan, nh ng v n t n t i m t s v n đ c n kh c ph c:

+ M t nh đ u vào c n phân lo i sau quá trình phân lo i cho k t qu thu c vào m t th lo i duy nh t.

+ H n ch s l ng và ch t l ng c a kho d li u nh h ng đ n ch t l ng phân lo i c a h th ng.

H ng phát tri n c a lu n v n

Trong khuôn kh lu n v n s l ng nhóm còn h n ch , th i gian th c thi còn lâu c n ph i kh c ph c do đó c n ph i c i ti n các quy trình x lý đ t ng t c cho h th ng.

TÀI LI U THAM KH O. Ti ng Anh:

[1] A flexible scheme for representation, matching, and retrieval of images. C. V. Jawahar, P. J. Narayanan, and S. Rakshit(2000). ICVGIP 2000, pages 271–277. Allied Publishers Ltd., 2000.

[2] Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories c a đ ng tác gi Svetlana Lazebnik, Cordelia Schmid, Jean Ponce. c phát hành vào 08-2009.

[3] Boosting Image Classification with LDA-based Feature Combination for Digital Photograph Management c a đ ng tác gi Xuezheng Liu, Lei Zhang, Mingjing Li, Hongjiang Zhang, Dingxing Wang. c phát hành vào 07-2008.

[4] Combining Local and Global Image Feature for Object Class Recognition c a tác gi Dimitri A. Lisin, Marwan A. Mattar, Matthew B. Blaschko, Mark C. Benfield, Erik G. Learned-Miller. c phát hành vào n m

2010.

[5] Content Based Image Retrieval by K-Means Clustering Algorithm c a tác gi Vanita G. Tonge, Department of Computer Technology, RCERT, Chandrapur (M.S.) pin:442403, India. Match 25, 2009.

[6] Distinctive Image Features from Scale-Invariant Keypoints. David G. Lowe, Computer Science Department University of British Columbia Vancouver, B.C., Canada lowe@cs.ubc.ca January 5, 2004.

[7] Face Recognition using SIFT Features. Mohamed Aly(2006), AlyCNS186 Term Project Winter.

[8] Feature Selection in Example-Based Image Retrieval Systems. V. Shiv Naga Prasad. A.G. Faheema, Subrata Rakshi(2002), Indian Conference on Vision Graphics and Image Processing.

[9] Image Classification using Super-Vector Coding of Local Image Descriptors c a tác gi XiZhou, Kai Yu, Tong Zhang, Thomas S. Huang. c

n ph m vào n m 2008.

[9] Object Recognition from Local Scale-Invariant Features c a tác gi David G. Lowe, thu c khoa khoa h c máy tính, tr ng đ i h c British Columbia.

[10] Object Recognitionusing Local Descriptors c a tác gi Javier Ruiz và Patricio Loncomila thu c trung tâm nghiên c u khoa h c Chile. 12/2004.

[11] Online feature Selection based on Generalized Feature Contrast Model. W. Jiang. M. Li, H. Zhang, J. Gu. (2004. IEEE International Conference on Multimedia and Expo(ICME). pp. 1995-1998

[12] Recognizing Indoor Scenes c a tác gi Ariadna Quattoni, Antonio Torralba. 01/2004.

[13] Similarity-Based Online Feature Selection In Content-Based Image Retrieval. W. Jiang, G. Er, Q. Dai and J. Gu. (2006). IEEE Trans. Image Processing, 15 (3), pp.702-712.

[14] Speeded-up Robust Features (SURF), Herbert Bay, Andreas Ess, Tinne Tuytelaars, Luc Van Gool, 12/2007.

[15] SVM-KNN: Discriminative Nearest Neighbor Classification for Visual Category Recognition c a đ ng tác gi Hao Zhang, Alexander C. Berg, Michael Maire, Jitendra Malik thu c khoa khoa h c máy tính tr ng đ i h c Berkeley, California. N m n hành 2006.

[16] Texture classification of aerial image based on bayesian network augmanted naïve bayes c a đ ng tác gi YU Xin, ZHENG Zhaobao, ZHANG Haitao, YE Zhiwei. 03/2008.

[17] Unsupervised real-time constrained linear discriminant analysis to hyperspectral image classification c a tác gi Qian Du, Department of Electrical and Computer Engineering, Missisippi State University, MS 39762, USA. Accepted 14 August 2006.

[22] A Comparative Study of Three Image Matcing Algorithms: Sift, Surf, and Fast. C a tác gi Maridalia Guerrero thu c Utah State University, n hành vào ngày 01-01-2011.

[23] Viola P. and Jones M. 2001, Rapid object detection using a boosted cascade of simple features, In: CVPR (1).

Ti ng Vi t:

[18] Gi i thi u ng d ng ph ng pháp phân lo i d a trên đ i t ng (Object-based classification) trong thành l p b n đ r ng t nh v tinh c a tác gi Ts. V Anh Tuân. 11/2009.

[19] Nghiên c u ph ng pháp k t h p các đ c tr ng màu s c hình d ng và v trí đ truy v n nh, lu n v n th c s c a tác gi Tr n S n H i, n m 2007.

[20] ph ng pháp trích ch n đ c tr ng nh trong thu t toán h c máy tìm ki m nh áp d ng vào bài toán tìm ki m s n ph m. Khóa lu n t t nghi p c a tác gi Nguy n Th Hoàn n m 2010.

[21] Xác đ nh c m xúc m t ng i c a tác gi Tr n Ng c Ph m. 12/2009.

Web tham kh o

http://bis.net.vn/forums/t/374.aspx Thu t toán K-Means v i bài toán phân c m d li u.

Một phần của tài liệu Luận văn thạc sĩ công nghệ thông tin Nghiên cứu và xây dựng bộ lọc ảnh thông qua phân loại ảnh kết hợp với gom cụm (Trang 82)

Tải bản đầy đủ (PDF)

(95 trang)