B GIÁO DO I HC BÁCH KHOA HÀ NI Trnh Tin Hòa HC T N VÀ NG DNG TRONG PHÂN LOI NH Chun ngành: Cơng ngh thơng tin LUK THUT CƠNG NGH THƠNG TIN NG DN KHOA HC TS Thân Quang Khốt Hà Ni 2017 170833002210079880ab1-1aa7-4dc1-896e-f32e6d1b3e07 1708330022100fd60d941-6616-4c8b-a934-58f241d0fa76 1708330022100dac93dd6-d818-4880-b6e8-7adc5dcc83e2 MC LC DANH MC CÁC KÝ HIU, CÁC CH VIT TT DANH MC CÁC BNG DANH MC CÁC HÌNH V TH M U CHNG TNG QUAN C S LÝ THUYT 1.1 Gii thiu hc t n 1.2 Biu din tha ca tín hiu 1.3 Mã hóa tha 1.4 Tin x lý nh 1.5 Phân lp SVM 11 CHNG - THUT TOÁN K-SVD .13 2.1 Gii thiu thut toán K-SVD cho hc t n: 13 2.2 Thut tốn K-means cho lng hóa vector .13 2.3 K-SVD-Tng quát hóa K-Means 15 2.4 Mô t chi tit K-SVD 17 2.5 T K-SVD quay li K Means 21 2.6 Các tính cht ca K-SVD 22 CHNG MƠ T BÀI TỐN, MƠ HÌNH, KT QU THC NGHIM VÀ MƠ PHNG 23 3.1 Mơ t tốn 23 3.2 Mơ hình hc t n 26 3.3 Xây dng c s d liu 28 3.4 Mô t d liu thc nghim 29 3.5 .30 3.6 Phn mm h tr phân lp 31 3.7 Kt qu thc nghim .37 3.8 Tng kt chng .42 KT LUN 43 TÀI LIU THAM KHO 44 L Nhng kin thc trình bày lu c t n ng dng phân loi tơi tìm hiu, nghiên cu trình bày theo nhng kin thc tng hp ca cá nhân Kt qu nghiên cu luc công b ti bt k cơng trình khác Trong q trình làm luo tài li n tài liu tham kh cơng trình nghiên cu ca không chép ca bt k Tơi xin chu hồn tồn trách nhim, nu sai, tơi xin chu mi hình thc k lunh Hà Ni, ngày 25 tháng 7 Hc viên Trnh Tin Hòa LI C Thân Quang Khoát, -TT, H K , cô , H , chân thành Trnh Tin Hòa DANH MC CÁC KÝ HIU, CÁC CH VIT TT T vit tt Thut ng Gii thích K-SVD K- Singular value decomposition Phân rã K giá tr k d MOD Method of optimal directions ng t SSE Sum of Squared Error Tng li trung bình SNR Signal-to-noise ratio T l tín hiu nhiu SVM Support vector machine Máy vector h tr VQ Vector quantization Lng hóa vector MSE Mean Squared Error T sai s OMP Orthogonal matching pursuit i khp trc giao BP Basis pursuit i kh SSY Sum of Squared Y Tng trung bình ma trn biu din tín hiu Y DANH MC CÁC BNG Bng 3.1 - Bng kt qu phân lp ch s ca tp train Test theo K.38 DANH MC CÁC HÌNH V TH Hình 1.1 - Các chi ti phân bing Hình 2.1 - Thut tốn K-means 14 Hình 2.2 - Thut tốn K-SVD 19 Hình 3.1 - Chia tp nh thành tp hc kim tr Hình 3.2 - Mơ t q trình to túi t .26 Hình 3.3 - Biu ding bi histogram 27 Hình 3.4 - Biu din bc nh bng bi histogram 27 Hình 3.5 - t qu phân lp ca bc nh 27 Hình 3.6 - Mô t h thng phân loi nh 28 Hình 3.7 - Mơ t nh Ơtơ laptop 32 Hình 3.8 - Giao din ca phn mm .34 Hình 3.9 - Chn u vào 35 Hình 3.10 - Chn nh ôtô .36 Hình 3.11 - Kt qu phân tích Car 37 Hình 3.12 - Hin th tên tác gi thông tin tr giúp 38 Hình 3.13 - Kt qu phân tích Laptop 39 Hình 3.14 - S xác ca tp Train Test theo K 41 Hình 3.15 - S i SNR ca tp Training Testing theo K 40 Hình 3.16 - S i SSE ca tp Train Test theo K 43 Hình 3.17 - Thi gian x lý d liu ca tp Train 44 M U Tính cp thit c tài Khoa hc k thut phát tri c nhn d c ng dng nhiu h thng hi i Mt minh chng hin nhiu hãng máy tính l ng cho công c p t ng bng phn mm nhn dng nhm to s tin d n khách hàng Bn cht tht s ca nhn dng mt toán phân lp Vi u vào, phn mm s phân lp t lp thích hp h thng honh n ti d lit nhng nguyên nhân tốn phân lp c nhiu s quan tâm Ngồi ra, s phát trin cn thoi thông minh máy nh k thut s ngày bùng n nh k thut s S ng nh khng l mt v v vic qun lý ni dung nh Nu ta có th phân loi nh t d dàng loi b nhng nh không phù hp trang web mt nhng thut toán hiu qu gii quyt v thut toán K-SVD Ngồi tốn x lý nh m phân tích n ca nh áp d t toán K-SVD Trong nghiên cu này, x lý c tin x lý thơng tin quan tr thut tốn K-SVD, SVM nhm gii quyt toán phân lp Kt qu xác ca q trình phân lp tài Hc t n ng dng phân loi nh nhm mu c cách thi nh hiu qu ng phm vi nghiên cu ng nghiên cu tp trung vào vic x lý nh b ch Tìm hiu thut tốn K-SVD, máy vector h tr SVM s dng cho phân lp nh Phm vi nghiên cu gii hn vic phân lp hai nhóm nh tơ máy tính t 131 bc u T chia 70% s bc nh làm tp hc 30% s bc nh làm tp kim tra Kt qu xác ca q trình phân lp nh Mc tiêu nghiên cu V mt lý thuyt, tác gi nghiên cu: - c t n - Cn ca nhc tin x lý d liu quan trng, nhng c la chn có ng ln kt qu ca q trình phân lp - Thut toán K-SVD - Máy vector h tr SVM - Nhng kin thc nn tng toán hc x lý ma trn V mt ng dng thc tin, tác gi xây dng mn mm có s dn m thut tốn K-SVD, t bc u trình s phân lp a xác cho q trình phân lp B cc lu Ni dung lum ba - T lý thuyt - Thut toán K-SVD - Mơ t tốn, mơ hình, Kt qu thc nghim mô phng TNG QUAN LÝ THUYT 1.1 Gii thiu hc t n S c khng l c ghi li mi giây ca b cm bin t t hom bin nhân tnh hoc microphones Thông tin phn la hai khía cnh chính: thng cha nhiu phiên bn ging ca th gii vt lý mi phiên bn thng có m mu c bi cm bin Thơng tin thích hp c x lý q trình c gim rt nhiu so vi tp d lic ghi Ngun gc thơng tin thích hp nhn dng bi bên lp ca tín hiu pháp hc t n hc c không gian biu din nh so vi khơng gian biu diu mà có th biu dic thơng u ca tín hiu tt cho nhim v x lý p d liu) 1.2 Biu dia tín hiu S dng mt ma trn t n hoàn chnh có cha K nguyên mu K thành phn tín hiu cho ct j 1 , mt tín hiu có th c biu di n t s kt hp tuyn tính ca thành phn Biu din ca y có th mt hai xác y=Dx hoc g a mãn ||y-Dx||p Các cha h s biu din ca tín hiu yp x, vector tiêu chuc s d ng sai lch chun cho p Nu n