Luận văn, khóa luận, chuyên đề, tiểu luận, quản trị, khoa học, tự nhiên, kinh tế
I HC KHOA HC T NHIÊN THÀNH PH H CHÍ MINH KHOA CÔNG NGH THÔNG TIN MÔN CÔNG NGH TRI THC ²²² Lê Minh – 0012158 Phm Hu Lê Quc Phc – 0012169 P P P H H H C C C H H H I I I T T T H H H Ô Ô Ô N N N G G G T T T I I I N N N T T T D D D L L L I I I U U U Q Q Q U U U A A A N N N S S S Á Á Á T T T B B B N N N G G G T T T H H H U U U T T T G G G I I I I I I D D D I I I T T T R R R U U U Y Y Y N N N LUN VN C NHÂN CÔNG NGH THÔNG TIN Giáo viên hng dn TS. Nguyn ình Thúc Niên khóa 2000-2004 Phc hi thông tin t d liu quan sát bng thut gii di truyn - 2 - I CM N Chúng em xin chân thành cám n Khoa Công Ngh Thông Tin, trng i Hc Khoa Hc T Nhiên Thành ph H Chí Minh ã to u kin cho chúng em thc hin tài lun vn tt nghip này. Chúng con xin gi li bit n sâu sc n ông bà, cha mã chm sóc, nuôi dy chúng con thành ngi. Chúng em xin chân thành cám n thy Nguyn ình Thúc ã n tình hng dn, ch bo chúng em trong sut thi gian thc hin tài. Chúng em xin chân thành cám n các thy cô trong Khoa Công Ngh Thông Tin ã tn tình ging dy, trang b cho chúng em nhng kin thc quí báu trong bn nm hc va qua. c dù chúng em ã c gng hoàn thành lun vn trong phm vi và kh nng cho phép nhng chc chn s không tránh khi nhng thiu sót. Chúng em kính mong nhn c s cm thông và tn tình ch bo ca thy cô và các bn. Nhóm sinh viên thc hin: Lê Minh - Phm Hu Lê Quc Phc Phc hi thông tin t d liu quan sát bng thut gii di truyn - 3 - I GII THIU Máy tính ngày nay ã tr thành mt trong nhng công c quan trng. Có c u ó là do máy tính có hai m mnh ch yu là c x lý và kh nng lu tr. S phát trin ca Trí tu Nhân to làm cho máy tính càng thông minh hn. Kt hp vi nhng kh nng ang ngày càng hoàn thin ca máy tính, các ng dng ca Trí tu Nhân to có mt khp mi ni và ang dn làm thay i cuc sng a chúng ta. n thân Trí tu Nhân to bao gm nhiu lnh vc nghiên cu nh nh: H chuyên gia, Nhn dng, X lý nh, Mng Nron, Thut gii di truy, mi lnh vc khi c áp dng vào trong thc tu ã t c mt s thành tu nht nh. Riêng Thut gii di truyn ã và ang là mt công c mnh m c áp dng rng khp, t phc v cho hc tp (sp xp thi khóa biu, ti u hóa hàm s), gii trí (nâng cao tính trí tu cho games), cho n ng dng trong công nghip em li li nhun (nh trong khai thác du khí, trong thit k máy móc, trong khai thác hm m, giao thông công cng, trong sn xu) và ngay c trong lnh vc u tra ti phm. tài Phc hi thông tin t d liu quan sát bng thut gii di truy nhm tìm hiu v vic áp dng Thut gii di truyn trong Trí tu Nhân to vào lnh vc u tra ti phm. Mc tiêu là phc hi li thông tin v mt khuôn mt ngi t nhng thông tin ri c. Phc hi thông tin t d liu quan sát bng thut gii di truyn - 4 - cc chính ca lun vn nh sau: § Chng 1: Phc hi thông tin t d liu quan sát bng thut gii di truyn Chng này gii thiu v tài và trình bày tóm tt v thut gii di truyn, thut gii chính c s dng trong tài. § Chng 2: Dng nh chân dung t quan sát bng thut gii di truyn Chng 2 trình bày v các thuc tính c s dng cho bài toán, cách mã hóa các thuc tính này và áp dng các thuc tính này vào thut gii di truyn. § Chng 3: H thng h tr tìm kim nh chân dung da trên mô Chng 3 trình bày v mô hình cài t c th cho bài toán a vào lý thuyt c kho sát trong các chng trên. § Chng 4: Kt lun Nhng kt quã t c, hng phát trin cho tng lai, ó là nhng ni dung c trình bày trong chng này. Phc hi thông tin t d liu quan sát bng thut gii di truyn - 5 - C LC CHNG 1 PHC HI THÔNG TIN T D LIU QUAN SÁT BNG THUT GII DI TRUYN-------------------------------------------------------------------------------------------------------------- 9 1.1 PHÁT BIU BÀI TOÁN------------------------------------------------------------------------9 1.2 THUT GII DI TRUYN ------------------------------------------------------------------ 10 1.2.1 Thut gii di truyn tng quát----------------------------------------------------------------10 1.2.1.1 Các bc trong thut gii di truyn---------------------------------------------------------------- 12 1.2.1.2 Cách biu din --------------------------------------------------------------------------------------- 13 1.2.1.3 Khi to qun th------------------------------------------------------------------------------------14 1.2.1.4 Các phép toán trên thut gii di truyn------------------------------------------------------------14 1.2.2 Thut gii di truyn tng tác----------------------------------------------------------------16 CHNG 2 NG NH CHÂN DUNG T QUAN SÁT BNG THUT GII DI TRUYN---------------------------------------------------------------------------------------------- -------------------19 2.1 GII THIU ------------------------------------------------------------------------------------ 19 2.2 ÁP NG THUT GII DI TRUYN GII BÀI TOÁN PHC I NH CHÂN DUNG MÔ 20 2.2.1 c trng và mã hóa c trng chân dung-------------------------------------------------20 2.2.1.1 c trng ---------------------------------------------------------------------------------------------20 2.2.1.2 Min xác nh ca các c trng ------------------------------------------------------------------22 2.2.1.3 Mã hoá c trng ------------------------------------------------------------------------------------25 2.2.2 Hàm thích nghi---------------------------------------------------------------------------------27 2.2.3 Thut gii di truyn----------------------------------------------------------------------------29 2.2.3.1 Các phép toán----------------------------------------------------------------------------------------29 2.2.3.1.1 Tái sinh ---------------------------------------------------------------------------------------- 29 2.2.3.1.2 Lai ----------------------------------------------------------------------------------------------30 2.2.3.1.3 t bin----------------------------------------------------------------------------------------33 2.2.3.1.4 Chn lc --------------------------------------------------------------------------------------- 35 2.2.3.2 Thut gii--------------------------------------------------------------------------------------------- 36 2.2.3.2.1 Tham s---------------------------------------------------------------------------------------- 36 2.2.3.2.2 Thut gii --------------------------------------------------------------------------------------36 2.2.4 Tìm kim trong c s d liu nh chân dung -----------------------------------------------38 2.2.4.1 Xây dng CSDL nh chân dung ------------------------------------------------------------------- 39 2.2.4.2 T chc c s d liu nh chân dung -------------------------------------------------------------46 2.2.4.3 Tìm kim ---------------------------------------------------------------------------------------------48 CHNG 3 THNG H TR TÌM KIM NH CHÂN DUNG DA TRÊN MÔ ------------------------------ -------------------------------------------------------------------------------------------52 Phc hi thông tin t d liu quan sát bng thut gii di truyn - 6 - 3.1 THNG --------------------------------------------------------------------------- 52 3.2 CÁC MÔUN THNG------------------------------------------------------------------ 54 3.2.1 S màn hình---------------------------------------------------------------------------------54 3.2.2 Môun Mã hóa nh----------------------------------------------------------------------------58 3.2.3 Môun Phc hi chân dung-------------------------------------------------------------------59 CHNG 4 T LUN ----------------------------------------------------------------------------70 4.1 NHN XÉT -------------------------------------------------------------------------------------70 4.1.1 Nhng kt qut c-----------------------------------------------------------------------70 4.1.2 Khó khn và hn ch --------------------------------------------------------------------------71 4.2 NG PHÁT TRIN ----------------------------------------------------------------------- 72 Phc hi thông tin t d liu quan sát bng thut gii di truyn - 7 - DANH MC CÁC HÌNH V Hình 1-1 Lc ca mt thut gii di truyn tng tác ---17 Hình 2-1 S tng quát ca bài toán. Trong ó, mã hóa nh chân dung là mt trong hai tin trình quan trng. -----39 Hình 3-1 Hai môun chính ca h thng ---------------------52 Hình 3-2 S màn hình -----------------------------------54 Hình 3-3 Màn hình chính ca chng trình. -----------------55 Hình 3-4 Màn hình mã hóa nh ------------------------------56 Hình 3-5 Màn hình Phc hi chân dung ----------------------57 Hình 3-6 Môun mã hóa nh ---------------------------------58 Hình 3-7 Môun Phc hi chân dung -------------------------59 Hình 3-8 Tin trình con Phc hi --------------------------60 Hình 3-9 Tin trình con Tìm kim --------------------------61 Hình 3-10 Vi k=1, chng trình tìm c 2 nh có cùng khong cách gn nht n khuôn mt phác tho c chn 68 Hình 3-11 k=2, chng trình tìm c 2 nh ----------------68 Hình 3-12 k=3 chng trình tìm c 5 nh có cùng khong cách gn nht. Khuôn mt cn phc hi ã c tìm thy là khuôn mt gia -----------------------------------68 Hình 3-13 k=4, kt qu tìm kim là 5 nh ------------------69 Hình 3-14 k = 5, kt qu là 5 nh -------------------------69 Phc hi thông tin t d liu quan sát bng thut gii di truyn - 8 - DANH MC CÁC CÔNG THC Công thc 2-1 Ta các m ca khuôn mt trung bình A 28 Công thc 2-2 Khong cách t khuôn mt F i n khuôn mt trung bình A 28 Công thc 2-3 o khong cách City-Block 28 Công thc 2-4 Khong cách City-Block gia F i và A .29 Công thc 2-5 Giá tr thích nghi ca khuôn mt F i .29 Phc hi thông tin t d liu quan sát bng thut gii di truyn - 9 - C C C H H H N N N G G G 1 1 1 P P P H H H C C C H H H I I I T T T H H H Ô Ô Ô N N N G G G T T T I I I N N N T T T D D D L L L I I I U U U Q Q Q U U U A A A N N N S S S Á Á Á T T T B B B N N N G G G T T T H H H U U U T T T G G G I I I I I I D D D I I I T T T R R R U U U Y Y Y N N N 1.1 PHÁT BIU BÀI TOÁN Phc hi thông tin t d liu quan sát bng thut gii di truyn nhm nghiên cu cách phc hi thông tin ch da vào trí nh ch quan ca con ngi. Các thông tin quan sát c thng ri rc, không chc chn, thi gian quan sát có khi rt ngn và chu nh hng ca nhiu yu t ch quan a ngi quan sát nh là tâm sinh lý, kh nng quan sát, kh nng din t, kh nng miêu t, … tài này có th áp dng vào lnh vc u tra ti phm: Nhà chc trách mun dng li chân dung ti phm hay tìm nh chân dung trong tp nhng i tng nghi vn da vào li khai ca các nhân chng. Các nhân chng thng không nh chính xác khuôn mt, nhiu khi các miêu t ca các nhân chng khác nhau li trái ngc nhau, do ch quan. Làm sao t các chi tit ri rc ó ta có th tng hp li và a ra mt chân dung phác tho chính xác nht có th? ó chính là mc ích nghiên cu ca tài này. Thut gii di truyn là mt trong nhng phng pháp có th gii quyt t nhng vn mà bài toán t ra nh vào các phép toán rt mnh mà thut Phc hi thông tin t d liu quan sát bng thut gii di truyn - 10 - gii s hu nh: chn lc, lai ghép, t bin. Do ó trong lun vn này chúng tôi s dng thut gii di truyn nh là mt công c gii quyt bài toán này. 1.2 THUT GII DI TRUYN 1.2.1 Thut gii di truyn tng quát Thut gii di truyn (GA – Genetic Algorithms) do John Holland xut vào nhng nm 1970 ca th k 20. Ý tng ca thut gii da trên thuyt tin hoá ca Darwin: Nhng cá th có tính thích nghi cao vi hoàn nh sng thì tn ti và tip tc phát trin, nhng cá th có thích nghi kém dn dn bào thi. Nh vy nhng th h sau bao gi cng tt hn th h trc. Xét trên khía cnh mt bài toán trong ó mi cá thóng vai trò mt i gii thì càng v sau ta s càng có nhng li gii tt hn nhng li gii trc ó, và quá trình tin hóa trên mt qun th các cá th thì ng vi mt quá trình tìm kim li gii trong không gian li gii. Thut gii di truyn s dng vay mn nhiu thut ng ca sinh hc nh: nhim sc th, cá th, qun th, lai ghép, t bin, chn lc . Cá th là mt li gii ca bài toán, mi cá th trong thut gii di truyn c qui c ch có mt nhim sc th (khác vi các sinh vt trong t nhiên, ví d nh con ngi chúng ta có ti 46 nhim sc th) nên cá th ng c gi là nhim c th. Các nhim sc th là mt chui tuyn tính các n v nh hn là các gen, mi gen biu din cho mt c trng và có mt v trí nht nh trong nhim sc th. Mi c trng có th có nhiu giá tr khác nhau. Qun th là t tp hp nhiu cá th có s lng xác nh, trong thut gii di truyn qun th là mt không gian các li gii. Còn lai ghép, t bin, chn lc… là các phép toán thc hin trên qun th to ra mt qun th mi. . Phc hi thông tin t d liu quan sát bng thut gii di truyn - 5 - C LC CHNG 1 PHC HI THÔNG TIN T D LIU QUAN SÁT BNG THUT GII DI TRUYN--------------------------------------------------------------------------------------------------------------. thông tin t d liu quan sát bng thut gii di truyn nhm nghiên cu cách phc hi thông tin ch da vào trí nh ch quan ca con ngi. Các thông tin