Fouille de graphes et classification de graphes application au symbol spotting

57 273 0
Fouille de graphes et classification de graphes application au symbol spotting

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Mộmoire de fin dộtude Fouille de graphes et Classification de graphes Application au "Symbol Spotting" Rộalisộ par : Nguyen Quoc Toan Responsable du stage : Jean-Marc Ogier Jean-Christophe Burie Romain Raveaux Ce stage a ộtộ rộalisộ au dộpartement Pascal de Laboratoire Informatique, Image et Interaction, Universitộ de la Rochelle La Rochelle, France, Novembre 2009 Table des matiốres Introduction 1.1 Problộmatique 1.2 Objectif et contribution du stage 1.3 Environnement de stage 1.4 Plan du document Conceptions 10 2.1 Dộfinition de graphe .10 2.2 Correspondance de Graphe 10 2.3 Graphe de distance 11 2.3.1 Distance d'ộdition 12 2.3.2 Distance entre signatures de graphe ôgraph probing ằ 15 2.4 Symbol spotting 17 Etat de l'art 19 3.1 Les mộthodes de construction de graphe 19 3.2 Les methodes de mise en correspondances des graphes 22 3.3 Rộcaputulation des mộthodes 24 Une mộthode de mise en correspondance de graphes fondộe sur lassignement de sousgraphes 25 4.1 Dộfinition : Dộcomposition en sous-graphes 25 4.2 La correspondance de sous-graphes 26 4.3 Le coỷt de fonction (c) pour la correspondance des signatures 26 4.4 Sous graphe de longueur 27 4.5 Construction de matrice de coỷts 28 Reprộsentation de linformation contenue dans une image 30 5.1 Constitution de l'ensemble des nuds 30 5.2 Extraction des composantes connexes 31 5.3 ẫtiquetage des composantes connexes 31 5.3.1 Extraction de caractộristiques 32 5.3.2 Statistique de la forme 33 5.3.3 Classification non supervisộe des caractộristiques morphologiques 34 5.4 Organisation de linformation : Construction dun Graphe de voisinage 34 5.4.1 Relations d'Allen bidimensionnelles 34 5.4.2 Intervalle basộ sur les distances entre deux rộgions 35 Application 36 6.1 Protocole 36 6.1.1 Test en classification 36 6.1.2 Symbol Spotting 37 6.2 Bases de tests 42 6.2.1 Pour la classification 42 6.2.2 Pour le Symbol Spotting 43 6.3 Rộsultat 44 6.3.1 Test en classification 44 6.3.2 Symbol Spotting 45 6.4 Complexitộ algorithmique 51 Symbol spotting 51 Conclusions 53 Rộfộrences 54 NGUYEN Quoc Toan Promotion 13 Page REMERCIEMENTS Je voudrais tout d'abord remercier professeur Jean-Marc Ogier, Jean-Christophe Burie, mes responsables de stage, de m'avoir accueillie au sein de lộquipe du projet ALPAGE du Laboratoire L3i (Laboratoire Informatique, Image et Interaction) de lUniversitộ de la Rochelle et de ma donnộ lenvironnement de travail trốs chaleureuse pendant toute la durộe du stage Je remercie ộgalement Romain Raveaux pour ses conseils, son explication trốs clairement des nouveaux concepts, ses aides, ses commentaires et ses discussions qui ont fait progresser mon travail Je lui suis reconnaissant davoir toujours ộtộ disponible et agrộable Je voudrais remercier tout le personnel du laboratoire L3I et particuliốrement lộquipe du projet ALPAGE pour leur accueil chaleureux Je voudrais aussi adresser mes sincốres remerciements tous les professeurs de lIFI pour leurs enseignements et les cours intộressants quils mont donnộ pendant mes ộtudes au niveau master Finalement, je voudrais remercier ma famille, mes parents et mes amis qui sont toujours prốs de moi et mont apportộ le courage dans les moments difficiles de ma scolaritộ lIFI NGUYEN Quoc Toan Promotion 13 Page Rộsumộ Reconnaissance des symboles est un domaine de recherche visant le dộveloppement d'algorithmes et de techniques et il y a une nombreuse mộthode de reconnaissance de graphiques ont ộtộ dộveloppộes pour la reconnaissance des symboles graphiques Le problốme ô Symbole Spotting ằ est comme la localisation d'un ensemble de rộgions d'intộrờt d'un document image, qui sont susceptibles de contenir une instance d'un certain symbole demandộ sans le reconnaợtre explicitement Nous prộsentons donc dans ce mộmoire un processus dextraction et dorganisation de linformation contenue dans une image afin de la structurer sous forme dun graphe pour tenir compte de la spộcificitộ que contiennent les documents techniques Chaque nud du graphe reprộsente une composante connexe dans limage de document, ces nuds sont ộtiquetộs automatiquement par lalgorithme de clustering ô k-Mean ằ Ce dernier utilise des descripteurs de formes extraits des composantes connexes La relation entre deux composantes connexes est matộrialisộe dans un graphe de ô voisinage ằ par un arc ộtiquetộ automatiquement en utilisant les relations d'Allen bidimensionnelles ou la distance entre composantes connexes Nous proposons une mộthode de mise en correspondance de graphes fondộe sur lassignement de sous-graphes de longueur l Nous proposons aussi une dộfinition de sousgraphe de longueur l Le problốme de reconnaissance des symboles devient donc de trouver les sous-graphes les plus similaires au graphe symbole donnộ en requờte Nous extrayons le graphe de plan en des sous-graphes de longueur l Le rộsultat de notre application est ensemble de sous-graphes isomorphisme que la distance entre les sous-graphes et le graphe de symbole est infộrieur une valeur seuil Afin dộvaluer la classification de graphes, nous utilisons un classifieur de type K-NN pour ộvaluer la performance de notre mộthode de mise en correspondance de graphes fondộe sur lassignement de sous-graphes NGUYEN Quoc Toan Promotion 13 Page Abstract Symbol Recognition is a research area for the development of algorithms and techniques, a lot of method of graphics recognition are developed for the recognition of graphic symbols The problem "Symbol Spotting" aims to find the locations of a set of regions interest in a document image, which may contain an instance of a symbol without explicitly recognize We therefore present in this paper a process for extracting and organizing information in an image to the structure of a graph for the specificity technical documents Each graph node is a connected component These nodes are labeled automatically by the clustering algorithm "k-means We extract the connected components using shape descriptors We use the family of graph "Neighborhood based on k nearest neighbors" to build edges and they are automatically labeled by the Bi-dimensional Allen Algebra or the distance between regions We propose a method for mapping graph-based assignment of subgraphs of length l We also propose a definition of subgraph of length l The symbols recognition problem is like to find subgraphs which are the nearest similar to the graph of symbol We extract the graph of technical documents in many subgraphs of length l The recognition task consists of finding all subgraphs isomorphism which the distance between sub-graphs and symbol graphs is less than a certain threshold To test the classification of graphs based on graph prototypes, we use a K-NN classifier in order to evaluate our method for mapping graph-based assignment of subgraphs of length l by the rate of recognition NGUYEN Quoc Toan Promotion 13 Page Liste des figures Figure 1: La distance entre signatures de graphe GP, (a) les graphes non orientộ, sans ộtiquetage, (b) les graphes orientộs, sans ộtiquetage, (c) les graphes ộtiquetộs, orientộs 16 Figure 2: La distance entre deux graphes selon ED et GP, (a) les graphes non orientộ, sans ộtiquetage, (b) les graphes orientộs, sans ộtiquetage, (c) les graphes ộtiquetộs, orientộs 17 Figure : Graphiques attribuộs relationnelle, chaque nud est comme une ligne segmentộe, un arcs ộtablis la relation dadjection entre deux segmentations (source[14]) 19 Figure 4: Chaque nud est une rộgion fermộe Larc lie deux rộgions adjacentes (source[32]) 19 Figure 5: Graphe transaction, source [33] .20 Figure 6: vectorisation de quadrilatốres, source [45] 20 Figure 7: La zone influence de quadrilatốre et le graphe correspondant, source [45] 21 Figure 8: exemple de construction dun graphe basộ sur les relations topologique, source [35] 21 Figure 9: La dộcomposition en sous-graphes p1, p2, p3, p4 est des sous-graphes dextractions de longueur qui associộs chaque nuds du graphe G 25 Figure 10: partir deux graphes G1, G2 (a), on extrait des sous-graphes de longueur (a), (b) Le graphe bipartite complet Gem obtenu par P1 et P2 26 Figure 11: (a) un graph G(V, E), partir du nud 1, on extrait les sous graphes avec (b)longueur=1, (c)longueur=2 28 Figure 12: un exemple de la correspondance de graphe, (a), (b) les sous-graphes dextraction de longueur 1, (c) la correspondance de sous-graphe selon distance dộdition (ED) 30 Figure 13: Analyse des composantes connexes 31 Figure 14: Mesure de l'ộlongation, comme le ratio de la longueur-largeur 33 Figure 15:Graphe des k plus proches voisins (a) les composantes connexes, (b) k=2, (c) k=134 Figure 16: Jeu restreint de relations d'Allen 35 Figure 17: (a) deux composantes connesxes, (b) dộtermination du systốme de coordonnộes liộ aux 35 Figure 18: Limage gauche : reprộsentation de la distance entre deux composantes connexes, d-max = 39 Le graphe droit obtenu par n = 10 (n est le nombre dintervalles) 36 Figure 19: La vộritộ terrain pour un plan 41 Figure 20: Les exemples de lettres A, M, K et Z: l'origine et la dộformation des niveaux faible, moyen et ộlevộ (de gauche droite) 42 Figure 21 : Illustration du composant dune molộcule 43 Figure 22:la comparaison le temps de calcul sur PMDED et PMDGP 45 Figure 23: La courbe de prộcision, rappel selon la mộthode Hu_Dist 47 Figure 24: La courbe de prộcision, rappel selon la mộthode Hu_ Allen 48 Figure 25: La courbe de prộcision, rappel selon la mộthode Shape_Allen .49 Figure 26: La courbe de prộcision, rappel selon la mộthode Shape_Dist 50 Figure 27: Les meilleurs courbes de chaque mộthode d'ộtiquetage 51 NGUYEN Quoc Toan Promotion 13 Page Liste des tableaux Table 1: Matrice des coỷts de G1, G2 .13 Table 2: ộtape : rộduction des lignes 13 Table 3: ộtape : rộductions des colonnes 13 Table 4: ộtape : dộterminer le nombre minimal de lignes sur les lignes, colonnes pour couvrir tous les zộros .14 Table 5: ộtape : Trouver la cellule de valeur minimum non-couverte par une ligne 14 Table 6: ộtape : recaler la valeur pour les cellules basộes sur cette valeur minimum 14 Table 7: ộtape : dộterminer le nombre minimal de lignes 14 Table 8: ộtape : dộterminer la solution optimale 15 Table 9: le coỷt minimal de G1, G2 15 Table 10 : La matrice de coỷts entre deux graphes G1, G2 29 Table 11: Rộsumộ des donnộes de graphes des caractộristiques .43 Table 12: Les taux de reconnaissance pour deux mộthode PMDED et PMDGP 45 Table 13: La valeur moyenne de prộcision, rappel selon la mộthode Hu_Dist 46 Table 14 : La valeur moyenne de prộcision, rappel selon la mộthode Hu_Allen 47 Table 15: La valeur moyenne de prộcision, rappel selon la mộthode Shape_Allen 48 Table 16: La valeur moyenne de prộcision, rappel selon la mộthode Shape_Dist 49 Table 17: La comparaison des mộthodes d'ộtiquetage des noeuds, des arcs 50 Table 18: Comparaison nos rộsultats avec les rộsultats de Marỗal [51] 51 NGUYEN Quoc Toan Promotion 13 Page Introduction 1.1 Problộmatique Reconnaissance de symbole est une des applications importantes dans le domaine de la reconnaissance de formes qui est appliquộ dans plusieurs domaines comme l'architecture, la cartographie, l'ộlectronique, la mộcanique etc En raison des types de documents graphiques sont trop large, chacune dentre eux possốdent un ensemble caractộristique de symboles propres, il n'est pas facile de trouver une dộfinition prộcise d'un symbole Dans une maniốre trốs gộnộrale, un symbole peut ờtre dộfini comme une entitộ graphique avec un sens particulier dans le contexte d'un domaine d'application spộcifique Il y a un grand nombre d'approches ont ộtộ proposộes pour la reconnaissance des symboles Chacune dentres elles possốdent des propriộtộs qui lui sont propres et ne peut sappliquer qu certains contextes, rộunissant certaines conditions Dans notre cas, nous utilisons la mộthode basộes sur le graphe pour reprộsenter les images de documents techniques et de symbole demandộ en des graphes Chaque nud du graphe reprộsente une composante connexe dans limage de document La relation entre deux composantes connexes est matộrialisộe dans un graphe de ô voisinage ằ Le problốme de la reconnaissance de symbole est tournộ en une question disomorphisme de sous graphe, afin de trouver les sous-graphes qui correspondent des symboles graphiques 1.2 Objectif et contribution du stage L'objectif de stage est dans un premier temps d'ộtudier le problốme de la correspondance de graphes ô Graph Matching ằ, les mesures de calculer la distance entre deux graphes Et puis, nous proposons une mộthode de mise en correspondance de graphes fondộe sur lassignement de sous-graphes de longueur l Ensuite nous construisons un protocole de test en classifications basộ sur les prototypes de graphes en utilisant la mộthode K plus proche voisins (K-NN) basộ sur notre mộthode de mise en correspondance de graphes Enfin, nous crộons une application de type reconnaissance de symbole basộ sur le graphe pour trouver toutes les localisations dun symbole dans un plan donnộ 1.3 Environnement de stage Ce stage sintốgre dans le contexte dun projet appelộ : ô ALPAGE ằ1 de Laboratoire L3I, Universitộ de La Rochelle, France Ce projet traite des plans cadastraux couleurs de lespace urbain parisien suivant diffộrentes ộpoques, allant du 14 ốme au 19 ốme siốcle en intộgrant rộellement la dimension spatiale Les travaux de ce projet ont concernant les domaines telles que la vision par ordinateur, la gộomộtrie, larchộologie et reconnaissance des formes La contribution du stage est une nouvelle approche dans le domaine de reconnaissance de forme basộ sur le graphe 1.4 Plan du document Le reste du document est organisộ de la maniốre suivante La deuxiốme partie, nous prộsentons des conceptions fondamentales Dans la troisiốme partie, nous prộsentons un ộtat de lart des mộthodes base de graphe pour la reconnaissance des symboles graphiques Alors, la quatriốme partie prộsente une nouvelle mộthode de mise en correspondance de graphes fondộe sur lassignement de sous-graphe de longueur l en utilisant la matrice de coỷts La cinquiốme partie fournit la faỗon de construire un graphe basộ sur linformation contenue dans une image, dans ce chapitre nous proposons des mộthodes dộtiquetage des nuds et des arcs pour avoir des types de graphe diffộrent Dans la sixiốme partie, nous prộsentons la contribution de notre stage http://alpageproject.free.fr NGUYEN Quoc Toan Promotion 13 Page construire deux protocoles : Test en classification et Symbol Spotting, nous prộsentons aussi la mộthode dộvaluation que nous avons utilisộe pour notre systốme, ainsi que les rộsultats obtenus La derniốre partie prộsente la conclusion, ainsi que les perspectives NGUYEN Quoc Toan Promotion 13 Page Conceptions 2.1 Dộfinition de graphe Soient deux fonctions d'ộtiquetage LV (V) et LE(E) qui associent chacun des ộlộments de V, respectivement de E, une ộtiquette Un graphe ộtiquetộ G est un 4-tuple G = (V, E, à, ), avec : V est un ensemble de nuds E V ì V : un ensemble darcs : V LV : la fonction dộtiquetage de nud : E LE : la fonction dộtiquetage darcs 2.2 Correspondance de Graphe Les graphes constituent un mode de reprộsentation frộquemment utilisộ dans le domaine des sciences et technologies de l'information qui permettent la description de donnộes structurộes Un graphe G est un ensemble V de nuds et un ensemble E d'arcs, G = (V, E) Les outils de classification supervisộe sont de plus en plus nộcessaires dans de nombreuses applications telles que la reconnaissance des formes [1], la CBR (Case Based Reasoning) [2], lanalyse des composantes chimiques [3], Pour lancer le sujet de la mise en correspondance de graphe ô graph matching ằ, nous rappelons qu'il existe une ộtude approfondie sur les techniques de la correspondance de graphes apparues au cours de ces 30 derniốres annộes dans [4] Dans le cas du problốme de reconnaissance des formes, ộtant donnộ deux graphes : le graphe de modốle GM et le graphe de donnộes GD, la procộdure de comparaison implique de vộrifier si ils sont similaires ou non De maniốre gộnộrale, nous pouvons reprộsenter le problốme de la correspondance de graphe comme suit : Etant donnộ deux graphes GM = (VM, EM) et GD = (VD, ED), avec | VM | = | VD |, le problốme est de trouver une fonction de correspondance f: VD VM, tel que (u, v) ED Si et seulement si (f (u), f (v)) EM Lorsquune telle fonction de correspondance f existe, nous somme en prộsente dun isomorphisme, et GD est dit d'ờtre isomorphe GM et ce type sappelle ô correspondance exacte ằ D'autre part, le terme ô inexact ằ appliquộe aux problốmes de la correspondance de graphe, indique qu'il n'est pas possible de trouver un isomorphisme entre les deux graphiques C'est le cas lorsque le nombre de sommets ou le nombre darcs sont diffộrents la fois dans le graphe modốle et graphe de donnộes Dans ce cas l, on peut trouver la meilleure correspondance entre eux en trouvant une correspondance non-bijective entre le graphe de donnộes et le graphe de modốle Le problốme de la correspondance de graphe a ộtộ prouvộ ờtre le NP-complet [5] Lorsque le nombre de nuds dans les deux graphes sont diffộrents, le problốme de la correspondance de graphe devient plus difficile que dans le cas de la correspondance de graphe exact De mờme, la complexitộ du problốme de sous-graphe inexact est ộquivalente la complexitộ du problốme de la plus grand sous graphe commun, qui est aussi connu pour ờtre NP-complet Plusieurs techniques ont ộtộ proposộes pour rộsoudre ce problốme, par exemple, la relaxation probabiliste, l'algorithme EM [6], [7], les rộseaux de neurones [8], [9], des arbres de dộcision [10] et un algorithme gộnộtique [11], [12] Toutes les mộthodes ộnoncộes antộrieurement ont comme point commun l'utilisation d'un algorithme d'optimisation pour adapter un graphe dans un autre et une fonction ô qualitộ ằ pour mesure la bonne similaritộ entre deux graphes Cette fonction est conỗue en tenant compte du coỷt pour faire la correspondance VD VM Les auteurs sont convaincus quune correspondance convenable doit conduire une distance entre graphe prộcise Selon cette hypothốse, le problốme est tournộ en une question de distance entre graphes De plus, ce point de vue sur le problốme de la correspondance de graphe permettra de lancer un banc de tests sur notre approche et de fournir une ộtude comparative NGUYEN Quoc Toan Promotion 13 Page 10 Figure 21 : Illustration du composant dune molộcule Table 11: Rộsumộ des donnộes de graphes des caractộristiques Base de donnộes Taille #classe Letter app 2250 val 2250 test 2250 15 Mutagộnicitộ 1500 500 2337 Etiquetage Nud x, y coordonnộes symbole chimique #Moyen #Max Arc aucun Nud 4.7 Arc 3.6 Nud Arc valence 30.3 30 417 112 6.2.2 Pour le Symbol Spotting La Base de symbole, elle contient 16 symboles armchair sink2 table1 bed sink3 table2 door1 sink4 table3 NGUYEN Quoc Toan Promotion 13 door2 sofa2 sink1 sofa1 tub window1, window2 Page 43 La Base Floor Plan, elle contient 100 plans en binaire dans le domaine de construction, avec ses tailles de 6775 x 2858 La base floorplans16-01 : 100 images, (source : http://mathieu.delalandre.free.fr) 6.3 Rộsultat 6.3.1 Test en classification Nous avons testộ ces reprộsentations en utilisant le classifieur 1-NN utilisant mộthode de mise en correspondance de graphes fondộe sur lassignement de sous-graphes de longueur l basộe sur la ô distance dộdition ằ et basộe sur le ô Graphe Probing ằ Les taux de reconnaissance obtenus pour deux bases de tests, exprimộs en pourcentage de bonne reconnaissance, sont prộsentộs sur le tableau 14 On sait que la distance dộdition de graphe est connue pour ờtre NP-complet, et dans la mộthode de calculer la correspondance de sous-graphe, nous utilisons l'algorithme hongrois avec une complexitộ en O (n3) dans le pire des cas, surtout le nombre de nuds moyens de base Mutagenicity est de 30,3, donc nous navons pas le temps pour rộaliser le test sur la mộthode PMDED Dans ce tableau reprộsente aussi le temps de calcul pour chaque mộthode Dan la figure 22 prộsente une comparaison le temps de calcul selon les mộthodes de calculer la distance entre deux graphes : PMDED et PMDGP, ce qui montrent que la mộthode PMDGP est suffisante et ce qui est rapide calculer On peut facilement voir que le temps de calcul est augmentộ selon la longueur de sous-graphe dextraction Pour ộvaluer la performance de notre mộthode de mise en correspondance de graphes fondộe sur lassignement de sous-graphes de longueur (l), nous comparaisons nos rộsultats avec les rộsultats de globalement obtenus par la communautộ en matiốre de mộthodes de reconnaissance de graphe basộe sur une approche structurelle (SSPR 2008) et des techniques statistiques de reconnaissance de formes (SPR 2008) [49] Pour la base Mutagenicity, notre rộsultat est un peu supộrieur (73, 4% contre 71,5%) Pour la base Letter, nous avons testộ sur tous les prototypes de graphes, par contre ils sộparent pour chaque base aux niveaux faible, moyen et ộlevộ, donc on ne peut pas de faire une comparaison, mais ces rộsultats sont plus proche NGUYEN Quoc Toan Promotion 13 Page 44 Table 12: Les taux de reconnaissance pour deux mộthode PMDED et PMDGP DB Mutagenicity Longueur Taux de classification Time de calcul 0.7223 37:29:56 0.7343 44:22:48 0.7343 0.7334 52:55:31 64:32:03 Longueur Taux de classification Time de calcul 0.9023 0:35:11:455 0.8827 0:53:4:110 0.8780 0.8714 0.8146 1:7:30:984 1:20:17:446 01:47:14 0.8235 05:33:51 0.8229 0.8270 09:40:35 12:17:59 Graph Probing DB Letter Graph Probing Edit Distance Le temps de calcul pour PMD (ED, GP) 14 12 heures 10 GP ED 0 sous-graphe longueur l Figure 22:la comparaison le temps de calcul sur PMDED et PMDGP 6.3.2 Symbol Spotting A partir de base de donnộe Floor Plan, nous avons testộ notre programme avec les mộthodes pour ộtiquetage des nuds et des arcs comme : Moment de Hu (Hu), Shape statistiques (Shape) pour ộtiqueter des nuds et les relations d'Allen bidimensionnelles (Allen) ou sur les distances entre deux rộgions pour ộtiqueter des arcs (Dist) Pour ộvaluer la performance de cet propose nous utilisons les valeurs prộcision et rappelle Pour chaque requờte (symbole), soit T est le nombre symbole de type requờte dans le plan, R est le nombre rộsultats obtenues par le programme Le nombre ộlộment bien dộtectộ sappel e La valeur prộcision a ộtộ dộfinie par le ratio entre le nombre ộlộment bien dộtectộ et le nombre rộsultats obtenues NGUYEN Quoc Toan Promotion 13 Page 45 p= e/R Le rappel est dộfini par le nombre ộlộment bien dộtectộ sur le nombre symboles de type requờte r=e/T Le nombre rộsultats obtenus dộpendent une valeur de seuil distance que nous avons abordộ Voici les rộsultats obtenues pour notre application en utilisant 100 plans architecturaux binaire et 16 symboles requờtent par plan Nb symboles Nb type symboles Le temps de calcul Hu_Allen Hu_Dist Shapes_Dist Shapes_Allen Min 01:24:20 01:08:38 24 1:45:08 01:26:50 Max 06:03:14 06:00:22 30 14 07:01:00 06:55:34 04:27:19 Moyen 04:06:32 03:55:50 26.71 12.24 04 :41 :14 468 :43 :24 410:53:28 396:58:36 441:03:37 Total 2761 16 Pour chaque plan, nous fait environs : 25 (seuil distance : 0, 2, 48) x (nb de cluster : 4, 8, 16) x 16 (type de symbole) = 1200 requờtes Seuil dist (%) 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 Table 13: La valeur moyenne de prộcision, rappel selon la mộthode Hu_Dist K=4 K=8 K=16 Moyen Prộcision Rappel Prộcision Rappel Prộcision Rappel Prộcision Rappel 0.65 0.57 0.72 0.60 0.72 0.60 0.70 0.59 0.65 0.57 0.72 0.61 0.72 0.60 0.70 0.59 0.64 0.58 0.70 0.61 0.70 0.61 0.68 0.60 0.61 0.61 0.66 0.63 0.66 0.63 0.65 0.62 0.55 0.71 0.60 0.74 0.59 0.71 0.58 0.72 0.48 0.76 0.54 0.78 0.54 0.74 0.52 0.76 0.46 0.78 0.51 0.80 0.51 0.77 0.49 0.79 0.42 0.81 0.47 0.82 0.49 0.80 0.46 0.81 0.39 0.82 0.44 0.84 0.45 0.83 0.43 0.83 0.37 0.84 0.40 0.85 0.41 0.85 0.39 0.85 0.34 0.90 0.36 0.91 0.38 0.91 0.36 0.90 0.32 0.92 0.34 0.93 0.35 0.92 0.33 0.92 0.29 0.94 0.31 0.94 0.31 0.95 0.30 0.95 0.26 0.96 0.28 0.96 0.28 0.96 0.27 0.96 0.23 0.98 0.25 0.97 0.25 0.97 0.25 0.97 0.21 0.98 0.22 0.98 0.23 0.98 0.22 0.98 0.19 0.99 0.20 0.98 0.21 0.98 0.20 0.99 0.17 0.99 0.19 0.98 0.19 0.99 0.18 0.99 0.16 0.99 0.17 0.99 0.17 0.99 0.17 0.99 0.15 0.99 0.16 0.99 0.16 0.99 0.16 0.99 0.13 0.99 0.15 0.99 0.15 0.99 0.14 0.99 0.13 0.99 0.14 0.99 0.14 0.99 0.14 0.99 0.12 0.99 0.13 1.00 0.14 0.99 0.13 0.99 0.11 1.00 0.13 1.00 0.13 1.00 0.12 1.00 0.11 1.00 0.12 1.00 0.12 1.00 0.12 1.00 NGUYEN Quoc Toan Promotion 13 Page 46 0.8 0.7 Prộcision 0.6 0.5 0.4 0.3 K=4 K=8 K=16 Moyen 0.2 0.1 0 0.2 0.4 0.6 Rappel 0.8 1.2 Figure 23: La courbe de prộcision, rappel selon la mộthode Hu_Dist Seuil dist (%) 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 Table 14 : La valeur moyenne de prộcision, rappel selon la mộthode Hu_Allen K=4 K=8 K=16 Moyen Prộcision 0.72 0.72 0.71 0.67 0.57 0.49 0.46 0.43 0.39 0.36 0.31 0.29 0.26 0.24 0.22 0.20 0.18 0.17 0.15 0.15 0.13 0.13 0.12 0.12 0.11 Rappel Prộcision Rappel Prộcision 0.76 0.75 0.74 0.68 0.59 0.53 0.49 0.46 0.42 0.38 0.34 0.31 0.28 0.26 0.24 0.21 0.20 0.18 0.17 0.16 0.15 0.14 0.13 0.13 0.12 0.65 0.65 0.67 0.73 0.78 0.83 0.85 0.88 0.90 0.92 0.95 0.96 0.97 0.97 0.98 0.98 0.98 0.99 0.99 0.99 0.99 0.99 0.99 1.00 1.00 0.79 0.79 0.77 0.71 0.62 0.56 0.52 0.48 0.43 0.40 0.34 0.32 0.29 0.27 0.24 0.22 0.20 0.19 0.17 0.16 0.15 0.14 0.14 0.13 0.12 0.63 0.64 0.65 0.72 0.77 0.81 0.85 0.87 0.90 0.92 0.95 0.95 0.96 0.97 0.98 0.98 0.98 0.99 0.99 0.99 0.99 0.99 0.99 0.99 1.00 NGUYEN Quoc Toan Promotion 13 Rappel 0.67 0.67 0.69 0.73 0.78 0.81 0.84 0.87 0.90 0.93 0.95 0.96 0.97 0.97 0.97 0.98 0.98 0.98 0.99 0.99 0.99 0.99 0.99 0.99 1.00 Prộcision 0.76 0.75 0.74 0.69 0.59 0.52 0.49 0.46 0.41 0.38 0.33 0.31 0.28 0.26 0.23 0.21 0.19 0.18 0.17 0.16 0.14 0.14 0.13 0.12 0.12 Rappel 0.65 0.65 0.67 0.72 0.78 0.82 0.85 0.88 0.90 0.92 0.95 0.96 0.96 0.97 0.98 0.98 0.98 0.99 0.99 0.99 0.99 0.99 0.99 0.99 1.00 Page 47 0.9 0.8 0.7 Prộcision 0.6 0.5 0.4 0.3 K=4 K=8 K=16 Moyen 0.2 0.1 0 0.2 0.4 0.6 0.8 1.2 Rappel Figure 24: La courbe de prộcision, rappel selon la mộthode Hu_ Allen Seuil dist (%) 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 Table 15: La valeur moyenne de prộcision, rappel selon la mộthode Shape_Allen K=4 K=8 K=16 Moyen Prộcision Rappel Prộcision Rappel Prộcision Rappel Prộcision Rappel 0.74 0.63 0.75 0.63 0.75 0.62 0.75 0.63 0.73 0.64 0.75 0.63 0.75 0.62 0.74 0.63 0.72 0.65 0.74 0.65 0.73 0.64 0.73 0.65 0.67 0.69 0.66 0.69 0.67 0.69 0.67 0.69 0.57 0.75 0.58 0.76 0.59 0.74 0.58 0.75 0.50 0.79 0.52 0.80 0.53 0.78 0.52 0.79 0.46 0.81 0.48 0.82 0.48 0.81 0.47 0.81 0.43 0.84 0.45 0.85 0.45 0.84 0.44 0.84 0.40 0.87 0.41 0.87 0.41 0.87 0.41 0.87 0.37 0.89 0.37 0.90 0.37 0.90 0.37 0.90 0.33 0.92 0.33 0.92 0.33 0.93 0.33 0.92 0.30 0.93 0.31 0.94 0.31 0.94 0.31 0.94 0.28 0.95 0.28 0.95 0.28 0.96 0.28 0.95 0.26 0.96 0.26 0.96 0.26 0.96 0.26 0.96 0.23 0.97 0.23 0.97 0.24 0.97 0.23 0.97 0.21 0.97 0.21 0.98 0.22 0.98 0.21 0.98 0.20 0.98 0.20 0.98 0.20 0.98 0.20 0.98 0.18 0.98 0.19 0.98 0.19 0.99 0.19 0.98 0.17 0.98 0.17 0.99 0.17 0.99 0.17 0.99 0.16 0.99 0.16 0.99 0.16 0.99 0.16 0.99 0.15 0.99 0.15 0.99 0.15 0.99 0.15 0.99 0.14 0.99 0.14 0.99 0.14 0.99 0.14 0.99 0.13 0.99 0.13 0.99 0.13 0.99 0.13 0.99 0.12 0.99 0.13 0.99 0.13 0.99 0.13 0.99 0.12 1.00 0.12 1.00 0.12 1.00 0.12 1.00 NGUYEN Quoc Toan Promotion 13 Page 48 0.8 0.7 Prộcision 0.6 0.5 0.4 0.3 K=4 K=8 K=16 Moyen 0.2 0.1 0 0.2 0.4 0.6 0.8 1.2 Rappel Figure 25: La courbe de prộcision, rappel selon la mộthode Shape_Allen Seuil dist (%) 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 Table 16: La valeur moyenne de prộcision, rappel selon la mộthode Shape_Dist K=4 K=8 K=16 Moyen Prộcision Rappel Prộcision Rappel Prộcision Rappel Prộcision Rappel 0.69 0.58 0.72 0.59 0.75 0.58 0.72 0.58 0.68 0.58 0.72 0.59 0.74 0.58 0.71 0.58 0.67 0.59 0.70 0.60 0.72 0.59 0.70 0.59 0.62 0.62 0.65 0.62 0.69 0.63 0.65 0.62 0.55 0.71 0.57 0.71 0.59 0.71 0.57 0.71 0.49 0.76 0.51 0.75 0.53 0.74 0.51 0.75 0.47 0.78 0.47 0.76 0.49 0.77 0.48 0.77 0.43 0.82 0.44 0.81 0.46 0.81 0.44 0.81 0.40 0.84 0.41 0.84 0.43 0.84 0.41 0.84 0.38 0.85 0.38 0.86 0.39 0.86 0.38 0.86 0.34 0.90 0.34 0.89 0.35 0.90 0.34 0.90 0.32 0.92 0.32 0.91 0.33 0.91 0.32 0.91 0.29 0.93 0.29 0.93 0.29 0.93 0.29 0.93 0.27 0.95 0.27 0.94 0.27 0.95 0.27 0.95 0.24 0.96 0.24 0.96 0.25 0.96 0.24 0.96 0.22 0.97 0.22 0.96 0.22 0.97 0.22 0.97 0.20 0.98 0.20 0.97 0.20 0.98 0.20 0.98 0.18 0.98 0.18 0.98 0.19 0.98 0.18 0.98 0.17 0.99 0.17 0.98 0.17 0.99 0.17 0.99 0.16 0.99 0.16 0.99 0.16 0.99 0.16 0.99 0.14 0.99 0.15 0.99 0.15 0.99 0.15 0.99 0.14 0.99 0.14 0.99 0.14 0.99 0.14 0.99 0.13 0.99 0.13 0.99 0.13 0.99 0.13 0.99 0.12 0.99 0.12 0.99 0.13 0.99 0.12 0.99 0.12 1.00 0.12 0.99 0.12 0.99 0.12 0.99 NGUYEN Quoc Toan Promotion 13 Page 49 0.8 0.7 Prộcision 0.6 0.5 0.4 0.3 K=4 K=8 K=16 Moyen 0.2 0.1 0 0.2 0.4 0.6 Rappel 0.8 1.2 Figure 26: La courbe de prộcision, rappel selon la mộthode Shape_Dist Pour dộterminer la meilleur mộthode dộtiquetage de nuds et darcs, nous dộterminons la meilleure courbe de chaque mộthode selon le nombre de cluster en calculant les valeurs maximale, minimale, moyenne selon la valeur de prộcision et rappel en moyenne est comme suivante : max(methode, k ) = max{moyen( precisionseuil _ dist ) + moyen(rappelseuil _ dist )} min(methode, k ) = min{moyen( precisionseuil _ dist ) + moyen(rappelseuil _ dist )} moyen(methode, k ) = moyen{moyen( precisionseuil _ dist ) + moyen(rappelseuil _ dist )} avec seuil _ dist = 0, 2, 4, 48% k = 4, 8, 16 est le nombre de cluster Dans le tableau 19 reprộsente la comparaison des mộthodes dộtiquetage des nuds et des arcs Dans tous le cas, on peut facilement sapercevoir que la mộthode dộtiquetage de nuds de moment de Hu combinộ lalgốbre dAllen donne de meilleures performances car cette derniốre est plus robuste aux changements dộchelles et de rotations prộsentes dans les plans que nous traitons Table 17: La comparaison des mộthodes d'ộtiquetage des noeuds, des arcs Mộthode Hu_Allen Hu_Dist Shape_Allen Shape_Dist Max 1.45956271 1.33995274 1.38579209 1.32812597 Min 1.12117956 1.11680837 1.11491458 1.11450756 Moyen 1.27001305 1.23320152 1.23832212 1.22058679 NGUYEN Quoc Toan Promotion 13 Page 50 Les meilleurs rộsultats de chaque mộthode Hu_Allen 0.9 Hu_Dist Shapes_Allen Shapes_Dist 0.8 0.7 Prộcision 0.6 0.5 0.4 0.3 0.2 0.1 0 0.2 0.4 0.6 0.8 1.2 Rappel Figure 27: Les meilleurs courbes de chaque mộthode d'ộtiquetage Voici une comparaison de nos rộsultats avec les rộsultats de Marỗal avec les mờmes la base FoorPlan de Mathieu Delalandre, les requờtes de Mathieu aussi et les valeurs de rappel / precision moyennes Table 18: Comparaison nos rộsultats avec les rộsultats de Marỗal [51] Hu_Allen (%) Hu_Dist (%) Shape_Allen (%) Rappel 90.37 87.63 Prộcision 36.63 35.68 Mộthode Marỗal (%) 88.95 Shape_Dist (%) 86.59 34.88 35.45 25.40 86.20 On peut conclure que dans tous le cas, nos rộsultats sont trốs bon ce qui montre la performance de notre approche 6.4 Complexitộ algorithmique Pour le test en classification La correspondance de graphique basộ sur la distance dộdition peut ờtre calculộe en temps de O (n3) dans le pire des cas Pour calculer la distance entre deux graphes G1 et G2 basộ sur lassignement de sous-graphes, nous construisons la matrice des coỷts que chaque ộlộment est comme le coỷt de la distance entre des sous-graphes de longueur l de G1, G2 Nous utilisons l'algorithme de la mộthode hongroise [23] pour rộsoudre ce problốme de trouver la correspondance de coỷt minimum partir de cette matrice de coỷts, dont la complexitộ est en O(n3) oự n est dans notre cas le nombre de sous-graphes Symbol spotting Pour extraire des composantes connexes nous utilisons un algorithme danalyse des composantes connexes qui est une complexitộ linộaire fonction du nombre de pixels contenu dans l'image La phase dextraction des caractộristiques selon le moment de Hu et Shape NGUYEN Quoc Toan Promotion 13 Page 51 statistiques qui est aussi une complexitộ linộaire, le processus de trouver des sous-graphes de plan qui correspondent des symboles graphiques est une complexitộ de O (n1.n23) oự n1 est le nombre de composantes connexes, n2 est le nombre de nuds des sous-graphes NGUYEN Quoc Toan Promotion 13 Page 52 Conclusions Nous avons prộsentộ donc dans ce mộmoire une application de reconnaissance de symbole basộ sur le graphe Chaque nud du graphe reprộsente une composante connexe dans limage de document Ces nuds sont ộtiquetộs automatiquement par lalgorithme de clustering ô k-Mean ằ La relation entre deux composantes connexes est matộrialisộe dans un graphe de ô voisinage ằ par un arc ộtiquetộ automatiquement en utilisant les relations d'Allen bidimensionnelles ou la distance entre composantes connexes Nous extrayons le graphe de plan en des sous-graphes de longueur l Le rộsultat de notre application est ensemble de sous-graphes isomorphisme que la distance entre ces sous-graphes et le graphe de symbole est infộrieur une valeur seuil Nous avons utilisộ les valeurs prộcision et rappelle pour ộvaluer la performance de notre application Les rộsultats obtenus sont assez bien ce qui montrent la pertinence de notre approche Nous avons proposộ une mộthode de mise en correspondance de graphes fondộe sur lassignement de sous-graphes basộe sur la ô distance dộdition ằ PMDED et basộe sur le ô Graphe Probing ằ PMDGP Dans le contexte de classification de graphes, nous avons utilisộ un classifieur de type K-NN pour ộvaluer la performance de notre mộthode de mise en correspondance de graphes fondộe sur lassignement de sous-graphes Nous avons comparộ nos rộsultats obtenues avec dautres approches faisant rộfộrence dans ce domaine Cette ộtude comparative a montrộ que nos rộsultats ộtaient encourageants En effet, nous obtenons des rộsultats similaires comparộs aux systốmes de rộfộrences parfois mờme meilleurs NGUYEN Quoc Toan Promotion 13 Page 53 Rộfộrences [1] Alessandra Serrau, Gian Luca Marcialis, Horst Bunke, and Fabio Roli An experimental comparison of ngerprint classication methods using graphs Graph-Based Representations in Pattern Recognition, pages 281290, 2005 [2] Pierre antoine Champin and Christine Solnon Measuring the similarity of labeled graphs Case-Based Reasoning Research and Development, pages 8095, 2003 [3] Liva Ralaivola, Sanjay Joshua Swamidass, Hiroto Saigo, and Pierre Baldi Graph kernels for chemical informatics Neural Networks, 18(8) :10931110, 2005 [4] Donatello Conte, Pasquale Foggia, Carlo Sansone, and Mario Vento Thirty years of graph matching in pattern recognition International Journal of Pattern Recognition and Articial Intelligence, 18(3) :265298, 2004 [5] M R Garey and David S Johnson Computers and intractability : A guide to the theory of np-completeness ISBN :0716710455, 1979 [6] Andrew D J Cross and Edwin R Hancock Graph matching with a dual-step em algorithm IEEE Trans Pattern Anal Mach Intell , 20(11) :12361253, 1998 [7] Bin Luo and Edwin R Hancock Symbolic graph matching using the em algorithm and singular value decomposition 15th International Conference on Pattern Recognition (ICPR00), pages 21412144, 2000 [8] Yang-Lyul Lee and Rae-Hong Park A surface-based approach to 3-d object recognition using a mean eld annealing neural network Pattern Recognition, 35(2) :299316, 2002 [9] R.S.T Lee and J.N.K Liu Tropical cyclone identication and tracking system using integrated neural oscillatory elastic graph matching and hybrid rbf network track mining techniques Neural Networks, IEEE Transactions on, 11(3) :680689, May 2000 [10] Bruno T Messmer and Horst Bunke A decision tree approach to graph and subgraph isomorphism detection Pattern Recognition, 32(12) :19791998, 1999 [11] Andrew D J Cross and Edwin R Hancock Inexact graph matching with genetic search Advances in Structural and Syntactical Pattern Recognition, pages 150159, 1996 [12] Gordon, A D (1999) Classication Chapman & Hall, 2nd edition [13] Enrique Vidal New formulation and improvements of the nearest neighbour approximating and eliminating search algorithm (aesa) Pattern Recognition Letters, 15(1) :17, 1994 [14] Paolo Ciaccia, Marco Patella, and Pavel Zezula M-tree: An ecient access method for similarity search in metric spaces Proceedings of 23rd International Conference on Very Large Data Bases (VLDB97), pages 426435, 1997 [15] Vidal, E (1994) New formulation and improvements of the nearerst-neighbour approximationg and eliminating search algorithm (AESA) Pattern Recognition Letters, 15(1):1_7 NGUYEN Quoc Toan Promotion 13 Page 54 [16] Horst Bunke and Kim Shearer A graph distance metric based on the maximal common subgraph Pattern Recognition Letters, 19(3-4) :255259, 1998 [17] Michel Neuhaus and Horst Bunke Automatic learning of cost functions for graph edit distance Information Science, 177(1) :239247, 2007 [18] Dzena Hidovic and Marcello Pelillo Metrics for attributed graphs based on the maximal similarity common subgraph International Journal of Pattern Recognition and Artificial Intelligence, 18(3) :299{313, 2004 [19] Antonio Robles-Kelly and Edwin R Hancock Graph edit distance from spectral seriation IEEE Trans Pattern Anal Mach Intell., 27(3) :365{378, 2005 [20] Richard Myers, Richard C Wilson, and Edwin R Hancock Bayesian graph edit distance IEEE Trans Pattern Anal Mach Intell., 22(6) :628{635, 2000 [21] Steven Gold and Anand Rangarajan Graph matching by graduated assignment IEEE transactions on pattern analysis and machine intelligence, pages 239{244, 1996 [22] Hans peter Kriegel and Stefan Schonauer Similarity search in structured data DataWarehousing and Knowledge Discovery, pages 309{319, 2003 [23] Kuhn, H W (1955) The hungarian method for the assignment problem Naval Research Logistics Quarterly, 2(83-87) [24] Kaspar Riesen and Horst Bunke Approximate graph edit distance computation by means of bipartite graph matching Image and Vision Computing, In Press, Corrected Proof , 2008 [25] D Lopresti and G Wilfong A fast technique for comparing graph representations with applications to performance evaluation International Journal on Document Analysis and Recognition, 6(4) :219{229, 2003 [26] Cordella, L.P., Vento, M Symbol recognition in documents: a collection of techniques? International Journal on Document Analysis and Recognition (2000) 7388 [27] Belkasim, S.O., Shridar, M., Ahmadi, M Pattern Recognition with Moment Invariants: A Comparative Study and New Results Pattern Recognition 24 (1991) 11171138 [28] S Belongie, J.M., Puzicha, J Shape matching and object recognition using shape contexts IEEE Transactions on PAMI 24 (2002) 509522 [29] Lin, B.C., Shen, J Fast Computation of Moment Invariants Pattern Recognition 24 (1991) 807813 [30] J Llado, E.M., Jose, J Symbol Recognition by Subgraph Matching Between Region Adjancy Graphs IEEE Transactions on PAMI 23 (2001) 11371143 [31] B.T Messmer and H Bunke Automatic Learning and Recognition of Graphical Symbols in Engineering Drawings In Graphics Recognition Methods and Applications, volume 1072 of Lecture Notes on Computer Science, pages 123134 1996 doi: 10.1007/3-540-61226-2 11 [32] J Lladús, E Martớ, and J Villanueva Symbol Recognition by Error-Tolerant Subgraph Matching between Region Adjacency Graphs IEEE Transactions on Pattern Analysis and Machine Intelligence, 23(10):11371143, 2001 doi: 10.1109/34.954603 NGUYEN Quoc Toan Promotion 13 Page 55 [33] E Barbu, P Hộrroux, S Adam, and E Trupin Using Bags of Symbols for Automatic Indexing of Graphical Document Image Databases In Graphics Recognition Ten Years Review and Future Perspectives, volume 3926 of Lecture Notes on Computer Science, pages 195205 2005 doi: 10.1007/11767978 18 [34] H Locteau, S Adam, E Trupin, J Labiche, and P Hộrroux Symbol Spotting Using Full Visibility Graph Representation In Proceedings of the Seventh International Workshop on Graphics Recognition, GREC07, 2007 [35] R.L Qureshi, J.Y Ramel, D Barret, and H Cardot Spotting Symbols in Line Drawing Images Using Graph Representations In Graphics Recognition Recent Advances and New Opportunities, volume 5046 of Lecture Notes on Computer Science, pages 91103 2008 doi: 10.1007/978-3-540-88188-9 10 [36] S Muller and G Rigoll Engineering Drawing Database Retrieval Using Statistical Pattern Spotting Techniques In Graphics Recognition Recent Advances, volume 1941 of Lecture Notes on Computer Science, pages 246255 2000 doi: 10.1007/3-540-40953-X 21 [37] S Tabbone, L.Wendling, and K Tombre Matching of Graphical Symbols in LineDrawing Images Using Angular Signature Information International Journal on Document Analysis and Recognition, 6(2):115125, 2003 doi: 10.1007/s10032-003-0105-0 [38] S Tabbone and L Wendling Recognition of Symbols in Grey Level Line-Drawings from an Adaptation of the Radon Transform In Proceedings of the Seventeenth International Conference on Pattern Recognition, ICPR04, pages 570573, 2004 doi: 10.1109/ICPR.2004.1334310 [39] A Della Ventura and R Schettini Graphic Symbol Recognition Using a Signature Technique In Proceedings of the Twelveth International Conference on Pattern Recognition, ICPR94, pages 533535, 1994 doi:10.1109/ICPR.1994.577011 [40] W Zhang and L Wenyin A New Vectorial Signature for Quick Symbol Indexing, Filtering and Recognition In Proceedings of the Ninth International Conference on Document Analysis and Recognition, ICDAR07, pages 536540, 2007 doi: 10.1109/ICDAR.2007.4378767 [41] D Zuwala and S Tabbone A Method for Symbol Spotting in Graphical Documents In Document Analysis Systems VII, volume 3872 of Lecture Notes on Computer Science, pages 518528 2006 doi: 10.1007/11669487 46 [42] S Tabbone and D Zuwala An Indexing Method for Graphical Documents In Proceedings of the Ninth International Conference on Document Analysis and Recognition, ICDAR07, pages 789793, 2007 doi: 10.1109/ICDAR.2007.4377023 [43] Khotanzad, A and Hong, Y H (1990) Invariant image recognition by Zernike moments IEEE Transactions on Pattern Analysis and Machine Intelligence, 12(5) :489_497 [44] Kaufmann, L., Rousseeuw, P.J.: Clustering by means of medoids In Dodge, Y., ed.: Statistical Data Analysis based on the L1 Norm and Related Methods, Elsevier Science (1987) 405416 [45] Ramel, J.Y., Vincent, N., Emptoz, H.: A Structural Representation for Understanding Line NGUYEN Quoc Toan Promotion 13 Page 56 Drawing Images International Journal on Document Analysis and Recognition 3(2), 5866 (2000) [46] P Bille A survey on tree edits distance and related problems Theoretical Computer Science, 337(1-3):217{239, 2005 [47] DTP, AIDS antiviral screen (2004), http://dtp.nci.nih.gov/docs/aids/aids data.html [48] M Delalandre, Analyse de documents graphiques : une approche par reconstruction dobjets, Ph.D thesis, Universitộ de Rouen, France, 2005 [49] K Riesen, H Bunke IAM Graph Database Repository for Graph Based Pattern Recognition and Machine Learning Accepted for publication in SSPR 2008 [50] Kuramochi, M and Karypis, G (2001) Frequent subgraph discovery In Proceedings of the 2001 International Conference on Data Mining (ICDM2001), pages 313-320 [51] Marcal Rusinol, 2009, Geometric and Structural-based Symbol Spotting Application to Focused Retrieval in Graphic Document Collections NGUYEN Quoc Toan Promotion 13 Page 57 [...]... la classification et l'indexation d'images de document Cette approche utilise des techniques de fouille de donnộes pour l'extraction de connaissances Les rộsultats sont assez bon et montrent ộgalement montrộ l'approche permettait de rộaliser une indexation des images partir des symboles prộsents, alors mờme que ces symboles sont connectộs d'autres ộlộments Notre approche Notre approche propose un autre... algorithme de ô clustering ằ appliquộ sur un jeu de descripteur de forme et les arcs reprộsentent les relations spatiales entre des composantes connexes (nous utilisons deux types dộtiquetage des arcs : les relations d'Allen bidimensionnelles et les distances entre deux rộgions) NGUYEN Quoc Toan Promotion 13 Page 18 3 Etat de l'art 3.1 Les mộthodes de construction de graphe De nombreuses mộthodes de reconnaissance...2.3 Graphe de distance Dans cette section, nous prộsentons une ộtude de diffộrentes mesures permettant de comparer des graphes Cette ộtude, prenant en considộration les contraintes de coỷt de calcul, permet de justifier notre orientation vers une mesure basộe sur les signatures de graphe Une mesure de dissimilaritộ (ou indice de dissimilaritộ) d est une fonction valeur numộrique permettant de mesurer... coỷt minimal de G1, G2 Donc le coỷt de la meilleure association des nuds de G1 et G2 est 48 2.3.2 Distance entre signatures de graphe ôgraph probing ằ Une technique plus rapide pour ộvaluer la similaritộ des graphes consiste extraire une description des graphes sous forme de vecteur de caractộristiques Cette reprộsentation, appelộe signature de graphe, proposộe par [25], qui peut traiter des graphes contenant... compacte de la base de donnộes du symbole Lidộe principale de cette approche est de trouver les sous-structures communes entre les symboles et afin de reprộsenter les symboles en termes de sous-structures De ce fait, le symbole est divisộ en composants Le plus petit composant ộtant une simple ligne Pour chaque composant, on trouve des isomorphismes de sous-graphe entre ce composant et le dessin Le... solution en quelques secondes pour les modốles graphiques moins de 10 rộgions et la contribution des graphes avec quelques centaines de rộgions Lapproche de Ramel L'idộe principale de cette mộthode est de dộtecter les parties du graphique qui peuvent correspondre des symboles sans connaissance sur le type du document De tels nuds et les arcs constituent le symbole de germe symbol seeds ằ Ensuite,... ou signatures dans des contextes diffộrents) de chaque graphe et de dộcrire les objets comparer en tant que vecteurs A partir de l'idộe originale dans [22] et [24], le coỷt minimum correspondant entre deux ensembles dộlộments, les auteurs ont ộtendu ce modốle des sous graphes, des objets plus complexes et plus discriminants 2.4 Symbol spotting En gộnộrale, le problốme ô Symbole Spotting ằ peut ờtre... distance entre des NGUYEN Quoc Toan Promotion 13 Page 23 rộgions Le problốme reconnaissance de symbole est tournộ en une question disomorphisme de sous graphe, afin de trouver les sous -graphes qui correspondent des symboles graphiques Nous extrayons le graphe de plan en des sous -graphes de longueur l Le rộsultat de notre application est ensemble de sous -graphes isomorphe en fonction de la distance... distance entre les sous -graphes et le graphe de symbole requờte (si la distance est infộrieur une valeur seuil) Nous proposons une mộthode de mise en correspondance de graphes fondộe sur lassignement de sous -graphes de longueur l pour calculer la distance entre deux graphes ô voir la section suivante ằ Lavantage de notre : L'utilisation des moments de Hu et Shapes statistiques assurent que deux composantes... comparables; Deux segments successifs avec un angle relatif loin de 90 ont une probabilitộ plus ộlevộe de faire une partie de symbole; Les symboles sont souvent composộes de segments parallốles; Un symbole est rarement liộe de plus de 3 autres segments; La plus courte des boucles sont souvent correspondant des symboles) [page 4, 33] pour construire le systốme de la reconnaissance de symbole graphique

Ngày đăng: 27/10/2016, 22:55

Mục lục

  • 1.2 Objectif et contribution du stage

  • 2.3 Graphe de distance

    • 2.3.1 Distance d'édition

    • 2.3.2 Distance entre signatures de graphe «graph probing » 

    • 3 Etat de l'art

      • 3.1 Les méthodes de construction de graphe

      • 3.2 Les methodes de mise en correspondances des graphes

      • 4 Une méthode de mise en correspondance de graphes fondée sur l’assignement de sous-graphes

        • 4.1 Définition : Décomposition en sous-graphes

        • 4.2 La correspondance de sous-graphes

        • 4.3 Le coût de fonction (c) pour la correspondance des signatures

        • 4.4 Sous graphe de longueur 

        • 4.5 Construction de matrice de coûts

        • 5 Représentation de l’information contenue dans une image

          • 5.1 Constitution de l'ensemble des nœuds

          • 5.2 Extraction des composantes connexes

          • 5.3.2 Statistique de la forme

          • 5.3.3 Classification non supervisée des caractéristiques morphologiques

          • 5.4 Organisation de l’information : Construction d’un Graphe de voisinage

            • 5.4.1 Relations d'Allen bidimensionnelles

            • 5.4.2 Intervalle basé sur les distances entre deux régions

            • 6.2.2 Pour le Symbol Spotting

Tài liệu cùng người dùng

Tài liệu liên quan