Binarisation d’images de documents graphiques

Institut de la Francophonie pour l’Informatique Laboratoire Lorrain de Recherche en Informatique et ses Applications RAPPORT DE STAGE DE FIN D’ETUDES Sujet : Binarisation d’images de documents graphiques Etudiante : Responsable : NGUYEN Thi Oanh Salvatore TABBONE Promotion 8, IFI Maître de conférences Université de Nancy Hanoi, Vietnam Chercheur l’équipe QGAR, INRIA Lorraine Nancy, France Nancy, juin - novembre 2004 REMERCIEMENTS Je tiens tout d’abord exprimer toutes mes reconnaissances sincères Madame Hélène Kirchner, Directrice du LORIA (Laboratoire Lorrain de Recherche en Informatique et ses Applications) et de l’INRIA Lorraine, pour m’avoir accueillie chaleureusement au sein de son laboratoire, et Monsieur Karl Tombre, responsable de l’équipe QGAR (Querying Graphics through Analysis and Recognition), qui m’a reçue dans son équipe de recherche et m’a donné des conditions favorables pour travailler Je tiens remercier profondément mon responsable, Monsieur Salvatore Tabbone, professeur associé l’Université de Nancy 2, chercheur au LORIA, qui a accepté de diriger mon stage de fin d’études, a aussi consacré beaucoup de temps pour m’aider lors de mon stage Je voudrais remercier particulièrement tous les professeurs l’Institut de la Francophonie pour l’Informatique (IFI) pour leur soutien, ce qui m'a permis de pouvoir bien effectuer mon stage de fin d'études Je remercie également les membres de l’équipe QGAR qui m’ont beaucoup aidée durant mon séjour Nancy Un grand merci tous mes amis l’IFI et au LORIA pour leurs encouragements, leurs aides et la sympathie qu'ils m’ont données tout au long de mon stage J'adresse, enfin, mes remerciements sincères ma famille pour ses stimulations Page RESUME La binarisation des images a suscité beaucoup de travaux de recherche ces dernières décennies Cependant, il n’existe pas une solution idéale qui est affectée tous les différents types d’images Durant mon stage, nous nous sommes intéressés définir une approche de binarisation qui s’applique des documents graphiques Après avoir testé des solutions différentes, nous avons proposé une méthode de binarisation pour l’image de documents niveaux de gris Cette méthode repose sur la coopération entre une approche de seuillage global et une approche de seuillage local La méthode se compose de deux étapes La technique de seuillage global est affectée la première étape et a pour but d’éliminer la partie du fond de l’image La deuxième est basée sur la segmentation hiérarchique floue de Gadi et Benslimane pour rendre l’objet dans l’image plus net Dans cette étape, les traitements sont effectués sur les données des zones de tailles différentes du résultat intermédiaire en prenant le principe de l’arbre quaternaire La classification finale d’un pixel sera déterminée grâce la fonction d’agrégation partir de ses différents degrés d’appartenance qui sont calculés tous les niveaux de l’arbre La méthode proposée a donné des résultats intéressants en appliquant sur l’ensemble des images de test Son efficacité est démontrée par une étude comparative avec d’autres méthodes et par des mesures de performance Mots clés : binarisation local adaptatif, binarisation coopérative, image de documents, arbre quaternaire, sous-ensembles flous, fonction d’appartenance Page ABSTRACT Binarization of the images has been a subject of an intense research interest for a long time However, there is not a perfect solution, which can apply for all the various kinds of images Therefore, during my training course, we define a method working effectively on image of graphic documents After testing different solutions, we propose a binarization method for the gray level image of documents This method is considered to be the cooperation between a global and a local thresholding technique The method presented is based on two stages The global thresholding is used in the first stage to give a preliminary result Then, a second based on the fuzzy hierarchical segmentation refines the result by analyzing local characteristics In this stage, the treatments are carried out on the data zones with different sizes by taking the quadtree principle on the preliminary result The classification of a pixel depends on its final degree of membership calculated from its various degrees determined by the node local information at all quadtree levels The method suggested gives remarkable results by applying it to a set of images that be used tested Its effectiveness is shown in comparing with other methods Keywords: adaptive local thresholding, cooperative binarization, document image, quadtree, fuzzy set, membership function Page TABLE DE MATIERES REMERCIEMENTS RESUME ABSTRACT LISTE DE FIGURES LISTE DE TABLEAUX .6 CHAPITRE : INTRODUCTION .7 1.1 PROBLEMATIQUE .7 1.2 OBJECTIF 1.3 STRUCTURE DU RAPPORT 1.4 LIEU DE STAGE CHAPITRE : ETAT DE L’ART 2.1 GENERALITE 2.1.1 Segmentation 2.1.2 Binarisation .9 2.1.3 Sous-ensemble flou 11 2.2 METHODES DE SEUILLAGE GLOBAL 13 2.2.1 Méthode de Otsu 14 2.2.2 Méthodes se basant sur l’entropie 15 2.3 SEGMENTATION HIERARCHIQUE FLOUE 17 CHAPITRE : METHODE PROPOSEE 20 3.1 PRINCIPE DE LA METHODE 20 3.2 ETAPE DE SEUILLAGE GLOBAL 20 3.3 ETAPE DE RAFFINAGE 21 3.3.1 Construction de l’arbre quaternaire 22 3.3.2 Calcul des degrés d'appartenance de chaque pixel 25 3.3.3 Décision de degré d'appartenance final 26 CHAPITRE : EVALUAT IONS .28 4.1 RESULTATS EXPERIMENTAUX 28 4.2 MESURES DE PERFORMANCE 34 4.2.1 Mesure de contraste .34 4.2.2 Mesure d’homogénéité 35 4.3 AVANTAGES ET INCONVENIENTS 35 CHAPITRE : CONCLUSIONS 37 REFERENCES 38 Page LISTE DE FIGURES Figure 2.1 : Fonction d’appartenance linéaire .13 Figure 2.2 : Fonction S de Zadeh 13 Figure 2.3 : Un problème de la méthode de Gadi et Benslimane .18 Figure 2.4 : Le résultat de la méthode [Gadi,2000] avec h = min(…) .19 Figure 3.1 : Principe de la méthode proposée 20 Figure 3.2 : Image originale – jaures_patie1.tif 21 Figure 3.3 : Image intermédiaire de jaures_patie1.tif 21 Figure 3.4 : Image binaire de jaures_patie1.tif après la première étape 21 Figure 3.5 : Structure tridimensionnelle de l’arbre quaternaire 23 Figure 3.6 : Quadrillage de l’image intermédiaire .25 Figure 3.7 : Résultat final de la méthode proposée sur l’image jaures_partie1.tif .27 Figure 4.1 : Image originale jaures.tif 28 Figure 4.2 : Image originale harchure.tif 28 Figure 4.3 : Image originale plan2.tif 28 Figure 4.4 : Image originale extraire_1.tif 28 Figure 4.5 : Résultats de l’image jaures.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane 30 Figure 4.6 : Résultats de l’image harchure.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane 31 Figure 4.7 : Résultats de l’image plan2.tif en appliquant : 32 Figure 4.8 : Résultats de l’image extrait_1.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane 33 LISTE DE TABLEAUX Tableau 4.1 : Performances quantitatives 35 Tableau 4.2 : Comparaison du temps de calculs 36 Page CHAPITRE : INTRODUCTION 1.1 Problématique Au sein de développements forts de la science, on ne peut pas nier le rôle de l’image numérique, un support important des applications dans de très nombreux domaines tels que la médecine, le multimédia, la robotique Parmi une série d’opérations effectuées sur les images, le traitement d’images est considéré comme une étape de base et indispensable dans toutes ces applications et a suscité de nombreuses recherches Il peut être vu comme préalable la reconnaissance de formes, l’analyse de scènes, l’intelligence artificielle La segmentation, un traitement de base ayant pour but de partitionner l’image en des régions homogènes qui représentent normalement les objets, est un problème classique mais très considéré C’est évident qu’il n’existe pas toujours une solution idéale pour tous les cas Plusieurs solutions ont été proposées pour résoudre ce problème de segmentation d’images du plus général au plus particulier Cependant, chaque méthode a ses avantages et ses inconvénients tels que la manipulation des paramètres [Trier,1995a], la complexité de calcul [Cheng,1999b] [Tao,2003] Problème Dans l’analyse d’images de documents et la reconnaissance de symboles, la binarisation est toujours une des premières étapes utilisées avant l’étape de reconnaissance Elle a donc une grande influence sur la performance des étapes suivantes et sur le résultat final C’est une technique importante dans les applications de traitement d’images Une image de documents graphiques contient généralement du graphique mais également du texte qui sont quelques fois assez proches Le texte risque donc de fusionner des différentes parties du graphique cause du changement faible d’intensité des pixels du fond et ceux de l’objet Recherchant des solutions pour l’image de documents graphiques, nous essayons de trouver une méthode automatique de binarisation simple et efficace qui sépare le fond et l’objet dans des images aux niveaux de gris Remarque Travaillant avec l’image de documents graphiques, nous supposons toujours que l’image contient l’objet noir (des lignes, des textes) sur le fond blanc Page 1.2 Objectif Ce stage se situe dans la problématique de la segmentation d’images et de chercher une méthode simple mais efficace pour l’image de documents graphiques afin de séparer clairement le fond et l’objet Autrement dit, il s’agit de trouver une méthode de binarisation qui peut déterminer automatiquement et efficacement le seuil pour chaque point de l’image 1.3 Structure du rapport Mon rapport se compose de cinq parties Quelques mots d’introduction de mon stage sont dans la première partie La deuxième est consacrée une présentation générale des techniques de segmentation d’images surtout la binarisation Des brèves descriptions de quelques méthodes y sont aussi présentées La troisième partie est dédiée la description détaillée de la méthode proposée L’analyse de résultats et les mesures d’évaluations sont abordées dans la quatrième Ce rapport se termine par la conclusion (cinquième partie) 1.4 Lieu de stage Laboratoire Le LORIA (Laboratoire Lorraine de Recherche en Informatique et ses Applications) est une Unité Mixte de Recherche - UMR7503 – constituée par plusieurs établissements : Centre National de Recherche Scientifique (CNRS), Institut National Polytechnique de Lorraine (INPL), Institut National de Recherche en Informatique et en Automatique (INRIA), Université Henri Poincaré Nancy (UPH), Université Nancy Equipe Mon stage, qui a duré six mois, s’est déroulé au sein de l’équipe QGAR (Querying Graphics through Analysis and Recognition) de l’INRIA lorraine sous la responsabilité de Salvatore Tabbone (Maître de conférences l’université de Nancy 2) C’est une équipe spécialisée dans l’analyse de documents forte composante graphique Les objectifs sont l’indexation et la recherche d’informations dans le contexte de la documentation technique Le site http://www.loria.fr vous fournira des informations plus détaillées sur le laboratoire La présentation plus détaillée de l’équipe se trouve dans les sites webs http://www.loria.fr/equipes/qgar et http://www.inria.fr/recherche/equipes/qgar.en.html Page CHAPITRE : ETAT DE L’ART 2.1 Généralité 2.1.1 Segmentation La segmentation, un traitement essentiel des images, consiste créer une partition de l’image en des sous-ensembles appelés régions Ri Une région est un ensemble de pixels qui possèdent des propriétés communes telles que l’intensité, la texture, etc Le but de la segmentation est d’extraire de l’image originale un certain nombre d’entités différentes appelées objets ou régions Comme c’est extrêmement difficile d’avoir un algorithme idéal qui fonctionne correctement dans tous les cas, des nombreuses méthodes sont proposées En bref, on peut les classifier en deux grandes approches, l’approche « frontière » et l’approche « région » [Horaud,1993] La première, l’approche « frontière », est basée sur la forte variation d’intensité ou sur la discontinuité des propriétés de deux ensembles connexes de points Elle regroupe les techniques de détections de contours En général, cette approche ne conduit pas directement une segmentation de l’image cause de la continuité rare des contours Il faut donc procéder une fermeture de contours si on souhaite une partition complète de l’image Les régions sont définies comme l’intérieur d’une ligne fermée Par contre, des méthodes appartenant l’approche « région » sont construites grâce la similarité des points en évaluant des critères prédéfinis pour les regrouper directement en régions Le seuillage, la croissance de région, la division-fusion sont des exemples de méthodes différentes de segmentation région Il existe également des méthodes qui se basent la fois sur les propriétés des frontières et sur les propriétés de la région, on les appelle approche collaboration « région-frontière » Pour des images de documents graphiques, la valeur d’intensité des pixels appartenant l’objet est assez différente de la valeur d’intensité des pixels appartenant au fond Donc, la technique de seuillage est devenue un outil simple mais efficace dans les applications de traitement d’images de documents Il a attiré de nombreuses recherches ayant pour but de trouver un algorithme qui optimise le seuil tels que les approches dans [Otsu, 1978] [Trier, 1995a] [Cheng,1999b] [Cheriet,1998]… 2.1.2 Binarisation Définition : la binarisation (le seuillage) est la technique de classification la plus simple où les pixels de l’image sont partagés par un seul seuil s en deux classes : ceux qui appartiennent au fond et ceux qui appartiennent la scène (l’objet) L’image est alors Page séparée en deux classes de façon ce que l’information comprise entre et s est retenue et l’autre non, ou vice-versa Soit l’image I (M x N), supposons que f(x, y) représente le niveau de gris du pixel aux coordonnées (x, y), ≤ x ≤ M ,0 ≤ y ≤ N et s est le seuil choisi, les pixels de l’objet sont ceux ayant le niveau de gris inférieur s et les autres ayant le niveau de gris supérieur s sont des pixel du fond Alors, l’image binarisée G est déterminée par les pixels (x, y) dont la valeur est : 1 si g ( x, y) =  0 si f ( x, y ) > s f ( x, y ) ≤ s Selon [Horaud,1993], il existe trois grandes techniques de sélection du seuil s : global, local et dynamique Comme il y a des différentes façons de déterminer le seuil s, il peut être considéré comme une fonction sous forme de s = t (( x, y ), p( x, y ), f ( x, y )) où p(x, y) représente des propriétés locales du point (x, y) Si s ne dépend de que la valeur f(x, y) du point, le seuil est global, s’il dépend en plus de p(x, y), s est un seuil local Et si s dépend la fois de (x, y), de p(x, y) et de f(x, y), on dit le seuil dynamique ou bien adaptatif Dans la méthode de binarisation globale un seuil unique est calculé partir d’une mesure globale sur toute l’image Il nous permet de décider l’appartenance d’un pixel l’objet ou au fond Les méthodes de Otsu [Otsu,1978], de Kapur [Kapur,1985], de Pun [Pun,1980], ou de Cheng et Chen [Cheng, 1998b] peuvent être tenues comme des représentants de cette approche Chacun a de différentes stratégies pour atteindre leur but Par exemple, la méthode décrite dans [Otsu,1978] essaie de maximiser la variance entre deux classes, tandis que d’autres méthodes dans [Kapur,1985] [Pun,1980] [Cheng,1998b] [ Mello,2000] se basent sur la théorie de maximum d’entropie ou d’entropie floue Pour la binarisation locale, la classification d’un pixel dépend non seulement du pixel soi-même mais aussi de ses informations locales Dans [Cheng,1999b], c’est la moyenne des pixels du voisinage qui est prise en compte lorsqu’on construit l’histogramme de deux dimensions Dans [Cheng,1998a], les informations locales sont inclues dans le homogramme qui indique le degré d’homogénéité correspondant chaque niveau de gris dans l’image La détermination du seuil se base sur cet homogramme Sachant l’importance des informations du voisinage pour la classification, Sue Wu et Adnan Amin [Wu,2003] proposent une méthode de seuillage en deux étapes pour l’image de documents Après l’étape de seuillage global sur l’image entière, le seuillage sur des sous-images qui contiennent des composants connectées est effectué La méthode donne de bons résultats sur l’ensemble des images d’enveloppe postale Page 10 Figure 3.6 : Quadrillage de l’image intermédiaire 3.3.2 Calcul des degrés d'appartenance de chaque pixel À chaque nœud de l’arbre, si la région correspondante n’est pas homogène, la théorie de l’ensemble flou sera appliquée pour la classification de ses données en deux sous-ensembles flous F (fond) & O (objet) en évaluant leurs degrés d’appartenance Cela signifie que ces degrés d’appartenance la classe objet µ Ok ( x, y) et la classe fond µ Fk ( x, y) de chaque pixel sont calculés pour chaque niveau k de l’arbre Etant une fonction a l plus souvent utilisée, la fonction S de Zadeh est prise calculer le degré d’appartenance la classe fond d’un pixel Supposons que µ F ( x, y) et µ O ( x, y) sont successivement le degré d’appartenance la classe objet et celui la classe fond du pixel (x, y) ayant le niveau de gris g I ( x, y) , ils sont déterminés comme suivant :   (g ( x, y ) − a )   2 I ( c − a )    µ F ( x, y ) = S Z ( g I ( x , y ); a, b, c ) =   1 − 2 ( g I ( x, y ) − c )  ( c − a )    µ O ( x , y ) = Z Z ( g I ( x, y ); a , b , c ) = − S Z ( g I ( x , y ); a , b , c ) g I ( x, y ) ≤ a a < g I ( x, y ) ≤ b b < g I ( x, y ) ≤ c c < g I ( x, y ) b = (a + c ) / Pour les estimations des paramètres a, b, c, on prend des propriétés locales des régions (des noeuds) Sur l’intervalle dynamique de la région, l’intervalle (moyenne – écart-type, moyenne + écart-type) est considéré comme la bande d’incertitude Alors, le Page 25 degré d'appartenance est absolu dans toute la bande des niveaux de gris sauf l’intervalle floue Et les degrés d'appartenance d'un pixel (x, y) au niveau k sont déterminés par : µ Fk ( x , y) = S Z ( g R ( x, y ); m − σ , m , m + σ ); µ Ok ( x , y ) = − µ Fk ( x, y ) où m et s sont la moyenne et l'écart-type calculés sur une sous-image correspondante un noeud au niveau k 3.3.3 Décision de degré d'appartenance final Après avoir calculé les degrés d'appartenance d'un pixel tous les niveaux, il faut prendre une décision : parmi eux quelle est la valeur qui va décider la classification du pixel ? ( µ Of ( x, y ) = h µ O0 ( x , y ), µ 1O ( x , y ), , µ Ol ( x, y ) ) On s’intéresse tout d’abord au degré d’appartenance du pixel l’objet Comme les données traitées dans cette étape contiennent essentiellement des pixels de l’objet, on doit assurer la qualité de l’objet obtenu la fin Si la fonction (tnorme de Zadeh) est choisie, la valeur la plus faible de tous les niveaux est rendue comme la mesure d’appartenance du pixel l’objet Dans ce cas, Il risque de perdre une partie de l’objet où l’intensité du niveau de gris est forte (plus claire) Tandis que si l’on utilise la fonction max (t-conorme de Zadeh), les pixels de l’objet sont bien conservés et la fois les faux pixels la frontière objet-fond sont effacés La raison, c’est que on a laissé, pour chaque pixel, la possibilité maximale d’appartenance l’objet comme le degré d’appartenance final Par conséquent, la fonction t-conorme de Zadeh qui rend la valeur la plus grande est choisie pour déterminer le degré d’appartenance final l’objet : ( ) ( µ Of ( x, y ) = h µ O0 ( x , y ), µ 1O ( x , y ), , µ Ol ( x , y ) = max µ O0 ( x, y), µ O1 ( x, y), , µ Ol ( x, y) ) Et le degré d’appartenance d’un pixel au fond sera : µ Ff ( x, y ) = − µ Of ( x, y) Alors, un pixel (x, y) va appartenir la classe fond F si µ Ff ( x, y ) > µ Of ( x, y) et sinon il est mis comme un pixel de l'objet Donc, le résultat final I F : { } I F = ( x , y ), x = 0, M − 1, y = 0, N − 1, g F ( x, y ) ∈ {0,255}  µ Ff ( x, y ) ≤ µ Of ( x, y ) g F ( x, y ) =  255 µ Ff ( x , y) > µ Of ( x , y ) Page 26 Figure 3.7 : Résultat final de la méthode proposée sur l’image jaures_partie1.tif Page 27 CHAPITRE : EVALUATIONS 4.1 Résultats expérimentaux Implémentation : - Le langage de programmation : C++ - L’environnement : LINUX - La mode d’exécution : commande en ligne La méthode proposée a été implémentée et testée avec un ensemble des images de documents graphiques existant dans la bibliothèque de l’équipe Les résultats obtenus sont satisfaisants Dans cette partie, on présente quelques résultats obtenus par comparaison d’autres méthodes Images originales : Figure 4.2 : Image originale harchure.tif Figure 4.1 : Image originale jaures.tif Figure 4.3 : Image originale plan2.tif Figure 4.4 : Image originale extraire_1.tif Page 28 Images résultats Des résultats de la méthode proposée et ceux de la méthode de binarisation en utilisant la principe de maximum d’entropie [Cheng,1998b] et de la méthode de Gadi et Bensilimane [Gadi,2000] sont présentés ci-dessous Nous remarquons que les images c) dans les figures de 4.5 4.8 sont des résultats obtenus par la méthode de Gadi et Benslimane avec un changement : la fonction d’agrégation est t-norme (min) de Zadeh a) Page 29 b) c) Figure 4.5 : Résultats de l’image jaures.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane Page 30 a) b) c) Figure 4.6 : Résultats de l’image harchure.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane Page 31 a) b) c) d) Figure 4.7 : Résultats de l’image plan2.tif en appliquant : a) la méthode propos ée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane ; d) la méthode de Trier et Taxt [Trier,1995a] Page 32 a) b) c) Figure 4.8 : Résultats de l’image extrait_1.tif en appliquant : a) la méthode proposée ; b) la méthode de Cheng et Chen ; c) la méthode de Gadi et Benslimane Page 33 Dans la figure 4.5a), on a obtenu clairement des lignes et chiffres Le fond entre les lignes proches est bien détecté Tandis que dans la figure 4.5b) les lignes, les textes ne sont pas distingués Dans la figure 4.5c) il y a des faux pixels classés l’objet, et les bords de l’objet ne sont pas lisses La méthode proposée a bien éliminé des bruits sur le fond et rendu un résultat vraiment net dans la figure 4.6a) La méthode dans [Cheng,1998b] a mise des bruits comme l’objet (figure 4.6b) ) Des fautes de binarisation apparaîtrent dans la figure 4.6c) et 4.7c) Le résultat de Trier et Taxt dans 4.7d) serait le meilleur parmi les résultats (figure 4.7a) b) et c)) si une zone solide de l’objet n’est pas disparue Dans les figures 4.8c) et 4.8a), l’objet est bien détecté Cependant, le résultat dans 4.8c) est plus claire La raison ici, c’est que le fond sur l’image originale extrait_1.tif est déjà tout fait homogène 4.2 Mesures de performance Pour examiner l’efficacité de la méthode proposée, on l’évalue sur deux critères qualitatifs des résultats obtenus Ce sont deux critères de base dans la segmentation des images Le premier, c’est le contraste entre des classes Le deuxième critère qu’il faut tenir compte est l’homogénéité Dans cette partie, on va prendre ces deux critères pour faire une comparaison entre la méthode proposée avec quelques autres méthodes existant tel que la méthode de Otsu, la méthode de Gadi et Benslimane, la méthode de Trier et Taxt [Trier,1995a] Les deux mesures de performance proposées par Levine & Nazif sont utilisées pour quantifier le contraste et l’homogénéité [Tabbone,2003]: 4.2.1 Mesure de contraste CI = ∑m Ri ∈I F − m Ri # Régions = m F − mO Où : m F : la moyenne des valeurs des pixels appartenant au fond mO : la moyenne des valeurs des pixels appartenant l’objet m Ri : la moyenne des valeurs des pixels dans la région Ri #Régions : le nombre de régions dans l’image sans compter le fond La valeur de CI indique le contraste entre les deux classes fond et objet Plus la valeur de CI est grande, plus le contraste entre deux régions est élevé Page 34 4.2.2 Mesure d’homogénéité ∑ (g (x , y ) − m ) O H I = σ objet = ( x, y )∈objet Card (objet ) où : Card (objet) est le nombre des pixels dans la classe objet La valeur HI indique le degré d’homogénéité dans les régions Dans ce cas, c’est l’homogénéité des pixels dans la classe objet On constate que plus cette valeur est petite, plus la région est homogène Dans le tableau 4.1 ci-dessous, les mesures de contraste et les mesures d’homogénéité des résultats correspondant la méthode proposée et ceux de Otsu, de Gadi & Benslimane, et de Trier & Taxt sont indiquées : proposée Méthode Trier & Taxt Méthode de Benslimane Méthode de Otsu Méthode de Mesure d'homogénéité proposée Méthode Trier & Taxt Méthode de Benslimane Méthode de Otsu Méthode de Mesure de contraste Jaures.tif 96.5696 92.8239 108.962 23.4738 29.9696 14.7079 hachures.tif 145.458 135.453 150.088 29.1459 30.6727 14.7696 plan2.tif 130.191 124.822 149.366 39.1952 44.264 Extrait_1.tif 131.427 141.778 32.539 35.7397 128.505 118.183 48.8416 25.5288 20.6122 Tableau 4.1 : Performances quantitatives Ce tableau a montré des avantages de notre méthode 4.3 Avantages et inconvénients Avantages A travers des tests, notre méthode a démontré son efficacité dans la binarisation des images de documents graphiques C’est une bonne solution pour résoudre le problème de classification des pixels dans la zone floue la frontière fond-objet De plus, la complexité temporelle de la méthode proposée n’est pas trop grande On ne peut pas faire des comparaisons avec les méthodes de seuillage global comme Otsu Page 35 mais il y a une grande différence du temps d’exécution entre la méthode proposée et la méthode de Gadi et Benslimane [Gadi,2000] Les chiffres montrés dans le tableau 4.2 sont les temps d’exécution de deux méthodes quand on les exécute sur la même machine avec les mêmes images Tailles d’images Méthode proposée Méthode de Gadi et Benslimane 1148 x 841 (jaures.tif) 0.70s 2.13s 3421 x 2512 6.06 s 21 s Tableau 4.2 : Comparaison du temps d’exécution Inconvénients Néanmoins, le résultat final de cette méthode dépend du résultat de l’étape de seuillage global Donc, si la première étape ne peut pas conserver l’objet entier dans l’image, aucune opération ne peut donner un bon résultat final Observant l’image originale et le résultat dans la figure 4.8a), on trouve que le fond de l’image originale est vraiment uniforme et le résultat de la première étape est déjà parfait La binarisation de cette image n’a pas besoin de la deuxième étape Alors, le résultat final est moins bien que le résultat intermédiaire Il risque de perdre des points de l’objet Malheureusement, on n’avait pas encore trouvé une solution pour vérifier la nécessité de cette étape En principe, la vérification d’homogénéité de l’ensemble ORi au sens que la variance est faible peut être une solution Cependant, le test d’homogénéité de façon automatique pour une région de l’image est encore un problème ouvert Page 36 CHAPITRE : CONCLUSIONS Pendant la durée de stage de six mois, j’ai fait des études sur les techniques de segmentation d’images surtout la technique de binarisation et essayé de proposer, sous des suggestions de mon responsable, une méthode de binarisation pour l’image de documents graphiques Après l’échec de quelques tests, une méthode de binarisation coopérative en deux étapes a été proposée Les résultats expérimentaux obtenus sur des images de documents graphiques en terme de séparation l’objet et le fond sont prometteurs Nous avons, également, fait des études comparatives de notre méthode avec d’autres comme celle de Otsu, la méthode se basant sur l’entropie floue de Cheng et Chen et la méthode de Gadi et Benslimane De plus, la complexité de la méthode n’est pas grande en temps de calcul par comparaison la méthode de Gadi sur laquelle la méthode proposée se base Néanmoins, lorsque l’image issue de la première étape est trop homogène (i.e variance très faible) le résultat issu de la deuxième se dégrade car la condition d’arrêt liée la construction de l’arbre quaternaire n’est plus vérifiée Dans ce cas, pour chaque sous région Ri, il faut examiner l’homogénéité des pixels dans ORi avant de vérifier la condition de découpage pour éviter une fausse binarisation Un seuil prédéfini pour la variance est peut-être une solution pour le test d’homogénéité d’un ensemble, cependant le problème réside dans le choix du seuil On recherchera donc une méthode qui peut définir automatiquement le seuil pour chaque ensemble ou bien vérifier automatique son homogénéité Actuellement, en terme de complexité temporelle, l’essentiel des temps de calculs se focalisent sur les calculs des moyennes et des écart-types de tous les nœuds dans l’arbre Alors si on peut augmenter la performance des ces calculs, le temps d’exécution aura des diminutions considérables Le choix d’une structure de données plus appropriée sera une de nos premières priorités en terme de perspective de recherche Page 37 REFERENCES [Braviano,1995] Gilson Braviano « Logique floue en segmentation d'images: seuillage par entropie et structures pyramidales irrégulières », thèse de doctorat l'Université Joseph Fourrier-Grenoble Octobre 1995 [Cheng,1998a] H.D Cheng, C H Chen, H.H Chiu and Huijuan Xu «Fuzzy Homogeneity Approach to Multilevel Thresholding » IEEE Transactions on Image Processing, vol 7, n 7, July 1998 [Cheng,1998b] H.D Cheng, Jim-Rong Chen and Jiguang Li « Threshold selection based on fuzzy c-partition entropy approach » Pattern Recognition, vol 31, No 7, pp 857-870, 1998 [Cheng,1999a] H D Cheng, Yen-Hung Chen, Ying Sun « A novel fuzzy entropy approach to image enhancement and thresholding » Signal Processing 75, pp.277-301, 1999 [Cheng,1999b] H.D Cheng, Yen-Hung Chen « Fuzzy partition of two -dimensional histogram and its application to thresholding » Pattern Recognition, vol.32, pp.825-843, 1999 [Cheriet,1998] M Cheriet, J N Said, C.Y Suen «A recursive thresholding technique for image segmentation » IEEE Transactions on Image Processing, vol 7, n.6, June 1998 [Gadi, 2000] T.Gadi, R Benslimane « Fuzzy hierarchical segmentation » Traitement du signal, vol.7, n°1, 2000 [Horaud, 1993] R Horaud, O Monga Vision par ordinateur – outils fondamentaux Editions Hermès, 1993 [Kapur, 1985] J.N Kapur, P.K Sahoo, A.K.C Wong « A New method for gray-level picture threshold using the entropy of the histogram ».Graphical Models and Image Processing, 29, 1985 [Kunt, 1993] Murat Kunt, Goesta Grandlund, Michel Kocher «Traitement numérique des images », vol.2, 1993 [Mello, 2000] Carlos A.B Mello and Rafael D Lins « Image segmentation of historical documents » http://www.upe.poli.br/dsc/recpad/site_hist/visual2000.pdf [Otsu, 1978] N.Otsu « A threshold selection method from grey-level histograms » IEEE Trans Syst Man Cybern., vol.SMC-8, 1978 [Pun, 1980] T.Pun « A New method for gray-level picture threshold using the entropy of the histogram » Signal processing, vol.2, n°3, 1980 Page 38 [Tabbone,2003] Salvatore Tabbone, Laurent Wendling « Multi-scale binarization of images » Pattern Recognition Letters, v.24 n.1-3, p.403-411, January 2003 [Tao,2003] Wen-Bing Tao, Jin-Wen Tian, Jian Liu « Image segmentation by three-level thresholding based on maximum fuzzy entropy and genetic algorithm », Pattern Recognition Letters, vol 24, issue 16, pp.3069-3078, December 2003 [Trier,1995a] Øivind Due Trier and Torfinn Taxt « Improvement of « Intergrated Function Algorithm » for binarization of document images » Pattern Recognition Lettres, vol 16, n° 3, March 1995 [Trier, 1995b] Øivind Due Trier and Torfinn Taxt “Evaluation of Binarisation Methods for Document Images” IEEE, Transactions on PAMI, vol 17, number 3, March 1995 [Wu,2003] Sue Wu, Adnan Amin « Automatic thresholding of grey-level using multi-stage approach », th International Conference on Document Analysis and Recognition, vol.1, August 2003 [NIST,ehandbook] NIST/SEMATECH e-Handbook of http://www.itl.nist.gov/div898/handbook/index.htm Page 39 Statistical Methods, [...]... un nombre de pixels de niveau de gris correspondant son indice Il permet de fournir effectivement une estimation de la densitộ de probabilitộ des valeurs des pixels sur limage observộe h (i ) = ni , i = 0, L 1 , oự ni le nombre de pixels de niveau de gris i dans limage 2.2.1 Mộthode de Otsu Le principe de la mộthode de Otsu est de trouver un seuil optimal qui maximise la diffộrence entre deux classes...La mộthode de Trier et Taxt [Trier,1995a] et celle de Gadi et Benslimane [Gadi,2000] peuvent ờtre considộrộes comme deux exemples de technique de seuillage locale adaptative Dans [Trier,1995a], les auteurs ont appliquộ des modifications sur la mộthode de White & Rohrer afin dobtenir une bonne mộthode de binarisation pour limage de documents Une de leurs modifications est la faỗon de classifier des pixels... des rộsultats correspondant la mộthode proposộe et ceux de Otsu, de Gadi & Benslimane, et de Trier & Taxt sont indiquộes : proposộe Mộthode Trier & Taxt Mộthode de Benslimane Mộthode de Otsu Mộthode de Mesure d'homogộnộitộ proposộe Mộthode Trier & Taxt Mộthode de Benslimane Mộthode de Otsu Mộthode de Mesure de contraste Jaures.tif 96.5696 92.8239 108.962 23.4738 29.9696 14.7079 hachures.tif 145.458... montrộ des avantages de notre mộthode 4.3 Avantages et inconvộnients Avantages A travers des tests, notre mộthode a dộmontrộ son efficacitộ dans la binarisation des images de documents graphiques Cest une bonne solution pour rộsoudre le problốme de classification des pixels dans la zone floue la frontiốre fond-objet De plus, la complexitộ temporelle de la mộthode proposộe nest pas trop grande On ne... Rộsultats de limage harchure.tif en appliquant : a) la mộthode proposộe ; b) la mộthode de Cheng et Chen ; c) la mộthode de Gadi et Benslimane Page 31 a) b) c) d) Figure 4.7 : Rộsultats de limage plan2.tif en appliquant : a) la mộthode propos ộe ; b) la mộthode de Cheng et Chen ; c) la mộthode de Gadi et Benslimane ; d) la mộthode de Trier et Taxt [Trier,1995a] Page 32 a) b) c) Figure 4.8 : Rộsultats de limage... faire des comparaisons avec les mộthodes de seuillage global comme Otsu Page 35 mais il y a une grande diffộrence du temps dexộcution entre la mộthode proposộe et la mộthode de Gadi et Benslimane [Gadi,2000] Les chiffres montrộs dans le tableau 4.2 sont les temps dexộcution de deux mộthodes quand on les exộcute sur la mờme machine avec les mờmes images Tailles dimages Mộthode proposộe Mộthode de Gadi... distribution de probabilitộ de lobjet Pt et la distribution de probabilitộ du fond (1 - Pt ) sont prises en compte en dộterminant lentropie de la partition Mộthode de Cheng et Chen [Cheng,1998b]: Diffộrant de ces deux mộthodes prộcộdentes, lentropie dune partition est calculộe en prenant des probabilitộs doccurrence de sous-ensembles (objet et fond) La thộorie de sous-ensembles flous est comptộe de plus... dagrộgation min est pris au lieu de max lộtape de dộcision Page 18 Figure 2.4 : Le rộsultat de la mộthode [Gadi,2000] avec h = min() Page 19 CHAPITRE 3 : METHODE PROPOSEE 3.1 Principe de la mộthode Lhistogramme de limage de document contient deux modes : une forte correspondant au fond et une faible correspondant lobjet Cependant ce qui est important est celui de lobjet Une mộthode de seuillage global peut... max() Figure 2.3 : Un problốme de la mộthode de Gadi et Benslimane En considộrant des images de documents graphiques, on constate que sil ny pas de grande variation dintensitộ des pixels appartenant lobjet et pour diminuer leffet nộgatif du dộcoupage, lopộrateur dagrộgation min() est plus convenable que lopộrateur max (figure 2.4) Alors, quand on fait des tests sur limage de documents, lopộrateur dagrộgation... le nombre de pixels dans chaque sous image Xjk : le niveau de gris du k ốme pixel de la sous-image j p : le degrộ de libertộ, dans ce cas, p = 3 = le nombre de sous ensemble 1 n : le nombre total de pixels de l'image mốre = 4K : le niveau de confiance (confidence level) Les valeurs de la distribution F sont indiquộes dans un tableau de Fisher La dộcision d'homogộnộitộ d'une rộgion dộpend de la comparaison

Định dạng
Số trang	39
Dung lượng	2,4 MB