INTRODUCTION
M OTIVATION
On peut constater que le climat global change de jour en jour, cela provoque l’augmentation des catastrophes naturelles complexes dans tout le monde, elles causent beaucoup de dégâts sérieux pour l’humain Des coordinations efficaces des équipes de secours peuvent diminuer considérablement les dégâts surtout les morts C’est pour cette raison qu’il est nécessaire d’avoir un bon système d’aide à la décision dans une situation de post-catastrophe naturelle
D’ailleurs, il y a actuellement plusieurs travaux sur la recherche d’images par le contenu mais pas beaucoup de travaux sur la recherche d’image se basant en même temps sur les informations du contenu de l’image et sur les informations de localisation géographique Les travaux existants sont appliqués surtout dans les applications de tourisme, le cas de l’aide à la décision pour les secours comme dans le projet IDEA reste une application nouvelle.
O BJECTIFS
Les objectifs de ce travail de stage sont :
• Construire une base d’images de sinistres différents
• Simuler les informations géographiques pour ces images
• Dộterminer une faỗon pour organiser les informations des images dans deux espaces de contenu visuel et de l’information géographique pour pouvoir manipuler ensemble ces deux espaces afin de trouver les situations d’urgences et d’attribuer un niveau d’urgence pour chaque image
• Proposer une faỗon pour dộterminer un niveau d’urgence pour chaque sinistre en se basant sur la proximité des situations similaires et sur l’importance des monuments autour de chaque sinistre
Pour vérifier et valider le modèle, il faut donner des scénarios différents pour IDEA qui identifient et décrivent des situations ó on peut montrer un intérêt de rechercher des images en combinant localisation et contenu image et faire des tests basés sur ces scénarios.
C ONTRIBUTION
En combinant les images de feux provenant du TPE de l’étudiant BUI The Quang de la promotion 14 de l’IFI avec les images trouvộes sur l’internet sous licence ô Crộative Commons ằ, j’ai dộjà construit une base d’images de cinq types de sinistres diffộrents (feux, bâtiments endommagés, routes endommagées, blessés et inondations) pour IDEA, chaque type contient de 300 à 350 images J’ai aussi simulé les informations de localisation géographique pour ces images en attribuant pour chaque image des coordonnées de latitude et de longitude, les coordonnées pouvant être attribuées soit au hasard, soit selon les groupes de proximité
Dans le cadre de ce stage, on a implémenté avec succès la structuration par partitionnement des données SR-Tree [2] pour organiser les descriptions du contenu visuel des images et les descripteurs externes d’informations géographiques des images pour faciliter et accélérer la recherche des images similaires dans l’espace du contenu et le calcul de la proximité entre des situations dans l’espace de localisation géographique en évitant des comparaisons exhaustives avec tous les éléments de la base D’ailleurs, dans la phase d’attribution d’un niveau d’urgence pour chaque image de sinistre, on considère non seulement la proximité des situations similaires mais aussi les descriptions symboliques des monuments à proximité des sinistres (hôpital, maison, bâtiment, école) qui sont utilisées souvent dans les systèmes d’informations géographiques (SIG).
E NVIRONNEMENT DE STAGE
Ce stage est réalisé au Laboratoire Informatique, Image et Interaction (L3I) de l’Université de La Rochelle, France dans le contexte du projet de recherche IDEA (Images of natural Disasters from robot Exploration in urban Area) [1] financé par le programme STC-Asie (MAE/CNRS/INRIA) L’IFI et l’université de La Rochelle sont deux partenaires du projet Avec l’objectif de développer un système d’aide à la décision utilisant le traitement d’images et la vision par ordinateur dans des situations de post- catastrophe naturelle, ce projet se concentre à quatre thèmes principaux : localisation dans une ville à partir des indices des images ; détermination de l’état de dommage des bâtiments et des infrastructures ; détection de l’état des victimes humaines et aide à la décision basée sur les images Le travail de ce stage appartient surtout au dernier thème.
ETAT DE L’ART
I NDEXATION MULTIDIMENSIONNELLE
Les techniques principales d’indexations multidimensionnelles visent à regrouper les descripteurs de base et à les englober dans des cellules faciles à manipuler (hiérarchie)
[3] Cela nous permet d’éviter de considérer tous les descripteurs dans la base lors d’une recherche en considérant seulement les groupes ou les paquets les plus pertinents et enfin, on travaille seulement avec les descripteurs dans les paquets sélectionnés
Il y a deux grandes catégories de techniques de création de cellules : partitionnement des données et partitionnement de l’espace.
Les techniques de partitionnement de données créent des cellules en se basant sur la distribution des descripteurs et leur proximité relative dans l’espace Dans cette catégorie, on trouve des techniques comme B-tree, la famille R-tree[5][6][7], SS-tree[8], SR-tree[2], X-tree [4], etc a B-tree : Balanced-tree (Bayer et McCreight, 1972) [3]
C’est un arbre balancé qui nous permet de structurer des données selon l’une des dimensions Un nœud qui n’est pas la racine d’un arbre B-tree d’ordre m contient entre m/2 et m nœuds fils Toutes les feuilles sont au même niveau et contiennent l’information
Un nœud quelconque qui a k nœuds fils a k-1 éléments en ordre croissant qui sont les valeurs de séparation divisant les valeurs de l’axe choisi des nœuds fils
Pour la recherche, on part de la racine Cette structure nous permet de vérifier s’il existe ou non un élément dans la base, mais elle ne convient pas pour trouver les éléments qui sont proches d’une entrée quelconque parce que chaque nœud interne contient seulement les valeurs de séparation selon un seul axe b La famille R-tree : Rectangle-tree [3][5][6][7]
Dans la famille R-tree, on trouve trois structures R-tree [5], R+-tree[6] et R*- tree[7] L’idée de base de cette approche est l’indexation des objets spatiaux par des rectangles englobants minimums Dans le contexte de l’indexation multidimensionnelle, on utilise des rectangles englobants multidimensionnels (hyper-rectangle) Le principe de cette famille est l’hiérarchie d’hyper-rectangles englobants et non-disjoints correspondant à la distribution des données par un arbre équilibré, les données étant au niveau des feuilles [3]
Un arbre R-tree a les propriétés suivantes [5] :
• Au niveau des feuilles, le rectangle englobant est le rectangle minimum recouvrant les vecteurs de données appartenant à ce nœud Chaque nœud feuille contient au maximum M et au minimum m≤M/2 éléments de données
• Tous les nœuds, sauf la racine, qui ne sont pas des feuilles ont entre m et M nœuds fils ; le rectangle englobant de ces nœuds est le rectangle minimum qui englobe les rectangles englobants des nœuds fils
• Le nœud racine a au moins deux fils sauf quand il est une feuille Le rectangle englobant du nœud racine recouvre tous les vecteurs de données de la base
• Toutes les feuilles sont au même niveau
Un rectangle englobant est déterminé par deux points S(s1,s2,…,sn) et T(t1,t2,…,tn) ; pour chaque élément X(x1,x2,…,xn) appartenant à ce rectangle, on a : si≤ xi≤ ti avec ∀i ∈ [1,n]
Pour rechercher toutes les données appartenant à un rectangle Q quelconque, on réalise la recherche à partir du nœud racine, en descendant aux nœuds fils qui ont le rectangle englobant intersectant le rectangle et ainsi de suite jusqu’à ce qu’on rencontre les nœuds feuilles Au niveau des nœuds feuilles, on retourne toutes les données appartenant au rectangle Q
La création d’un arbre R-tree est réalisée en ajoutant au fur et à mesure des vecteurs dans l’arbre L’algorithme exact pour l’insertion d’un nouvel élément (vecteur) dans l’arbre est dans [5] ; l’idée principale est de partir du nœud racine, puis de descendre pour trouver la feuille ó ajouter le nouvel élément A chaque nœud, on choisit le nœud fils avec le rectangle englobant le plus petit Lorsqu’on trouve une feuille pour ajouter l’élément, s’il est plein, on doit le diviser en deux feuilles différentes en minimisant la surface totale des deux nouveaux rectangles englobants (division exhaustive, cỏt quadratique ou linéaire [5]) Le rectangle englobant de chaque nœud est créé et mis à jour au cours de l’insertion des éléments dans l’arbre pour qu’il soit le rectangle le plus petit possible qui recouvre tous les éléments dans le sous-arbre de ce noeud
La structure R-tree est dédiée à la recherche par intervalles, elle convient pour l’indexation des données spatiales Lors de la recherche, on peut gagner du temps car on ne doit pas considérer tous les éléments dans la base, on considère seulement les nœuds fils ayant le rectangle englobant qui intersecte l’intervalle entré Mais la possibilité d’intersection entre les rectangles augmente quand le nombre de dimensions est grand
Dans ce cas, le parcours séquentiel peut être plus efficace
Les structures R+-tree [6] et R*-tree [7] sont données pour optimiser la recherche en minimisant le chevauchement des rectangles englobants La structure R+-tree évite le recouvrement entres les rectangles en divisant chaque rectangle qui recouvre un autre rectangle en plus petits rectangles jusqu’à ce qu’il n’y a plus de recouvrement Cela peut faire augmenter la hauteur de l’arbre mais on peut gagner du temps en réduisant le nombre de sous-arbres à visiter La structure R*-tree minimise le recouvrement entre les rectangles et minimise aussi le volume des rectangles en appliquant, quand on veut ajouter un nouveau fils à un nœud plein, le mécanisme de réinsérer quelques nœuds fils du nœud plein avant de le diviser en deux avec l’espoir de trouver des meilleurs positions pour les nœuds à réinsérer R*-tree est la structure ayant le plus de succès dans la famille R-tree [7][2] Les expérimentations [7] montrent qu’un SR-tree peut être utilisé efficacement pour l’organisation des données multidimensionnelles et des données spatiales c SS-tree : Similarity Search Tree (1996) [3][8]
Le SS-tree [8] est une structure d’indexation de similarité qui regroupe les vecteurs de caractéristiques suivant la similarité entre eux La mesure de similarité utilisée ici est la distance euclidienne dans le cas ó les poids de toutes les dimensions dans le vecteur de caractéristiques sont pareils
La structure de SS-tree ressemble à celle du R-tree mais on remplace dans chaque nœud le rectangle englobant par une sphère englobante représentée par un centre et un rayon Les données sont toujours au niveau des feuilles Le centre de la sphère englobante d’un nœud est le centre de gravité de tous les éléments dans le sous-arbre de ce nœud Au niveau des feuilles, la sphère englobante recouvre les éléments appartenant à cette feuille, le rayon de la sphère englobante est égal à la distance entre le centre et le point le plus loin Et au niveau d’un nœud interne, la sphère englobante recouvre les sphères englobantes de tous les nœuds fils de ce nœud, le rayon de la sphère est toujours supérieur ou égal à la distance entre le centre et le point le plus loin parmi les points dans le sous- arbre de ce nœud
On utilise aussi le mécanisme de réinsertion d’une partie d’un nœud plein comme dans le cas du R*-tree afin de minimiser le recouvrement entre les sphères englobantes et le volume des sphères Les expérimentations [8] montre que le SS-tree est meilleur que le R*-tree pour les applications de recherche de similarité avec des données de haute dimensionalité d SR-tree : Sphere/Rectangle Tree (1997) [3][2]
L’idée du SR-tree (Sphere/Rectangle Tree) est de combiner les deux structures R*- tree et SS-tree en identifiant la région de chaque nœud par l’intersection du rectangle englobant et de la sphère englobante Pour chaque nœud dans l’arbre SR-tree, on détermine :
• Un rectangle englobant recouvre tous les éléments (vecteurs) dans le sous-arbre de ce nœud Ce rectangle est déterminé comme dans le cas du R-tree
• Une sphère englobante recouvre tous les éléments dans le sous-arbre de ce nœud
Cette sphère est déterminée comme dans le cas du SS-tree
T RAVAUX SIMILAIRES
SnapToTell est un système qui fournit de l’information multimédia aux touristes en se basant sur les images prises par des téléphones portables et sur l’information de localisation Imaginez que vous être en train de voyager et que vous voyez un beau site
(un lac, un monument, un sculpture, etc.) et que vous voulez avoir les informations concernant ce site Vous pouvez prendre une photo de ce site utilisant votre téléphone portable et l’envoyer à un fournisseur de service de SnapToTell Le fournisseur de service va vous envoyer ensuite les informations décrivant ce site sous la forme un message multimédia (MMS) et/ou un message texte
L’idée de ce système est d’utiliser l’information de localisation géographique du téléphone portable de l’utilisateur pour déterminer le contexte de l’utilisateur Mais la position seule de l’utilisateur ne nous permet pas de déterminer son intention car le monument qui l’intéresse peut être éloigné de plusieurs centaines de mètres Alors, après avoir eu l’information du contexte de l’utilisateur, le système va rechercher dans la base de données les images les plus proches visuellement de l’image requête pour trouver le site qui intéresse l’utilisateur Notez qu’on fait la recherche seulement parmi les images autour du positionnement de l’utilisateur La base de données de ce système collecte les images de tous les sites célèbres d’un pays (ici, Singapour), chaque site correspondant à plusieurs images prises à plusieurs distances différentes, de plusieurs points de vue différents
Figure 7 - Architecture client/serveur du système SnapToTell
L’architecture client/serveur est utilisée pour le système SnapToTell Le client est un téléphone portable intégrant un appareil photo et supportant les MMS La requête envoyée vers le serveur par le client peut être l’image de la scène ou le vecteur de description du contenu visuel de l’image (par exemple, un histogramme de couleurs) Le serveur SnapToTell reỗoit l’image avec l’information de localisation gộographique du téléphone mobile de l’utilisateur grâce à l’opérateur du réseau mobile A partir du positionnement de l’utilisateur, le serveur recherche dans la base de données l’image la plus proche visuellement parmi les images autour de la localisation de l’appareil mobile
A l’égard de la base de données, on construit une base d’images de scènes différentes de Singapour Chaque image contient l’information GPS de la scène, l’information de localisation géographique ici étant localisée hiérarchiquement à trois niveaux : Singapour est divisé en plusieurs zones, chaque zone contenant plusieurs lieux et chaque lieu correspondant à quelques scènes Chaque scène est caractérisée par des photos prises à plusieurs distances, plusieurs points de vue et plusieurs conditions de luminosité, elle correspond aussi à une description textuelle et/ou une description audio qui sont les informations à retourner pour l’utilisateur lors de chaque requête
Figure 8 - Localisation hiérarchique des scènes de Singapour
Ainsi, chaque fois qu’on reỗoit une requờte, on utilise tout d’abord l’information de localisation géographique pour diminuer le nombre d’images à rechercher, puis on recherche l’image la plus proche visuellement pour déterminer la scène Notez que l’on utilise un seuil pour déterminer s’il y a une scène correspondant à l’image requête ou non
Le vecteur de caractéristiques visuelles de l’image ici est l’histogramme des couleurs
MobiLog (Mobile Blogging automation) [15] est une plateforme qui est proposée pour automatiser partiellement la saisie de données des blogs écrits à partir d’un téléphone mobile et le système TraveLog [15] est une application de cette plateforme
Notez que ce système utilise les résultats du système Snap2Tell abordé dans la partie précédente
L’idée de ce système est qu’un utilisateur prend des images d’une scène intéressante en voyageant et il veut écrire un blog en utilisant son téléphone mobile pour partager son voyage Le système va l’aider à ajouter automatiquement les informations concernant le contexte (l’heure, la location, le climat), les informations personnelles d’utilisateur (le nom, la date de naissance) et les informations du contenu des images (description de la scène)
Figure 9 - Screen shots de la composition de blog sur un téléphone portable
On peut trouver les informations du contexte en se basant sur le temps de la création des images, sur la position du téléphone mobile (GPS) et sur l’information du climat obtenue à partir des serveurs correspondants Les informations personnelles de l’utilisateur sont obtenues à partir de son profil Pour avoir la description de la scène, le serveur TraveLog envoie les images ajoutées dans le blog par l’utilisateur vers le serveur Snap2Tell [2.2.1] A partir des mots-clộs dans la description reỗue du serveur Snap2Tell, le système peut chercher les sites web concernés en utilisant les moteurs de recherche Web et les lister dans le blog Un autre but de ce système est d’améliorer la qualité des images dans le blog en utilisant la technique d’égalisation d’histogramme ou en remplaỗant les images de mauvaise rộsolution par des images de bonne rộsolution d’une même scène (différents points de vue, différentes conditions de lumière) trouvées par le service de Snap2Tell La figure suivante donne un exemple de blog proposé par le système TraveLog :
Figure 10 - Exemple de blog du système TraveLog
SR-TREE
I NSERTION DANS LE SR- TREE
L’algorithme d’insertion d’un nœud dans un SR-tree est basé sur celui du SS-tree
[8] La première étape d’insertion est d’ajouter le nœud à insérer dans la liste des nœuds à réinsérer et puis, insérer les nœuds dans la liste jusqu’à ce que la liste soit vide
L’algorithme pour insérer un nœud N quelconque de la liste dans SR-tree est comme suivant :
• S’il existe seulement un nœud racine du SR-tree (structure vide), on créera une entrée du nœud racine, ajoutera N dans cette entrée et mettra à jour le nœud racine de faỗon appropriộe
• Sinon, on descend jusqu’à ce qu’on trouve un nouveau père pour le nœud N Le sous-arbre à choisir en descendant est celui qui a le centre est plus proche du nœud
N à insérer Pour chaque nœud traversé en descendant, on doit mettre à jour le nombre de points w ainsi que le rectangle R et la sphère S de ce nœud Chaque fois qu’on trouve le nœud père du N :
• si le père n’est pas plein, on ajoute le nœud N comme un de ses fils
• si le père est plein, on réinsère une part de ses fils (par exemple 30%) dans le cas que le père n’est pas encore réinséré ; dans le cas inverse, on divise (spit) ses fils en deux parties pour avoir deux nouveaux pères Pour diviser, on choisit la dimension avec la variance sur cette dimension qui est la plus grande et puis on choisit la position à diviser pour minimiser la somme des variances de chaque côté de la division Alors, on a deux nouveaux pères, le père qui est plus proche du grand-père est gardé, et l’autre père doit être réinséré
Le rectangle englobant et la sphère englobante d’un nœud sont créés et mis à jour au cour de la phase d’insertion des entrộes dans l’arbre SR-tree La faỗon de mettre à jour les régions qui sont à l’intersection du rectangle englobant et de la sphère englobante est comme suit :
• Notez qu’un rectangle englobant est déterminé par deux points S et T pour que toutes les coordonnées de S soient inférieures ou égales à toutes les coordonnées correspondantes d’un point quelconque dans la région et inversement, toutes les coordonnées de T soient supérieures ou égales à toutes les coordonnées correspondantes d’un point quelconque dans la région Donc, pour mettre à jour le rectangle englobant d’un nœud, il faut simplement mettre à jour les coordonnées de
S et T pour que le nouveau rectangle recouvre les rectangles des nœuds fils (supposons qu’on a n nœud fils) :
11 k est l’indice du fils C k et i est l’indice de la dimension C k s i et C k t i sont respectivement la ième coordonnée des points S et T du rectangle englobant du nœud fils C k
• Pour mettre à jour la sphère englobante : o Le centre de la sphère englobante x(x 1 , x 2 , …, x D ) est calculé comme suit :
1 1 k est l’indice du fils C k et i est l’indice de la dimension C k x i est la ième coordonnée du centre du fils C k ; C k w est le nombre de points dans le sous- arbre du fils C k o Le rayon de la sphère englobante, r, est calculé comme suit :
C k x et C k r sont respectivement le centre et le rayon de la sphère englobante du fils C k ; C k R est le rectangle englobant du fils C k La fonction MAXDIST(p,R) qui calcule la distance maximale entre un point p et un rectangle R est comme suit :
On peut calculer MAXDIST(p,R) comme suit :
MAXDIST(p,R) calculé par la formule précédente donne une distance qui est toujours supérieure ou égale à toutes les distances entre le point p et les points dans le rectangle R On dit d s la distance maximale entre le centre du nœud père et les sphères englobantes de ses fils, et aussi d r la distance maximale entre le centre du nœud père et les rectangles englobants de ses fils Le SS-tree détermine le rayon r par d s tandis que le SR-tree détermine le rayon r en choisissant le minimum entre d s et d r Alors, le rayon du SR-tree peut être plus petit que celui du SS-tree.
S UPPRESSION DANS LE SR- TREE
La suppression dans le SR-tree est comme celle dans le R-tree [5] Pour supprimer un élément E d’un SR-tree, on suit les étapes suivantes :
• A partir du nœud racine, on descend pour trouver le noeud feuille L contenant l’élément E En descendant, on vérifie tous les nœuds fils pour que leur région déterminée par le rectangle englobant et la sphère englobante contienne E
• Si on trouve le record E dans un feuil L de l’arbre, on supprimera E de ce feuil
• Après avoir supprimé E, si L contient moins de mL éléments (mL est le nombre minimal possible d’éléments d’un nœud feuille), on va supprimer L et réinsérera tous les éléments de L ; sinon on va mettre à jour les régions de tous les nœuds à partir de L jusqu’au nœud racine.
R ECHERCHE DANS LE SR- TREE
Il y a quelques types de requête qui peuvent être exercés avec la structuration SR- tree tels que la recherche d’un vecteur dans l’arbre SR-tree, la recherche des k plus proches voisins d’un point, la recherche de vecteurs de données qui sont dans un rayon de proximité d’un point quelconque
La recherche d’un vecteur dans l’arbre SR-tree commence à partir de la racine et descend à chaque niveau vers les nœuds qui ont une région contenant ce vecteur La recherche termine quand on a trouvé le vecteur dans une feuille de l’arbre ou quand il n’y a plus de nœud à vérifier
La recherche des k plus proches voisins d’un point quelconque est comme dans
• Tout d’abord, on sélectionne k points quelconques comme k plus proches voisins initiaux
• On utilise la distance entre le point entré et le point le plus loin dans k points pour diriger la recherche vers les nœuds fils qui ont les régions superposées avec l’intervalle des k points
La distance minimale entre le point entré et la région d’un fils C k qui est l’intersection du rectangle englobant et de la sphère englobante est calculée comme suit :
C k x et C k r est le centre et le rayon de la sphère englobante de C k , C k R est le rectangle englobant du fils C k MINDIST(p,R) est la distance minimale entre le point p et le rectangle R :
On peut calculer cette distance comme dans [16] :
= non si p t p si t s p si s r avec r p R p MINDIST i i i i i i i i n i i i
La distance MINDIST(p,R) calculée par la formule précédente donne une distance qui est toujours inférieure ou égale à toutes les distances entre le point P et les points dans le rectangle R
Pour chaque fils C k qui a la distance minimale d entre le point entré et la région de ce fils qui est supérieur à la distance entre le point p et le point le plus loin parmi les k points les plus proches, on ne doit pas rechercher plus dans ces fils Pour les autres fils, on visite ces fils en utilisant la recherche en profondeur et par ordre de croissant de la distance minimale d
Pour la recherche de vecteurs de données qui sont dans un rayon de proximité r d’un point quelconque p, on dirige la recherche vers les nœuds fils qui ont les régions superposées avec la sphère du centre p et de rayon r
Chapitre 4 – Système de recherche d’informations basé sur une double information de contenu des images et de localisation géographique
Comme nous avons abordé, ce travail de stage a pour but de construire un modèle de recherche d’informations basé sur une double information de contenu des images et de localisation géographique afin de retrouver des situations urgences dans une ville et de leur attribuer un niveau d’urgence en fonction de la proximité géographique d’événements similaires Ce chapitre va présenter notre approche pour développer un tel système.
La recherche d’informations dans ce stage est basée d’une part sur l’information du contenu visuel des images et d’autre part sur l’information de localisation géographique
Alors, chaque image est représentée par un descripteur interne du contenu de l’image et un descripteur externe de localisation géographique A l’égard du descripteur interne, on représente le contenu visuel de l’image sous forme d’un vecteur de n dimensions A l’égard du descripteur externe, on suppose que toutes les images ont les informations de localisation géographique de type GPS, c'est-à-dire que chaque image est représentée par les coordonnées de longitude et de latitude qu’on prend pour cette image L’information de localisation géographique des images est simulée par le programme
Une autre hypothèse est que l’entrée du système est un ensemble d’images qui arrivent à un moment t C'est-à-dire qu’on retrouve des situations d’urgence et qu’on leur attribue un niveau d’urgence en utilisant les images qui sont actuellement valides
D’ailleurs, l’identification des situations d’urgence concerne la recherche d’images par le contenu qui est le travail de thèse de NGUYEN Nhu Van dont nous allons bénéficier Donc, on ne se concentre pas sur la recherche d’un bon descripteur interne pour la représentation du contenu visuel de l’image, on utilise les descripteurs internes de son système (ici, soit l’histobin de couleur, soit un sac de mots visuels) Dans le cadre de ce stage, on se concentre sur le problème de structurer les images en deux espaces (contenu visuel et localisation géographique) et de manipuler ces deux espaces pour retrouver des situations d’urgence et leur attribuer un niveau d’urgence
A l’égard de l’attribution d’un niveau d’urgence pour une situation, en réalité il y a plusieurs aspects à considérer comme la nature du sinistre (le niveau d’urgence d’un feu peut être différent de celui d’une inondation, c’est un grand feu ou un petit feu, etc.), le nombre de sinistres différents qui sont proches, le nombre de sinistres de même type qui sont proches, la nature des monuments (hôpital, maison, école, etc.) à la position du sinistre ou proches du sinistre, etc Pour pouvoir considérer tous les aspects qui peuvent influencer sur l’attribution d’un niveau d’urgence, il nous faut l’aide des experts du domaine des secours dans des situations de post-catastrophes naturelles (par exemple des pompiers) D’ailleurs, pour déterminer le niveau d’urgence en se basant sur le contenu de l’image (par exemple, c’est un grand feu ou un petit feu), c’est aussi un grand travail à faire Donc, dans le cadre de ce stage, on suppose que le niveau d’urgence d’une situation est basé seulement sur la proximité géographique d’événements similaires et sur la nature des monuments à la position du sinistre ou proches du sinistre
Pour le système qu’on va construire, on suppose qu’il y a cinq types de sinistres différents (feu, blessé, bâtiment endommagé, route endommagée et inondation) et que les niveaux d’urgence de ces cinq types sont pareils D’ailleurs, dans les Système d’Informations Géographiques (SIG) actuels, les données d’une ville peuvent se composer de plusieurs couches, chaque couche étant un fichier shapefile [17] qui contient un type d’information quelconque comme les maisons, les routes, les lacs, etc On suppose aussi qu’il y a un fichier shapefile contenant des objets de type polygone identifiant des monuments différents dans la ville, chaque monument appartient à un des quatre types différents (maison, hôpital, grand bâtiment et école)
En effet, plusieurs personnes peuvent prendre des photos d’un même sinistre (par exemple un feu) et envoyer vers le serveur Pour simplifier, on suppose qu’une situation d’urgence est reprộsentộe par une seule image reỗue C'est-à-dire que deux images différentes doivent représenter deux sinistres différents
Pour retrouver des situations d’urgence dans la ville, on construit une base d’images (on dit la base d’apprentissage) qui contient les images différentes des situations d’urgence Ce sont les images qu’on collecte selon cinq types de sinistres différents (feu, blessé, bâtiment endommagé, route endommagée et inondation) On annote ces images selon le type de sinistre correspondant à chaque image L’idée est comme suit : pour chaque image qu’on reỗoit à un moment t (notez qu’on ne connaợt pas le type du sinistre représenté par cette image), on retrouve dans la base d’apprentissage les k images qui sont les plus proches visuellement de l’image d’entrée et on va identifier le type du sinistre correspondant à cette image en se basant sur le nombre d’images de chaque type de sinistre parmi ses k plus proches images Par exemple, parmi k0 plus proches images, si on a 10 images de feux, 5 images de blessés, 6 images de bâtiments endommagés, 4 images des routes endommagées et 5 images d’inondations, alors on dit que l’image entrộe est de type ô feu ằ Un autre exemple, parmi 30 plus proches images, on a 15 images de feux, 15 images de bâtiments endommagés, alors on dit que l’image d’entrée est de type ô feu ằ si la premiốre image de feu apparaợt avant la premiốre image de bâtiment endommagé dans la liste des k plus proches images et vice versa
Alors, dans notre système, on doit distinguer deux bases d’images :
• Une base d’images d’apprentissage contenant les images qui sont déjà annotées selon cinq types de sinistres différents
• Une base d’images actuelles contenant les images que le systốme reỗoit à un moment t On doit identifier le type du sinistre correspondant à chaque image dans cette base et puis lui attribuer un niveau d’urgence
Il nous faut maintenant structurer les images en deux espaces (l’espace des descripteurs internes du contenu visuel et l’espace des descripteurs externe de localisation gộographique) La structure SR-tree [2] est choisie pour les deux espaces car elle accroợt la performance des requêtes par plus proches voisins pour les données de haute dimensionalité (descripteurs internes des images) et elle correspond bien à la structuration des données géographiques Cette structure permet de faciliter et accélérer la recherche des images similaires dans l’espace du contenu et le calcul de la proximité entre des événements dans l’espace de localisation géographique On va structurer les données du système comme suit :
SYSTEME DE RECHERCHE D’INFORMATIONS BASE SUR UNE DOUBLE
A PPROCHE PROPOSEE
Pour retrouver des situations d’urgence dans la ville, on construit une base d’images (on dit la base d’apprentissage) qui contient les images différentes des situations d’urgence Ce sont les images qu’on collecte selon cinq types de sinistres différents (feu, blessé, bâtiment endommagé, route endommagée et inondation) On annote ces images selon le type de sinistre correspondant à chaque image L’idée est comme suit : pour chaque image qu’on reỗoit à un moment t (notez qu’on ne connaợt pas le type du sinistre représenté par cette image), on retrouve dans la base d’apprentissage les k images qui sont les plus proches visuellement de l’image d’entrée et on va identifier le type du sinistre correspondant à cette image en se basant sur le nombre d’images de chaque type de sinistre parmi ses k plus proches images Par exemple, parmi k0 plus proches images, si on a 10 images de feux, 5 images de blessés, 6 images de bâtiments endommagés, 4 images des routes endommagées et 5 images d’inondations, alors on dit que l’image entrộe est de type ô feu ằ Un autre exemple, parmi 30 plus proches images, on a 15 images de feux, 15 images de bâtiments endommagés, alors on dit que l’image d’entrée est de type ô feu ằ si la premiốre image de feu apparaợt avant la premiốre image de bâtiment endommagé dans la liste des k plus proches images et vice versa
Alors, dans notre système, on doit distinguer deux bases d’images :
• Une base d’images d’apprentissage contenant les images qui sont déjà annotées selon cinq types de sinistres différents
• Une base d’images actuelles contenant les images que le systốme reỗoit à un moment t On doit identifier le type du sinistre correspondant à chaque image dans cette base et puis lui attribuer un niveau d’urgence
Il nous faut maintenant structurer les images en deux espaces (l’espace des descripteurs internes du contenu visuel et l’espace des descripteurs externe de localisation gộographique) La structure SR-tree [2] est choisie pour les deux espaces car elle accroợt la performance des requêtes par plus proches voisins pour les données de haute dimensionalité (descripteurs internes des images) et elle correspond bien à la structuration des données géographiques Cette structure permet de faciliter et accélérer la recherche des images similaires dans l’espace du contenu et le calcul de la proximité entre des événements dans l’espace de localisation géographique On va structurer les données du système comme suit :
• On caractérise chaque image dans la base d’apprentissage par un vecteur de caractéristiques (soit l’histobin de couleurs, soit un sac de mots visuels) Puis on structure tous les descripteurs du contenu visuel des images dans la base d’apprentissage par un arbre SR-tree en ajoutant au fur et à mesure ces descripteurs dans l’arbre
• Pour les images qui arrivent au système à un moment t, on va structurer en deux espaces par des SR-tree différents : o Dans l’espace de localisation géographique, chaque image est caractérisée par un descripteur externe sous forme un point (x,y) représentant la longitude et la latitude de la position qu’on prend pour cette image On utilise un arbre SR-tree pour structurer les descripteurs externes des images o Dans l’espace du contenu visuel, chaque image est représentée par un descripteur interne sous forme d’un vecteur de n dimensions comme dans le cas des images dans la base d’apprentissage On va structurer les images dans cet espace par des SR-tree différents, chaque SR-tree correspondant à un type du sinistre C'est-à-dire qu’on a cinq SR-tree différents correspondant à cinq types de sinistres différents (SR-tree du feu, SR-tree des blessés, SR-tree des bâtiments endommagés, SR-tree des routes endommagées et SR-tree des inondations) Un SR-tree peut être vide s’il n’y a aucune image appartenant au type du sinistre correspondant à cet arbre o Alors, pour chaque image reỗue, on doit :
Créer un élément (ou enregistrement) pour caractériser les données de cette image (nom de l’image, descripteur externe de localisation géographique, descripteur interne du contenu visuel, type du sinistre (non connu), niveau d’urgence (non connu), etc.)
En se basant sur le descripteur externe, on ajoute cette image dans l’arbre SR-tree de l’espace spatial, la feuille contenant l’information de localisation géographique de cette image pointant vers son élément de données
Utiliser l’algorithme de recherche des k plus proches voisins dans l’arbre SR-tree de la base des images d’apprentissage pour trouver k images dans la base d’apprentissage qui sont plus proches visuellement avec l’image entrée A partir des k images obtenues, on détermine le type de situation d’urgence (feu, blessé, bâtiment endommagé, route endommagée ou inondation) de l’image entrée et on met à jour l’information de type du sinistre dans l’élément de cette image Et en basant sur le descripteur interne, on ajoute cette image dans l’arbre SR-tree correspondant à son type du sinistre La feuille contenant ce descripteur interne pointe vers l’élément de données de cette image
• Il y a un autre type de données qu’on doit structurer, soit l’information sur les monuments dans la ville Comme nous l’avons abordé ci-dessus, on utilise un fichier shapefile [17] pour identifier les monuments dans la ville, chaque monument est un objet de type polygone Lorsqu’on attribue un niveau d’urgence pour les situations d’urgence, on doit considérer aussi les monuments qui sont proches de chaque sinistre C’est pour cette raison qu’on construit aussi un arbre SR-tree pour structurer les informations des monuments dans la ville, chaque feuille de cet SR-tree contenant l’information d’un monument (maison, hôpital, école ou grand bâtiment), le rectangle englobant et la sphère englobante de cette feuille recouvrant le polygone identifiant le monument
Alors, on a dans notre système :
• Un SR-tree structurant l’information du contenu visuel des images dans la base d’apprentissage
• Un SR-tree des informations de localisation gộographique des images reỗues à un moment t
• Des SR-tree des informations du contenu visuel des images reỗues à un moment t, dont un SR-tree pour chaque type du sinistre
• Un SR-tree structurant l’information des monuments dans la ville
Figure 13 - Structuration des données par des SR-tree
4.2.2 Manipulation dans les SR-tree
Comme nous l’avons expliqué, l’identification des situation d’urgence est réalisé en appliquant la recherche des k plus proches images visuellement dans le SR-tree des images dans la base d’apprentissage Le problème maintenant est d’attribuer un niveau d’urgence pour ces situations Dans le cadre de ce stage, on suppose que le niveau d’urgence est attribué en fonction de la proximité entre des événements similaires (événements de même type) et suivant le type des monuments autour des situations d’urgence
On définit deux paramètres r1 et r2 :
• r1 est le rayon de proximité entre des situations dans l’espace de localisation géographique Deux situations urgences caractérisées par deux images à deux positions P(x,y) et P’(x’,y’) sont proches si la distance (distance euclidienne) entre ces deux positions est inférieure ou égale à r1
• r2 est le rayon de proximité entre une situation et un monument On dit qu’un monument (par exemple un hôpital) et une situation situé à la position P(x,y) sont proches si la sphère du centre P(x,y) et de rayon r2 intersecte la région déterminant le monument (dans l’arbre SR-tree des monuments, la région d’un monument est l’intersection entre le rectangle englobant et la sphère englobante du polygone caractérisant le monument)
Lors d’une catastrophe naturelle, il peut y avoir plusieurs images qui sont envoyées vers le serveur, il est utile de grouper les situations similaires en groupe en fonction de leur proximité dans l’espace géographique et d’afficher sur l’écran des groupes de situations d’urgence
On va déterminer un groupe de proximité des situations similaires comme suit :
• A l’égard du contenu visuel, toutes les situations dans un groupe doivent être de même type du sinistre
• A l’égard de la localisation géographique, on regroupe des images représentant des situations de même type comme suit : si A et B sont proches dans le rayon r 1 , B et
C sont proches dans le rayon r 1 ; alors, A, B et C appartiennent à un même groupe de proximité
Je propose l’approche suivante pour déterminer les niveaux d’urgence des situations :
• Au niveau du sinistre, pour chaque image représentant un sinistre quelconque, on attribue un niveau d’urgence correspondant au type du sinistre de cette image Pour savoir quel est le niveau d’urgence approprié à chaque type du sinistre, il nous faut consulter des experts dans le domaine du secours Dans le cadre de ce stage, on attribut un niveau d’urgence 1 pour tous les types de sinistres
• Après avoir déterminé le type du sinistre correspondant à une image, on réalise la recherche dans l’arbre SR-tree de l’information des monuments pour trouver le monument ó le sinistre a lieu et trouver les monuments qui sont proches dans un rayon r 2 par rapport de la position du sinistre Le sinistre a lieu à un monument A si et seulement si la position de l’image caractérisant le sinistre se situe dans la région du monument A déterminée par l’intersection du rectangle englobant et de la sphère englobante du polygone déterminant le monument A Un monument B est proche du sinistre situé à la position (x,y) si et seulement si la région du monument
I MPLEMENTATION DU SYSTEME
ô feu ằ, il y a plusieurs sous-types comme le feu dans des bõtiments, le feu dans la forêt, … Si l’utilisateur veut se concentrer surtout sur les images de feu dans des bâtiments par exemple, il peut cliquer sur un image de feu d’un bâtiment quelconque affichées sur l’écran, le programme va utiliser la recherche de k-plus proches voisins dans le SR-tree du type ô feu ằ et afficher les k images les plus similaires à l’image de feu du bâtiment que l’utilisateur a choisi L’organisation des données du contenu visuel des images dans les arbres SR-tree différents correspondant aux différents types de sinistres nous permet d’éviter de faire la recherche dans toute la base d’images.
Au début de ce stage, on n’a pas encore une base d’images réelles des situations d’urgence différentes, alors une tâche importante de ce travail de stage est de construire la base d’images du projet IDEA [1] avec les images des sinistres réels En combinant les images sur les tremblements de terre dans quelques pays en Asie et les images trouvées sur le site http://www.flickr.com avec la licence ô Creative commons ằ, on a dộjà construit une base d’images de cinq types de sinistres différents (feu, blessé, bâtiment endommagé, route endommagée et inondation) Pour chaque type de sinistre, les images sont divisées en deux parties, une partie est annotée et ajoutée dans la base d’apprentissage, une autre partie appartient à la base des images de test identifiant les images que le systốme reỗoit à un moment t La table suivante donne le nombre d’images correspondant à chaque type du sinistre :
Type du sinistre Base d’apprentissage Base de test Total
Table 2 - Base d'images des sinistres
Il nous faut avoir aussi des données shapefile qui décrivent les informations des monuments J’utilise les données SIG libres du Colorado des Etats-Unis (http://www2.census.gov/geo/tiger/TIGER2007FE/) Normalement, dans les données originales, il n’y a pas d’information sur les types des monuments, j’ai simulé ces données en ajoutant un champ dans les données d’un fichier shapefile du Colorado pour identifier quatre types de monuments différents (maison, grand bâtiment, hôpital et école) J’utilise le logiciel libre OpenJump (http://jump-pilot.sourceforge.net/) pour préparer les données SIG
Le système est construit dans l’environnement suivant :
• Outil de programmation : QT Creator
Ce travail de stage bénéficie du code source du travail de thèse de NGUYEN Nhu Van concernant la création des descripteurs internes du contenu visuel des images (histobin de couleur, sac de mots visuels) D’ailleurs, on utilise aussi la librairie ô Shapefile C Library V1.2 ằ (http://shapelib.maptools.org/) pour pouvoir lire les donnộes des monuments dans un fichier shapefile et les autres fichiers concernés
L’interface du programme est comme suit :
Le plan de la ville se situe à droite de l’interface, les parties vertes dans ce plan représentent des monuments dans la ville A gauche de l’interface, il y a des boutons qui nous permettent de réaliser les fonctions du système :
• Le bouton ô Apprendre ằ permet d’extraire le vecteur du contenu visuel des images dans la base d’images d’apprentissage fournie par l’utilisateur, ces descripteurs internes du contenu visuel vont être enregistrés dans des fichiers texte
Alors, la phase d’apprentissage pour une base quelconque doit être réalisée seulement une fois
• Le bouton ô Init ằ permet de structurer les descripteurs internes des images dans la base d’apprentissage dans un SR-tree et de structurer les données des monuments d’un fichier shapefile dans un autre SR-tree
• Le bouton ô Open ằ permet de donner des images actuelles qui sont les images arrivant au système à un moment t Le système va déterminer le type de sinistre correspondant à chaque image et structurer ces images dans deux espaces de localisation géographique et du contenu visuel par un SR-tree de l’information géographique et cinq SR-tree du contenu visuel
• Le bouton ô Search ằ permet de rechercher et afficher les groupes de proximitộ des sinistres similaires correspondant aux types du sinistre qu’on veut (on peut afficher les groupes de tous les types ou seulement les groupes du type feu)
Le système nous permet aussi de trouver les monuments qui sont proches d’un sinistre quelconque, les sinistres qui sont proches d’un monument comme un hôpital, les sinistres autour d’un autre sinistre, etc On utilise les symboles suivants pour identifier les types de sinistres et les types de monument différents :
Car le but de ce stage est de montrer ce que l'on peut faire en combinant localisation et contenu images dans un système d’aide à la décision dans une situation de post-catastrophe naturelle en zone urbaine Alors, afin d’évaluer les résultats du système, on fait des test basés sur des scénarios décrivant des situations ó on peut montrer un intérêt de rechercher des images en combinant localisation et contenu image Dans ce chapitre, on va évaluer les résultats en basant sur des scénarios différents et donner des commentaires sur les points forts et les points faibles de notre système pour chaque scénario
5.1 Scénario 1 : attribution des niveaux d’urgence
Comme nous avons vu dans les chapitres précédents, le but principal de ce système est de retrouver des situations d’urgence dans une ville et de leur attribuer un niveau d’urgence en fonction de la proximité entre des situations similaires (situations de même type) Dans le système construit, on a déjà combiné les informations du contenu de l’image pour retrouver des situations d’urgence et pour trouver des situations similaires, les informations de localisation géographique des images pour déterminer la proximité entre des situations et les informations des monuments pour pouvoir attribuer un niveau d’urgence aux images en se basant aussi sur la nature des monuments autour des sinistres
Le résultat donné est une vue générale sur les sinistres dans la ville, l’utilisateur peut observer la distribution des sinistres différents, et peut savoir le lieu ó les sinistres sont très urgents (en se basant sur la taille des symboles) pour pouvoir prendre des décisions de secours rapidement
Figure 17 - Groupes des situations d’urgence dans la ville
Figure 18 - Groupes des feux dans la ville
On peut voir que l’utilisateur peut observer les sinistres de tous les types ou seulement les sinistres d’un ou deux types auxquels il s’intéresse Chaque symbole dans les résultats représente un groupe de sinistres similaires qui sont proches géographiquement La taille des symboles représente le niveau d’urgence correspondant à chaque groupe
L’utilisateur peut observer en détail des sinistres appartenant à un groupe quelconque en cliquant sur le symbole correspondant à ce groupe, la taille des images augmente selon le niveau d’urgence des images ce qui nous permet de comparer le niveau d’urgence de chaque sinistre Cela nous permet de donner des décisions de secours raisonnables :
Figure 19 - Résultat des sinistres d'un groupe
ANALYSE DES RESULTATS
S CENARIO 5 : DETERMINATION DES SINISTRES SIMILAIRES A UN AUTRE SINISTRE
Ce travail de stage présente une approche pour le développement d’un modèle de recherche d’informations basé sur une double information de contenu des images et de localisation géographique Le système construit implémente l’approche proposée qui structure les images en même temps dans deux espaces de localisation géographique et du contenu visuel par des arbres SR-tree [2] La structuration SR-tree est choisie pour les raisons suivantes : d’une part, elle est utile pour les applications d’indexation de similarité des images/vidéos ; d’autre part, son mécanisme de regroupement des données qui sont proches par des rectangles englobants et des sphères englobantes correspond bien à la structuration des données géographiques Cette approche nous permet de combiner l’information de localisation et du contenu des images pour retrouver des situations d’urgence dans une ville et leur attribuer un niveau d’urgence en fonction de la proximité géographique d’événements similaires
D’ailleurs, on propose aussi l’utilisation de la structure SR-tree pour structurer des différents monuments (maison, grand bâtiment, hôpital, école) dans la ville Ces monuments sont enregistrés dans un fichier shapefile, un type de fichier utilisé dans les systèmes SIG (Système d’Informations Géographiques) pour les données géographiques
La forme de type polygone des monuments correspond bien à la structuration par des SR- tree Cette extension dans l’approche proposée nous permet d’attribuer un niveau d’urgence non seulement en fonction de la proximité géographique d’événements similaires, mais aussi en fonction de la nature des monuments autour de la position d’un sinistre Par exemple, un feu dans un hôpital est plus urgent que des feux dans quelques maisons
En effet, on a atteint le but de ce stage dans la construction d’un modèle d’aide à la décision dans une situation de post-catastrophe naturelle et dans la contribution d’une base d’images des sinistres pour le projet IDEA Le système construit fournit à l’utilisateur une vue globale sur les sinistres dans la ville sous forme de groupes de proximité géographique des situations similaires Il fournit aussi un accès aux informations comme les monuments proches d’in sinistre, les sinistres proches d’un monument, les sinistres proches d’un sinistre, etc L’information fournie par le système nous permet de prendre des dộcisions qui coordonnent d’une faỗon raisonnable les équipes de secours Ce système est utile pour qu’on puisse limiter les dommages dans une situation de post-catastrophe naturelle.
CONCLUSIONS ET PERSPECTIVES
Ce travail de stage présente une approche pour le développement d’un modèle de recherche d’informations basé sur une double information de contenu des images et de localisation géographique Le système construit implémente l’approche proposée qui structure les images en même temps dans deux espaces de localisation géographique et du contenu visuel par des arbres SR-tree [2] La structuration SR-tree est choisie pour les raisons suivantes : d’une part, elle est utile pour les applications d’indexation de similarité des images/vidéos ; d’autre part, son mécanisme de regroupement des données qui sont proches par des rectangles englobants et des sphères englobantes correspond bien à la structuration des données géographiques Cette approche nous permet de combiner l’information de localisation et du contenu des images pour retrouver des situations d’urgence dans une ville et leur attribuer un niveau d’urgence en fonction de la proximité géographique d’événements similaires
D’ailleurs, on propose aussi l’utilisation de la structure SR-tree pour structurer des différents monuments (maison, grand bâtiment, hôpital, école) dans la ville Ces monuments sont enregistrés dans un fichier shapefile, un type de fichier utilisé dans les systèmes SIG (Système d’Informations Géographiques) pour les données géographiques
La forme de type polygone des monuments correspond bien à la structuration par des SR- tree Cette extension dans l’approche proposée nous permet d’attribuer un niveau d’urgence non seulement en fonction de la proximité géographique d’événements similaires, mais aussi en fonction de la nature des monuments autour de la position d’un sinistre Par exemple, un feu dans un hôpital est plus urgent que des feux dans quelques maisons
En effet, on a atteint le but de ce stage dans la construction d’un modèle d’aide à la décision dans une situation de post-catastrophe naturelle et dans la contribution d’une base d’images des sinistres pour le projet IDEA Le système construit fournit à l’utilisateur une vue globale sur les sinistres dans la ville sous forme de groupes de proximité géographique des situations similaires Il fournit aussi un accès aux informations comme les monuments proches d’in sinistre, les sinistres proches d’un monument, les sinistres proches d’un sinistre, etc L’information fournie par le système nous permet de prendre des dộcisions qui coordonnent d’une faỗon raisonnable les équipes de secours Ce système est utile pour qu’on puisse limiter les dommages dans une situation de post-catastrophe naturelle
Cependant, il existe encore des limites dans le système construit Premièrement, on traite seulement l’information géographique des images sous forme de données GPS Il existe d’autres types de localisation géographique à traiter comme l’adresse civique
Deuxièmement, le système ne traite pas encore les images qui n’ont pas cette localisation
Troisièmement, la reconnaissance des situations d’urgence n’est pas toujours exacte car actuellement, il n’y a pas encore une méthode parfaite pour la recherche d’images par le contenu Finalement, le niveau d’urgence est attribué seulement en fonction de la proximité géographique des situations similaires et de la nature des monuments autour du sinistre tandis qu’il existe plusieurs autres paramètres qui peuvent influencer ce niveau d’urgence
Il existe des travaux à faire pour que le système puisse devenir un bon outil d’aide à la décision dans une situation de post-catastrophe naturelle :
• On peut consulter les experts pour déterminer tous les paramètres qui peuvent influencer l’attribution d’un niveau d’urgence pour les sinistres et pour construire une base d’apprentissage identifiant le niveau d’urgence correspondant aux valeurs différentes de ces paramètres Dans ce cas, on peut utiliser n’importe quelle méthode d’apprentissage afin de déterminer un niveau d’urgence approprié à chaque situation Notez que l’état d’un sinistre (par exemple, un grand feu ou un petit feu) est aussi un paramètre important ; mais pour déterminer ce paramètre, il reste un grand travail à faire
• Si on peut trouver de bons descripteurs internes du contenu visuel des images, on pourra améliorer la recherche des situations d’urgence
• Il serait possible d’utiliser une base de données contenant des références entre des adresses civiques et des données de type GPS pour que le système puisse traiter les différents types de localisation géographique Pour les images qui n’ont pas de données de localisation géographique, on peut se baser sur le contenu de l’image pour trouver s’il existe une adresse civique dans l’image ou si c’est l’image d’un monument célèbre dans la ville ou non
[1] Site web du projet de recherche IDEA, http://www.ifi.auf.org/IDEA/, March 20, 2009
[2] Noriko Katayama, Shin’ichi Satoh, “The SR-tree : An index structure for High- Dimentional Nearest Neighbor Queries”, In Proceedings of the ACM SIGMOD International Conference on Management of Data, pages 369-380, Tucson, Arizon USA,
[3] Jean-Marc OGIER, “Partie 3 : Techniques de Clustering et d’indexation multidimensionnelles ằ, cours Indexation Multimedia, universitộ de La Rochelle
[4] Stefan Berchtold, Daniel A.Keim, Hans-Peter Kriegel, “The X-tree: An index structure for High-Dimensional Data”, In Proceedings of the 22nd International Conference on Very Large Databases, pages 28–39, 1996
[5] Automn Guttman, ô R-tree : A dynamic index structure for spatial searching ằ, In Proceedings of the ACM SIGMOD International Conference on Management of Data, pages 47-57, Boston, MA, June 1984
[6] Timos Sellis, Nick Roussopoulos et Christos Faloutsos, ô The R+-tree : a dynamic index for multi-dimensional objects ằ, In proceedings of the 16th International Conference on Very Large databases, page 507-518, 1987
[7] Norbert Beckmann, Hans-Peter Kriegel, Ralf Schneider, Bernhard Seeger, ô The R*- tree : An efficient and Robust Access Method for Points and Rectangles ằ, In proceeding of the ACM SIGMOD International Conference on Management of Data, page 322-331,
[8] David A.White, Ramesh Jain, “Similarity indexing with the SS-tree”, In proceeding of the 12 th International Conference on Data Engineering, page 516-523, 1996
[9] John T Robinson “The k-d-b-tree: A search structure for large multidimensional dynamic indexes” In Proceedings of the ACM SIGMOD International Conference on Management Data, pages 10–18, 1981
[10] Andreas Henrich, Hans-Werner Six, Peter Widmayer, “The LSD tree: spatial access to multidimensional point and non point objects”, In Proceedings of the 15 th International Conference on Very large data bases, pages 45-53, Amsterdam, The Netherlands, July
[11] Jean-Pierre Chevallet, Joo-Hwee Lim, “SnapToTell – Accès ubiquitaire à de l’information multi-média à partir d’un telephone portable”, 2 e Conférence en Recherche d’Informations et Applications, pages 245-260, Grenoble, France, Mars 2005
[12] Joo-Hwee Lim, Jean-Pierre Chevallet, Sihem Nouarah Merah, “SnapToTell:
Ubiquitous Information Access from Camera”, In Workshop on Mobile and Ubiquitous Information Access (MUIA04), 2004.