Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 78 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
78
Dung lượng
2,56 MB
Nội dung
Institut de la Francophonie pour l’Informatique Université de la Rochelle Université Toulouse Capitole Option : Systèmes Intelligents et Multimédia Mémoire de fin de formation pour l’obtention du diplôme de Master Informatique Génération de population synthétique localisée Master - IFI, Septembre 2014 Rédigé par : Paterne Chokki Sous la supervision de : M Benoit Gaudou et M Frédéric Amblard Année académique : 2013 - 2014 « Génération de population synthétique localisée » Table des matières Table des matières IV Remerciements V Résumé VI Abstract VII Liste des figures VIII Liste des tableaux X Introduction Chapitre Synthèse bibliographique 1.1 Concepts de base 1.1.1 Concepts de base sur la population synthétique 1.1.2 Concepts de base sur la localisation 1.1.3 Conclusion 3 4 1.2 Etat de l’art sur la génération de population synthétique 1.2.1 Générateurs de population synthétique avec échantillon 1.2.1.1 Approche SR (Synthethic Reconstruction) 1.2.1.2 Approche CO (Combinatorial Optimization) 1.2.2 Générateurs de population synthétique sans échantillon 1.2.2.1 Approche (Gargiulo et al., 2010) 1.2.2.2 Approche (Barthelemy & Toint, 2013) 1.2.3 Conclusion 5 7 1.3 Etat de l’art sur la localisation de la population 1.3.1 Approches de localisation sans données auxiliaires 1.3.2 Approches de localisation avec données auxiliaires 1.3.2.1 Approche ’binary dasymetric mapping’ 1.3.2.2 Approche ’limiting variables’ 1.3.2.3 Approche ’street weighting’ 1.3.2.4 Approche ’address point weighting’ 1.3.3 Conclusion 10 10 13 13 14 14 15 16 Chapitre Approche méthodologique 18 2.1 Proposition d’une approche pour la génération de population synthétique : GenPopSyn Paterne Chokki 18 Page I « Génération de population synthétique localisée » 2.1.1 2.1.2 2.1.3 Présentation générale de l’approche GenPopSyn 2.1.1.1 Détermination et subdivision des caractéristiques de la population synthétique 2.1.1.2 Génération de la population synthétique en ne prenant en compte que les caractéristiques principales 2.1.1.2.1 Génération des ménages non complexes et des individus de ces ménages 2.1.1.2.1.1 Correction des incohérences entre les données agrégées 2.1.1.2.1.2 Détermination des combinaisons possibles entre les différentes valeurs des caractéristiques primaires des individus 2.1.1.2.1.3 Détermination des combinaisons possibles entre les différentes valeurs des attributs des ménages 2.1.1.2.1.4 Détermination des différentes compositions possibles des ménages non complexes 2.1.1.2.1.5 Détermination des différents poids associés aux différentes compositions des ménages non complexes 2.1.1.2.1.6 Génération des ménages non complexes et des individus de ces ménages 2.1.1.2.2 Génération des ménages complexes et des individus de ces ménages 2.1.1.2.2.1 Détermination des données des ménages complexes et des individus de ces ménages 2.1.1.2.2.2 Génération des ménages complexes et des individus de ces ménages 2.1.1.3 Prise en compte des caractéristiques secondaires dans la génération de la population synthétique 2.1.1.3.1 Détermination des combinaisons possibles entre les caractéristiques primaires et les caractéristiques secondaires 2.1.1.3.2 Détermination des poids associés aux différentes combinaisons des caractéristiques primaires et des caractéristiques secondaires 2.1.1.3.3 Affectation des caractéristiques secondaires Plateforme utilisée pour l’implémentation de l’approche GenPopSyn Conclusion 2.2 Proposition d’une approche pour la localisation de la population synthétique : SpatPopSyn 2.2.1 Présentation générale de l’approche SpatPopSyn Paterne Chokki 18 18 20 20 21 21 22 22 24 26 27 28 29 30 30 31 31 32 33 33 34 Page II « Génération de population synthétique localisée » 2.2.1.1 Détermination du nombre d’individus sur chaque cellule de la grille 2.2.1.1.1 Approche ’areal weighting’ (Goodchild & Lam, 1980) 2.2.1.1.2 Approche ’pycnophylactic interpolation’ (Tobler, 1979) 2.2.1.1.3 Approche (Roy & Blaschke, 2014) 2.2.1.1.4 Approche (Kim & Choi, 2011) 2.2.1.1.5 Approche ’street weighting’ (Riebel & Buffalino, 2005) 2.2.1.1.6 Approche ’overlaid network’ (Xie, 1995) 2.2.1.2 Affectation d’une cellule chaque individu de la population synthétique Plateforme utilisée pour l’implémentation de l’approche SpatPopSyn Conclusion 2.2.2 2.2.3 Chapitre Expérimentations 34 35 37 38 39 39 41 41 42 42 44 3.1 Parametres d’entrées et indicateur d’évaluation des approches : GenPopSyn et SpatPopSyn 3.1.1 Paramètres d’entrées de l’approche GenPopSyn 3.1.2 Paramètres d’entrées de l’approche SpatPopSyn 3.1.3 Indicateur d’évaluation des approches GenPopSyn et SpatPopSyn 3.1.4 Conclusion 3.2 Expérimentations des approches : GenPopSyn et SpatPopSyn 3.2.1 Présentation des cas d’études 3.2.1.1 Données de Can Tho 3.2.1.2 Données des municipalités d’Abrest et de Bellerive-sur-Allier 3.2.2 Résultats d’expérimentations et interprétations 3.2.2.1 Capacité de l’approche GenPopSyn selon la taille de la population générer et en absence de données significatives 3.2.2.2 Capacité de l’approche GenPopSyn selon la taille de la population générer et en présence de données significatives 3.2.2.3 Comparaison de l’approche GenPopSyn l’approche (Gargiulo et al., 2010) 3.2.2.4 Capacité de l’approche SpatPopSyn localiser une population selon le type de données disponibles 3.2.3 Conclusion 44 44 44 44 46 46 47 47 49 50 50 52 55 56 57 Conclusion 59 Annexe A : Algorithme de l’approche IPU (Ye et al., 2009) 60 Annexe B : Différentes distributions de l’approche GenPopSyn pour les municipalités d’Abrest et de Bellerive-sur-Allier 61 Paterne Chokki Page III « Génération de population synthétique localisée » Annexe C : Résultats de localisation de la population de Ninh Kieu en utilisant une grille 63 Références bibliographiques 65 Paterne Chokki Page IV « Génération de population synthétique localisée » Remerciements Nous tenons saisir cette occasion pour adresser nos profonds remerciements et nos profondes reconnaissances : • M Benoit Gaudou et M Frédéric Amblard, pour leurs précieux conseils et leurs orientations tout au long de notre recherche • Tout le personnel du Laboratoire IRIT - Equipe SMAC principalement Thai, Thomas et Charles pour leur assistance sur le lieu de stage • Tous les professeurs de l’IFI, qui ont su assurer sans faille notre formation tout au long des trois semestres passés au sein de l’institut À tous ceux qui ont contribué de près ou de loin l’élaboration de ce travail, je vous dis Merci Paterne Chokki Page V « Génération de population synthétique localisée » Résumé Les modèles base d’agents sont devenus aujourd’hui des outils importants d’aide la décision pour la gestion des systèmes socio-environnementaux complexes Ces modèles pour la plupart nécessitent généralement des ensembles de données réalistes pour initialiser et calibrer le système étudié Une reproduction précise des états initiaux du système est donc extrêmement importante afin d’obtenir des prévisions fiables partir du modèle Notre étude s’inscrit dans le cadre du projet ANR Genstar et consiste proposer une approche qui permettra de générer une population synthétique réaliste et de la localiser dans l’environnement d’étude L’approche proposée est ainsi subdivisée en deux modules : un module pour la génération de la population synthétique (GenPopSyn) et un autre module pour la localisation de la population (SpatPopSyn) Le module GenPopSyn est en effet une approche qui contrairement aux approches existantes ne nécessite pas beaucoup de données disponibles sur la population pour son bon fonctionnement et qui se base en partie sur l’approche (Ye et al., 2007) Quant au module SpatPopSyn, il est un regroupement de approches existantes : (Goodchild & Lam, 1980), (Tobler, 1979), (Roy & Blaschke, 2014), (Kim & Choi, 2011), (Riebel & Buffalino, 2005), (Xie, 1995) qui ont été choisies pour localiser la population selon le type de données disponibles sur l’environnement d’étude En effet, l’avantage majeur du module SpatPopSyn est qu’il permet de choisir pour un environnement d’étude donné l’approche qui convient le mieux parmi les approches implémentées Les résultats d’expérimentations du module GenPopSyn sur des données INSEE de deux municipalités de la France (Abrest et Bellerive-sur-Allier) et sur des données de la ville de Can Tho (Vietnam) montrent dans l’ensemble que l’approche proposée donne de très bons résultats par rapport aux données réelles (soit un taux de correspondance d’environ 95%) et également par rapport l’approche (Gargiulo et al., 2010) Des résultats de localisation de la population de Ninh Kieu, Can Tho en utilisant deux approches du module SpatPopSyn ont été également présentés Mots clés : modèles base d’agents, population synthétique, localisation Paterne Chokki Page VI « Génération de population synthétique localisée » Abstract Agent-based models have now become important tools of decision support for the management of complex socio-environmental systems These models generally require a lot of realistic datasets to initialize and calibrate the system studied An accurate reproduction of the initial states of the system is extremely important to obtain reliable results from the model predictions Our study is part of the ANR Genstar project and aims providing an approach that will generate a realistic synthetic population and locate it in the environment studied The proposed approach is thus divided into two modules : a module for generating the synthetic population (GenPopSyn) and another module for the location of the population (SpatPopSyn) The GenPopSyn module is indeed an approach that unlike existing approaches does not require a lot of data available on the population for its operation and is based in part on the approach (Ye et al., 2007) The SpatPopSyn module is a collection of six existing approaches : (Goodchild & Lam, 1980), (Tobler, 1979), (Roy & Blaschke, 2014), (Kim & Choi, 2011), (Riebel & Buffalino, 2005), (Xie, 1995) that have been chosen to locate the population depending on the available data on the environment studied Indeed, the major advantage of SpatPopSyn module is that it allows choosing for a chosen environment the right approach among the approaches implemented The results of experiments of the GenPopSyn module on INSEE data from two municipalities in France (Abrest and Bellerive-sur-Allier) and on data from the city of Can Tho (Vietnam) show overall that the proposed approach gives good results against actual data (either a match rate of about 95%) and also compared to the approach (Gargiulo et al., 2010) The results of localization of the population of Ninh Kieu, Can Tho using two approaches of the SpatPopSyn module are also presented Keywords : Agent-based models, Synthetic population, Localization Paterne Chokki Page VII « Génération de population synthétique localisée » Liste des figures 1.1 1.2 1.3 2.1 2.2 2.3 2.4 2.5 2.6 2.7 3.1 3.2 3.3 3.4 Exemple d’application de l’approche ’Point interpolation’ (Martin, 2009) Exemple d’application de l’approche ’pycnophylactic interpolation’ (Deichmann, 1996) Exemple d’application de l’approche (Rase, 2000) Diagramme de classe des entités de l’approche GenPopSyn Organigramme de détermination de la meilleure approche de localisation utiliser dans l’approche SpatPopSyn Diagramme de classe des entités de l’approche SpatPopSyn Exemple d’intersection entre l’environnement d’étude et une grille (Milego & Ramos, 2011) Exemple d’affectation d’une cellule une seule zone source (Milego & Ramos, 2011) Exemple d’intersection entre les bâtiments de l’environnement d’étude et une grille (Roy & Blaschke, 2014) Diagramme de classe des entités de l’approche GenPopSyn et SpatPopSyn Données SIG de Ninh Kieu Contours des différents quartiers de Ninh Kieu Distribution des individus par âge de l’approche (Garguilo et al., 2010) Les barres correspondent aux moyennes obtenues avec 100 générations et l’erreur correspond l’écart-type de ces 100 générations Distribution des individus par âge de l’approche GenPopSyn Les barres correspondent aux moyennes obtenues avec générations et l’erreur correspond l’écart-type de ces générations qui est nul dans ce cas Paterne Chokki 11 12 12 20 35 36 36 37 39 42 50 51 56 56 Page VIII « Génération de population synthétique localisée » Liste des tableaux 1.1 Récapitulatif des approches dans le domaine de la localisation de la population 16 2.1 2.2 2.3 Caractéristiques primaires des individus et des ménages Différentes étapes de l’approche GenPopSyn Tableau comparatif des plateformes de simulation multi-agents 2011) 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 3.10 3.11 3.12 3.13 3.14 3.15 3.16 (Amouroux, Paramètres d’entrées de l’approche GenPopSyn Paramètres d’entrées de l’approche SpatPopSyn Distribution des ménages par taille et par niveau de vie du ménage dans les zones urbaines Distribution des ménages par taille et par niveau de vie du ménage dans les zones rurales Distribution des individus par âge et par sexe de l’individu dans les zones urbaines (à gauche) et dans les zones rurales (à droite) Données sur les populations des quartiers de Ninh Kieu Distribution du nombre de ménages par type de la municipalité d’Abrest (INSEE, 1999) Distribution du nombre de ménages par type de la municipalité de Bellerivesur-Allier (INSEE, 1999) Distribution du nombre d’individus par âge et par statut familial (sauf le statut familial autre) de la municipalité d’Abrest (INSEE, 1999) Distribution du nombre d’individus par âge et par statut familial (sauf le statut familial autre) de la municipalité de Bellerive-sur-Allier (INSEE, 1999) Distribution du nombre d’individus par âge de la municipalité d’Abrest (INSEE, 1999) Distribution du nombre d’individus par âge de la municipalité de Bellerivesur-Allier (INSEE, 1999) Distribution du nombre de ménages par taille de la municipalité d’Abrest (INSEE, 1999) Distribution du nombre de ménages par taille de la municipalité de Bellerivesur-Allier (INSEE, 1999) Paramètres d’entrées spécifiques l’expérimentation : Capacité de l’approche GenPopSyn selon la taille de la population générer et en absence de données significatives Résultats de l’expérimentation : Capacité de l’approche GenPopSyn selon la taille de la population générer et en absence de données significatives Paterne Chokki 19 32 43 45 46 48 48 49 49 50 50 51 52 52 52 53 53 53 54 Page IX « Génération de population synthétique localisée » Tableau 3.13 – Distribution du nombre de ménages par taille de la municipalité d’Abrest (INSEE, 1999) Tableau 3.14 – Distribution du nombre de ménages par taille de la municipalité de Bellerive-sur-Allier (INSEE, 1999) l’approche GenPopSyn pour cette expérimentation sont présentées l’Annexe B Au vu des valeurs de Moy_PGPG_DE_I et Moy_PGPG_DE_M, nous pouvons dire que l’approche GenPopSyn arrive bien reproduire les données d’évaluation des individus et des ménages et ce quelque soit la taille de la population générer Une autre remarque qu’on peut également tirer des valeurs de Moy_PGPG_DE_I et Moy_PGPG_DE_M est que plus la taille de la population est grande, plus les mesures statistiques Moy_PGPG_DE_I et Moy_PGPG_DE_M sont bonnes En ce qui concerne les valeurs de Moy_PGPG_DV_M, nous pouvons dire que l’approche GenPopSyn arrive bien reproduire les données de validation des ménages et ce quelque soit la taille de la population générer Cela vient confirmer que les populations synthétiques générées sont de bonne qualité car comme on l’a dit les données de validation sont des données qui ne sont pas utilisées lors de la génération des populations synthétiques mais qui sont utilisées pour valider la qualité des populations synthétiques générées Une autre remarque qu’on peut également tirer des valeurs de Moy_PGPG_DV_M est que plus la taille de la population est grande, plus la mesure statistique Moy_PGPG_DV_M est bonne De plus, les différents écart-types présentés dans le tableau 3.18 montrent que la différence d’erreur entre les générations est négligeable ainsi on pourrait des fois générer une seule fois la population au lieu de la générer n fois vu que les résultats sont très semblables Ainsi, trois grandes conclusions peuvent ressortir de ces résultats La première est que l’approche GenPopSyn arrive donner de très bons résultats en présence de données significatives et ce quelque soit la taille de la population générer dans des temps raisonnables Tableau 3.15 – Paramètres d’entrées spécifiques l’expérimentation : Capacité de l’approche GenPopSyn selon la taille de la population générer et en absence de données significatives Paterne Chokki Page 53 « Génération de population synthétique localisée » Tableau 3.16 – Résultats de l’expérimentation : Capacité de l’approche GenPopSyn selon la taille de la population générer et en absence de données significatives La seconde est que l’approche GenPopSyn arrive bien reproduire aussi bien les données d’évaluation que les données de validation et ce quelque soit la taille de la population générer Et la dernière est que plus la taille de la population est importante, plus la mesure statistique PGPG devient meilleure et tend vers 100% Mais comparativement au cas où il n’y a pas de données significatives, ces résultats sont moins bons Cela se justifie par le fait que comme il y a plus de données sur la population il y a plus de contraintes respecter au niveau de l’étape de détermination des poids faisant ainsi que cette étape dans ce cas est un peu plus compliquée par rapport au cas précédent Tableau 3.17 – Paramètres d’entrées spécifiques l’expérimentation : Capacité de l’approche GenPopSyn selon la taille de la population générer et en présence de données significatives Paterne Chokki Page 54 « Génération de population synthétique localisée » Tableau 3.18 – Résultats de l’expérimentation : Capacité de l’approche GenPopSyn selon la taille de la population générer et en présence de données significatives 3.2.2.3 Comparaison de l’approche GenPopSyn l’approche (Gargiulo et al., 2010) Le but de cette expérimentation est de comparer l’approche proposée par rapport l’approche (Gargiulo et al., 2010) Nous utilisons pour cette expérimentation les données des municipalités d’Abrest et de Bellerive- sur-Allier car ce sont ces données qui ont été utilisées dans l’approche (Gargiulo et al., 2010) ) Nous tenons rappeler que les données sur la population utilisées ici sont des données de 1999 contrairement aux données de 1990 utilisées dans l’approche (Gargiulo et al., 2010) En effet, nous n’avons pas pu avoir accès aux données de 1990 d’où le choix d’utiliser les données de 1999 qui sont des données très semblables celles de 1990 (INSEE, 1999) La comparaison entre notre approche et l’approche (Gargiulo et al., 2010) sera faite en comparant la distribution des deux approches pour la caractéristique âge car c’est seulement cette distribution qui est le point commun entre les résultats présentées par l’approche (Gargiulo et al., 2010) dans son article et nos résultats Les figures 3.3 et 3.4 présentent les résultats obtenus respectivement par l’approche (Gargiulo et al., 2010) et par notre approche pour la distribution des individus par âge dans les municipalités d’Abrest et de Bellerive-sur-Allier Les données en rouge représentent les données générées et celles en bleu représentent les données réelles En abscisse, nous avons les tranches d’âge et en ordonnée la proportion de la population de chacune de ces tranches d’âge par rapport la population totale Au vu de ces résultats, nous pouvons dire que l’approche GenPopSyn parvient mieux distribuer les individus selon leur âge par rapport l’approche (Gargiulo et al., 2010) et ce pour les deux municipalités Les très bons résultats obtenus par notre approche viennent du fait que lors de la génération de la population, on vérifie chaque fois s’il est possible de générer un ménage donné avec un certain nombre d’individus ayant des âges donnés sans Paterne Chokki Page 55 « Génération de population synthétique localisée » que cela ne cause pas d’erreur sur les contraintes de la population si c’est le cas on génère le ménage sinon on ne le génère pas et de plus l’étape de génération des ménages complexes nous permet de distribuer les individus restants dans des ménages permettant ainsi de ne pas avoir d’erreur dans la distribution d’âge contrairement l’approche (Gargiulo et al., 2010) Cependant, nous ne pouvons pas conclure que notre approche est meilleure que celle de l’approche (Gargiulo et al., 2010) sans plus d’expérimentations Mais cela prouve au moins que notre approche permet de bien distribuer la population en respectant leur âge par rapport l’approche (Gargiulo et al., 2010) et ce quelque soit la taille de la population ce qui n’est pas le cas au niveau de l’approche (Gargiulo et al., 2010) qui donne des résultats biaisés surtout lorsque la taille de la population est petite Figure 3.3 – Distribution des individus par âge de l’approche (Garguilo et al., 2010) Les barres correspondent aux moyennes obtenues avec 100 générations et l’erreur correspond l’écart-type de ces 100 générations Figure 3.4 – Distribution des individus par âge de l’approche GenPopSyn Les barres correspondent aux moyennes obtenues avec générations et l’erreur correspond l’écart-type de ces générations qui est nul dans ce cas 3.2.2.4 Capacité de l’approche SpatPopSyn localiser une population selon le type de données disponibles Le but de cette expérimentation est de tester la capacité de l’approche SpatPopSyn localiser une population selon le type de données disponibles Ainsi pour cela, nous utilisons les données GIS disponibles sur Ninh Kieu pour localiser la population de ce district Deux types de données auxiliaires (bâtiments et routes) existent dans les données GIS de Ninh Paterne Chokki Page 56 « Génération de population synthétique localisée » Kieu Nous appliquons donc les approches (Roy & Blaschke, 2014) et (Riebel & Buffalino, 2005) qui semblent les plus adaptées pour ces différents types de données vu que Ninh Kieu est une zone urbaine et qu’on ne dispose pas des données sur les classes des routes Le tableau 3.19 présente les paramètres d’entrées utilisés pour cette expérimentation Tableau 3.19 – Paramètres d’entrées spécifiques l’expérimentation : Capacité de l’approche SpatPopSyn localiser une population selon le type de données disponibles En effet pour évaluer les résultats de localisation des deux approches, nous comparons les populations obtenues par ces deux approches pour les différents quartiers de Ninh Kieu par rapport aux populations réelles de ces quartiers en utilisant la mesure statistique PGPS La population obtenue pour un quartier donné est déterminée en faisant la somme des populations des cellules contenues dans ce quartier Les résultats de localisation de ces approches en utilisant une grille sont présentés l’annexe C Le tableau 3.20 présente les valeurs de la mesure statistique PGPS pour les différentes approches Tableau 3.20 – Résultats de l’expérimentation : Capacité de l’approche SpatPopSyn localiser une population selon le type de données disponibles Au vu des résultats du tableau 3.20, nous constatons que les approches (Roy & Blaschke, 2014) et (Riebel & Buffalino, 2005) arrivent bien localiser la population et de plus dans des temps raisonnables ce qui confirme que ces approches sont bien adaptées ces types de données Une autre remarque est que la mesure statistique PGPS de l’approche (Roy & Blaschke, 2014) est meilleure celle de l’approche (Riebel & Buffalino, 2005) ce qui vient confirmer la qualité de notre méthode de détermination de l’approche la plus appropriée selon le type de données car comme on l’avait dit l’approche la plus adaptée lorsque la zone d’étude est urbaine et qu’on n’a pas de données sur les classes des routes est l’approche (Roy & Blaschke, 2014) Cependant, le bon résultat obtenu par l’approche (Riebel & Buffalino, 2005) se justifie par le fait que les routes représentées dans les données GIS sont pour la majorité des routes ayant la classe « living_street » ou « residentiel » c’est dire des routes autour desquelles on trouve des maisons ce qui permet ainsi cette approche de bien localiser la population 3.2.3 Conclusion Somme toute, nous avons eu présenter les différentes expérimentations faites sur les approches GenPopSyn et SpatPopSyn Au vu des différents résultats obtenus lors de ces Paterne Chokki Page 57 « Génération de population synthétique localisée » expérimentations, il en ressort que l’approche GenPopSyn arrive bien générer une population synthétique réaliste aussi bien en absence qu’en présence de données significatives sur la population et également pour n’importe quelle taille de la population tout en essayant de reproduire le plus fidèlement possible les données d’évaluation et de validation de la population Une comparaison entre l’approche GenPopSyn et l’approche (Gargiulo et al., 2010) montre également que notre approche présente de meilleurs résultats partielles par rapport l’approche (Gargiulo et al., 2010) Cependant, il faudra faire d’autres expérimentations pour confirmer cela Des résultats de localisation en utilisant l’approche SpatPopSyn montrent que l’approche SpatPopSyn permet de bien localiser une population donnée en utilisant l’approche adéquate selon le type de données disponibles Paterne Chokki Page 58 « Génération de population synthétique localisée » Conclusion et perspectives Les modèles base d’agents sont devenus aujourd’hui des outils incontournables pour la compréhension des systèmes complexes L’un des défis majeurs dans l’implémentation de ces modèles est leur initialisation L’étude effectuée au cours ce stage s’inscrit dans cet ordre d’idées et consiste proposer une approche qui permettra de générer une population synthétique et ensuite de la localiser dans un environnement d’étude donné Ainsi pour répondre ces objectifs, nous avons proposé deux approches : une approche pour la génération de la population synthétique nommée GenPopSyn et une autre pour la localisation de la population synthétique nommée SpatPopSyn L’avantage majeur de l’approche GenPopSyn est le fait qu’elle ne nécessite pas beaucoup de données pour la génération d’une population synthétique contrairement aux approches existantes Un autre avantage de cette approche est qu’elle permet d’ajouter autant de caractéristiques qu’on veut aux individus et aux ménages même après que la population soit déjà générée En ce qui concerne l’approche SpatPopSyn, son avantage majeur est qu’elle regroupe plusieurs approches existantes et elle permet de déterminer l’approche qui semble adéquate selon le type de données disponibles sur l’environnement d’étude La limite qu’on peut souligner dans l’approche GenPopSyn est que nous avons fixé les différents types de ménages ce qui fait qu’elle est adaptée plus pour des pays dans lesquels les différents types de ménages correspondent ceux définis dans l’approche GenPopSyn sinon on met les types de ménages non définis dans les ménages complexes Des expérimentations faites sur l’approche GenPopSyn montrent dans l’ensemble que l’approche GenPopSyn arrive bien générer une population synthétique réaliste aussi bien en absence qu’en présence de données significatives sur la population et ce pour n’importe quelle taille de la population et montrent également que l’approche GenPopSyn présente de meilleurs résultats partielles par rapport l’approche (Gargiulo et al., 2010) En ce qui concerne les expérimentations faites sur l’approche SptatPoSyn, elles montrent que l’approche SptatPoSyn permet de bien localiser une population donnée en utilisant l’approche adéquate selon le type de données disponibles Comme perspectives de ce travail, nous proposons de faire d’autres expérimentations afin de confirmer la performance des approches proposées et aussi pour pouvoir les comparer avec d’autres approches existantes Nous proposons également d’optimiser la performance de l’approche GenPopSyn en rendant dynamique l’étape de composition des ménages et en permettant aussi la permutation des individus lors de la génération de la population comme fait dans l’approche (Barthelemy & Toint., 2013) Paterne Chokki Page 59 « Génération de population synthétique localisée » Annexe A : Algorithme de l’approche IPU (Ye et al., 2009) Cette annexe présente en détail l’algorithme utilisé par l’approche IPU pour correspondre les distributions des ménages et les distributions individuelles ainsi qu’un exemple d’application de l’algorithme (voir figure la fin de l’Annexe C) Cet algorithme se présente comme suit (Ye et al., 2009) : Paterne Chokki Page 60 « Génération de population synthétique localisée » Annexe B : Différentes distributions de l’approche GenPopSyn pour les municipalités d’Abrest et de Bellerive-sur-Allier Cette annexe présente les différents résultats obtenus lors de la génération de la population des municipalités de Bellerive-sur-Allier et d’Abrest en utilisant l’approche GenPopSyn Les données en bleu sur les différentes figures représentent les données réelles et celles en rouge les données obtenues par l’approche GenPopSyn Les barres en rouge correspondent aux moyennes obtenues avec générations et l’erreur correspond l’écart-type de ces générations qui est nul dans ces cas Distribution des individus par âge dans la municipalité de Bellerive-sur-Allier : données réelles VS données générées par l’approche GenPopSyn Distribution des ménages par taille dans la municipalité de Bellerive-sur-Allier : données réelles VS données générées par l’approche GenPopSyn Paterne Chokki Page 61 « Génération de population synthétique localisée » Distribution des individus par âge dans la municipalité d’Abrest : données réelles VS données générées par l’approche GenPopSyn Distribution des ménages par taille dans la municipalité d’Abrest : données réelles VS données générées par l’approche GenPopSyn Distribution des ménages par type dans la municipalité d’Abrest : données réelles VS données générées par l’approche GenPopSyn avec générations Distribution des ménages par type dans la municipalité de Bellerive-sur-Allier : données réelles VS données générées par l’approche GenPopSyn avec générations Paterne Chokki Page 62 « Génération de population synthétique localisée » Annexe C : Résultats de localisation de la population de Ninh Kieu en utilisant une grille Cette annexe présente les différents résultats obtenus lors de la localisation de la population de Ninh Kieu en utilisant les approches (Roy & Blaschke, 2014) et (Riebel & Buffalino, 2005) En effet, comme nous l’avons mentionné nous localisons les individus sur des cellules ainsi les résultats présentées sur les figures correspondent au nombre d’individus se trouvant sur chacune des différentes cellules Plus la couleur d’une cellule est foncée plus le nombre d’individus sur cette cellule est importante La couleur blanche correspond une population nulle Résultat de localisation de la population de Ninh Kieu en utilisant l’approche (Roy & Blaschke, 2014) Paterne Chokki Page 63 « Génération de population synthétique localisée » Résultat de localisation de la population de Ninh Kieu en utilisant l’approche (Riebel & Buffalino, 2005) Exemple d’application de l’approche IPU (Ye et al., 2009) Paterne Chokki Page 64 « Génération de population synthétique localisée » Références bibliographiques • Gargiulo, F., Ternes, S., Huet, S., & Deffuant, G (2010) An iterative approach for generating statistically realistic populations of households PloS One, 5(1), e8828 doi :10.1371/ journal.pone.0008828 • MobiSim, 2012 Rapport intermediare du projet MobiSim : Module D1 − Population et logements www.mobisim.org • Wilson, A.G., & Pownall,C.E.(1976).A new representation of the urban system for modeling and for the study of micro−level interdependence Area 8, pp.246−254 • Voas,D., & Williamson, P.(2000) An evaluation of the combinatorial optimization ap proach to the creation of synthetic microdata International Journal of Population Geography (6) pp.349−366 • Deming, W E., & Stephan, F F (1940) On a least squares adjustment of a sample frequency table when the expected marginal totals are known Annals of Mathematical Statistics 11, 427−444 • Müller K., & Axhausen, K.W (2010) Population synthesis for microsimulation : State of the art, TRB 2011 Annual Meeting, 1−21 • Arentze, T., Timmermans, H.J.P., & Hofman, F (2007) Creating Synthetic Household Populations : Problems and Approach Transportation Research Record : Journal of the Transportation Research Board 2014 : 85−91 • Ye, X., Konduri, K., Pendyala, R.M., Sana B., & Waddel, P (2009) A Methodology to Match Distributions of Both Household and Person Attributes in the Generation of Synthetic Populations Washington, U.S.A., 2009 Transportation Research Board − 88th Annual Meeting • Guo, J.Y., Bhat, C.R (2007) Population Synthesis for the Microsimulating Travel Behavior Transportation Research Record : Journal of the Transportation Research Board 2014 : 92−101 • Huang, Z., Williamson, P (2001) A Comparison of Synthetic Reconstruction and Combinatorial Optimisation Approaches to the Creation of Small−Area Microdata Working paper Liverpool, United Kingdom : University of Liverpool, Department of Geography • Barthélemy, J., Toint, P.,L (2013) Synthetic Population Generation Without a Sample Transportation Science 47(2) : 266−279 Paterne Chokki Page 65 « Génération de population synthétique localisée » • Lenormand, M., & Deffuant, G (2013) Generating a Synthetic Population of Individuals in Households : Sample−Free Vs Sample−Based Methods, Journal of Artificial Societies and Social Simulation 16 (4) 12 http ://jasss.soc.surrey.ac.uk/ 16/4/12.html, 2013 • Martin, D (2009) Gridded population data for the UK−redistribution models and applications http ://www.globalchange.gov/sites/globalchange/files/Martin UK−gri dded−pop.PDF • Goodchild, M.F., & Lam, N.S.−N 1980 Areal interpolation : A variant of the traditional spatial problem Geo−processing : 297−312 • Deichmann, U (1996) A review of Spatial Population Database design and Modeling Technical Report • Tobler, W.R (1979), Smooth pycnophylactic interpolation of geographical regions, Journal of the American Statistical Association, 74, 367 :519−530 • Rase, W.D (2000) Volume−preserving interpolation of a smooth surface for polygon− related data Journal of Geographical Systems (2001) : 199−213 • Fisher, P.F., & Langford., M (1996) Modeling sensitivity to accuracy in classified imagery : A study of areal interpolation by dasymetric mapping The Professional Geographer 48(3) : 299−309 • Eicher, C.L., & Brewer, C (2001) Dasymetric mapping and areal interpolation : Implementation and evaluation Cartography and Geographic Information Science 28(2) : 125−38 • Kim, K & Choi, J (2011) A Hybrid Dasymetric Mapping for Population Density Surface using Remote Sensing Data Journal of the Korean Geographical Society Vol 46, No : 67 −80 • Riebel, M., & Buffalino, M (2005) Street−weighted interpolation techniques for demographic count estimates in incompatible zone systems Environment & Planning A 37 : 127−39 • Tapp, A.F (2010) Areal Interpolation and Dasymetric Mapping Methods Using Local Ancillary Data Sources Cartography and Geographic Information Science, Vol 37, No 3, 2010, pp 215−228 • Xie, Y (1995) The overlaid network algorithm for areal interpolation problem Computers, Environment and Urban Systems 19(4) : 287−306 • Hawley, K J (2005) A comparative analysis of areal interpolation methods Thesis of the requirements for the degree Master of Arts Paterne Chokki Page 66 « Génération de population synthétique localisée » • Zandbergen, P A (2011) Dasymetric Mapping Using High Resolution Address Point Datasets Transactions in GIS, 2011, 15(s1) : 5−27 • GAMA platform (2010) http :// www.gama−platform.googlecode.com • OpenStreetMap (2004) http ://www.openstreetmap.org/ & http ://wiki.openstreetmap org/ wiki/Map−Features • Milego, R & Ramos, M.J (2011) Disaggregation of socioeconomic data into a regular grid and combination with other types of data Technical report • Roy, D C & Blaschke T (2014) A grid−based approach for refining population data in rural areas Journal of Geography and Regional Planning • Amouroux, E (2011) KIMONO : une méthode de modélisation descriptive centrée agent pour l’explication des systèmes complexes, une application en épidémiologie, Thèse de doctorat • Harland, K., Heppenstall, A., Smith, D & Birkin, M (2012) Creating realistic synthetic populations at varying spatial scales : A comparative critique of population synthesis techniques Journal of Artificial Societies and Social Simulation 15(1), http ://jasss soc.surrey.ac.uk/15/1/1.html • INSEE (1999) French Population Census of 1999 Centre Maurice Halbwarchs, 48 Boulevard Jourdan, Paris http ://www.recensement−1999.insee.fr/ Paterne Chokki Page 67