Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 67 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
67
Dung lượng
4,52 MB
Nội dung
Rapport de Stage Mod´ elisation de l’information spatiale dans des images 3D biom´ edicales Encadrants : Auteur : Thomas Boudier (UPMC) Tran Thi Nhu Hoa Ludovic Roux (IPAL) Master - Syst`emes Intelligents et Multim´edia Institut de la Francophonie pour l’Informatique Septembre 2014 z z Remerciements Je tiens ` a remercier dans un premier temps, mon encadrant de stage, Monsieur Thomas Boudier, pour m’avoir accueilli au sein de l’´equipe, pour son soutien tout au long du stage, sa disponibilit´e, et ses conseils nombreux et ´eclair´es Je remercie ´egalement Monsieur Ludovic Roux, Monsieur Lu Shijian pour m’avoir aid´e `a me familiariser avec l’environnement de recherche `a IPAL, ses conseils mais surtout pour sa gentillesse et son implication dans mon stage Sans oublier mes amis du bureau des ´etudiants IPAL, pour l’accueil chaleureux, pour l’ambiance de travail tr`es amicale Merci enfin ` a Mme Coralie Hunsicker pour m’avoir aid´e `a r´esoudre toutes les d´emarches administratives difficiles qui ont permis la r´ealisation de mon stage Tran Thi Nhu Hoa z Table des mati` eres Contents iii List of Figures Introduction 1.1 Introduction 1.1.1 IPAL & Partenaires 1.2 Objectif du stage 1.2.1 Contexte du travail 1.2.2 Objectif du stage v ´ Etat de l’art 2.1 Rappel de biologie 2.1.1 Structure de la cellule 2.1.2 Cancer du sein 2.1.3 Diab`ete et insuline 2.2 Analyse de l’organisation spatiale 2.2.1 Travaux similaires 2.2.2 Analyse ` a l’´echelle locale 2.2.3 Analyse ` a l’´echelle globale 2.2.3.1 Statistique spatiale 2.2.3.2 Fonctions d’estimation de 2.3 Estimation de la distance 2.3.1 Distance euclidienne 2.3.2 Distances g´eod´esiques 2.4 Environnement logiciel utilis´e la distribution Impl´ ementation 3.0.1 Mod´elisation de la structure d’une cellule 3.0.2 Mod´elisation ` a l’´echelle locale 3.0.2.1 Forme analytique de la cellule 3.0.2.2 Formes complexes de la cellule 3.0.3 Mod´elisation ` a l’´echelle globale 3.0.4 Mod´elisation ` a multi-´echelles 3.0.5 Langage de description de l’organisation spatiale 1 2 5 10 10 11 13 13 15 18 18 20 22 24 24 25 25 29 34 38 42 R´ esultat & Discussion 46 4.1 R´esultat 46 iii z Table des mati`eres iv 4.1.1 4.1.2 4.2 R´esultat de mod´elisation de la structure d’une cellule R´esultat de mod´elisation de la distribution de v´esicules dans une cellule 4.1.3 R´esultat des exp´erimentations `a multi-´echelles 4.1.4 R´esultat de g´en´eration al´eatoire des positions des cellules Conclusion et Perspective Bibliographie 47 49 50 52 53 55 z Table des figures 1.1 Image & Pervasive Access Lab (IPAL) logo 2.2 ´ Etapes du cancer du sein : Normal cells, Ductal hyperplasia - trop de cellules Atypical ductal hyperplasia - trop de cellules qui commencent `a apparaˆıtre anormale (´egalement connu sous le nom ADH) Ductal carcinoma in situ - trop de cellules qui se d´eveloppent comme un cancer mais sont encore confin´es a` l’int´erieur du conduit (DCIS) DCIS-MI (DCIS avec micro-invasion) - plusieurs sous-types de DCIS, certains plus graves que d’autres Invasive ductal cancer - L’´etat incontrˆol´e des cellules qui ont pass´e ` a travers des barri`eres tissulaires normales Les ˆılots de Langerhans (A-D) Les micrographies confocales montrent des ˆılots pancr´eatiques de Langerhans `a partir de sections chez l’humain (A), le singe (B), la souris (C) et le cochon (D) L’insuline immunor´eactive (rouge) - β cellule, glucagon immunor´eactive (vert) - α cellule, et la somatostatine-immunor´eactives (cellules bleues - δ cellule) (d’apr`es [1]) 10 Les relations RCC5D et RCC8D Les r´egions sont repr´esent´ees en des cercles dimentions (l’objet plus lumineux est X et l’objet fonc´e est Y) 12 La correspondance de Discrete M´er´eotopologie et Morphologie Math´ematique, d´efini dans RCC8D (d’apr`es [2]) 12 Algorithme de d´etection des relations spatiales entre les r´egions Cet algorithme 0, est cod´ee pour l’image X et 0, est cod´e pour Image Y (0 est le plan arri`ere, le fond et 1, repr´esente la r´egion pixels) L’histogramme de la somme (X + Y) ne contient que valeurs de (fond), (r´egion X), (r´egion Y), ou (ces deux r´egions occupent l’emplacement de ce pixel) et il peut ˆetre utilis´e pour trouver la relation RCC5D entre les r´egions Par exemple si le nombre de pixels de l’histogramme et (les valeurs de r´egions X et Y) sont tous ´egaux `a et la somme S (valeur ´egal `a 3) est sup´erieure ` a 0, la relation est EQ (d’apr`es [2]) 13 Exemple : Illustration 2D de l’extraction de compartiment Promyelocytic Leukemia (PML) (l’image extraite `a partir de l’article de David J Weston, voir [3]) A) l’image d’origine B) PML est segment´e `a partir de cette image C) Chaque noyau est remplac´e par son centre de gravit´e Une question que nous pouvons poser, les composants (en vert ) PML sont distribu´ees au hasard ou ont des relations les uns aux autres 14 Diff´erents types de distribution spatiale Les positions peuvent ˆetre uniform´ement et ind´ependamment distribu´es (compl`etement al´eatoire mod`ele), ou attraction mutuelle (mod`ele agr´eg´e) ou r´epulsion mutuelle (mod`ele r´egulier, uniforme) (d’apr`es [4]) 15 2.3 2.4 2.5 2.6 2.7 2.8 v z Liste des figures 2.9 2.10 2.11 2.12 2.13 2.14 2.15 2.16 2.17 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 vi G-function, les points observ´es - ´ev´enements (events en anglais) : 1, 2, 3, ,12 dans une r´egion d’´etude Pour chaque ´ev´enement, nous avons trouv´e leur voisin avec la plus proche de distance possible (nearest neighbor) Par exemple : le plus proche de l’´ev´enement est l’´ev´enement 10 avec la distance rmin = 25.59 (d’apr`es [5]) Graphe du G-function La forme de function G nous pr´esente la fa¸con dont les ´ev´enements sont espac´ees dans un mod`ele (pattern) de points (d’apr`es [5]) La F-function est la function de distribution cumul´ee de la distance entre les points qui ont ´et´e g´ener´e al´eatoirement dans la r´egion d’´etude (croix bleues) et leur plus proche ´ev´enement (points observ´es - des cercles dans la figure) (d’apr`es [5]) Le r´esultat SDI du F-function (graphe en couleur noire) est la mesure de la distance du vide dans la r´egion d’´etude Cette distance a la tendance `a ˆetre grande pour le mod`ele agr´eg´e et plus petite pour le mod`ele r´egulier Si le graphe de F-function est situ´e entre deux graphes avec les valeurs de confiance 5% et 95%, des ´ev´enement ont la distribution al´eatoire Si cette graphe est situ´e au-dessous du graphe de 5%, c’est-`a-dire une distribution agr´eg´e (cluster) et au-dessus du graphe de 95%, c’est-`a-dire r´egularit´e (uniformit´e) des ´ev´enements dans la r´egion d’´etude Le processus de production de carte de distance pour chaque image Exemple du calcul de la carte de distance Euclidienne Exemple du calcul de la transformation de distance En (a) : image binaire noir et blanc En (b), il s’agit de la distance euclidienne de chaque pixel au pixel noir le plus proche Les valeurs de distance est au carr´e de sorte que seules les valeurs enti`eres sont stock´ees Exemple du calcul de la carte de distance g´eod´esique, r´esultat obtenu en appliquant la fonction ’geodesic’ dans le plugin ’geodesic distance map’ sous le logiciel ImageJ ImageJ - logiciel d’analyse et de traitement d’image Sch´ema de la structure d’une cellule Illustration du calcul relations RCC8 (DC, EC, PO, EQ, TPP, NTPP, TPPi, NTPPi) Illustration du r´esultat de l’algorithme en 2D Des relations spatiales entre les objets S1 , S2 , , Sn et entre ces objets et le domaine de recherche P sont pr´esent´es dans la table de relation Notre but est de produire al´eatoirement ces objets dans le domaine de recherche P et satisfaire ces r`egles de relation Comparaison deux m´ethodes de production d’un mod`ele spatial Illustration du r´esultat de la fonction TPPi calcul du domaine TPPi possible Illustration de l’algorithme : calcul du domaine DC possible ´ Etapes d’impl´ementation de l’algorithme Illustration de l’algorithme : calcul du domaine de distribution en se basant sur le param`etre de distribution α z 16 16 17 17 19 20 21 21 22 25 26 29 29 31 33 34 36 Liste des figures 3.9 3.10 3.11 3.12 3.13 3.14 3.15 3.16 3.17 3.18 3.19 3.20 3.21 vii Illustration d’une ´etape d’impl´ementation de l’algorithme pour produire ´ un mod`ele agr´eg´e (cluster) Etat initial : domaine de recherche P + un objet S1 existant, le but est de g´enerer un objet S2 qui est associ´e avec S1 , ` a l’ext´erieur de S1 Sc´enario : dans la mod´elisation de la structure d’une cellule, les v´esicules S1 , S2 , , Sn sont ` a l’int´erieur de noyau N : le noyau est `a l’int´erieux de cellule P , les v´esicules sont `a l’int´erieur de noyau et les v´esicules sont disconnect´es les uns aux autres Si TPPi N , Si (DC, EC) Sj , Si TPPi P Sc´enario : dans la mod´elisation de la structure d’une cellule, les v´esicules S1 , S2 , , Sn sont ` a l’int´erieur de cytoplasme : les v´esicules sont `a l’int´erieur de la cellule P , l’ext´erieur du noyau N Si TPPi P , Si (DC, EC) Sj , Si DC N Sc´enario : dans la mod´elisation de la structure d’une cellule, les v´esicules S1 , S2 , , Sn sont ` a l’int´erieur du cytoplasme P et `a l’int´erieur ou l’ext´erieur du noyau N Si TPPi P , Si DC, EC Sj , Si DC N ou Si TPPi N Sc´enarios : dans la mod´elisation de la structure des cellules, la premi`ere ´etape du cancer du sein (voir la section 2.1.2), cellules normales S1 , S2 , , Sn , plusieurs cellules ont la connexion externe Si EC Si+1 , Si TPPi P Sc´enario : dans la mod´elisation globale, les v´esicules S1 , S2 , , Sn sont distribu´es al´eatoirement dans le domaine de recherche P Si TPPi P , S ∈ {random} Rdistribution Sc´enario : dans la mod´elisation globale, les v´esicules S1 , S2 , , Sn sont distribu´es r´eguli`erement (repulsion, uniform), chaque v´esicule est le plus S ∈ {unif orm} loin possible des autres Si TPPi P , Rdistribution Sc´enario : dans la mod´elisation globale, les v´esicules S1 , S2 , , Sn sont clusteris´e (mod`ele agr´eg´e) Il s’agit des centroids (des v´esicules attirent l’attention des autres) et des autres ont ´et´e attir´es par les centroids Si S ∈ {clustered} TPP P , Rdistribution Sc´enario : dans la mod´elisation des prot´eins : les prot´eins A sont distribu´es al´eatoirement, les prot´eins B sont colocalis´es avec les prot´eins A, B A disjoint A Comment trouver la distribution des prot´eins B ? Rdistribution B ∈ {random}, B DC A, A, B TPP P , Rdistribution ? Sc´enario : dans la mod´elisation des prot´eins : les prot´eins A sont distribu´es al´eatoirement, les prot´eins B sont colocalis´es avec les prot´eins A, B et A se touchent Comment trouver la distribution des prot´eins B ? A B Rdistribution ∈ {random}, B EC A, A, B TPP P , Rdistribution ? Sc´enario 10 : des clusters en membrane, les v´esicules S1 , S2 , , Sn sont ont la connection int´erieure du membrane Le probl`eme est comment g´en`erer S un mod`ele satisfaisant ces r`egles spatiaux ? Si TPP P , Rdistribution ∈ {clustered} La conception globale des objets Il s’agit de cinq objets, structures principaux : image, algorithme, request, mereo-topologie, structure La conception globale des objets et des relations entre les objets Cette conception fait le lien entre les objets, strutures et r´epondre `a la question comment cette connaissance structurelle et spatiale peut ˆetre utilis´ee pour guider l’interpr´etation d’images z 38 39 39 39 39 39 40 40 40 40 40 43 44 Liste des figures viii 3.22 Impl´ementation du langage de description de l’organisation spatiale n3 Initialement, nous avons d´efini les ontologies, des r`egles, et des queries Ensuite, l’ex´ecution le logiciel EYE Engine sur ces fichiers n3, nous avons obtenu un fichier du r´esultat Apr`es, nous avons utilis´e un programe Java pour lire les structures dans le fichier du r´esultat n3 et obtenu des relations logiques Enfin, nous avons ex´ecut´e le programe sur des images d’entr´ee et des requˆetes, obtenu des images de sortie 45 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 L’interface du programme - un plugin ”3D Statistic” avec des options sous le logiciel ImageJ (2.4) Choisir l’option 3D Aggregated Pattern dans le plugin ”3D Statistic” sous le logiciel ImageJ (2.4), une fˆenetre pour saisir des param`etres d’entr´ee comme le nombre des clusters, la taille de la cellule R´esultat de g´en´eration d’un mod`ele spatial dans le sc´enario 3.0.4 en 2D Il s’agit de v´esicules sont `a l’int´erieur du noyau et noyau est `a l’int´erieur de la cellule R´esultat de g´en´eration d’un mod`ele spatial dans le sc´enario 3.0.4 en deux dimentions Il s’agit de 10 v´esicules sont `a l’int´erieur de la cellule et `a l’ext´erieur du noyau Le noyau est `a l’int´erieur de la cellule R´esultat de g´en´eration d’un mod`ele spatial dans le sc´enario 3.0.4 en deux dimentions Il s’agit de 13 v´esicules sont `a l’int´erieur de la cellule et a l’ext´erieur du noyau, v´esicules sont `a l’int´erieur de la cellule et `a ` l’int´erieur du noyau Le noyau est `a l’int´erieur de la cellule R´esultat dans la mod´elisation d’une cellule en trois dimentions, il s’agit de v´esicules qui sont `a l’int´erieur de la cellule et sont disjointes R´esultat de g´en´eration du mod`ele des cellules normales dans la premi`ere ´etape du cancer du sein (voir la section 2.1.2) R´esultat de g´en´eration du mod`ele spatial en mod´elisation `a l’´echelle globale en ex´ecution le plugin 3D Statistic sous ImageJ Dans la figure, nous avons obtenu trois mod`eles de distribution qui correspondent `a trois sc´enarios (3.0.4, 3.0.4, 3.0.4) Le graphe de F-function (la couleur bleu) la figure (A) est situ´e entre deux graphes (en couleur vert) 5% et 95% avec la valeur de confiance de F-function SDI = 0.65 ou 65% c’est-`a-dire, la distribution al´eatoire - les v´esicules al´eatoire Cette graphe - la figure (B) est situ´e au-dessous du graphe de 5% , avec la valeur de confiance de Ffunction SDI = 0.02, c’est-`a-dire la distribution agr´eg´e (les v´esicules clusteris´es) Le graphe de F-function (la couleur bleu) au-dessus du graphe de 95% avec la valeur de confiance de F-function SDI = 1.0 - 100% dans la figure (C), c’est-` a-dire r´egularit´e (uniformit´e) des v´esicules uniforme dans la r´egion d’´etude Les r´esultats obtenus montrent que les mod`eles spatiaux a ´et´e produit correctement R´esultat de g´en´eration du mod`ele spatial en mod´elisation `a multi-´echelle, correspond au sc´enario (3.0.4) - cluster en membrane Les diff´erents types de cellules α, β, δ `a l’origine Par convention l’insuline est produite par les cellules β en couleur rouge, le glucagon est produit par les cellules α en couleur verte, la somatostatine est produite par les cellules δ en couleur bleu Le r´esultat de g´en´eration al´eatoire les positions des cellules δ (les cellules δ en couleur bleu, β en couleur rouge, α en couleur verte) z 46 47 47 48 48 48 49 50 51 52 53 Liste des figures ix 4.12 R´esultat du F-function (le graphe en couleur bleu) et r´esultat du Gfunction (le graphe en couleur rouge) en estimant la distribution des cellules δ dans propositions d’organisation spatiale La valeur SDI de F-function dans cas : n1 = 0.98, n2 = 0.98, n3 = 0.35, n4 = 0.87, n5 = 0.87 C’est-` a-dire dans deux premiers cas, les cellules δ sont clusteris´e, les autres cas, les cellules δ sont g´ener´es al´eatoirement 53 z Impl´ementation 42 Function genererElementPerCluster(listeCentroid C, n) foreach ci ∈ C iteration = ; ; listeVesiculesClusterCi Ei = ∅ ; listeVesiculesClusterCi Ei ajouter ci ; while iteration