1. Trang chủ
  2. » Công Nghệ Thông Tin

Pratique de MySQL et PHP- P72 potx

5 205 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 5
Dung lượng 140,36 KB

Nội dung

8.3 Import de données XML dans MySQL 333 Le modèle DOM s’appuie sur une représentation arborescente. Chaque nœud de l’arbre est un objet, doté de méthodes propres au type du nœud, et de pointeurs vers le ou les sous-arbres, le père du nœud, les attributs, etc. On utilise plutôt DOM pour les applications qui doivent disposer en mémoire de l’ensemble de la représentation d’un document, comme par exemple un éditeur XML, un processeur de transformations XSLT, le langage de requête XQuery, etc. DOM est connu pour être gourmand en mémoire et parfois lent, et il est préférable d’éviter d’y recourir quand c’est possible. Pour en savoir plus sur DOM, vous pouvez consulter la recommandation du W3C, disponible sur le site http://www.w3c.org/dom. PHP propose de plus une interface de manipulation de données XML, dite SimpleXML, qui fournit quelques fonctions très simples pour accéder au contenu d’un document. L’arborescence XML est représentée par SimpleXML comme une imbrication de tableaux PHP, accompagnée de quelques fonctions pour rechercher des éléments ou des attributs. SimpleXML peut être vue comme une version très basique de DOM (PHP fournit d’ailleurs une conversion depuis un objet DOM vers un objet SimpleXML). La présentation qui suit montre successivement comment traiter un document XML avec SimpleXML, puis SAX, à chaque fois dans l’optique d’extraire des données du document pour les insérer dans MySQL. L’annexe C, page 500 récapitule les fonctions utilisées. 8.3.1 SimpleXML Le fonctionnement de SimpleXML est comparable à celui d’une fonction comme mysql_fetch_object() : on crée un objet PHP (instance de la classe prédéfinie SimpleXMLElement) contenant une représentation de la source de données externe. Dans le cas de mysql_fetch_object(), la source de données est une ligne d’une table relationnelle, ce qui se représente simplement par une liste d’attributs de l’objet. Dans le cas de SimpleXML, l’objet créé a une structure nettement plus complexe. Elle s’appuie sur une représentation arborescente constituée d’une hiérarchie d’éléments dotée d’un unique élément racine. Voici les règles de construction qui aident à comprendre la représentation : • l’objet instancié par SimpleXML correspond à l’élément racine du document ; • les attributs publics de cet objet sont les éléments-fils de l’élément racine ; eux- mêmes sont des objets PHP de la classe SimpleXMLElement, ou un tableau d’objets s’il y a plusieurs occurrences d’un élément de même nom ; • les attributs sont stockés dans une propriété privée de l’objet, accessible grâce àlaméthodeattributes(). Ces règles s’appliquent, récursivement, aux éléments-fils de l’élément racine et à tous ses descendants. Prenons le cas du document XML KillBill.xml, page 331. Après analyse par SimpleXML, on obtiendra un objet référençant l’élément racine (correspondant à la balise <Films> du document). Les propriétés de cet objet sont les fils de l’élément racine, soit titre, annee, code_pays, genre, resume, id_realisateur, Realisateur et Acteur. Ce dernier est 334 Chapitre 8. XML un tableau indicé d’objets puisqu’on trouve plusieurs occurrences de l’élément <Acteur>. Voici un exemple de code SimpleXML extrayant des informations de cette structure. Exemple 8.11 exemples/ExSimpleXML.php : Application de l’API SimpleXML <?xml version=" 1.0 " encoding=" iso −8959−1"?> <!DOCTYPE h t ml PUBLIC " −/ /W3C / / DTD XHTML 1 . 0 S t r i c t / / EN " "http ://www.w3. org /TR/xhtml1/DTD/xhtml1−strict.dtd"> <html xmlns="http ://www.w3. org/1999/xhtml" xml: lang="fr " > <head> <title >Création d’un formulaire </title > <link rel=’ stylesheet ’ href="films . css" type="text/css"/> </head> <body> <?php // Application des fonctions SimpleXML // Analyse du document K illBill . xml $doc = SimpleXML_load_file (" KillBill .xml") ; // Accès à un élément : le t itr e echo " Film : " . $doc−>Film[0]− >titre . "<br>"; // Accès aux attributs de l ’élément <Realisateur > $attr_real = $doc−>Film−>Realisateur−>attributes (); echo "Réalisé par " . $attr_real [ ’prenom’] . " " . $attr_real [ ’ nom ’ ] ; // Affichage de la liste des acteurs echo "<p>Avec: <ol>\n" ; // Boucle sur l ’ensemble des acteurs foreach ($doc−>Film−>Acteur as $acteur) { // On prend les attributs du noeud courant $attributs = $acteur−>attributes(); // On les affiche echo "<li>" . $attributs[ ’prenom’] . " " . $attributs [ ’nom’] ."danslerôlede" . utf8_decode($attributs[ ’nom_role ’]) . "</li>"; } echo "</ol>"; ?> </body> </html> On accède donc aux éléments du document XML par une simple navigation dans une hiérarchie d’objets PHP. La variable $doc représentant l’élément racine, on obtient le titre avec $doc->Film->titre, le réalisateur avec 8.3 Import de données XML dans MySQL 335 $doc->Film->Realisateur, et les acteurs avec $doc->Film->Acteur. Pour ce dernier on effectue une boucle avec for each.Laméthodeattributes() renvoie un tableau associatif contenant les attributs d’un élément. Noter que SimpleXML traite les chaînes de caractères en les codant en UTF-8, ce qui oblige parfois à les transférer en ISO-8859-1 quand elles contiennent des caractères accentués. En résumé, SimpleXML offre une interface simple et pratique, quoique limitée, à un document XML de petite taille. Pour une exploitation généralisable à de gros documents, il reste préférable de recourir à l’API SAX, présentée ci-dessous. 8.3.2 L’API SAX Les fonctions proposées par PHP s’appuient sur le parseur expat développé par James Clark (voir le site http://www.jclark.com). Elles sont disponibles systématiquement dans le cas d’une configuration de PHP avec Apache, ou peuvent être incluses avec l’option with-xml sinon. L’analyse d’un document XML s’effectue en trois phases : 1. on initialise un parseur avec la fonction xml_parser_create() ; 2. on indique au parseur les fonctions à associer aux différents types de marquage rencontrés dans le document ; 3. enfin on lance l’analyse avec la fonction xml_parse(). La seconde étape doit être adaptée à chaque type de document traité. Pour être concret voici un premier exemple d’un module d’analyse de documents XML, s’appliquant à n’importe quel document. Exemple 8.12 exemples/SAX.php : Un exemple simple de traitement d’un document XML <?php /∗∗ Analyse avec le parseur SAX d ’un document XML. ∗ La fonction renvoie un tableau associatif contenant toutes les ∗ informations trouvées ∗ / $tab_elements = array () ; $element_courant = ""; /∗∗ ∗ Fonction déclenchée sur une balise ouvrante ∗ / function debutElement ($parser , $nom, $attrs) { global $element_courant ; $element_courant = $nom; $tab_elements [$element_courant] = ""; echo " balise ouvrante de $nom\n" ; } 336 Chapitre 8. XML /∗∗ ∗ Fonction déclenchée sur une balise fermante ∗ / function finElement ($parser , $nom) { echo " balise fermante de $nom\n" ; } /∗∗ ∗ Fonction déclenchée sur du texte ∗ / function donneesCaracteres ($parser , $chaine) { global $tab_elements , $element_courant ; if ( trim($chaine) != "") $tab_elements [ $element_courant] = $chaine ; } /∗∗ ∗ Cette fonction prend un nom de fichier contenant ∗ un document XML et en extrait des informations ∗ / function parseFilm ($nom_fichier) { global $tab_elements; if (! ($f = fopen($nom_fichier , "r"))) { echo "Impossible d’ouvrir le fichier $nom_fichier!!\n"; return 0; } $parseur = xml_parser_create () ; // Déclencheurs pour les éléments xml_set_element_handler ($parseur , "debutElement" , "finElement" ); // Déclencheurs pour les noeuds texte xml_set_character_data_handler ($parseur , "donneesCaracteres") ; // Lecture du document $document = fread ($f , 100000) ; xml_parse ( $parseur , $document , feof ($f)); xml_parser_free ($parseur); return $tab_elements; } 8.3 Import de données XML dans MySQL 337 La fonction la plus importante est xml_parse() 1 . Elle prend en argument le parseur, le nom d’un fichier contenant un document XML à analyser, et un Booléen indiquant si le document est passé en totalité ou par fragments. L’analyse se résume à afficher au fur et à mesure les balises ouvrante et fermante rencontrées, et à stocker dans un tableau associatif le contenu des éléments. Après la création du parseur, on utilise xml_set_element_handler() pour indiquer les fonctions qui doivent être déclenchées quand le parseur rencontre les balises ouvrante et fermante des éléments, soit ici debutElement() et finElement(). La fonction associée à une balise ouvrante doit accepter trois paramètres : 1. le parseur ; 2. le nom de l’élément rencontré ; 3. un tableau associatif contenant la liste des attributs XML contenus dans la balise ouvrante. Quand on écrit cette fonction, on doit donc implanter l’action appropriée en tenant compte du nom de l’élément et des attributs. Dans notre cas, on affiche un message et on mémorise dans une variable globale le nom de l’élément rencontré. function debutElement ($parser , $nom, $attrs) { global $element_courant ; $element_courant = $nom; echo " balise ouvrante de $nom\n" ; } L’inconvénient de cette fonction est que l’on ne peut pas étendre la liste des para- mètres ou renvoyer une valeur. Le seul moyen de communiquer avec l’application est donc d’utiliser une variable globale (voir page 437) ce qui n’est pas très satisfaisant : nous verrons plus loin comment faire mieux avec la programmation objet. La fonction déclenchée sur la balise fermante n’a pas de troisième argument (il n’y a pas d’attributs dans ces balises). Notre implantation se contente d’afficher un message rendant compte de l’événement rencontré. function finElement ($parser , $nom) { echo " balise fermante de $nom\n" ; } Le troisième type d’événement pris en compte dans ce module est la rencontre d’un nœud de texte. La fonction déclenchée est déclarée avec xml_set_character_data_handler(). La voici : 1. La liste complète des fonctions de cette API est donnée dans l’annexe C, page 500. . comme mysql_ fetch_object() : on crée un objet PHP (instance de la classe prédéfinie SimpleXMLElement) contenant une représentation de la source de données externe. Dans le cas de mysql_ fetch_object(),. 8.3 Import de données XML dans MySQL 333 Le modèle DOM s’appuie sur une représentation arborescente. Chaque nœud de l’arbre est un objet, doté de méthodes propres au type du nœud, et de pointeurs. Realisateur et Acteur. Ce dernier est 334 Chapitre 8. XML un tableau indicé d’objets puisqu’on trouve plusieurs occurrences de l’élément <Acteur>. Voici un exemple de code SimpleXML extrayant des

Ngày đăng: 06/07/2014, 00:20