Complément au cours : XML
L'Extensible Markup Language (XML) est un langage de balisage générique. Il permet de représenter des données de manière arborescente (ou sous la forme d'un graphe en utilisant des références XML).
Le XML ne définit pas de balise mais simplement une façon de présenter un document afin qu'il soit bien formé (well-formed). Le XML est défini par la recommandation du W3.
Structure du langage
Le XML est composé par des noeuds (XML Nodes) reliés entre eux sous une forme arborescente. Un noeud ne peut donc avoir au plus qu'un seul noeud parent et, dans un document, un seul noeud n'a pas de parent : il s'agit du noeud racine (root node).
Il existe différents types de noeuds XML :
- Element
- Un élément sera représenté dans le document par une balise. Un noeud racine est obligatoirement de type élément. Seuls les noeuds de type élément peuvent avoir des fils (i.e. être parent d'un autre noeud)
- Attribute
- Un attribut permet d'associer une valeur à un élément
- Text
- Un simple fragment de texte
- Processing instruction
- Une portion contenant des instructions traitables par une application et délimitée par <? ?>
Structure du document
Un document XML est un document texte qui peut optionnellement commencer par le prologue suivant :
On précise ainsi la version du langage XML et l'encodage du document.
Un élément est représenté par une balise. Attention en XML, une balise doit obligatoirement être fermée !
Un attribut est positionné sur la balise ouvrante représentant l'élément.
En XML, un attribut a obligatoirement une valeur (qui peut être une chaîne de caractères vide) et cette dernière est obligatoirement délimitée par ' ou ".
En XML, les caractères & ' " < > sont des caractères réservés et doivent être échappés par les entités XML & ' " < >.
Un document XML qui respecte les règles de structure du langage et d'un document est dit bien formé (well-formed).