Premiers pas avec lxml

Pourquoi avons-nous besoin de lxml et comment l’utiliser ?

Premièrement, pourquoi avons-nous besoin de lxml ?

lxml.etree est une API générique pour la gestion XML et HTML. Il vise la compatibilité ElementTree et prend en charge l’intégralité de l’ensemble d’informations XML. Il est bien adapté à la fois au contenu mixte et au XML centré sur les données. Sa généralité en fait le meilleur choix pour la plupart des applications.

La bibliothèque lxml est une extension des anciens libxml2 et libxsit et présente des avantages majeurs :

  1. API Python très simple
  2. Bien documenté
  3. Pas besoin de s’occuper de la gestion de la mémoire
  4. Pas besoin de s’inquiéter d’un défaut de segmentation

Il fournit également une manière très naturelle de traiter n’importe quel format de données XML. Les données sont automatiquement converties en types de données Python et peuvent être manipulées avec des opérateurs Python normaux

Super! maintenant comment puis-je l’utiliser ?

Sur les machines Linux, vous pouvez installer la bibliothèque lxml en utilisant apt-get :

sudo apt-get install python-lxml

Pour importer et utiliser la bibliothèque :

from lxml import etree

Pour parser le fichier xml, vous pouvez utiliser :

    try:
        parser = ET.XMLParser(remove_comments=False, remove_blank_text=True)
        tree = ET.parse(file, parser=parser)
    except (Exception):
        print ('Failed to open file %s' % file, exc_info=True)
    return tree

installation de lxml

L’installation de lxml est très simple, c’était devenu une tâche facile depuis Python 2.7.9 (car il est livré avec un utilitaire qui aide les développeurs à télécharger la dépendance d’installation de manière simple comme Maven pour Java) au début, vous devez exécuter la commande puis commencer à coder .

pip install lxml

La deuxième méthode consiste à installer en utilisant easy_install. Des instructions plus détaillées peuvent être trouvées [ici] [1]

[1] : http://lxml.de/installation.html

Installation ou configuration

Instructions détaillées sur la configuration ou l’installation de lxml.