Programmation client, année 2018

Cours-TD 3. Traitements des données en Python (2)

Attention!

Chaque TD doit faire l’objet d’un envoie de e-mail à l’adresse charles.paperman@univ-lille.fr avec comme objet [L3-MIASHS: programmation-client] depuis votre boite universitaire.

Le mail doit contenir:

  1. Les réponses aux questions posées
  2. Les éventuelles pièces jointes demandées

Tout mail qui n’est pas rendu à la fin du TD sera automatiquement supprimé.

Début du TD

Important: Vous devez terminer le cours-TD 1 et 2 avant de débuter le cours-TD 3.

Il existe de nombreuses manières d’échanger des informations sur internet, qui peuvent être structurée ou non.

Python et internet (suite)

  1. Écrire une fonction en Python qui retourne le contenu HTML d’une page web dont l’url est donné en paramètre.

  2. Écrire une fonction en Python qui extrait d’une page HTML tous le contenu textuels (qui efface es balises). (Vous pouvez utiliser une expression régulière)

  3. Proposez une solution éventuelle pour filtrer le contenu des balises script.

  4. Écrire une fonction qui retourne la liste des mots (sans multiplicité) présent dans une page web.

BeautifulSoup

  1. Trouvez la documentation officielle du module Python BeautifulSoup et indiquez briévement à quoi ce module peut servir.

  2. En utilisant ce module, comment pouvez vous simplifiez les fonctions des question 2 et 3?

  3. Écrire un script en Python qui affiche la météo actuelle à Lille en l’extrayant du site de Météo France. Vous pouvez vous aider de BeautifulSoup ainsi que de l’explorateur de DOM du navigateur.


Compiled the: dim. 07 janv. 2024 23:19:23 CET