Get Mystery Box with random crypto!

Qu’est-ce que l’extraction de données web ? L’extraction de d | Apprendre le Code Informatique

Qu’est-ce que l’extraction de données web ?

L’extraction de données web est un processus automatique de récupération (ou extraction) des données d’un site web. Au lieu de collecter des données manuellement, vous pouvez écrire des scripts Python (une façon contournée de dire des processus de code) qui peuvent collecter des données à partir d’un site web et les sauvegarder dans des fichiers .txt ou .csv.

Imaginons que vous soyez expert marketing. Vous êtes en train de préparer une campagne pour un nouveau type de veste. Ce serait utile de collecter des informations comme le prix et la description de vestes similaires. Au lieu de rechercher et copier/coller manuellement les informations dans un tableur, vous pouvez écrire du code Python pour collecter des données automatiquement à partir d’internet et les sauvegarder dans un fichier CSV.

Dans les deux prochains chapitres, je vais vous guider pas à pas dans un exercice d’extraction de données. Vous allez apprendre de nouvelles choses et pratiquer certains outils que vous avez déjà utilisés avant, comme les fonctions et les variables. Assurez-vous de suivre les indications de votre éditeur. Vous apprendrez mieux si vous réalisez les étapes de votre côté en même temps !

Pour cet exercice d’extraction, nous allons extraire des nouvelles et des communications du site web d’informations et des services du gouvernement du Royaume-Uni (https://gov.uk), transformer les données dans le format désiré et charger les données dans un fichier CSV.