€0+

Workflow scrap

I want this!

Workflow scrap

€0+

Ce workflow no-code a été conçu pour extraire automatiquement les informations des entreprises listées sur l’annuaire du site gifen.fr, sans utiliser d’API externe. Il repose uniquement sur une analyse de la structure HTML du site et des techniques de web scraping natives dans n8n.

🧩 Étapes du workflow :

  1. Analyse de la pagination du site :
    J’ai commencé par comprendre la structure de l’annuaire et la logique de navigation entre les pages.
  2. Génération des URLs de pagination (via un nœud Code) :
    Un nœud Code génère dynamiquement toutes les URLs correspondant aux pages de l’annuaire.
  3. Scraping des pages de pagination :
    Chaque page est ensuite scrapée pour récupérer la liste des URLs individuelles des entreprises.
  4. Stockage temporaire dans Google Sheets :
    Les URLs des fiches entreprises sont stockées dans un Google Sheet.
  5. Scraping détaillé de chaque entreprise :
    Le workflow parcourt chaque URL pour extraire les données importantes (nom, adresse, SIRET, téléphone, email, site web, etc.).
    Les informations sont extraites directement depuis le HTML, nettoyées et formatées à l’aide de logique personnalisée dans des nœuds Code.

💡 Particularités :

  • Aucune API requise
  • 100 % no-code avec des nœuds Code personnalisés dans n8n
  • Basé sur l’analyse manuelle du HTML
  • Facilement adaptable à d’autres structures de sites web similaires
I want this!
Size
18.2 KB
Copy product URL