Dashboard

0
Jobs Actifs
0
Jobs Total
WebSocket
2.0
Version
🚀 Démarrage rapide
📍
Google Maps
Extraire fiches, téléphones, emails, GPS sur 60+ pays.
Prospection B2B
📒
Annuaires Pro
Pages Jaunes, Kompass, Societe.com, Yellow Pages, Yelp.
Prospection B2B
🚀
Moteur Masse
1000+ pages/min — emails & téléphones par mots-clés × villes.
Prospection B2B
📋
Batch URLs
Scraper des listes d'URLs en parallèle à haute vitesse.
Extraction Web
🏠
SeLoger
Prix, surface, contact agent depuis les annonces immobilières.
Immobilier
📧
IMAP Email
Extraire contacts depuis Gmail, Outlook, Yahoo et +6 providers.
Contacts
📋 Jobs Récents
Job IDTypeStatutRésultatsExport
📭
Aucun job lancé
📡 Activité en direct
En attente de connexion WebSocket...
Extraction Web
Analysez n'importe quelle URL et extrayez automatiquement emails, téléphones, adresses, liens et métadonnées. Pour plusieurs URLs, utilisez le mode Batch →
⚡ Scrape Rapide

📊 Données extraites

📧
EmailsToutes les adresses email détectées sur la page.
📞
TéléphonesNuméros FR validés et formatés (fixe + mobile).
📍
AdressesAdresses postales avec code postal détectées.
🔗
Liens externesLiens sortants vers d'autres domaines.
📝
MétadonnéesTitre, description meta, H1 de la page.
💡 Pour scraper plusieurs URLs à la fois, utilisez le mode Batch.
📋
Extraction Web
Traitez des centaines d'URLs en parallèle avec le moteur httpx async. Idéal pour crawler des listes de sites et en extraire contacts, emails et données structurées en masse.
📋 Scraping Batch

⚡ Moteur haute performance

🔥
1000+ pages/minHttpx async avec pool de connexions keepalive.
🔄
Retry automatique3 tentatives avec backoff exponentiel sur erreur.
📡
Temps réelProgression live via WebSocket — pages/min, succès, erreurs.
🔀
Rotation proxiesDistribue les requêtes sur vos proxies configurés.
⚠️ Concurrence > 100 recommandée pour les grands volumes uniquement.
📍
Prospection B2B
Extrayez en masse des fiches Google Maps : nom, adresse, téléphone, email (enrichi), note, GPS, horaires — sur 60+ pays avec locale native. Mode Campagne pour des milliers de résultats (keywords × villes × pays).
🔍 Extraction Simple
🚀 Campagne Masse
📍 Google Maps Simple

📊 Données extraites (12 colonnes)

🏪
Nom & CatégorieRaison sociale et type d'activité.
📍
Adresse + GPSAdresse complète, latitude, longitude, plus code.
📞
TéléphoneNuméro direct affiché sur la fiche Maps.
📧
Email enrichiCollecte sur le site officiel de l'établissement (httpx async).
Note & Nb avisScore /5 et nombre d'avis clients Google.
🕐
HorairesStatut ouvert/fermé + horaires hebdomadaires.
Architecture 3 phases : liste → détails parallèles → email enrichment
🛡️ Anti-détection : stealth JS, UA rotation, context isolation
🌍 60+ pays avec locale/hl/gl natif
📒
Prospection B2B
Scrapez les annuaires professionnels : SIRENE data.gouv.fr (officiel, SIRET inclus), Annuaire Mairie (France), Yellow Pages & Yelp (USA). Obtenez nom, SIRET, adresse, catégorie d'activité.
📒 Annuaires

📚 Sources disponibles

Pages Jaunes🇫🇷 FR
Kompass🇫🇷 FR
Societe.com🇫🇷 FR
Yellow Pages🇺🇸 US
Yelp🇺🇸 US
📊 Données extraites : Nom, adresse, téléphone fixe/mobile, email, site web, SIRET, catégorie, note.
🏠
Immobilier
Extrayez les données d'annonces SeLoger : prix, surface, pièces, localisation, contact agence/particulier. Mode annonce unique ou liste d'annonces en batch.
🏠 SeLoger

🏠 Données immobilières

💶
PrixPrix de vente ou loyer mensuel.
📐
Surface & PiècesSuperficie en m² et nombre de pièces.
📍
LocalisationVille, quartier, arrondissement.
👤
ContactAgence ou particulier, nom, téléphone.
📧
EmailEmail du vendeur/loueur si disponible.
🤖 Utilise Playwright + interception des APIs internes SeLoger pour une extraction fiable.
🚀
Prospection B2B
Moteur haute performance : entrez des mots-clés + villes, le moteur génère automatiquement les URLs (Societe.com, Pages Jaunes) et extrait emails & téléphones à 1000+ pages/min avec déduplication Bloom.
🚀 Moteur Masse

🚀 Génération automatique d'URLs

Le moteur génère automatiquement les URLs à partir de chaque combinaison mot-clé × ville :
societe.com pagesjaunes.fr
📧
EmailsTous les emails trouvés sur chaque page.
📞
Téléphone fixeNuméros 01-05 validés.
📱
Téléphone mobileNuméros 06-07 validés.
💡 4 kw × 5 villes = 40 URLs générées automatiquement (2 sources × 20 combinaisons).
📧
Contacts
Connectez-vous à n'importe quelle boîte IMAP (Gmail, Outlook, Yahoo, Orange, SFR, Free…) et extrayez automatiquement les contacts : noms, emails, téléphones depuis vos échanges.
Connexion
Extraction
Résultats
🔗 Étape 1 — Connexion IMAP

📧 Providers supportés

Gmailimap.gmail.com:993
Outlook / Hotmailimap.outlook.com:993
Yahooimap.mail.yahoo.com:993
Orangeimap.orange.fr:993
SFRimap.sfr.fr:993
Freeimap.free.fr:993
La Posteimap.laposte.net:993
💡 Pour Gmail, créez un App Password dans votre compte Google (sécurité → Mots de passe d'application).
📄
Extraction Web
Extrayez du contenu depuis des PDFs en ligne, des images (OCR Tesseract multilingue) ou crawlez un site entier pour en extraire tous les contacts. Aucun fichier stocké côté serveur.
📄 PDF en ligne
🖼 Image / OCR
🕸 Crawl de site
📄 Extraction PDF

📄 Capacités d'extraction

📄
PDF en ligneExtraction de texte, emails, téléphones et adresses depuis n'importe quel PDF accessible par URL.
🖼
OCR ImageReconnaissance de texte (Tesseract) sur JPG, PNG, WebP. Langues : FR, EN, AR.
🕸
Crawl récursifParcours un site jusqu'à N niveaux, extrait contacts sur chaque page + détecte les PDFs liés.
Tout se traite en mémoire, aucun fichier n'est sauvegardé sur le serveur.
🔀
Paramètres
Gérez votre pool de proxies pour les campagnes de scraping à grande échelle. Ajoutez, testez et monitorez la disponibilité de chaque proxy avec rotation automatique.
🔀 Ajouter un Proxy
📋 Proxies enregistrés
🔀
Aucun proxy configuré

🔀 Gestion des Proxies

Test automatiqueVérifie la disponibilité et mesure la latence de chaque proxy.
🔄
Rotation aléatoireLes requêtes sont distribuées sur les proxies actifs.
🌍
Filtre par paysUtilisez des proxies locaux pour cibler des sources géolocalisées.
💾
PersistanceLes proxies sont sauvegardés dans data/proxies.json.
💡 Format supporté : http://user:pass@host:port et socks5://host:port
💾
Paramètres
Téléchargez les résultats de n'importe quel job en CSV (UTF-8 BOM, compatible Excel) ou Excel .xlsx avec mise en forme. Validez également des listes de numéros de téléphone pour 8 pays.
💾 Exporter par Job ID
✅ Validation & Export Téléphones

📊 Formats d'export

📄
CSV (UTF-8 BOM)Compatible Excel, Google Sheets, LibreOffice. Séparateur virgule, encodage UTF-8 avec BOM pour les accents.
📊
Excel .xlsxMise en forme automatique, colonnes redimensionnées, en-têtes colorés en violet.

🌍 Pays supportés (validation tél.)

🇫🇷 France🇲🇦 Maroc 🇸🇳 Sénégal🇨🇮 Côte d'Ivoire 🇩🇿 Algérie🇹🇳 Tunisie 🇧🇪 Belgique🇺🇸 États-Unis
📡 Logs Temps Réel
Déconnecté