Agent IA

Création d’un Agent IA pour la Prospection Automatisée des Universités

Introduction et Storytelling

Imaginez-vous créer un outil capable de prospecter des universités partout dans le monde, de collecter des contacts clés et de gérer une communication efficace à grande échelle. Ce projet pourrait révolutionner la manière dont vous gérez vos efforts de prospection commerciale. Avec l’intelligence artificielle, cette ambition devient réalisable.

Dans ce tutoriel, nous allons construire un agent IA qui collecte les adresses email de différents sites universitaires et les enregistre dans un fichier CSV pour une utilisation ultérieure. L’agent utilise des techniques modernes de web scraping associées à des bibliothèques Python puissantes comme requests, BeautifulSoup, et csv. Ce projet est conçu pour être accessible, même pour ceux qui débutent en programmation ou en intelligence artificielle.

Alors, préparez-vous à plonger dans un univers fascinant où la technologie simplifie les tâches répétitives, tout en boostant votre efficacité commerciale.


Tutoriel Complet : Création d’un Agent IA de Prospection Automatisée

Prérequis

Avant de commencer, assurez-vous d’avoir installé les éléments suivants :

  1. Python 3.7 ou version supérieureLien de téléchargement
  2. Un éditeur de code (comme VS Code ou PyCharm).
  3. Bibliothèques Python : Installez-les avec la commande suivante : pip install requests beautifulsoup4 csv
  4. Un navigateur avec une extension comme « SelectorGadget » (utile pour identifier les éléments sur une page web).

Étape 1 : Configuration de votre Environnement

Créez un répertoire de travail sur votre ordinateur et ajoutez un fichier Python nommé agent_prospection.py.


Étape 2 : Écriture du Script de Base

Voici le code de base pour démarrer notre agent IA.

Import des Bibliothèques

import requests
from bs4 import BeautifulSoup
import csv

Fonction pour Récupérer les Emails

def collect_emails(url):
    try:
        response = requests.get(url)
        response.raise_for_status()  # Vérifie si la requête a réussi
        soup = BeautifulSoup(response.text, 'html.parser')
        emails = set()
        
        # Cherche les emails dans le contenu HTML
        for link in soup.find_all('a', href=True):
            if 'mailto:' in link['href']:
                email = link['href'].split('mailto:')[1]
                emails.add(email)

        return emails
    except Exception as e:
        print(f"Erreur lors de l'accès à {url} : {e}")
        return set()

Étape 3 : Collecte de Données et Sauvegarde

Nous allons écrire les emails collectés dans un fichier CSV.

Fonction d’écriture dans un CSV

def save_emails_to_csv(emails, filename='emails.csv'):
    try:
        with open(filename, mode='w', newline='', encoding='utf-8') as file:
            writer = csv.writer(file)
            writer.writerow(["Email"])
            for email in emails:
                writer.writerow([email])
        print(f"Les emails ont été enregistrés dans {filename}")
    except Exception as e:
        print(f"Erreur lors de l'enregistrement dans le fichier CSV : {e}")

Étape 4 : Intégration et Lancement

Assemblez les différentes fonctions dans le fichier principal.

Code Principal

if __name__ == "__main__":
    # Liste des URLs à prospecter (exemple)
    urls = [
        "https://www.univ-paris1.fr",
        "https://www.univ-lyon3.fr",
        "https://www.univ-montpellier.fr"
    ]

    all_emails = set()

    for url in urls:
        print(f"Prospection en cours pour : {url}")
        emails = collect_emails(url)
        all_emails.update(emails)

    save_emails_to_csv(all_emails)

Étape 5 : Testez votre Agent

  1. Exécutez le script avec la commande suivante : python agent_prospection.py
  2. Vérifiez le fichier emails.csv à la racine de votre répertoire pour vous assurer que les emails ont été enregistrés.

Étape 6 : Améliorations Futures

  • Ajout d’un filtre : Exclure les emails non pertinents.
  • Gestion des erreurs avancées : Ajouter des logs pour suivre les URLs qui échouent.
  • Exploration en profondeur : Récolter des emails sur plusieurs pages en suivant les liens internes.

Conclusion

Vous venez de construire un agent IA capable de prospecter automatiquement des emails depuis des sites web universitaires. Ce projet, bien que basique, peut être étendu à des cas d’utilisation beaucoup plus complexes. Alors, pourquoi ne pas intégrer ce tutoriel à votre portfolio pour montrer vos compétences en programmation et en intelligence artificielle ?

Bonne prospection !