Sommaire
Les codes SIREN et SIRET sont des identifiants administratifs essentiels pour les entreprises en France. Ils jouent un rôle similaire à celui des numéros de sécurité sociale pour les individus, permettant d’identifier clairement chaque entreprise ou établissement sur le territoire national.
.png)
Dans cet article, nous allons explorer différentes méthodes pour extraire ces informations officielles et publiques à partir d’Excel, en utilisant notamment une API officielle française accessible librement. Cette démarche est indispensable pour tout professionnel ayant besoin de gérer ou analyser des données d’entreprises à grande échelle, tout en garantissant la fiabilité et la mise à jour régulière des informations.
Et voici la vidéo qui traite de ce sujet :
.png)
#1 | Comprendre SIREN et SIRET
Avant d’aborder la récupération des informations, il est important de bien saisir la nature de ces codes :
- Le code SIREN est un identifiant unique à 9 chiffres attribué à chaque entreprise ou organisme. Il sert d’identification administrative et reste le même quel que soit le nombre d’établissements dont l’entreprise dispose.
- Le code SIRET est une extension du SIREN incluant 5 chiffres supplémentaires, correspondant à chaque établissement précis d’une entreprise. C’est un identifiant unique à 14 chiffres permettant de localiser géographiquement les différents sites.
Ces numéros sont indispensables pour des démarches administratives, fiscales ou commerciales, et figurent dans de nombreuses bases de données officielles.
#2 | API publiques : accès aux données
Les informations sur les entreprises françaises sont publiques et accessibles via des bases de données administratives maintenues par l’État. Le site data.gouv.fr offre notamment des APIs (interfaces de programmation d’applications) qui permettent une extraction rapide et fiable de données à jour. Ici, la « recherche d’entreprise » est accessible via une API publique en open data, continuellement mise à jour.
Cette API permet de faire jusqu’à 7 requêtes par seconde, ce qui est largement suffisant pour des volumes modérés, tout en restant simple à utiliser grâce à des interfaces comme Swagger. Cette interface graphique évite d’avoir à plonger dans une documentation technique complexe et permet de tester rapidement les requêtes.
#3 | Récupérer les codes avec Excel
Pour illustrer, prenons le cas d’un tableau Excel contenant 16 noms d’entreprises françaises. Chaque ligne dispose du nom de l’entreprise et de son département. Notre objectif est de récupérer leurs codes SIREN et SIRET.
3.1 Effectuer une recherche textuelle dans l’API
La clé est de formuler une requête dans l’API en spécifiant :
- Le nom de l’entreprise (ou une partie du nom)
- Éventuellement le département pour affiner la recherche en cas d’homonymes
Par exemple, si on cherche une entreprise nommée "Solpedinn" dans le département 94, on configure ces paramètres dans l’interface Swagger et on exécute la requête.
“Si plusieurs entreprises ont des noms similaires, préciser le département évite de se tromper d’identification.”
3.2 Intégrer la requête dans Excel avec la fonction WEBSERVICE
Excel possède une fonction appelée WEBSERVICE(url)
qui permet d’envoyer une requête à une URL et de récupérer la réponse directement dans une cellule. En construisant correctement l’URL de l’API avec les paramètres dynamiques tirés du contenu des cellules (nom et département), on peut automatiser l’extraction des données.
Exemple de formule adaptant nom et département :
=WEBSERVICE("
https://entreprise.api.gouv.fr/v3/recherche?nom=
" & B2 & "&departement=" & C2)
Ici, B2
contient le nom de l’entreprise et C2
son département.
3.3 Analyser et extraire les codes SIREN et SIRET dans le flux JSON
La réponse de l’API est un texte au format JSON, généralement complexe et limité par des blocs imbriqués et des accolades. Il faut donc extraire les numéros précis depuis ces chaînes de caractères.
Les codes SIREN et SIRET apparaissent toujours à des positions fixes dans cette réponse :
- Le SIREN est toujours un nombre à 9 chiffres, généralement en début de réponse.
- Le SIRET est un nombre à 14 chiffres, plus varié dans sa position.
On peut isoler ces informations à l’aide de fonctions texte d’Excel comme STXT
(extraction d’une sous-chaîne), en indiquant le bon point de départ et la longueur.
3.4 Exemple concret d’extraction avec STXT
Supposons que le SIREN commence au 80e caractère et fait 9 caractères. La formule pour l’extraire serait :
=STXT(cellule_avec_JSON, 80, 9)
Pour le SIRET, on utilise une extraction similaire, souvent en recherchant le mot-clé "siret" dans la chaîne et en prenant les caractères qui suivent.
#4 | REGEX : une extraction plus robuste
Excel a récemment intégré des fonctions de manipulation avancée de texte basées sur les expressions régulières (REGEX), qui simplifient grandement la recherche de motifs complexes dans les chaînes de texte.
Au lieu de compter manuellement le nombre de caractères ou de positions, on peut utiliser REGEX.EXTRAIRE()
pour extraire directement les numéros SIREN ou SIRET :
- On définit un motif ciblé : par exemple, un groupe de 9 chiffres consécutifs précédé de "siren".
- La fonction renvoie automatiquement le numéro correspondant.
Cette technique est à la fois plus souple et pérenne, surtout si la structure JSON peut varier dans le temps.
#5 | Limites et pistes d’optimisation
La méthode présentée est simple et accessible, idéale pour quelques dizaines d’entreprises en simultané. Cependant, elle atteint ses limites en termes de performance et de volume : l’API bloque à 7 requêtes/seconde, et chaque extraction prend un peu de temps.
Pour plusieurs milliers ou centaines de milliers d’enregistrements, on devra envisager :
- Une approche incrémentielle, qui va chercher les données en plusieurs fois et mémorise les précédents résultats.
- L’usage de scripts ou langages plus performants que Excel pour gérer ces appels.
- La gestion fine des erreurs et doublons, via des filtres et validations supplémentaires.
Conclusion : Données officielles avec Excel
Intégrer les codes SIREN et SIRET d’entreprises dans vos fichiers Excel peut paraître complexe, mais grâce aux outils publics tels que l’API de data.gouv.fr et aux fonctions Excel adaptées, cette tâche devient rapide, précise et accessible à tous les utilisateurs, même sans connaissances approfondies en programmation.
La méthode consiste à :
- Utiliser une API officielle accessible en open data
- Construire dynamiquement les requêtes en fonction des noms d’entreprises et départements
- Extraire les codes SIREN et SIRET depuis les réponses JSON avec des fonctions Excel classiques ou avancées
- Prévoir des optimisations pour les volumes importants de données
À retenir !
- Les codes SIREN (9 chiffres) et SIRET (14 chiffres) sont indispensables pour identifier les entreprises en France.
- Les données sont accessibles via l’API publique sur data.gouv.fr, mise à jour en permanence.
- Excel offre la fonction
WEBSERVICE()
pour automatiser la récupération d’informations de l’API. - L’extraction des codes dans la réponse JSON s’opère avec des fonctions texte ou REGEX pour plus de robustesse.
- La méthode simple présentée est idéale pour des volumes modestes, avec possibilité d’évoluer vers des solutions plus performantes sur gros volumes.