Tout savoir sur la sirétisation (ou siretage) de votre base de données

Tout savoir sur la sirétisation (ou siretage) de votre base de données

La France dispose d'une base de données extraordinaire gérées par l'INSEE et qui reprend la totalité des entités économiques françaises en activité ou non. Cette donnée publique est accessible plus facilement depuis l'avènement de l'Open-Data et permet aux professionnels d'enrichir leurs bases de données propres via le traitement de SIRETISATION.

1-Les données disponibles pour enrichir votre base.

Voici la liste non exhaustive des champs les plus importants disponibles dans la base SIRENE.

Numéro de SIREN Numéro de SIREN, identifiant du groupe – en savoir plus
Numéro de SIRET Numéro SIRET, identifiant unique de  l’établissement – en savoir plus
Dernier Evènement Libellé de l'événement (Déménagement, fermeture…)
Date du dernier Evènement Date de l'événement listé plus haut
Raison sociale Raison sociale de l’établissement, exemple DURAND SARL
Enseigne Enseigne, exemple DECATHLON
Sigle Sigle, exemple SNCF
Adresse 3 Bâtiment de l’adresse normalisée selon le référentiel postal
Adresse 4 Voie de l’adresse normalisée selon le référentiel postal
Adresse 5 Lieu-dit, BP de l’adresse normalisée selon le référentiel postal
Code postal (pas le code INSEE) Code postal de l’adresse normalisée selon le référentiel postal
Commune Ville de l’adresse normalisée selon le référentiel postal
Code APE sur 5 caractères Code NAF établissement – en savoir plus
Code APE sur 2 caractères Code NAF entreprise – en savoir plus
Tranche d'effectif salarié du site Tranche d'effectif établissement
Tranche d'effectif salarié du siège Tranche d'effectif entreprise au global siège + établissements
Date de création du site Date de création établissement
Date de création du siège Date de création entreprise
Catégorie juridique catégorie juridique
Type d'établissement 1 : siège ; 2 : Ets secondaire
Nombre d'établissements Nombre d'établissements

 

On peut y trouver également des informations hors base SIRENE, comme les coordonnées du dirigeant ou des informations liées à la personne morale. Ces données ne concernent pas les salariés.

TELEPHONE Ligne du standard de l'entreprise
EMAIL Email générique de l'entreprise
SITE Site web de l'entreprise
CIVILITE DU DIRIGEANT Mr, Mme
PRENOM DU DIRIGEANT Prénom du principal dirigeant
NOM DU DIRIGEANT Nom du principal dirigeant

 

2-Comment fonctionne le traitement de sirétisation?

-Traitement de masse de votre base de données

Traitement automatique : Ce traitement consiste à comparer en une seule fois votre base client/prospect avec la dernière version à jour de la base Sirene. Pour les pros du marketing direct, cela ressemble à une déduplication postale, puisqu'on va calculer un score de probabilité que l'adresse de votre fichier soit bien celle trouvée dans le référentiel INSEE.

C'est sur la qualité de ce traitement que vous devez choisir votre prestataire, la donnée enrichie étant de même qualité, puisque puisée à la même source. N'hésitez donc pas à faire tester un échantillon voire, toute la base, pour obtenir ce fameux taux de rapprochement. En effet, plus ce taux est bas, plus vous aurez de rapprochement manuel à fournir. Les taux de rapprochement dépendent essentiellement de la qualité initiale de votre base et varient entre 50 et 100% de rapprochement.

Traitement semi-automatique : ce traitement consiste à réduire les critères de rapprochement du score pour augmenter artificiellement le nombre d'adresses rapprochées. On va ainsi accepter des raisons sociales proches, des adresses approximatives...

Traitement manuel : souvent pratiqué offshore dans des pays à bas coût, ce traitement est coûteux et donne peu de résultat. Il consiste à faire des recherches manuelles dans la base SIRENE. Les données compliquées à récupérer sont souvent liées à des erreurs de saisie, des raisons sociales erronées (enseigne, nom du dirigeant, intitulé flou comme CCAS) ou des adresses manquantes et/ou incomplètes.

Voir notre article sur la sirétisation

Traitement au fil de l’eau par webservice : on peut mener le même type de traitement de sirétisation à chaque création ou modification d’un enregistrement de la base. Pour ce faire, on va ajouter des scripts aux formulaires des sites et des applications comme la CRM et l’ERP. Ce type de mise en place est intéressante si un volume conséquent de fiches est créé ou modifié.

 

3-Ma base est enrichie en SIRET, que dois-je faire lors de l'intégration?

Voici les premières actions à mener une fois le fichier enrichi.

-Supprimer les évènements "fermeture"

Il faut supprimer les prospects ou clients inactifs cessés ou liquidés sans hésiter.
Soyez plus prudent avec les clients actifs dans la dernière année ; il se pourrait que certains aient des commandes en cours ou que le rapprochement ait commis une erreur due à un doublon.

-Modifier les adresses des sociétés "déménagées"

Il faut modifier les prospects ou clients inactifs déménagés sans hésiter.
Soyez plus prudent avec les clients actifs dans la dernière année pour les mêmes raisons que plus haut.

-Dédoublonnage des Sirets en doublon

Vous pouvez, si votre informatique le permet, fusionner les comptes clients/prospects ayant le même Siret – en savoir plus sur le code SIRET

-Regrouper les sociétés ayant le même Siren, dans un groupe capitalistique

Attribution d’un même groupe à tous les établissements avec le même code SIREN.
Par exemple, le groupe DECATHLON a comme SIREN 306 138 900.

-Regrouper les sociétés ayant la même enseigne, dans un groupe de marque

Attribution d’un même groupe à tous les établissements avec la même enseigne.
Par exemple, le groupe AFFLELOU. L'enseigne transcende les franchisés.

-Mettre en place une segmentation métier basée sur les codes NAF

Voir notre article sur la segmentation

-Faire un profiling de la base pour déterminer les codes NAF les plus porteurs en prospection.

Voir notre article sur le profiling

 

4-Les autres traitements possibles une fois ma base enrichie en numéro de siret

Acquisition de lignes supplémentaires (Siren d'un même groupe, NAF porteurs, société d'une même enseigne) pour enrichir la base - voir notre article sur l'appending

Acquisition de données supplémentaires pour enrichir la base existante

-Données comptables et d’assurance crédit (CA, Bilan, stock, part de CA export...)

Voir notre article sur l'appending

-Acquisition de données marketing et commerciales (Contact, fonction, email, téléphone...)

Attention, ces données sont personnelles et concernées par le nouveau Réglement Européen de Protection de Données (RGPD)

Introduction

La France dispose d’une grande base de données gérée par l’INSEE et qui reprend la totalité des entités économiques françaises en activité ou non. Cette donnée publique est accessible plus facilement depuis l’avènement de l’Open-Data et permet aux professionnels d’enrichir leurs bases de données propres via le traitement de SIRETISATION.

Qu'est-ce que la sirétisation ?

La sirétisation ou sirenage consiste à rapprocher une base de données commerciales de clients/prospects du référentiel SIREN de l’INSEE.

Le SIREN (Système d’Identification du Répertoire des ENtreprises) est un nombre composé de 9 chiffres attribué aux entreprises ou association par l’INSEE au moment de leur création. Ce numéro d’identification est commun à tous les établissements de l’entreprise ; c’est à dire au siège et à ses établissements secondaires.

Le SIRET (système d’identification du répertoire des établissements) se compose quant à lui de 14 chiffres. Les 9 premiers correspondent au SIREN puis les 5 suivant sont le numéro NIC (Numéro Internet de Classement) qui différencie les établissements de l’entreprise. Le SIRET est unique pour chaque établissement, à l'image de votre numéro de sécurité sociale.

SIRET = SIREN + NIC

L’objectif de la sirétisation est donc d’attribuer un numéro de SIRET à chaque ligne analysée, c’est à dire un établissement au sens INSEE. Une fois ce SIRET attribué, il est possible d’enrichir la ligne d’un tas d’informations liées.

Les données disponibles pour enrichir votre base.

Voici la liste non exhaustive des champs les plus importants disponibles dans la base SIRENE.

Numéro de SIREN Identifiant du groupe – en savoir plus
Numéro de SIRET Identifiant unique de  l’établissement – en savoir plus
Dernier événement Libellé de l'événement (déménagement, fermeture…)
Date du dernier événement Date de l'événement listé plus haut
Raison sociale Raison sociale de l’établissement, exemple DURAND SARL
Enseigne Enseigne, Exemple DECATHLON
Sigle Sigle, Exemple SNCF
Adresse 3 Bâtiment de l’adresse normalisée selon le référentiel postal
Adresse 4 Voie de l’adresse normalisée selon le référentiel postal
Adresse 5 Lieu-dit, BP de l’adresse normalisée selon le référentiel postal
Code postal (pas le code INSEE) Code postal de l’adresse normalisée selon le référentiel postal
Commune Ville de l’adresse normalisée selon le référentiel postal
Code APE sur 5 caractères Code NAF établissement – en savoir plus
Code APE sur 2 caractères Code NAF entreprise – en savoir plus
Tranche d'effectif salarié du site Tranche d'effectif établissement
Tranche d'effectif salarié du siège Tranche d'effectif entreprise au global siège + établissements
Date de création du site Date de création établissement
Date de création du siège Date de création entreprise
Catégorie juridique catégorie juridique
Type d'établissement 1 : siège ; 2 : Ets secondaire
Nombre d'établissements Nombre d'établissements
 

On peut y trouver également des informations hors base SIRENE, comme les coordonnées du dirigeant ou des informations liées à la personne morale. Ces données ne concernent pas les salariés.

Téléphone Ligne du standard de l'entreprise
Email Email générique de l'entreprise
Site Site web de l'entreprise
Civilité du dirigeant Mr, Mme
Prénom du dirigeant Prénom du principal dirigeant
Nom du dirigeant Nom du principal dirigeant
 

Comment fonctionne la sirétisation ?

En savoir plus sur la sirétisation d'un fichier client

La sirétisation est une opération qui demande du temps de traitement et elle se déroule en trois grandes étapes :

La phase automatique

Elle permet de traiter la majeure partie du fichier (entre 70% et 80%). Ce traitement consiste à comparer en une seule fois votre base client/prospect avec la dernière version à jour de la base SIRENE. Le traitement se base sur un algorithme qui tentera de faire matcher chaque ligne de votre fichier avec le référentiel INSEE. Ce processus permet de déterminer un taux de rapprochement, également appelé taux de match, qui permet aussi d’évaluer la qualité de votre fichier. C’est par rapport à la qualité de ce traitement que vous devez choisir votre prestataire. En effet, la donnée enrichie reste de même qualité puisque qu'elle est toujours puisée à votre base de données.

N’hésitez donc pas à faire tester un échantillon voire, toute la base pour obtenir ce taux de rapprochement. Sachez que plus ce dernier est bas, plus vous aurez de rapprochement manuel à fournir. Les taux de rapprochement dépendent essentiellement de la qualité initiale de votre base et varient entre 50 et 100% de rapprochement.

La phase semi-automatique

Ce traitement consiste à réduire les critères de rapprochement du score pour augmenter artificiellement le nombre d’adresses rapprochées. On va ainsi accepter des raisons sociales proches, des adresses approximatives…

La phase manuelle

Comme son nom l’indique, cette étape consiste en une recherche manuelle des dernières lignes non retrouvées. Cette phase est longue et souvent coûteuse car elle fait appel à un opérateur qui travaillera ligne par ligne pour relier vos données et celle du référentiel INSEE. Les données compliquées à récupérer sont souvent liées à des erreurs de saisie, des raisons sociales erronées (enseigne, nom du dirigeant, intitulé flou comme CCAS) ou des adresses manquantes et/ou incomplètes. Cette phase manuelle sera utilisée en dernier recours lorsque les lignes restantes ne peuvent être laissées pour compte.

Enfin, malgré les 3 phases il restera toujours des données non rapprochables de la base de données INSEE (comme les particuliers, certaines associations, certains établissements publics ou des sociétés étrangères).

Traitement au fil de l’eau par webservice

On peut mener le même type de traitement de sirétisation à chaque création ou modification d’un enregistrement de la base. Pour ce faire, on va ajouter des scripts aux formulaires des sites et des applications comme la CRM et l’ERP. Ce type de mise en place est intéressante si un volume conséquent de fiches est créé ou modifié.

Ma base est enrichie en SIRET, que dois-je faire lors de l'intégration ?

Voici les premières actions à mener une fois le fichier enrichi.

Supprimer les évènements “fermeture”

Il faut supprimer les prospects, clients inactifs cessés ou liquidés sans hésiter. Soyez plus prudent avec les clients actifs dans la dernière année ; il se pourrait que certains aient des commandes en cours ou que le rapprochement ait commis une erreur due à un doublon.

Modifier les adresses des sociétés “déménagées”

Il faut modifier les prospects ou clients inactifs déménagés sans hésiter. Soyez plus prudent avec les clients actifs dans la dernière année pour les mêmes raisons que plus haut.

Dédoublonnage des Sirets en doublon

Vous pouvez, si votre informatique le permet, fusionner les comptes clients/prospects ayant le même SIRET.

Regrouper les sociétés ayant le même SIREN, dans un groupe capitalistique

Attribution d’un même groupe à tous les établissements avec le même code SIREN. Par exemple, le groupe DECATHLON a comme SIREN 306 138 900.

Regrouper les sociétés ayant la même enseigne, dans un groupe de marque

Attribution d’un même groupe à tous les établissements avec la même enseigne. Par exemple, le groupe AFFLELOU. L’enseigne transcende les franchisés.

Mettre en place une segmentation métier basée sur les codes NAF

Voir notre article sur la segmentation

Faire un profiling de la base pour déterminer les codes NAF les plus porteurs en prospection.

Voir notre article sur le profiling

Les autres traitements possibles une fois ma base enrichie en numéro de SIRET

La sirétisation peut servir à plusieurs services d’une entreprise, que ce soit la comptabilité, le marketing ou encore la DSI.

Le traitement peut intervenir comme une étape lors de la mise en place d’un logiciel de gestion. On fait alors appel au sirenage pour nettoyer et injecter des données complètes et propres. Si les logiciels sont déjà en place, on parlera alors de mise à jour de votre CRM ou autres outils de la relation client.

En plus de présenter de nombreux avantages : nettoyer votre base de données des sociétés fermées, identifier les doublons dans votre base, récupérer les adresses des sociétés déménagées, identifier les établissements appartenant à un même groupe… Le Numéro de SIRET permettra d’enrichir votre base de données en informations complémentaires tels que les numéros de TVA intracommunautaire, les emails, le téléphone, le chiffre d’affaires, le score financier, etc.

Acquisition de lignes supplémentaires (SIREN d’un même groupe, NAF porteurs, société d’une même enseigne) pour enrichir la base – Voir notre article sur l'appending

Acquisition de données supplémentaires pour enrichir la base existante

Données comptables et d’assurance-crédit (CA, Bilan, stock, part de CA export…)

Voir notre article sur l'appending

Acquisition de données marketing et commerciales (Contact, fonction, email, téléphone…)

Attention, ces données sont personnelles et concernées par le nouveau Réglement Européen de Protection de Données (RGPD)

Nos derniers articles

Envie d'en savoir plus sur la sirétisation ?

Des questions ? Un projet ? Discutons-en ensemble !
Audit gratuit de votre base de données & devis sous 48h.

Inscrivez-vous à notre newsletterDéveloppez votre Happy Business !

Recevez gratuitement chaque mois 4 nouveaux articles sur le monde du digital !