Comment bloquer le Referer spam dans Google Analytics

Comment bloquer le Spam de référencement dans Google Analytics ?

Mis à jours 23 juillet 2024

Le spam de référent est une nuisance courante qui peut fausser les données de Google Analytics, rendant difficile l’analyse précise du trafic de votre site web. En filtrant ces données indésirables, vous pouvez obtenir une image plus claire et précise du comportement de vos visiteurs. Ceci est crucial pour prendre des décisions éclairées en matière de marketing et d’optimisation du site. Dans cet article, nous allons explorer diverses méthodes pour bloquer le spam de référent dans Google Analytics, en utilisant des filtres personnalisés et des configurations avancées. En suivant ces étapes, vous pourrez améliorer la qualité de vos données et optimiser votre stratégie digitale.

Le spam de référent, également connu sous le nom de spam referrer, se présente sous plusieurs formes, notamment le Ghost Spam et le Crawler Spam. Le Ghost Spam injecte des données fictives dans vos rapports Google Analytics sans visiter réellement votre site, tandis que le Crawler Spam implique des bots qui visitent effectivement votre site, enregistrant de fausses informations. Ignorer ces spams peut conduire à des analyses erronées et à des décisions basées sur des données inexactes.

Pour commencer, nous allons définir les étapes préliminaires essentielles pour filtrer efficacement le spam de référent, puis explorer les méthodes avancées pour une suppression complète et proactive de ces données indésirables.

Comprendre le spam de référent

Le spam de référent, ou referrer spam, est une forme de spam qui peut fausser les données de Google Analytics en générant du faux trafic. Il existe principalement deux types de spam de référent : Ghost Spam et Crawler Spam.

Types de spam de référent

  1. Ghost Spam
Ghost Spam
  • Description : Le Ghost Spam injecte des données fictives directement dans vos rapports Google Analytics sans que les bots ne visitent réellement votre site web. Cela est possible en utilisant votre identifiant de suivi UA, ce qui permet de manipuler les données de trafic.
  • Impact : Ce type de spam peut considérablement fausser vos statistiques, rendant difficile l’analyse correcte des performances de votre site.
  • Exemple : Les référents comme « free-social-buttons.com » ou « 4webmasters.org » sont souvent des Ghost Spam.
  1. Crawler Spam
Crawler Spam
  • Description : Le Crawler Spam, à la différence du Ghost Spam, implique des bots qui visitent réellement votre site. Ces bots accèdent à vos pages, enregistrant des informations dans vos rapports de trafic.
  • Impact : Bien que ces visites soient réelles, elles n’apportent aucune valeur, car elles ne représentent pas de véritables utilisateurs intéressés par votre contenu.
  • Exemple : Les bots de sites comme « semalt.com » ou « buttons-for-website.com » sont typiquement des Crawler Spam.

Comment le spam de référent affecte Google Analytics

Comment le spam de référent affecte Google Analytics
  • Faussage des données de trafic : Les spams de référent augmentent artificiellement le nombre de visites, faussant ainsi les rapports de trafic. Cela rend difficile la compréhension du comportement réel des visiteurs de votre site.
  • Réduction du taux de conversion : Les visites générées par les spams de référent n’entraînent aucune conversion réelle, ce qui peut abaisser votre taux de conversion global.
  • Difficultés d’analyse des sources de trafic : L’inclusion de données de spam complique l’analyse des sources de trafic, rendant plus difficile l’identification des canaux de marketing efficaces.

Étapes préliminaires

Pour filtrer efficacement le spam de référent dans Google Analytics, il est important de suivre quelques étapes préliminaires pour s’assurer que vous travaillez avec des données précises et fiables. Voici les étapes à suivre :

Créer une vue non filtrée

  1. Créer une nouvelle vue
Créer une vue non filtrée
  • Connectez-vous à Google Analytics.
  • Allez dans « Admin » > « Vue » > « Créer une vue ».
  • Donnez un nom à cette vue, par exemple « Vue non filtrée » et configurez les paramètres selon vos besoins.
  1. Conserver les données brutes

Cette nouvelle vue servira de sauvegarde pour vos données brutes, vous permettant de comparer et de vérifier l’efficacité de vos filtres.

Activer le filtrage des bots connus

  1. Activer le filtrage des bots
Activer le filtrage des bots
  • Allez dans « Admin » > « Paramètres de la vue ».
  • Cochez la case « Exclure tous les hits provenant de bots et de spiders connus ».
  1. Vérification des paramètres :

Enregistrez les modifications pour appliquer ce filtre. Cela permet de réduire automatiquement une partie du trafic de spam provenant de bots et de spiders bien connus.

Créer des filtres personnalisés dans Google Analytics

Créer une nouvelle vue

Pour bloquer efficacement le spam de référent dans Google Analytics, la création de filtres personnalisés est essentielle. Voici comment procéder pour exclure les hostnames invalides et les sources de campagne malveillantes.

Filtrer les hostnames valides

Filtre  hostnames valides
  1. Accéder aux filtres :
  • Connectez-vous à Google Analytics.
  • Allez dans « Admin » > « Vue » > « Filtres ».
  • Cliquez sur « Ajouter un filtre ».
  1. Créer un nouveau filtre :
  • Nommez votre filtre, par exemple « Filtrer les hostnames valides ».
  • Sélectionnez « Type de filtre personnalisé » et choisissez « Inclure ».
  • Dans le champ « Filtrer le champ », sélectionnez « Nom d’hôte ».
  • Dans le champ « Modèle de filtre », saisissez les hostnames valides en utilisant une expression régulière (REGEX). Par exemple :
codeexample.com|www.example.com|blog.example.com
  • Cliquez sur « Vérifier ce filtre » pour vous assurer qu’il fonctionne correctement.
  • Enregistrez le filtre.

Exclure les sources de campagne malveillantes

Exclure les sources de campagne malveillantes

Voici comment créer un filtre pour exclure les sources malveillantes :

  • Toujours dans « Admin » > « Vue » > « Filtres », cliquez sur « Ajouter un filtre ».
  • Nommez ce filtre, par exemple « Exclure le spam de campagne ».
  • Sélectionnez : « Type de filtre personnalisé » et choisissez « Exclure ».
  • Dans le champ « Filtrer le champ », sélectionnez : « Source de la campagne ». Dans le champ « Modèle de filtre », saisissez les sources de spam connues en utilisant une REGEX. Par exemple :
codespam-source1\.com|spam-source2\.com|spam-source3\.com
  • Cliquez sur « Vérifier ce filtre » pour vous assurer qu’il fonctionne correctement.
  • Enregistrez le filtre.

Exclure le spam de langue

Suivez ces étapes pour créer un filtre pour le spam de langue :

  • Allez dans « Admin » > « Vue » > « Filtres » et cliquez sur « Ajouter un filtre ».
  • Nommez ce filtre, par exemple « Exclure le spam de langue ».
  • Sélectionnez « Type de filtre personnalisé » et choisissez « Exclure ».
  • Dans le champ « Filtrer le champ », sélectionnez « Paramètres de langue ».Dans le champ « Modèle de filtre », saisissez une REGEX pour les paramètres de langue malveillants. Par exemple :
\s[^\s]*\s|.{15,}|\.|
  • Cliquez sur « Vérifier ce filtre » pour vous assurer qu’il fonctionne correctement.
  • Enregistrez le filtre.

Utiliser le fichier .htaccess pour bloquer le spam

Utiliser le fichier .htaccess pour bloquer le spam

Le fichier .htaccess est un outil puissant pour bloquer le spam de référent directement au niveau du serveur. Cela empêche non seulement le trafic de spam d’atteindre votre site, mais réduit également la charge sur votre serveur en bloquant les bots indésirables avant qu’ils ne puissent consommer des ressources.

Ajouter des règles de réécriture pour bloquer les référents indésirables

  1. Accéder au fichier .htaccess : Connectez-vous à votre serveur via FTP ou utilisez le gestionnaire de fichiers de votre hébergeur pour accéder au fichier .htaccess situé à la racine de votre site web.
  2. Ajouter des règles pour bloquer les référents : Ajoutez les lignes suivantes à votre fichier .htaccess pour bloquer des domaines de spam spécifiques. Remplacez les exemples par les domaines de spam que vous souhaitez bloquer
## BLOCK SITE REFERRERS
RewriteEngine on
RewriteCond %{HTTP_REFERER} spamdomain1\.com [NC,OR]
RewriteCond %{HTTP_REFERER} spamdomain2\.com [NC,OR]
RewriteCond %{HTTP_REFERER} spamdomain3\.com [NC]
RewriteRule .* - [F]
  1. Enregistrer et tester :

Enregistrez les modifications apportées au fichier .htaccess et testez votre site pour vous assurer qu’il fonctionne toujours correctement. Vérifiez les logs de votre serveur pour confirmer que les tentatives de spam sont bien bloquées.

Exemple de configuration .htaccess

Voici un exemple de configuration complète pour bloquer plusieurs domaines de spam de référent :

## BLOCK SITE REFERRERS
RewriteEngine on
RewriteCond %{HTTP_REFERER} darodar\.com [NC,OR]
RewriteCond %{HTTP_REFERER} ilovevitaly\.co [NC,OR]
RewriteCond %{HTTP_REFERER} semalt\.com [NC,OR]
RewriteCond %{HTTP_REFERER} buttons-for-website\.com [NC]
RewriteRule .* - [F]

Avantages de l’utilisation du fichier .htaccess

  • Flexibilité : Peut être mis à jour régulièrement pour inclure de nouveaux domaines de spam dès qu’ils apparaissent.
  • Efficacité : Bloque les bots avant qu’ils n’accèdent à votre site, réduisant ainsi la consommation de ressources serveur.
  • Simplicité : Facile à mettre en œuvre et à maintenir.

Utiliser des outils tiers pour bloquer le spam

En complément des filtres personnalisés et des configurations de fichiers .htaccess, des outils tiers peuvent être utilisés pour bloquer efficacement le spam de référent et protéger votre site web contre les trafics indésirables.

1.Sucuri

Sucuri est une solution de sécurité web complète qui inclut des fonctionnalités pour bloquer le spam de référent. Il surveille et protège votre site contre les malwares, les attaques DDoS, et le trafic indésirable.

Fonctionnalités :

  • Surveillance de la sécurité en temps réel.
  • Blocs personnalisables pour les domaines de spam.
  • Pare-feu web (WAF) pour filtrer les trafics malveillants.

Configurer Sucuri :

  • Inscrivez-vous sur Sucuri et ajoutez votre site web à la plateforme.
  • Configurez les paramètres de sécurité pour inclure le blocage des référents spam.
  • Activez le pare-feu web (WAF) pour filtrer le trafic entrant.

2. Cloudflare

Cloudflare offre des services de CDN (Content Delivery Network) et de sécurité web, y compris la protection contre le spam de référent et les bots malveillants.

Fonctionnalités :

  • Protection DDoS.
  • Filtrage du trafic malveillant.
  • Options de blocage des référents et des IP suspectes.

Configurer Cloudflare :

  • Inscrivez-vous sur Cloudflare et ajoutez votre domaine.
  • Configurez les réglages de sécurité et de pare-feu pour bloquer les référents spam et les bots malveillants.
  • Utilisez les règles de pare-feu personnalisées pour bloquer les domaines de spam spécifiques.

3. Google Analytics Opt-out Add-on :

Une extension pour Google Chrome qui aide à bloquer le spam de référent en ajoutant automatiquement des filtres dans Google Analytics.

Fonctionnalités :

  • Détection automatique des référents spam.
  • Ajout facile de filtres à Google Analytics.
  • Mise à jour régulière de la liste des spams connus.

Utiliser Google Analytics Opt-out Add-on :

  • Installez l’extension depuis le Chrome Web Store.
  • Connectez l’extension à votre compte Google Analytics.
  • Suivez les instructions pour ajouter des filtres automatiques et bloquer les référents spam.

Limites et défis des solutions actuelles

Il est important de comprendre que les solutions mentionnées pour bloquer le spam de référent dans Google Analytics ne sont pas des solutions à long terme. Malheureusement, à l’heure actuelle, ces méthodes ne sont efficaces qu’à court terme. Les polluposteurs développent constamment des moyens innovants et sophistiqués pour envoyer des pourriels, ce qui signifie que les utilisateurs de Google Analytics et d’autres outils d’analyse en ligne sont susceptibles d’en subir les conséquences de manière récurrente.

Innovation constante des polluposteurs

Les spammers utilisent des techniques de plus en plus avancées pour contourner les filtres et continuer à envoyer des données de spam. Par exemple, ils peuvent utiliser des réseaux de bots sophistiqués, changer fréquemment leurs domaines de référence, ou exploiter de nouvelles failles dans les systèmes de filtrage. Cette constante innovation rend les solutions de filtrage actuellement disponibles temporaires et nécessitant des mises à jour régulières.

Réponse des fournisseurs de services analytiques

Google et d’autres fournisseurs de services analytiques travaillent continuellement à développer de nouveaux mécanismes pour lutter contre le spam de référent. Cela inclut l’amélioration des algorithmes de détection des spams, la mise en place de filtres plus robustes, et l’offre de meilleures options de personnalisation pour les utilisateurs.

L’importance de la vigilance continue

Il est crucial pour les utilisateurs de Google Analytics de rester vigilants et de mettre à jour régulièrement leurs filtres et configurations pour répondre aux nouvelles menaces de spam. Bien que les fournisseurs d’outils analytiques améliorent leurs systèmes, il est également de la responsabilité des utilisateurs de suivre les meilleures pratiques et d’ajuster leurs paramètres en conséquence.

Perspective future

Avec les changements continus dans le domaine de l’analyse web, il est probable que nous assisterons à des surprises, bonnes ou mauvaises. Les progrès technologiques apporteront de nouveaux outils et méthodes pour lutter contre le spam de référent, mais il est aussi possible que les spammers trouvent de nouvelles failles à exploiter. La clé est de rester informé et proactif pour maintenir la qualité des données analytiques.

Jacques Tremblay
Suivez moi

Check Also

Marque Personnelle

Comment créer une marque personnelle et la promouvoir avec succès ?

Mis à jours 6 décembre 2021 Elon Musk et Richard Branson, Billie Eilish et Oprah …