Comment bloquer le Referer spam dans Google Analytics


, Mis à jour le 8 juin, 2015

Comment bloquer le Referer spam dans Google Analytics

Savez-vous ce qui me fait réellement grincer des dents? Ouvrir un rapport dans Google Analytics et avoir à l’écran un pourriel de sites référants (referrals spam). À cet effet, je vais vous expliquer quoi faire avec des pourriels de référence et vous dire pourquoi ils sont dangereux.
Cliquez ici pour obtenir directement les solutions...

Grincer des dents

Au cours de la dernière année, j’ai observé un nombre inquiétant de pourriels de sites référants qui se faufilent à l’ouverture de mes rapports Google Analytics. Le pourriel de référant est une technique qui consiste à envoyer des requêtes bidon vers un site ou produit à promouvoir, laquelle peut sembler inoffensive mais qui risque de devenir à court terme un sérieux problème. Il s'agit ici d'une technique de référencement abussif qui risque de faire d'énormes dégats

Types de référant spammeur

En ce qui a trait à Google Analytics, le pourriel de référant prend deux formes : robot d’indexation et pourriel de trafic référant fantôme.

Le robot d’indexation est un logiciel qui explore les sites Web afin de permettre à un moteur de recherche de les indexer. La plupart des robots d’indexation s’identifient comme tels à des serveurs et sont gardés à l’écart des rapports d’analyse. Cependant, certains robots d’indexation comme ceux de Semalt (YARK!) ne s’identifient pas comme robots et, par conséquent, s’affichent lors de traitement de rapports d’analyse avec un taux de rebond de 100 % et une durée de 0 secondes. Google a récemment lancé une fonction pour filtrer les robots connus, laquelle est toutefois loin d’être parfaite (j’y reviendrai plus tard).

Le pourriel de trafic fantôme, le pire des deux maux, n’explore jamais un site Web. Les polluposteurs tirent avantage du fait que Google Analytics transfère désormais l’information au moyen de demandes HTTP effectuées directement aux serveurs de Google Analytics, facilitant l’accès à une session en simulant leur adresse. Ce type de pourriel peut être créé par un simple programme qui simule des demandes HTTP visant diverses propriétés de Google sans atteindre votre site. Ce qui est encore plus embêtant est que ce pourriel peut être utilisé pour simuler des résultats de recherche organiques. Voir la prise d’écran ci-après à titre d’exemple:

 Référents spammeurs dans Google Analytics

Note : Pour le pourriel de trafic fantôme, modifier .htaccess n’aidera pas du tout puisque ces polluposteurs ne visitent jamais votre site – pour plus d’information, consultez les Mesures conformes à la documentation de référence de Google.

Conséquences négatives

 “Un référant est tout simplement une information transmise à un serveur HTTP lorsqu'un visiteur navigue d’une page à l’autre, laquelle indique où est situé le visiteur. Les utilisateurs peuvent le modifier et certains individus peuvent placer un référant sur des pages qu’ils veulent promouvoir et visiter des milliers de personnes sur le web. Les internautes le voient et se disent « ça me tente d’en savoir plus ». Il ne s’agit pas nécessairement d’un lien… Certaines personnes essaient de stimuler le trafic en visitant une panoplie de sites Web à l’aide d’un script automatisé et en configurant le référant comme l’adresse URL qu’ils veulent promouvoir… il n’y a aucune authentification.  Vous n’assumez pas automatiquement qu’il s’agit du propriétaire de l’URL si vous voyez de quoi apparaître sur votre tableau de bord. Quelqu’un essaie de faire du trouble.”

- Matt Cutts, Ancienc chef de l’équipe Google Webspam

Alors pourquoi est-ce que les pourriels de référant sont si dangereux ? Premièrement, ils portent atteinte à mes données analytiques en ligne. L’intrusion en ligne au moyen de pourriels de référant biaisent les données, affectent la précision des paramètres d’engagement et augmentent les données sur le trafic. Par conséquent, ceux qui n’ont pas conscience de ces pourriels peuvent baser leurs décisions en fonction de données inexactes, surtout en ce qui a trait à des sites avec peu de trafic.

De plus, les référants spammeurs rendent l’optimisation des moteurs de recherche plus difficile pour tout le monde. Un des objectifs des sites référants Spam est d’avoir des liens de sites qui publient leurs journaux d’accès.  Certains sites web publient des données analytiques au public, ce qui peut inclure des hyperliens donnant accès à l’adresse URL désignée du polluposteur. Ces liens retours peuvent améliorer les résultats du moteur recherche pour cette adresse URL puisque plusieurs sites web publiant des données sur le référant sont présumées fiables.

On fait face également à davantage de fins moins nobles associées à des pourriels de référant. Si un polluposteur veut envoyer un site non désiré et un trafic non admissible, il suffit de changer le nom de l’URL du référant à l’URL de la victime. Tel que susmentionné par Matt Cutts, le référant spammeur ne peut être réellement authentifié et retracé à une source spécifique. En étant conscient de ce fait, le référant spammeur peut être utilisé pour porter atteinte à une réputation, et possiblement désigner le site web inoffensif comme pourriel de référant.

L’exposition à des logiciels malveillants constitue un autre risque à quiconque s’aventure à visiter l’adresse du site référant spammeur. Avec l’essor du vol de données électroniques, il serait plus simple pour les réseaux de pourriels de référant de se fier aux URL contenant des logiciels malveillants qui visent à voler des informations importantes.

En bout de compte, personne ne veut faire l’objet d’une publicité en regardant les rapports  d’acquisition.

Solutions

À partir de Google Analytics, il y a plusieurs options pour supprimer les courriels de référant :

Exclure les noms de domaines étranges et filtrer les robots de spam

L’un des attributs de plusieurs pourriels de trafic fantôme est l’attribution inexacte du nom de domaine. En passant en revue les données référantielles dans Google Analytics, le nom de domaine sera aucunement associé à votre site web (p.ex. : apple.com). En sachant ceci, il devient assez simple de créer un filtre pour n’inclure que les données avec un nom de domaine approprié. Pour les utilisateurs de Google Analytics utilisant seulement un ou quelques domaines, cette solution est probablement la plus simple (cliquez ici pour une rapide mise à jour sur les expressions régulières dans Google Analytics):

Comment ajouter un filtre dans Google Analytics

Dans la plupart des cas, il suffit de remplacer le nom de votre domaine de premier niveau (p. exemple.com). Si vous avez plusieurs domaines, vérifiez vos expressions régulières avec Regex Pal.

Ce premier filtre supprimera tout pourriel de trafic fantôme. Cependant, il sera nécessaire d’ajouter un autre filtre pour supprimer les robots malveillants (comme Semalt) puisqu’ils visitent le site et signaleront un nom d’hôte approprié. À titre d’exemple de filtre pour supprimer les deux robots les plus usités, voir le tableau ci-après.

Comment ajouter un filtre de robots malveillant dans Google Analytics
Expression utilisée:

.*(semalt|buttons\-for\-website)\.com.*
Note : Vous devez toujours conserver l’écran sans filtre, puisque qu’une fois traitées par les filtres GA, les données ne peuvent revenir à leur état initial.

Filtrer toutes les sources des référants spams

Dans les cas où les domaines, dont l’affichage est mesuré, peuvent facilement changer, le blocage des pourriels de référant peut nécessiter un filtre de référant plus détaillé afin de pouvoir traiter tous les sites référants fautifs. Au cours des derniers mois, j’ai créé une liste de sites fautifs et réglé les filtres en conséquence, tel qu’illustré ci-après. Petite mise en garde : bien que cette liste cible bon nombre de sources de pourriels de référant, elle est loin d’être complète.

Comment bloquer tous les sites référants spam dans Google Analytics


Expression réguliére:

.*((darodar|priceg|semalt|buttons\-for\-website|makemoneyonline|blackhatworth|hulfingtonpost|bestwebsitesawards|o\-o\-6\-o\-o|(social|simple\-share)\-buttons)\.com)|((ilovevitaly|econom)(\.co(m)?|\.ru))|((humanorightswatch|4webmasters)\.org).*

Segments avancés pour les données historiques

Puisque les filtres ne peuvent traiter que des données actuelles, je vous conseille d’utiliser des segments avancés pour passer en revue les données sauvegardées avant l’implantation des filtres. Tout comme les solutions susmentionnées, c’est à vous de décider laquelle approche est la plus appropriée pour votre site. Utilisez des expressions régulières pour supprimer des sessions des pourriels de référant, tel qu’illustré ci-après :

Filtre audience dans Google analytics


Expressions régulière :

.*((darodar|priceg|semalt|buttons\-for\-website|makemoneyonline|blackhatworth|hulfingtonpost|bestwebsitesawards|o\-o\-6\-o\-o|(social|simple\-share)\-buttons)\.com)|((ilovevitaly|econom)(\.co(m)?|\.ru))|((humanorightswatch|4webmasters)\.org).*
Note : Les segments avancés peuvent être appliqués rétroactivement aux données historiques, alors que les filtres ne peuvent que traiter des données actuelles. Si vous n’êtes pas familier avec les segments et les filtres, ci-après se trouve un court sommaire comparatif des deux approches.

Filtrage de bot à partir de Afficher les paramètres de la vue (View Settings)

En juillet 2014, Google a mis en application le filtrage de bots et d’araignées afin de permettre aux utilisateurs d’obtenir des données plus exactes. À partir de l’interface administration, vous pouvez sélectionner cette option, tel qu’illustré ci-après. Cette opération exclut toute session dont le nom apparaît sur la IAB known bots and spiders list (sans aucun frais supplémentaire).

En théorie, il s’agit d’une excellente nouvelle! Cependant, cette fonction est nouvelle et nous observons toujours des pourriels de référant qui réussissent à contourner le filtrage de bots et d’araignées. Ceci étant dit, vous ne risquez rien de cocher la case surtout si Google décide d’y ajouter plus de fonctions.

Paramètre vue rapport dans Google analytics


Pour ceux qui sont familiers avec Google Tag Manager, je vous recommande vivement de lire l’article de Sayf Sharif Eliminating Dumb Ghost Referral Traffic in Google Analytics.
 

Ajouter les sites spammeur dans la Liste d'exclusion de sites référents

Le fait d'utiliser des filtres ne réglera pas le problème à 100 % et risque de rendre les visites des sites malveillants comme étant des visites directes. Pour se débarasser une fois pour toute des référents indésirables dans vos statistisques, il faut les ajouter à " la liste d'eclusion de sites réfrents" sous " informations de suivi" à partir de la section Admin. Voici une vidéo pour vous montrer comment faire:

Liste de sites malveillants

La liste actuelle de sites malveillants inclut :

  • .com
  • semalt
  • buttons-for-website
  • darodar
  • priceg
  • makemoneyonline
  • blackhatworth
  • hulfingtonpost
  • bestwebsitesawards
  • o-o-6-o-o
  • ilovevitaly
  • simple-share-buttons
  • social-buttons
  • .co
  • econom
  • ilovevitaly
  • .ru
  • ilovevitaly
  • .org
  • humanorightswatch
  • 4webmasters
  • best-seo-offer.com
  • siteevaluation.org

 

Il ne s’agit pas d’une solution à long terme

Malheureusement, à l’heure actuelle, les solutions susmentionnées ne sont efficaces qu’à court terme. Alors que les polluposteurs trouvent des moyens novateurs et plus sophistiqués pour trafiquer des pourriels, les utilisateurs de produits comme Google Analytics sont davantage susceptibles d’en subir les conséquences. Google et d’autres fournisseurs de sites analytiques en ligne travailleront à créer de nouveaux mécanismes pour lutter contre les référants spammeurs, du moins espérons-le. Cependant, avec des changements importants au système actuel, l’univers des Web Analytics risque d’avoir des mauvaises surprises. Si vous êtes nouveau dans la configuration de Google Analytics, consultez notre guide du débutant.

Mise à Jours:


comments powered by Disqus

Meilleur Audit SEO

Meilleur Audit SEO

Maintenant que la saison fiscale est terminée, je peux enfin revenir sur mon mot commençant par la lettre A préféré…audit ! Eh oui. Je m’appelle Steve et je suis un junkie des audits SEO. Comme tout junkie qui se respecte, j’ai lu tout ce qui concernait les audits en question ; j’ai écrit des milli … Continuer

Publié le 16 septembre, 2014

4 Commentaires
50 astuces pour optimiser votre SEO

50 astuces pour optimiser votre SEO

Il arrive que certains articles se propagent à travers le globe du jour au lendemain, de même qu’ils attirent l’attention des médias locaux et nationaux, mais la question que l’on se pose le plus souvent est « Comment ces éditeurs d’articles  optimise leur SEO ? » Je pense que la plupart des gens q … Continuer

Publié le 10 juillet, 2014

0 Commentaires
Crowdsourcing: Pas de contenu ? Pas de problème !

Crowdsourcing: Pas de contenu ? Pas de problème !

Beaucoup de compagnies ont des stratégies sociales/de contenu qui dépendent du contenu généré par leurs fans pour créer une communauté et encourager les gens à participer. Cet article vous donne des exemples de compagnies qui utilisent ce genre de contenu et des instructions sur comment avoir des s … Continuer

Publié le 22 avril, 2014

0 Commentaires
10 statistiques sur les médias sociaux

10 statistiques sur les médias sociaux

Comme tout le monde le sait, les médias sociaux changent plus vite que jamais ! Si vous gérez un média social pour votre business, il serait peut-être utile de prendre connaissance de quelques-unes des statistiques les plus surprenantes cette année. En voici dix qui pourraient vous faire reconsidér … Continuer

Publié le 30 mars, 2014

4 Commentaires
Guide du débutant sur le SEO

Guide du débutant sur le SEO

Depuis que j’ai commencé à travailler dans le marketing en ligne il y a quelques années, j’ai la tête pleine d’acronymes. KPI, PPC, SoLoMo, TOFU, BOFU, et FOMO, tout ça sonne parfaitement normal pour moi maintenant – c’est fou, non ? Mais l’acronyme qui interpelle le plus les gens, c’est SEO (searc … Continuer

Publié le 13 mars, 2014

1 Commentaires
Création de backlinks à partir de liens brisés

Création de backlinks à partir de liens brisés

Vous êtes à court d’idées pour améliorer votre stratégie de création de liens ? Nous vous montrerons dans cet article comment créer des liens retour pour votre site web à travers des liens brisés. Cette méthode a très bien marché pour moi dans plusieurs cas, et je suis sûr qu’elle peut fonctionner p … Continuer

Publié le 3 mars, 2014

2 Commentaires
Réseaux Sociaux et autorité du Site Web

Réseaux Sociaux et autorité du Site Web

Les statistiques sur lesquelles l’autorité de domaine (« Domain Authority ») se base pour évaluer votre site web sont plus redoutables que celles sur lesquelles se base la PageRank. S’il fallait désigner un gagnant, je dirais que l’autorité de domaine est à présent bien loin devant la PageRank. Et j … Continuer

Publié le 3 février, 2014

0 Commentaires
Visualisation des données marketing- tutoriel

Visualisation des données marketing- tutoriel

Il est important de savoir bien analyser et interpréter vos données marketing. Il existe différents types d’outils et tableaux de bord pour vous aider dans cette tâche. Dans ce tutoriel, consacré aux débutants, nous vous présenterons les étapes à suivre pour créer votre premier tableau de bord de vi … Continuer

Publié le 23 janvier, 2014

0 Commentaires
Google AuthorRank

Google AuthorRank

Qu’est-ce que l'Author Rank? Si, comme moi, vous utilisez régulièrement Google, vous avez sûrement déjà entendu parler d’Author Rank, sans toutefois y faire vraiment attention. Mais honnêtement, je doute que vous y ayez porté une réelle attention et si vous avez été déconnecté de Google et de l’int … Continuer

Publié le 20 janvier, 2014

0 Commentaires
Outils d'audit SEO en ligne

Outils d'audit SEO en ligne

Maintenant que les chefs d’entreprise s’occupent de tout, de la planification stratégique au SEO pour leur site web, le monde du « fait maison » peut s’avérer être complètement écrasant. La bonne nouvelle, c’est que nous vivons à l’ère digitale, et que des collègues entrepreneurs ont créé des outils … Continuer

Publié le 18 janvier, 2014

0 Commentaires



Les avis des clients

Avis des utilisateurs


Faites entendre votre voix. Passez en revue votre fournisseur d'hébergement Web - bon ou mauvais.


EX2 - assistance technique - 3 AWARDS :-) Bonjour, Ce n'est pas si fréquent que cela de rendre un hommage à un service de nos jours et surtout, quand il s'agit d'assistance technique dans les domaines du web. Pour avoir fait quelques hébergeurs que je ne citerai pas ici, je peux vous assurer que je …

Lampecco Pascal à propos Ex2hosting

Montrer une autre revue
Lire les avis Ex2hosting



Plans d'hébergement




Les plans d'hébergement de 59 sociétés d'hébergement partout dans le monde


Meilleur hébergeurs web

# hébergeur web prix action

1

Ikoula

1.95 EURO

Ajouter un Avis
Visiter

2

Siteground

6.95 USD

Ajouter un Avis
Visiter

3

Ex2hosting

3.99 EURO

Ajouter un Avis
Visiter

4

Inmotion

5.95 USD

Ajouter un Avis
Visiter

5

Webhostinghub

4.95 USD

Ajouter un Avis
Visiter

6

Bluehost

6.95 USD

Ajouter un Avis
Visiter






Hébergeurs par avis de clients

Ex2hosting
78 avis des clients
Nuxit France
70 avis des clients
Hostpapa France
67 avis des clients
1and1 France
62 avis des clients
Rapidenet
50 avis des clients
Ajouter un avis Tous les profils


Hébergeurs par fidélité de clients

Ex2hosting
73 / 78 recommandé
Nuxit France
68 / 70 recommandé
Rapidenet
49 / 50 recommandé
Infomaniak France
48 / 48 recommandé
Hostpapa France
39 / 67 recommandé
Évaluer hébergeur Tous les profils


Question de la Semaine


Le plus important critère de votre hébergeur



Contacter l'éditeur

Posez votre question