Emolytics

Avez-vous remarqué un certain nombre de références inexplicables dans vos rapports Google Analytics récemment ? Cela est probablement causé par un spam de référence malveillant.

The rise of referrer spam in your analytics reports

Robots vs humains : qui dirige le Web ?

Si vous surveillez régulièrement votre site Web, vous avez probablement du voir une augmentation des visites récemment. En règle générale, C’est plutôt une bonne nouvelle, mais si cela vous arrive, vous devriez être un peu méfiant. Les visites sont-elles de vrais êtres humains ou de robots ?

Aujourd’hui, les robots sont plus actifs que jamais et représentent jusqu’à 50% du trafic en ligne. Cependant, tous les robots ne sont pas mauvais. Certains d’entre eux aident à améliorer notre expérience utilisateur sur le Web. Prenez Googlebot, par exemple. C’est un moteur utile qui indexe le contenu et les pages Web dans son moteur de recherche pour nous aider à trouver ce que nous recherchons rapidement.

Bien sûr, d’autres robots n’ont pas autant de bonnes intentions. Ils exécutent des fonctions malveillantes et provoquent une confusion dans le système de rapport analytique web. Google Trends a récemment révélé une augmentation exponentielle des robots malveillants dans les recherches des moteurs de recherche impliquant le spam de référence, ainsi que le spam de référence fantôme, ce qui est encore plus difficile à contrôler.

Spam de référence et spam de référence fantôme : Les robots interfèrent avec vos analyses

Le spam de référence, également connu sous le nom de spam de référence fantôme, est un type très spécifique de « spamdexing » (spamming destiné aux recherches sur les moteurs de recherche). Dans le domaine de l’analyse Web, il représente une tendance croissante qui gonfle de façon trompeuse le nombre de visites sur un site Web provenant d’une source référencée. En d’autres termes, le spam par référence est une fausse source de trafic prétendant rediriger les visiteurs sur votre site, vous donnant une fausse image de votre popularité.

Cette technique de spam de référence implique de faire des demandes répétées à l’aide d’une fausse URL de référence sur le site Web cible. Le but de ces spammeurs est double : améliorer leur classement sur les moteurs de recherche en indexant (via les journaux d’accès) ces liens générés de manière intensive, et aussi pour générer des revenus en incitant les webmasters et les spécialistes du marketing Web à visiter les sites malveillants signalés comme référents dans leurs analytiques.

Au fil des années, les spam de référence robots sont devenus de plus en plus sophistiqués. La dernière génération de robots agissant comme spam de référence fantôme envoie des fausses données de visite sans même visiter votre site. Ils obtiennent simplement votre code de suivi analytique ou l’ID de la propriété Google Analytics, qui est une information publique. Ce type de spam est particulièrement dangereux car il est « immunisé » par les méthodes habituelles pour traiter le spam par référence.

Comment les données de spam de référence affectent-elles votre analyse ?

Les robots spam affectent vos analyses de cinq façons clés:

  1. Ils affectent la précision de vos données
  2. Ils diminuent votre taux d’engagement
  3. Ils réduisent la qualité du trafic de votre site
  4. Ils augmentent votre taux de rebond (jusqu’à 100%)
  5. Ils réduisent le temps moyen sur la page (environ 1,0) et la durée de la session (0,00)

En d’autres termes, le spam de référence vous donne une fausse impression de succès tout en dégradant le reste de vos données les plus qualifiées et les plus utiles.

Le nettoyage de vos analytiques est plus critique que jamais, quelle que soit la popularité, la taille ou l’ancienneté de votre site Web. Le spam par référence peut affecter les sites récemment créés bien avant qu’ils n’aient gagné en popularité.

En fait, plus votre site est petit, moins vous aurez de visites, et au plus l’impact des spams de références aura d’influence sur vos paramètres. Si vous possédez un grand site Web avec des dizaines de milliers de visiteurs chaque jour, les faux liens de référence seront compensés par vos données réelles de liens entrants. Quelle que soit la taille ou la popularité de votre site, l’impact du spam est important et ne doit pas être négligé.

Heureusement, il existe des solutions qui vous permettent d’ignorer le spam de référence et le spam de référence fantôme, et même de restaurer l’intégrité de vos données précédentes.

Comment traiter le spam de référence  sur vos rapports Google Analytics

Voici un aperçu rapide des façons les plus courantes de traiter les spams de référence et à quel point ils sont efficaces:

Filtrer sur le champ «Renvoi»

Filter on the ‘Referral’ field

Filtrer sur le champ ‘Renvoi’

Une recommandation commune consiste à créer simplement un filtre en fonction des critères du champ de référence. Cela semble trop beau pour être vrai. Malheureusement, ça l’est ! Cette approche est inefficace parce que les spammeurs changent régulièrement les références qu’ils utilisent. Vous devriez constamment mettre à jour votre filtre qui est une solution inefficace et qui ne traite pas la cause. Certaines personnes recommandent d’utiliser un filtre basé sur le champ Source de la campagne, mais ce champ n’est souvent pas explicitement mentionné, de sorte que Google Analytics utilise automatiquement la référence par défaut.

Filter sur le champ Hostname

Filter on the Hostname field

Filter sur le champ Hostname 

Une autre approche est de définir un filtre basé sur le champ Hostname. Mais comme nous l’avons vu plus tôt, les spammeurs peuvent envoyer des fausses données sans cibler un nom d’hôte de site Web identifié en corrélation avec un identifiant de propriété Google Analytics. En créant une liste blanche basée uniquement sur le champ Hostname, vous risquez de filtrer accidentellement les vues de page valides. Mauvaise idée !

Filtrer sur le champ de requête URI

Filter on the Request URI field

Filtrer sur le champ de requête URI 

Il s’agit d’une méthode plus déductive basée sur l’hypothèse que le spam par renvoi fantôme demande la page d’accueil du site. Donc, la solution consiste à remplacer l’URI (/) de la page d’accueil déclarée dans l’extrait Javascript Google Analytics avec une alternative telle que /index.php. Ce faisant, vous pouvez ignorer sans risque le spam par renvoi en créant un filtre qui exclut toutes les vues de page avec le champ URI demandé configuré sur /. Un problème majeur avec cette approche est qu’elle introduira une discontinuité dans les données de votre page d’accueil. Afin d’éviter cela, vous pouvez exécuter un autre filtre pour mapper automatiquement /index.php dans vos analityques.

Dimension personnalisée

Custom dimension

         Dimension personnalisée

Vous pouvez utiliser la dimension personnalisée dans le cas où les spammeurs commencent à cibler des pages autres que /. Cette technique vise à modifier le code de suivi pour éviter ce comportement spécifique et envoyer une valeur corrélée et filtrable à Google Analytics dans toutes les pages vues. Mais même cette approche n’est pas entièrement sûre et durable.

Investissez dans des données d’analyse plus propres pour bloquer le spam de référence

L’équipe de développement Emolytics a développé des mesures de sécurité robustes et efficaces dans notre outil d’analyse. Le spam par référence cible souvent des fournisseurs spécifiques tels que Google Analytics, de sorte que notre outil d’analyse est naturellement immunisé contre les robots indésirables.

Mettre des battons dans les roues des mauvais robots est notre credo. Nous avons mis en place un filtre pour protéger directement les IP des robots renommés connus ou détectés. Nous vérifions et filtrons toutes les données et veillons à ce que le domaine et l’ID conviennent bien pour prévenir les comportements malveillants. Contrairement à Google Analytics, il est impossible de décrypter l’ID avec la solution Emolytics, ce qui rend le trafic de spam de référence plus difficile ou impossible dans les activités de masse.

Nos clients ont déjà constaté des améliorations significatives lors de la comparaison de leurs rapports Google Analytics avec nos données optimisées Emolytics : un certain nombre de statistiques clés sont clairement plus qualifiées et réalistes, en particulier en ce qui concerne le taux de rebond, la durée de session et le nombre de visites.

La morale de cette histoire de robots ? Bloquer le spam de référence, en particulier le spam par référence fantôme, prend du temps et demande de l’effort, mais c’est un problème crucial qui doit être résolu si vous souhaitez préserver la validité de vos indicateurs de performance et atteindre vos objectifs de marketing.

Demandez dès maintenant une démo gratuite avec l’un de nos bloqueurs de spam les plus endurcis !

CTO and Co-Founder at Emolytics, David Frenay is an Engineer, Physicist and Entrepreneur. He is Passionate about data, web dev, psychology, entrepreneurship and complexity science.

View Comments

There are currently no comments.

Next Post

This website uses cookies to ensure you get the best experience on our website.
Some functionality will be unavailable until cookies are allowed. About cookies