Une étude de cas sur l'inflation du contenu, la dégradation de l'indexation et le coût (caché) de la publication accrue.
SERVICE RECOMMANDÉ :
DISCUSSION CONNEXE :
TERMES CLÉS :
J'ai récemment analysé une jeune entreprise SaaS qui avait mis en place un référencement naturel programmatique pour la création de contenu. En réalité, il ne s'agissait pas seulement de contenu : le site web, l'application, les messages vocaux et les conseils (ils proposent des conseils relationnels) étaient quasiment tous générés automatiquement grâce à l'IA.
Sur le blog généré automatiquement, plus de 270 articles ont été publiés et, apparemment, le processus de publication était efficace. Pourtant, Google n'a indexé qu'une soixantaine de pages. Pour être plus précis : c'est même moins, car sur ces 65 pages indexées, 23 sont des pages de tags. Au final, près des trois quarts du contenu ont été ignorés.
Ce que j'appelle un inflation du contenun publie activement sur le web sans pour autant générer de clics ni de mentions. Souvent, une inflation du contenu se produit lorsque le nombre de documents publiés augmente. plus rapide que la quantité d'informations uniques apportées par ces documents.
Signaux :
Modèles permettant de catégoriser l'inflation du contenu :
Le résultat de l'inflation du contenu :
Le site s'agrandit sans pour autant devenir plus informatif.
Dans notre cas, le schéma le plus flagrant était celui du « contenu standardisé », c’est-à-dire un contenu produit sans démontrer d’autorité manifeste ni d’expérience directe avec le sujet. Le site présente une structure de titres répétitive : génériques et facilement identifiables, sans citer de personnes réelles (ni avoir d’auteur désigné), malgré son appartenance au domaine médical/psychologique.
J'affirme que 75 % des pages n'ont pas été indexées. parce que d'inflation du contenu. D'autres explications possibles ont été explicitement écartées au cours de la recherche (nous omettons cette partie ici), notamment :
La question la plus importante du brief client était la suivante : une seule page – l’avis sur la marque concurrente – génère 30 % de nos clics organiques. L’ensemble du contenu associé à cette marque (avis, conseils, comparaison marque-concurrent, etc.) représente environ la moitié du trafic non lié à la marque.
Il est important de noter que l'équipe du concurrent a pris contact avec lui pour lui demander de cesser toute publication à son sujet. Le client cherchait donc à compenser la perte de trafic (après la suppression potentielle de ce groupe de concurrents).
Ainsi, si l'on considère le contenu non pas comme des pages individuelles, mais comme un portfolio, on peut construire la séquence suivante de questions relatives à la qualification, dont les réponses permettent de définir la qualité du portfolio de contenu :
Il est à noter que, dans ce cas précis, aucun autre ensemble de pages, qu'il s'agisse du blog dans son ensemble (ou de tout autre groupe d'articles), des pages de services, des pages informatives, etc., ne pouvait rivaliser avec un ensemble de pages axé sur la concurrence. Consciente de cela, la cliente a délibérément utilisé cette stratégie de contenu « dénigrement de la concurrence » (comme le font d'ailleurs de nombreuses autres entreprises SaaS), mais le problème était que ses autres ensembles de pages étaient loin d'atteindre ce niveau. Cela a mis en lumière un point essentiel :
Un site web accumule des contenus et perd simultanément en qualité de portefeuille en dehors du groupe de contenus piloté par la concurrence.
Si elles se radicalisent, toutes les grappes — à l'exception de celles axées sur la concurrence — tendent à ne pas apporter de valeur ajoutée. Par conséquent, l'ajout de contenu supplémentaire (au sein de ces grappes) ne fait qu'amplifier le cercle vicieux. Comme décrit dans Étude de cas wlw.de sur l'optimisation du portefeuille de contenu, cette boucle de rétroaction fonctionne comme ceci :
Les signaux négatifs provenant de plusieurs pages sont pris en compte dans le calcul des performances de toutes les pages du segment (cluster). Ainsi, lorsque d'anciennes pages sont pénalisées, les nouvelles subissent le même sort et ne parviennent pas à se positionner correctement dans les résultats de recherche.
De ce point de vue, le problème relie deux choses :
La première option semblait plus simple. Je recommandais d'abandonner la stratégie de contenu consistant à « éliminer les concurrents » et de se concentrer plutôt sur une page par concurrent. Tout le reste (l'ensemble du contenu) serait consolidé ou redirigé. Je ne perçois pas de risque important de perte de trafic lié à une telle stratégie d'élagage de contenu.
Cette dernière opération — la récupération de l'indexation des URL à partir des clusters natifs — est beaucoup plus complexe.
Signaux possibles :
Systèmes de recherche Gen AI :
Si dix pages disent la même chose, la onzième n'apporte que peu de valeur ajoutée.
Mon principal conseil était de décommoditer le contenu, c'est-à-dire passer d'un contenu générique à une présentation des fonctionnalités de leur application (par rapport à d'autres outils similaires). Cela démontrerait la valeur de contenu spécifique au fabricant et permettent une meilleure indexation et un plus grand nombre de mots-clés par page.
Alors que la plupart des entreprises suivent :
J'ai proposé :
Taux d'utilisation du portefeuille
Exemple : 270 pages publiées donnent lieu à 65 pages indexées, ce qui équivaut à un taux d’utilisation effectif de 24 % — c’est un taux d’utilisation du portefeuille que tout créateur de contenu doit surveiller.
C'est important pour ce client en particulier (et globalement) en raison du risque imminent et élevé de désindexation (plus importante). Des tendances comme celle-ci indiquent ce risque : c'est l'une des stratégies d'IA qui se retournent contre leurs auteurs. Mon choix, un peu à contre-courant, a été d'arrêter complètement d'ajouter du nouveau contenu et de me concentrer sur l'élimination du contenu le moins performant (redirection, suppression, regroupement d'articles) ainsi que sur la modification manuelle des titres du blog. C'est là que le suivi du taux d'utilisation du portefeuille peut s'avérer particulièrement utile.
À propos de Bohdan Lytvyn
Contexte et approche détaillés — bohdanlytvyn.com

Bohdan Lytvyn
« CROISSANCE SANS GASPILLAGE » AUTEUR DE LIVRES
17 ans d'expérience en SEO et stratégie de croissance. Ancien responsable SEO senior chez Alibaba (filiale européenne). Expérience auprès de marketplaces B2B, de plateformes SaaS, d'entreprises e-commerce et d'entreprises 100 % digitales en Europe.
Basée à Paris. Je travaille en anglais et en français.
Je ne dirige pas une agence qui vous affecte à une équipe junior. Je suis celle qui réalise le diagnostic, conçoit la stratégie et livre le travail.