Dans un précédent billet, nous avons expliqué les avantages par Google BigQuery pour l’analyse de données. Dans cet article, nous allons nous concentrer sur les données issues de la Google Search Console (GSC).
Quelles sont les limites des données que vous voyez dans la Search Console
L’immense majorité des utilisateurs de la Google Search Console accèdent aux rapport Performances de leurs propriétés pour effectuer leurs analyses. Penchons-nous sur leurs limitations.
16 mois de données maximum
Première grosse restriction : les données mises à disposition par Google ne vont pas au-delà des 16 derniers mois. Avec celles-ci, il est donc impossible de faire des comparaisons saisonnières ou annuelles approfondies.
Limite de 1000 lignes par rapport
Lorsque vous chargez le rapport de performance de la Google Search Console, peu importe la segmentation appliquée, vous êtes toujours limité.e à 1000 lignes de données. Par conséquent, vous n’accédez pas à toutes les informations existantes.
Données partielles
En plus de la question des 1000 lignes, de l'échantillonnage peut être appliqué à vos rapports. Plus encore, ces derniers ne vous fournissent pas d’informations concernant les requêtes anonymisées (les données pour des recherches qui requièrent une anonymisation pour des raisons de confidentialité). Encore une fois, cela fait en sorte que les données auxquelles vous accédez sont incomplètes.
Et l’API dans tout cela ?
Quand nous expliquons ceci, on nous répond souvent “oui, mais avec l’API…”. Et c’est un réflexe louable, car l’API offre une grande flexibilité pour aller chercher les données de la Search Console dont vous avez besoin.
Mais, malheureusement, l’API souffre d’un peu près toutes les limitations citées ici : 16 mois de données maximum, de l'échantillonnage potentiel et certaines informations manquantes. Cet outil vous contraint aussi à respecter certains quotas au niveau de vos requêtes et offre une liste de dimensions, ainsi que de métriques, assez limitée.
Pourquoi exploiter ses données Search Console dans BigQuery
Bon, vous l’avez à présent compris : ce que vous voyez dans l’interface de la GSC et les informations que vous pouvez obtenir de son API ont des limitations assez importantes. Parlons à présent de la solution qui vous aidera à aller plus loin, BigQuery.
Petite note : nous parlerons ici de l’export automatique proposé par la Google Search Console vers BigQuery. C’est une précision importante, car cette fonctionnalité permet (justement) d’éviter de devoir passer par l’API pour importer les données de la GSC, ce que des “data pipelines” ou scripts “maisons” font.
N’oubliez pas de lire comment paramétrer l’export de données de la Search Console vers BigQuery. C’est gratuit et relativement simple à mettre en place.
Revenons aux avantages que cette approche propose :
Conservation illimitée des données
Cela dépend bien entendu de quand vous activez l’export, mais le gros avantage de BigQuery, étant une solution de stockage de données en ligne, est que vous pouvez y stocker vos données sans limitations.
Accès aux données pures, incluant pour les requêtes anonymisées
Comme pour les données de Google Analytics 4 dans BigQuery, celles de la GSC sont plus complètes et granulaires quand exportées vers cette solution avec la fonctionnalité proposée par défaut par Google. Cela vous permet même d’obtenir des détails quant aux requêtes anonymisées pour obtenir un tableau plus complet quant aux informations que la Search Console vous fournit.
Mélange et manipulation de données
En exportant vos données vers BigQuery, vous prenez possession de celles-ci. Cela vous offre la possibilité d’effectuer des calculs et manipulations complexes pour aller plus loin dans vos analysés. Vous pouvez même effectuer des mélanges de données avec d’autres sources.