Avec Google Analytics 4 (GA4), les CRMs, Google Search Console, Google Ads... avez-vous parfois l'impression de vous noyer dans les données ? Souhaitez-vous aller plus loin dans l'analyse et l'extraction des données ? Êtes-vous frustré.e de ne pas pouvoir obtenir les réponses que vous cherchez en analysant vos données ? Si c'est le cas, vous n'êtes pas seul.e. En tant que spécialistes Marketing, nous sommes toujours à la recherche de moyens d'améliorer notre façon de traiter les données.
Dans cette optique, Google BigQuery est un outil formidable qui pourrait vous aider à surmonter bon nombre de vos problèmes et limites, ainsi qu’à mieux exploiter vos données. Il vous permet de vous approprier vos données et d'y accéder avec plus de contrôle, de granularité et de créativité.
Il ne s'agit toutefois pas d'une solution facile à utiliser. Avant de décider d'investir du temps et de l'argent dans Google BigQuery, découvrez ses avantages et ses inconvénients.
Commençons par les bases.
Google BigQuery fait partie de Google Cloud, une plateforme qui offre de nombreux services et solutions dans le nuage (le “cloud”). BigQuery, en particulier, vous permet de stocker des données (c'est ce que nous appelons un entrepôt de données ou “data warehouse)) dans le nuage. Ces données peuvent être accédées et/ou transformées à l'aide de requêtes SQL.
BigQuery dispose d'une API qui peut être utilisée pour envoyer ou accéder à des données à partir de ce que nous appelons un "projet", un environnement que vous avez créé et configuré avec des ensembles de données (datasets) spécifiques. L'outil offre également une interface utilisateur qui vous permet de configurer, d'interroger et d'accéder à vos ensembles de données et à vos tableaux à partir de projets.
Le problème des données stockées dans des solutions comme Google Analytics, Google Search Console (GSC), Google Ads ou votre CRM, par exemple, c'est qu'elles sont limitées par ce que ces outils vous permettent de faire. Les limitations sont diverses, mais exporter vos données, en les stockant dans un entrepôt de données, vous permet de surmonter la plupart de ces limitations.
Bien entendu, les données elles-mêmes et les moyens de les exporter vers BigQuery peuvent avoir leurs propres limites, mais avec ce processus, vous devenez propriétaire de vos données afin de pouvoir les utiliser comme vous le souhaitez et selon vos besoins.
Nous mentionnerons certaines des limitations les plus courantes plus loin dans cet article.
L’une des principales limites de la Google Search Console, par exemple, est que les données que l’outil fournit sont limitées à 16 mois en arrière. Cela limite votre capacité à distinguer les évolutions sur plusieurs années et à mieux comprendre, analyser les progressions.
BigQuery étant une solution de stockage, il vous permet de stocker vos données aussi longtemps que vous le souhaitez.
Une autre limitation très ennuyeuse lors de l'utilisation de l'interface utilisateur de GSC, par exemple, est l'impossibilité de charger autant de lignes de données que vous le souhaitez. Cela signifie que bien souvent, les outils ne fournissent pas toutes les données disponibles.
Si vous parvenez à exporter toutes vos données brutes vers BigQuery, vous n'avez plus ces limitations.
Encore une fois, tout dépend des outils d'analyse de données que vous utilisez. Mais GA4 et GSC, par exemple, ont de grandes limitations en ce qui concerne les données auxquelles vous pouvez accéder dans leur interface utilisateur (comme les limites de lignes, par exemple).
Dans le cas de GA4, BigQuery permet d’accéder à des données brutes, sans traitement, ce qui constitue un énorme avantage si l’on souhaite mener une analyse plus précise. Les données auxquelles vous pouvez accéder dans l’interface utilisateur de GA4 peuvent présenter des problèmes de seuil, d’échantillonnage et/ou de cardinalité. Vous n'aurez pas ces limitations dans BigQuery (du moins si vous utilisez l'exportation de données intégrée).
Toujours en parlant de GA4, BigQuery n'est pas non plus soumis à des quotas au niveau des dimensions, des métriques ou des propriétés utilisateur personnalisées. Si vous utilisez l'exportation de données intégrée, toutes les données brutes sont envoyées à BigQuery.
Même si une solution telle que Google Analytics vous permet d'importer certaines données provenant d'outils comme Google Ads, Google AdSense et plus encore, elle limite grandement votre capacité à utiliser des données provenant de sources externes et à mélanger des données issues de plusieurs sources.
Tant que vos sources de données ont des colonnes (types de données) communes, BigQuery vous permet de mélanger librement des données provenant de plusieurs sources. Vous pouvez, par exemple, mélanger les données de GA4 et de votre CRM afin d'obtenir des informations encore plus utiles pour vos analyses.
Une solution telle que BigQuery vous permet d'interroger vos données afin d'exécuter des calculs et des opérations complexes pour approfondir votre analyse. En utilisant du SQL, vous pouvez segmenter vos données, les filtrer et appliquer vos propres formules.
BigQuery constitue donc une option de choix vers une approche plus scientifique.
BigQuery est également un outil intéressant à intégrer dans votre processus et votre écosystème pour stocker vos données au sein d’une solution centralisée telle que votre propre entrepôt de données.
Par exemple, l'outil peut facilement, automatiquement et sans frais, recevoir des données de GA4 et de Google Search Console. Il peut donc être utilisé comme silo de données avant d'utiliser des pipelines (des outils dédiés qui permettent d'exporter les données de manière contrôlée) pour envoyer ces données dans votre propre solution de stockage de données.
Nous en reparlerons plus tard avec les inconvénients, mais BigQuery est généralement très bon marché. Bien sûr, tout dépend de ce que vous en faites !
Si vous lisez tous les points listés ci-dessus, vous comprendrez peut-être déjà pourquoi BigQuery n’est peut-être pas pour vous. Soyez patient.e toutefois, car même si BigQuery peut être utilisé pour toutes les raisons mentionnées ci-haut, il peut être très utile simplement pour effectuer de meilleures analyses et accéder à des données plus précises avec des requêtes SQL assez simples.
Si vous avez de bonnes compétences du SQL ou si vous avez accès à des ressources qui en possèdent, vous pourriez probablement en bénéficier.
Vérifiez les inconvénients propres à BigQuery pour mieux évaluer si la solution vaut la peine pour vous :
Comme tout outil, BigQuery, et Google Cloud en général, fonctionne d'une manière très particulière. Vous devez apprendre à l’utiliser, ce qui peut être frustrant et prendre beaucoup de temps.
Si vous utilisez déjà Google Cloud, cela ne sera pas un problème pour vous.
Pour faire simple, Google BigQuery est une solution de stockage. Pour accéder, transformer et/ou utiliser les données qu'il stocke, vous devez utiliser des requêtes SQL.
Si vous ne connaissez pas le SQL, vous pouvez toujours apprendre. Mais cela demande du temps et des efforts.
Si vous savez utiliser le SQL, vous allez adorer BigQuery.
Gardez à l’esprit que même l’API de Google BigQuery nécessite l’utilisation de SQL.
BigQuery étant un entrepôt de données, il nécessite des stratégies et des processus pour accéder aux données et les transformer, surtout si vous souhaitez exécuter des calculs ou des processus complexes pour l'exportation de données, par exemple. Cela peut requérir beaucoup de travail.
De plus, si vous comptez sur BigQuery pour vos analyses, il s'agit d'un élément supplémentaire dans votre processus. Cela ajoute de la complexité et des problèmes potentiels, ainsi que des coûts.
C’est cependant le prix à payer pour plus d’efficacité et de granularité…
Un projet Google BigQuery est gratuit. Toutefois, en fonction du volume de données que vous stockez et traitez (via des requêtes), Google peut vous facturer. Par conséquent, au fil du temps, la solution pourrait commencer à vous coûter cher chaque mois ou chaque fois que vous effectuez une analyse.
La solution peut être particulièrement coûteuse si vous jouez et essayez de nombreuses requêtes lourdes. Cela peut particulièrement être le cas si vous n’appliquez pas les meilleures pratiques en matière de SQL. Par exemple, si vous interrogez l’ensemble d’un ensemble de données, cela peut s’avérer très coûteux en fonction de la quantité de données qu’il stocke.
Comme mentionné précédemment, BigQuery peut cependant être très bon marché (voire gratuit). Tout dépend de la façon dont vous l'utilisez.
Bien entendu, tout dépend des solutions d’analyse que vous utilisez.
Mais parlons de GA4 et GSC. Ils offrent tous deux des fonctionnalités intégrées d’exportation en masse. Celles-ci sont très utiles, car elles sont faciles à utiliser (pas besoin de coder des scripts à l’aide des API, par exemple), fiables et gratuites (vous n’avez pas besoin de payer pour des pipelines ou d’autres outils).
Cependant, elles ne sont pas parfaites : elles n’exportent les données qu’à partir du jour où vous configurez les exportations. Les données historiques ne seront pas envoyées à BigQuery.
De telles limitations sont un exemple de complexité supplémentaire inhérente à l'utilisation de BigQuery, car les surmonter peut être complexe et coûteux.