L'intégration Google BigQuery permet d'automatiser l'export de vos données de projet DI vers votre projet Google Cloud ou l'import de vos tables GBQ vers votre projet DI. Cela facilite le transfert de vos données complémentaires et comportementales de contacts générées par DI. Ainsi, vous pourrez aisément exploiter et analyser ces données dans votre entrepôt GBQ.
Chemin d'accès : Projet → Gestion des données → Intégrations |
Préalables
- Créer un compte Google Cloud et un projet Google Cloud
- Créer un compte de service Google Cloud (dédié à la connexion avec DI). Il est recommandé de créer un rôle personnalisé avec les permissions suivantes :
- bigquery.datasets.create (export)
- bigquery.jobs.create (export)
- bigquery.datasets.get (import)
- bigquery.tables.list (import)
- bigquery.tables.get (import)
- bigquery.tables.getData (import)
Étape 1 : Connecter le projet Google Cloud
Repérez d'abord votre identifiant dans votre projet Google Cloud :
Dans DI, suivez le chemin d'accès et à côté de Google BigQuery, cliquez sur Ajouter :
Entrez votre identifiant de projet Google Cloud :
Déposez le fichier JSON (exporté de GBQ) qui contient les clés du compte de service :
Vous pouvez ensuite ajouter d'autres projets Google Cloud comme source (optionnel) en répétant l'étape 1 :
Étape 2 : Configurer l'export ou l'import
Selon ce que vous voulez faire avec vos données, configurer au minimum un export ou un import :
Attention de ne pas créer une boucle entre vos sources de données. Par exemple, si vous configurez un import d'une table GBQ vers un projet DI, ne configurez pas un export de ce projet DI vers la même table dans GBQ. Cette intégration n'est pas conçue pour supporter la synchronisation bidirectionnelle.
Option 1 : Export de journaux
Un export de journaux exporte l'ensemble des tables de votre projet. Lorsque vous faites un export de journaux, un dataset (non-modifiable) est créé dans GBQ.
Vous devez choisir comme destination Google Big Query :

Si vous voulez exporter l'ensemble de vos données depuis la création de votre projet DI, cochez l’option Exporter toutes les données à la première exécution* :

*Pensez à décocher l'option après le premier export des données, car sinon, à chaque export, l'intégralité des données sera envoyée, ce qui a un impact sur la performance.
Lorsque vous avez terminé de configurer l'export de journaux, pensez à cliquer sur Sauvegarder en bas de la page.
Par la suite, il est recommandé de lancer manuellement le premier export pour qu'il s'effectue maintenant (il faut avoir coché Exporter toutes les données à la prochaine exécution). Cliquez sur Activer :

Rendez-vous dans Historique, sélectionnez les tâches et cliquez sur Lancer maintenant :

→ Voir la procédure complète d'export de journaux
Option 2 : Export automatisé
Il est possible de configurer plusieurs exports automatisés (il n'y a aucune limite contrairement à l'export de journaux). Un export automatisé permet d'exporter un seul objet (une table) à la fois. Il faudra donc configurer plusieurs exports si vous voulez exporter plusieurs objets.
Sélectionnez Google Big Query comme destination :

Lorsque vous avez terminé de configurer un export automatisé, pensez à cliquer sur Sauvegarder en bas de la page.
Par la suite, il est recommandé de lancer manuellement le premier export pour qu'il s'effectue maintenant.

→ Voir la procédure complète de configuration d'export automatisé

Vous aurez ensuite à assigner les champs, c'est-à-dire associer les champs dans la source (GBQ) à leurs champs correspondants dans la destination (DI).

→ Voir la procédure complète d'import automatisé