Depuis quelques semaines, nous entendons beaucoup parler de dbt Fusion, la dernière nouveauté de dbt Labs lancée officiellement le 28 mai 2025. Cette annonce marque un tournant pour cet outil qui est devenu un incontournable dans les stacks Data actuelles.
Un rappel rapide : qu'est-ce que dbt ?
dbt (data build tool) est un framework open source qui permet d'écrire des transformations de données en SQL tout en s'appuyant sur un langage de templating basé sur Jinja. Il permet de rendre le SQL plus dynamique, modulaire, testé et documenté.
En quelques années, dbt est devenu la brique incontournable des modern data stacks.
Au-delà du cœur de l'outil, un vaste écosystème de packages open source (tests, macros, utilitaires, modèles pré-construits…) s'est développé, porté par une communauté très active.
Article conseillé : Mes 3 packages dbt préférés
Jusqu'à maintenant, dbt existait sous deux formes :
- dbt Core : version open source, à exécuter localement ou sur ses propres serveurs
- dbt Cloud : version hébergée et payante qui repose sur dbt Core avec des fonctionnalités supplémentaires comme l'orchestration, les alertes, ou encore l'IDE intégré
Pourquoi Fusion était-il nécessaire ?
Le moteur de dbt Core était écrit en Python. Or, si Python est un langage extrêmement populaire dans la data, il n'est pas réputé pour sa rapidité.
Chaque fois que vous exécutez dbt, vos modèles SQL templatés sont compilés en requêtes SQL prêtes à être exécutées dans votre entrepôt de données. Et cette étape de compilation, entièrement gérée en Python, était souvent lente. Si vous êtes déjà utilisateur de dbt, vous avez déjà dû remarquer la lenteur de l'outil lors de cette phase de compilation.
-- Avant compilation (SQL + Jinja)
SELECT *
FROM {{ ref('raw_orders') }}
WHERE created_at >= '{{ var('start_date') }}'
-- Après compilation (SQL pur)
SELECT *
FROM analytics.raw_orders
WHERE created_at >= '2025-01-01'
Une amélioration considérable de l'expérience développeur
Pour pallier ce problème, dbt Labs a complètement transformé son moteur en le réécrivant en Rust, un langage beaucoup plus performant.
Cette réécriture en Rust améliore considérablement l'expérience développeur :
➡️ Une compilation beaucoup plus rapide
➡️ Une exécution plus fluide
➡️ Une expérience plus réactive, notamment grâce à une meilleure intégration avec les éditeurs de code comme VS Code (et donc Cursor)
L'objectif est clair : accélérer les workflows des data teams tout en gardant la même logique de projet, les mêmes modèles, les mêmes tests, la même structure.
✅ dbt Fusion est 100 % compatible avec les projets dbt existants. Il n'y a pas besoin de réécrire votre code, seule la façon dont il est compilé et exécuté change.
Après avoir testé dbt Fusion en local avec l'aide de l'extension officielle pour VS Code, les gains qu'apporte cette réécriture du moteur sautent aux yeux :
- Lineage très dynamique
- Column lineage
- Détection des erreurs en live
- Récupération rapide des colonnes disponibles dans un modèle
- Auto-complétion beaucoup plus efficace
- Preview des CTEs
- Et bien plus encore...
Column Lineage très appréciable quand on veut voir quelles transformations a subi une colonne en particulier
Le nouveau moteur plus rapide permet d’avoir une auto-complétion beaucoup plus intelligente qu’auparavant
Si vous voulez avoir un aperçu de ce qu'apporte dbt Fusion, je vous conseille vivement de travailler avec le projet jaffle_shop de base comme je l'ai fait grâce à ce lien.
dbt Fusion est-il fait pour vous ?
Avant de savoir si cette nouvelle version de dbt est faite pour vous, je vous conseille premièrement d’aller vous assurer que vous remplissez les prérequis disponibles sur le site de dbt.
Si vous utilisez déjà dbt Core et ses fonctionnalités de base : Je vous conseille vivement de vous intéresser à ce projet qui a pour vocation à remplacer dbt Core à terme.
Si vous utilisez dbt Core avec différents packages : Je vous invite à consulter la page des compatibilités afin de vous assurer que les packages que vous utilisez peuvent fonctionner avec dbt Fusion avant de faire l'upgrade.
Si vous utilisez dbt Cloud : Aujourd’hui, il faut vous rapprocher de votre account manager afin de vous rendre disponible la Beta.
Si vous n'êtes pas encore utilisateur de dbt : Je vous conseille de commencer tout de suite avec dbt Fusion afin de ne pas avoir l'upgrade à faire plus tard.
En résumé
dbt Fusion, c'est :
✅ Un moteur réécrit en Rust et beaucoup plus performant
✅ Une compatibilité totale avec vos projets actuels
✅ Une expérience développeur optimisée, notamment avec VS Code
✅ Une transition progressive mais inévitable vers le futur de dbt
Pourquoi vous devriez vous y intéresser dès maintenant
Les équipes data qui utilisent déjà dbt vont rapidement voir la différence :
- Des itérations plus rapides
- Moins d’erreurs dans les transformations
- Des cycles de développement plus courts
- Une productivité accrue
Bref, moins de temps perdu à attendre, plus de temps pour analyser et créer de la valeur avec vos données.