Le 1er juin 2026 restera une date charnière pour l’écosystème data. Après des mois d’attente depuis l’annonce initiale d’octobre 2025, Fivetran et dbt Labs ont officiellement bouclé leur fusion, créant un mastodonte dont la mission affichée est sans équivoque : bâtir « l’infrastructure data de confiance pour les agents IA ».

Une fusion à près de 10 milliards de dollars de valorisation cumulée

Les chiffres donnent le vertige. Fivetran était valorisé à 5,6 milliards de dollars en septembre 2021, dbt Labs à 4,2 milliards en février 2022. La nouvelle entité, qui opère temporairement sous le nom « Fivetran + dbt Labs », affiche un chiffre d’affaires annuel récurrent combiné approchant les 600 millions de dollars et sert plus de 100 000 équipes data à travers le monde.

George Fraser (ex-CEO Fivetran) prend les rênes comme CEO, tandis que Tristan Handy (ex-CEO dbt Labs) devient President. La logique industrielle est limpide : Fivetran excelle dans l’ingestion et l’intégration de données (ELT), dbt Labs domine la transformation et la modélisation. Ensemble, ils couvrent l’intégralité de la chaîne — de la source brute jusqu’à la donnée gouvernée, sémantiquement riche, prête à alimenter des agents IA.

dbt Core v2.0 : le Fusion engine passe en open source

L’annonce la plus retentissante pour la communauté technique est sans conteste la sortie de dbt Core v2.0 en alpha, accompagnée de l’open-sourcing du Fusion engine sous licence Apache 2.0. Jusqu’ici moteur propriétaire en bêta fermée, Fusion devient le runtime unifié de dbt — et il est écrit en Rust.

Ce que ça change concrètement :

  • Jusqu’à 10x plus rapide sur le parsing et la compilation SQL
  • Un seul moteur : fin de l’ère « deux moteurs » (Core classique vs Fusion propriétaire)
  • Modèle de contribution simplifié pour les développeurs d’adaptateurs
  • Installation en un simple pip install dbt-core

C’est un virage stratégique majeur : l’investissement commercial de dbt Labs alimente désormais directement l’open source, et non plus un fork propriétaire. La communauté peut respirer.

Les nouveautés produit dévoilées au Snowflake Summit 2026

Le Snowflake Summit, qui s’est tenu du 1er au 4 juin à San Francisco, a servi de caisse de résonance. dbt Labs y a été nommé Partenaire Data Integration de l’Année 2026. Voici les lancements à retenir :

dbt State (Preview)

Une couche de cache pour pipelines data qui détecte quand la logique et les données sous-jacentes n’ont pas changé, permettant de skipper ou cloner des nœuds automatiquement. Objectif : réduire les coûts d’infrastructure.

dbt Wizard (Beta publique)

Un assistant IA intégré à l’espace de travail dbt, accessible via chat et CLI, pour assister la rédaction, le refactoring et le debugging des modèles data. Une réponse directe à la demande croissante de productivité assistée par IA dans les workflows analytics.

dbt Docs v2 (Preview)

Refonte complète du catalogue de données open source, avec lineage colonne par colonne (pour Fusion), métadonnées Semantic Layer, et UI repensée.

dbt lint (Beta)

Un linter SQL haute performance intégré à la plateforme, compatible SQLFluff, pensé pour les projets utilisant le moteur Fusion.

Agents Schema

Un standard open source pour fournir du contexte structuré aux agents IA — brique essentielle dans la vision « data infrastructure for trusted AI agents ».

Airbyte pousse aussi ses pions sur le terrain des agents IA

Airbyte a publié le 1er juin son Agent CLI, interface en ligne de commande pour interagir avec l’Airbyte Agent Engine (en bêta publique depuis février). Le concept central : un Context Store, couche de données spécialement conçue pour les agents IA, qui pré-réplique et pré-indexe les données d’entreprise pour des recherches rapides et contextuellement pertinentes — sans passer par des appels API directs coûteux en tokens.

Airbyte élargit également son connecteur vectoriel vers Pinecone, Weaviate, Milvus, Chroma, Qdrant et PostgreSQL/pgvector, confirmant son pivot d’un outil ELT open source vers une infrastructure data AI-native.

L’industrie data s’aligne sur l’agentic AI

Cette semaine confirme une tendance de fond : toute l’industrie data se structure autour des agents IA. Les annonces satellites en sont la preuve :

  • Cyera a étendu son intégration avec Snowflake (5 juin) pour gouverner les accès des agents IA aux données sensibles, avec remédiation en un clic via Snowflake Access Governance.
  • Experian a lancé son Agent Operating System™ (AOS) au Money20/20 Europe — infrastructure de décision autonome pour le secteur financier.
  • ZoomInfo s’est intégré nativement à Claude (Anthropic), injectant données B2B vérifiées et signaux d’achat directement dans les conversations avec l’assistant IA.
  • Shell a étendu son partenariat avec C3 AI pour passer de la détection d’anomalies à l’analyse de causes racines par agents IA, sur plus de 13 000 équipements.

Ce que ça signifie pour les pros de la data

La fusion Fivetran-dbt Labs n’est pas qu’une opération financière. Elle valide une hypothèse clé : la prochaine bataille de la data se jouera sur la qualité, la gouvernance et la sémantique — pas seulement sur le volume ou la vitesse. Les agents IA ont besoin de données fiables, traçables, contextualisées. Le pipeline d’ingestion brut ne suffit plus.

Pour les data engineers, l’open-sourcing de Fusion en dbt Core v2.0 est une excellente nouvelle : la performance du parsing Rust devient accessible à tous, gratuitement. Pour les analytics engineers, dbt Wizard et dbt lint promettent des gains de productivité tangibles. Pour les architectes data, l’émergence de standards comme Agents Schema et des Context Stores signale qu’il est temps de penser ses pipelines pour des agents autonomes, pas seulement pour des dashboards.

Le mot de la fin

La semaine du 1er au 5 juin 2026 marque un point d’inflexion. La fusion Fivetran-dbt Labs crée un acteur incontournable de l’infrastructure data, le Fusion engine passe en open source, et l’ensemble de l’écosystème — d’Airbyte à Snowflake, de Cyera à Experian — s’aligne sur une vision commune : fournir aux agents IA des données gouvernées, sémantiquement riches et accessibles en temps réel.

Les équipes data qui n’ont pas encore inscrit l’agentic AI dans leur roadmap feraient bien de s’y mettre. Le train est en marche, et il avance vite.


Sources : dbt Labs Blog, Fivetran Press, TechTarget, Airbyte Blog, KDnuggets, BusinessWire, PR Newswire — Veille du 5 juin 2026.

📖 À lire aussi : SQL avancé : les window functions que tout développeur devrait connaître

W
WP Admin Lab

Architecte web full-stack. WordPress, performance, data et sécurité. Notes de terrain, tests reproductibles et retours d'expérience.