Introduction
Les entreprises sont en train de soutenir le machine learning, les flux de travail agents et l'analyse sur la même infrastructure, ce qui a conduit à l'émergence de l'architecture de données ouverte comme facteur clé pour la mise à l'échelle. DoorDash, l'une des plus grandes entreprises de logistique en temps réel, a construit une fondation sur des principes d'architecture ouverte pour soutenir ses ambitions en matière d'IA.
Contexte Technique
DoorDash a passé 10 ans à construire une infrastructure basée sur des principes d'architecture ouverte, notamment le stockage ouvert, le calcul ouvert et la conception agnostique. Cela a permis à l'entreprise de servir les consommateurs, les commerçants et les travailleurs de livraison en même temps, tout en alimentant de plus en plus de fonctionnalités de machine learning et de flux de travail d'IA.
Apache Iceberg a été utilisé pour réduire les coûts de déplacement de données à travers l'environnement multi-plateforme de DoorDash. Avant l'investissement dans Iceberg, les équipes consacraient des ressources importantes pour déplacer des données dans et hors de Snowflake à l'aide d'outils séparés, ce qui ajoutait des coûts et de la latence.
Analyse et Implications
La gouvernance au niveau du stockage est ce qui rend l'architecture de données ouverte pratique à grande échelle. En définissant les principes de qualité des données et l'autorisation de calcul une fois de manière centralisée, les mêmes politiques de gouvernance s'appliquent à toutes les plateformes simultanément. Cela devient essentiel lorsque les flux de travail d'agents sont en jeu, car exposer la mauvaise table à un agent peut conduire à des résultats erronés.
Les outils CoCo et CoWork de Snowflake, annoncés à la conférence Summit 2026, reflètent la même philosophie, avec des environnements conçus pour les producteurs et les consommateurs de données, respectivement, afin de garantir que les produits de données gérés et sensibles au contexte atteignent à la fois les analystes humains et les agents d'IA.
Perspective
Les entreprises qui définissent des faits précis sur leurs entités, comme les livreurs, les consommateurs et les commerçants, sont celles qui déployeront les agents le plus rapidement. L'architecture de données ouverte et la gouvernance efficace seront essentielles pour soutenir ces ambitions en matière d'IA et de machine learning.