Introduction
Qdrant Solutions GmbH, une startup spécialisée dans les bases de données vectorielles open-source, a annoncé avoir levé 50 millions de dollars dans le cadre d'un financement de série B. Cette levée de fonds vise à améliorer la recherche vectorielle flexible pour les systèmes IA de production.
Contexte Technique
Qdrant a été construit à partir de zéro en utilisant le langage Rust, fournissant ainsi une mémoire fondamentale pour les grands modèles de langage qui fonctionnent de manière stateless. Les bases de données vectorielles ont été initialement créées pour résoudre le problème de la recherche du plus proche voisin dans la mémoire sémantique, permettant ainsi aux modèles de langage de découvrir le contexte dans les données statiques.
Cependant, les systèmes et les jeux de données IA d'aujourd'hui sont très différents, avec des sources de données multimodales en constante évolution, des documents de texte intégrés, de l'audio et de la vidéo. L'avènement de l'IA agente a également changé la façon dont les applications d'intelligence récupèrent et utilisent les données en temps réel.
Analyse et Implications
Qdrant affirme que le paradigme de la recherche vectorielle doit s'adapter aux besoins changeants du paysage IA. Cela signifie que le moteur de recherche doit s'adapter au problème plutôt que de forcer le problème à s'adapter à l'outil. Le système doit offrir une composabilité, c'est-à-dire des modules et une flexibilité pour choisir le meilleur ensemble d'outils pour la tâche en cours.
Les équipes d'IA peuvent ainsi optimiser pour une précision maximale, une latence minimale ou une efficacité coût à grande échelle. Qdrant a construit son système de manière composable et modulaire, permettant ainsi aux équipes d'IA de l'adapter à leur cas d'utilisation en production.
Perspective
Aujourd'hui, les pipelines de génération augmentée de récupération (RAG) sont devenus le cadre de base pour exécuter les chatbots et les agents IA. Les RAG utilisent des bases de données vectorielles pour optimiser la sortie des grands modèles de langage en récupérant des connaissances spécifiques et autorisées à partir de vastes magasins d'informations en dehors de leurs données de formation d'origine.
Ceci est fondamental pour réduire les hallucinations IA, ou lorsque les modèles IA génèrent des erreurs. La base de données Qdrant est entièrement open-source avec des options de déploiement flexibles pour répondre aux différentes étapes de déploiement. Les développeurs peuvent la lancer sur leur machine locale dans un conteneur Docker pour des tests rapides, ou la déployer sur Kubernetes, Qdrant Cloud, ou dans un cloud hybride ou privé.