Introduction

Graphon, une startup spécialisée dans l'amélioration des modèles d'intelligence artificielle (IA) pour le traitement de grands ensembles de données, a annoncé aujourd'hui une levée de fonds de 8,3 millions de dollars. Cette plateforme vise à résoudre les limites actuelles des modèles de langage à grande échelle, qui sont incapables de traiter des ensembles de données très volumineux en raison de leur fenêtre de contexte limitée.

Contexte Technique

Les modèles de langage actuels les plus avancés ont une fenêtre de contexte d'environ 1 million de jetons, ce qui signifie qu'une seule invite ne peut contenir plus de 1 million de jetons de données, correspondant à quelques milliers de pages de texte. Pour contourner cette limite, les développeurs d'IA utilisent des outils de génération augmentée de récupération (RAG), qui analysent les ensembles de données plus importants, extraient les enregistrements clés et les rendent disponibles aux modèles de langage. Cependant, ces outils ont du mal à identifier les connexions entre les enregistrements.

Graphon a développé une plateforme logicielle qui répond à ce défi en analysant les ensembles de données plus importants, en identifiant les modèles clés et en les sauvegardant dans une mémoire relationnelle persistante. Les modèles de langage peuvent ensuite extraire ces modèles de la mémoire persistante sans atteindre leurs limites de contexte. La plateforme de Graphon utilise de petits modèles d'IA avec environ 200 millions de paramètres, qui effectuent le traitement avec l'aide de graphes, des structures de données qui contiennent des informations sur les relations entre les objets.

Analyse et Implications

La plateforme de Graphon a le potentiel de révolutionner la façon dont les modèles d'IA traitent les grands ensembles de données, en leur permettant de mieux comprendre les relations entre les données et d'améliorer leur précision. Cela pourrait avoir des implications importantes pour diverses applications, notamment la cybersécurité, où la capacité d'identifier les modèles et les relations entre les données peut aider à détecter les menaces plus efficacement.

La levée de fonds de Graphon reflète l'intérêt croissant pour les technologies qui visent à améliorer les capacités des modèles d'IA. D'autres startups, comme Subquadratic et Standard Intelligence, travaillent également sur des solutions pour augmenter la quantité de données que les modèles de langage peuvent traiter.

Perspective

Alors que le domaine de l'IA continue d'évoluer, il est crucial de surveiller les progrès réalisés par des startups comme Graphon, qui poussent les limites de ce qui est possible avec les modèles de langage. Les futurs développements dans ce domaine pourraient avoir des implications significatives pour diverses industries et applications, et il est essentiel de comprendre les potentialités et les limites de ces technologies pour en tirer le meilleur parti.