Introduction
Les modèles de langage ont considérablement gagné en puissance, mais les hallucinations et les erreurs factuelles restent difficiles à éviter. Probably, une entreprise qui vient de lever 9 millions de dollars en financement initial, cherche à développer une méthode plus rigoureuse pour détecter ces erreurs.
Contexte Technique
Probably vise à prévenir les hallucinations et les erreurs factuelles simples pour atteindre un niveau de précision de 99,99%, courant dans les systèmes déterministes mais plus difficile à atteindre avec l'IA. Pour y parvenir, l'entreprise a développé un outil de science des données qui produit des réponses rapides à partir de jeux de données complexes, avec une traçabilité et une citation pour chaque résultat.
Le système de Probably repose sur un modèle de langage qui est vérifié par un système de validation déterministe, qui renvoie les résultats qui ne correspondent pas au jeu de données. Le modèle a été entraîné contre le validateur, et le système entier est optimisé pour des réponses rapides et précises.
Analyse et Implications
Cette approche permet à Probably de réduire les coûts liés à l'utilisation de l'IA, car elle peut fonctionner avec des modèles plus petits et être exécutée sur du matériel local. C'est une idée bienvenue à un moment où les coûts des jetons d'IA augmentent et où de nombreux clients réévaluent leurs budgets d'IA.
L'approche de Probably pourrait également être étendue à d'autres cas d'utilisation, tels que la comptabilité ou les services médicaux, où la précision est cruciale.
Perspective
Il est intéressant de noter que les grands laboratoires d'IA n'ont pas encore tenté d'aborder ce problème, probablement en raison de leurs incitations financières à maximiser l'utilisation de leurs modèles. Probably pourrait donc ouvrir la voie à de nouvelles approches plus fiables et plus rentables dans le domaine de l'IA.