Introduction

L'article présente une nouvelle approche de recherche d'information appelée interaction directe avec le corpus (DCI), qui permet aux agents de recherche d'interagir directement avec le corpus sans passer par une interface de similarité fixe.

Contexte Technique

Les systèmes de recherche modernes utilisent généralement une interface de similarité pour compresser l'accès au corpus en un seul étape de récupération top-k avant de raisonner. Cependant, cette abstraction peut devenir un goulet d'étranglement pour la recherche agente, car elle rend difficile la mise en œuvre de contraintes lexicales exactes, de conjonctions de pistes rares, de vérifications de contexte local et de raffinements d'hypothèses multi-étapes.

La DCI utilise des outils généraux (tels que grep, lecture de fichiers, commandes shell, scripts légers) pour rechercher directement le corpus sans modèle d'incrustation, index vectoriel ou API de récupération. Cette approche n'a pas besoin d'indexation hors ligne et s'adapte naturellement aux corpus locaux en évolution.

Analyse et Implications

Les résultats montrent que la DCI surpasse considérablement les méthodes de récupération classiques sur plusieurs benchmarks et tâches de recherche agente. Cela suggère que la qualité de la récupération dépend non seulement de la capacité de raisonnement, mais également de la résolution de l'interface par laquelle le modèle interagit avec le corpus.

Perspective

La DCI ouvre un espace de conception d'interface plus large pour la recherche agente et souligne l'importance de la résolution de l'interface pour améliorer la qualité de la récupération. Les futurs travaux devraient explorer les possibilités de la DCI et son intégration avec d'autres approches de recherche pour améliorer les performances des agents de recherche.