Introduction

Komprise, une startup de gestion de données, a annoncé une mise à jour majeure de sa plateforme avec le lancement de Komprise Transparent File Tables, une fonctionnalité qui permet une vue structurée des données non structurées, les rendant plus accessibles aux modèles d'IA et aux applications.

Contexte Technique

Les données non structurées représentent plus de 80% des données d'entreprise, mais la majorité d'entre elles ne sont pas utilisées en raison du manque de schéma cohérent, de la qualité médiocre et de la difficulté de déplacement. Les mécanismes d'ingestion de données existants ne sont pas adaptés aux données non structurées, car ils se concentrent sur la copie de toutes les données brutes sans extraction de schéma.

Komprise Transparent File Tables utilise une architecture distribuée pour indexer les données non structurées et les formatter en un schéma tabulaire, permettant ainsi aux modèles d'IA de les trouver rapidement en recherchant les métadonnées classifiées et enrichies.

Analyse et Implications

La nouvelle fonctionnalité de Komprise permet aux entreprises d'utiliser les données non structurées sans devoir les déplacer, ce qui réduit les coûts et les risques de sécurité. Les équipes de données et d'IA peuvent accéder à des données non structurées de haute qualité à travers leurs interfaces familières, sans les coûts et la complexité de l'ingestion de données brutes et de l'extraction de schéma.

Perspective

Les cas d'utilisation potentiels de Komprise Transparent File Tables incluent la création de cartes de données unifiées pour les organisations financières, l'amélioration des opérations de conformité et l'utilisation d'agents d'IA pour identifier les archives de médias et restreindre les scripts à ingérer. Les entreprises peuvent désormais laisser leurs vastes états de données non structurées intacts, tout en les rendant plus accessibles aux équipes d'IA et d'analyse, ce qui leur permet de bénéficier de plus de valeur sans les coûts et la complexité associés au déplacement de grandes quantités de données.