Ingestion multi-format
PDF (texte + scan OCR), Word, Excel, PowerPoint, HTML, emails. Crawl auto d'un SharePoint, Google Drive, Dropbox.
- PDF + OCR
- Office
- Crawl SharePoint
- Google Drive
Recherche sémantique dans votre base de contrats, rapports, documentation : extraction de clauses, résumé, questions-réponses avec citations. Pinecone ou Weaviate pour la vectorisation, Claude ou GPT-5 pour la synthèse. Données en UE.
PDF (texte + scan OCR), Word, Excel, PowerPoint, HTML, emails. Crawl auto d'un SharePoint, Google Drive, Dropbox.
Découpage intelligent qui respecte les sections, paragraphes, tableaux. Overlap configurable, métadonnées préservées.
Pinecone (managed) ou Weaviate / pgvector (self-hosted UE). Index hybride : vector + keyword (BM25).
Chaque réponse cite les passages sources avec lien cliquable vers le document. Refus si peu de contexte pertinent.
Templates pour extraire automatiquement : parties, dates, montants, clauses type. Export JSON / Excel.
RBAC par document / dossier, historique complet des requêtes, export pour audit conformité.
1–10 000 documents, 1 source (SharePoint ou Drive), UI web, 5–30 utilisateurs, permissions basiques.
100 k+ documents, multi-sources, extraction de clauses, permissions fines, intégration SSO, audit.
Millions de documents, multi-tenants, API publique, SDK clients, SLA 99.9 %, déploiement dédié UE.
Tarifs sur devis après cadrage · forfait ou régie selon le format
L'assistant est connecté à vos sources : Google Drive, SharePoint, OneDrive, Notion, Confluence, dossiers partagés, ou tout système disposant d'une API. Les documents sont indexés et mis à jour automatiquement. L'assistant respecte les droits d'accès existants : un collaborateur ne peut obtenir que les informations auxquelles il est légitimement autorisé à accéder.
Tous les formats courants : PDF, Word, Excel, PowerPoint, pages Notion et Confluence, emails archivés, pages web internes, manuels techniques, contrats, procédures qualité. Y compris les PDF scannés et les documents anciens — grâce aux capacités de lecture visuelle des modèles IA récents.
Oui, chaque réponse est accompagnée de la source exacte : nom du document, page ou section, lien direct. Cela garantit la traçabilité et permet à l'utilisateur de vérifier l'information en un clic. C'est un principe de conception fondamental : l'assistant n'invente pas, il s'appuie sur votre contenu réel.
Oui. Nous utilisons les offres professionnelles d'OpenAI et Anthropic qui garantissent contractuellement que vos données ne sont pas utilisées pour entraîner leurs modèles. Pour les cas les plus sensibles, il est possible d'héberger tout le système en Europe, voire sur votre propre infrastructure, avec une base documentaire privée qui ne sort jamais de votre réseau.
Automatiquement. Quand un document est ajouté, modifié ou supprimé dans vos outils (Drive, Notion, SharePoint…), l'assistant s'actualise en conséquence, sans intervention manuelle. Vous gardez votre gestion documentaire existante, l'assistant suit. Aucun double travail.
Audit rapide pour estimer le volume documentaire, la stack adaptée (Pinecone / Weaviate / pgvector), le périmètre de permissions et le palier pertinent. Sans engagement, 15 minutes.