Choisir par architecture: SaaS managé, cloud privé, on‑prem

Le bon découpage part de l’endroit où résident les index, les logs, les prompts et les connecteurs internes.

Modèle	À exiger avant achat	Risque opérationnel
SaaS mutualisé	Preuves de contrôle: certification ISO/IEC 27001:2022 ou rapport SOC 2 Type II aligné sur les Trust Services Criteria, plus DPA signé (sources: ISO/IEC 27001:2022; AICPA SOC 2 Trust Services Criteria (2017)).	Dépendance forte au fournisseur pour l’isolation tenant, les exports de logs et les incidents.
Environnement dédié ou privé	Tenant, cluster ou projet cloud séparé, avec réseau privé et règles d’accès documentées.	Moins mutualisé, mais responsabilités partagées à clarifier dans le contrat et le runbook.
Auto‑hébergé on‑prem ou VPC	Contrôle direct sur stockage, réseau, sauvegardes, secrets et politiques d’accès.	Charge d’exploitation 24/7 à assumer, plus dette d’intégration sur SSO, monitoring, upgrades et connecteurs (source: ISO/IEC 27001:2022).

💡

Pour les flux vers le LLM, le mode BYO‑key mérite d’être évalué: votre organisation détient la clé API, configure le fournisseur de modèle et vérifie la politique de non‑rétention côté modèle. OpenAI distingue l’usage API des produits grand public et documente les règles d’utilisation des données API (source: OpenAI API data usage policies (consulted 2026-06)).

La gouvernance minimale doit couvrir les accès, la traçabilité et la protection des données: RBAC par rôle métier, journaux exportables vers SIEM, chiffrement en transit et chiffrement au repos. Ces contrôles correspondent aux attentes d’accès logique, de traçabilité et de protection des données couvertes par ISO/IEC 27001:2022 et les AICPA SOC 2 Trust Services Criteria (2017).

Shortlist par cas d’usage: support clients, recherche, self‑host

Support clients

Pour des docs publiques et une FAQ produit, auditez des alternatives spécialisées à Kapa.ai comme Inkeep ou Mendable. Le périmètre naturel: indexer docs, changelog, guides d’API et tickets support publiables, puis répondre avec citations vers les pages sources.

Recherche interne

Pour la connaissance d’entreprise, examinez des moteurs comme Glean, Coveo ou Yext. Le besoin central n’est pas le chat: c’est le respect des permissions, le SSO, la gouvernance des sources et la recherche dans les outils internes.

Self-host

Pour une pile auto-hébergée, assemblez un RAG avec Elasticsearch, OpenSearch ou pgvector, puis orchestrez ingestion, chunking et retrieval avec LangChain ou LlamaIndex. Ce choix augmente le contrôle sur données, logs et prompts, mais ajoute une charge d’exploitation.

Critères entreprise à vérifier

Exigez SSO SAML ou SCIM, redaction PII avant journalisation, traces d’audit, quotas par usage, alertes d’erreur et connecteurs natifs vers vos outils critiques.

Décision rapide

Choisissez d’abord la catégorie alignée à votre risque principal: exposition publique, permissions internes ou contrôle d’infrastructure. Évaluez ensuite les finalistes nécessaires au test comparatif.

10 tests à exécuter sur vos données avant de signer

Construire le jeu d’évaluation

Préparez des questions réelles issues du support, de la documentation et des tickets internes, puis associez chaque question à une réponse de référence validée par un expert métier (source: CNIL — L’IA générative: premiers repères (2023)).

Mesurer la récupération

Testez le hit-rate de récupération en top-k: la source attendue doit apparaître dans les passages retournés.

Tracer les passages récupérés

Gardez l’URL, le titre, la version et le score de chaque document récupéré afin de comparer les essais entre fournisseurs.

Mesurer l’exactitude des réponses fermées

Comparez la réponse générée à la référence avec une lecture exact match pour les réponses fermées.

Mesurer l’exactitude des procédures

Pour les procédures, limites produit et formulations longues, utilisez une lecture par similarité sémantique face à la réponse de référence.

Tester la robustesse linguistique

Réécrivez les mêmes questions avec synonymes, fautes courantes, FR/EN, acronymes internes et formulations client. La réponse doit rester stable et citer les mêmes sources.

Tester les contextes longs

Ajoutez des contextes longs et des interruptions. Le système doit conserver le sujet sans inventer de politique absente.

Tester les relances

Ajoutez des relances comme “et pour l’offre enterprise ?”. La réponse doit rester rattachée au contexte et aux sources disponibles.

Vérifier RBAC et PII

Lancez les mêmes requêtes avec plusieurs rôles. Un utilisateur sans droit ne doit jamais voir un extrait hors périmètre RBAC. Les PII doivent être masquées ou exclues selon votre politique.

Valider les opérations

Modifiez un document source, relancez l’ingestion incrémentale, mesurez le temps de rafraîchissement, puis vérifiez SSO/SAML, export des logs et traçabilité complète requête → sources → réponse.

Chiffrage et contrat: postes de coût + clauses à exiger

Demandez un devis ventilé par postes facturables: sièges admin/rédaction, MAU ou messages, ingestion/indexation, appels LLM, hébergement et egress. Sans cette ligne par ligne, un pic de tickets support devient une surprise comptable.

Le contrat doit inclure un DPA, un registre des sous-traitants, la durée de rétention, la procédure de purge et l’objet exact du traitement. Exigez aussi la base légale et la minimisation des données envoyées au modèle, points cadrés par la CNIL pour l’IA générative (source: CNIL — L’IA générative: premiers repères (2023)).

Ne signez pas sur une promesse. Demandez les rapports d’audit, l’attestation SOC, le certificat ISO, les journaux exportables et le plan de réponse à incident. Vérifiez que les logs couvrent ingestion, requêtes, réponses et actions admin.

Le SLA doit nommer la disponibilité, les délais de réponse support, les fenêtres de maintenance et les crédits dus en cas de non-respect. Refusez une clause qui exclut toutes les dépendances LLM ou cloud.

Ajoutez des plafonds de consommation, des alertes avant dépassement et des paliers négociés pour les pics. Un bon contrat permet de bloquer l’ingestion, de ralentir les requêtes ou de basculer en mode dégradé sans coupure brutale.

Plan 10 jours vers la prod (et qui fait quoi)

J1–2 — Sources, PII, visibilité

Les data owners listent chaque source documentaire, son propriétaire, son périmètre métier et ses restrictions d’accès. Ils retirent ou masquent les PII avant ingestion.

Ils définissent aussi les règles de visibilité: document public interne, équipe limitée, client spécifique, ou exclusion complète de l’index.

J3–4 — Ingestion et modèle

L’équipe plateforme implémente les connecteurs, fixe le schéma d’ingestion et versionne les transformations appliquées aux contenus.

Elle choisit le modèle et l’embedding selon vos contraintes: langue, taille des documents, hébergement, isolation des données et compatibilité avec l’architecture retenue.

J5–6 — Sécurité applicative

SécOps et IT configurent les garde-fous: prompts système, filtres de sortie, refus sur contenus hors périmètre et messages d’erreur exploitables.

Ils branchent SSO, SCIM, RBAC et journaux d’audit pour relier chaque requête à un utilisateur, un groupe et une source consultée.

J7–8 — Évaluation et observabilité

Data et ops automatisent les tests d’évaluation sur un jeu fixe de questions internes, avec résultats rejouables après chaque changement d’index ou de modèle.

Ils ajoutent des dashboards d’usage, de qualité et d’erreurs, puis des alertes sur dérive de réponses, échecs d’ingestion et pics d’usage anormaux.

J9–10 — Pilote et décision

Le pilote fermé démarre avec des utilisateurs nommés, un canal de feedback unique et une règle claire: corriger, bloquer ou accepter chaque retour.

Le go/no-go valide le déploiement élargi, le plan de formation, les owners post-prod et les critères de rollback.

Meilleures alternatives à Kapa.ai pour les entreprises