Intercom Monitors : boucler l'observabilité du support IA

La fonctionnalité Monitors d'Intercom ferme la phase Analyze du flywheel Fin — apportant une QA structurée et reproductible au support piloté par IA à grande échelle. Voici ce que ça change pour votre opération.

Chris

Chris

March 30, 2026 · 10 min read

Intercom Monitors : boucler l'observabilité du support IA
Ouvrir la boîte noire de l'IA — Intercom Monitors apporte une QA structurée à chaque conversation Fin

Le titre de l'annonce d'Intercom le dit clairement : Ouvrir la boîte noire de l'IA. Ce n'est pas du marketing — c'est une philosophie produit, et Monitors en est l'expression la plus aboutie à ce jour.

La plupart des vendeurs d'agents IA gardent le tuning à l'intérieur de la boîte. Si quelque chose ne tourne pas, vous ouvrez un ticket et quelqu'un chez eux ajuste pour vous. Intercom a pris la position inverse depuis le début : les clients doivent pouvoir ouvrir le système eux-mêmes, comprendre ce qui se passe, et le changer à leurs propres conditions. Comme l'a dit Paul Adams au Fin Labs Paris : « Nous voulons que les gens — tous nos clients — puissent ouvrir la boîte et la modifier selon leurs besoins. »

Cette philosophie sous-tend le flywheel Fin — une boucle continue Train → Test → Deploy → Analyze autour de laquelle tout le produit est architecturé. L'idée est simple : chaque cycle d'amélioration compose le suivant. Vous entraînez Fin sur du meilleur contenu et une guidance plus claire, testez les changements avant qu'ils n'atteignent les clients, déployez sur des segments ou canaux spécifiques, puis analysez ce qui se passe réellement à grande échelle. Rincer et répéter.

Si vous ne connaissez pas le fonctionnement de Fin et pourquoi son architecture compte, notre analyse approfondie sur l'avenir de l'expérience client avec Fin couvre l'ensemble — des workflows à la conception AI-first.

Monitors, c'est la couche Analyze qui se termine. Sur la dernière année, Intercom avait déjà livré Insights — avec CX Score, Topics et Trends — et Recommendations, qui propose des correctifs en un clic pour les lacunes de contenu et les problèmes de configuration. Monitors, annoncé le 25 mars au Fin Labs Paris, est la troisième et dernière brique : un système de QA structuré et reproductible qui ferme la boucle entre ce que vous observez et ce que vous corrigez réellement.

Regardez l'annonce complète au Fin Labs Paris sur Intercom Monitors — ou explorez la keynote Analyze sur fin.ai

Ce qui manquait vraiment

La distinction posée par Intercom est précise et mérite d'être comprise. CX Score vous dit ce que les clients ont ressenti après une conversation. Monitors avec Custom Scorecards vous dit si la conversation a respecté vos standards. Ce sont deux questions différentes, et jusqu'ici il n'existait pas de système scalable pour répondre à la seconde.

Les équipes faisaient encore la QA à l'ancienne : tableurs, échantillonnage manuel, vérifications ponctuelles sur une fraction infime du volume. À mesure que Fin scale — 8 000 clients, un taux de résolution moyen de 67 %, 2 millions de requêtes résolues chaque semaine, y compris des cas complexes dans des industries régulées — savoir ce que Fin fait réellement en coulisses devient opérationnellement critique.

L'ancienne infrastructure ne peut pas aider : les enquêtes CSAT couvrent environ 8 % des conversations, et l'échantillonnage ad-hoc ne remonte pas fiablement les edge cases les plus risqués ni les endroits où la qualité commence discrètement à dériver.

C'est là que beaucoup d'équipes butent — l'écart entre savoir que quelque chose cloche et savoir exactement quoi corriger. Si vous construisez des bases de connaissances pour le support IA, la qualité de votre contenu détermine directement si les réponses de Fin passent ou échouent sur une scorecard. Monitors rend cette connexion visible.

Comment fonctionne Monitors

Monitors a deux composants imbriqués : le monitor lui-même, qui définit quelles conversations sont revues, et les Custom Scorecards, qui définissent comment chaque conversation est évaluée.

Sélection des conversations

Pour la sélection, vous combinez des filtres structurés — canal, sujet, statut de résolution, région client, métriques spécifiques à Fin — avec des signaux en langage naturel pour les nuances que les filtres durs ne captent pas. Un acteur de la santé peut cibler toute conversation où un patient montre des signes de détresse financière. Une SaaS qui lance une fonctionnalité peut créer un monitor à durée limitée pour suivre comment Fin gère les questions à son sujet pendant les deux premières semaines.

Vous pouvez aussi faire tourner des échantillons hebdomadaires larges et constants simplement pour benchmarker la qualité dans le temps. Les deux approches ne s'excluent pas.

Custom Scorecards

Les Custom Scorecards vous permettent de définir ce que la qualité signifie spécifiquement pour votre activité — critères, pondération, seuils de scoring. Chaque critère peut être noté automatiquement par l'IA ou assigné à un relecteur humain, ou les deux, dans la même scorecard.

Intercom est clair : il ne s'agit pas de choisir entre l'échelle et le jugement. Une société de services financiers peut faire scorer l'empathie et le respect des politiques par l'IA, tout en gardant un relecteur humain sur l'exactitude pour les sujets régulés. Vous pondérez ce qui compte le plus, et vous pouvez marquer certains critères comme critiques — une seule défaillance dessus fait échouer toute l'évaluation.

La Review Queue

Quand une conversation échoue, elle passe dans une Review Queue structurée : signalée, assignée, marquée pour correction, suivie jusqu'à résolution. La boucle qui se terminait avant sur un score perdu dans un thread Slack ou un export de tableur se termine maintenant sur une amélioration documentée.

C'est là que Monitors se branche directement sur ce qu'on appelle le support proactif avec IA — le passage du firefighting réactif à une gestion qualité systématique et anticipatrice.

La validation terrain

Deux exemples clients du panel parisien illustrent pourquoi la pièce « couverture » compte autant que le scoring.

🏥

Newman — santé numérique

Newman, société britannique de santé numérique, a commencé par revoir manuellement 100 % des interactions Fin pour satisfaire ses exigences de gouvernance clinique. Au fil du temps, à mesure que la confiance s'est installée, ils sont descendus à un échantillon mensuel de 5 % — toujours un coût manuel significatif. Rydian de leur équipe a été direct : Monitors leur ouvre un chemin de retour vers 100 % de couverture sans le coût manuel, tout en satisfaisant les exigences de sécurité et de conformité qui comptent dans un environnement régulé.

🚀

Glean — IA entreprise

Glean est passé de 41 % à 100 % de taux d'implication de Fin tout en maintenant des taux de résolution au-dessus de 80 %. À cette échelle et à cette vélocité — leur cycle produit va vite, ils servent des industries dont la santé, le secteur public et les services financiers — la capacité à mettre en place des monitors ciblés par lancement de produit ou changement de politique, avec une vue structurée sur la qualité globale, est exactement le contrôle opérationnel dont ils ont besoin.

La couche reporting

Tout remonte dans le reporting custom d'Intercom. Les scores QA de Monitors cohabitent avec le CX Score, le taux de résolution et le taux d'implication, au même endroit. Les patterns que ça débloque sont réellement nouveaux :

  • Une baisse de qualité corrélée à un changement récent de la base de connaissances
  • Un sujet précis qui sous-performe systématiquement
  • Une équipe dont les scores progressent semaine après semaine

La QA cesse d'être un exercice périodique dans un outil séparé et devient un signal continu intégré au pilotage de toute l'opération.

Pour les équipes qui veulent connecter ces signaux à une automation plus large, notre guide sur les workflows d'automation SaaS couvre la façon dont des plateformes comme Intercom s'insèrent dans une stack opérationnelle plus large — et comment éviter les pièges courants.

Ce qui arrive ensuite

Monitors couvre aujourd'hui les conversations Fin. Ce qui est sur la roadmap étend significativement sa portée :

  • QA des agents humains — étendre le même framework de scorecard à votre équipe humaine, pour un système qualité unifié sur toute l'opération de support
  • Alertes temps réel — pour les conversations à haut risque au moment où elles se produisent, pas après coup
  • Évaluation de la base de connaissances — scorer les réponses directement face à vos dernières politiques et docs, avec une justification claire liée à la source pertinente
  • Benchmarking du CX Score — montrer votre score relativement à d'autres entreprises de votre industrie, donnant aux équipes qui calibrent encore ce que « bon » veut dire un contexte précieux

La pièce « évaluation de la base de connaissances » est particulièrement intéressante si vous investissez déjà dans l'optimisation de la façon dont Fin gère les quick questions — Monitors vous dira bientôt exactement où votre contenu cale, conversation par conversation, preuves à l'appui.

L'implication pratique

Le flywheel ne fonctionne que si chaque phase fonctionne. Train et Test ont bénéficié de gros investissements récemment. Monitors complète Analyze.

Avec Insights qui vous donne le pourquoi derrière la performance, Recommendations qui vous dit quoi corriger, et Monitors qui vous dit si vos standards sont respectés conversation après conversation à pleine échelle, la boucle est réellement fermée.

La bonne question maintenant n'est pas s'il faut mettre en place Monitors — c'est quels monitors construire en premier.

Si vous avez besoin d'aide pour concevoir une stratégie QA pour votre opération de support IA — du design des scorecards à la structure de la base de connaissances jusqu'à la cadence de monitoring qui colle à votre profil de risque — c'est exactement ce qu'on fait chez dot2.solutions.

La boîte noire de l'IA est ouverte. La question, c'est ce que vous faites de ce que vous y trouvez.

Besoin d'aide pour mettre en place Monitors et la QA sur votre instance Fin ?

On conçoit des stratégies de monitoring taillées pour votre profil de risque — des scorecards custom aux audits de base de connaissances, en passant par les workflows d'escalade. Si vous voulez que la qualité de Fin soit à la hauteur de vos standards de marque, on peut aider.

Découvrir nos services Intercom →
IntercomAI AgentsFinQuality AssuranceCustomer ExperienceObservabilityCX ScoreAutomationSupport Operations

Questions fréquentes

Monitors est la fonctionnalité d'observabilité d'Intercom qui complète la phase Analyze du flywheel Fin. Elle permet de définir des critères de QA structurés — ton, exactitude, conformité aux politiques — et d'évaluer automatiquement chaque conversation Fin par rapport à ces standards, à grande échelle.

Le CSAT mesure le ressenti client après coup et a un faible taux de réponse (typiquement 5–15 %). Monitors évalue chaque conversation selon vos critères de qualité spécifiques en quasi temps réel, vous donnant une couverture complète et des signaux exploitables plutôt qu'un biais d'échantillonnage.

Oui. Vous pouvez configurer Monitors pour signaler les hallucinations, les violations de politiques, les écarts de ton et les informations incorrectes. Quand un Monitor se déclenche, il peut alerter votre équipe ou ajuster automatiquement le comportement de Fin pour ce type de conversation.

Non. Monitors fait partie du produit Intercom standard et est disponible pour tous les utilisateurs Fin. La Plateforme API est une offre distincte pour les entreprises qui construisent des agents verticaux custom.

D'autres questions ?

Contactez-nous

Share this article

Need Help with Intercom & Fin?

As an Intercom Silver Partner, we specialise in Fin deployment, knowledge base architecture, and AI support automation for Swiss SMEs.

No commitment required • Free 30-minute consultation • Expert guidance