Intercom Monitors: Den Observability-Loop für KI-Support schliessen

Intercoms Monitors-Feature schliesst die Analyze-Phase des Fin-Flywheels — und bringt strukturierte, wiederholbare QA für KI-gestützten Support im grossen Stil. Was das für deinen Betrieb bedeutet.

Chris

Chris

March 30, 2026 · 10 min read

Intercom Monitors: Den Observability-Loop für KI-Support schliessen
Die KI-Blackbox öffnen — Intercom Monitors bringt strukturierte QA in jede Fin-Konversation

Die Überschrift von Intercoms Ankündigung sagt es klar: Die KI-Blackbox öffnen. Das ist kein Marketing — es ist eine Produktphilosophie, und Monitors ist deren bisher klarster Ausdruck.

Die meisten Anbieter von KI-Agenten lassen das Tuning in der Box. Wenn etwas nicht performt, eröffnest du ein Ticket und jemand bei ihnen passt es für dich an. Intercom hat von Anfang an die Gegenposition bezogen: Kunden sollen das System selbst öffnen, verstehen, was passiert, und es nach ihren eigenen Bedingungen ändern können. Wie Paul Adams beim Fin Labs Paris formulierte: „Wir wollen, dass die Leute — alle unsere Kunden — die Box öffnen und sie nach ihren Anforderungen verändern können.“

Diese Philosophie liegt dem Fin-Flywheel zugrunde — einer kontinuierlichen Train → Test → Deploy → Analyze-Schleife, um die das gesamte Produkt herum architekturiert ist. Die Idee ist einfach: Jeder Verbesserungszyklus verstärkt den nächsten. Du trainierst Fin auf besseren Content und klarere Guidance, testest Änderungen, bevor sie Kunden erreichen, deployst auf bestimmte Segmente oder Kanäle und analysierst, was tatsächlich im grossen Stil passiert. Spülen und wiederholen.

Wenn du nicht weisst, wie Fin funktioniert und warum seine Architektur wichtig ist, deckt unser Deep Dive zu der Zukunft der Customer Experience mit Fin das ganze Bild ab — von Workflows bis zu AI-first-Design.

Monitors ist die Vollendung der Analyze-Schicht. Im letzten Jahr hatte Intercom bereits Insights ausgeliefert — mit CX Score, Topics und Trends — und Recommendations, das Ein-Klick-Fixes für Content-Lücken und Konfigurationsprobleme vorschlägt. Monitors, angekündigt am 25. März beim Fin Labs Paris, ist das dritte und letzte Stück: ein strukturiertes, wiederholbares QA-System, das den Loop zwischen Beobachten und tatsächlichem Beheben schliesst.

Sieh dir die vollständige Fin-Labs-Paris-Ankündigung zu Intercom Monitors an — oder erkunde die Analyze-Keynote auf fin.ai

Was tatsächlich fehlte

Die Unterscheidung, die Intercom zieht, ist präzise und es lohnt sich, sie zu verstehen. CX Score sagt dir, wie Kunden eine Konversation empfunden haben. Monitors mit Custom Scorecards sagt dir, ob die Konversation deinen Standards entsprochen hat. Das sind unterschiedliche Fragen, und bis jetzt gab es kein skalierbares System, um die zweite zu beantworten.

Teams haben QA noch auf die alte Art gemacht: Spreadsheets, manuelles Sampling, stichprobenartige Checks auf einem winzigen Bruchteil des Volumens. Während Fin skaliert — 8.000 Kunden, eine durchschnittliche Resolution Rate von 67 %, 2 Millionen aufgelöste Anfragen pro Woche, inklusive komplexer Fälle in regulierten Industrien — wird es operativ kritisch zu wissen, was Fin hinter den Kulissen tatsächlich tut.

Die alte Infrastruktur kann nicht helfen: CSAT-Umfragen decken rund 8 % der Konversationen ab, und Ad-hoc-Sampling bringt weder Hochrisiko-Edge-Cases noch leise Qualitätsdrift zuverlässig ans Licht.

Hier laufen viele Teams gegen eine Wand — die Lücke zwischen wissen, dass etwas nicht stimmt und genau wissen, was zu fixen ist. Wenn du Wissensbasen für KI-Support baust, entscheidet die Qualität deines Contents direkt darüber, ob Fins Antworten eine Scorecard bestehen oder nicht. Monitors macht diese Verbindung sichtbar.

Wie Monitors funktioniert

Monitors hat zwei ineinandergreifende Komponenten: den Monitor selbst, der definiert, welche Konversationen geprüft werden, und Custom Scorecards, die definieren, wie jede Konversation bewertet wird.

Konversationsauswahl

Für die Auswahl kombinierst du strukturierte Filter — Kanal, Topic, Resolution-Status, Kundenregion, Fin-spezifische Metriken — mit Natural-Language-Signalen für die Nuancen, die harte Filter nicht erwischen. Ein Healthcare-Anbieter könnte jede Konversation ins Visier nehmen, in der ein Patient Anzeichen finanzieller Belastung zeigt. Ein SaaS-Unternehmen, das ein neues Feature launcht, könnte einen zeitlich begrenzten Monitor erstellen, um in den ersten zwei Wochen zu beobachten, wie Fin Fragen dazu beantwortet.

Du kannst auch breite, konsistente Wochen-Samples laufen lassen, einfach um Qualität über die Zeit zu benchmarken. Die beiden Ansätze schliessen sich nicht aus.

Custom Scorecards

Mit Custom Scorecards definierst du, was Qualität für dein Geschäft konkret heisst — Kriterien, Gewichtung, Scoring-Schwellen. Jedes Kriterium kann automatisch von KI bewertet oder einem menschlichen Reviewer zugewiesen werden — oder beides in derselben Scorecard.

Intercom ist klar: Hier geht es nicht darum, zwischen Skalierung und Urteilsvermögen zu wählen. Ein Finanzdienstleister könnte Empathie und Policy-Adhärenz von KI scoren lassen, aber einen menschlichen Reviewer für Genauigkeit bei regulierten Themen behalten. Du gewichtest, was am wichtigsten ist, und kannst bestimmte Kriterien als kritisch markieren — ein einziger Fail dort lässt die gesamte Bewertung scheitern.

Die Review Queue

Wenn eine Konversation durchfällt, wandert sie durch eine strukturierte Review Queue: markiert, zugewiesen, für einen Fix gekennzeichnet, bis zur Lösung getrackt. Der Loop, der früher bei einem Score endete und in einem Slack-Thread oder einem Spreadsheet-Export verschwand, endet jetzt bei einer dokumentierten Verbesserung.

Genau hier dockt Monitors direkt an das an, was wir proaktiven Support mit KI nennen — der Wechsel vom reaktiven Firefighting zu systematischem, vorausschauendem Qualitätsmanagement.

Die Praxisvalidierung

Zwei Kundenbeispiele aus dem Paris-Panel zeigen, warum die Coverage-Komponente genauso zählt wie das Scoring.

🏥

Newman — Digital Healthcare

Newman, ein britisches Digital-Healthcare-Unternehmen, hat anfangs 100 % der Fin-Interaktionen manuell überprüft, um die klinischen Governance-Anforderungen zu erfüllen. Mit der Zeit, als Vertrauen wuchs, sind sie auf ein monatliches 5-%-Sample heruntergegangen — immer noch ein erheblicher manueller Aufwand. Rydian aus ihrem Team war direkt: Monitors eröffnet ihnen einen Weg zurück zu 100 % Coverage ohne die manuellen Kosten, während die Sicherheits- und Compliance-Anforderungen, die in einem regulierten Umfeld zählen, weiterhin erfüllt bleiben.

🚀

Glean — Enterprise AI

Glean ist von 41 % auf 100 % Fin-Involvement-Rate gegangen und hat die Resolution Rates über 80 % gehalten. In dieser Grösse und Geschwindigkeit — ihr Produktzyklus ist schnell, sie bedienen Industrien wie Healthcare, öffentlicher Sektor und Finanzdienstleistungen — ist die Fähigkeit, gezielte Monitors pro Produkt-Launch oder Policy-Änderung aufzusetzen und einen strukturierten Qualitätsblick über alles zu haben, genau die operative Kontrolle, die sie brauchen.

Die Reporting-Schicht

Alles fliesst in Intercoms Custom Reporting. QA-Scores aus Monitors stehen an einem Ort neben CX Score, Resolution Rate und Involvement Rate. Die Muster, die das freischaltet, sind wirklich neu:

  • Ein Qualitätsabfall, der mit einer kürzlichen Änderung der Wissensbasis korreliert
  • Ein bestimmtes Topic, das konsistent unterperformt
  • Ein Team, dessen Scores sich Woche für Woche verbessern

QA hört auf, eine periodische Übung in einem separaten Tool zu sein, und wird zu einem kontinuierlichen Signal, das ins Gesamtmonitoring der Operation integriert ist.

Für Teams, die diese Signale mit breiterer Automation verbinden wollen, deckt unser Guide zu SaaS-Automation-Workflows ab, wie Plattformen wie Intercom in einen grösseren operativen Stack passen — und wie man die typischen Fallen vermeidet.

Was als Nächstes kommt

Monitors deckt derzeit Fin-Konversationen ab. Was auf der Roadmap steht, erweitert die Reichweite deutlich:

  • QA für menschliche Agenten — das gleiche Scorecard-Framework auf dein menschliches Team ausweiten, mit einem einheitlichen Qualitätssystem für den gesamten Support
  • Echtzeit-Alerts — für Hochrisiko-Konversationen, während sie passieren, nicht im Nachhinein
  • Bewertung der Wissensbasis — Antworten direkt gegen deine aktuellsten Policies und Dokumente scoren, mit klarer Begründung verlinkt auf die relevante Quelle
  • CX-Score-Benchmarking — dein Score relativ zu anderen Unternehmen deiner Branche, was Teams, die noch kalibrieren, was „gut“ bedeutet, dringend benötigten Kontext gibt

Die Bewertung der Wissensbasis ist besonders spannend, wenn du bereits in die Optimierung dafür, wie Fin Quick Questions handhabt, investierst — Monitors wird dir bald genau sagen, wo dein Content abfällt, Konversation für Konversation, mit Belegen.

Die praktische Implikation

Das Flywheel funktioniert nur, wenn jede Phase funktioniert. Train und Test haben zuletzt deutliche Investitionen erhalten. Monitors vervollständigt Analyze.

Mit Insights, das dir das Warum hinter der Performance gibt, Recommendations, das dir sagt, was zu fixen ist, und Monitors, das dir Konversation für Konversation auf voller Skala sagt, ob deine Standards erfüllt sind, ist der Loop wirklich geschlossen.

Die richtige Frage jetzt ist nicht ob du Monitors aufsetzen sollst — sondern welche Monitors du zuerst baust.

Wenn du Hilfe brauchst, eine QA-Strategie für deinen KI-Support zu designen — vom Scorecard-Design über die Struktur der Wissensbasis bis zur Monitoring-Kadenz, die zu deinem Risikoprofil passt — genau das machen wir bei dot2.solutions.

Die KI-Blackbox ist offen. Die Frage ist, was du mit dem machst, was du darin findest.

Brauchst du Hilfe beim Aufsetzen von Monitors und QA für deine Fin-Instanz?

Wir designen Monitoring-Strategien, die zu deinem Risikoprofil passen — von Custom Scorecards über Wissensbasis-Audits bis zu Eskalations-Workflows. Wenn Fins Qualität deinen Markenstandards entsprechen soll, helfen wir.

Unsere Intercom-Services entdecken →
IntercomAI AgentsFinQuality AssuranceCustomer ExperienceObservabilityCX ScoreAutomationSupport Operations

Häufig gestellte Fragen

Monitors ist Intercoms Observability-Feature, das die Analyze-Phase des Fin-Flywheels schliesst. Du definierst strukturierte QA-Kriterien — Tonalität, Genauigkeit, Policy-Konformität — und jede Fin-Konversation wird automatisch und in grossem Stil dagegen bewertet.

CSAT misst Kundenempfinden im Nachhinein und hat niedrige Antwortquoten (typischerweise 5–15 %). Monitors bewertet jede Konversation gegen deine spezifischen Qualitätskriterien nahezu in Echtzeit — vollständige Abdeckung und handlungsfähige Signale statt Sampling-Bias.

Ja. Du kannst Monitors so konfigurieren, dass sie Halluzinationen, Policy-Verstösse, Tonabweichungen und falsche Informationen markieren. Wenn ein Monitor auslöst, kann er dein Team alarmieren oder Fins Verhalten für diesen Konversationstyp automatisch anpassen.

Nein. Monitors ist Teil des Standard-Intercom-Produkts und für alle Fin-Nutzer verfügbar. Die API Platform ist ein separates Angebot für Unternehmen, die eigene vertikale Agenten bauen.

Noch Fragen?

Kontakt aufnehmen

Share this article

Need Help with Intercom & Fin?

As an Intercom Silver Partner, we specialise in Fin deployment, knowledge base architecture, and AI support automation for Swiss SMEs.

No commitment required • Free 30-minute consultation • Expert guidance