Eoghan sagte „Fin für Zahnärzte“. Er hat recht. Hier ist, was das wirklich bedeutet.

Intercom hat die Fin API Platform mit Verträgen ab 250.000 $/Jahr und Apex gelauncht — ein spezialisiertes LLM, das GPT-5.4 und Opus 4.5 übertrifft. Aber die eigentliche Geschichte ist nicht das Modell. Es ist die Lücke in der vertikalen Umsetzung.

Chris

April 8, 2026 · 12 min read

Eoghan sagte „Fin für Zahnärzte“. Er hat recht. Hier ist, was das wirklich bedeutet. — Die Fin API Platform stellt Intercoms gesamte Modell-Suite — Apex, RAG, Retrieval und Reranker — per API bereit

Ask AI about this post

Letzte Woche hat Intercom die Fin API Platform gelauncht. Verträge starten bei 250.000 $/Jahr. Apex — das neue spezialisierte Customer-Service-LLM — schlägt laut Benchmarks GPT-5.4 und Opus 4.5 bei Resolution Rate, Halluzinationsrate und Latenz.

Das ist eine wichtige Ankündigung. Und die meisten Takes werden sich auf die Modell-Benchmarks konzentrieren.

Ich will stattdessen auf einen Satz aus Eoghan McCabes Post eingehen.

„Wir werden nie für diese spezifischen Branchen bauen.“

Hier das volle Zitat, weit hinten in seiner Ankündigung versteckt:

„Fin für Zahnärzte? Warum nicht. Fin für Autohäuser? Klar. Wir werden nie für diese spezifischen Branchen bauen, aber wir würden es lieben, wenn das jemand anders tut.“

— Eoghan McCabe, CEO von Intercom

Lies das zweimal.

Der CEO von Intercom — der ankündigt, was er das weltbeste Customer-Service-Modell nennt — sagt offen: Die vertikale Implementierungsarbeit ist nicht unsere Aufgabe.

Das ist kein dahingeworfener Satz. Das ist eine strategische Grenze. Und sie hat reale Folgen für jeden, der Fin bei KMU-Kunden ausrollt.

Was die API-Plattform tatsächlich öffnet

Die Fin API Platform gibt Buildern Zugriff auf vier Modellschichten:

Fin Apex 1.0 — das generative Modell, das die finalen Antworten produziert
Fin RAG API — die vollständige Retrieval-Augmented-Generation-Pipeline
Fin Retrieval API — ein eigenes, auf Customer Service optimiertes Retrieval-Modell
Fin Reranker API — Relevanz-Scoring für abgerufene Inhalte

Fin model pipeline

Resolution rate is decided before the model generates a word

Query in

Fin RAG API

standalone API

Fin Apex API

Answer

Click any stage to learn more

dot2.solutions · Intercom Silver Partner

The Fin model pipeline — from knowledge base to generated answer.

Das ist wirklich starke Infrastruktur. Die Apex-Benchmarks sind ernst zu nehmen: +2,8 % Resolution Rate ggü. Frontier-Modellen, 65 % weniger Halluzinationen als Sonnet 4.6, 0,6 Sekunden schneller bei Time-to-First-Token.

Die reale Wirkung bestätigt das: Intercom berichtete, dass ein großer Gaming-Kunde seine Resolution Rate über Nacht von 68 % auf 75 % steigerte, nachdem Apex ausgerollt wurde — ein Rückgang ungelöster Konversationen um 22 % und der größte Einzelsprung seit dem Launch von Fin.

Aber die jährliche Untergrenze von 250.000 $ sagt klar, wer die primäre Zielgruppe ist: Konzerne, Startups, die vertikale Agenten bauen, und Intercoms eigene Plattform-Konkurrenten, die die Modelle lizenzieren wollen.

Für die große Mehrheit der KMU ist das kein Direktzugangsterritorium. Und das ist okay — denn die Wertschöpfungslücke liegt für sie ohnehin nicht in der API.

Die Wissensschicht ist weiterhin der Burggraben

Folgendes hat jede KI-Implementierung, die ich begleitet habe, bestätigt, und der AI Agent Blueprint von Intercom macht es explizit:

Resolution Rate ist primär kein Modellproblem. Es ist ein Content-Problem.

Der Blueprint sagt es klar: „AI Agents sind nur so gut wie ihre Inputs.“ Und Eoghans beiläufiger Kommentar über Zahnärzte und Autohäuser zeigt auf genau dasselbe: Du kannst das beste Modell der Welt haben — wenn die Wissensarchitektur darunter nicht um die Funktionsweise deiner Branche herum gebaut ist, wirst du keine relevanten Resolution Rates erreichen.

Apex auf einer generischen, schlecht strukturierten Wissensbasis wird unterperformen. Eine gut konfigurierte Fin-Instanz auf einer sauberen, vertikal abgestimmten Content-Schicht wird sie konstant übertreffen.

Das ist die Lücke, die die API-Plattform nicht schließt. Und es ist die Lücke, die für KMU-Deployments zählt. Wenn du deine Content-Schicht baust oder auditierst, deckt unser Guide zu Wissensbasen für KI-Support die Grundprinzipien ab.

Wie „Content vor Konfiguration“ in der Praxis aussieht

Wenn wir bei dot2.solutions von Content vor Konfiguration sprechen, meinen wir etwas Konkretes:

Bevor du eine einzige Intercom-Einstellung anfasst, musst du wissen:

Welche Fragen deine Kunden tatsächlich stellen (nicht die, von denen du denkst, dass sie sie stellen)
Welche davon hohes Volumen und niedrige Komplexität haben — dein schneller Weg zur Resolution
Wo bestehender Content falsch, veraltet oder gar nicht vorhanden ist
Wie deine SOPs zum Procedures-Format von Fin passen
Welche bedingte Logik deine komplexesten Workflows wirklich brauchen

Das ist Wissensarchitektur. Sie ist nicht glamourös. Sie macht keine schönen Benchmark-Folien. Aber sie ist die Arbeit, die entscheidet, ob du 65 % Resolution erreichst oder 30 %.

Intercom hat das beste Modell dafür gebaut. Sie haben auch starkes Tooling drumherum gebaut — Guidance, Procedures, Simulations, Topics Explorer. Die Plattform ist wirklich exzellent. Und mit dem jüngsten Launch von Monitors ist die Observability-Schicht jetzt ebenfalls komplett — du kannst endlich messen, ob Fins Antworten deinen Standards genügen, nicht nur ob sie Konversationen lösen.

Was sie nicht tun — laut eigener Aussage — ist die vertikale Content-Arbeit. Der tiefe Einstieg, wie eine Schweizer Treuhand mit Kunden über Mehrwertsteuer spricht oder wie ein Genfer SaaS-Unternehmen Churn-Konversationen auf Französisch führt. Das ist Implementierungsarbeit. Das ist Praktikerarbeit.

Die Chance, die das schafft

Die Fin API Platform wird eine Welle neuer Builder vertikaler Agenten erzeugen. Eoghan lädt sie explizit ein. Manche werden gut finanzierte Startups sein. Andere Beratungen, die sich über Nacht umbenennen.

Die meisten werden mit der Modellschicht starten, weil das neu und aufregend ist.

Wer Erfolg hat, lernt am Ende, was jeder erfahrene Fin-Implementierer schon weiß: Das Modell ist der einfache Teil. Was Zeit, Urteilskraft und Domänenwissen braucht, ist die Content-Architektur darunter.

Das ist die asymmetrische Chance für Implementierungspartner, die diese Arbeit schon gemacht haben — die Frameworks gebaut, Wissensaudits geführt und gelernt haben, aus welchen Content-Strukturen Fin tatsächlich Antworten generiert und welche es umgeht.

Die Modellschicht öffnet sich. Die Wissensschicht bleibt der Burggraben.

Für eine breitere Sicht, wie proaktive KI-Support-Strategien auf dieser Basis aufbauen, siehe unseren Artikel zu proaktivem KI-Support 2026.

Eine Anmerkung zu den Benchmarks

Fin-Apex-Benchmark-Ergebnisse: Vergleich von Resolution Rate, Halluzinationsrate und Latenz mit GPT-5.4 und Opus 4.5 — Fin-Apex-1.0-Benchmark-Ergebnisse — Quelle: Intercom

Die Apex-Zahlen verdienen einen Moment. Sich auf einem Customer-Service-spezifischen Benchmark günstig mit GPT-5.4 und Opus 4.5 zu vergleichen, ist keine triviale Behauptung. Intercom hat ein 60-köpfiges KI-Team, ein Jahrzehnt Customer-Service-Daten und Jahre an Produktionssignal aus Millionen Fin-Konversationen pro Woche.

Dass spezialisierte vertikale Modelle generalistische Frontier-Modelle übertreffen, ist genau das, was man in reifen KI-Verticals erwartet. Medizin, Recht, Finanzen und Customer Service bewegen sich alle in diese Richtung. Die Fin-Modell-Suite ist weiter, als ich erwartet hätte.

Allein der Fin Escalation Router — >98 % Genauigkeit bei Handoff-Entscheidungen, 0,5 s schneller als LLM-basiertes Routing — zeigt, wie viel zusammengesetzter Wert in der spezialisierten Sub-Agenten-Architektur steckt, nicht im Headline-LLM.

Über die reine Modellleistung hinaus umfasst Intercoms volle Suite jetzt sieben spezialisierte Modelle: Apex 1.0, Retrieval, Reranker, Issue Summarizer, Feedback Parser, Language Detector und den Escalation Router. Jedes ist gezielt für eine Stufe der Support-Pipeline gebaut und fine-getuned — eine zusammengesetzte Architektur, die mit generischen Frontier-Modellen allein schwer zu replizieren ist.

Was das für unsere Kunden bedeutet

Für Schweizer KMU, die Fin über dot2.solutions einsetzen, ändert sich an unserem Kernansatz nichts. Die Plattform, auf der ihr lauft, ist gerade spürbar besser geworden. Während die Custom-API-Plattform ein Viertelmillionen-Eintrittsticket hat, integriert Intercom das Apex-Modell direkt in das Standard-Fin-Produkt. Das heißt: Apex ist ab sofort das Modell hinter eurer Fin-Instanz.

Was sich verbessert: Resolution-Genauigkeit, Halluzinationsrate, Antwortlatenz und Eskalationsentscheidungen.

Was sich nicht ändert: die Qualität eurer Wissensbasis, die Struktur eurer Procedures, die Klarheit eurer Guidance-Konfiguration. Diese bleiben die Haupt-Hebel für höhere Resolution Rates — und dort verbringen wir die meiste Zeit.

Wenn ihr Fin schon nutzt, ist jetzt ein guter Moment zu prüfen, ob eure Content-Schicht mit den Modellverbesserungen Schritt hält. Die Strategien zu Quick Questions und Resolution, die wir skizziert haben, sind ein praktischer Startpunkt.

Wenn ihr Fin noch nicht nutzt und diese Ankündigung euch neugierig macht: Der beste Einstieg ist nach wie vor ein Wissensaudit, nicht eine Toolbewertung.

Content vor Konfiguration. Dort wird eure Resolution Rate gewonnen oder verloren — egal, wie gut das Modell wird. Wenn ihr bereit seid, mit dem Einstellungs-Tuning aufzuhören und eine Wissensschicht zu bauen, die Tickets wirklich löst, lasst uns über einen Wissensaudit sprechen.

IntercomFin AIAPI PlatformFin ApexCustomer Service AILLMSwiss SMEKnowledge Architecture

Häufig gestellte Fragen

Der Fin Reranker sitzt zwischen Retrieval und Generation. Retrieval wirft ein breites Netz mittels semantischer Suche aus und liefert die Top-N-Treffer, die grob zur Anfrage passen. Aber „grob relevant“ reicht für die Generierung nicht — wenn du Apex zehn mittelmäßige Chunks gibst, bekommst du eine mittelmäßige Antwort. Der Reranker bewertet jeden Kandidaten anhand von drei Dingen: wie relevant er für die konkrete Anfrage ist, wie gut er in den Gesprächskontext passt und wie wahrscheinlich er eine Resolution produziert. Veralteten oder unsicheren Inhalt stuft er aktiv ab. Heraus kommt ein eng gefiltertes, geordnetes Set — der finale Inhalt, aus dem Apex generiert. Der Benchmark: +16,7 % NDCG ggü. Cohere Rerank v3.5, dem bisherigen Industriestandard. Das ist eine spürbare Lücke — und deshalb wirkt sich die Struktur deines Contents (ein Thema pro Artikel, klare Überschriften, präzise Sprache) direkt auf die Resolution Rate aus, lange bevor das Modell überhaupt ein Wort generiert.

Nein. Apex läuft bereits in allen Standard-Fin-Instanzen — Intercom hat bestätigt, dass ~100 % der englischsprachigen Chat- und E-Mail-Konversationen jetzt darauf laufen. Die 250.000-$-API-Plattform ist ein separates Angebot für Builder, die Modellzugriff wollen. Standard-Fin-Kunden bekommen Apex' verbesserte Resolution-Accuracy, niedrigere Halluzinationsraten und schnellere Antworten automatisch — ohne zusätzliche Kosten oder API-Zugang.

Nein. Ein besseres Modell verstärkt guten Content und legt schlechten Content schneller offen. Vage Sammelartikel, die mehrere Themen abdecken, werden weiterhin für die falschen Anfragen herangezogen. Saubere, einthemen-Artikel mit präziser Sprache bleiben das Fundament hoher Resolution Rates.

Die Retrieval API übernimmt die semantische Suche, um relevante Content-Chunks zu finden. Die RAG API ist die komplette Pipeline: Retrieval → Reranking → Generation. Retrieval gibt feingranulare Kontrolle über die Suche; RAG liefert die End-to-End-Antwortgenerierung in einem Aufruf.

Der Kernansatz ändert sich nicht — er wird sogar bestätigt. Intercom wird nicht für spezifische Branchen bauen. Unsere Sicht: Die Modellschicht wird zur Commodity. Die Differenzierung liegt in der Wissensarchitektur — zu verstehen, wie eine Schweizer Treuhand über Mehrwertsteuerfragen spricht, wie ein Genfer SaaS-Unternehmen Churn auf Französisch handhabt oder wie eine Zahnarztpraxis Terminanfragen triagiert. Das ist Praktikerarbeit, und genau dort werden Resolution Rates gewonnen.

Apex sitzt am Ende der Pipeline: Es nimmt den besten Inhalt, den der Reranker ausgewählt hat, und produziert eine direkte, fundierte Antwort — oder entscheidet, dass ein Mensch übernehmen muss. Jede Antwort ist im konkreten Inhalt deiner Wissensbasis verankert, nicht in allgemeinen Trainingsdaten. Vor der Generierung wendet Apex die konfigurierte Guidance an — Tonalität, Vokabular, Eskalationsregeln, Brand-Constraints. Es trifft auch eine Resolution-Entscheidung: Reicht der gefundene Inhalt, antwortet es direkt; wenn nicht, routet es per Fin Escalation Router (>98 % Genauigkeit) an einen Menschen, statt eine Antwort mit niedriger Konfidenz zu liefern. Apex schlägt Frontier-Modelle wie GPT-5.4 und Opus 4.5 hier, weil es gezielt auf Intercoms Produktionsdaten aus Milliarden von Support-Interaktionen nachtrainiert wurde — ein engeres Modell, das auf den richtigen Daten trainiert ist, schlägt ein breiteres Modell beim spezialisierten Job. Implementierungsfolge: Apex' Qualitätsobergrenze wird von dem gesetzt, was der Reranker ihm übergibt. Besserer Content rein, bessere Antworten raus.

Noch Fragen?

Share this article

Need Help with Intercom & Fin?

As an Intercom Silver Partner, we specialise in Fin deployment, knowledge base architecture, and AI support automation for Swiss SMEs.

Book Free Consultation Intercom Silver Partner

No commitment required • Free 30-minute consultation • Expert guidance

Eoghan sagte „Fin für Zahnärzte“. Er hat recht. Hier ist, was das wirklich bedeutet.

Ask AI about this post

„Wir werden nie für diese spezifischen Branchen bauen.“

Was die API-Plattform tatsächlich öffnet

Die Wissensschicht ist weiterhin der Burggraben

Wie „Content vor Konfiguration“ in der Praxis aussieht

Die Chance, die das schafft

Eine Anmerkung zu den Benchmarks

Was das für unsere Kunden bedeutet

Häufig gestellte Fragen

Share this article

Need Help with Intercom & Fin?

Related posts

Claude Fable 5 von der US-Regierung deaktiviert: Was das für Ihren KI-Kundenservice bedeutet

Fin spricht 45 Sprachen. Ihr Help Center nicht.

Intercom Monitors: Den Observability-Loop für KI-Support schliessen

Eoghan sagte „Fin für Zahnärzte“. Er hat recht. Hier ist, was das wirklich bedeutet.

Ask AI about this post

„Wir werden nie für diese spezifischen Branchen bauen.“

Was die API-Plattform tatsächlich öffnet

Die Wissensschicht ist weiterhin der Burggraben

Wie „Content vor Konfiguration“ in der Praxis aussieht

Die Chance, die das schafft

Eine Anmerkung zu den Benchmarks

Was das für unsere Kunden bedeutet

Häufig gestellte Fragen

Was macht der Fin Reranker eigentlich mit Kandidaten-Inhalten?

Brauchen KMU Zugang zur Fin API Platform, um von Apex zu profitieren?

Wird Apex eine schlecht strukturierte Wissensbasis reparieren?

Was ist der Unterschied zwischen der Fin RAG API und der Fin Retrieval API?

Wie wirkt sich das auf Intercom-Implementierungspartner wie dot2.solutions aus?

Wie erzeugt Fin Apex 1.0 die finale Kundenantwort?

Share this article

Need Help with Intercom & Fin?

Related posts

Claude Fable 5 von der US-Regierung deaktiviert: Was das für Ihren KI-Kundenservice bedeutet

Fin spricht 45 Sprachen. Ihr Help Center nicht.

Intercom Monitors: Den Observability-Loop für KI-Support schliessen