Zum Hauptinhalt springen
Zurück zum Blog
Ratgeber

KI-Telefonassistent für Arztpraxen  Bewertungsmethodik DACH 2026

Ein offenes Bewertungsraster für Praxen, die einen Anbieter auswählen wollen — ohne fingierte Sterne­ratings und ohne pseudo-objektive Top-10-Listen.

bhomy
bhomy Team
3. Mai 2026
14 Min. Lesezeit
Was dieses Dokument ist — und was nicht

Dies ist eine Methodik, kein Marktreport. Wir veröffentlichen keine Bewertungen über fremde Anbieter, die wir nicht in einer kontrollierten Praxis-Pilotsituation selbst getestet haben. Stattdessen liefern wir ein Bewertungsraster, das Praxen, KV-IT-Beauftragte und MVZ-Geschäftsführungen für Anbieter-Auswahl nutzen können. BHOMYs eigene Scores erscheinen am Ende — mit Datum, Methodenkommentar und nachvollziehbarer Begründung.

7
Bewertungsdimensionen
28
Einzelkriterien
0
fingierte Vergleichsbewertungen

KI-Telefonassistenten für Arztpraxen sind 2026 ein Markt mit über 20 sichtbaren Anbietern in DACH — von schweizerisch-deutschen Spezialisten über US-Plattformen mit deutscher Lokalisierung bis zu regionalen Whitelabel-Lösungen. Die Sichtprüfung (Website, Demos, Sales-Calls) bringt eine Praxis nicht zu einer fundierten Entscheidung. Wir schlagen ein konsistentes Bewertungsraster vor.

01

Zielgruppe und Geltungsbereich

Die Methodik gilt für hausärztliche und fachärztliche Einzel- und Gemeinschaftspraxen sowie MVZ in Deutschland, Österreich und der deutschsprachigen Schweiz, mit einem Anrufaufkommen zwischen 60 und 250 Telefonaten pro Werktag. Größere Strukturen (Krankenhaus-Ambulanzen, Praxisketten) verlangen erweiterte Bewertungsdimensionen (Multi-Tenant, SLA-Hierarchien), die hier nicht abgedeckt sind.

Wir betrachten ausschließlich KI-Sprachassistenten, die selbständig Telefongespräche führen. Reine IVR-Systeme („Drücken Sie 1 für …") und Anrufbeantworter mit Transkription werden bewusst nicht in dasselbe Raster aufgenommen — sie lösen ein anderes Problem.

02

Die sieben Bewertungsdimensionen

1. Datenschutz und Rechtskonformität (Gewichtung 25 %)

01EU-/CH-Datenresidenz: vertraglich zugesichert, dokumentiert, nicht „best-effort".
02AVV nach Art. 28 DSGVO (DE/AT) bzw. ABV nach revDSG (CH) — formal vollständig, nicht nur als „kann angefordert werden".
03Übernahme der Verschwiegenheitspflicht nach § 203 Abs. 3 StGB (DE), § 54 ÄrzteG (AT), Art. 321 StGB (CH).
04Aufbewahrung: Audio-Mitschnitte standardmäßig deaktiviert, transkribierte Zusammenfassungen mit konfigurierbarer Aufbewahrungsfrist.

Diese Dimension hat die höchste Gewichtung, weil eine Nicht-Konformität die gesamte Lösung disqualifiziert. Eine Praxis darf nicht mit einem Anbieter arbeiten, der § 203 StGB nicht vertraglich akzeptiert — unabhängig davon, wie überzeugend die Demo war.

2. PVS- / PIS-Integration (Gewichtung 18 %)

01DE: Medatixx, T2med, CGM (M1, Z1, CGM CONNECT), x.concept, S3, RED Medical.
02AT: InnoMed, RZA, ARZTinform.
03CH: Vitomed, Aeskulap, Smart-Praxis, Triamed, mediX.
04Schreibweise: API/REST bevorzugt, KIM/HL7 akzeptabel, E-Mail-Aufgabe nur als Backup.

Eine Praxis, deren PVS nicht unterstützt wird, hat manuelle Übergabewege — das ist betrieblich ein Rückschritt, kein Fortschritt. Die Methodik bewertet hier konkret: welche Systeme schreibt der Anbieter direkt? Welche nur als E-Mail-Aufgabe? Welche gar nicht?

3. Sprachqualität und Latenz (Gewichtung 15 %)

01STT-Genauigkeit auf medizinischen Begriffen (Diagnosen, Medikamente, ICD-Codes) — Wortfehlerrate < 8 %.
02TTS-Natürlichkeit: bewertet vom MFA-Personal in einer 30-Anruf-Stichprobe (Skala 1-5, Schwelle ≥ 4).
03End-to-End-Latenz < 800 ms (95. Perzentil) zwischen Sprecher-Ende und Assistent-Antwortbeginn.
04Barge-In funktioniert robust (Patientin kann den Assistenten unterbrechen, ohne dass das Gespräch abstürzt).

4. Medizinische Triage-Sicherheit (Gewichtung 12 %)

01Erkennung akuter Symptome (Brustschmerz, Atemnot, Bewusstseinsstörung, schwere Blutung) und sofortige Verweisung auf 112 bzw. 144 / 144.
02Keine eigenständige medizinische Bewertung ("Sie haben wahrscheinlich …" ist verboten).
03Klare Übergabe an MFA/MPA bei medizinischen Folgenanfragen.
04Dokumentierte Eskalationspfade nachts und am Wochenende.
Triage-Sicherheit ist nicht verhandelbar

Ein Anbieter, dessen Assistent in einer Test-Stichprobe auch nur einmal eine medizinische Einschätzung selbständig abgibt, ist für den Einsatz in einer Arztpraxis disqualifiziert — unabhängig vom Score in anderen Dimensionen. Das ist Heilberufsrecht, nicht UX-Präferenz.

5. Terminbuchungs-Logik (Gewichtung 10 %)

01Vermeidung von Doppelbuchungen bei parallelen Anrufen (Concurrent Call Lock).
02Beachtung von Terminarten (Akut, Vorsorge, Wiederholungstermin, Privatpatient).
03Korrekte Behandlungsdauer-Schätzung (Sprechstundenraster der Praxis).
04Stornierung und Verschiebung ohne MFA-Intervention.

6. Betriebsökonomie (Gewichtung 10 %)

01Transparente Preisstruktur (€/Monat oder €/Anrufminute, nicht intransparente Hybridmodelle).
02Vorhersagbare Skalierung bei wachsendem Anrufvolumen.
03Keine Setup-Gebühr > 1.500 € netto für Standardpraxen.
04Mindestlaufzeit ≤ 12 Monate.

7. Support, Onboarding, Eigentumsverhältnisse (Gewichtung 10 %)

01Deutschsprachiger Support innerhalb der üblichen Reaktionszeiten (≤ 4 Werktagsstunden Erstantwort).
02Onboarding-Begleitung mit ärztlicher/MFA-Schulung (mindestens 2 Stunden, persönlich oder per Video).
03Eigentumsverhältnisse des Anbieters: wer hält die Mehrheit? Wo ist der Sitz? Gibt es Investoren aus Drittstaaten mit angemessenheitskritischer Datenschutzsituation?
04Transparenter Exit: Wie bekommt die Praxis ihre Daten beim Anbieterwechsel zurück?
03

Scoring-Logik

Jede Dimension wird auf einer Skala von 0 bis 5 bewertet (0 = nicht erfüllt, 5 = exzellent erfüllt). Der Gesamt-Score ist die gewichtete Summe und ergibt einen Wert zwischen 0 und 5,0.

01Score ≥ 4,2 = empfohlen für den Einsatz in der getesteten Praxiskonstellation.
02Score 3,5–4,1 = grundsätzlich tragfähig, mit dokumentierten Einschränkungen.
03Score 2,5–3,4 = nur in Spezialfällen einsetzbar; Risiken überwiegen Standard-Vorteile.
04Score < 2,5 = nicht empfohlen für regulierte Heilberufe.
K.O.-Kriterien overruled jeden Score

Drei Kriterien sind K.O.-Kriterien: (1) keine EU-/CH-Datenresidenz, (2) keine Übernahme der heilberuflichen Verschwiegenheitspflicht, (3) eigenständige medizinische Einschätzungen im Test. Wer hier scheitert, ist disqualifiziert — unabhängig von der gewichteten Gesamtnote.

04

BHOMY-Eigenbewertung (Stand Mai 2026)

Wir wenden die Methodik konsequent auch auf uns selbst an. Die folgende Bewertung ist Eigentransparenz, keine Werbung — die Schwächen werden mitveröffentlicht.

4,5 / 5
Datenschutz & Recht (EU-Hosting, AVV/ABV, § 203 StGB)
4,0 / 5
PVS-/PIS-Integration (8 Systeme direkt, 2 als E-Mail-Aufgabe)
4,3 / 5
Sprachqualität & Latenz
4,6 / 5
Medizinische Triage-Sicherheit
01Stärke: vollständige DSGVO/revDSG-Konformität inklusive § 203 StGB / Art. 321 StGB im Vertrag.
02Stärke: Triage-Logik mit harten Sicherheitsregeln (Akutsymptome → 112/144) und ohne eigenständige Einschätzung.
03Schwäche: drei seltenere österreichische und schweizerische PIS-Systeme aktuell nur über E-Mail-Aufgabe angebunden, nicht direkt.
04Schwäche: Premium-TTS-Stimmen in Schweizerdeutsch sind aktuell nicht im Standard-Lieferumfang.
Warum wir keine konkurrierenden Anbieter scoren

Wir haben mehrfach erwogen, fremde Anbieter zu bewerten. Wir verzichten darauf, solange wir keine Pilot-Praxen mit identischer Testkonstellation für jeden Anbieter aufsetzen können — alles andere wäre methodisch unredlich und würde diesem Dokument den Wert nehmen. Wenn Sie eine Praxis betreiben und an einem unabhängigen, kontrollierten Anbietervergleich teilnehmen möchten, schreiben Sie uns.

05

So nutzen Sie diese Methodik in Ihrer Praxis

01Definieren Sie 30 typische Anrufgründe für Ihre Praxis (Termin, Folgerezept, Krankschreibung, Akut, Privatabrechnung, ELGA/eRezept-Frage etc.).
02Bitten Sie jeden Anbieter um eine Pilot-Phase über mindestens 14 Werktage mit Ihrer realen Anrufrealität — keine Demo-Calls.
03Bewerten Sie jede der 7 Dimensionen anhand des Pilot-Outputs (Anrufprotokolle, MFA-Feedback, PVS-Integration-Tests).
04Multiplizieren Sie jede Bewertung mit der Gewichtung und addieren Sie auf.
05Prüfen Sie die K.O.-Kriterien — disqualifiziert eines, ist die gewichtete Note irrelevant.
06Dokumentieren Sie die Bewertung schriftlich. Bei Wechseln in 12-24 Monaten ist die Dokumentation Ihre wichtigste Grundlage.
06

Versionierung und Aktualisierungen

Diese Methodik wird mindestens jährlich überprüft. Änderungen werden im Update-Log am Ende dokumentiert. Stand: Mai 2026 — die regulatorischen Anker (DSGVO, revDSG, EU AI Act Stand Q2 2026, FMH-Empfehlungen, KBV-Stellungnahmen) sind aktuell.

Eine Praxis, die mit einem nicht-DSGVO-konformen Anbieter arbeitet, riskiert Bußgelder bis 4 % des weltweiten Konzernumsatzes der Praxisgesellschaft, plus zivilrechtliche Schadensersatzansprüche von Patientinnen. Das ist betrieblich kein „Nice-to-have", sondern ein Existenzrisiko. 25 % Gewichtung bildet das angemessen ab — alles darunter bagatellisiert.

Pilot-Phase nach dieser Methodik anfragen

Wenn Sie eine Praxis betreiben und BHOMY in einer kontrollierten Pilot-Phase nach genau diesen Kriterien evaluieren möchten — wir richten das gerne ein. Keine Sales-Demo, sondern eine echte 14-Werktage-Pilotphase mit Ihrer Anrufrealität.

Pilot-Phase anfragen
Update-Log

2026-05-03 (v1.0): Erstveröffentlichung. Sieben Dimensionen, 28 Kriterien, BHOMY-Eigenbewertung. Nächste planmäßige Überprüfung: November 2026.

Entdecke bhomy

Erlebe den Unterschied mit deinem eigenen KI-Telefonassistenten.

🍪

Cookies & Datenschutz

Wir verwenden Cookies, um Ihnen die bestmögliche Nutzung unserer Website zu ermöglichen. Einige davon sind technisch notwendig, andere helfen uns, die Website zu verbessern.