Zum Hauptinhalt springen
Glossar

Barge-In

Fähigkeit, dass Anrufer dem Assistenten ins Wort fallen können. Gilt als Indikator für natürliche Gespräche; technisch realisiert durch parallele STT mit Voice-Activity-Detection.

Barge-In bezeichnet die Fähigkeit eines KI-Telefonassistenten, dass Anrufer ihn jederzeit unterbrechen können — so wie in einem natürlichen Gespräch. Ohne Barge-In wirken Telefonate roboterhaft, weil Nutzende abwarten müssen, bis das System ausgesprochen hat.

Technisch wird Barge-In durch parallele Speech-to-Text-Erkennung mit Voice-Activity-Detection (VAD) realisiert: Sobald das System Spracheingang detektiert, wird die laufende TTS-Wiedergabe unterbrochen und in den Zuhör-Modus gewechselt. Schwellenwerte und Hysterese sind kritisch, sonst springen Geräusche das Gespräch an.

In der Praxis verbessert Barge-In die wahrgenommene Latenz und die Abschlussraten. Wichtige Edge-Cases: laute Hintergrundgeräusche, Hold-Music auf Anruferseite und sehr kurze Bestätigungen ("ja", "okay") sollten richtig kategorisiert werden, sonst entsteht ein Ping-Pong-Effekt.

FAQ
Wann wirkt Barge-In schlecht?
Wenn die VAD zu empfindlich ist, unterbrechen Husten, Türen oder Tastatur den Assistenten. Eine konservative Energieschwelle plus Mindestdauer (~150–250 ms) glättet das.
Verwandte Begriffe
Vertiefen in der Dokumentation
Anwendung im Produkt

Nächster Schritt

Sehen Sie BHOMY in einer 15-minütigen Demo am echten Anrufbeispiel.

🍪

Cookies & Datenschutz

Wir verwenden Cookies, um Ihnen die bestmögliche Nutzung unserer Website zu ermöglichen. Einige davon sind technisch notwendig, andere helfen uns, die Website zu verbessern.