Zum Hauptinhalt springen
Glossar

Turn-Taking

Steuerung des Wechsels zwischen Sprechen und Zuhören. Über reines Barge-In hinaus: Erkennung von Sprechpausen, Backchannels („mhm"), Vermeidung von Doppel-Sprechen. Schlüssel zur Gesprächs­natürlichkeit.

Turn-Taking beschreibt, wie ein Voice-AI-System entscheidet, wann es spricht und wann es zuhört. Schlechtes Turn-Taking erzeugt das Gefühl von "Funkgerät-Telefonie" — entweder unterbricht das System ständig oder es wartet quälend lange, bis es antwortet.

Gute Turn-Taking-Heuristiken kombinieren Voice-Activity-Detection (VAD), prosodische Endsignale ("…in Ordnung."), Pausen-Länge und semantische Endpunkt-Vorhersage des LLMs. Übliche Zielzeiten: 250–500 ms Reaktionsfenster nach Anrufer-Pause, mit dynamischer Verlängerung bei erkennbaren Denkpausen.

Im produktiven Einsatz zahlen sich kontextabhängige Profile aus: Outbound-Sales darf etwas schneller reagieren, Support für ältere Anrufer eher langsamer. Messbare KPIs sind Anteil unterbrochener Anrufer-Sätze, mittlere Antwortlatenz und Abbruchrate nach Latenz-Spikes.

Vertiefen in der Dokumentation
Anwendung im Produkt

Nächster Schritt

Sehen Sie BHOMY in einer 15-minütigen Demo am echten Anrufbeispiel.

🍪

Cookies & Datenschutz

Wir verwenden Cookies, um Ihnen die bestmögliche Nutzung unserer Website zu ermöglichen. Einige davon sind technisch notwendig, andere helfen uns, die Website zu verbessern.