KI-Telefonassistent A–Z

Glossar

Begriffe rund um Voice AI, Telefonie und DSGVO — kompakt erklärt für Entscheider und Technik-Teams.

Scroll

KI-Telefonassistent A–Z — KI-Telefonassistent A–Z — KI-Telefonassistent A–Z — KI-Telefonassistent A–Z — KI-Telefonassistent A–Z — KI-Telefonassistent A–Z — KI-Telefonassistent A–Z — KI-Telefonassistent A–Z — KI-Telefonassistent A–Z — KI-Telefonassistent A–Z —

AVV (Auftragsverarbeitungsvertrag)

Vertrag nach Art. 28 DSGVO zwischen Verantwortlichem und Auftragsverarbeiter. Regelt Zweck, Umfang und Schutzmaßnahmen der Datenverarbeitung. Pflicht für jeden SaaS-Einsatz mit personenbezogenen Daten.

Verwandt:DSGVO EU-Datenresidenz

Barge-In

Fähigkeit, dass Anrufer dem Assistenten ins Wort fallen können. Gilt als Indikator für natürliche Gespräche; technisch realisiert durch parallele STT mit Voice-Activity-Detection.

Verwandt:Voice AI Latenz

Gleichzeitige Anrufe (Concurrent Calls)

Anzahl der parallel führbaren Telefonate. Bestimmt die Skalierung bei Lastspitzen — wichtig bei Marketing-Kampagnen oder Notdiensten. Limit ist meist tarifabhängig.

Verwandt:Inbound vs. Outbound SLA (Service Level Agreement)

CRM-Integration

Schnittstelle zwischen Telefonassistent und Customer-Relationship-System (HubSpot, Salesforce, Pipedrive). Ermöglicht automatisches Anlegen von Kontakten und Aktivitäten nach Anrufen.

Verwandt:Webhook

DSGVO

EU-Datenschutz-Grundverordnung. Regelt die Verarbeitung personenbezogener Daten in der EU. Verlangt u. a. Rechtsgrundlage, Zweckbindung, AVV bei Auftragsverarbeitung und EU-Server bei sensiblen Daten.

Verwandt:AVV (Auftragsverarbeitungsvertrag)EU-Datenresidenz

EU-Datenresidenz

Speicherung und Verarbeitung von Daten ausschließlich in EU-Rechenzentren. Reduziert Drittland-Transfer-Risiken nach Schrems II und ist Voraussetzung für viele DSGVO-konforme Setups.

Verwandt:DSGVO AVV (Auftragsverarbeitungsvertrag)

Inbound vs. Outbound

Inbound = der Assistent nimmt eingehende Anrufe entgegen (Terminbuchung, Support). Outbound = der Assistent ruft aktiv heraus (Bestätigungen, Umfragen). Beide Modi haben unterschiedliche Compliance-Anforderungen.

Verwandt:KI-Telefonassistent Gleichzeitige Anrufe (Concurrent Calls)

IVR (Interactive Voice Response)

Klassisches Sprachdialogsystem mit Tastenmenüs ("Drücken Sie 1 für ..."). KI-Telefonassistenten ersetzen IVR durch freie Sprache und Intent-Erkennung.

Verwandt:KI-Telefonassistent Voice AI

KI-Telefonassistent

Software, die eingehende und ausgehende Anrufe autonom führt — auf Basis von Sprache-zu-Text, einem Sprachmodell zur Antwortfindung und Text-zu-Sprache. Übergibt bei Bedarf an Menschen.

Verwandt:Voice AI LLM (Large Language Model)TTS (Text-to-Speech)

Latenz

Verzögerung zwischen Sprecherende und Antwort des Assistenten. Unter 700 ms wirkt natürlich, über 1500 ms abgehackt. Setzt sich aus STT, LLM und TTS zusammen.

Verwandt:Barge-In TTS (Text-to-Speech)STT / ASR (Speech-to-Text)

LLM (Large Language Model)

Großes Sprachmodell (z. B. GPT-4, Claude, Llama) zur Generierung von Antworten. Im Telefonkontext kombiniert mit RAG, um auf unternehmensspezifisches Wissen zuzugreifen.

Verwandt:RAG (Retrieval-Augmented Generation)NLU (Natural Language Understanding)

NLU (Natural Language Understanding)

Komponente, die Anrufer-Sätze in strukturierte Intents und Entities übersetzt ("Termin am Dienstag um 10" → intent=book, slot=dienstag-10). Heute meist von LLMs übernommen.

Verwandt:LLM (Large Language Model)STT / ASR (Speech-to-Text)

RAG (Retrieval-Augmented Generation)

Architektur, bei der ein LLM vor der Antwort relevante Dokumente aus einer Wissensbasis abruft. Ermöglicht aktuelle, unternehmensspezifische Antworten ohne Modell-Fine-Tuning.

Verwandt:LLM (Large Language Model)CRM-Integration

SIP-Trunk

Internet-basierte Telefonleitung, die Rufnummern an den KI-Assistenten weiterleitet. Standard-Protokoll für VoIP. Häufig portiert von bestehenden Anbietern (Telekom, Sipgate, Vodafone).

Verwandt:Inbound vs. Outbound Gleichzeitige Anrufe (Concurrent Calls)

SLA (Service Level Agreement)

Vertraglich zugesicherte Dienstgüte: Verfügbarkeit (z. B. 99,9 %), Reaktionszeit, Wiederherstellungszeit. Pflicht für geschäftskritische Setups, oft mit Pönalen bei Verletzung.

Verwandt:Gleichzeitige Anrufe (Concurrent Calls)EU-Datenresidenz

STT / ASR (Speech-to-Text)

Wandelt gesprochene Sprache in Text um. Auch ASR genannt (Automatic Speech Recognition). Qualität entscheidet über Verständnis-Rate; spezialisierte Modelle für Deutsch sind Pflicht.

Verwandt:TTS (Text-to-Speech)NLU (Natural Language Understanding)Latenz

TTS (Text-to-Speech)

Wandelt Text in gesprochene Sprache um. Aktuelle neuronale TTS-Systeme klingen nahezu menschlich. Variiert in Latenz, Sprachenauswahl und Stimm-Klonungs-Fähigkeit.

Verwandt:STT / ASR (Speech-to-Text)Voice Cloning Latenz

Voice AI

Oberbegriff für KI-Systeme, die Sprache verstehen und sprechen. Umfasst STT, NLU/LLM und TTS. KI-Telefonassistenten sind eine konkrete Anwendung von Voice AI.

Verwandt:KI-Telefonassistent LLM (Large Language Model)

Voice Cloning

Erzeugung einer synthetischen Stimme aus einer Sprachprobe (oft 30 s–10 min). Erlaubt einheitliche Markenstimme. DSGVO- und einwilligungsrechtliche Prüfung erforderlich.

Verwandt:TTS (Text-to-Speech)Voice AI

Webhook

HTTP-Callback, der nach einem Anruf-Event (Anrufende, Termin gebucht) automatisch ein Drittsystem informiert. Wichtigste Integrations-Technik neben Direkt-APIs.

Verwandt:CRM-Integration

Bereit für den nächsten Schritt?

Verbinden Sie diese Begriffe mit konkreten Lösungen für Ihre Branche.

Lösungen ansehen Welcher KI-Telefonassistent passt zu Ihnen?

Stand: 03. Mai 2026. Definitionen werden vierteljährlich überprüft. · v2026-05-03