Natural Language Understanding (NLU) ist die Komponente, die unstrukturierte Anrufer-Sätze in strukturierte Intents und Entities übersetzt. "Ich brauche einen Termin nächsten Dienstag um 10" → intent=book_appointment, slot.day=Dienstag, slot.time=10:00.
Klassisch wurde NLU über regelbasierte Grammatiken oder spezialisierte ML-Modelle (Rasa, Dialogflow) gelöst. Heute übernimmt das in den meisten Voice-AI-Stacks ein LLM mit strukturiertem Output (JSON-Schema oder Function-Calling). Das ist robuster gegen Umformulierungen, kostet aber Latenz und Token.
Die Qualität einer NLU-Implementierung misst sich an drei Größen: Intent-Accuracy bei Edge-Cases (Dialekt, Abkürzungen, unscharfe Aussagen), Slot-Filling-Rate (vollständige Erfassung aller benötigten Felder im ersten Anlauf) und Recovery-Verhalten bei Fehlinterpretationen.