Gleichzeitige Anrufe — concurrent calls — beschreiben, wie viele Telefonate ein KI-Telefonassistent parallel führen kann. Die Kennzahl entscheidet darüber, ob ein Setup Lastspitzen verkraftet: Marketing-Kampagne, Notdienst, Montagvormittag bei einer Arztpraxis.
Das Limit ist meist tarif- und infrastrukturgebunden. Cloud-basierte Anbieter skalieren elastisch; on-premise oder hybride Setups stoßen schneller an Grenzen. Wichtig ist, ob das Limit weich (Queueing) oder hart (Besetzt-Ton) gehandhabt wird.
Belastbare Dimensionierung folgt aus historischen Anrufprofilen: durchschnittliche Anrufdauer × Spitzen-Anrufrate ergibt die nötige Gleichzeitigkeit. Sicherheitsmarge von 30 % ist Standard. Wer dies nicht messen kann, sollte mit einem Anbieter starten, der vertraglich Skalierung garantiert.