APIs werden in der Regel als zustandslos konzipiert, d. h. sie speichern keine Anfragedaten oder bewahren keine Informationen zwischen den Sitzungen auf. Diese zustandslose Natur ist entscheidend, wenn Skalierungsmethoden in Betracht gezogen werden. Zustandslose APIs erfordern keine Datenreplikation über Instanzen hinweg, wodurch die horizontale Skalierung effizienter und einfacher zu implementieren ist. Systemadministratoren können VMs nach Bedarf hinzufügen oder entfernen, ohne die API-Vorgänge zu beeinträchtigen, da der API-Client nicht auf bestimmte Serverinstanzen angewiesen ist.
Es ist nichts falsch daran, zustandsbehaftet zu sein. Tatsächlich kann dies für die gewünschte Funktion der Anwendung von entscheidender Bedeutung sein. Die Ausführung der horizontalen Skalierung für eine zustandsbehaftete Anwendung ist jedoch wesentlich komplizierter. Dies würde das Kopieren gespeicherter Daten aus der Originalversion der Anwendung in neue Instanzen erfordern.
Eine zustandslose Anwendung oder API hingegen ist eine Anwendung, die keine Anfragedaten speichert. Sie speichert keine Sitzungsdaten im Speicher. Bei jedem Start einer Sitzung ist es so, als ob die Anwendung den Client zum ersten Mal trifft. Nach dem Ende der Sitzung heißt es „auf Wiedersehen“, ohne sich an die Sitzung zu erinnern.
Horizontale Skalierung ist für eine zustandslose Anwendung möglich, da es keine Rolle spielt, welche VM auf API-Aufrufe reagiert. Der API-Client kann eine unendliche Anzahl von VMs aufrufen, die die API hosten, und das wird keine Rolle spielen. Systemadministratoren können beliebig viele VMs hinzufügen oder entfernen, ohne den Betrieb der API zu beeinträchtigen.