Kapitel 9. Skalierung

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In Kubernetes kann die Skalierung für verschiedene Nutzer unterschiedliche Bedeutungen haben. Wir unterscheiden zwischen zwei Fällen:

Cluster-Skalierung

Manchmal wird dies auch als Cluster-Elastizität bezeichnet und bezieht sich auf den (automatischen) Prozess des Hinzufügens oder Entfernens von Arbeitsknoten auf der Grundlage der Clusterauslastung.

Skalierung auf Anwendungsebene

Manchmal auch Pod-Skalierung genannt, bezieht sich dies auf den (automatisierten) Prozess der Veränderung von Pod-Eigenschaften auf der Grundlage einer Vielzahl von Metriken, von Low-Level-Signalen wie der CPU-Auslastung bis hin zu höherwertigen Signalen wie HTTP-Anfragen pro Sekunde für einen bestimmten Pod.

Es gibt zwei Arten von Skalierern auf Pod-Ebene:

Horizontale Pods-Autoscaler (HPAs)

HPAs erhöhen oder verringern automatisch die Anzahl der Pod Replikate in Abhängigkeit von bestimmten Metriken.

Vertikale Pods-Autoscaler (VPAs)

VPAs erhöhen oder verringern automatisch den Ressourcenbedarf von Containern, die in einem Pod laufen.

In diesem Kapitel untersuchen wir zunächst die Elastizität von Clustern für GKE, AKS und EKS und diskutieren dann die Pod-Skalierung mit HPAs.

9.1 Skalierung eines Einsatzes

Problem

Du hast einen Einsatz und möchtest ihn horizontal skalieren.

Lösung

Verwende den Befehl kubectl scale, um einen Einsatz zu ...

Get Kubernetes Kochbuch, 2. Auflage now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.