Guía de estudio para administrador certificado de Kubernetes (CKA). (Spanish Edition), 2nd Edition
by Benjamin Muschko
Capítulo 12. Escalado de cargas de trabajo
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Hay varias razones por las que es necesario escalar una carga de trabajo, especialmente para mantener un rendimiento óptimo ante una demanda creciente. Por ejemplo, una aplicación puede experimentar un aumento repentino de usuarios a medida que gana popularidad, o puede necesitar procesar mayores volúmenes de datos con el tiempo.
En Kubernetes, el escalado de una carga de trabajo se puede lograr de dos maneras principales: aumentando los recursos asignados a cada pod (escalado vertical) o ajustando el número de pods que se ejecutan simultáneamente (escalado horizontal). El escalado horizontal es especialmente eficaz para manejar cargas de trabajo fluctuantes, ya que garantiza que la aplicación siga siendo receptiva y resistente ante niveles variables de demanda, como contrapresiones en la CPU, la memoria y la E/S.
En este capítulo, aprenderás a escalar manualmente el número de réplicas como reacción al aumento de la carga de la aplicación. Además, exploraremos la primitiva API HorizontalPodAutoscaler (HPA), que te permite escalar automáticamente el conjunto gestionado de pods en función de umbrales de recursos como la CPU y la memoria. No entraremos en el escalado vertical representado por la primitiva de API VerticalPodAutoscaler (VPA), ya que el examen no lo cubre.
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access