Capítulo 17. Suficientemente barato y preciso: Muestreo
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En el capítulo anterior, vimos cómo debe configurarse un almacén de datos para almacenar y recuperar eficazmente grandes cantidades de datos de observabilidad. En este capítulo, veremos técnicas para reducir la cantidad de datos de observabilidad que puedes necesitar almacenar. A una escala lo suficientemente grande, los recursos necesarios para retener y procesar cada uno de los eventos pueden llegar a ser prohibitivos y poco prácticos. El muestreo de eventos puede mitigar las compensaciones entre el consumo de recursos y la fidelidad de los datos.
Este capítulo examina por qué es útil el muestreo (incluso a pequeña escala), las distintas estrategias que se suelen utilizar para muestrear datos y las compensaciones entre esas estrategias. Utilizamos ejemplos basados en código para ilustrar cómo se aplican estas estrategias e introducimos progresivamente conceptos que se basan en ejemplos anteriores. El capítulo comienza con esquemas de muestreo más sencillos aplicados a sucesos individuales, como introducción conceptual al uso de una representación estadística de los datos en el muestreo. A continuación, avanzamos hacia estrategias de muestreo más complejas a medida que se aplican a una serie de eventos relacionados (intervalos de traza) y propagan la información necesaria para reconstruir tus datos tras el ...