Preguntas clave para servir de modelo¿Cuál será la carga de nuestro modelo?¿Cuáles son las necesidades de latencia de predicción de nuestro modelo?¿Dónde tiene que vivir el modelo?¿Cuáles son las necesidades de hardware para nuestro modelo?¿Cómo se almacenará, cargará, versionará y actualizará el modelo de servicio?¿Cómo será nuestra línea de productos para servir?Arquitecturas Servidoras de ModelosServir sin conexión (Inferencia por lotes)Servir en línea (Inferencia en línea)Modelo como servicioServir en el perímetroElegir una arquitecturaDiseño del modelo APIPrueba¿Servir para la precisión o para la resistencia?EscaladoAutoescaladoAlmacenamiento en cachéRecuperación en caso de catástrofeConsideraciones éticas y de equidadConclusión