November 2025
Intermediate to advanced
1060 pages
14h 20m
Chinese
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
通过这本权威指南,全面提升您AI基础设施各层级的效能,从而增强AI系统的性能表现。在生成式模型日益庞大的当下,《AI系统性能工程》为工程师、研究人员和开发者提供了可操作的优化策略实践指南。 学习协同优化硬件、软件与算法,构建兼具训练与推理能力的弹性、具备可扩展性且经济高效的人工智能系统。本书由专注性能优化的工程与产品领袖克里斯·弗雷格利执笔,将复杂的人工智能系统转化为高效精简的高影响力解决方案。
书中将逐步揭示GPU CUDA内核、基于PyTorch的算法以及多节点训练与推理系统的精细化调优方法论。您还将掌握GPU集群扩展技术,实现高性能分布式模型训练任务与推理服务器的构建。全书末附有175余项经验验证的即用型优化清单。
Read now
Unlock full access