Skip to Content
实用 MLOps
book

实用 MLOps

by Noah Gift, Alfredo Deza
May 2025
Intermediate to advanced
460 pages
6h 16m
Chinese
O'Reilly Media, Inc.
Content preview from 实用 MLOps

第 6 章. 监控和日志记录

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com

不仅,大脑解剖结构是双重的,不仅一个半球足以产生意识这一点毋庸置疑,而且,胼胝体切除术后的两个半球已被证明可以同时和独立地产生意识。正如纳格尔在谈到分裂脑时所说的那样:"右半球自己所能做的事情太精细、太有目的性、在心理上也太容易理解,不能仅仅被视为无意识自动反应的集合。

约瑟夫-博根博士

日志记录和监控是 DevOps 原则的核心支柱,对于强大的 ML 实践至关重要。有用的日志记录和监控很难做到位,尽管您可以利用云服务来处理繁重的工作,但还是要由您来决定并提出合理的策略。大多数软件工程师倾向于编写代码,而将测试、文档等其他任务抛在脑后,日志记录和监控往往也是如此。

如果听到有人提出可以 "解决日志记录问题 "的自动化解决方案,请不要感到惊讶。彻底思考手头的问题,使产生的信息可用,才有可能打下坚实的基础。当你面对无用信息(无助于叙述故事)或隐晦信息(太难理解)时,我所描述的艰苦工作和坚实基础的理想就会变得非常清晰。这种情况的一个完美例子就是我在 2014 年打开的一个软件问题,它捕捉到了关于该产品的在线聊天中的以下问题:

"谁能帮我解释一下这句话:

7fede0763700  0 -- :/1040921 >> 172.16.17.55:6789/0 pipe(0x7feddc022470 \
sd=3 :0 s=1 pgs=0 cs=0 l=1 c=0x7feddc0226e0).fault

当时我已经使用这个软件产品快两年了,但我不知道这意味着什么。你能想到可能的答案吗?一位知识渊博的工程师给出了完美的翻译:"您所在的机器无法与位于 172.16.17.55 的监视器取得联系"。我百思不得其解,不知道日志的意思是什么。为什么不能改成这样说呢?截至本文撰写时,2014 年记录此问题的票单仍未处理完毕。更令人不安的是,工程部在该票中回复说 "日志信息没有问题"。

日志记录和监控是一项艰苦的工作,因为需要付出努力才能产生有意义的输出,帮助我们了解程序的状态。

我曾说过,掌握有助于我们叙述故事的信息至关重要。监控和日志记录都是如此。几年前,我在一个大型工程小组工作,该小组交付了世界上最大的基于 Python 的 CMS(内容管理系统)之一。在提议为应用程序添加度量指标后,大家普遍认为内容管理系统并不需要。监控已经到位,运营团队有各种与警报阈值相关的实用工具。工程经理为了奖励工程师的卓越表现,会给他们时间参与任何相关项目(而不是像某些著名科技公司那样只参与 20%的项目)。在参与相关项目之前,工程师必须向整个管理团队提出自己的想法,以获得认同。当我的机会来临时,我当然选择在应用程序中添加度量设施。

"阿尔弗雷多,我们已经有了衡量标准,我们知道磁盘使用情况,每台服务器都有内存警报。我们不明白这一举措能给我们带来什么好处"。站在一个庞大的高级管理团队面前,试图说服他们相信自己不相信的东西是很难的。我的解释从网站上最重要的按钮开始:订阅按钮。订阅按钮负责产生付费用户,对业务至关重要。我解释说:"如果我们部署的新版本存在 JavaScript 问题,导致这个按钮无法使用,有什么指标或警报可以告诉我们这是一个问题?"当然,磁盘使用率会保持不变,内存使用率可能也不会有任何变化。然而,应用程序中最重要的按钮却在无法使用的状态下被忽视了。在这种特殊情况下,度量指标可以捕捉到该按钮每小时、每天和每周的点击率。最重要的是,它可以帮助说明网站今天的收入比去年同月的收入多(或少!)。服务器的磁盘使用率和内存消耗值得关注,但这并不是 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

在企业中实施 MLOps

在企业中实施 MLOps

Yaron Haviv, Noah Gift
超越Vibe编程

超越Vibe编程

Addy Osmani
低代码AI

低代码AI

Gwendolyn Stripling, Michael Abel

Publisher Resources

ISBN: 9798341657939