book

计算机视觉中的实用机器学习

by Valliappa Lakshmanan, Martin Görner, Ryan Gillard

May 2025

Beginner to intermediate

482 pages

6h 42m

Chinese

O'Reilly Media, Inc.

Book available

Read now

Unlock full access

这本书适合哪些人阅读？如何使用本书本书的编排本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
机器学习Deep Learning 使用案例摘要
机器感知数据集5 花数据集读取图像数据图像数据可视化读取数据集文件使用 Keras 的线性模型Keras 模型训练模型使用 Keras 的神经网络神经网络深度神经网络摘要术语表
预训练嵌入预训练模型迁移学习微调卷积网络卷积滤波器堆叠卷积层汇集层亚历克斯网追求深度滤波器因式分解1x1 卷积VGG19全球平均集合模块化架构开始SqueezeNetResNet 和跳过连接DenseNet深度可分卷积Xception神经架构搜索设计NASNetMobileNet 大家庭超越卷积变压器架构选择机型性能比较组装建议的战略摘要
物体检测YOLO视网膜网细分掩码 R-CNN 和实例分割U-Net 和语义分割摘要
收集图片照片成像概念验证数据类型渠道地理空间数据音频和视频手动贴标多标签物体检测大规模贴标标签用户界面多重任务投票和众包贴标服务自动贴标来自相关数据的标签吵闹的学生自我监督学习偏见偏见的来源选择偏差测量偏差确认偏差检测偏差创建数据集分割数据TensorFlow 记录读取 TensorFlow 记录摘要
预处理的原因形状转换数据质量转型提高模型质量尺寸和分辨率使用 Keras 预处理层使用 TensorFlow 图像模块混合使用 Keras 和 TensorFlow模型培训培训-服务偏差重复使用函数模型内的预处理使用 tf.transform数据扩充空间变换色彩失真信息丢弃形成输入图像摘要
高效摄入高效存储数据并行读取数据最大限度地利用 GPU保存模型状态导出模型检查点分销战略选择战略制定战略无服务器 ML创建 Python 软件包提交培训工作超参数调整部署模型摘要
监测张量板重量直方图设备安置数据可视化培训活动模型质量指标分类指标回归指标物体检测指标质量评估切片评估公平监督持续评估摘要
进行预测导出模型使用内存模型改进抽象性提高效率在线预测TensorFlow 服务修改服务功能处理图像字节批量和流预测Apache Beam 管道批量预测托管服务调用在线预测边缘 ML限制和优化TensorFlow Lite运行 TensorFlow Lite处理图像缓冲区联合学习摘要

机器学习管道对管道的需求Kubeflow 管道集群将代码库容器化编写组件连接组件自动运行可解释性技术增加可解释性无代码计算机视觉为什么使用 No-Code？加载数据培训评估摘要
物体测量参考对象细分旋转校正比率和测量计数密度估算提取补丁模拟输入图像回归预测姿势估计人物实验室PoseNet 模型识别多种姿势图像搜索分布式搜索快速搜索更好的嵌入摘要
形象理解嵌入辅助学习任务自动编码器变异自动编码器图像生成生成式对抗网络 Network+改进全球网络图像到图像的翻译超分辨率修改图片（涂色）异常检测深度伪造图像字幕数据集字幕标记化配料字幕模式培训环路预测摘要

Content preview from 计算机视觉中的实用机器学习

后记

1966 年，麻省理工学院教授西摩-帕帕特（Seymour Papert）为他的学生发起了一个暑期项目。这个项目的最终目标是通过将图像中的物体与已知物体的词汇进行匹配来命名这些物体。他很有帮助地将任务分解成几个子项目，并希望学生们能在几个月内完成。可以说，帕帕特博士有点低估了问题的复杂性。

本书一开始，我们就研究了像全连接神经网络这样的天真机器学习方法，这些方法并没有利用图像的特殊性。在第 2 章中，通过尝试这些简单的方法，我们学会了如何读取图像，以及如何使用机器学习模型进行训练、评估和预测。

然后，在第 3 章中，我们介绍了许多创新概念--卷积滤波器、最大池化层、跳转连接、模块、挤压激活等--这些概念使现代机器学习模型能够很好地从图像中提取信息。实际上，实现这些模型需要使用内置的 Keras 模型或 TensorFlow Hub 层。我们还详细介绍了迁移学习和微调。

在第 4 章中，我们探讨了如何使用第 3 章中介绍的计算机视觉模型来解决计算机视觉中两个更基本的问题：物体检测和图像分割。

本书接下来的几章深入介绍了创建生产计算机视觉机器学习模型所涉及的各个阶段：

在第 5 章中，我们介绍了如何以高效的机器学习格式创建数据集。我们还讨论了创建标签以及为模型评估和超参数调整保留独立数据集的可用选项。
在第 6 章中，我们深入探讨了预处理和防止训练服务偏差的问题。预处理可以在tf.data 输入管道、Keras 层、tf.transform 中完成，也可以混合使用这些方法。我们介绍了每种方法的实现细节和优缺点。
在第 7 章中，我们讨论了模型训练，包括如何在 GPU 和工作者之间分配训练。
在第 8 章中，我们探讨了如何监控和评估模型。我们还研究了如何进行抽样评估，以诊断出模型中的不公平和偏差。
在第 9 章中，我们讨论了部署模型的可用选项。我们实现了批量、流式和边缘预测。我们能够在本地和网络上调用模型。
在第 10 章中，我们向你展示了如何将所有这些步骤整合到机器学习管道中。我们还尝试了一种无代码图像分类系统，以利用机器学习的不断民主化。

在第 11 章中，我们将视角扩大到图像分类之外。我们探讨了如何利用计算机视觉的基本构件来解决各种问题，包括计数、姿势检测和其他用例。最后，在第 12 章中，我们探讨了如何生成图像和标题。

在本书中，所讨论的概念、模型和流程都附有在 GitHub 中的实现。我们强烈建议您不仅要阅读本书，还要通过代码进行操作和尝试。学习机器学习的最佳方式就是动手实践。

计算机视觉正处于一个激动人心的阶段。在帕帕特博士向他的学生们提出这个问题 50 多年后的今天，我们终于可以用两个月的时间完成图像分类项目了！我们祝愿你们在应用这项技术改善人类生活方面取得巨大成功，并希望使用计算机视觉技术解决现实世界的问题能给你们带来和我们一样多的快乐。

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Start your free trial

Publisher Resources

ISBN: 9798341657335Supplemental Content

计算机视觉中的实用机器学习

by Valliappa Lakshmanan, Martin Görner, Ryan Gillard

后记

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

You might also like

Rust程序设计

软件架构指标

机器学习在高风险应用中的应用

《敏捷开发艺术》第二版

Publisher Resources

后记

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

You might also like

Rust程序设计

软件架构指标

机器学习在高风险应用中的应用

《敏捷开发艺术》第二版

Publisher Resources

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.