book

Ray 分布式机器学习：利用Ray 进行大模型的数据处理、训练、推理和部署

Name: Ray 分布式机器学习：利用Ray 进行大模型的数据处理、训练、推理和部署
ISBN: 9787111753384

by Max Pumperla, Edward Oakes, Richard Liaw

May 2024

Intermediate

252 pages

5h 31m

Chinese

China Machine Press

Read now

Unlock full access

第1章 Ray概述
1.1 Ray是什么
1.1.1 Ray的渊源
1.1.2 Ray的设计原则
1.1.3 Ray的三层架构：内核、库、生态
1.2 分布式计算框架
1.3 数据科学库套件
1.3.1 Ray AIR和数据科学工作流
1.3.2 处理数据
1.3.3 训练模型
1.3.4 调优超参数
1.3.5 部署模型
1.4 Ray的生态
1.5 总结
第2章 Ray Core入门
2.1 Ray Core简介
2.1.1 Ray API的第一个示例 (1/2)
2.1.1 Ray API的第一个示例 (2/2)
2.1.2 Ray Core API概述
2.2 理解Ray的系统组件
2.2.1 在节点上调度和执行任务
2.2.2 主节点
2.2.3 分布式调度和执行
2.3 利用Ray创建简单的MapReduce示例
2.3.1 映射和打乱文档数据
2.3.2 利用约简进行单词统计
2.4 总结
第3章创建第一个分布式应用程序
3.1 强化学习入门
3.2 创建简易的迷宫问题
3.3 创建模拟
3.4 训练强化学习模型
3.5 创建分布式Ray应用程序
3.6 回顾强化学习术语
3.7 总结
第4章利用Ray RLlib进行强化学习
4.1 RLlib概述
4.2 RLlib入门
4.2.1 创建Gym环境
4.2.2 运行RLlib CLI
4.2.3 使用RLlib Python API (1/2)
4.2.3 使用RLlib Python API (2/2)
4.3 配置RLlib实验
4.3.1 资源配置
4.3.2 配置rollout worker
4.3.3 配置环境
4.4 使用RLlib环境
4.4.1 RLlib环境概述
4.4.2 使用多智能体
4.4.3 使用策略服务器和客户端
4.5 高级概念
4.5.1 创建高级环境
4.5.2 应用课程学习
4.5.3 使用离线数据
4.5.4 其他高级主题
4.6 总结
第5章利用Ray Tune进行超参数调优
5.1 调优超参数
5.1.1 使用Ray创建随机搜索示例
5.1.2 调优超参数的难点
5.2 Ray Tune入门
5.2.1 Tune的原理
5.2.2 配置和运行Tune
5.3 使用Tune进行机器学习
5.3.1 结合使用RLlib和Tune
5.3.2 调优Keras模型
5.4 总结
第6章利用Ray进行数据处理
6.1 Ray Dataset
6.1.1 Ray Dataset基础
6.1.2 利用Ray Dataset进行计算
6.1.3 数据集管道
6.1.4 示例：并行训练分类器副本
6.2 外部集成库
6.3 创建ML管道
6.4 总结
第7章利用Ray Train进行分布式训练
7.1 分布式模型训练基础
7.2 基于示例介绍Ray Train
7.2.1 预测纽约出租车的大额小费
7.2.2 加载、预处理、特征化
7.2.3 定义深度学习模型
7.2.4 示例：利用Ray Train进行分布式训练
7.2.5 分布式批量推理
7.3 Ray Train训练器
7.3.1 迁移到Ray Train
7.3.2 扩展训练器
7.3.3 利用Ray Train进行预处理
7.3.4 将训练器和Ray Tune集成
7.3.5 使用回调函数监控训练
7.4 总结
第8章利用Ray Serve进行在线推理
8.1 在线推理的主要特点
8.1.1 ML模型属于计算密集型
8.1.2 ML模型无法独立使用
8.2 Ray Serve入门
8.2.1 Ray Serve概述
8.2.2 定义基础HTTP端点
8.2.3 扩展和资源分配
8.2.4 批处理请求
8.2.5 多模型推理图
8.3 端到端示例：创建基于NLP的API
8.3.1 获取内容和预处理
8.3.2 NLP模型
8.3.3 HTTP处理和驱动逻辑
8.3.4 整合
8.4 总结
第9章 Ray集群
9.1 手动创建Ray Cluster
9.2 在Kubernetes上进行部署
9.2.1 设置KubeRay集群
9.2.2 与KubeRay集群交互
9.2.3 公开KubeRay
9.2.4 配置KubeRay
9.2.5 配置KubeRay日志
9.3 使用Ray集群启动器
9.3.1 配置Ray集群
9.3.2 使用集群启动器CLI
9.3.3 与Ray Cluster交互
9.4 使用云集群
9.4.1 AWS
9.4.2 其他云服务
9.5 自动扩展
9.6 总结
第10章 Ray AIR入门
10.1 为什么使用AIR
10.2 AIR核心概念
10.2.1 Ray Dataset和预处理器
10.2.2 训练器
10.2.3 调优器和检查点
10.2.4 批预测器
10.2.5 部署
10.3 适合AIR的任务
10.3.1 AIR任务执行
10.3.2 AIR内存管理
10.3.3 AIR故障模型
10.3.4 自动扩展AIR任务
10.4 总结
第11章 Ray生态及其他
11.1 蓬勃的生态
11.1.1 数据加载和处理
11.1.2 模型训练
11.1.3 模型服务
11.1.4 创建自定义集成
11.1.5 Ray集成概述
11.2 Ray和其他系统
11.2.1 分布式Python框架
11.2.2 Ray AIR和更广泛的ML生态
11.2.3 将AIR集成到ML平台
11.3 继续学习
11.4 总结
作者简介
封面简介

Content preview from Ray 分布式机器学习：利用Ray 进行大模型的数据处理、训练、推理和部署

Ray

概述

1.3.1 Ray AIR

和数据科学工作流

近年来，数据科学（

D ata Science

，

）发展迅速，连该术语本身都变得有些

难以捉摸，可以在网上找到许多关于数据科学的定义，这些定义都有一定的道

理

注

。我们将“数据科学”定义为利用数据获得洞见，并创建实际应用。这是

在实践和应用层面做出的广义定义，重点是理解事物并获得新知。从这个意义

上说，将这个领域的从业者描述为“数据科学家”，就像将黑客描述为“计算机

科学家”一样不准确

注

。

从宏观上看，数据科学是一个不断迭代的过程，涉及提出需求、收集和处理数

据、搭建和评估模型、部署模型。机器学习不一定属于这个过程，但通常是环

节之一。如果涉及机器学习，可以进一步列出以下步骤：

处理数据

为了训练机器学习模型，需要将数据转换为模型能够理解的格式。将数据经

过转换、选择后再输入模型的过程通常被称为特征工程。特征工程可能非常

烦琐，如果你能熟练使用常用工具进行数据处理，可以节省许多精力。

训练模型

在机器学习中，需要利用处理好的数据训练算法。这个步骤需要选择合适的

算法，如果你能从多种算法中选出恰当的算法，会很有帮助。

调优超参数

在模型训练步骤中，需要对模型进行参数调优。大多数机器学习模型中还有

一组被称为超参数的参数，可以在训练之前对其进行修改。这些参数会对最

终模型的性能产生重大影响，需要进行适当的调优。有一些很好的工具可以

实现自动化超参数调优。

部署模型

训练好的模型需要部署。部署模型意味着用户通过任何途径都可以访问该模

注 11 ：我们向来不喜欢将数据科学归类为数学、编程和商业的交叉学科，因为这样无法指明数据科学家 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9787111753384

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Ray 分布式机器学习：利用Ray 进行大模型的数据处理、训练、推理和部署

by Max Pumperla, Edward Oakes, Richard Liaw

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

通过可观测性确保数据与AI的可靠性

数据可观测性的基础知识

人工智能系统性能工程 (Chinese Edition)

Kubernetes 上的生成式人工智能 (Chinese Edition)

Publisher Resources