book

AWS 上的生成式人工智能

Name: AWS 上的生成式人工智能
ISBN: 9798341656710

by Chris Fregly, Antje Barth, Shelbee Eigenbrode

May 2025

Intermediate to advanced

312 pages

4h 10m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

序言
本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢克里斯安特Shelbee
1.生成式人工智能用例、基础知识和项目生命周期
用例和任务基础模型和模型枢纽生成式人工智能项目生命周期AWS 上的生成式人工智能为什么要在 AWS 上进行生成式人工智能？在 AWS 上构建生成式人工智能应用程序摘要
2.提示工程和情境学习
提示和填写代币prompt 工程提示结构教学背景用少量推理进行情境学习零点推理一次性推理少量推理走入误区的情境学习情境学习最佳实践prompt 工程最佳实践推理配置参数摘要
3.大语言基础模式
大语言基础模式代币化器嵌入向量变压器结构输入和上下文窗口嵌入层编码器自我关注解码器软最大输出基于变压器的地基模型类型预训练数据集缩放定律计算优化模型摘要
4.内存和计算优化
记忆挑战数据类型和数值精度量化fp16bfloat16fp8int8优化自我关注层FlashAttention分组查询关注分布式计算分布式数据并行完全分片数据并行FSDP 与 DDP 的性能比较AWS 上的分布式计算使用亚马逊 SageMaker 实现完全分片数据并行处理AWS Neuron SDK 和 AWS Trainium摘要
5.微调和评估
指令微调拉玛 2 猫猎鹰聊天FLAN-T5指令数据集多任务指令数据集FLAN：多任务指令数据集示例提示模板将自定义数据集转换为指令数据集指令微调亚马逊 SageMaker Studio亚马逊 SageMaker JumpStart亚马逊 SageMaker 猜脸器评估评估指标基准和数据集摘要
6.参数高效微调
全面微调与 PEFTLoRA 和 QLoRALoRA 基础知识等级目标模块和层应用 LoRA将 LoRA 适配器与原始模型合并维护独立的 LoRA 适配器全微调与 LoRA 性能对比QLoRA提示调整和软提示摘要
7.通过人的反馈强化学习进行微调
人类排列：乐于助人、诚实、无害强化学习概述训练自定义奖励模型通过 "人在回路 "收集训练数据集人体标签样本说明使用亚马逊 SageMaker 地面实况进行人类注释准备排名数据以训练奖励模型培训奖励模式现有奖励模型：Meta 毒性检测器通过人的反馈强化学习进行微调在 RLHF 中使用奖励模型近端策略优化 RL 算法使用 PPO 进行 RLHF 微调减少悬赏黑客行为利用 RLHF 进行参数高效微调评估 RLHF 微调模型定性评估定量评估负荷评估模型定义评价指标聚合函数前后评估指标对比摘要
8.模型部署优化
模型优化推理修剪使用 GPTQ 进行训练后量化蒸馏大型模型推理容器AWS Inferentia：推理专用硬件模型更新和部署战略A/B 测试影子部署指标和监测自动缩放自动扩展策略定义自动扩展策略摘要
9.使用 RAG 和代理的情境感知推理应用
大语言模型的局限性幻觉知识截止日期检索-增强生成外部知识来源RAG 工作流程文件加载分块文件检索和重新排名prompt AugmentationRAG 协调与实施文件加载和分块嵌入式矢量存储和检索检索链以最大边际相关性重新排名代理商React 框架程序辅助语言框架生成式人工智能应用FMOps：操作生成式人工智能项目生命周期实验注意事项发展考虑因素生产部署注意事项摘要

10.多模式基础模型
使用案例多模式提示工程最佳实践图像生成和增强图像生成图像编辑和增强内画、外画、图像深度油画外绘图像深度图像字幕和视觉问题解答图像字幕内容管理可视化问题解答模型评估文本到图像的生成任务前向扩散非语言推理扩散架构基础前向扩散反向扩散U-Net 稳定扩散 2 结构文本编码器U-Net 和扩散过程文本调节交叉关注调度员图像解码器稳定扩散 XL 架构U-Net 和交叉关注炼油厂调节摘要
11.利用稳定扩散进行受控生成和微调
控制网微调梦之窗梦之窗和 PEFT-LoRA文本反转从人类反馈中强化学习与人类的一致性摘要
12.亚马逊 Bedrock：生成式人工智能托管服务
基岩地基模型亚马逊泰坦基金会模型稳定人工智能的稳定扩散基础模型基岩推理应用程序接口大型语言模型生成 SQL 代码总结文本嵌入微调代理商多模式模型从文本创建图像从图像创建图像数据隐私和网络安全管理与监督摘要
索引
关于作者

Content preview from AWS 上的生成式人工智能

第 12 章亚马逊基岩：生成式人工智能托管服务

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

在本书中，你可以看到 Amazon SageMaker JumpStart 的示例，用于使用 SageMaker 基础架构微调和部署基础模型。另一方面，Amazon Bedrock 是一种托管服务，通过简单的 API 提供完全无服务器的体验。

在本章中，您将探索 Amazon Bedrock，包括如何访问 Bedrock API、可用的基础模型 (FM)，以及 Bedrock 数据隐私和网络安全。您将了解如何使用 Bedrock 实现检索增强生成、语义搜索和基于代理的用例。您还将了解如何使用自己的自定义数据集对 Bedrock 基础模型进行私人微调。

首先，让我们讨论一下 Amazon Bedrock 中可用的基础模型，以及如何在这些基础模型的基础上进行构建。

基岩地基模型

Amazon Bedrock 支持来自亚马逊和多家第三方公司（包括 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 等）的基础模型。

您可以通过 AWS 管理控制台、AWS CLI 或 AWS SDK 访问这些基础模型。本章中的代码示例将使用名为 boto3 的 AWS Python SDK。您可以使用 Bedrock Python 函数list_founda⁠tio⁠nal_models() 查看可用模型的最新列表。

使用 Amazon Bedrock 非常简单，只需为您的使用案例选择一个基础模型，然后调用几个 API 即可。您可以使用 Bedrock 模型游乐场尝试可用的基础模型，并选择适合您的使用案例和数据集的模型。

请记住，在评估不同模型时，您应该首先尝试第 2章和第 10 章中讨论的各种 prompt 工程技术，包括带有少量推理的上下文学习。您还可以调整推理配置参数，包括temperature 、top_p 和top_k ，这在第 2 章中已经学过。

亚马逊泰坦基金会模型

Amazon Titan 基础模型是在大型数据集上预训练的通用模型，您可以按原样使用，也可以针对特定任务使用自己的数据对模型进行微调，从而对其进行自定义。

Titan Text 是大型语言模型，用于文本摘要、文本生成、分类、问答和信息提取等任务。它们还可以在不同的编程语言以及富文本格式（RTF）（包括表格、JSON 和 CSV）上进行训练。

泰坦文本嵌入模型将文本输入（如单词、短语或可能的大文本单元）转化为数字表示，即嵌入向量。正如你在第 1 章中所学到的，嵌入向量在高维向量空间中捕捉文本的语义。

在将文档转换为嵌入式后，您可以将嵌入式存储在一个能执行嵌入式级任务（如相似性搜索）的矢量存储中。通过相似性搜索，您可以编写一个查询，将其转换为嵌入式，然后在向量存储中搜索与查询文本相匹配的文档。与传统的单词或n-gram 匹配搜索算法相比，比较嵌入通常能生成更相关、更有用的上下文搜索结果。

稳定人工智能的稳定扩散基础模型

使用 Amazon Bedrock，您可以访问 Stability AI 的文本到图像和图像到图像基础模型 Stable Diffusion，如第 11 章所述。Stable Diffusion 只需在文本提示中输入几个字，就能生成独特、逼真的高质量图像、艺术品、徽标和设计。

接下来，您将探索模型推理 API，并开始使用 Amazon Bedrock 中的基础模型生成内容。 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341656710

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business