第 12 章 亚马逊基岩:生成式人工智能托管服务
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
在本书中,你可以看到 Amazon SageMaker JumpStart 的示例,用于使用 SageMaker 基础架构微调和部署基础模型。另一方面,Amazon Bedrock 是一种托管服务,通过简单的 API 提供完全无服务器的体验。
在本章中,您将探索 Amazon Bedrock,包括如何访问 Bedrock API、可用的基础模型 (FM),以及 Bedrock 数据隐私和网络安全。您将了解如何使用 Bedrock 实现检索增强生成、语义搜索和基于代理的用例。您还将了解如何使用自己的自定义数据集对 Bedrock 基础模型进行私人微调。
首先,让我们讨论一下 Amazon Bedrock 中可用的基础模型,以及如何在这些基础模型的基础上进行构建。
基岩地基模型
Amazon Bedrock 支持来自亚马逊和多家第三方公司(包括 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 等)的基础模型。
您可以通过 AWS 管理控制台、AWS CLI 或 AWS SDK 访问这些 基础模型。本章中的代码示例将使用名为 boto3 的 AWS Python SDK。您可以使用 Bedrock Python 函数list_foundational_models() 查看可用模型的最新列表。
使用 Amazon Bedrock 非常简单,只需为您的使用案例选择一个基础模型,然后调用几个 API 即可。您可以使用 Bedrock 模型游乐场尝试可用的基础模型,并选择适合您的使用案例和数据集的模型。
请记住,在评估不同模型时,您应该首先尝试第 2章和第 10 章中讨论的各种 prompt 工程技术,包括带有少量推理的上下文学习。您还可以调整推理配置参数,包括temperature 、top_p 和top_k ,这在第 2 章中已经学过。
亚马逊泰坦基金会模型
Amazon Titan 基础模型 是在大型数据集上预训练的通用模型,您可以按原样使用,也可以针对特定任务使用自己的数据对模型进行微调,从而对其进行自定义。
Titan Text 是大型语言模型 ,用于文本摘要、文本生成、分类、问答和信息提取等任务。它们还可以在不同的编程语言以及富文本格式(RTF)(包括表格、JSON 和 CSV)上进行训练。
泰坦文本嵌入模型 将文本输入(如单词、短语或可能的大文本单元)转化为数字表示,即嵌入向量。正如你在第 1 章中所学到的,嵌入向量在高维向量空间中捕捉文本的语义。
在将文档 转换为嵌入式后,您可以将嵌入式存储在一个能执行嵌入式级任务(如相似性搜索)的矢量存储中。通过相似性搜索,您可以编写一个查询,将其转换为嵌入式,然后在向量存储中搜索与查询文本相匹配的文档。与传统的单词或n-gram 匹配搜索算法相比,比较嵌入通常能生成更相关、更有用的上下文搜索结果。
稳定人工智能的稳定扩散基础模型
使用 Amazon Bedrock,您可以访问 Stability AI 的文本到图像和图像到图像基础模型 Stable Diffusion,如第 11 章所述。Stable Diffusion 只需在文本提示中输入几个字,就能生成独特、逼真的高质量图像、艺术品、徽标和设计。
接下来,您将探索模型推理 API,并开始使用 Amazon Bedrock 中的基础模型生成内容。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access