第 9 章. 利用 Azure OpenAI 服务实现生成式 AI 应用程序
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
生成式人工智能 不仅改变了游戏规则,还为每个人提供了小抄。想象一下,一家小面包店使用 Azure OpenAI 在几秒钟内就能制作出个性化的婚礼蛋糕说明,或者一家乡村医院自动生成连超负荷工作的护士都能信任的病人出院摘要。这就是 Azure OpenAI 等服务的真正魔力所在:它们可以让你将 "某一天 "的想法转化为今天的工作流程,而不需要你拥有机器学习方面的博士学位。有了工具箱中的这些模型,你就可以在午餐前开发出客户服务机器人原型,并在晚餐前对其进行完善。
本章将为你提供这场革命的后台通行证。我们将跳过浮华,深入探讨真正重要的东西:为什么精心设计的提示比通用指令更有优势,为什么通过 AI-102 的生成式人工智能部分并不是为了记住 API,而是为了证明你能迅速将想法变为现实。你将获得在会议室和代码审查中都能发挥作用的蓝图。
Microsoft Azure 上的生成式人工智能
在 Microsoft Azure 上,生成式人工智能主要由 Azure OpenAI 服务提供支持,该服务将 OpenAI 的基础模型连接到 Azure,以便您可以在工作负载中使用它们。我们将在本节中探讨这种交互的工作原理。
生成式人工智能模型的类型
Azure OpenAI 服务 提供了多种生成式 AI 模型,每种模型适合不同类型的任务。表 9-1提供了可用模型的概述,并按其功能(优缺点)和用例进行了细分,以帮助您选择最适合您需求的模型。
| 模型 | 优势 | 局限性 | 典型应用 | 成本 | 延迟和吞吐量 |
|---|---|---|---|---|---|
| GPT-4 | 高级推理、多模式输入、强大的代码支持 | 成本最高的层级,吞吐量低于小型模式 | 复杂的聊天机器人、详细的文档生成和代码协助 | 每 100 万个提示令牌 30.00 美元,每 100 万个完成令牌 60.00 美元 | 中等延迟(每 1k 个代币数十到数百毫秒),配额为每分钟 50k 次交易 (TPM) |
| GPT-3.5 | 成本效益高,吞吐量大,针对聊天进行了优化 | 细微推理较少,上下文窗口较小 | 客户支持机器人、文本完成和辅导 | 每 100 万个提示令牌 1.50 美元,每 100 万个完成令牌 2.00 美元 | 较低的延迟(每 1k 标记几十毫秒)和 200k TPM 的配额 |
| 嵌入 | 深度语义理解,成本低 | 无需生成文本,不适合对话 | 语义搜索、推荐和聚类 | 每 100 万个词条 0.40 美元(每 1k 0.0004 美元) | 速度极快(每次调用通常低于 50 毫秒) |
| DALL-E | 从文本生成高保真图像 | 每张图像成本高,推理时间较慢 | 营销视觉效果、产品模型和创意艺术 | 每张 1,024 × 1,024 图像 0.02 美元 | 较慢(每幅图像约 1-3 秒) |
每个模型的典型应用列表说明了每个模型的优势所在。成本一栏显示了基于令牌的模型的输入和输出费率,以及 DALL-E 的每个图像费率。最后,您可以使用延迟和吞吐量数字来指导您对负载下性能的预期。
OpenAI o 系列模型
在撰写本文时,OpenAI o3是 Azure OpenAI 服务中最新、最先进的推理模型。与以前的版本相比,它在理解和生成自然语言和代码方面有了很大改进。由于 OpenAI o3 是为处理更复杂的任务而设计的,因此它的响应具有更高的准确性和相关性,适用于各种复杂的 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access