Skip to Content
LangChain在生命科学与医疗健康领域的应用
book

LangChain在生命科学与医疗健康领域的应用

by Ivan Reznikov
July 2025
Intermediate to advanced
412 pages
6h 20m
Chinese
O'Reilly Media, Inc.
Content preview from LangChain在生命科学与医疗健康领域的应用

第 2 章 大型语言模型介绍 大型语言模型介绍

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com

让我猜猜:如果不是因为 ChatGPT,你不会读到这本书。

OpenAI 于 2022 年推出了这一开创性模型。与以往的模型不同,ChatGPT 可以进行自由形式的对话,并协助完成许多日常任务,从撰写文本和编码片段到创意构思和决策。它庞大的知识库和流畅的语言生成能力,再加上遵循用户指令的能力,让人们看到了生成式人工智能的诱人前景,人工智能似乎能够像人类一样交流和理解。ChatGPT 的问世堪比谷歌搜索、Facebook、iPhone 1 和特斯拉的发布,似乎是凭空出现的,感觉更像是魔法而非技术。

然而,即使 ChatGPT 的表现令人印象深刻,它也有其局限性。它可能前后不一、有失偏颇,有时甚至与事实不符。它的推理能力还没有完全开发出来,经常会根据训练数据中的统计模式产生听起来很有道理的输出结果。可以准确地说,对 ChatGPT 的炒作引发了一场生成式人工智能革命,公司和研究人员竞相开发和展示自己的 LLMs。

注释

在整本书中,如果没有特别提到,在谈到文本生成人工智能时,我们将重点讨论 LLMs。

突如其来的兴趣热潮凸显了 LLM 技术的 变革潜力。虽然像 GPT-3 这样的早期生成式人工智能系统(比 ChatGPT 早两年于 2020 年出现)只展示了前景,但 ChatGPT 让人们不可否认地看到,人类与人工智能合作的新时代已经来临。企业立即急于将生成式人工智能整合到自己的产品和服务中。与此同时,风险资本家们也纷纷向采用生成式人工智能的初创企业投入资金。开发出自己的核心龙8国际娱乐城的公司筹集到的资金更多,投资额从数亿美元到数十亿美元不等。当第一次炒作浪潮平息后,人们对用于训练的数据、反复出现的偏见、错误的答案以及错误信息的普遍传播提出了具体的担忧。

LangChain是一个 的开源框架,它的开发明确是为了应对使用LLMs(如ChatGPT底层的LLMs)构建应用程序的挑战。当哈里森-蔡斯开始研究 LangChain 时,它更像是一个宠物项目,而不是一个正式的商业尝试。他的兴趣是在与使用 LLMs 开发应用程序的朋友交谈时激发的。认识到 LLM 的复杂性和日常挑战,他创建了一个可以简化 LLM 相关应用程序开发流程的框架。该框架名为 LangChain,是一个应对这些挑战的开源平台,很快就获得了广泛关注,吸引了 Anthropic、OpenAI、Cohere 等公司和其他人工智能研究实验室的贡献者。

注释

最初的拉取请求侧重于构建 LangChain 的基础元素,包括 prompt 结构和 LLM 对象及链,如mathpythonsearch

第 3 章将更详细地讨论 LangChain。现在,我们将专注于了解语言模型是如何工作的、存在哪些类型的 LLMs、它们的区别、大小是否重要以及它们是如何生成文本的。

生成式人工智能的前景广阔,发展迅速。如图 2-1 所示,各种生成式人工智能模型可以合成和转换文本、音频和视觉内容。除各种开源项目外,OpenAI、谷歌、微软和其他技术公司还提供多种文本到音频/图像/视频/三维/代码(反之亦然)的模型。文本是图 2-1 所示大多数转换之间的通用连接纽带,因为大多数训练数据都包含文本 <→ 代码、文本 <→ 图像和其他配对。在本书中,我们将使用文本创建助手和团队,以便在代理之间进行交流、生成实验配方、创建报告并完成不同的任务。此外,我们还将添加文本到科学格式,例如生成和可视化分子和 ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

基于scikit-learn和PyTorch的实践机器学习

基于scikit-learn和PyTorch的实践机器学习

Aurélien Géron
GPT-3

GPT-3

Sandra Kublik, Shubham Saboo
超越Vibe编程

超越Vibe编程

Addy Osmani

Publisher Resources

ISBN: 9798341664555