Skip to Content
大規模言語モデルのセキュリティに関する開発者のプレイブック
book

大規模言語モデルのセキュリティに関する開発者のプレイブック

by Steve Wilson
March 2025
Intermediate to advanced
200 pages
2h 47m
Japanese
O'Reilly Media, Inc.
Audio summary available
Content preview from 大規模言語モデルのセキュリティに関する開発者のプレイブック

第5章. LLMは知りすぎることがあるのか?

この作品はAIを使って翻訳されている。ご意見、ご感想をお待ちしている:translation-feedback@oreilly.com

2023年、機密データ流出の可能性を懸念し、ChatGPTのようなLLMサービスの利用を禁止または大幅に制限する企業が相次いだ。サムスン、JPモルガン・チェース、アマゾン、バンク・オブ・アメリカ、シティグループ、ドイツ銀行、ウェルズ・ファーゴ、ゴールドマン・サックスなどだ。このような巨大経理企業やハイテク企業の行動は、LLMが機密情報を開示することへの大きな懸念を示している。LLMアプリケーションの開発者として、あなたは気にする必要があるだろうか?

第1章のTayの話では、Microsoftのチャットボットがハッカーに攻撃された。テイが公開可能な機密データにあまりアクセスできなかったため、被害は限定的だった。しかし、LLMと実世界のデータとの積集合は、意図しない情報開示の可能性をはらんでいる可能性がある。従業員がうっかりChatGPTにビジネス上の機密データを与えてしまい、それがシステムの学習ベースに統合され、他の人がそれを発見できるようになったケースに見られるように。

この章では、LLMがデータにアクセスする様々な方法について掘り下げていく。つの主な知識獲得メソッドと、LLMがこのようなアクセスを持つことに関連するリスクを検証する。その過程で、「LLMは知りすぎることがあるのか」という問いに答え、アプリケーションが機密、私的、または極秘データを開示することに関連するリスクを軽減する方法について議論する。

実例

現実の世界で見られた影響の例を2つ見てみよう。まずはチャットボットの例から。Tayとやや似ているが、チャットボットがアクセスできるデータとその公開方法によって、被害がはるかに大きくなった。次に、所有者が法的リスクと風評リスクを高めたコパイロットの例を見てみよう。

イ・ルーダ

第1章でも少し触れた、ソウルを拠点とする新興企業Scatter Labは、個人データの無責任な取り扱いにより、深刻な法的影響と風評被害に直面した。同社は「Science of Love(恋愛の科学)」という人気アプリを演算子として運営しており、ユーザがテキストメッセージを分析することで、恋愛相手との相性を分析することを支援していた。このサービスでは、60万人のユーザから94億件の会話が蓄積された。同社はその後、"人が人よりも会話の相手として好むAIチャットボット"、Lee Ludaを発表した。リー・ルーダは、サイエンス・オブ・ラブの膨大なデータセットを、適切なサニタイズ処理を施すことなく、トレーニングベースとして使用した。Lee Ludaは、Tayに見られたような有害な振る舞いを見せただけでなく、さらに問題なのは、ユーザの名前、プライベートなニックネーム、自宅の住所などの機密データを漏洩し始めたことだ。

韓国の個人情報保護委員会は、ユーザーの適切な許可を得なかったとして、Scatter Lab社に1億330万ウォン(約93万米ドル)の罰金を科した。

このインシデントによる影響は大きかった。さまざまな側面を見てみよう:

機密データの公開

機密データの暴露はユーザのプライバシーを脅かし、名前、場所、交際ステータス、医療情報などの個人情報を暴露した。

罰金

スキャッター・ラボは、ユーザデータの責任ある管理を怠ったとして、多額の罰金を科せられた。

風評被害

このインシデントにより、Scatter ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

タイニーエムエル

タイニーエムエル

Pete Warden, Daniel Situnayake
DevSecOpsを学ぶ

DevSecOpsを学ぶ

Steve Suehring
効果的なマシンラーニングチーム

効果的なマシンラーニングチーム

David Tan, Ada Leung, David Colls
生成AIデザインパターン

生成AIデザインパターン

Valliappa Lakshmanan, Hannes Hapke

Publisher Resources

ISBN: 9798341633582