8章ソーシャルメディア

今の時代、英語を話す必要はありません。

ソーシャルメディアがあるからです。

—— Vir Das

ソーシャルメディアのプラットフォーム(Twitter、Facebook、Instagram、WhatsAppなど)は、個人、グループ、コミュニティ、企業、政府機関、メディアなどとのコミュニケーション方法に革命をもたらしました。これにより、営業、マーケティング、広報、カスタマーサポートなど、企業や政府機関の常識やエチケット、日常業務が変化してきました。ソーシャルメディアでは、日々膨大な量と種類のデータが生成されます。そのため、現在ではソーシャルメディア上のコミュニケーションを理解するための、知的なシステムの構築を目指す研究が数多く行われています。コミュニケーションの大部分はテキストで行われるため、NLPは知的なシステムを構築する上で、基本的な役割を担っています。本章では、ソーシャルメディアのデータ分析にNLPがどのように役立つのか、またそのようなシステムをどのように構築するのかを中心に説明します。

これらのプラットフォームで生成されるデータ量[1][2][3]をイメージするために、次の数字を見てみましょう。

Twitterの月間アクティブユーザー数は1億5,200万人、Facebookは25億人
速度
6,000ツイート/秒、57,000投稿/秒(Facebook)
多様性
トピック、言語、文体、文字体系

図8-1は、さまざまなプラットフォームで1分間にどれだけのデータが生成されているかを示しています[4]

図8-1 さまざまなソーシャルプラットフォームで1分間に生成されるデータ(2019年)

このような数字を見ると、ソーシャルプラットフォームは自然言語データの最大の発生源であることは間違いないでしょう。あまりにもデータ量が多いため、データのほんの一部であっても手作業では分析できません。多くのコンテンツはテキストなので、唯一の解決方法はNLPベースの知的なシステムを設計し、データを分析して洞察を引き出すことです。これが本章の焦点です。本章では、トピック検出、 ...

Get 実践 自然言語処理 ―実世界NLPアプリケーション開発のベストプラクティス now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.