
2
|
前言
举个例子,我们的一位客户是一家家电制造商,他们通过分析产品评论掌握了影响
客户购买产品的关键信息,并根据这些信息调整了营销策略。再举一个例子,一家
电子商务零售商使用深度神经网络对客户咨询进行了分类,并将他们分配给正确的
部门,以更快地为客户解决问题。分析科学期刊的文摘能够帮助研发公司发现新材
料的趋势,并相应地调整研究方向。时装公司通过分析社交网络中的帖子来发现客
户群的大型话题。我们希望通过本书将我们从这些项目(以及其他项目)中积累的
经验转化成一个个案例,供各位读者参考。
本书的主要内容
本书主要面向数据科学家与开发人员,帮助他们快速入门文本分析与自然语言处理。
本书的重点在于开发实践解决方案,希望能够帮助你解决日常业务的需求。对于案
例,我们的定义是常见问题的最佳实践解决方案。这些案例都是模板,可供你复制
和重复使用。在各个案例中,我们使用了数据分析、自然语言处理和机器学习方面
的
Python
框架。除此之外,我们还介绍了基础模型和算法。
我们不要求任何有关自然语言处理领域的前提知识,本书会介绍必要的背景知识,
帮助你快速入门。在每章中,我们会针对具体任务介绍和讨论多个不同的解决方案
及其潜在的优势和劣势。因此,你不仅可以了解如何解决某个问题,而且还可以获
得一整套现成的解决方案,你可以在此基础之上,根据自己的数据和需求进行定制。
本书共
13
章,每一章都提供了一个文本分析特定方面的案例(见表
1
)。我们会根
据示例数据集,逐步开发和解释案例。
表 1:章节概述
章节
数据集
库
第
1
章
,
洞悉文本数据