第11章 网络安全
在本书的学习过程中,我们构建了这样一个事实,即为了实现人工智能,我们需要访问大量的数据。数据在为智能机器构建功能方面发挥着核心作用,这些智能机器补充和增强了人类的能力。人们开发的基于机器学习体系结构和算法的应用程序,其好坏取决于底层数据质量。随着人们对数据的依赖增加,数据开始作为任务关键型系统的一种资产,如医疗设备、航空、银行系统等。维护数据资产的完整性是至关重要的优先事项,也是成功地广泛采用AI系统的关键因素。保护维生管线免受数据泄露的工作通常就被称为网络安全(Cyber Security)。
本章将介绍如何利用各种数据治理框架来保护关键数据资产,并通过对大数据管理和机器学习框架的理解来确保最重要的资产(数据)的安全。
本章主要介绍以下内容:如何利用大数据来保护维生管线;流处理的一般概念;安全信息和事件管理;Web服务器访问日志文件的结构和策略,并在网络安全中利用它;Splunk作为实现网络安全的企业级应用;ArcSight ESM作为一个企业安全管理平台。
11.1 大数据用于维生管线保护
维生管线(Critical Infrastructure,CI)是企业和政府机构用来定义资产和工作模型的术语,这些资产和工作模型需要在最佳级别运行,以便直接为受益于这些系统或间接受这些系统影响的利益相关者提供无缝的舒适体验。例如,电网、供水、交通、执法以及许多需要全天候无缝工作的系统。在过去的几十年里,大多数CI已经数字化,并从不同的数据源生成越来越多的数据。这些额外的数据资产促进了系统的不断进步并消除了人工干预的需要,从而减少了错误。
这些系统生成的数据被当作用来描述状况和预测分析的资产,可以用来安排预防性维护并防止故障。利用数据驱动的方法来实现其核心功能,CI在效率和总体可靠性方面有了巨大的改进。然而,仍然有恶意破坏CI的攻击者成功地侵入了CI并造成破坏的重大事件发生。 ...
Get 人工智能技术与大数据 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.