您当前所在位置:主页 > 新闻中心 > 行业动态 >
新闻中心 / News
联系智融 / CONTACT US

技术经理:13871093995

邮箱:gongch@zronggsoft.com

QQ: 点击这里给我发消息 点击这里给我发消息
行业动态

大数据安全问题及应对思路

发布时间:2016-05-30 17:47
  随着高新产业技术的不断发展,大数据越发成为我国社会与经济发展的重要因素,国家层面已将大数据的发展上升到战略高度,推出“双创”以及“互联网+”等思路与举措,而放眼世界,如美国等科技强国也早就开始布局和发展。随着互联网络的发展,大数据将会更具开放性,这也为大数据的私密数据泄露和敏感信息窃取等信息安全提出了更大的挑战。因此,确保数据信息安全性对于在在大数据背景下推动各个政府部门、教育科研机构、企业单位和金融机构等诸多领域的安全发展来说具有非常重要的现实意义。
  一、大数据实现流程
  1.1、数据源获取
  大数据原始数据获取的途径主要有数据库的直接调用、数据库的整体导出、自动爬虫技术等方式,而同时相关的数据来源非常广泛,可包括网络中的各类信息。在科技水平较高的互联网企业中,往往也都会基于数据获取技术来开发自有的数据抓取工具,例如脸书的抄写员系统,采用的即是日志分布式搜集、统一处理的高效方式。
  1.2、原始数据处理
  原始数据处理一般有四个阶段,分别是数据清理阶段、集成和变换阶段、规约阶段和概念分层阶段。在数据清理阶段,首先需要利用遗漏值处理、噪音数据处理等技术清理掉大量无效、重复的数据;接下来利在数据的集成和变换阶段,用多个原数据中的数据结合、存放到同一个数据存储区;最后在规约阶段和概念分层阶段完成原始数据的整体处理。而通过对原始数据的处理,可以有效地统一各类标准,再加上规约管理,可大大提升后续的数据利用效率。
  1.3、分布式计算
  大数据计算需要极其强大的计算能力,而利用服务器的大量集群是快速提升计算能力的一种方式。在服务器集群中,每一台服务器都可视为计算能力的细小单位,在计算任务下达时,可以高效地集成为统一的个体,通过整合,可以迅速提升整体的计算能力,轻松完成高强度的计算任务。目前,谷歌和亚马逊等互联网企业均有自己的分布式计算中心,均拥有大量服务器。
  1.4、大数据挖掘分析
  大数据的核心要义,就是在于将大量无效、混乱的数据筛选提取成为有价值的数据。在对数据进行分析的时候,主要有图形化加工、变量计算法、趋势分析能力和 客户语境预判等。例如央视发布的各类居民感知大数据调查报告、金融领域的趋势分析和百度语义引擎等都是大数据挖掘的最直观的应用。
  二、大数据面临的安全问题及应对思路
  在大数据时代,每个人都是数据的贡献者。根据中投顾问《2016-2020年中国智能家居投资分析及前景预测报告》的分析,预计到2020年,一个中国普通家庭一年产生的数据相当于半个国家图书馆的信息储量。通过对相关数据的归并整理,我们可以筛选出大量有商用价值的数据,而这些数据也是未来互联网企业发展的新型引擎。海量的数据不仅带来了巨大的商用价值,同时也必然会成为众多黑客所觊觎的目标,从而带来更多的安全问题。
  2.1、大数据遭受异常流量攻击
  大数据所存储的数据非常巨大,往往采用分布式的方式进行存储,而正是由于这种存储方式,存储的路径视图相对清晰,而数据量过大,导致数据保护,相对简单,黑客较为轻易利用相关漏洞,实施不法操作,造成安全问题。由于大数据环境下终端用户非常多,且受众类型较多,对客户身份的认证环节需要耗费大量处理能力。因此,大数据为高级持续性威胁(APT:AdvancedPersistent Threat)攻击提供了良好的隐藏环境。众多互联网平台均遭受过APT攻击,造成网络受阻,计算机系统瘫痪。例如2013年3月,韩国部分电视台和银行同时遭受攻击,共受到1500多次的非法入侵,受破坏的计算机达48700台,成为近年来最严重的APT攻击事件。
  由于APT攻击具有很强的针对性,且攻击时间长,一旦攻击成功,大数据分析平台输出的最终数据均会被获取,容易造成的较大的信息安全隐患。
  2.2、大数据平台的信息泄露风险
  在对大数据进行数据采集和信息挖掘的时候,要注重用户隐私数据的安全问题,在不泄露用户隐私数据的前提下进行数据挖掘。需要考虑的是在分布计算的信息传输和数据交换时保证各个存储点内的用户隐私数据不被非法泄露和使用是当前大数据背景下信息安全的主要问题。同时,当前的大数据数据量并不是固定的,而是在应用过程中动态增加的,但是,传统的数据隐私保护技术大多是针对静态数据的,所以,如何有效地应对大数据动态数据属性和表现形式的数据隐私保护也是要注重的安全问题。最后,大数据的数据远比传统数据复杂,现有的敏感数据的隐私保护是否能够满足大数据复杂的数据信息也是应该考虑的安全问题。
  2.3、大数据的存储管理风险
  大数据的数据类型和数据结构是传统数据不能比拟的,在大数据的存储平台上,数据量是非线性甚至是指数级的速度增长的,各种类型和各种结构的数据进行数据存储,势必会引发多种应用进程的并发且频繁无序的运行,极易造成数据存储错位和数据管理混乱,为大数据存储和后期的处理带来安全隐患。当前的数据存储管理系统,能否满足大数据背景下的海量数据的数据存储需求,还有待考验。不过,如果数据管理系统没有相应的安全机制升级,出现问题后则为时已晚。
  三、信息安全风险应对思路
  基于大数据平台的业务需求,以及大数据平台面临的安全问题,很难通过一次安全建设将大数据平台面临的所有风险解决;同时,安全风险也是动态发展变化的,因此,应对思路也需要随着大数据平台的安全需求变化不断完善和发展。从大数据平台的构成角度来看,信息安全的保密性、完整性、可用性,以及根据网络层次划分的从物理层安全到应用层安全,仍然是需要解决的问题。
  在应对大数据平台信息安全问题时,需要整体考虑,通盘规划,需要基于业务需求,采用多层面全方位的解决方案来应对。安全域的划分可更好的对不同重要等级的区域进行适当防护,大数据平台的基础网络架构也不例外,其防护策略主要分为安全域边界和安全域内部的防护。
  首先,可以从大数据平台基础支撑网络构架的不同来进行整体安全域的划分,主要分为互联网接人区、核心汇聚区、业务接人区和运维管理区等。
  3.1、大数据分析平台互联网接入区信息安全防护思路
  (1)实施最严格的访问控制策略
  制定访问控制策略的意义是从网络访问源头开始区分安全访问区,可以根据平台内不同设备的重要性制定分门别类的安全策略。防火墙和交换机上的ACL均可实现访问控制的功能,通过在访问源头制定安全策略,校验人方向的数据包并检查具体操作方式等,来确认数据包转发的合法性。
  (2)实施最细粒度的异常流量分析
  随着技术的不断发展,恶意攻击的技术代价也越来越小,这也导致网络上充斥着大量的异常流量。因此,针对所有流量的检测意义非常重大。可以加强在大数据平台网络出口进行异常流量分析或检测能力的建设,以期达到分析数据、研判趋势的目的。同时,通过对异常流量进行及时的告警和定位,还可使相关管理人员能够准确的发现异常流量进入网络的端口和攻击目标,以便做出反应,将异常流量对信息安全的影响减少到最低或消除。
  3.2、大数据分析平台核心汇聚区信息安全防护思路
  (1)建立动态攻击防护手段
  大数据平台完全面向互联网,所面临的威胁会被无限放大。入侵检测与防护技术的引入,除了可以对攻击行为进行阻断,还可以通过报文的分析发现潜在风险,并可触发智能保护措施。但需要注意的是,因为大数据平台数据量大的特点,入侵检测与防护技术的关键点在于从海量的告警数据中进行过滤、梳理与提取。此外,信息安全防护层面,可以利用killer数据包,切断特定的敏感信息传输,从而在第一时间阻止敏感信息的泄露。
  (2)应用有效的Web防护技术
  Web应用防护技术在事前可通过扫描的方式,主动检查大数据平台中所有Web形态的资产,并把结果形成新的防护规则增加到事中的防护策略中,而事后的防篡改则可以保证即使系统有疏漏,也可以让攻击的步伐止于此,不能进一步修改和损坏文件,对于大数据信息安全而言至关重要。除此之外,Web应用防护技术还可以检测SSL加密流量中混杂的攻击,并提供白名单模型,在确保Web应用安全的前提下,增加日常运维的便利性。
  3.3、大数据分析平台业务接入区信息安全防护思路
  (1)建设病毒防护能力
  病毒防范系统是业务接入网架构中不可或缺的一部分。大数据平台进行统一的病毒防范管理,一般采用安装防病毒客户端的形式,这就要求防病毒软件能实现对大数据平台的自有设备进行集中设置和安装,并可分发防病毒代码和引擎,实现集中的病毒代码和引擎的升级。病毒防护一般可设定多重预约扫描,对特定磁盘、目录和文件做安全扫描,对Java Applet、ActiveX恶意代码、病毒、木马和BO程序等都能够准确检测和拦截,保证大数据平台网络没有病毒“后门”。此外,多种报警模式和集中统一的事件日志纪录,还可以对病毒事件及时进行通知。
  (2)进行审计操作
  针对大数据平台的数据库交互,需对不同数据库的SQL语义进行分析,提取出SQL中相关的要素(用户、SQL操作、表、字段、视图、索引、过程和函数 等),实时监控来自各个层面数据库的活动,包括来自应用系统发起的数据库操作请求和来自数据库客户端工具的操作请求,以及通过远程登录服务器后的操作请求等通过远程命令行执行的SQL命令,并对违规的操作进行阻断系统不仅对数据库操作请求进行实时审计,还可对数据库返回结果进行完整的还原和审计,同时可以 根据返回结果设置审计规则。
  3.4、大数据分析平台运维管理区信息安全防护思路
  (1)账号统一管理
  大数据平台网络规模庞大,网络设备数量繁多,因此,账号的管理给信息安全带来了较大的潜在风险,例如,多个用户混用同一个账号,或一个用户使用多个账号等粗放式的权限管理,这给准确定位安全事件带来了一定的困难。而集中账号管理可以有效地解决上述问题,通过最小权限原则的账号集中管理,可以保障专属岗位的人做专属职责的事。
  (2)动态漏洞评估
  大数据平台因资产众多,难免的会存在一些漏洞,对这些漏洞的动态评估也是安全运维的重要能力。漏洞评估工作的要点在于“三分技术七分管理”,发现漏洞后的漏洞影响分析与处置非常关键,而且需要将漏洞评估工作定性为常态化工作,介入资产的全生命周期,形成高效的漏洞闭环处置机制。
  四、结语
  大数据在现代社会经济生活中扮演了越来越重要的角色,但信息安全问题也随之而来。各行各业的大数据从业人员都需要从当前数据安全面临的挑战出发,不断完善管理制度,积极研发探索能够发挥大数据优势的安全技术,加强数据保护关键技术的攻关,提升对数据跨境流动的管控能力。

上一篇:信息安全认证 都有哪些

下一篇:大数据安全技术与应用和基本特征

 
 
点击这里给我发消息

经理电话:13871093995

-->

报价申请
加密软件价格申请
技术咨询
加密软件技术咨询
关注我们

智融科技