不知不觉大数据进入我们的生活已经很久,越来越多的人开始接受从IT到DT的转变。在大数据开发成井喷式增加的同时,一个重要的问题也随之而来:如何保证数据安全?这是一个巨大的挑战,本文将以“数据之家”数据管理平台为例,为大家介绍大数据时代如何保障数据安全。
我们将安全策略的展开分为了四个层级:物理层,数据层,代码层以及用户层,在每一层级通过不同的方式加强数据安全性。
物理层
数据的存取和传输,整个网络的连接根本上来说是基于物理层的。物理层安全的重要性不言而喻。物理层是网络构建的基础,但不幸的是,物理层也是所有组成网络设施的元素中最容易被忽视的。普遍存在的观点是,物理层只是一条传输的“通路”,只要“路”通了,考虑其管理问题完全是多余和奢侈。
数据之家充分考虑到了物理层数据安全的重要性,平台各数据中心具有先进的安保设施和完善的管理体系,从物理方面保证数据安全。为防止意外或灾难性事故导致断电后数据丢失,
数据之家为所有服务器配置UPS不间断电源,自备发电机,保证电力可以持续供应。此外,专业人员会定期检查物理架构,保证出错率达到最低。
数据层
大数据应用依托的基础即是数据,作为一个专业的数据管理平台,数据之家的数据存储采用了分布式存储技术,用户数据创建多个副本在全国多点存放,定时更新,保证数据的高可用性和可靠性。服务器使用防火墙和其他先进技术来阻止网络入侵者的干扰或访问。
此外,数据之家采用了国际标准的DDI元数据规范,用超过100种可检索的字段去定义一个课题。通过元数据,即数据的数据,万一某些数据出现问题,可以迅速排查并解决。
代码层
代码层代表的是数据的管理技术。我们的软件系统使用了成熟的EJB框架,从代码级别防止未经许可的非法访问,并借助EJB的事务管理,对数据库操作进行全程跟踪,保证多线程并发时数据的完备性。即使遇到处理异常,也可以自动回滚事务,保证数据安全。
EJB是什么呢?EJB是sun的JavaEE服务器端组件模型,设计目标与核心应用是部署分布式应用程序。简单来说就是把已经编写好的程序(即:类)打包放在服务器上执行。
或者更简化一些,EJB 是一种技术规范,从技术上而言不是一种"产品",而是一种描述了构建应用组件要解决的标准:
可扩展 (Scalable)
分布式 (Distributed)
事务处理(Transactional)
数据存储(Persistent)
安全性 (Secure)
用户层
用户层是最贴近用户的一个层级,为保证用户的使用体验,数据之家采用了一定的保护机制。
1 身份信息验证和保护机制
用户每次登录时,必须输入用户名和密码,数据之家仅发送 "cookie"会话,用来记录特定会话过程中的加密身份验证信息。数据之家不使用 "cookie"存储其他机密的用户和会话信息,并采用多重
加密技术对用户登录密码进行加密处理,加密过程不可逆,以此保证用户的账户安全。
2 权限控制和访问控制系统
用户创建的数据集以及上传的数据文件,都可以进行权限控制,只有在创建者授权的前提下,其他访客才有权查看或下载相关资料。用户还可以对一个或多个用户指定不同的身份:管理员、编辑者、成员、贡献者,十分灵活地设立个性化权限和访问级别。
3 日志记录及安全审计功能
成员在数据集中所做的任意操作都有清晰的日志记录,各项变动有迹可循。
正在寻求高效、可扩展灾难恢复计划的公司应当关注云计算存储技术。毋容置疑,越来越多的数据将会在云端存储,而且越来越多的企业也都意识到云存储的重要性。IT人员需要确保无论发生什么都能够对数据进行恢复。
云端存储
根据最近的一份调查显示,80%的IT人员都正在或准备使用云存储。其它研究也都表明,企业中云的重要性正在逐渐增加。当需要进行灾难恢复时,60%的IT专家表示只用一天时间就可以将应用程序和数据全部从云端恢复到本地。
尽管云采用率逐渐增加,调查发现55%的受访者仅将10TB的数据上传到云端。25%的IT人员说他们有超过50TB的数据。似乎公司还有其他的备份方式,三分之一的公司还在使用离线磁带备份技术,与之相比只有十分之一的IT技术人员选择了云备份。
改善
出于不同目的,每个组织都需要进行备份和灾难恢复。根据发现,云存储在IT部门的受欢迎程度逐渐增加。事实上是因为对数据恢复的重视程度正在逐渐加强。相应的,灾难恢复即服务(DRaaS)变得越来越流行,它允许公司定期将在现场外服务器进行备份。IT部门看到了DRaaS的潜力,越来越多的数据将涌向云端。
提升可用性
各企业,尤其是中小企业,现在越来越喜欢用云来进行存储和灾难恢复。随着时间的推进会有更多的企业使用云来加固自己的数据。供应商也会提供更多在DRaaS领域的解决方案。云存储成为灾难恢复预案中一部分之后,IT专家们有理由相信无论企业遭遇任何灾难都有办法进行恢复。