展會(huì)信息港展會(huì)大全

在Hadoop中保護(hù)大數(shù)據(jù)安全的9個(gè)技巧
來源:互聯(lián)網(wǎng)   發(fā)布日期:2012-11-13 08:52:36   瀏覽:9306次  

導(dǎo)讀:當(dāng)企業(yè)轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng)的機(jī)器時(shí),其潛力是巨大的:企業(yè)所擁有的數(shù)據(jù)可能成為獲得競(jìng)爭優(yōu)勢(shì)的關(guān)鍵。因此,企業(yè)的數(shù)據(jù)和基礎(chǔ)設(shè)施的安全也變得比以往任何時(shí)候都重要。 在許多情況下,企業(yè)或組織都可能得到Forrester所說的有毒的數(shù)據(jù)。例如,一家無線公司正在收集...

當(dāng)企業(yè)轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng)的機(jī)器時(shí),其潛力是巨大的:企業(yè)所擁有的數(shù)據(jù)可能成為獲得競(jìng)爭優(yōu)勢(shì)的關(guān)鍵。因此,企業(yè)的數(shù)據(jù)和基礎(chǔ)設(shè)施的安全也變得比以往任何時(shí)候都重要。

在許多情況下,企業(yè)或組織都可能得到Forrester所說的“有毒的數(shù)據(jù)”。例如,一家無線公司正在收集誰登錄哪一個(gè)天線塔、他們?cè)诰逗留多長時(shí)間、他們使用多少數(shù)據(jù)、他們是在移動(dòng)還是處于靜止?fàn)顟B(tài)等數(shù)據(jù),這些數(shù)據(jù)可用來了解用戶行為的狀況。

這家無線公司也許有許多用戶生成的數(shù)據(jù):信用卡號(hào)碼、社會(huì)保險(xiǎn)號(hào)碼、購買習(xí)慣數(shù)據(jù)和用戶使用任何信息的方式等。關(guān)聯(lián)這種數(shù)據(jù)和從這些數(shù)據(jù)中提取推斷結(jié)果的能力是有價(jià)值的,但是,這種做法也是有害的,如果這種關(guān)聯(lián)的數(shù)據(jù)泄露到機(jī)構(gòu)外部并且落入他人手中,這將給個(gè)人和機(jī)構(gòu)造成災(zāi)難性的損失。

應(yīng)用大數(shù)據(jù),不要忘記法規(guī)遵從和控制。下面是保證大數(shù)據(jù)安全的9個(gè)技巧。

1. 在啟動(dòng)大數(shù)據(jù)項(xiàng)目之前要考慮安全問題。不應(yīng)該等到發(fā)生數(shù)據(jù)突破事件之后再采取保證數(shù)據(jù)安全的措施。組織的IT安全團(tuán)隊(duì)和參加大數(shù)據(jù)項(xiàng)目的其他人員在向分布式計(jì)算(Hadoop)集群安裝和發(fā)送大數(shù)據(jù)之前應(yīng)該認(rèn)真地討論安全問題。

2. 考慮要存儲(chǔ)什么數(shù)據(jù)。在計(jì)劃使用Hadoop存儲(chǔ)和運(yùn)行要提交給監(jiān)管部門的數(shù)據(jù)時(shí),可能需要遵守具體的安全要求。即使所存儲(chǔ)的數(shù)據(jù)不受監(jiān)管部門的管轄,也要評(píng)估風(fēng)險(xiǎn),如果個(gè)人身份信息等數(shù)據(jù)丟失,造成的風(fēng)險(xiǎn)將包括信譽(yù)損失和收入損失。

3. 責(zé)任集中,F(xiàn)在,企業(yè)的數(shù)據(jù)可能存在于多個(gè)機(jī)構(gòu)的豎井之中和數(shù)據(jù)集中。集中的數(shù)據(jù)安全的責(zé)任可保證在所有這些豎井中強(qiáng)制執(zhí)行一致的政策和訪問控制。

4. 加密靜態(tài)和動(dòng)態(tài)數(shù)據(jù)。在文件層增加透明的數(shù)據(jù)加密。SSL(安全套接層)加密能夠在數(shù)據(jù)在節(jié)點(diǎn)和應(yīng)用程序之間移動(dòng)時(shí)保護(hù)大數(shù)據(jù)。安全研究與顧問公司Securosis的首席技術(shù)官和分析師阿德里安·萊恩(Adrian Lane)稱,文件加密解決了繞過正常的應(yīng)用安全控制的兩種攻擊方式。在惡意用戶或者管理員獲得數(shù)據(jù)節(jié)點(diǎn)的訪問權(quán)限和直接檢查文件的權(quán)限以及可能竊取文件或者不可讀的磁盤鏡像的情況下,加密可以起到保護(hù)作用。這是解決一些數(shù)據(jù)安全威脅的節(jié)省成本的途徑。

5. 把密鑰與加密的數(shù)據(jù)分開。把加密數(shù)據(jù)的密鑰存儲(chǔ)在加密數(shù)據(jù)所在的同一臺(tái)服務(wù)器中等于是鎖上大門,然后把鑰匙懸掛在鎖頭上。密鑰管理系統(tǒng)允許組織安全地存儲(chǔ)加密密鑰,把密鑰與要保護(hù)的數(shù)據(jù)隔離開。

6. 使用Kerberos網(wǎng)絡(luò)身份識(shí)別協(xié)議。企業(yè)需要能夠管理什么人和流程可以訪問存儲(chǔ)在Hadoop中的數(shù)據(jù)。這是避免流氓節(jié)點(diǎn)和應(yīng)用進(jìn)入集群的一種有效的方法。萊恩說,這能夠幫助保護(hù)網(wǎng)絡(luò)控制接入,使管理功能很難被攻破。我們知道,設(shè)置Kerberos比較困難,驗(yàn)證或重新驗(yàn)證新的節(jié)點(diǎn)和應(yīng)用可以發(fā)揮作用。但是,沒有建立雙向的信任,欺騙Hadoop允許惡意應(yīng)用進(jìn)入這個(gè)集群、或者接受引進(jìn)的惡意節(jié)點(diǎn)是很容易的。這個(gè)惡意節(jié)點(diǎn)以后可以增加、修改或者提取數(shù)據(jù)。Kerberos協(xié)議是可以控制的最有效的安全控制措施。Kerberos建在Hadoop基礎(chǔ)設(shè)施中,因此,請(qǐng)使用它。

7. 使用安全自動(dòng)化。企業(yè)是在處理一個(gè)多節(jié)點(diǎn)環(huán)境,因此,部署的一致性是很難保證的。Chef和Puppet等自動(dòng)化工具能夠幫助企業(yè)更好地使用補(bǔ)丁、配置應(yīng)用程序、更新Hadoop棧、收集可信賴的機(jī)器鏡像、證書和平臺(tái)的不一致性等信息。事先建立這些腳本需要一些時(shí)間,但是,以后會(huì)得到減少管理時(shí)間的回報(bào),并且額外地保證每一個(gè)節(jié)點(diǎn)都有基本的安全。

8. 向Hadoop集群增加記錄。大數(shù)據(jù)很自然地適合收集和管理記錄數(shù)據(jù)。許多網(wǎng)站公司開始使用大數(shù)據(jù)專門管理記錄文件。為什么不向現(xiàn)有的集群增加記錄呢?這會(huì)讓企業(yè)觀察到什么時(shí)候出現(xiàn)的故障或者是否有人以為企業(yè)已經(jīng)被黑客攻破了。沒有一個(gè)事件跟蹤記錄,你就是一個(gè)瞎子。記錄MR請(qǐng)求和其它集群活動(dòng)是很容易的并且可以稍微提高存儲(chǔ)和處理需求。但是,當(dāng)有需要的時(shí)候,這些數(shù)據(jù)是不可或缺的。

9. 節(jié)點(diǎn)之間以及節(jié)點(diǎn)與應(yīng)用之間采用安全通信。要做到這一點(diǎn),需要部署一個(gè)SSL/TLS(安全套接層/傳輸層安全)協(xié)議保護(hù)企業(yè)的全部網(wǎng)絡(luò)通信,而不是僅僅保護(hù)一個(gè)子網(wǎng)。就像許多云服務(wù)提供商一樣,Cloudera等Hadoop提供商已經(jīng)在做這件事。如果設(shè)置上沒有這種能力,就需要把這些服務(wù)集成到應(yīng)用棧中。


贊助本站

相關(guān)熱詞: Hadoop 大數(shù)據(jù)

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港