大數(shù)據(jù)的核心是云技術(shù)和BI。關(guān)于大數(shù)據(jù)和云計算的關(guān)系人們通常會有誤解,而且也會把它們混起來說,分別做一句話直白解釋就是:云計算就是硬件資源的虛擬化;大數(shù)據(jù)就是海量數(shù)據(jù)的高效處理。如果做一個更形象的解釋,云計算相當(dāng)于我們的計算機(jī)和操作系統(tǒng),將大量的硬件資源虛擬化之后再進(jìn)行分配使用;大數(shù)據(jù)則相當(dāng)于海量數(shù)據(jù)的“數(shù)據(jù)庫”。
整體來看,未來的趨勢是,云計算作為計算資源的底層,支撐著上層的大數(shù)據(jù)處理,而大數(shù)據(jù)的發(fā)展趨勢是,實(shí)時交互式的查詢效率和分析能力,當(dāng)前的大數(shù)據(jù)處理一直在向著近似于傳統(tǒng)數(shù)據(jù)庫體驗(yàn)的方向發(fā)展。
大數(shù)據(jù)的4V特性,即類型復(fù)雜,海量,快速和價值,其總體架構(gòu)包括三層,數(shù)據(jù)存儲,數(shù)據(jù)處理和數(shù)據(jù)分析,三層的相互配合,讓大數(shù)據(jù)最終產(chǎn)生價值。

數(shù)據(jù)存儲層,從存儲層的搭建來說,關(guān)系型數(shù)據(jù)庫,NoSQL數(shù)據(jù)庫和hdfs分布式文件系統(tǒng)三種存儲方式都需要。從用戶來講并不關(guān)心底層存儲細(xì)節(jié),只關(guān)心數(shù)據(jù)的存儲和讀取的方便性,通過共享數(shù)據(jù)存儲層可以實(shí)現(xiàn)在存儲上的應(yīng)用和存儲基礎(chǔ)設(shè)置的徹底解耦。
數(shù)據(jù)處理層核心解決問題在于數(shù)據(jù)存儲出現(xiàn)分布式后帶來的數(shù)據(jù)處理上的復(fù)雜度,海量存儲后帶來了數(shù)據(jù)處理上的時效性要求,這些都是數(shù)據(jù)處理層要解決的問題。
數(shù)據(jù)分析層重點(diǎn)是真正挖掘大數(shù)據(jù)的價值所在,而價值的挖掘核心又在于數(shù)據(jù)分析和挖掘。那么數(shù)據(jù)分析層核心仍然在于傳統(tǒng)的BI分析的內(nèi)容。包括數(shù)據(jù)的維度分析,數(shù)據(jù)的切片,數(shù)據(jù)的上鉆和下鉆,cube等。
由此可以看來大數(shù)據(jù)兩大核心為云技術(shù)和BI,離開云技術(shù)大數(shù)據(jù)沒有根基和落地可能,離開BI和價值,大數(shù)據(jù)又變化為舍本逐末,丟棄關(guān)鍵目標(biāo)。簡單來說,就是大數(shù)據(jù)目標(biāo)驅(qū)動是BI,大數(shù)據(jù)實(shí)施落地式云技術(shù)。
如果你想了解學(xué)習(xí)更多關(guān)于大數(shù)據(jù)的相關(guān)技術(shù),那么不妨選擇千鋒大數(shù)據(jù)培訓(xùn)進(jìn)行系統(tǒng)專業(yè)的學(xué)習(xí)。

京公網(wǎng)安備 11010802030320號