hadoop權(quán)威指南第四版中文版電子書
pdf版本- 軟件大小:8.56 MB
- 軟件語言:中文
- 軟件類型:國產(chǎn)軟件 / 程序開發(fā)
- 軟件授權(quán): 免費軟件
- 更新時間:2017-10-30 15:49:30
- 軟件等級:
- 軟件廠商: -
- 應用平臺:WinXP, Win7, Win8, Win10
- 軟件官網(wǎng): 暫無
相關(guān)軟件
微信公眾平臺應用開發(fā)實戰(zhàn)完整版pdf掃描版
61.80 MB/中文/10.0
hadoop權(quán)威指南第三版中文pdf電子書
111.80 MB/中文/0.0
hadoop權(quán)威指南第5版電子書完整掃描版
0 Bytes/中文/7.0
信號與系統(tǒng)第三版pdf電子版
8.37 MB/中文/1.0
NLC電子圖書格式閱讀器v1.0 綠色免費版
378.00 KB/中文/10.0
軟件介紹人氣軟件精品推薦相關(guān)文章網(wǎng)友評論下載地址
hadoop權(quán)威指南第4版是一款針對于Hadoop發(fā)展現(xiàn)狀和應用進行詳細的分析講解,由淺入深全方位介紹了Hadoop,并通過海量數(shù)據(jù)分析儲存,更加清晰了解集群安裝運維,高性能的分析平臺和海量數(shù)據(jù)處理。歡迎來IT貓撲下載使用。
hadoop權(quán)威指南第四版中文版pdf介紹
Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。
用戶可以在不了解分布式底層細節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力進行高速運算和存儲。
Hadoop實現(xiàn)了一個分布式文件系統(tǒng)(Hadoop Distributed File System),簡稱HDFS。HDFS有高容錯性的特點,并且設(shè)計用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)來訪問應用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(large data set)的應用程序。HDFS放寬了(relax)POSIX的要求,可以以流的形式訪問(streaming access)文件系統(tǒng)中的數(shù)據(jù)。
hadoop權(quán)威指南第四版作者簡介
Tom White,數(shù)學王子&Hadoop專家。身為Apache Hadoop提交者八年之久,Apache軟件基金會成員之一。全球知名云計算公司Cloudera的軟件工程師。Tom擁有英國劍橋大學數(shù)學學士學位和利茲大學科學哲學碩士學位。
hadoop權(quán)威指南第四版電子書第三章免費部分閱讀
第3章 Hadoop分布式文件系統(tǒng)
當數(shù)據(jù)集的大小超過一臺獨立的物理計算機的存儲能力時,就有必要對它進行分區(qū)(partition)并存儲到若干臺單獨的計算機上。管理網(wǎng)絡(luò)中跨多臺計算機存儲的文件系統(tǒng)稱為分布式文件系統(tǒng)(distributed filesystem)。該系統(tǒng)架構(gòu)于網(wǎng)絡(luò)之上,勢必會引入網(wǎng)絡(luò)編程的復雜性,因此分布式文件系統(tǒng)比普通磁盤文件系統(tǒng)更為復雜。例如,使文件系統(tǒng)能夠容忍節(jié)點故障且不丟失任何數(shù)據(jù),就是一個極大的挑戰(zhàn)。
Hadoop自帶一個稱為HDFS的分布式文件系統(tǒng),即HadoopDistributed Filesystem。在非正式文檔或舊文檔以及配置文件中,有時也簡稱為DFS,它們是一回事兒。HDFS是Hadoop的旗艦級文件系統(tǒng),也是本章的重點,但實際上Hadoop是一個綜合性的文件系統(tǒng)抽象,因此接下來我們將了解將Hadoop與其他存儲系統(tǒng)集成的途徑,例如本地文件系統(tǒng)和Amazon S3系統(tǒng)。
3.1 HDFS的設(shè)計
HDFS以流式數(shù)據(jù)訪問模式來存儲超大文件,運行于商用硬件集群上。①讓我們仔細看看下面的描述。
* 超大文件 “超大文件”在這里指具有幾百MB、幾百GB甚至幾百TB大小的文件。目前已經(jīng)有存儲PB級數(shù)據(jù)的Hadoop 集群了。②
* 流式數(shù)據(jù)訪問 HDFS的構(gòu)建思路是這樣的:一次寫入、多次讀取是最高效的訪問模式。數(shù)據(jù)集通常由數(shù)據(jù)源生成或從數(shù)據(jù)源復制而來,接著長時間在此數(shù)據(jù)集上進行各種分析。每次分析都將涉及該數(shù)據(jù)集的大部分數(shù)據(jù)甚至全部,因此讀取整個數(shù)據(jù)集的時間延遲比讀取第一條記錄的時間延遲更重要。
* 商用硬件 Hadoop并不需要運行在昂貴且高可靠的硬件上。它是設(shè)計運行在商用硬件(在各種零售店都能買到的普通硬件③)的集群上的,因此至少對于龐大的集群來說,節(jié)點故障的幾率還是非常高的。HDFS遇到上述故障時,被設(shè)計成能夠繼續(xù)運行且不讓用戶察覺到明顯的中斷。
同樣,那些不適合在HDFS上運行的應用也值得研究。目前HDFS對某些應用領(lǐng)域并不適合,不過以后可能會有所改進。
IT貓撲小編推薦
準備好釋放數(shù)據(jù)的強大潛能了嗎?借助于這本本書,你將學習如何使用ApacheHadoop構(gòu)建和維護穩(wěn)定性高、伸縮性強的分布式系統(tǒng)。本書是為程序員寫的,可幫助他們分析任何大小的數(shù)據(jù)集。本書同時也是為管理員寫的,幫助他們了解如何設(shè)置和運行Hadoop集群。
hadoop權(quán)威指南第四版中文版pdf未出,暫提供英文原版閱讀。
更多>> 軟件截圖
推薦應用
其他版本下載
精品推薦
相關(guān)文章
下載地址
hadoop權(quán)威指南第四版中文版電子書 pdf版本
查看所有評論>> 網(wǎng)友評論
更多>> 猜你喜歡