hadoop權(quán)威指南第4版下載 最新更新|軟件分類|軟件專題|手機版|論壇轉(zhuǎn)貼|軟件發(fā)布

您當前所在位置: 首頁教程下載程序開發(fā) → hadoop權(quán)威指南第四版中文版電子書 pdf版本

hadoop權(quán)威指南第四版中文版電子書

pdf版本

hadoop權(quán)威指南第四版中文版電子書下載
  • 軟件大小:8.56 MB
  • 軟件語言:中文
  • 軟件類型:國產(chǎn)軟件 / 程序開發(fā)
  • 軟件授權(quán): 免費軟件
  • 更新時間:2017-10-30 15:49:30
  • 軟件等級:4星
  • 軟件廠商: -
  • 應用平臺:WinXP, Win7, Win8, Win10
  • 軟件官網(wǎng):

ITMOP本地下載文件大?。?.56 MB

點贊 好評 0%(0) 差評 差評 0%(0)

軟件介紹人氣軟件精品推薦相關(guān)文章網(wǎng)友評論下載地址

小編為您推薦: hadoop權(quán)威指南 hadoop 電子圖書

hadoop權(quán)威指南第4版是一款針對于Hadoop發(fā)展現(xiàn)狀和應用進行詳細的分析講解,由淺入深全方位介紹了Hadoop,并通過海量數(shù)據(jù)分析儲存,更加清晰了解集群安裝運維,高性能的分析平臺和海量數(shù)據(jù)處理。歡迎來IT貓撲下載使用。

hadoop權(quán)威指南第四版中文版pdf介紹

Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。

用戶可以在不了解分布式底層細節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力進行高速運算和存儲。

Hadoop實現(xiàn)了一個分布式文件系統(tǒng)(Hadoop Distributed File System),簡稱HDFS。HDFS有高容錯性的特點,并且設(shè)計用來部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)來訪問應用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(large data set)的應用程序。HDFS放寬了(relax)POSIX的要求,可以以流的形式訪問(streaming access)文件系統(tǒng)中的數(shù)據(jù)。

hadoop權(quán)威指南第4版

hadoop權(quán)威指南第四版作者簡介

Tom White,數(shù)學王子&Hadoop專家。身為Apache Hadoop提交者八年之久,Apache軟件基金會成員之一。全球知名云計算公司Cloudera的軟件工程師。Tom擁有英國劍橋大學數(shù)學學士學位和利茲大學科學哲學碩士學位。

hadoop權(quán)威指南第四版電子書第三章免費部分閱讀

第3章 Hadoop分布式文件系統(tǒng)

當數(shù)據(jù)集的大小超過一臺獨立的物理計算機的存儲能力時,就有必要對它進行分區(qū)(partition)并存儲到若干臺單獨的計算機上。管理網(wǎng)絡(luò)中跨多臺計算機存儲的文件系統(tǒng)稱為分布式文件系統(tǒng)(distributed filesystem)。該系統(tǒng)架構(gòu)于網(wǎng)絡(luò)之上,勢必會引入網(wǎng)絡(luò)編程的復雜性,因此分布式文件系統(tǒng)比普通磁盤文件系統(tǒng)更為復雜。例如,使文件系統(tǒng)能夠容忍節(jié)點故障且不丟失任何數(shù)據(jù),就是一個極大的挑戰(zhàn)。

Hadoop自帶一個稱為HDFS的分布式文件系統(tǒng),即HadoopDistributed Filesystem。在非正式文檔或舊文檔以及配置文件中,有時也簡稱為DFS,它們是一回事兒。HDFS是Hadoop的旗艦級文件系統(tǒng),也是本章的重點,但實際上Hadoop是一個綜合性的文件系統(tǒng)抽象,因此接下來我們將了解將Hadoop與其他存儲系統(tǒng)集成的途徑,例如本地文件系統(tǒng)和Amazon S3系統(tǒng)。

3.1 HDFS的設(shè)計

HDFS以流式數(shù)據(jù)訪問模式來存儲超大文件,運行于商用硬件集群上。①讓我們仔細看看下面的描述。

* 超大文件 “超大文件”在這里指具有幾百MB、幾百GB甚至幾百TB大小的文件。目前已經(jīng)有存儲PB級數(shù)據(jù)的Hadoop 集群了。②

* 流式數(shù)據(jù)訪問 HDFS的構(gòu)建思路是這樣的:一次寫入、多次讀取是最高效的訪問模式。數(shù)據(jù)集通常由數(shù)據(jù)源生成或從數(shù)據(jù)源復制而來,接著長時間在此數(shù)據(jù)集上進行各種分析。每次分析都將涉及該數(shù)據(jù)集的大部分數(shù)據(jù)甚至全部,因此讀取整個數(shù)據(jù)集的時間延遲比讀取第一條記錄的時間延遲更重要。

* 商用硬件 Hadoop并不需要運行在昂貴且高可靠的硬件上。它是設(shè)計運行在商用硬件(在各種零售店都能買到的普通硬件③)的集群上的,因此至少對于龐大的集群來說,節(jié)點故障的幾率還是非常高的。HDFS遇到上述故障時,被設(shè)計成能夠繼續(xù)運行且不讓用戶察覺到明顯的中斷。

同樣,那些不適合在HDFS上運行的應用也值得研究。目前HDFS對某些應用領(lǐng)域并不適合,不過以后可能會有所改進。

IT貓撲小編推薦

準備好釋放數(shù)據(jù)的強大潛能了嗎?借助于這本本書,你將學習如何使用ApacheHadoop構(gòu)建和維護穩(wěn)定性高、伸縮性強的分布式系統(tǒng)。本書是為程序員寫的,可幫助他們分析任何大小的數(shù)據(jù)集。本書同時也是為管理員寫的,幫助他們了解如何設(shè)置和運行Hadoop集群。

hadoop權(quán)威指南第四版中文版pdf未出,暫提供英文原版閱讀。

更多>> 軟件截圖

推薦應用

    其他版本下載

      精品推薦

      相關(guān)文章

      下載地址

      • hadoop權(quán)威指南第四版中文版電子書 pdf版本

      查看所有評論>> 網(wǎng)友評論

      發(fā)表評論

      (您的評論需要經(jīng)過審核才能顯示) 網(wǎng)友粉絲QQ群號:374962675

      查看所有 0條 評論>>

      更多>> 猜你喜歡