濮阳杆衣贸易有限公司

主頁 > 知識庫 > Hadoop 2.x與3.x 22點比較,Hadoop 3.x比2.x的改進

Hadoop 2.x與3.x 22點比較,Hadoop 3.x比2.x的改進

熱門標簽:地圖標注w是什么方向 河南省鄭州市地圖標注 昆明外呼系統(tǒng) 400電話申請找哪家公司 新鄉(xiāng)人工智能電話機器人加盟 福州呼叫中心外呼系統(tǒng)哪家好 地圖標注需要提交啥資料入駐 臨汾電銷機器人費用 七大洲地圖標注

問題導讀
1.Hadoop3.x通過什么方式來容錯?
2.Hadoop3.x存儲開銷減少了多少?
3.Hadoop3.x MR API是否兼容hadoop1.x?

一、目的

在這篇文章中,我們將討論Hadoop 2.x與Hadoop 3.x之間的比較。 Hadoop3版本中添加了哪些新功能,Hadoop3中兼容的Hadoop 2程序,Hadoop 2和Hadoop 3有什么區(qū)別?

二、Hadoop 2.x與Hadoop 3.x比較

本節(jié)將講述Hadoop 2.x與Hadoop 3.x之間的22個差異。 現(xiàn)在讓我們逐一討論

2.1License

Hadoop 2.x - Apache 2.0,開源
Hadoop 3.x - Apache 2.0,開源

2.2支持的最低Java版本

Hadoop 2.x - java的最低支持版本是java 7
Hadoop 3.x - java的最低支持版本是java 8

2.3容錯

Hadoop 2.x - 可以通過復制(浪費空間)來處理容錯。
Hadoop 3.x - 可以通過Erasure編碼處理容錯。

2.4數(shù)據(jù)平衡

Hadoop 2.x - 對于數(shù)據(jù)平衡使用HDFS平衡器。
Hadoop 3.x - 對于數(shù)據(jù)平衡使用Intra-data節(jié)點平衡器,該平衡器通過HDFS磁盤平衡器CLI調(diào)用。

2.5存儲Scheme

Hadoop 2.x - 使用3X副本Scheme
Hadoop 3.x - 支持HDFS中的擦除編碼。

2.6存儲開銷

Hadoop 2.x - HDFS在存儲空間中有200%的開銷。
Hadoop 3.x - 存儲開銷僅為50%。

2.7存儲開銷示例

Hadoop 2.x - 如果有6個塊,那么由于副本方案(Scheme),將有18個塊占用空間。
Hadoop 3.x - 如果有6個塊,那么空間9個塊,中6塊空間,3塊用于奇偶校驗。

2.8YARN時間線服務

Hadoop 2.x - 使用具有可伸縮性問題的舊時間軸服務。
Hadoop 3.x - 改進時間線服務v2并提高時間線服務的可擴展性和可靠性。

2.9默認端口范圍

Hadoop 2.x - 在Hadoop 2.0中,一些默認端口是Linux臨時端口范圍。所以在啟動時,他們將無法綁定。
Hadoop 3.x - 但是在Hadoop 3.0中,這些端口已經(jīng)移出了短暫的范圍。

2.10工具

Hadoop 2.x - 使用Hive,pig,Tez,Hama,Giraph和其他Hadoop工具。
Hadoop 3.x - 可以使用Hive,pig,Tez,Hama,Giraph和其他Hadoop工具。

2.11兼容的文件系統(tǒng)

Hadoop 2.x - HDFS(默認FS),F(xiàn)TP文件系統(tǒng):它將所有數(shù)據(jù)存儲在可遠程訪問的FTP服務器上。 Amazon S3(簡單存儲服務)文件系統(tǒng)Windows Azure存儲Blob(WASB)文件系統(tǒng)。
Hadoop 3.x - 它支持所有前面以及Microsoft Azure Data Lake文件系統(tǒng)。

2.12Datanode資源

Hadoop 2.x - Datanode資源不專用于MapReduce,我們可以將它用于其他應用程序。
Hadoop 3.x - 此處數(shù)據(jù)節(jié)點資源也可用于其他應用程序。

2.13MR API兼容性

Hadoop 2.x - 與Hadoop 1.x程序兼容的MR API,可在Hadoop 2.X上執(zhí)行
Hadoop 3.x - 此處,MR API與運行Hadoop 1.x程序兼容,以便在Hadoop 3.X上執(zhí)行

2.14支持Microsoft Windows

Hadoop 2.x - 它可以部署在Windows上。
Hadoop 3.x - 它也支持Windows。

2.15插槽/容器

Hadoop 2.x - Hadoop 1適用于插槽的概念,但Hadoop 2.X適用于容器的概念。通過容器,我們可以運行通用任務。
Hadoop 3.x - 它也適用于容器的概念。

2.16單點故障

Hadoop 2.x - 具有SPOF的功能,因此只要Namenode失敗,它就會自動恢復。
Hadoop 3.x - 具有SPOF的功能,因此只要Namenode失敗,它就會自動恢復,無需人工干預就可以克服它。

2.17HDFS聯(lián)盟

Hadoop 2.x - 在Hadoop 1.0中,只有一個NameNode來管理所有Namespace,但在Hadoop 2.0中,多個NameNode用于多個Namespace。
Hadoop 3.x - Hadoop 3.x還有多個名稱空間用于多個名稱空間。

2.18可擴展性

Hadoop 2.x - 我們可以擴展到每個群集10,000個節(jié)點。
Hadoop 3.x - 更好的可擴展性。 我們可以為每個群集擴展超過10,000個節(jié)點。

2.19更快地訪問數(shù)據(jù)

Hadoop 2.x - 由于數(shù)據(jù)節(jié)點緩存,我們可以快速訪問數(shù)據(jù)。
Hadoop 3.x - 這里也通過Datanode緩存我們可以快速訪問數(shù)據(jù)。

2.20HDFS快照

Hadoop 2.x - Hadoop 2增加了對快照的支持。 它為用戶錯誤提供災難恢復和保護。
Hadoop 3.x - Hadoop 2也支持快照功能。

2.21平臺

Hadoop 2.x - 可以作為各種數(shù)據(jù)分析的平臺,可以運行事件處理,流媒體和實時操作。
Hadoop 3.x - 這里也可以在YARN的頂部運行事件處理,流媒體和實時操作。

2.22群集資源管理

Hadoop 2.x - 對于群集資源管理,它使用YARN。 它提高了可擴展性,高可用性,多租戶。
Hadoop 3.x - 對于集群,資源管理使用具有所有功能的YARN。

hadoop3.X比hadoop2.x的改進

Common主要改進:
    Shell script rewrite
     過時API刪除

HDFS改進:
    支持erasure編碼
    支持超過兩個namenode
    數(shù)據(jù)均衡
    多個服務端口發(fā)生變化

Yarn改進:
 YARN Timeline Service v.2
 Support for Opportunistic Containers and Distributed Scheduling

MapRduece改進:
    MapReduce task-level native optimization
    Reworked daemon and task heap management

其他新特性:
 Shared client jars

三、結(jié)論

正如我們已經(jīng)討論了Hadoop 2.x與Hadoop 3.x之間的22個重要差異和3.x的改進,現(xiàn)在我們可以看到Hadoop 2和Hadoop 3哪個更好。

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。如果你想了解更多相關內(nèi)容請查看下面相關鏈接

標簽:烏海 岳陽 紅河 股票 四川 臨沂 鎮(zhèn)江

巨人網(wǎng)絡通訊聲明:本文標題《Hadoop 2.x與3.x 22點比較,Hadoop 3.x比2.x的改進》,本文關鍵詞  Hadoop,2.x,與,3.x,22點,比較,;如發(fā)現(xiàn)本文內(nèi)容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《Hadoop 2.x與3.x 22點比較,Hadoop 3.x比2.x的改進》相關的同類信息!
  • 本頁收集關于Hadoop 2.x與3.x 22點比較,Hadoop 3.x比2.x的改進的相關信息資訊供網(wǎng)民參考!
  • 推薦文章
    峨眉山市| 灵宝市| 军事| 德化县| 桃江县| 石景山区| 包头市| 库伦旗| 新津县| 留坝县| 察隅县| 雷波县| 丽水市| 泰州市| 巍山| 当雄县| 永春县| 平南县| 崇礼县| 吉安市| 盐津县| 奇台县| 安泽县| 桂林市| 聂荣县| 双流县| 固镇县| 防城港市| 白城市| 丰台区| 嘉荫县| 灌南县| 肇东市| 措勤县| 远安县| 余干县| 安龙县| 淄博市| 乐安县| 漯河市| 常德市|