TOP
0
0
母親節暖心加碼,點我領取「限時加碼券」
人民幣定價:62 元
定價
:NT$ 372 元
優惠價
87324
領券後再享88折起
海外經銷商無庫存,到貨日平均30天至45天
可得紅利積點:9 點
相關商品
商品簡介
目次

商品簡介

本書全面介紹了Hadoop生態系統中各個開源組件的理論知識和實踐案例。全書分為上篇――Hadoop基礎篇、中篇――Hadoop提高篇、下篇――案例篇三部分,共11章,涉及數據採集、數據存儲與管理、數據處理與分析、數據可視化一系列大數據應用生命週期中各階段典型組件的理論知識、安裝部署和實戰使用。上篇為第1~8章,具體內容包括大數據概述、初識Hadoop、分布式文件系統HDFS、分布式計算框架MapReduce、統一資源管理和調度框架YARN、分布式協調框架ZooKeeper、分布式數據庫HBase、數據倉庫Hive;中篇為第9、10章,具體內容包括大數據遷移和採集工具、數據可視化;下篇為第11章,介紹了使用Hadoop平臺完成用戶畫像項目的全過程。本書在Hadoop、HDFS、MapReduce、ZooKeeper、HBase、Hive等重要章節安排了初級實踐操作,以便讀者更好地學習和掌握Hadoop關鍵技術。
本書內容翔實,案例豐富,既可作為高等院校大數據、計算機、人工智能等相關專業研究生、本科生的大數據課程教材,也可供相關技術人員參考。
本書配套有《Hadoop大數據原理與應用實驗教程》,同時可在西安電子科技大學出版社網站下載本書作者提供的相關資源。

目次

上篇 Hadoop基礎篇
第1章 大數據概述 2
1.1 大數據內涵 3
1.2 大數據的特徵 5
1.3 大數據的關鍵技術 6
1.4 大數據產業 8
1.5 大數據與物聯網、雲計算、人工智能、5G的關係 11
1.6 大數據崗位介紹 12
1.7 大數據學習路線 13
本章小結 14
思考與練習題 15
第2章 初識Hadoop 16
2.1 Hadoop概述 17
2.2 Hadoop生態系統 20
2.3 Hadoop的體系架構 23
2.4 Hadoop的應用現狀 23
2.5 部署和運行Hadoop 25
本章小結 50
思考與練習題 50
實驗1 部署全分佈模式Hadoop集群 51
第3章 分布式文件系統HDFS 52
3.1 HDFS簡介 53
3.2 HDFS的體系架構 53
3.3 HDFS文件的存儲機制 55
3.4 HDFS數據的讀/寫過程 57
3.5 實戰HDFS 60
3.6 HDFS的高可靠性機制 75
本章小結 89
思考與練習題 89
實驗2 實戰HDFS 90
第4章 分布式計算框架MapReduce 91
4.1 MapReduce簡介 92
4.2 第一個MapReduce案例:WordCount 92
4.3 MapReduce的作業執行流程 97
4.4 MapReduce的數據類型與格式 101
4.5 Shuffle的機制 104
4.6 在MapReduce中自定義組件 105
4.7 實戰MapReduce 109
4.8 MapReduce調優 116
4.9 其他主流計算框架 118
本章小結 119
思考與練習題 120
實驗3 MapReduce編程 120
第5章 統一資源管理和調度框架YARN 122
5.1 初識YARN 123
5.2 YARN的體系架構 126
5.3 YARN的工作流程 127
5.4 實戰YARN 129
5.5 YARN的新特性 134
5.6 其他統一資源管理調度框架 141
本章小結 150
思考與練習題 151
第6章 分布式協調框架ZooKeeper 152
6.1 分布式協調技術 153
6.2 初識ZooKeeper 154
6.3 ZooKeeper的系統模型 156
6.4 ZooKeeper的工作原理 163
6.5 ZooKeeper的典型應用場景 172
6.6 部署ZooKeeper集群 176
6.7 實戰ZooKeeper 183
本章小結 218
思考與練習題 219
實驗4 部署ZooKeeper集群和實戰ZooKeeper 220
第7章 分布式數據庫HBase 221
7.1 NoSQL簡介 222
7.2 初識HBase 224
7.3 HBase的數據模型 224
7.4 HBase的體系架構 229
7.5 HBase的運行機制 233
7.6 部署HBase集群 235
7.7 實戰HBase 241
7.8 HBase的性能優化 264
本章小結 265
思考與練習題 266
實驗5 部署全分佈模式HBase集群和實戰HBase 267
第8章 數據倉庫Hive 268
8.1 初識Hive 269
8.2 Hive的體系架構 271
8.3 Hive的數據類型 273
8.4 Hive的文件格式 275
8.5 Hive的數據模型 275
8.6 Hive函數 278
8.7 部署Hive 285
8.8 實戰Hive 299
8.9 Hive的優化策略 307
本章小結 308
思考與練習題 309
實驗6 部署本地模式Hive和實戰Hive 309
中篇 Hadoop提高篇
第9章 大數據遷移和採集工具 312
9.1 數據遷移工具Sqoop 313
9.2 日誌採集工具Flume 344
9.3 分布式流平臺Kafka 357
9.4 ETL工具Kettle 371
本章小結 377
思考與練習題 378
第10章 數據可視化 379
10.1 可視化概念 380
10.2 可視化的作用與意義 381
10.3 可視化圖表的類型 386
10.4 可視化工具 391
本章小結 419
思考與練習題 419
下篇 案 例 篇
第11章 華為P30手機評論畫像分析 422
11.1 需求分析 423
11.2 項目設計 423
11.3 項目環境搭建 423
11.4 數據採集與預處理 424
11.5 使用Hive分析數據 430
11.6 數據可視化 437
本章小結 443
思考與練習題 443

參考文獻 444

您曾經瀏覽過的商品

購物須知

大陸出版品因裝訂品質及貨運條件與台灣出版品落差甚大,除封面破損、內頁脫落等較嚴重的狀態,其餘商品將正常出貨。

特別提醒:部分書籍附贈之內容(如音頻mp3或影片dvd等)已無實體光碟提供,需以QR CODE 連結至當地網站註冊“並通過驗證程序”,方可下載使用。

無現貨庫存之簡體書,將向海外調貨:
海外有庫存之書籍,等候約45個工作天;
海外無庫存之書籍,平均作業時間約60個工作天,然不保證確定可調到貨,尚請見諒。

為了保護您的權益,「三民網路書店」提供會員七日商品鑑賞期(收到商品為起始日)。

若要辦理退貨,請在商品鑑賞期內寄回,且商品必須是全新狀態與完整包裝(商品、附件、發票、隨貨贈品等)否則恕不接受退貨。

優惠價:87 324
海外經銷商無庫存,到貨日平均30天至45天

暢銷榜

客服中心

收藏

會員專區