基于Greenplum Hadoop分布式平臺(tái)的大數(shù)據(jù)解決方案及商業(yè)應(yīng)用案例剖析
聞喜網(wǎng)站建設(shè)公司創(chuàng)新互聯(lián),聞喜網(wǎng)站設(shè)計(jì)制作,有大型網(wǎng)站制作公司豐富經(jīng)驗(yàn)。已為聞喜上1000家提供企業(yè)網(wǎng)站建設(shè)服務(wù)。企業(yè)網(wǎng)站搭建\外貿(mào)營銷網(wǎng)站建設(shè)要多少錢,請(qǐng)找那個(gè)售后服務(wù)好的聞喜做網(wǎng)站的公司定做!
【上集】百度網(wǎng)盤下載:鏈接:http://pan.baidu.com/s/1eQJFXZ0 密碼:kdx9
【下集】百度網(wǎng)盤下載:鏈接:http://pan.baidu.com/s/1hq4cO2w 密碼:cnsq
課程內(nèi)容簡介:
本課程分兩大部分:
第一部分全面深入地介紹了Greenplum數(shù)據(jù)庫,包括架構(gòu)特性、部署、管理、開發(fā)和調(diào)優(yōu)等,由淺入深
,理論結(jié)合實(shí)戰(zhàn),讓同學(xué)全面徹底掌握這把大數(shù)據(jù)利劍。
第二部分深入闡述了Hadoop的架構(gòu)原理,Hadoop整體技術(shù)架構(gòu),包括HBase、Hive、Pig、ZooKeeper、
Chukwa等實(shí)戰(zhàn)運(yùn)用。另外還介紹了云計(jì)算的基礎(chǔ)知識(shí)和Hadoop在云計(jì)算領(lǐng)域的運(yùn)用,以及剖析了Hadoop在
各個(gè)互聯(lián)網(wǎng)巨頭商業(yè)環(huán)境的運(yùn)用。
【上集】 Greenplum 分布式數(shù)據(jù)庫基礎(chǔ)(41課時(shí))
1 Greenplum架構(gòu)
什么是Greenplum
Greenplum體系結(jié)構(gòu)
Greenplum高可用性架構(gòu)
2 安裝Greenplum
配置環(huán)境
安裝并初始化GPDB系統(tǒng)
啟停數(shù)據(jù)庫
配置GP系統(tǒng)
3 分布式數(shù)據(jù)庫存儲(chǔ)
數(shù)據(jù)是如何存儲(chǔ)的
分布策略
4 GBDB查詢處理
查詢命令的執(zhí)行
SQL查詢處理機(jī)制
并行查詢計(jì)劃
5 角色權(quán)限及客戶端認(rèn)證管理
客戶端認(rèn)證
管理用戶和組
6 客戶端接口和程序
pgAdmin III
PSQL
7 定義數(shù)據(jù)庫對(duì)象
創(chuàng)建并管理數(shù)據(jù)庫
創(chuàng)建并管理表空間
創(chuàng)建并管理模式
創(chuàng)建并管理表
分區(qū)表
數(shù)據(jù)分布與分區(qū)
壓縮存儲(chǔ)與行列存儲(chǔ)
序列、索引與視圖
8 管理數(shù)據(jù)
插入、更新、刪除記錄
事務(wù)管理
空間回收和統(tǒng)計(jì)
9 查詢數(shù)據(jù)
定義查詢
使用函數(shù)和運(yùn)算符
查詢分析
10 工作負(fù)載及資源管理
GP工作負(fù)載管理概述
配置工作負(fù)載管理
創(chuàng)建資源隊(duì)列
分配資源隊(duì)列
檢查資源隊(duì)列狀態(tài)
11 裝載和卸載數(shù)據(jù)
GP裝載命令概述
裝載數(shù)據(jù)到GP
從GP卸載數(shù)據(jù)
格式化數(shù)據(jù)文件
12 備份恢復(fù)
串行備份和恢復(fù)
并行恢復(fù)和恢復(fù)
13 性能調(diào)優(yōu)
如何進(jìn)行調(diào)優(yōu)
常見的性能問題
14 GP系統(tǒng)配置參數(shù)
關(guān)于GP的Master參數(shù)與本地化參數(shù)
設(shè)置配置參數(shù)
配置參數(shù)種類
15 開啟高可用性
GP高可用概述
開啟GP的Mirror
獲知Segment何時(shí)失敗
恢復(fù)失敗的Segment
恢復(fù)失敗的Master
16 GP MapReduce
MapReduce基礎(chǔ)
GP MapReduce編程
MapReduce作業(yè)執(zhí)行和故障診斷
【下集】 Hadoop分布式平臺(tái)(55課時(shí))
1 Hadoop的起源和體系
Hadoop思想起源:Google
Hadoop子項(xiàng)目家族
Hadoop的架構(gòu)
2 Hadoop的安裝與配置
準(zhǔn)備和配置環(huán)境
三種運(yùn)行模式
完全分布式模式安裝
3 HDFS-大數(shù)據(jù)存儲(chǔ)
HDFS概念與體系結(jié)構(gòu)
HDFS的可靠性
HDFS文件操作
HDFS API
4 關(guān)于MapReduce
MapReduce編程模型
MapReduce的集群行為
MapReduce任務(wù)的優(yōu)化
MapReduce工作機(jī)制
錯(cuò)誤處理及作業(yè)調(diào)度機(jī)制
5 MapReduce應(yīng)用開發(fā)
Hadoop Eclipse插件開發(fā)
數(shù)據(jù)篩選程序開發(fā)
倒排索引程序開發(fā)
6 Hadoop監(jiān)控與管理
頁面監(jiān)控
hadoop備份
7 HBase數(shù)據(jù)庫
Hbase體系結(jié)構(gòu)
HBase shell
HBase API應(yīng)用實(shí)例
HBase場(chǎng)景應(yīng)用
HBase模式設(shè)計(jì)
8 Hive數(shù)據(jù)倉庫
Hive組件與體系架構(gòu)
Hive安裝配置
Hive的服務(wù)接口
HiveQL常用操作
Hive的優(yōu)化
Hive UDF編程
Hive綜合實(shí)戰(zhàn)
9 Pig數(shù)據(jù)分析平臺(tái)
Pig框架
Pig安裝配置
Pig的使用
Pig的數(shù)據(jù)模型
常用Pig Latin操作
Pig UDF編程
Pig數(shù)據(jù)分析實(shí)戰(zhàn)
10 ZooKeeper分布式服務(wù)框架
ZooKeeper工作原理
ZooKeeper設(shè)計(jì)目標(biāo)
ZooKeeper的數(shù)據(jù)結(jié)構(gòu)和組成
ZooKeeper的安裝配置
ZooKeeper命令行工具
ZooKeeper API
ZooKeeper實(shí)戰(zhàn):Hadoop任務(wù)調(diào)度
11 Chukwa集群監(jiān)控系統(tǒng)
Chukwa的組成
Chukwa架構(gòu)和設(shè)計(jì)
Chukwa安裝與配置
常用Chukwa命令
實(shí)現(xiàn)自定義數(shù)據(jù)處理
12 Hadoop商業(yè)應(yīng)用案例
云計(jì)算概念和特征
云計(jì)算服務(wù)模式和形態(tài)
Hadoop在云計(jì)算的運(yùn)用
京東商城
百度
阿里巴巴
騰訊
13 Greenplum Hadoop集群
集成架構(gòu)的特征
集成架構(gòu)的優(yōu)勢(shì)
配置gphdfs協(xié)議使用環(huán)境
使用HDFS外部表
當(dāng)前標(biāo)題:GreenplumHadoop分布式平臺(tái)大數(shù)據(jù)解決方案實(shí)戰(zhàn)教程
當(dāng)前URL:http://jinyejixie.com/article34/jdodse.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供自適應(yīng)網(wǎng)站、手機(jī)網(wǎng)站建設(shè)、品牌網(wǎng)站制作、網(wǎng)站設(shè)計(jì)、定制網(wǎng)站、網(wǎng)站排名
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)