目前從事大數(shù)據(jù)應(yīng)用開發(fā)工作的人員工資已經(jīng)遠(yuǎn)超普通技術(shù)開發(fā)者,初級月薪在2萬左右,高級年薪已經(jīng)達(dá)到50萬。Hadoop對累積了海量數(shù)據(jù)資產(chǎn)的企業(yè)來說意義非凡。Hadoop可以在商業(yè)服務(wù)器集群上分布數(shù)據(jù)和執(zhí)行并行處理,還能偵測和處理對于分布式處理至關(guān)重要的故障。
*階段:Hadoop應(yīng)用技術(shù)淺析
課程目標(biāo):
1.掌握Linux操作系統(tǒng)的基本命令和簡單維護(hù)
2.深入理解Hadoop架構(gòu)
3.掌握Hadoop HDFS的設(shè)計(jì)原理
4.掌握Hadoop HDFS常用操作命令
5.掌握Hadoop MapReduce的設(shè)計(jì)原理
6.熟悉Hadoop MapReduce程序開發(fā)基本流程
7.掌握Hadoop 1.x與hadoop2.x的主要區(qū)別
8.獨(dú)立實(shí)施Hadoop集群以及對集群進(jìn)行監(jiān)控
9.了解Zookeeper基本原理以及實(shí)施Zookeeper集群
10.了解Hbase基本原理以及實(shí)施Hbase集群
11.了解Hadoop調(diào)優(yōu)的基本思路和方法
課程內(nèi)容:
1.Linux系統(tǒng)安裝和配置
2.Linux系統(tǒng)進(jìn)程和用戶管理
3.Linux文件和目錄創(chuàng)建和配置
4.Linux RPM和YUM配置管理
5.Linux網(wǎng)絡(luò)管理
6.Hadoop生態(tài)系統(tǒng)總體概覽
7.Hadoop分布式文件系統(tǒng)DHFS詳解
8.Hadoop MapReduce詳解
9.Hadoop單機(jī)、偽分布式和分布式部署
10.Hadoop Namenode HA詳解及部署
11.Hadoop日常維護(hù)管理
12.Zookeeper原理及分布式部署
13.Hbase原理及分布式部署
14.Hadoop與RDBMS數(shù)據(jù)庫進(jìn)行數(shù)據(jù)轉(zhuǎn)換
15.Hadoop調(diào)優(yōu)
第二階段:Nutch應(yīng)用技術(shù)詳解
課程目標(biāo):
1.了解Nutch的基本工作流程
2.能夠在Hadoop分布式環(huán)境中安裝、配置、運(yùn)行、調(diào)試、優(yōu)化Nutch搜索引擎
3.使用Java編程語言開發(fā)對Nutch插件進(jìn)行定制化開發(fā)
4.使用Nutch內(nèi)置腳本對運(yùn)行狀態(tài)及結(jié)果進(jìn)行分析
5.使用Linux Shell開發(fā)定制腳本
6.使用Nutch發(fā)送Solr索引數(shù)據(jù)
7.使用Java語言為搜索引擎開發(fā)網(wǎng)頁快照功能
8.通過Nutch了解Hadoop map/reduce
9.通過Nutch了解大數(shù)據(jù)在HDFS的應(yīng)用
課程內(nèi)容:
1.Nutch的基本工作流程
2.Nutch的安裝與配置
3.Nutch的單機(jī)、偽分布式和分布式部署
4.Nutch的常用命令
5.Nutch的參數(shù)設(shè)置及調(diào)優(yōu)
6.Nutch與Solr的對接
7.Nutch的第三方插件安裝與配置
8.Nutch在Eclipse中的部署與調(diào)試
第三階段:Solr企業(yè)級搜索應(yīng)用技術(shù)
課程目標(biāo):
1.了解Solr的基本工作流程
2.熟練使用Solr界面功能主要包括詞語分析,模板配置,查詢及數(shù)據(jù)導(dǎo)入
3.Solr創(chuàng)建核心服務(wù)容器并新增刪除數(shù)據(jù)
4.使用查詢及過濾器獲取Solr里的數(shù)據(jù)
5.使用Solr對查詢結(jié)果實(shí)現(xiàn)關(guān)鍵詞高亮顯示
6.Solr添加中文分詞插件,實(shí)現(xiàn)中文語義分析
7.了解Solr Cloud基本原理以及實(shí)施Solr Cloud集群
8.Solr Cloud新增刪除及分布式數(shù)據(jù)查詢
SolrJ查詢分析器的使用
9.掌握Solr服務(wù)性能境問題分析及提升方法
課程內(nèi)容:
1.Solr的基本工作流程
2.Solr的安裝與配置
3.Solr的單機(jī)、偽分布式和分布式部署
4.Solr的界面使用及應(yīng)用配置
5.Solr的中文分詞mmseg4j使用
6.Solr的查詢分析器使用
7.Solr的高級應(yīng)用--關(guān)鍵字高亮顯示、內(nèi)容過濾、結(jié)果去重及排序
8.Solr的用戶搜索界面設(shè)計(jì)