以西瓜书为主线,以其他书籍作为参考进行补充,例如《统计学习方法》,《PRML》等
Hadoop 伪分布式环境搭建
Hadoop伪分布式安装步骤
JDK 安装(1.8版本及以上)
貌似如果JDK是1.7的话会遇到一些莫名的BUG…
比如编译Spark的时候就卡了很久!!
解压:
tar -zxvf jdk-7u79-linux-x64.tar.gz -C ~/app
添加到环境变量:~/.bash_profile
export JAVA_HOME=/home/hadoop/app/jdk1.7.0_79
export PATH=$JAVA_HOME/bin:$PATH
使得环境变量生效: source ~/.bash_profile
验证Java是否配置成功: java -version