Hadoop 环境的搭建

一、安装VMWare 虚拟机

虚拟机版本VMware12,考虑到启动速度,装在固态硬盘中。

二、安装Linux

安装版本:ubuntu-16.04.1-server-amd64

此版本没有图形化界面,体积较小,只有命令行窗口

三、配置Linux

1、为了方便操作以及避免权限的相关问题,不用个人用户,使用root用户登录来进行操作 ——>root用户的解锁:修改root密码,方便登录

sudo passwdroot

2、关闭防火墙,卸载iptables

关闭防火墙:ufw disable

卸载iptables:apt-get removeiptables

3、安装vim编辑器

apt-getinstall vim

四、安装SSH工具

为了方便不在Linux命令窗口中输入命令,转而在Windows工具中远程控制Linux——>配置SSH工具远程连接

1、在Linux中安装SSH服务

apt-getinstall openssh-server

2、启动SSH服务

/etc/init.d/sshstart

3、检测SSH进程是否已经开启

ps -e| grep sshd

4、配置root用户的默认登录【这样每次打开SSH工具就不用登陆了,自动登陆到root上】

vim /etc/ssh/sshd_config

修改配置文件

#允许root用户登录,设置为yes

·PermitRootLogin: yes

保存,退出 :x

5、打开SSH客户端(这里使用SecureCRT)配置

·Linux下查询本机IP:ifconfig 查看inet addr

·SecureCRT中:Hostname输入查询到的IP,Username输入root

这里使用SecureCRT连接本地VMware是可能会遇到

“Connection timed out”,并且在Vmware的VM里面可以ping通宿主机,但是宿主机无法ping通VM。 解决方法:本地的网络设置里面的vmware的NAT网卡(Vmnet8)设置了手工填写地址和DNS,修改为自动获取即可。

五、配置FTP服务

为了方便Windows传输文件到Linux中,所以要配置FTP服务,使用客户端8UFTP

1、在Linux中安装FTP服务组件

apt-getinstall vsftpd

2、修改FTP用户的密码

passwdftp

3、设置FTP目录的控制权限为完全控制

chmod777 /srv/ftp (文件都上传到这个目录里)

4、修改配置文件

vim /etc/vsftpd.conf

修改:

anonymous_enable= NO //不允许匿名登录,必须使用正确的用户名和密码登录

local_enable=YES //允许本地用户登录

write_enable=YES //用户具有写权限

chroot_local_user= YES //将所有用户限制在主目录

chroot_list_enable= YES //启动限制用户名单

chroot_list_file=/etc/vsftpd.chroot_list //定义名单设置的目录

增加:

pam_service_name=vsftpd //增加到定义名单设置目录之后

保存退出

5、在名单设置目录中增加用户名

先增加文件/etc/vsftpd.chroot_list,然后在文件里面写上用户名ftp

vim/etc/vsftpd.chroot_list

输入ftp

保存退出

6、修改pam配置文件

vim /etc/pam.d/vsftpd

注释掉(添加#号):

# auth required pam_shells.so

保存退出

7、启动ftp服务

servicevsftpd start

(重新启动服务 service vsftpdrestart)

8、连接客户端8UFTP

新站点:

主机名:IP地址

用户名:ftp

密码:123110(Linux中配置的ftp账号密码)


六、在Linux中安装JDK

1、下载Linux版本的JDK安装包jdk-8u101-linux-x64.tar

2、把JDK开发包利用8UFTP工具上传到Linux中(目录/srv/ftp中)

3、将上传后的文件进行解压缩处理

tar xzvf JDK安装包文件名 -C /usr/local

4、给的解压后的文件重命名

mv JDK原名 jdk

5、配置JDK

·打开环境文件

vim /etc/profile

·在最下面,输入

export JAVA_HOME=/usr/local/jdk

export PATH=$PATH:$JAVA_HOME/bin:

export CLASS_PATH=$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

保存退出

6、让配置生效

source /etc/profile

7、测试 JDK

java 或 javac


七、配置SSH 免登录

1、设置虚拟网络

·进入Linux系统,在VM中选择编辑-虚拟网络配置,选择NAT模式

2、设置主机名称

vim /etc/hostname

把localhost 修改为 hadoopm

vim /etc/hosts

第一行增加

本机IP地址 hadoopm

3、重启Linux reboot

4、设置SSH免登陆

·删除根路径下.ssh

rm -rf~/.ssh

·在hadoopm主机上生成sshkey

ssh-keygen -t rsa(一直回车,不输入) //加密方式 rsa,可以选择其他方式

·将公钥信息保存在授权文件中

cat ~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys

5、测试免登陆(即登录ssh)

ssh root@hadoopm 变为远程连接

(exit退出链接)


八、安装hadoop(伪分布模式)——版本2.7.3

1、下载hadoop安装包

2、解压重命名hadoop安装包

tar xzvf hadoop安装包文件名 -C /usr/local

mv hadooop安装包名 hadoop

3、修改环境变量

vim /etc/profile

export HADOOP_HOME =/usr/local/hadoop

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

让配置生效

source /etc/profile

4、修改hadoop配置文件

配置:“core-site.xml”:Hadoop的核心信息,包括临时目录、访问地址等;

配置:“yarn-site.xml”:可以简单理解为配置相关job的处理;

配置:“hdfs-site.xml”:可以确定文件的备份个数、数据文件夹的路径;

·vim /usr/local/hadoop/etc/hadoop/hadoop-env.sh

更改JavaJDK路径

export JAVA_HOME=/usr/local/jdk/

(1)core-site.xml

·vim /usr/local/hadoop/etc/hadoop/core-site.xml

添加:

######################################################################################

## 配置hadoop临时文件,如果不配置,那么就会在hadoop的文件夹里面生产tmp文件("/usr/local/hadoop/tmp"),

## 那么hadoop重启此文件会被清空,也就是说此时hadoop的环境就失效了。 创建hadoop_tmp文件

## cd ~

##mkdir hadoop_tmp

#######################################################################################

<configuration>

<property>

<name>hadoop.tmp.dir</name>

<value>/home/root/hadoop_tmp</value>

</property>

<property>

<name>fs.defaultFS</name>

<value>hdfs://hadoopm:9000</value>

</property>

</configuration>

(2)hdfs-site.xml

vim/usr/local/hadoop/conf/hdfs-site.xml

######################################################################################

## “dfs.replication”:文件的副本数,一般情况下一个文件备份3份

## “dfs.namenode.name.dir”:定义名称节点路径

## “dfs.namenode.data.dir”:定义数据文件节点路径

## “dfs.datanode.data.dir”:名称节点的http访问路径

## “dfs.namenode.secondary.http-address”:第二名称节点

## “dfs.permissions”: 权限认证问题,关闭

#######################################################################################

<configuration>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>file:///usr/local/hadoop/dfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>file:///usr/local/hadoop/dfs/data</value>

</property>

<property>

<name>dfs.namenode.http-address</name>

<value>hadoopm:50070</value>

</property>

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>hadoopm:50090</value>

</property>

<property>

<name>dfs.permissions</name>

<value>false</value>

</property>

</configuration>

(3)yarn-site.xml

·vim /usr/local/hadoop/conf/ yarn-site.xml

添加:

<configuration>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<property>

<name>yarn.resourcemanager.address</name>

<value>master:8032</value>

</property>

<property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>master:8030</value>

</property>

<property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>master:8031</value>

</property>

<property>

<name>yarn.resourcemanager.admin.address</name>

<value>master:8033</value>

</property>

<property>

<name>yarn.resourcemanager.webapp.address</name>

<value>master:8088</value>

</property>

</configuration>·

(4)mapred-site.xml

vim/usr/local/hadoop/conf/mapred-site.xml

添加:

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>hadoopm:9001</value>

</property>

</configuration>

5、由于hadoop属于分布式的开发环境,考虑到日后要进行集群的搭建,建议在“/usr/local/hadoop/etc/hadoop”目录下创建一个masters,里面写上主机名称(hadoopm,之前在hosts目录里面定义的主机名称),如果是单机环境,不写也没有关系。

cd/usr/local/hadoop/etc/hadoop

vimmasters

输入:hadoopm


6、修改从节点文件,增加hadoopm(此时主副节点为统一节点)

cd/usr/local/hadoop/etc/hadoop

vimslaves

输入:hadoopm


7、上述hdfs-site.xml文件将所有的namenode、datanode保存路径设置在/usr/local/hadoop/dfs目录中,虽然可以自动创建,但是建议手动创建者两个文件夹

cd/usr/local/hadoop/

mkdirdfs dfs/name dfs/data

如果hadoop出现问题需要重新配置时,请保证将这两个文件夹彻底清除掉,如果没有删除,则配置无效。


8、格式化文件系统namenode

hdfs namenode- format

如果可以正确执行,则出现如下信息:INFO util.ExitUtil: Exiting with status 0;

如果出错,此处出现: INFOutil.ExitUtil: Exiting with status 1,很有可能是之前的几个配置文件复制、粘贴时出现了错误。


9、启动hadoop

start-all.sh 每次启动hadoop都要输入


10、检测是否启动成功

jps 查看所有java进程(是否出现了5个重要进程,Jps进程忽略)

6116SecondaryNameNode

5940Datanode

6500Jps

5802NameNode

6270ResourceManager

6382NodeManager

或者登录 http://ip地址:50070 http://ip地址:50030

(如果想用hadoopm从windows登录,则需要在windows下增加映射文件,

C:\Windows\System32\drivers\etchosts 追加 ip地址 hadoopm)

11、停止服务

stop-all.sh 使用jps查看进程

如果重启发现进程启动不完整的解决方案:http://www.linuxidc.com/Linux/2015-01/111891.htm


···配置完毕··

ubuntu16+Hadoop2.7.3环境搭建伪分布式的更多相关文章

  1. ios – Xcode警告:“没有处理文件的规则”和“找不到目录”

    重命名我的项目文件夹后,我收到以下错误消息:什么可能出错?解决方法关于第一个警告,您可以在项目设置中的“构建阶段”中检查XCode,即头文件不会出现在“编译源”列表中.

  2. 你如何将xcode项目转换为cocoapod?

    我有一段代码,我发现我在多个不同的项目中重复使用,所以我想把它变成一个cocoapod并使用私人cocoapod仓库.我的问题是如何将xcode项目设置为cocoapod?它应该是一个静态库还是一个带有appdelegate的空“项目”?

  3. ios – 如何将文件添加到主包的/ Library / Sounds目录中?

    根据Apple’sdocumentation,/Library/Sounds中的声音文件将在尝试播放声音时由系统搜索.如何将声音文件添加到此文件夹?适用于iOS的正确文档应为here总之,您只需将声音文件作为应用程序包的非本地化资源添加到项目中.

  4. ios – 资产目录与文件夹参考:何时使用其中一个?

    我可以将文件放入Assets.xcassets,或者我可以将文件放入文件夹引用.我何时会选择一个而不是另一个?

  5. ios – 从icloud备份中限制sqlite-wal和sqlite-shm

    我是第一次使用coredata,我必须从文档目录中的iCloud备份限制sqlitedb文件,我使用下面的代码完成了它//阻止iCloud备份文档目录文件夹现在我不明白的是,我们还需要从icloud备份中限制sqlite-wal和sqlite-shm文件,如果是,那么如何从icloud备份限制sqlite-wal和sqlite-shm文件我想要一个解决方案,而无需从文档目录文件夹中更改sqlitedb位置…

  6. iOS:如何从文档目录中删除具有特定扩展名的所有现有文件?

    当我更新我的iOS应用程序时,我想删除Documents目录中的任何现有sqlite数据库.现在,在应用程序更新时,我将数据库从软件包复制到文档目录,并通过附加软件包版本来命名它.因此,在更新时,我还想删除可能存在的任何旧版本.我只是希望能够删除所有sqlite文件,而无需循环浏览并查找以前版本的文件.是否有任何方法可以对removeFileAtPath:方法进行通配符?解决方法那么,你想要删除所有*.sqlite文件?

  7. osx – 无法创建目录/ var / teamsserver

    OpenSSH_6.2p2,OSSLShim0.9.8r8Dec2011debug1:Readingconfigurationdata/etc/ssh_configdebug1:/etc/ssh_configline20:Applyingoptionsfor*debug1:Connectingto1.2.3.4[1.2.3.4]portPORT.debug1:Connectionestablished.Couldnotcreatedirectory‘/var/teamsserver/.ssh’.debug

  8. ios – Xcode Server 4.0 git从构建触发脚本推送

    我为一个托管在github上的项目安装了一个XcodeBot.我按照步骤和设置机器人来使用我现有的SSH密钥.验证成功,项目结算和建立.然后,我在预触发器操作中添加了一个shell脚本,它增加了plist中的版本,将其标记,并将该更改提交到github.但是当我尝试从shell脚本执行gitpush时,我得到:–推送到git@github.com:spex-app/spex-ios.git权限被拒

  9. .dylib在Debug中链接,在XCode中找不到适用于iPhone的版本

    所以我已经将libxml2.2.dylib库包含在我的iPhoneXCode项目中,以创建一些Xml和XPath解析实用程序.当我编译并运行在模拟器和设备的调试模式时,我没有问题,但是,当我切换到发布模式我得到…

  10. ios – 从文件目录加载UIImage

    我正在尝试从文件目录加载一个UIImage,并将其设置为UIImageView,如下所示:但是,每当我尝试以上,图像从不加载.该图像在Documents/MyAppCustomDirectory/school.png中.以上是否正确从该目录加载?我也尝试了其他几个:UIImageimageWithContentsOfFile,以及基于SO响应的其他方法.解决方法要获取您应该使用的文档目录:我不太清

随机推荐

  1. crontab发送一个月份的电子邮件

    ubuntu14.04邮件服务器:Postfixroot收到来自crontab的十几封电子邮件.这些邮件包含PHP警告.>我已经解决了这些警告的原因.>我已修复每个cronjobs不发送电子邮件(输出发送到>/dev/null2>&1)>我删除了之前的所有电子邮件/var/mail/root/var/spool/mail/root但我仍然每小时收到十几封电子邮件.这些电子邮件来自cronjobs,

  2. 模拟两个ubuntu服务器计算机之间的慢速连接

    我想模拟以下场景:假设我有4台ubuntu服务器机器A,B,C和D.我想在机器A和机器C之间减少20%的网络带宽,在A和B之间减少10%.使用网络模拟/限制工具来做到这一点?

  3. ubuntu-12.04 – 如何在ubuntu 12.04中卸载从源安装的redis?

    我从源代码在Ubuntu12.04上安装了redis-server.但在某些时候它无法完全安装,最后一次makeinstallcmd失败.然后我刚刚通过apt包安装.现在我很困惑哪个安装正在运行哪个conf文件?实际上我想卸载/删除通过源安装的所有内容,只是想安装一个包.转到源代码树并尝试以下命令:如果这不起作用,您可以列出软件自行安装所需的步骤:

  4. ubuntu – “apt-get source”无法找到包但“apt-get install”和“apt-get cache”可以找到它

    我正在尝试下载软件包的源代码,但是当我运行时它无法找到.但是当我运行apt-cache搜索squid3时,它会找到它.它也适用于apt-getinstallsquid3.我使用的是Ubuntu11.04服务器,这是我的/etc/apt/sources.list我已经多次更新了.我尝试了很多不同的debs,并没有发现任何其他地方的错误.这里的问题是你的二进制包(deb)与你的源包(deb-src)不

  5. ubuntu – 有没有办法检测nginx何时完成正常关闭?

    &&touchrestarted),因为即使Nginx没有完成其关闭,touch命令也会立即执行.有没有好办法呢?这样的事情怎么样?因此,pgrep将查找任何Nginx进程,而while循环将让它坐在那里直到它们全部消失.你可以改变一些有用的东西,比如睡1;/etc/init.d/Nginx停止,以便它会休眠一秒钟,然后尝试使用init.d脚本停止Nginx.你也可以在某处放置一个计数器,这样你就可以在需要太长时间时发出轰击信号.

  6. ubuntu – 如何将所有外发电子邮件从postfix重定向到单个地址进行测试

    我正在为基于Web的应用程序设置测试服务器,该应用程序发送一些电子邮件通知.有时候测试是使用真实的客户数据进行的,因此我需要保证服务器在我们测试时无法向真实客户发送电子邮件.我想要的是配置postfix,以便它接收任何外发电子邮件并将其重定向到一个电子邮件地址,而不是传递到真正的目的地.我正在运行ubuntu服务器9.10.先感谢您设置本地用户以接收所有被困邮件:你需要在main.cf中添加:然后

  7. ubuntu – vagrant无法连接到虚拟框

    当我使用基本的Vagrantfile,只配置了两条线:我看到我的虚拟框打开,但是我的流氓日志多次显示此行直到超时:然后,超时后的一段时间,虚拟框框终于要求我登录,但是太久了!所以我用流氓/流氓记录.然后在我的物理机器上,如果我“流氓ssh”.没有事情发生,直到:怎么了?

  8. ubuntu – Nginx – 转发HTTP AUTH – 用户?

    我和Nginx和Jenkins有些麻烦.我尝试使用Nginx作为Jenkins实例的反向代理,使用HTTP基本身份验证.它到目前为止工作,但我不知道如何传递带有AUTH用户名的标头?}尝试将此指令添加到您的位置块

  9. Debian / Ubuntu – 删除后如何恢复/ var / cache / apt结构?

    我在ubuntu服务器上的空间不足,所以我做了这个命令以节省空间但是现在在尝试使用apt时,我会收到以下错误:等等显然我删除了一些目录结构.有没有办法做apt-getrebuild-var-tree或类似的?

  10. 检查ubuntu上安装的rubygems版本?

    如何查看我的ubuntu盒子上安装的rubygems版本?只是一个想法,列出已安装的软件包和grep为ruby或宝石或其他:)dpkg–get-selections

返回
顶部