搭建Spark集群(一)——使用VirtualBox建立虚拟机

2019年6月8日 310次阅读来源: cyfloel

环境准备

一台主机（看个人的配置，当然配置越高性能越好，我自己的是i5+16G+1TB 64位 windows7系统）
CentOS 7.0安装文件
hadoop-2.6.0.tar.gz、scala-2.10.5.tgz、jdk-7u79-linux-x64.rpm、spark-1.3.1-bin-hadoop2.6.tgz
VirtualBox、xshell、WinSCP

对应IP地址

虚拟机	IP地址	hostname
160.Master.Hadoop	192.168.1.160	Master
161.Slave1.Hadoop	192.168.1.161	Slave1
162.Slave2.Hadoop	192.168.1.162	Slave2
163.Slave3.Hadoop	192.168.1.163	Slave3

配置虚拟机

如果你有几台物理机，那可以直接跳过这一部分，直接查看。这次搭建Spark集群主要是利用VirtualBox建立了4台虚拟机来完成，对虚拟机熟悉的同学可以直接跳过这一部分。

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

为了方便我们管理这些虚拟机，命名的时候，我们可以按照上面列出的虚拟机名字进行命名，这里根据自己喜好。

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

因为系统是CentOS 7.0，类型我们选择Linux版本根据自己系统选择32位还是64位

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

设定虚拟机内存大小（可根据自己电脑配置），这里我设定虚拟机的内存大小为1G

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

虚拟硬盘选择默认的
VDI格式即可

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

给虚拟硬盘分配空间，默认是
【动态分配】，选择这个一开始占据物理硬盘的空间较少，随着使用（安装软件等）逐渐增加，直到之后设定的最大值，我这选择
【固定大小】，现在硬盘容量都很大，足够使用了，而且
【固定大小】运行起来会快点，但在创建虚拟机的时候需要花更多的时间

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

选择虚拟硬盘文件的保存位置（为了方便，可以把所有的虚拟机都放到同一个磁盘下面，如D盘）；设定分配给虚拟机的硬盘大小，这里设定为20G（作为测试，20G足够使用了）

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

创建后就是等待了，时间取决于你机器的性能

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》 Paste_Image.png

创建完后，可以在VirtualBox左侧的虚拟机列表查看刚才创建的虚拟机，接下来就是系统的安装了，点击工具栏里的【设置】

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

在【系统】菜单里，把光驱作为第一启动顺序，硬盘作为第二启动

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

在【存储】菜单里，选中控制器（默认是没有盘片的，需要通过最右边的小光驱图案，选择安装系统的ISO文件）

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

在【网络】菜单里，连接方式选择【桥接网卡】，混杂模式选择【全部允许】，每台虚拟机都要分配不同的MAC地址，可通过这个页面进行查看，然后在系统里面进行修改，后面复制镜像生成新的虚拟机时需要根据新生成的MAC地址进入系统里面修改。这几项设置完后，就可以保存，回到VirtualBox主界面，在左侧列表选择这台虚拟机，双击启动或者点击顶部工具栏的【启动】按钮，启动这台虚拟机进行安装。安装CentOS 7.0参考这里：搭建Spark集群（二）——安装CentOS 7

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

转载请注明出处：http://www.jianshu.com/p/16319cb0ae49，谢谢支持！

    原文作者：cyfloel
    原文地址: https://www.jianshu.com/p/16319cb0ae49
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。