搭建Spark集群(一)——使用VirtualBox建立虚拟机

环境准备

  • 一台主机(看个人的配置,当然配置越高性能越好,我自己的是i5+16G+1TB 64位 windows7系统)
  • CentOS 7.0安装文件
  • hadoop-2.6.0.tar.gz、scala-2.10.5.tgz、jdk-7u79-linux-x64.rpm、spark-1.3.1-bin-hadoop2.6.tgz
  • VirtualBox、xshell、WinSCP

对应IP地址

虚拟机IP地址hostname
160.Master.Hadoop192.168.1.160Master
161.Slave1.Hadoop192.168.1.161Slave1
162.Slave2.Hadoop192.168.1.162Slave2
163.Slave3.Hadoop192.168.1.163Slave3

配置虚拟机

如果你有几台物理机,那可以直接跳过这一部分,直接查看。这次搭建Spark集群主要是利用VirtualBox建立了4台虚拟机来完成,对虚拟机熟悉的同学可以直接跳过这一部分。

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

为了方便我们管理这些虚拟机,命名的时候,我们可以按照上面列出的虚拟机名字进行命名,这里根据自己喜好。

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

因为系统是CentOS 7.0,类型我们选择Linux版本根据自己系统选择32位还是64位

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

设定虚拟机内存大小(可根据自己电脑配置),这里我设定虚拟机的内存大小为1G

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

虚拟硬盘选择默认的
VDI格式即可

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

给虚拟硬盘分配空间,默认是
【动态分配】,选择这个一开始占据物理硬盘的空间较少,随着使用(安装软件等)逐渐增加,直到之后设定的最大值,我这选择
【固定大小】,现在硬盘容量都很大,足够使用了,而且
【固定大小】运行起来会快点,但在创建虚拟机的时候需要花更多的时间

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

选择虚拟硬盘文件的保存位置(为了方便,可以把所有的虚拟机都放到同一个磁盘下面,如D盘);设定分配给虚拟机的硬盘大小,这里设定为20G(作为测试,20G足够使用了)

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

创建后就是等待了,时间取决于你机器的性能

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》 Paste_Image.png

创建完后,可以在VirtualBox左侧的虚拟机列表查看刚才创建的虚拟机,接下来就是系统的安装了,点击工具栏里的【设置】

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

在【系统】菜单里,把光驱作为第一启动顺序,硬盘作为第二启动

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

在【存储】菜单里,选中控制器(默认是没有盘片的,需要通过最右边的小光驱图案,选择安装系统的ISO文件)

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

在【网络】菜单里,连接方式选择【桥接网卡】,混杂模式选择【全部允许】,每台虚拟机都要分配不同的MAC地址,可通过这个页面进行查看,然后在系统里面进行修改,后面复制镜像生成新的虚拟机时需要根据新生成的MAC地址进入系统里面修改。这几项设置完后,就可以保存,回到VirtualBox主界面,在左侧列表选择这台虚拟机,双击启动或者点击顶部工具栏的【启动】按钮,启动这台虚拟机进行安装。安装CentOS 7.0参考这里:搭建Spark集群(二)——安装CentOS 7

《搭建Spark集群(一)——使用VirtualBox建立虚拟机》

转载请注明出处:http://www.jianshu.com/p/16319cb0ae49,谢谢支持!

    原文作者:cyfloel
    原文地址: https://www.jianshu.com/p/16319cb0ae49
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞