光看"北京蓝"不如搞懂MHA-教你最新版本VIP模式搭建

小伙伴们,好久没有发手记了,大家有没有期待,哈哈!

《光看

今天我给大家分享一篇“Mysql5.7版本实现基于VIP的MHA搭建”

为什么要单独来写这一篇手记呢?在正式讲解搭建步骤之前,我们先聊聊Mysql5.7,Mysql5.7的版本相比5.5之前的版本多了产生了很大的变化,如:

1、主从中binlog的gtid模式

2、多线程复制

3、多主复制模式

4、支持动态调整buffer pool size 等等

5、半同步复制

..等等

所以,在选择使用Mysql的相关工具的时候(如MHA的版本),它选择也是需要谨慎,选择最匹配的版本。那么本内容中,我们配置的MHA,建议同学下载的如下版本,如下:

mha4mysql-node-0.57.tar.gz (所有节点需要)

mha4mysql-manager-0.57.tar.gz(manager节点需要)

大家可以提前从百度网盘下载:

链接:https://pan.baidu.com/s/1oocYRuK41YNV48eQuvZ3_g(下载密码密码在这篇文章这篇文章中获取:http://imoocc.com/jeson/2018/06/28/mha-vip/)

关于什么是MHA及简单模式搭建,大家可以参考之前在我的手记内容(Mysql管理之道-MHA最全搭建步骤)

今天我们要来搭建是 MHA使用VIP模式之前介绍的MHA典型的模式中,用到VIP的好处,就是当我们的主节点故障时,MHA来实现对vip的切换,使得客户端可以无感知。如下:

《光看

接下来,正式聊聊搭建步骤喽~

《光看

一、安装Mysql5.7,及主从搭建

大家请先配置好Mysql5.7版本的主从架构模式,可以参考我这篇文章搭建:Jeson聊DBA晋级之路-Mysql主从搭建

二、成员节点IP规划

搭建完毕后,先对自己部署的三台Mysql实例作一个简单规划,如下:

IP主机名集群节点类型MHA节点类型VIP
192.168.1.175imoocc-com01主库node节点192.168.1.181
192.168.1.176imoocc-com02从库Manager节点
192.168.1.180imoocc-com03从库node节点

三、所有节点安装基础包


1、安装基础开发包

yum install perl-DBD-MySQL perl-devel perl-CPAN -y

2、编译安装mha4mysql-node包

tar -xzvf mha4mysql-node-0.57.tar.gz 

cd mha4mysql-node-0.57

perl Makefile.PL

make && make install

四、安装manager节点

登陆1.176

1、安装基础开发包

yum install perl-DBD-MySQL perl-devel perl-CPAN -y

yum install perl cpan perl-DBD-MySQL perl-Config-Tiny perl-Log-Dispatch perl-Parallel-ForkManager perl-Net-Telnet perl-Time-HiRes -y 

2、编译安装mha4mysql-manager包

tar -xvf mha4mysql-manager-0.57.tar.gz 

cd mha4mysql-manager-0.57

perl Makefile.PL

make && make install

3、建立配置文件目录

mkdir /etc/masterha

#拷贝默认配置文件

cp samples/conf/* /etc/masterha/

4、拷贝相关命令

cp samples/scripts/* /usr/local/bin/

会拷贝如下的命令:

master_ip_failover     #自动切换时vip管理的脚本,不是必须,如果我们使用keepalived的,我们可以自己编写脚本完成对vip的管理,比如监控mysql,如果mysql异常,我们停止keepalived就行,这样vip就会自动漂移

master_ip_online_change    #在线切换时vip的管理,不是必须,同样可以可以自行编写简单的shell完成power_manager     #故障发生后关闭主机的脚本,不是必须send_report       #因故障切换后发送报警的脚本,不是必须,可自行编写简单的shell完成。

五、登陆mysql的主库,配置节点间ssh登陆互信和建立相关用户

1、配置节点互信

注意:所有节点都需要添加ssh互信免密认证

#生成密钥 

ssh-keygen -t rsa

#将公钥拷贝到所有节点

ssh-copy-id -i /root/.ssh/id_rsa.pub root@192.168.1.180

ssh-copy-id -i /root/.ssh/id_rsa.pub root@192.168.1.175

ssh-copy-id -i /root/.ssh/id_rsa.pub root@192.168.1.176

#将私钥id_rsa拷贝所有节点

scp ./id_rsa root@192.168.8.180:/root/.ssh/

…省略

2、授权所有节点都可以用root连接

登陆主库的mysql,执行如下:

grant all on *.* to ‘root’@’192.168.1.%’ identified by ‘xxxxxxx’;

flush privileges;

3、新建数据库复制账户

同样登陆主库

#记住用户密码

grant replication slave on*.* to repl@’%’ identified by ‘repl’;

六、配置manager节点配置

登陆mager节点,执行如下:

cd /etc/masterha

1、配置下MHA的master_ip_failover脚本

修改/usr/local/bin/master_ip_failover,这里使用脚本管理vip 
将如下代码全部复制进去,根据自己的实际情况进行修改,如下:

# cat /usr/local/bin/master_ip_failover

#!/usr/bin/env perl

use strict;

use warnings FATAL => ‘all’;

use Getopt::Long;

my (

    $command,          $ssh_user,        $orig_master_host, $orig_master_ip,

    $orig_master_port, $new_master_host, $new_master_ip,    $new_master_port

);

my $vip = ‘192.168.1.181/24’;  #此处为你要设置的虚拟ip

my $key = ‘1’;

my $ssh_start_vip = “/sbin/ifconfig bond0:$key $vip”; #此处改为你的网卡名称

my $ssh_stop_vip = “/sbin/ifconfig bond0:$key down”;

GetOptions(

    ‘command=s’          => \$command,

    ‘ssh_user=s’         => \$ssh_user,

    ‘orig_master_host=s’ => \$orig_master_host,

    ‘orig_master_ip=s’   => \$orig_master_ip,

    ‘orig_master_port=i’ => \$orig_master_port,

    ‘new_master_host=s’  => \$new_master_host,

    ‘new_master_ip=s’    => \$new_master_ip,

    ‘new_master_port=i’  => \$new_master_port,

);

exit &main();

sub main {

    print “\n\nIN SCRIPT TEST====$ssh_stop_vip==$ssh_start_vip===\n\n”;

    if ( $command eq “stop” || $command eq “stopssh” ) {

        my $exit_code = 1;

        eval {

            print “Disabling the VIP on old master: $orig_master_host \n”;

            &stop_vip();

            $exit_code = 0;

        };

        if ($@) {

            warn “Got Error: $@\n”;

            exit $exit_code;

        }

        exit $exit_code;

    }

    elsif ( $command eq “start” ) {

        my $exit_code = 10;

        eval {

            print “Enabling the VIP – $vip on the new master – $new_master_host \n”;

            &start_vip();

            $exit_code = 0;

        };

        if ($@) {

            warn $@;

            exit $exit_code;

        }

        exit $exit_code;

    }

    elsif ( $command eq “status” ) {

        print “Checking the Status of the script.. OK \n”;

        exit 0;

    }

    else {

        &usage();

        exit 1;

    }

}

sub start_vip() {

    `ssh $ssh_user\@$new_master_host \” $ssh_start_vip \”`;

}

sub stop_vip() {

     return 0  unless  ($ssh_user);

    `ssh $ssh_user\@$orig_master_host \” $ssh_stop_vip \”`;

}

sub usage {

    print

    “Usage: master_ip_failover –command=start|stop|stopssh|status –orig_master_host=host –orig_master_ip=ip –orig_master_port=port –new_master_host=host –new_master_ip=ip –new_master_port=port\n”;

}

2、配置app1文件

vim /etc/masterha/app1.cnf

[server default]

# mysql user and password

user=root                 /设置监控用户root

password=’12345′  /设置mysql中root用户的密码,这个密码是前文中创建监控用户的那个密码

ssh_user=root        /设置ssh的登录用户名

repl_user=repl      /设置复制环境中的复制用户名

repl_password=12345     /设置复制用户的密码

ping_interval=3  /设置监控主库,发送ping包的时间间隔,默认是3秒,尝试三次没有回应的时候自动进行railover

master_ip_failover_script= /usr/local/bin/master_ip_failover

/设置自动failover时候的切换脚本,也就是上边的哪个脚本master_ip_online_change_script= /usr/local/bin/master_ip_online_change  //设置手动切换时候的切换脚本

#master_ip_online_change_script= /usr/local/bin/master_ip_online_change 

#master_ip_failover_script=/usr/local/bin/master_ip_failover_userinfo

# master_ip_online_change_script=/usr/local/bin/master_ip_online_change_script

# working directory on the manager

manager_workdir=/var/log/masterha/app2

manager_log=/var/log/masterha/manager2.log

# working directory on MySQL servers

# remote_workdir=/var/log/masterha/app1

[server1]

hostname=192.168.1.175

ssh_port=22

port=3306

master_binlog_dir=/data/userinfo/logs

check_repl_delay=0

/默认情况下如果一个slave落后master 100M的relay logs的话,MHA将不会选择该slave作为一个新的master,因为对于这个slave的恢复需要花费很长时间,通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,因为这个候选主在切换的过程中一定是新的master

candidate_master=1

/设置为候选master,如果设置该参数以后,发生主从切换以后将会将此从库提升为主库,即使这个主库不是集群中事件最新的slave

[server2]

hostname=192.168.1.176

ssh_port=22

port=3306

master_binlog_dir=/data/userinfo/logs

check_repl_delay=0

candidate_master=1

[server3]

hostname=192.168.1.180

ssh_port=22

port=3306

no_master=1

七、检查

1、在manager节点检测mha可用性如下

执行如下步骤:

#测试ssh的连接情况

masterha_check_ssh –conf=/etc/masterha/app1.cnf 

#测试mysq集群的连接情况

masterha_check_repl –conf=/etc/masterha/app1.cnf 


2、整体测试

#登陆manager节点,终端执行如下命令,启动服务:

masterha_manager –conf=/etc/masterha/app1.cnf

#在manager节点上,查看日志

tail -n 200 /var/log/masterha/manager2.log 

#登陆mysql的master节点关闭数据库。

如果我们看到,vip发生切换,并且日志中可以到切换的信息。

另外,我们可以登陆其中的从库show slave status查看下是否有切换到新的主库中。

如果,都正常,那么恭喜你,搭建完毕了。

最后,在给大家送上两张“北京蓝”,祝大家天天都有好心情~

《光看

八、报错处理记录

1、执行检查出现问题

masterha_check_ssh –conf=/etc/masterha/app1.cnf

出现问题:

Can’t locate MHA/NodeConst.pm in @INC (@INC contains: /usr/local/lib64/perl5 /usr/local/share/perl5 /usr/lib64/perl5/vendor_perl /usr/share/perl5/vendor_perl /usr/lib64/perl5 /usr/share/perl5 .) at /usr/local/share/perl5/MHA/ManagerConst.pm line 25.

解决方式:

这个报错是因为在管理主机上没有安装mha4mysql-node-0.53.tar.gz所致

在管理节点安装mha4mysql-node-0.53.tar.gz 后报错消失

2、执行检测报错

masterha_check_repl –conf=/etc/masterha/app1.cnf 

出现这个错误:

Wed Jun 27 18:08:10 2018 –

Global configuration file /etc/masterha_default.cnf not found. Skipping.

Wed Jun 27 18:08:10 2018 –

Reading application default configuration from /etc/masterha/app1.cnf..

Wed Jun 27 18:08:10 2018 –

Reading server configuration from /etc/masterha/app1.cnf..

Wed Jun 27 18:08:10 2018 –

MHA::MasterMonitor version 0.57.

Wed Jun 27 18:08:10 2018 – [error][/usr/local/share/perl5/MHA/ServerManager.pm, ln671] Master 192.168.1.220:3308 from which slave 192.168.1.175(192.168.1.175:3308) replicates is not defined in the configuration file!

Wed Jun 27 18:08:10 2018 – [error][/usr/local/share/perl5/MHA/MasterMonitor.pm, ln427] Error happened on checking configurations.  at /usr/local/share/perl5/MHA/MasterMonitor.pm line 329

Wed Jun 27 18:08:10 2018 – [error][/usr/local/share/perl5/MHA/MasterMonitor.pm, ln525] Error happened on monitoring servers.

Wed Jun 27 18:08:10 2018 –

Got exit code 1 (Not master dead).

MySQL Replication Health is NOT OK!

原因:主库同时开启了从模式,所以需要到主库上执行:

reset slave

start slave 

九、补充

(1)切换master的命令

CHANGE MASTER TO MASTER_HOST=’192.168.1.176′,MASTER_PORT=3306,MASTER_USER=’repl’,MASTER_PASSWORD=’123456′,MASTER_AUTO_POSITION=1;

     

点赞