世纪证券Zabbix监控体系晋级高可用架构的实践共享_欧宝在线入口_ob欧宝最新地址电竞官网入口
  • 欧宝在线入口
  • ob欧宝最新地址
  • 新闻中心
  • 企业风采
  • ob欧宝电竞官网入口
  • 网站地图
  • 
    • 欧宝在线入口
      SHA . 600794

    NEWS

    管理部风采

    欧宝在线入口
    • 张家港保税区石化交易大厦 27-28层
    • 0512-58320658

    欧宝在线入口:世纪证券Zabbix监控体系晋级高可用架构的实践共享

    2022-11-22 21:01:38 | 来源:ob欧宝最新地址 作者:ob欧宝电竞官网入口

      ,上任于世纪证券信息技术部,现在担任运维、监控体系的相关架构规划、开发作业。对操作体系、网络编程、服务器后台架构有丰厚实践经验。

      世纪证券于2022年8月初完结了Zabbix监控体系的版别(5.2-6.0)和架构晋级。本次晋级最重要的变更是运用Zabbix6.0官方供给的原生高可用HA特性完结了服务端架构上的高可用。主备机房一切设备的监控已平稳运转一月有余,现将整个进程做一个共享,供有需求的小伙伴参阅运用。

      公司自建机房和网络,主机房和同城灾备机房经过裸光纤完结内网互联。图1为晋级前的布置架构。

      公司两个机房一切被监控设备都只衔接一个Zabbix Server节点,且只要一个MySQL数据库节点,形成Zabbix Server和MySQL都存在单点毛病。一旦这两个服务呈现反常,公司监控体系将无法作业,如发生在买卖时刻,将直接导致公司失掉出产体系的运转状况的及时把握,带来极大的危险危险。

      Zabbix Server和MySQL都只要单节点,形成监控时刻的空缺。任何服务器的晋级改造、停机操作都将导致公司整个监控服务的暂停中止;

      公司事务还处于高速发展期,需监控的设备节点数量和监控维度还在不断添加,Zabbix server的承载才能受制于地点宿主主机的硬件装备,体系扩展性不行。

      晋级Zabbix6.0,引进了的HA(High Availability)特性,分别在两个机房布置zabbix server主备节点;正常情况下,主节点布置于主机房,备节点布置于同城灾备机房,主节点一旦中止服务,备节点可在1分钟(可装备)内接收服务;如主机主动中止,备节点可立马接收。

      主备Zabbix Server应急切换预案如图3所示。正常情况下,主Server处于Active状况,备Server处于Standby状况。当主Server中止服务,状况由Active变为Stop或Unavailable后,备Server经过主备状况信息同步机制感知到反常,当即发动接收服务,状况切换为Active状况;Zabbix Agent和Zabbix Proxy在衔接主Server失利后,也会测验衔接备Server。整个监控服务主动接收和切换,然后坚持监控持续可用。当主节点毛病康复后,状况由Stop或Unavailable切换为Standby状况。

      图3 主备Zabbix Server切换预案 MySQL双主架构下的主备形式应急切换预案

      MySQL数据库双主架构下的主备形式布置架构的应急切换预案如图4所示。正常情况下,主机房的MySQL数据库作为主数据库,同城灾备机房的数据库作为备数据库,同步主数据库的数据。当主机房的MySQL主数据库中止服务后,此刻备数据库作为主数据库持续供给服务,因为主备Zabbix Server服务一起只能装备一个数据库地址,所以此刻需求将Zabbix Server服务的数据库装备一起指向备数据库地址,并重启Zabbix Server服务坚持整个体系依然可用(此进程现在选用手动切换)。当主机房数据库服务康复后,此刻作为备数据库,可主动同步灾备机房的主数据库,然后主动康复中止服务期间丢掉的数据,持续坚持两个数据库可用的状况。

      依据Zabbix HA原理,主、备Zabbix Server的状况依赖于数据库来进行同步。如数据库呈现毛病,整个Zabbix的服务的可用性依然无法确保。为了确保整个服务的高可用,MySQL数据库的备份布置挑选双主架构下的主从形式。

      为了论述后续的装备过程,此处列出IP地址,但均已做了处理,和实在环境IP地址无任何实践相关。

      官方文档介绍history相关表结构有相关改变,很多人的做法是不备份history相关表,经过额定脚本导入原数据库的history相关表数据。咱们的做法有所不同,备份的是整个数据库,原因是zabbix server在发动时会主动检测数据库版别,并完结数据库的主动晋级操作

      依据公司的实践情况,agent端尽量坚持5.2版不变,但怎么确保服务的高可用性,咱们的解决方案是:装备文件Server和ServerActive项多配一个ip,用逗号分隔

      晋级后完善了公司的监控服务架构,但仍有能够持续改进的当地。如Zabbix Proxy服务还没有做到高可用,后期可考虑引进keepalived做高可用;Zabbix Server切换MySQL数据库时,现在选用的是人为断定切换机遇,后期可考虑设定数据库毛病检测的规矩,经过脚本完结主动化切换。

    

    欧宝在线入口