共享存储HA概述

简介

实际使用中服务器的故障可能由各种原因引起,如网络设备故障、操作系统故障、存储故障、数据库软件系统故障,等等。一般地讲,在技术人员在现场的情况下,恢复服务器正常可能需要10分钟、几小时甚至几天。 从实际经验上看,除非是简单地重启服务器(可能隐患仍然存在),否则往往需要几个小时以上。 而如果技术人员不在现场,则恢复服务的时间就更长了。 而对于一些重要系统而言,用户是很难忍受这样长时间的服务中断的。 因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 而基于存储共享的双机热备是双机热备的最标准方案。对于这种方式,采用两台服务器,使用共享的存储设备(磁盘阵列柜或存储区域网SAN)。 两台服务器可以采用互备、主从、并行等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器通过心跳线(目前往往采用建立私有网络的方式)侦测另一台服务器的工作状况。当一台服务器出现故障时,另一台服务器根据心跳侦测的情况做出判断,并进行切换,接管服务。 对于用户而言,这一过程是全自动的,在很短时间内完成,从而对业务不会造成影响。 由于使用共享的存储设备,因此两台服务器使用的实际上是一样的数据,由双机或集群软件对其进行管理。 采用共享磁盘方式将用户数据存放在共享磁盘上,后台同时使用两台神通服务器对用户数据进行管理。 正常情况下,只有一台神通活动服务器拥有共享磁盘数据的管理权,可对外提供数据访问服务,而另一台处于备用状态; 如果活动服务器发生故障,则备用服务器自动接管共享磁盘上的用户数据的管理权,继续对外提供服务,保证用户访问数据的不间断性;当故障服务器修复后,以备用服务器的身份继续工作。基本架构如下:

../../../../_images/image110.png

支持所有Linux操作系统下的环境,比如Linux下的龙芯、飞腾、神威、兆芯、海光等系列国产环境;也支持Linux下的国外Intel、amd的x86环境(暂不支持Windows)

功能指标

共享磁盘方式是将用户数据存放在共享磁盘上,数据库同时使用两台神通服务器对用户数据进行管理。正常情况下,只有一台神通活动服务器拥有共享磁盘数据的管理权,可对外提供数据访问服务,而另一台处于备用状态;如果活动服务器发生故障,停止对外提供服务,则备用服务器自动接管共享磁盘上的用户数据的管理权,继续对外提供服务,保证用户访问数据的不间断性;当故障服务器修复后,以备用服务器的身份继续工作。共享存储的主要指标如下:

1) 支持主备机人工或自动发送切换;
2) 支撑仲裁盘心跳功能,避免存储被双写破坏数据;
3) 双机热备软件可托管存储挂载、数据库服务、虚拟IP等资源;
4) 切换时间在秒级(5s~30s之间);
5) 支持对外统一的虚拟IP访问,故障切换后应用可自动切换;
6) 支持多实例
7) 支持所有国产CPU和操作系统

相关文件

在购买了神通数据库企业版、安全版本后,共享存储双机热备功能同时打包在数据库版本中,数据库安装完成后,相关文件如下:

程序名 作用 路径 备注
oscarha HA的主程序, "$SZ_OSCAR_HOME/bin/"    
resourceManager HA的资源管理, $SZ_OSCAR_HOME/bin/    
ha.conf Ha的配置文件, $SZ_OSCAR_HOME/agent/HA/ ha.conf是默认名称,可以在服务启动过程中指定其他文件  
oscarhad.service 专用机下Ha的服务文件, /usr/lib/systemd/system/ 专用机环境  
ha.log Ha的日志文件, $SZ_OSCAR_HOME/log/ha.log    

相关端口

端口号 端口作用
5430 HA服务监控端口号