共享存储HA概述¶
简介¶
实际使用中服务器的故障可能由各种原因引起,如网络设备故障、操作系统故障、存储故障、数据库软件系统故障,等等。一般地讲,在技术人员在现场的情况下,恢复服务器正常可能需要10分钟、几小时甚至几天。 从实际经验上看,除非是简单地重启服务器(可能隐患仍然存在),否则往往需要几个小时以上。 而如果技术人员不在现场,则恢复服务的时间就更长了。 而对于一些重要系统而言,用户是很难忍受这样长时间的服务中断的。 因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。 而基于存储共享的双机热备是双机热备的最标准方案。对于这种方式,采用两台服务器,使用共享的存储设备(磁盘阵列柜或存储区域网SAN)。 两台服务器可以采用互备、主从、并行等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器通过心跳线(目前往往采用建立私有网络的方式)侦测另一台服务器的工作状况。当一台服务器出现故障时,另一台服务器根据心跳侦测的情况做出判断,并进行切换,接管服务。 对于用户而言,这一过程是全自动的,在很短时间内完成,从而对业务不会造成影响。 由于使用共享的存储设备,因此两台服务器使用的实际上是一样的数据,由双机或集群软件对其进行管理。 采用共享磁盘方式将用户数据存放在共享磁盘上,后台同时使用两台神通服务器对用户数据进行管理。 正常情况下,只有一台神通活动服务器拥有共享磁盘数据的管理权,可对外提供数据访问服务,而另一台处于备用状态; 如果活动服务器发生故障,则备用服务器自动接管共享磁盘上的用户数据的管理权,继续对外提供服务,保证用户访问数据的不间断性;当故障服务器修复后,以备用服务器的身份继续工作。基本架构如下:
支持所有Linux操作系统下的环境,比如Linux下的龙芯、飞腾、神威、兆芯、海光等系列国产环境;也支持Linux下的国外Intel、amd的x86环境(暂不支持Windows)
功能指标¶
共享磁盘方式是将用户数据存放在共享磁盘上,数据库同时使用两台神通服务器对用户数据进行管理。正常情况下,只有一台神通活动服务器拥有共享磁盘数据的管理权,可对外提供数据访问服务,而另一台处于备用状态;如果活动服务器发生故障,停止对外提供服务,则备用服务器自动接管共享磁盘上的用户数据的管理权,继续对外提供服务,保证用户访问数据的不间断性;当故障服务器修复后,以备用服务器的身份继续工作。共享存储的主要指标如下:
相关文件¶
在购买了神通数据库企业版、安全版本后,共享存储双机热备功能同时打包在数据库版本中,数据库安装完成后,相关文件如下:
| 程序名 | 作用 | 路径 | 备注 |
|---|---|---|---|
| oscarha | HA的主程序, "$SZ_OSCAR_HOME/bin/" | ||
| resourceManager | HA的资源管理, $SZ_OSCAR_HOME/bin/ | ||
| ha.conf | Ha的配置文件, $SZ_OSCAR_HOME/agent/HA/ | ha.conf是默认名称,可以在服务启动过程中指定其他文件 | |
| oscarhad.service | 专用机下Ha的服务文件, /usr/lib/systemd/system/ | 专用机环境 | |
| ha.log | Ha的日志文件, $SZ_OSCAR_HOME/log/ha.log |
相关端口¶
| 端口号 | 端口作用 |
|---|---|
| 5430 | HA服务监控端口号 |