为股民请命,打造证券交易的“定海神针”
作为某证券公司IT系统运维人员,小明最怕的是突如其来的“牛市行情”,成交量的暴涨,使服务器无法应对瞬时交易峰值,致使交易频繁出现各种故障,有时候集合竞价系统登录缓慢,或是委托单无法成交也无法撤单。要是想买而没买到的股票跌了倒也罢了,但若是想买的股票因为没买到而“涨了”,那问题可就麻烦了。一大波怨声载道的股民正在赶来的路中,这时候为将对用户的影响降低到最小,系统恢复过程就要分秒必争,IT系统运维人员的压力可想而知,但面对服务器老化或性能不足等问题,有时候IT运维人员也无能为力。
2020年股市的大起伏
2020年是一个特别的年份,全球遭受疫情的影响,很多国家经济出现负增长,唯独中国经济一枝独秀,面对巴菲特都没见过的美股三次“熔断”,中国股市也频繁出现大幅度涨跌。成交量的剧增,让证券系统面临越来越大的压力系统故障也变得越来越频繁。来自证监部门的数据显示,因券商系统核心设备老化未及时做更换,导致集中交易系统和综合账户管理系统故障频发,同时系统运维保障能力的严重不足,让证券交易系统普遍处于重大风险隐患中。对小明来说,证券交易平台承载了无数老股民的希望,绝对不允许这样玩。
证券系统的“定海神针”
自遭遇股民频繁投诉之后,小明对证券系统进行了高强度的压力测试,并就如何改善并提升证券系统的性能和稳定性,与公司领导进行了深入沟通。小明认为当务之急是瞄准故障频发的性能和稳定性痛点解决问题,只有提升访问和交易的速度,保证系统拥有更高的可用性,才能通过更佳的交易体验吸引更多的客户。他在对集中交易系统进行了评估后发现,由于证券公司的上交所报盘是证券交易的通道,这个通道具有非常重要的作用,通道的稳定性和可靠性直接关系到交易是否正常进行。而系统存在的一个最大风险点是,这个报盘接口由于采用SQL Server接口库的架构,存在单点故障隐患,在现有应急切换方案中,由于SQL Server接口库的硬件故障场景需人工切换至备份服务器,切换操作复杂,切换时间在3分钟以上,一旦发生故障,影响面较大。
为解决这个问题,必须找到一种即使出现硬件故障,也能进行自动切换的服务器平台。经过多轮选型和评估,IT实施团队最终选了Stratus ftServer 4810作为报盘系统平台,将SQL Server部署到Stratus ftServer 4810。这是一款全双工硬件的单一系统,有着极高的容错性、可靠性和运行性能,即便服务器一组子系统出现故障,它能自动切换到另外一组完全相同的子系统上,无需人员介入。易于部署、管理和维护,减少了运维人员的时间和工作量,即使要更换子系统或组件,直接进行热插拔替换即可,不会影响业务的正常运行,在插入的同时CRU能自动完成数据同步,多路径I/O故障转移功能,还可防止数据损坏或丢失。
自Stratus ftServer 4810解决方案实施后,解决了交易系统中SQL Server接口库的单点故障隐患,实现了SQL Server接口库的高可用性,极大地保障了核心交易系统的持续高可用性,从而保障通道的安全性和稳定性,最终保障了交易正常进行。
曾经有一份千载难逢的买入机会摆在我的面前
可在频繁的交易系统故障中
我没能珍惜
人世间最痛苦的事莫过于此
如果上天能够给我一个再来一次的机会
我会对那只股票说三个字:换平台
如果非要明确买多少手
我希望是“钱买完”
作为一颗韭菜,赚钱虽然很重要
但也绝对不能影响心情
广大小散们,您说对吗?