7月@@1日@@,宁夏银行核心系统数据@@库@@出现故障@@,导致该行存取款@@、转账支付@@、借记卡@@、网上银行@@、ATM和@@POS业务中断@@37小时@@40分钟@@。16日@@,工商银行由于网络设备@@发生硬件故障导致银证系统异常@@,部分银证转账交易出现单边账现象@@。人们不禁要问@@,为何在信息化技术@@相对发达@@、一向重视安全的金融行业@@中@@,仍会频频出现宕机等问题呢@@? 到底是什么阻碍了金融行业@@业务系统的高效运行@@@@?我们又该如何去应对@@?

  银行面临运维难题@@

  金融机构在抢占市场份额@@、扩大客户基础@@、创新产品和@@业务模式的过程中@@,整个@@业务系统的组成也变得愈发复杂@@,从前端的网银@@、外部系统到核心前置@@,乃至跟第三方的相连@@,其中涉及的服务器@@、主机@@、应用@@、网络系统越来越庞大@@,系统之间的耦合也越来越复杂@@,运维难度明显加大@@。另一方面@@,大集中给总行数据@@中心带来的不仅是数据@@的大集合@@,还包括技术@@、人力@@,甚至业务的集合@@,由此带来的运维压力可想而知@@。而金融机构面向激烈的市场竞争不得不做出应用@@和@@业务变更@@,也成为了业务运维低效的原因之一@@。

  从运维能力和@@运维手段来看@@,系统之间业务上相互独立@@,但维护上需要相互关联@@,而银行目前的运维是割裂的@@,不难想象各家自扫门前雪的结果将是网络@@、应用@@、数据@@库@@、主机@@等@@“各自为阵@@”,一旦出现故障@@,各个@@系统之间的配合难以协调@@。从运维人员来看@@,他们受制于缺乏业务知识@@,排查故障往往需要首先弄清业务的网络路径@@,再挨个@@筛查对业务产生影响的应用@@@@,导致故障处置周期长@@、效率低@@,不能很好地满足监管机构@@、银行客户@@,乃至银行自身的要求@@。由此看来@@,支撑核心业务系统的网络系统的运维工作@@,包括网络基础设施@@、相关的应用@@系统@@、数据@@库@@以及安全保障系统的运维已经变成一个@@至关重要的工作@@,网络系统的运维必须和@@企业的核心业务活动完全融合起来@@。金融机构网络运维需要一种基于业务网络的性能管理系统@@,能让网络的运维和@@业务的保障紧密结合起来@@,帮助用户提升以业务为核心的主动网络运维能力@@,提升业务保障工作和@@故障处置的效率@@。

  形势严峻@@ 亟需更专业的运维手段@@

  银行要保证业务持续@@、高效运行@@,有效的运维平台@@和@@工具必不可少@@。各个@@网络设备@@厂商虽然在其网络设备@@产品中集成了网络管理的功能@@,但这些功能仅限于对自家产品进行管理@@,对于其他厂家的设备则@@“爱莫能助@@”。面对现代众多金融行业@@用户的期望和@@需求@@,仅是对网络设备@@进行管理的网管系统已经不合时宜@@,将服务器@@、网络设备@@、中间件@@、数据@@库@@等纳入统一监控才是用户所需要的@@。另外@@,在我国强调自主可控的大论调下@@,国内厂商跟国外厂商相比@@,能够给用户更多@@安心@@。但不论是国外厂商@@,还是国内厂商@@,他们目前所提供的运维产品内容主要集中在@@ITIL流程管理@@、自动化和@@综合监控等方面@@,其中综合监控主要是对应用@@的监控@@,需要开发@@,只能做到浅层次@@的结合@@。总体来说@@,主要是以物理网络作为运行维护对象@@,而缺乏以业务网络为对象的运行维护模式@@。科来@@的业务性能管理@@解决方案则是围绕业务系统进行的主动分析@@,能够做到对业务网络的实时监控及迅速定位故障点@@,帮助金融机构建立高效的运维系统@@。

  当金融机构发生业务故障@@,它的根本需求即提高发现问题@@、分析问题@@、解决问题的效率@@。根据@@《银行业重要信息系统突发事件应急管理规范@@(银监办发@@【2008】53号@@)》规定@@,银行业金融机构在一个@@省无法正常开展业务半小时@@@@(含@@)以上便算作较大突发事件@@。“这意味着@@3个@@10分钟@@,即第一个@@@@10分钟@@内知道是什么问题@@,第二个@@@@10分钟@@进行讨论@@、做出决策@@,最后@@10分钟@@采取行动@@。但实际情况往往是@@10分钟@@内不能发现问题点@@,最后@@10分钟@@领导决定是否进行切换或者重启@@,而在不清楚问题源头的情况下就做出决定是非常冒险的@@。”科来@@技术总监高彦刚告诉记者@@,“科来@@的业务性能管理@@解决方案能做到在@@5分钟@@内定位故障点@@,这对之后快速@@、准确地解决问题至关重要@@。”据悉@@,至今国外各大厂商的标准维护合同中绝大部分都没有承诺修复时间@@。

  科来@@业务性能管理@@@@  为业务运维@@“保驾护航@@”

  2009年@@,某银行核心业务系统出现问题@@,分行发生访问速度缓慢@@、交易堵塞等现象@@。在找不到问题点的情况下@@,银行决定进行切备@@,根据@@切换后的结果@@,银行判断是主机@@出现了问题@@,这时@@,距离问题发生早已超过@@了半小时@@@@。据相关人员介绍@@,科来@@进行排查分析发现@@,问题在于数据@@中心的核心交换机的传输链路上出现丢包@@,针对此问题的解决过程几乎只用了@@“一杯茶@@”的时间@@。而银行经验主义的做法导致之前的整个@@决策链出现错误@@,无法准确@@、快速地定位问题@@,解决问题更是@@“无据可依@@”。

  不同于其他厂商以物理网络为对象的运行维护模式@@,科来@@业务性能管理@@@@解决方案最大特色之一是以业务网络为运维对象@@。在部署之后系统会预先梳理各业务逻辑关系@@,建立支撑业务的应用@@服务@@、主机@@系统@@、网络路径之间的关联关系@@,再围绕业务系统部署分析设备@@,制定针对性的监控分析策略和@@警报策略@@。数据@@上报至@@UPM分析中心后@@,对业务网络的应用@@响应性能@@、主机@@服务性能@@、网络传输性能和@@交易处理性能进行智能化分析@@@@,提供集成的业务网络性能监控视图@@@@(见图@@@@1),把所有与业务相关联的分析结果@@(如性能异常警报@@、关键性能指标@@、多段数据@@对比等@@)集成到一起@@,进行图@@形化显示和@@关联挖掘@@,一旦发生异常@@,即使是不熟悉业务知识的运维人员也能根据@@视图@@快速定位问题点@@。“预先的业务逻辑梳理和@@针对性的监控分析@@,相当于为金融机构提供了定制化的解决方案@@。”高彦刚这样告诉记者@@。


图@@ 1

  科来@@作为一家专注于网络分析技术和@@产品研发@@10多年@@的企业@@,其业务性能管理@@解决方案以最大提升业务网络的运维效率和@@故障处置能力为研发目标@@,在国内多家大型金融机构都有成功案例@@。科来@@的网络分析技术服务于全球@@97个@@国家和@@地区@@,超过@@87家财富@@500强企业都选择了科来@@的产品@@。

  在最后@@@@,高彦刚表示@@,“帮助客户迅速@@、准确地定位故障点@@,保证业务持续高效运行@@是科来@@带来的价值@@,我们的产品和@@服务体现了科来@@@@‘为客户创造价值@@’的理念@@。现在金融机构的业务系统和@@网络的集成度越来越高@@。我们的目标是融入用户的业务网络里@@(包括基础网络架构@@、应用@@、主机@@等@@),使用户能够对每一个@@影响业务系统的网络运行环境进行实时化@@、智能化分析@@,这是科来@@业务性能管理@@@@系统的基础@@,也是金融业网络运维的未来@@。”

责任编辑@@:admin