案例详情

某大型金融机构总部网管项目

项目背景
   某大型金融机构是中国银行卡联合组织,处于银行卡产业的核心和枢纽地位,是实现银行卡系统互联互通的关键所在。依托跨行交易清算系统,该机构制定和推广银联跨行交易清算系统入网标准,统一银行卡跨行技术标准和业务规范,形成银行卡产业的资源共享和自律机制,从而对银行卡产业的发展起到引导、协调、推动和促进作用。
   各商业银行通过该银行卡跨行交易清算系统,实现系统间的互联互通和资源共享,保证银行卡跨行、跨地区和跨境的使用。
   该机构的主要职责是负责建设和运营银联跨行交易清算系统这一基础设施,推广统一的银行卡标准规范,为商业银行、特约商户、持卡人提供跨行信息交换、清算数据处理、风险防范等银行卡基础服务,推动银行卡产业集约化、规模化发展,同时联合商业银行,创建银行卡自主品牌。

客户需求
   为了该机构网络进行全面系统的管理,需要制订比较系统的管理流程,以使全网得到全面有效的管理。通过建立一套网管系统,可以很好地实现故障管理、性能管理和报表管理这三个管理功能。网管工具实现绝大部分工作的自动化处理,从而加强管理效果,提高网络的安全生产率。
网络设备数据采集需求
   网络管理系统是以事件管理为核心的实时网络运行管理系统,要实现对网络实时、不失真的监控,基础数据的采集就尤为重要。

网络及安全设备监控数据采集需求
1)  网络设备环境特性监控:设备电源电压、设备温度(℃)等;
2) 设备性能监控:设备 CPU使用率、设备 memory使用率; 
3)  Dlsw状态监控:监控 Dlsw peer变化、监控处于联机状态的 Dlsw circuits变化; 
4)  链路层状态信息监控:监控重要端口的状态; 
5)  设备冗余热备状态监控; 
6)  路由信息监控:监控路由信息的变化情况;
7)  设备故障信息监控:运行中发生的设备硬件故障信息、软件故障信息;
8) 防火墙的实时状态和事件的监控(目前数据中心网络中采用了 Cisco ASA、Juniper、Checkpoint等防火墙);
9)  网络设备配置信息及变更的采集与监控; 
10)  对备份线路使用状况的监控; 
11)  报警方式的多样化,如手机短信息,窗口弹出消息,客户端屏幕输出等;  
 
 
对网管服务器进行监控的需求
   对网管服务器本身也要进行一些性能数据的采集,对网管服务器的操作系统、核心进程等进行实时监控,从而对网管服务器的运行状况进行评价。
具体如下:
1)  对网管服务器的 CPU、内存等进行实时监控;
2)  对网管服务器的操作系统、核心进程等进行实时监控,并可定制对重要进程的自动处理(如进程自动重启)等操作;

对其它网管设备的集成和兼容的需求
   网管产品应具有比较好的兼容性,可以与已经部署的UMP、Netscout实现互操作。

故障管理、性能管理需求
故障管理
(1) 对网络运营中比较常见的故障信息进行监控,如:网络设备或系统重启,局
域网 STP,网络设备硬件,IOS的运作错误信息,广域网 HSRP,局域网、广
域网端口连接状态,拨号(DDR、ISDN)状态,EIGRP、OSPF 路由、BGP路由;
(2) 发生故障时,系统能在故障发生后小于60秒内收集到故障信息并告警;
(3) 具有分析故障信息的能力,根据故障的轻、重、缓、急来定义不同的告警级别,并且对故障信息进行关联分析、压缩处理,减少事件量;
(4) 对于未知的事件也应该详细描述处理的方法;
(5) 能够对原始的网络事件信息进行丰富,增加报警信息的可读性;
(6) 报警的方式应该具有多样化,如声音,手机短信息等;
(7) 可根据故障的种类、等级、时间、描述中的关键字等进行简单查询或复合查询。
性能管理
(1)  对于一些性能数据,应该能够周期性地主动采集性能信息,采集周期和采集时间可选择; 
(2)  能基于定义的阀值,发出警告;
(3)  并能根据网络的实际运行状况调整阀值。

网络监控呈现及统计报表需求
   网管系统的呈现界面应可以根据运维以及管理人员分工的具体要求,对不同角色的运维人员灵活设计不同的功能及监控界面。系统应能够实现灵活定制并支持同时打开多个事件窗口,并提供灵活的过滤机制,同时不同权限的人员只能查看各自的监控图和事件列表,实现分权管理。
网管系统的报表要求根据通过对网络设备在采样时间间隔进行采集和网络设备主动发送的信息,对网络性能管理和告警管理所获得的信息进行汇总过滤,以数据库的形式保存详细的历史纪录,可以根据过滤条件灵活提供报表,并具有多种展示方式。对于性能数据,可以根据统计结果为网络规划提供依据。对于告警信息,网络监控系统能够按照日、周和月的时间关系生成“网络设备故障统计表” 、 “网络线路故障统计表” 、 “网络线路可用率报表” 、 “机构网络故障分级统计表”等表格,供网络管理人员和领导定期分析网络运行情况,掌握网络的薄弱环节,为网络升级改造提供科学依据。

解决方案
    网络管理系统采用 IBM 的 NETCOOL 网络管理解决方案,提供各种管理功能的整合,整个管理方案围绕网络事件管理,将所有的管理报警信息,如网络故障、性能下降、流量异常等都以事件的方式报告到网络事件处理平台,管理人员通过直观的事件信息监控,可以了解网络实时的运行状况。

 
   统一的网管系统提供从网络事件管理、性能管理、资源管理和报表管理的全面管理功能。所有的管理功能采用 Web界面提供用户的访问,通过 NETCOOL/WebGUI 进行整合,并定制针对不同人员的不同管理信息和界面。
客户价值
网络管理功能与流程的结合
    网络管理系统,是由网络管理技术,管理流程,管理人员的角色和管理职责共同构成的网络管理解决方案。系统的设计充分考虑了与管理流程的结合,实现网络运行监控和评估管理的需要,能够适合用户目前网络环境和运维要求,并满足未来网络发展需要的高度灵活的可扩展性。
以事件管理为中心,支持问题管理流程
   网络管理系统的设计从满足网络管理的需求出发,通过 IBM Tivoli 以事件管理为中心的管理功能和流程,提高管理人员对网络的实时监控能力,帮助网络管理人员在网络运行维护中主动快速发现和处理问题,同时结合性能、流量分析,对网络进行统计分析和量化评估,为网络的发展提供有效的管理数据。
对网络具有全面的实时管理能力,并且可不断完善和扩展
   IBM Tivoli Netcool 网络管理系统解决方案具有同时对网络所有组成部分进行持续监控的能力,从而使管理人员能够实时了解网络的状况,及时对出现的各种情况做出快速反应。同时随着网络的发展,技术的更新和厂家设备的丰富,IBM Tivoli Netcool 网管解决方案能够通过开放的管理接口,不断扩展,支持用户网络管理的要求。
   IBM Tivoli Netcool 网络管理软件和解决方案将提供强大的功能,灵活的结构、接口,配合用户在网络管理解决方案上根据管理需要进行客户化定制和开发,以满足用户建立深入的网络管理系统的需要。
支持分层管理,权限分工,规范管理
   解决方案支持集中分布式的管理和维护方式,为用户建立分权的网络管理系统,定义统一的管理策略和流程,规范网络管理标准,并支持管理人员的不同分工权限的运维工作。 
用户逐步实现从网络基础架构到业务支持的全面管理
   以网络为基础设施, 为业务提供基础服务。 为了满足用户网络管理和业务发展的需要,网络管理解决方案能够提供灵活的结构和功能,实现面向业务服务的网络管理和功能,分析网络故障对业务的影响程度,监控网络为业务提供的服务质量,使网络管理充分为业务服务,支持业务需要的网络服务质量。
满足现有需求和未来扩展的灵活应变
   IBM Tivoli网络管理软件具有优异的可扩展性,能随着用户网络和业务的变化,迅速调整并适应变化。

 


成功案例