图形化监控管理系统在信息网络运维中的应用

时间:2023-05-24 13:42:03 公文范文 来源:网友投稿

【摘 要】本文概述了图形化网络监控系统的总体构成和功能,分析了图形化监控系统的特点,分析并总结了针对性较强的图形化监控系统在信息网络运行维护中对网络设备、网络线缆、网络通道、安全设备、服务器等方面起到的作用,以及保证企业网络安全、稳定运行的重要意义。

【关键词】图形化;信息网络;网络管理;运行维护

0.引言

在当今时代,信息网络系统已成为社会组成必不可少的一部分,而信息网络系统在各个企业中已成为企业办公、生产、运行管理等方面的重要支撑平台,随着社会发展和企业信息化规模扩大,网络的规模也随之越来越大,网络的结构日趋复杂,局域网的运行维护任务也日益显得复杂繁重,因此如何能够简单有效地管理和维护内部网络已成为当前网络管理研究的一个重要方面,迫切需要一种网络管理方式可以简化运维流程、减少运维步骤、快速查找故障、明确运维目标和提高运维效率。目前商用网络管理软件种类繁多,例如国内的北塔、网强等网络管理系统。这些商用软件网络管理功能较为全面,但是针对信息网络运行维护来说,还存在一些不足之处。

本文介绍了一种针对信息网络运维而设计的网络监控系统,该系统强调以图形化的方式显示当前网络各节点状态。以直观的方式反映网络故障或潜在的故障,具备节点控制、监测日志、统计以及多种智能报警功能,力求减轻网络运维人员的工作量,提高工作效率。

1.概述

在大中型企业内部的整个网络上面运行着各种服务器以及众多的个人台式机,点多面广,管理维护难度和工作量都相对较大。仅靠单纯的人工管理,被动式的检查维护已无法满足整个系统良好运转的需要,面对并处理网络中众多设备发出的事件报告和短时间内检测发现故障点等问题,所有的这些要求很清楚地摆在网络管理人员的面前,因此迫切需要对网络进行主动的监视,自动进行网络故障的检测与解决,以维护网络的良好运转,从而更好地服务于整个公司的业务系统。

图形化监控系统可以更加直接地反映信息网络系统状态和故障,使运维人员明确网络系统运行状态,快速查找故障节点并进行处理。首先,收集网络环境内所有网络节点的信息资料和办公环境图纸,确定网络节点物理位置,建设信息网络节点图形化管理系统,根据收集的信息建立图形界面和联动资料库,包括用户物理位置、用户信息、设备信息、网络连接状态信息等;然后把信息网络节点图形化界面与现有的网络管理系统进行接口配置,在图形界面上产生网络节点的实时状态信息,同时可进行接口状态操作,并进行网络节点状态联动报警系统,当故障发生时,对预先指定的报警情况进行报警,报警方式可通过邮件和短信,使维护人员在第一时间得知并判别故障类型和严重程度,并通过图形界面精确判断故障地点,缩短网络故障发现和处理时间。

2.图形化网络监控管理系统技术结构、技术优越性

2.1图形化网络监控管理系统技术结构

图形化网络监控管理系统由图形部分、网络管理功能部分、网络健康度评估部分和运维流程部分组成。各部分的作用为:

2.1.1图形部分

图形部分是整个监控管理系统的衔接部分。其作用首先是系统本身各类功能的操作界面和针对网络系统各环节物理位置的直观展示,比如机房内设备位置图、建筑结构图和办公室网络布点图等,以及网络系统整体和部分的拓扑结构图,用三维图形和二维图形结合进行展示;其次是对整个监控管理系统的各功能部分进行衔接,像前面提到的网络管理功能部分、网络健康评估部分和运维流程部分要通过图形部分进行衔接,使各部分功能得到体现,监控人员通过其进行监控和管理。图形部分的完整度和详细度直接影响到整个监控管理系统的运行效果。

2.1.2网络管理功能部分

网络管理功能部分是整个监控管理系统的核心组成,按照分层架构设计思想进行建设,实现网管数据采集与处理的分离,数据处理与呈现的分离,共分为 3 个层次:数据采集层、数据处理层和功能显示层,具有较强的灵活性和可扩展性。

数据采集层:数据采集层是位于数据处理层与管理对象之间的数据采集子系统,与 IP 网的网元设备和相关的业务系统交互,遵循标准的通信协议,完成系统所需的各类原始管理数据的采集,包括主机、网络、数据库、中间件、应用软件、环境等数据源的原始信息,如配置数据、性能数据、故障数据和准确性数据等。

数据处理层:将数据采集层所获得各种数据进行清洗、整理和标准化处理,提供各应用功能进行处理分析、统计及存储,如通过触发事件发生器,将收集的各类原始信息与KPI阈值对比后进行分析、配置或处理,形成资源分类的告警信息等。

功能显示层:针对分类管理信息进行统一汇总和多维展现,实现网络、系统硬件设备资源和软件运行状况的统一监控和管理,保障业务系统的正常运行。

另外按功能模块划分可分为六大模块,包括数据采集组件、综合网管服务、WEBService 应用组件、IE显示层组件、数据流分析探针、外部数据库,各模块组件之间通过TCP/IP进行通信,支持灵活的集中或多服务器的部署策略,提高系统的可扩展性。下面是其中几种模块的功能简介:

数据采集组件:接收各网管功能模块的数据采集请求,定时其管理范围内的被管对象中收集IT基础设施信息,同时维护、提供性能数据缓存,存储获得的IT基础设施的性能信息,从而达到:统一的数据获取接口、多管理协议支持、可扩展的IT组件支持、数据有效性控制和智能化网络访问控制。

综合网管服务:综合网管服务(NMS)作为数据处理层,建立了网络管理模型和资源数据访问模型的标准化,NMS数据处理层中采用了O/R Mapping、IOC、Remoting等技术完成系统的架构和实现。NMS将实体对象的数据如网络配置数据、资源数据存储在关系型数据库中,通过O/R Mapping 实现将关系模型映射到面向对象的数据模型,提供完整的面向对象的数据管理、访问模型和接口,完成了网络管理数据的对象化,包括:网络配置数据、 设备网元数据、性能数据(历史数据、实时数据)、告警规则配置数据、告警信息数据、服务资源数据和用户权限配置数据。

WebService应用服务:与图形化部分紧密结合,监控系统的应用管理、呈现层采用WEB架构实现,通过WEB2.0、AJAX、WEBSERVICE、JSCRIPT等技术,实现完整的B/S模式的应用管理、数据呈现等核心功能。通过管理控制台集成了网络拓扑管理、网络监控、故障管理、报表管理、服务资源管理、资产管理和系统管理等。方便用户统一执行管理任务。门户功能模块可归纳为三种类型:门户基本框架和管理功能:提供门户通用服务和基本功能。包含用户管理,门户系统权限管理等。对其它系统的集成功能:主要提供对于系统监控管理,流程管理,分析报表集成。管理门户将作为这些系统的统一访问入口,并为用户提供单一登录功能。开发定制的特定服务模块:开发用户要求的日志和审计功能模块,用户访问统计模块。

数据流分析探针:监控系统的性能数据采集能够支持秒级单位的采样周期。能够提供原始采样频率的数据。监控系统经过一段时间的记录,能够通过对性能数据的对比,生成相应的阀值告警事件。监控系统通过Web访问的方式为用户展示物理拓扑结构,并通过物理拓扑结构为用户提供全网的性能和状态信息,并通过颜色表现表示出来,帮助用户及时发现网络潜在的故障隐患点,从而为用户提供管理数据的分析、诊断机制和运维管理流程。

2.1.3网络健康度评估部分

评价指标主要包括可用带宽、单双向时延、单双向时延抖动和单双向丢包。可用带宽直接影响网络业务的质量、网络对即将开展业务的支撑能力以及网络的扩容规划和设计。单向时延、单向时延抖动和单向丢包之所以不可缺少是由于业务服务器和客户终端内容交互的非对称造成的。评估方式由系统采用基于端到端的网络性能质量测试方法,指标是端到端之间的指标而不是单个设备、某一段甚至某一跳之间链路的指标。端到端的含义包括业务的起始点和业务的终止点整条路径,是业务传输的全部环节,端到端的单向时延是从一个测量点(一个具体的IP地址)到另外一个测量点的数据报文传递所用的时间,这个时间是转发时延、排队时延和传输时延的总和,通过一系列测试后可以得出现有网络健康度情况。

2.1.4运维流程部分

网络运维流程从功能上可以划分为六个模块,各模块功能如下:

任务工单管理。该模块实现临时性任务管理功能,如派发给县公司的任务工单、接收来自公司的任务工单、部门内部用于任务分配的个人任务以及部门之间用于项目管理的部门任务等。

业务流程管理。该模块实现对例行性网络运维业务流程的管理功能,如资源调度流程、故障处理流程、网络优化流程和业务开发流程,这些流程一般可分解为定义良好的任务、角色、规则和过程,通过与人和各种应用系统的交互来进行工作流程的执行和监控,达到提高网络运维效率和网络管理水平的目的。

统一工作任务列表。该模块为用户提供统一工作任务列表,包括当前任务、新建任务、已派发任务、已处理任务、阅知任务和待发任务。通过统一工作任务列表可以接收处理来自各方面的任务工单及来自工作流系统的业务流程。

工作任务统计分析。该模块实现对个人工作和组织工作的统计分析功能,包括派发任务数量、接收任务数量、不同难度任务所占比例、任务完成及时率、任务完成质量及绩效指标完成情况等。

接口适配。该模块提供与网管部分、图形部分以及资源管理平台的接口适配功能,通过系统之间的数据交换和应用集成达到部分业务流程自动化的目标

工作流管理系统。工作流管理系统是用于定义、实现和管理工作流运行的一套软件系统,通过与人和各种应用系统的交互来进行业务流程的执行和监控。工作流管理系统是网络运维流程支撑平台的核心,包括图形化建模工具、工作流引擎、管理监控工具和工作任务列表四个主要功能模块。

2.2技术优越性

2.2.1网络故障查找直观明了,图形化网络监控管理系统的特点是实体图形的大量使用,把网络连接、设备位置、机房或房间布局、故障点描述等通过具体的图形表现出来,再与网络管理系统各个监测功能模块集成,就可以直观明了的对各类故障情况进行图形化描述,信息网络运维人员可通过该系统了解故障的等级、类别、具体位置,并以此得出相应的处理办法,直接节约了普通故障查找的人力和时间,提高了工作效率。

2.2.2网管系统功能全面,由六大模块组成,包括数据采集组件、综合网管服务、WEBService 应用组件、IE显示层组件、数据流分析探针、外部数据库,涵盖层次化管理、拓扑管理、网络监控管理、IP地址管理、主机服务器管理、数据流分析、故障报警管理和报表管理多项功能,还可通过相关功能模块对整体或部分网络系统健康度进行评估,以此为依据指定相应的网络整改方案。

2.2.3信息网络运维流程明确,可通过网络运维部分人为或自动进行运维工单下达,实现完备的流程化操作,包括任务工单管理、业务流程管理、统一工作任务列表、工作任务统计分析和工作流管理,从接受运维任务、任务分析、制定运维方式、资源调拨、人员派遣、运维操作、完成任务和对应不同变数选择相应调配方式完成运维流程。

3.图形化网络监控管理系统的应用

3.1系统中图形部分的应用

该部分应用包括系统本身操作界面图形和具体信息网络拓扑信息及实际物理环境图形的规划编制。首先是操作界面图形的规划编制,涵盖层次化管理、拓扑管理、网络监控管理、IP地址管理、主机服务器管理、数据流分析、故障报警管理、报表管理和系统管理,以及各大类下面具体分类的操作界面图形,如下图所示:

其次是具体信息网络拓扑信息及实际物理环境图形的规划编制,要收集公司范围内所有网络节点的信息资料和办公环境图纸,确定网络节点物理位置,具体到网络设备、网络线缆、网络通道、安全设备、服务器的布点状态,以及信息机房和办公室的布局图纸,如下图所示:

然后用具体的网络设备图形反应实际网络连接情况,如下图:

最后可根据图形的详细显示得出网络故障节点位置和严重程度等信息,极大的便利了网络运维工作。

3.2系统中网络管理功能部分的应用

网络管理功能部分是整个监控管理系统的核心组成,通过snmp协议读取和写入交换机、路由器、服务器等信息设备策略和数据信息,主要通过人工录入和自动搜索相结合的手段进行设备发现和链路获取,整合分析数据实现层次化管理、拓扑管理、网络监控管理、IP地址管理、主机服务器管理、数据流分析、故障报警管理和报表管理多项功能,再通过设定网络管理系统本身的报警策略定制报警数值和临界点等信息,以图形颜色标示、声音、短信或邮件等方式对系统管理员进行告警。

网络管理功能部分是整个系统的核心,图形部分的功能显示、网络整体健康度评价和运行维护人员流程管控,都要通过功能部分进行实现和链接。

4.结论

图形化网络监控管理系统在信息网络运维中的应用,将解决网络运维侧重于对网络设备本身或网络的维护与管理的问题,解决各类网管系统之间信息无法互通、管理内容庞杂、操作界面多样等问题带来的局限性,大大降低了信息网络系统的运行风险,提高运维工作效率,实现对全网的综合管理,包括全网故障分析、故障定位、全网性能综合分析等功能,能够从总体上提高企业的全网综合管理水平和运维工作效果。

【参考文献】

[1]张玮,唐学文,马颖.图形化校园网络监控系统的设计与实现.计算机与现代化[J],2007,5:72.

[2]卢艳军.端到端网络承载性能质量测评势在必行.电信技术[J].2006,9:15.

[3]海空.网络运维流程管理平台的建设和应用.中国IT实验室[N].2008,12:3.

推荐访问:管理系统 信息网络 图形化 监控 运维中